剛剛,蘋果的WWDC 2026結(jié)束了。
這是Tim Cook作為CEO最后一次站在WWDC的舞臺上了,9月1號,他就會把位置交給硬件工程高級副總裁John Ternus,所以今年這場,多少帶了點告別的意思。
![]()
但發(fā)布會本身,坦率的講,還是那個蘋果。
不驚不喜,穩(wěn)穩(wěn)當當。
整場下來最大的主題就一個,還是AI,比如跟Gemini的合作終于落地了,比如Siri終于有了個AI的后綴,比如各種IOS的APP,也都往AI化的方向一步步集成。
不過蘋果還是那個蘋果,動作慢的可憐,并且最難崩的依然是國區(qū)幾乎都不支持。
原話是:
![]()
不過,這些功能的更新還是值得一看的,以及國內(nèi)到底蘋果會跟誰合作,還是一個意思的話題。
我也通宵給大家蹲完,然后整理完了。
希望對大家有用。
一. Apple Intelligence新架構(gòu)
先說底層,因為后面所有AI相關(guān)的東西都建立在這套新架構(gòu)上。
1. 跟Google Gemini的深度合作
![]()
這次蘋果也終于官宣了。
Apple Foundation Models的新一代是跟Google合作,基于Gemini家族一起來做的,搞了5個模型,然后蘋果把這些模型適配到了端側(cè)運行和Private Cloud Compute服務(wù)器上運行。
Private Cloud Compute就是蘋果專門為AI搭建的一套云計算基礎(chǔ)設(shè)施,跑在蘋果自研芯片上,用的是一個從iOS裁剪出來的專用操作系統(tǒng)。核心承諾是,你的數(shù)據(jù)端到端加密,只用于處理你的請求,處理完立刻刪除,不存儲、不留痕,連蘋果自己的工程師也看不到你的數(shù)據(jù)。
再細節(jié)的參數(shù)啥的就沒說了,反正就是蘋果承認了自己在大模型基礎(chǔ)能力上追不上第一梯隊,選擇花錢買他們認為對普通消費者來說最好的底座,然后在上面做自己擅長的系統(tǒng)集成和體驗設(shè)計。
策略上說得通,面子上。。。
面子有啥用你說對吧。
2. 雙端側(cè)模型
蘋果今年的端側(cè)模型分了兩檔。
所有支持Apple Intelligence的設(shè)備都有一個基礎(chǔ)版端側(cè)模型。但在能力強一點的的Apple設(shè)備上,比如iPhone 17 Pro、iPhone 17 Pro Max、iPhone Air、M4 及以上且至少 12GB 統(tǒng)一內(nèi)存的 iPad、M3 及以上且至少 12GB 統(tǒng)一內(nèi)存的 Mac,蘋果額外部署了一個更強的第二版。
這兩個端側(cè)模型分別是:
AFM 3 Core,一個3B的小模型。
AFM 3 Core Advanced,20B的MoE模型。
這個更強的模型多出來的核心能力是語音和更高精度的聽寫等功能,它能聽懂語音也能生成語音。
所以像Siri更有表現(xiàn)力的新聲音、更精準的全系統(tǒng)聽寫這些功能,都只有跑得動第二版模型的設(shè)備才能用。
3. 系統(tǒng)架構(gòu)
有了模型之后,對模型的調(diào)度還是需要一些設(shè)計的。
蘋果做了一個叫系統(tǒng)編排器(System Orchestrator)的東西,它是整個Apple Intelligence的調(diào)度中心,負責協(xié)調(diào)四大系統(tǒng)級能。
![]()
人上下文理解。你設(shè)備上所有的內(nèi)容,照片、郵件、備忘錄、消息,都通過Spotlight的語義索引被組織起來了。
![]()
廣泛世界知識。比如你問世界杯賽程是什么,系統(tǒng)編排器會讓Apple Intelligence聯(lián)網(wǎng)去搜索,然后通過Private Cloud Compute來生成回答。
![]()
App Actions。這是讓Siri能動手做事的關(guān)鍵。系統(tǒng)編排器知道你手機上每個App能做什么(通過App Intents框架),當你說發(fā)消息給某某的時候,它會調(diào)用Messages來執(zhí)行。理論上,任何適配了App Intents的第三方App都能被Siri調(diào)用。
![]()
屏幕感知。系統(tǒng)編排器能看到你當前屏幕上顯示的內(nèi)容。比如你正在Safari里看一篇文章,這時候問Siri一個問題,它能結(jié)合你正在看的內(nèi)容來給出更相關(guān)的回答。
![]()
這四個能力組合在一起,就是蘋果所說的以你為中心的AI,也是硬件跟AI結(jié)合的一個比較完整的方案。
4. 隱私
他們的原話是:
We believe privacy in AI is non-negotiable.
我們認為,AI中的隱私是不可談判的。
蘋果的態(tài)度是,很多AI廠商在嘴上說隱私,但默認情況下都在保留你的個人交互數(shù)據(jù),把保護隱私的責任推給用戶。
蘋果的方案就是前面說的端側(cè)處理+Private Cloud Compute,數(shù)據(jù)不存儲、不可訪問,只用于執(zhí)行請求,外部專家可以隨時審計。
二. Siri AI
今天真正的重頭戲,也是蘋果最大的發(fā)布了。。。
![]()
給新版Siri正式命名為Siri AI。
1. 核心能力升級
Siri AI基于整套新的Apple Intelligence架構(gòu),集成了上面提到的很多的新能力。
蘋果的說法是,Siri現(xiàn)在是一個“有了質(zhì)的飛躍”的助手。
然后基于這次的新Siri AI,他們做了一些演示。
演示一,問答+提醒+音樂。
問“舊金山的某位歌手演唱會什么時候”→ Siri給出答案(7月26號)→ 追問怎么買票 → Siri說要抽簽 → “抽簽開始的時候提醒我”→ 設(shè)好提醒 → “放一首她的新單曲”
演示二,屏幕感知+個人上下文+路線規(guī)劃
看到一張照片問“這是哪”→ Siri識別出圣克魯茲海岸的天然橋州立海灘 → “我朋友Jeff最近搬到附近了,他新家在哪”→ Siri從消息記錄里找到Jeff發(fā)過的地址 → “給我導航到那個拱門,中間停一下Jeff家”→ Siri規(guī)劃路線
演示三,照片篩選+共享
“給我看上周在沙斯塔山的照片”→ Siri搜索照片 → “只把有Bryce、Madison和Quinn的照片加到家庭共享相冊”→ 完成
演示四,對話式體驗
查世界杯開幕周末賽程 → “我想為巴西vs摩洛哥那場辦個觀賽派對,給我兩個國家的經(jīng)典菜”→ Siri給出菜品(還帶圖片)→ “Maria最近提到的那個甜點是什么”→ Siri搜索消息找到椰子餅干→ “把這些整合成一個菜單”→ Siri生成創(chuàng)意菜單 → “發(fā)消息給Gold Chasers群組問他們要不要來,附上菜單”→ 發(fā)送
演示五,Mac上的對話式Siri
Siri也集成進了Spotlight。
在Spotlight里輸入問題就能啟動跟Siri的對話,窗口可以拖拽和調(diào)整大小。
演示了讓Siri分析多個不同格式的文件比較三個棚子的報價,然后結(jié)合兒子之前發(fā)的消息里提到的電路問題來做推薦,最后讓Siri直接起草一封郵件給選中的供應商。
大概就是這樣。
我的感受是,怎么說呢。
2026年了,Siri AI的演示核心還是問答、搜索個人信息、發(fā)消息、設(shè)提醒這些事。對話式體驗確實比以前強了不少,能連續(xù)聊、能帶上下文了,但說實話,這些demo跟現(xiàn)在的ChatGPT、Claude比,談不上什么驚喜。
![]()
最關(guān)鍵的是,沒有看到真正的Agent能力。也沒有看到Siri自主規(guī)劃、自主執(zhí)行多步任務(wù)、自主調(diào)用多個App完成一個復雜目標的場景。
蘋果說了App Actions,但演示里最復雜的也就是搜索照片→篩選→加到共享相冊這種程度。
這塊確實是有一點失望。
2. 新語音體驗
在支持第二個強端側(cè)模型的設(shè)備上,Siri有了全新的語音。
![]()
更有表現(xiàn)力,語調(diào)變化更自然。
蘋果還讓你可以自定義Siri的語音風格,調(diào)表現(xiàn)力和語速,更親切更好玩一點。
3. 全系統(tǒng)聽寫升級
同樣需要第二檔端側(cè)模型,新的聽寫引擎在拼寫、標點和大小寫上都更精準了。
![]()
因為它是內(nèi)建在系統(tǒng)鍵盤里的,所以不管你在哪個App里,只要調(diào)出鍵盤就能用。發(fā)布會上提到的場景是“在地鐵上用語音發(fā)消息”和“邊想邊說地用日記App記錄”,都是日常會用到的,這個我覺得還是比較剛需的,好評。
4. 視覺智能
iPhone上,Visual Intelligence(視覺智能)集成進了相機App,新增了一個Siri模式。
![]()
按快門鍵讓Siri看到你看到的東西,然后給你有用的回應,可以下拉查看詳細信息、問后續(xù)問題。
比如蘋果演示的,對著賬單拍,選擇你點的菜,用Apple Cash跟朋友分賬。
![]()
或者看著一個背包問“這個能當我9月航班的隨身行李嗎”,Siri結(jié)合產(chǎn)品信息和個人航班信息回答。
![]()
5. 寫作工具 + Siri集成
寫作工具現(xiàn)在更深度地跟Siri結(jié)合了,你可以在任何能打字的地方用自然語言描述讓Siri從頭生成文本。
在郵件和信息里,Siri還能根據(jù)你跟特定聯(lián)系人的溝通風格來調(diào)整語氣。
![]()
另外,Apple Intelligence現(xiàn)在全系統(tǒng)自動校對了,你在任何App里打字,它都會自動檢查拼寫和語法,不用你手動觸發(fā),大多數(shù)第三方App也支持。
![]()
6. Siri獨立App + 跨平臺
蘋果給Siri做了一個獨立的App,這是第一次。
![]()
現(xiàn)在有了獨立App之后,你所有跟Siri的對話都會被保存在這里,可以隨時回看。
最重要的是跨平臺同步,你在iPhone上跟Siri聊了一個話題,打開iPad上的Siri App可以看到這段對話,繼續(xù)往下聊,在Mac上也一樣。
![]()
對話歷史通過iCloud加密同步,蘋果看不到你的對話內(nèi)容。
Siri AI還擴展到了watchOS(手腕上直接問)和visionOS(3D可視化的Siri,放在你空間里的任何位置,看著它說話就行,不用說「hey Siri」)。
![]()
然后新版的Siri,目前只支持英語,后續(xù)會擴展其他的語言,歐盟和中國都目前不可用,可用時間未知。
三. APP智能化
反而是我今天覺得比較驚喜的部分。
![]()
讓AI滲透進所有人的生活中,確實還是得從老的APP改造入口,是最能進日常場景的。
1. Safari
三個新功能。
智能標簽頁整理,Safari用Apple Intelligence分析你打開的每個頁面,自動按主題分組。你瀏覽的時候,相關(guān)新標簽頁會自動歸到對應主題下,可以一鍵關(guān)掉整個主題或者存為標簽頁組。
![]()
Notify Me,你可以用自然語言告訴Safari你在等什么變化(比如某個商品補貨、某個報名開放),然后關(guān)掉那個標簽頁,Safari會自動監(jiān)控,變化發(fā)生時推送通知。
![]()
這個功能太實用了,不知道執(zhí)行效果怎么樣,但思路是對的。
Describe an Extension,用自然語言描述你想要什么,Safari幫你生成一個自定義擴展來調(diào)整網(wǎng)頁內(nèi)容,比如在工具欄加一個按鈕來保存和評分你試過的食譜。
![]()
還有一條,Safari所有智能功能都不追蹤你的瀏覽數(shù)據(jù),不跟任何人分享,包括蘋果自己,然后稍微內(nèi)涵了一下友商。。。
![]()
“不像某些瀏覽器”。
2. 密碼App
密碼App現(xiàn)在已經(jīng)能提醒你弱密碼和泄露密碼了。
新功能是,它現(xiàn)在能自動幫你更新密碼,背后是Apple Intelligence和Safari配合,自動導航到對應網(wǎng)站、登錄、改密碼。
![]()
一個“agentic”的動作,難得見到蘋果用這個詞。。。
3. 短信
Messages現(xiàn)在能理解對話上下文,提供一鍵建議。
![]()
比如有人提到某個事,Messages會建議你創(chuàng)建提醒或備忘錄,有人問你要照片,Messages幫你根據(jù)關(guān)鍵詞、地點和人名搜索最合適的照片。
4. 郵件
郵件也有了更智能的上下文建議,讓你快速用喜歡的App(包括第三方App)采取行動。
![]()
5. 日歷
可以用自然語言添加事件了。
![]()
你打字的時候,日歷會自動識別聯(lián)系人、地點,填上標題。
編輯也更智能,比如把“每周”改成“每兩周”,日歷自動調(diào)頻率。
![]()
6. 電話
蘋果把這個電話的功能叫Call Context。
這個是我的剛需。
打電話給商家的時候,電話App可以主動從你其他App里找相關(guān)信息。比如你打電話給航空公司改機票,它能自動從郵件里找到你的確認碼。
![]()
而且全部端側(cè)運行,看的是你打給誰。
但是咱就是說,新AI上國內(nèi)的時候,咱能不能把那些惡心的營銷電話也都用AI處理一下。。。
7. Home
家庭App可以支持用Apple Intelligence理解攝像頭通知,把相關(guān)的通知合并成一個持續(xù)更新的活動通知。
![]()
還能分析錄像片段,生成描述,支持用自然語言搜索錄像內(nèi)容(比如搜快遞),支持4K分辨率回放。
8. 快捷指令
這個更新也挺好的,類似飛書的AI生成工作流。
![]()
快捷指令現(xiàn)在支持用自然語言描述你想要的自動化,Apple Intelligence幫你組裝所有步驟。
演示里的例子是,“當我離開公司時,發(fā)消息告訴佩德羅我在路上,附上到家的預計時間”→ 快捷指令自動創(chuàng)建了一個自動化,檢測離開公司地址 → 用地圖計算到家時間 → 用信息App發(fā)送。
還能追加描述來調(diào)整,比如自動播放最愛的播客。
四. 創(chuàng)意與影像
這塊蘋果也用AI雕了一些有意思的花。
1. Image Playground大升級
Image Playground這次大幅升級了一下。
核心變化,支持寫實風格了,之前只能生成那種卡通/插畫風格,現(xiàn)在用Private Cloud Compute上的跟Gemini搞的新生成模型,可以做高質(zhì)量的各種風格圖片。
![]()
畢竟你都用Gemini了,生圖再不迭代一下,那就真說不過去了。
你可以用照片庫里的人來生成圖片,用自然語言描述修改,用觸摸手勢圈選對象來移動/縮放/修改。
還能選擇不同的畫幅,生成聯(lián)系人海報和鎖屏壁紙。
![]()
同時,給開發(fā)者也開放了Image Playground API。
2. Photos AI編輯三件套
![]()
Cleanup升級,去除干擾物的效果更好了,復雜場景下的填充更真實。
![]()
Extend,擴展圖片邊界,給主體更多空間,或者調(diào)整畫幅時不用裁掉重要內(nèi)容。
![]()
Spatial Reframing(空間重構(gòu)),這個是今年P(guān)hotos里最酷的新功能。你可以在拍完之后重新調(diào)整照片的構(gòu)圖,就像你在拍照那個瞬間移動了相機一樣。
它用的是端側(cè)的空間模型做實時預覽,然后用Private Cloud Compute上的生成模型來填充透視變化產(chǎn)生的新區(qū)域。只生成空白區(qū)域的內(nèi)容,原始照片的部分保持不變。
演示效果確實不錯,而且這個功能基于Apple Vision Pro積累的空間理解技術(shù),對老照片和其他相機拍的照片也能用。
五. 開發(fā)者工具
1. Xcode
蘋果說Xcode是做agentic coding最好的地方。。。
我一直不知道該從哪開始吐槽起。。。
反正這次也做了一些更新,也基本圍繞的著AI。
比如它現(xiàn)在能一鍵把你的整個App本地化成其他語言,能跟模擬器里的虛擬設(shè)備直接交互(以前只能看代碼),還支持自定義skills來擴展助手的能力。
然后呢Xcode的代碼助手現(xiàn)在可以選擇不同的AI模型了,包括Google的Gemini。。。
![]()
我朋友當時就吐槽了。
![]()
你還可以把它跟Figma和GitHub這樣的外部工具連起來,讓代碼助手能夠參考設(shè)計稿和代碼倉庫。
測試方面,蘋果推出了全新的Device Hub,把所有模擬設(shè)備和真實設(shè)備統(tǒng)一到一個界面里。
![]()
你可以在里面模擬多點觸控操作,一鍵切換App的深色/淺色模式,還能動態(tài)調(diào)整App的窗口大小來測試不同屏幕尺寸下的表現(xiàn)。
2. Foundation Models Framework
開發(fā)者可以在App里用Apple的端側(cè)模型,今年新增了圖像輸入(之前只有文本),支持自定義Skills擴展模型能力,還能用同一套Swift API調(diào)用服務(wù)器端的模型。
3. Core AI Framework
全新框架,可以在所有蘋果平臺上用Apple Silicon的全部算力來本地運行其他模型。這個對開發(fā)者來說可能是最實際的,意味著你可以把自己的模型或者第三方模型直接跑在設(shè)備上。
六. 體驗升級
就是一些偏系統(tǒng)偏設(shè)計的了,跟AI關(guān)系不大了。
1. Liquid Glass優(yōu)化
去年WWDC最爆的就是Liquid Glass這套全新設(shè)計語言。
好看是真好看,但爭議也不小。
蘋果今年也說去年太激進了,所以在IOS27上,底層優(yōu)化了Liquid Glass的模糊算法,對復雜背景的彌散效果好多了。
也加了一個透明度滑塊,現(xiàn)在,你可以自己調(diào)Liquid Glass的透明度。
![]()
macOS上還做了幾個調(diào)整,工具欄更統(tǒng)一了,側(cè)邊欄延伸到窗口邊緣,側(cè)邊欄圖標恢復了彩色,所有窗口統(tǒng)一了更緊湊的圓角,App圖標也迭代了一版,在圖標內(nèi)部加了多層Liquid Glass折射效果。
![]()
2. 性能提升
常規(guī)操作,比如iPhone和iPad上App啟動速度快了30%,新拍的照片在圖庫里出現(xiàn)的速度快了70%,隔空投送傳文件速度快了80%,iPad接外部硬盤瀏覽和傳輸文件速度快了5倍。
![]()
3. 搜索基礎(chǔ)設(shè)施重建
蘋果重建了聚焦搜索、照片和郵件背后的搜索索引,讓它更穩(wěn)定、更全面。
新內(nèi)容幾乎實時入索引,郵件搜索還加了全新的排名系統(tǒng),置頂結(jié)果更準了。
![]()
4. 其他小更新
照片,iCloud共享相冊終于支持Android和Windows用戶加入了,還支持全分辨率共享。
AirPods,支持自定義EQ了。
Apple Vision Pro,全景照片可以變成有深度的空間場景。
地圖,F(xiàn)lyover大幅升級,航拍影像+視覺智能模型,建筑細節(jié)和樹木形態(tài)都清晰得多。
網(wǎng)絡(luò)切換,iPhone更智能地判斷什么時候該從Wi-Fi切回蜂窩(終于不用手動去控制中心關(guān)Wi-Fi了)。
信息App,低帶寬環(huán)境下發(fā)大文件不會卡住對話了,會顯示發(fā)送進度。
無障礙,蘋果官網(wǎng)上列了不少Apple Intelligence在無障礙方面的集成。
VoiceOver現(xiàn)在能更豐富地描述周圍環(huán)境和屏幕內(nèi)容,Magnifier可以放大后直接問Siri,Voice Control更靈活了,可以用自然語言跟App交互。
這塊發(fā)布會上沒提,但確實是AI落地到實際場景里的好例子。
今天WWDC算是平穩(wěn)結(jié)束了。
這也是Cook最后主持的一屆WWDC了。
蘋果,這個偉大的企業(yè),終于要交接到了下一棒人手中去。
最后,我想用我特別特別喜歡的喬布斯的一段詞結(jié)尾:
"向那些瘋狂的家伙們致敬。
他們特立獨行。
他們桀驁不馴。
他們?nèi)鞘律恰?/p>
他們格格不入。
他們用與眾不同的眼光看待事物。
他們不喜歡墨守成規(guī)。
他們也不安于現(xiàn)狀。
你可以認同他們,反對他們,
頌揚或是詆毀他們。
但唯獨不能漠視他們。
因為他們改變了尋常事物。
他們推動人類向前邁進。
或許他們是別人眼里的瘋子,
但他們卻是我們眼中的天才。
因為只有那些瘋狂到 以為自己能夠改變世界的人,
才能真正改變世界。"
>/ 作者:卡茲克、chiyo
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.