![]()
作者 | 王兆洋
郵箱 | wangzhaoyang@pingwest.com
Google I/O 2026,再一次飽和式發布。
數十個產品更新,2個小時,一股腦全扔出來。信息量爆炸。
如果把最重要的發布更新先做個梳理,它們包括:
Gemini 3.5系列亮相,先丟出 Flash版本,Pro下個月上線。一如既往,新的輕量模型干翻上一代Pro版本;
Gemini Spark 亮相:對標OpenClaw的個人Agent產品終于有了,24/7在線干活;
Antigravity發布2.0,全面擺脫coding的場景局限,終于和Claude Code 以及 Codex 直接競爭;
多模態能力集大成,聚到新的世界模型 Gemini Omni 上,可以用任何模態輸入,任何模態輸出,創造互動世界;
Gemini app全面Agent化,交互設計和配套模型跟著完成大更新;
搜索、全家桶,全面“小 Gemini”化,讓你在哪都能build;
Gemini “降價”:新增一檔 100 美元/月的 Ultra plan,給那些“想買重度 Agent 服務但還不到頂配水位”的用戶。原來 250 美元/月的頂級 Ultra plan 直接降到 200 美元。Pro 維持 19.99 美元/月。
可以看出來,其中最重要的發布都是關于一個詞:
Agent!Agent! 還是 Agent!
“最前沿的 Agent 可能只觸達過世界上 0.1% 的人。”Google CEO Sundar Pichai 在 I/O 期間表示。“真正的問題,是怎么把這種前沿能力規模化交付給真正的更廣泛的用戶。”
讓 Agent 這件事從早期采用者的小圈子走向所有人的過程,Google 準備自己來做。以下是憋了很久的Google為了做成這件事,在這次I/O上的重要發布。
1
3.5 Flash 干掉上代 Pro,把“Agent 經濟賬”擺上桌
Gemini 3.5 系列的第一款模型 3.5 Flash 在幾乎所有基準測試上超過了自家上一代的 Gemini 3.1 Pro。在 Pichai 特意點名的 GDPval 基準(衡量“具有真實經濟價值的任務”)上,提升尤其明顯。
但真正讓 Google 把它推到 keynote 中心位置的,是另一組數據。
3.5 Flash 的輸出速度是其它前沿模型的 4 倍。Antigravity 2.0 里內置的優化版本可以做到 12 倍,質量不變。價格不到同檔前沿模型的一半。
“這種速度與性能的平衡使 3.5 Flash 成為處理長時程Agent任務的最理想選擇。”Google表示。這是一個特意為Agent設計的模型。
![]()
“過去需要開發者數天或審計師數周才能完成的工作,如今 3.5 Flash 可以在極短時間內輔助完成,成本通常不到其他前沿模型的一半。”
也就是說,Pichai 直接把這個性價比換算成了一筆賬給所有 CIO 看。
“你可能聽過很多 CIO 抱怨他們一年的 token 預算才到五月就快用完了。如果一家頭部企業一天處理一萬億 token,把其中 80% 的負載從其它前沿模型遷到 3.5 Flash,一年能省下超過 10 億美元,真金白銀。”
Google 自己已經是這件事最大的受益者。今年 3 月,Google 內部每天處理 5000 億 token;現在每天超過 3 萬億,每隔幾周翻一倍。增長的來源,是工程團隊全面切換到 Antigravity 2.0 加 3.5 Flash 的開發流程之后釋放出來的需求。
![]()
這套內部用法構成了一個完整的反饋回路,反過來又幫 Flash 做得更好。
而且,更強大的 Gemini 3.5 Pro 沒有發布,Pichai 透露夏天會亮相,“內部已經在用,效果很好,但還在打磨”。
1
Gemini Spark:Google 的個人 Agent 終于落地
Spark 是這次回答“Agent 怎么走出 0.1%”最直接的產品。
它是一個 7×24 跑在云端的個人 Agent,以及毫不意外的,把Google全系產品都連了起來。
![]()
注意右下角那一堆產品,那就是Google的個人agent的護城河所在
它跑在 Google Cloud 的專用虛擬機上。你筆記本合上、手機關機,Spark 還在后臺干活。底層模型是 Gemini 3.5,框架是 Google 內部用的 Antigravity Harness。所以它能跑“長周期任務”。
入口先是 Gemini app,隨后接入郵件和聊天。工具調用先從 Google 自家產品開始,接下來幾周開放第三方 MCP 接入。
展示的實際場景包括給老板發狀態匯報,Spark 自動從你的 Gmail、Docs、Sheets、Slides 里拉事實寫草稿;學生用 Spark 建一個會自動更新的學習指南;家長用它管學校時間表;小企業用它盯著收件箱,不漏掉任何客戶問題。
![]()
Spark 接下來還會加 MCP 第三方連接、直接發短信或郵件指揮 Spark、自定義 sub-agent、接入 Chrome 跨網頁干活。Android 上有一個新的 UI 入口叫 Android Halo,可以看 Spark 當前的執行進度。
開放節奏的拿捏值得注意。Spark 僅向受信任測試者首發,下周作為 beta 推給美國 Google AI Ultra 訂閱用戶。配合下面要講的定價調整,Spark 接下來幾個月會真正進入普通人手里。
目前個人Agent 普及最大的現實障礙是用戶的不安全感。Google 這次專門花了時間講它的設計哲學。Spark 在做什么這件事每時每刻都要很清晰,詳細的“思考軌跡”會展示給用戶,可以隨時打斷;執行敏感操作前會停下來征求許可。Google 給的一個具體例子是用 Spark 訂日歷會議,Spark 會在真正發出邀請前先和用戶確認一次。
1
Antigravity 2.0 終于開卷 Claude Code 和 Codex
Antigravity 1.0 是 6 個月前發布的(約 2025 年 11 月),已經有“數百萬開發者在用”。
2.0 這次的關鍵變化是定位轉移。它從“編程環境”變成了“多 Agent 編排平臺”。
具體分三層。
![]()
第一層是一款獨立桌面 App,作為“與 Agent 交互的中央樞紐”。你可以同時編排多個 Agent,一個寫網站代碼、一個生成品牌素材、第三個規劃產品架構,互不打架。
第二層是新的 Antigravity CLI,命令行接口,給想留在終端里的開發者用。
第三層是新的 Antigravity SDK。這一層比較關鍵。Google 給的說明是,SDK 讓程序可以直接、可編程地訪問驅動 Google 自家產品的同一套 Agent harness,與 Gemini 模型協同優化。
內部的一個案例顯示,它在還沒對外發布的Gemnini 3.5 pro的支持下,可以讓93個不同Agents工作,完成任務,消耗26億token,從零建造起一個復雜系統項目。
換句話說,Google 試圖把內部產品正在使用的 Agent harness,以 SDK 的形式開放給開發者。
![]()
這是一次對 Claude Code 和 Codex 的正面對位。
“開發者這個群體的好處是,你把東西做出來,如果真的好用,他們就會真的用。我自己玩過這些產品,Antigravity 加 3.5 Flash 是相當魔幻的體驗,特別是它有多快。3.5 Flash 已經是其它前沿模型的 4 倍,在 Antigravity 里大約是 12 倍。”Pichai在前期的溝通里提到。
更有說服力的支撐來自 Google 的內部測試。用 3.5 Flash 加 Antigravity 2.0 跑多 Agent 協同,他們成功讓 Agent 完全從零搭出了一個能跑的操作系統,而且API耗費在1千美金以內。
Antigravity 這條線下面還有一個單獨發布的安全 Agent,叫 CodeMender。
CodeMender 用 Gemini 的高級推理能力自動找出并修復關鍵代碼漏洞。Google 強調,CodeMender 會直接下筆把代碼漏洞補上,等于接管了“人來打補丁”那一步。當前邀請少數專家測試 CodeMender API,更廣泛的開放“很快”推出。
Google 給這件事的理由是,隨著 Agent 寫越來越多代碼,cybersecurity 會變得更關鍵,agentic workflow 也是這個領域取得進展的必由路徑。
1
徹底換新的 Gemini app,配上大降價
Gemini app 在過去一年里月活從 4 億漲到 9 億,日請求量翻 7 倍,在 230 個國家、70 種語言里運行,Google 在 I/O 上把它定義為“世界上覆蓋最廣的 AI 助手”。
這次Google形容它被從頭重做了。
![]()
Gemini app 的新設計語言叫 Neural Expressive。從動效、色彩、字體到點擊按鈕時的觸感反饋,全換。
但更值得注意的是回答頁面的變化。回答不再是一整面文字墻。最重要的信息加粗頂在頂部。往下滾動,會看到交錯排列的圖片、時間線、可視化圖表。Gemini Live 也不再需要切模式,直接內嵌打開。
Neural Expressive 5 月 19 日全球開放(Android、iOS、Web)。
Gemini Omni 同步進 app。你可以上傳任意照片或視頻,一鍵應用內置模板,甚至可以創建一個“看起來、聽起來都像你”的 AI 化身,把自己放進 Omni 生成的內容里。
更重要的,是 Agent 第一次以“開箱即用”的方式進 Gemini app。第一個出場的是 Daily Brief。
Daily Brief 每天早上做一份個性化簡報。Gemini 隔夜幫你整理收件箱、日歷、當天最重要的任務,會替你把這些信息排序、組織,給出下一步建議。
Daily Brief 有一段值得講的前史。它的前身是 2025 年 12 月在 Google Labs 上線的實驗,叫 Cici。按 Google 自己的說法,Cici 很快成為最受用戶喜愛的 Labs 實驗之一,所以這次直接收編進 Gemini app 成為正式產品。Google Labs 的實驗養大、定型、再吸納進 Gemini 這條工業化產品線,Cici 到 Daily Brief 是最清晰的一個案例。
Daily Brief 5 月 19 日起在美國對所有 Google AI 訂閱用戶開放。
隨這些發布一起調整的是 Gemini 的訂閱價。
新增一檔 100 美元/月的 Ultra plan,給那些“想買重度 Agent 服務但還不到頂配水位”的用戶。原來 250 美元/月的頂級 Ultra plan 直接降到 200 美元。Pro 維持 19.99 美元/月。
![]()
2025 年 5 月 Google 才把頂級檔 Ultra 定在 249.99 美元,一年時間實際降了 20%,中間又加了一檔。這件事和 Spark 同步發生,意圖很清楚,把 Spark 這種重度 Agent 服務的通道鋪寬,讓普通付費用戶也能摸到。Google 自己的說法是要讓這種新型的幫助“交到盡可能多人手里”。
1
Gemini Omni:把 Veo 和 Nano Banana 揉進 Gemini 主架構
如果說 3.5 Flash 是為“讓 Agent 跑起來”準備的,那么 Gemini Omni 是為“讓 world model 真的成型”準備的。
這部分由偉大的Demis Hassabis親自發布。
![]()
Google 給 Omni 的定位是“能從任何輸入生成任何輸出模態的模型”,先做視頻輸出,未來擴展到圖像和文字。
第一款上線的 Gemini Omni Flash,5 月 19 日起向 Google AI 訂閱用戶開放,入口包括 Gemini app、Google Flow 和 YouTube Shorts。所有 Omni 生成或編輯的內容都自帶 SynthID 水印。Omni Pro“即將推出”。
Omni 和 Veo、Nano Banana 之間的關系,Google 自己給出的描述大致是這樣。Omni 是 Gemini 主架構的進化,是 Gemini 一開始原生多模態底層設計延伸的產物。它讓原生多模態從輸入端擴展到輸出端。視頻生成是切入點,因為這是離 Veo 最近的能力;再把 Nano Banana 的編輯能力帶進 Veo,讓你可以像剪輯那樣自然修改視頻。本質上 Omni 是 Gemini 主線的進化,Veo 和 Nano Banana 是它身上的能力組件。
Nano Banana 累計已經生成超過 500 億張圖,Omni 這次把這個能力同等帶到了視頻里。它支持的玩法包括純文本生成視頻,也包括上傳你自己的視頻,做改風格、換角色、保持時間一致性的連續編輯。
在它展示的各種效果里,Omni 可以讓復雜想法可視化,從簡短的提示詞中生成引人入勝的解釋視頻,生成分解更復雜想法的視覺效果。
1
搜索 + 全家桶:Agent 進入 Google 每個角落
搜索:標志性搜索框 25 年來最大一次升級
AI Mode 一周歲了。2025 年的 I/O 上才推出,現在月活超過 10 億,“上線以來每個季度查詢量翻一倍”。
這次 AI Mode 升級到 Gemini 3.5 Flash 驅動。Google 搜索團隊給出的判斷是,人們意識到搜索能做更多事,開始問更長、更具體、跨模態的問題,所以上季度搜索總查詢量創了歷史新高。
圍繞這種變化,Google 這次推出了一個全新的“智能搜索框”。Google 自己給這次搜索框改造下的定義是“標志性搜索框 25 年來最大的一次升級”。
新搜索框會擴展,容納更長更口語化的查詢。一套 AI 驅動的查詢建議系統取代了原來的自動補全,會主動幫你寫復雜、精細的搜索。同時支持多模態輸入。5 月 19 日同步上線。
AI Overviews 和 AI Mode 這次合并成一個無縫體驗。你問一個問題,得到 AI Overview,直接在原頁面繼續追問就進入 AI Mode。5 月 19 日在移動端和桌面端全球同時上線。
搜索框里也長出了 Agent
Information Agents 把搜索從“一次性”變成了 Agent 后臺跑活兒的入口。
你自己創建、定制、管理一個或多個后臺 24/7 跑的 Agent。例如設一個跟蹤某個領域市場變動的 alert,Agent 自己制定監控計劃、確定要用哪些工具和數據(包括 Google 的實時金融數據),達到條件時合成一份帶鏈接的更新推送給你。今夏上線。
更進一步,Generative UI 把 agentic 編程能力注入到了搜索。
例如搜“黑洞如何影響時空?”,得到的是一個 AI Overview 加一個可交互可視化;再追問,搜索會現場為你新建一個可視化。這套能力跑在 Gemini 3.5 Flash 上,背后是 Google DeepMind 和搜索團隊共建的實時代碼生成系統。今夏對所有人免費開放。
同時Google 還把 Antigravity 背后的 agentic 編程能力接進搜索,讓用戶可以用自然語言描述自己想要什么工具,搜索現場為你 build 一個“mini-app”。
Google 給的例子是個性化健身 mini-app,能接入實時天氣、讀你的日歷、知道你的飲食偏好,自動生成餐計劃并附帶帶鏈接的食譜。未來幾個月先對美國 Google AI Pro 和 Ultra 訂閱用戶開放。
1
雖遲但到的 Google ,用轟炸式發布開卷Agent賽道
Google在此前一段時間在Agent的競爭里缺席了。而這場I/O可以看出它對Agent有多焦慮。而它給出的答案是一套全棧布局。
模型層,3.5 Flash 用速度和價格把 Agent 跑起來的邊際成本壓到企業可以接受的位置;Omni 把 world model 這件事再往前推一步。
產品層,Spark 給所有人,Daily Brief 給所有 AI 訂閱用戶,Information Agents 和 Generative UI 讓 Agent 進入Google最廣泛的“渠道”搜索框,Antigravity 2.0 直接給開發者提供了Claude Code的直接“平替”選擇。
在商業層,UCP、AP2、Universal Cart 讓 Agent 進入真實的交易場景。
別忘了Google還有強大的基礎設施層兜底。Pichai也強調了第八代 TPU 這次第一次走“雙芯片”分工,TPU 8T 專做訓練,TPU 8I 專做推理。配合 JAX 和 Pathways,訓練任務可以跨多個數據中心,全球分布到超過 100 萬顆 TPU,這是“世界最大的訓練集群”。
在I/O上,Pichai一直在提醒人們,Google的AI在各個主要產品里的用戶量級全部是十億級別的。有5個產品已經各自有30億用戶。這是一個沒法忽視的優勢,這種全棧的能力會一直讓Anthropic和OpenAI們忌憚。
他透露,Google 今年的 capex 預計 1800-1900 億美元,是 2022 年(310 億)的 6 倍。每月跨自家產品處理的token已經達到了夸張的 3.2 千萬億(quadrillion)token,是 2025 年 I/O 時 480 萬億的 7 倍。
![]()
“為什么我們這么專注于做出既能力非常強、又很高效、很快、價格還很低的前沿模型?因為我們要把它帶給盡可能多的人。這是我們隨著時間會真正發光的地方,就像我們在搜索、推薦和其它領域已經做到的那樣。”在I/O前的小范圍交流里,Pichai這樣說道。
雖遲但到,Google開卷Agent,The show goes on!
![]()
點個“愛心”,再走 吧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.