網易首頁 > 網易號 > 正文申請入駐

直擊 Google I/O 2026 | 轟炸式發布 Agent，狙擊 Claude Code，開戰！

2026-05-20 03:37:21　來源: 硅星人

北京舉報

分享至

作者｜王兆洋
郵箱｜ wangzhaoyang@pingwest.com

Google I/O 2026，再一次飽和式發布。

數十個產品更新，2個小時，一股腦全扔出來。信息量爆炸。

如果把最重要的發布更新先做個梳理，它們包括：

Gemini 3.5系列亮相，先丟出 Flash版本，Pro下個月上線。一如既往，新的輕量模型干翻上一代Pro版本；
Gemini Spark 亮相：對標OpenClaw的個人Agent產品終于有了，24/7在線干活；
Antigravity發布2.0，全面擺脫coding的場景局限，終于和Claude Code 以及 Codex 直接競爭；
多模態能力集大成，聚到新的世界模型 Gemini Omni 上，可以用任何模態輸入，任何模態輸出，創造互動世界；
Gemini app全面Agent化，交互設計和配套模型跟著完成大更新；
搜索、全家桶，全面“小 Gemini”化，讓你在哪都能build；
Gemini “降價”：新增一檔 100 美元/月的 Ultra plan，給那些“想買重度 Agent 服務但還不到頂配水位”的用戶。原來 250 美元/月的頂級 Ultra plan 直接降到 200 美元。Pro 維持 19.99 美元/月。

可以看出來，其中最重要的發布都是關于一個詞：

Agent！Agent! 還是 Agent！

“最前沿的 Agent 可能只觸達過世界上 0.1% 的人。”Google CEO Sundar Pichai 在 I/O 期間表示。“真正的問題，是怎么把這種前沿能力規模化交付給真正的更廣泛的用戶。”

讓 Agent 這件事從早期采用者的小圈子走向所有人的過程，Google 準備自己來做。以下是憋了很久的Google為了做成這件事，在這次I/O上的重要發布。

3.5 Flash 干掉上代 Pro，把“Agent 經濟賬”擺上桌

Gemini 3.5 系列的第一款模型 3.5 Flash 在幾乎所有基準測試上超過了自家上一代的 Gemini 3.1 Pro。在 Pichai 特意點名的 GDPval 基準（衡量“具有真實經濟價值的任務”）上，提升尤其明顯。

但真正讓 Google 把它推到 keynote 中心位置的，是另一組數據。

3.5 Flash 的輸出速度是其它前沿模型的 4 倍。Antigravity 2.0 里內置的優化版本可以做到 12 倍，質量不變。價格不到同檔前沿模型的一半。

“這種速度與性能的平衡使 3.5 Flash 成為處理長時程Agent任務的最理想選擇。”Google表示。這是一個特意為Agent設計的模型。

“過去需要開發者數天或審計師數周才能完成的工作，如今 3.5 Flash 可以在極短時間內輔助完成，成本通常不到其他前沿模型的一半。”

也就是說，Pichai 直接把這個性價比換算成了一筆賬給所有 CIO 看。

“你可能聽過很多 CIO 抱怨他們一年的 token 預算才到五月就快用完了。如果一家頭部企業一天處理一萬億 token，把其中 80% 的負載從其它前沿模型遷到 3.5 Flash，一年能省下超過 10 億美元，真金白銀。”

Google 自己已經是這件事最大的受益者。今年 3 月，Google 內部每天處理 5000 億 token；現在每天超過 3 萬億，每隔幾周翻一倍。增長的來源，是工程團隊全面切換到 Antigravity 2.0 加 3.5 Flash 的開發流程之后釋放出來的需求。

這套內部用法構成了一個完整的反饋回路，反過來又幫 Flash 做得更好。

而且，更強大的 Gemini 3.5 Pro 沒有發布，Pichai 透露夏天會亮相，“內部已經在用，效果很好，但還在打磨”。

Gemini Spark：Google 的個人 Agent 終于落地

Spark 是這次回答“Agent 怎么走出 0.1%”最直接的產品。

它是一個 7×24 跑在云端的個人 Agent，以及毫不意外的，把Google全系產品都連了起來。

注意右下角那一堆產品，那就是Google的個人agent的護城河所在

它跑在 Google Cloud 的專用虛擬機上。你筆記本合上、手機關機，Spark 還在后臺干活。底層模型是 Gemini 3.5，框架是 Google 內部用的 Antigravity Harness。所以它能跑“長周期任務”。

入口先是 Gemini app，隨后接入郵件和聊天。工具調用先從 Google 自家產品開始，接下來幾周開放第三方 MCP 接入。

展示的實際場景包括給老板發狀態匯報，Spark 自動從你的 Gmail、Docs、Sheets、Slides 里拉事實寫草稿；學生用 Spark 建一個會自動更新的學習指南；家長用它管學校時間表；小企業用它盯著收件箱，不漏掉任何客戶問題。

Spark 接下來還會加 MCP 第三方連接、直接發短信或郵件指揮 Spark、自定義 sub-agent、接入 Chrome 跨網頁干活。Android 上有一個新的 UI 入口叫 Android Halo，可以看 Spark 當前的執行進度。

開放節奏的拿捏值得注意。Spark 僅向受信任測試者首發，下周作為 beta 推給美國 Google AI Ultra 訂閱用戶。配合下面要講的定價調整，Spark 接下來幾個月會真正進入普通人手里。

目前個人Agent 普及最大的現實障礙是用戶的不安全感。Google 這次專門花了時間講它的設計哲學。Spark 在做什么這件事每時每刻都要很清晰，詳細的“思考軌跡”會展示給用戶，可以隨時打斷；執行敏感操作前會停下來征求許可。Google 給的一個具體例子是用 Spark 訂日歷會議，Spark 會在真正發出邀請前先和用戶確認一次。

Antigravity 2.0 終于開卷 Claude Code 和 Codex

Antigravity 1.0 是 6 個月前發布的（約 2025 年 11 月），已經有“數百萬開發者在用”。

2.0 這次的關鍵變化是定位轉移。它從“編程環境”變成了“多 Agent 編排平臺”。

具體分三層。

第一層是一款獨立桌面 App，作為“與 Agent 交互的中央樞紐”。你可以同時編排多個 Agent，一個寫網站代碼、一個生成品牌素材、第三個規劃產品架構，互不打架。

第二層是新的 Antigravity CLI，命令行接口，給想留在終端里的開發者用。

第三層是新的 Antigravity SDK。這一層比較關鍵。Google 給的說明是，SDK 讓程序可以直接、可編程地訪問驅動 Google 自家產品的同一套 Agent harness，與 Gemini 模型協同優化。

內部的一個案例顯示，它在還沒對外發布的Gemnini 3.5 pro的支持下，可以讓93個不同Agents工作，完成任務，消耗26億token，從零建造起一個復雜系統項目。

換句話說，Google 試圖把內部產品正在使用的 Agent harness，以 SDK 的形式開放給開發者。

這是一次對 Claude Code 和 Codex 的正面對位。

“開發者這個群體的好處是，你把東西做出來，如果真的好用，他們就會真的用。我自己玩過這些產品，Antigravity 加 3.5 Flash 是相當魔幻的體驗，特別是它有多快。3.5 Flash 已經是其它前沿模型的 4 倍，在 Antigravity 里大約是 12 倍。”Pichai在前期的溝通里提到。

更有說服力的支撐來自 Google 的內部測試。用 3.5 Flash 加 Antigravity 2.0 跑多 Agent 協同，他們成功讓 Agent 完全從零搭出了一個能跑的操作系統，而且API耗費在1千美金以內。

Antigravity 這條線下面還有一個單獨發布的安全 Agent，叫 CodeMender。

CodeMender 用 Gemini 的高級推理能力自動找出并修復關鍵代碼漏洞。Google 強調，CodeMender 會直接下筆把代碼漏洞補上，等于接管了“人來打補丁”那一步。當前邀請少數專家測試 CodeMender API，更廣泛的開放“很快”推出。

Google 給這件事的理由是，隨著 Agent 寫越來越多代碼，cybersecurity 會變得更關鍵，agentic workflow 也是這個領域取得進展的必由路徑。

徹底換新的 Gemini app，配上大降價

Gemini app 在過去一年里月活從 4 億漲到 9 億，日請求量翻 7 倍，在 230 個國家、70 種語言里運行，Google 在 I/O 上把它定義為“世界上覆蓋最廣的 AI 助手”。

這次Google形容它被從頭重做了。

Gemini app 的新設計語言叫 Neural Expressive。從動效、色彩、字體到點擊按鈕時的觸感反饋，全換。

但更值得注意的是回答頁面的變化。回答不再是一整面文字墻。最重要的信息加粗頂在頂部。往下滾動，會看到交錯排列的圖片、時間線、可視化圖表。Gemini Live 也不再需要切模式，直接內嵌打開。

Neural Expressive 5 月 19 日全球開放（Android、iOS、Web）。

Gemini Omni 同步進 app。你可以上傳任意照片或視頻，一鍵應用內置模板，甚至可以創建一個“看起來、聽起來都像你”的 AI 化身，把自己放進 Omni 生成的內容里。

更重要的，是 Agent 第一次以“開箱即用”的方式進 Gemini app。第一個出場的是 Daily Brief。

Daily Brief 每天早上做一份個性化簡報。Gemini 隔夜幫你整理收件箱、日歷、當天最重要的任務，會替你把這些信息排序、組織，給出下一步建議。

Daily Brief 有一段值得講的前史。它的前身是 2025 年 12 月在 Google Labs 上線的實驗，叫 Cici。按 Google 自己的說法，Cici 很快成為最受用戶喜愛的 Labs 實驗之一，所以這次直接收編進 Gemini app 成為正式產品。Google Labs 的實驗養大、定型、再吸納進 Gemini 這條工業化產品線，Cici 到 Daily Brief 是最清晰的一個案例。

Daily Brief 5 月 19 日起在美國對所有 Google AI 訂閱用戶開放。

隨這些發布一起調整的是 Gemini 的訂閱價。

新增一檔 100 美元/月的 Ultra plan，給那些“想買重度 Agent 服務但還不到頂配水位”的用戶。原來 250 美元/月的頂級 Ultra plan 直接降到 200 美元。Pro 維持 19.99 美元/月。

2025 年 5 月 Google 才把頂級檔 Ultra 定在 249.99 美元，一年時間實際降了 20%，中間又加了一檔。這件事和 Spark 同步發生，意圖很清楚，把 Spark 這種重度 Agent 服務的通道鋪寬，讓普通付費用戶也能摸到。Google 自己的說法是要讓這種新型的幫助“交到盡可能多人手里”。

Gemini Omni：把 Veo 和 Nano Banana 揉進 Gemini 主架構

如果說 3.5 Flash 是為“讓 Agent 跑起來”準備的，那么 Gemini Omni 是為“讓 world model 真的成型”準備的。

這部分由偉大的Demis Hassabis親自發布。

Google 給 Omni 的定位是“能從任何輸入生成任何輸出模態的模型”，先做視頻輸出，未來擴展到圖像和文字。

第一款上線的 Gemini Omni Flash，5 月 19 日起向 Google AI 訂閱用戶開放，入口包括 Gemini app、Google Flow 和 YouTube Shorts。所有 Omni 生成或編輯的內容都自帶 SynthID 水印。Omni Pro“即將推出”。

Omni 和 Veo、Nano Banana 之間的關系，Google 自己給出的描述大致是這樣。Omni 是 Gemini 主架構的進化，是 Gemini 一開始原生多模態底層設計延伸的產物。它讓原生多模態從輸入端擴展到輸出端。視頻生成是切入點，因為這是離 Veo 最近的能力；再把 Nano Banana 的編輯能力帶進 Veo，讓你可以像剪輯那樣自然修改視頻。本質上 Omni 是 Gemini 主線的進化，Veo 和 Nano Banana 是它身上的能力組件。

Nano Banana 累計已經生成超過 500 億張圖，Omni 這次把這個能力同等帶到了視頻里。它支持的玩法包括純文本生成視頻，也包括上傳你自己的視頻，做改風格、換角色、保持時間一致性的連續編輯。

在它展示的各種效果里，Omni 可以讓復雜想法可視化，從簡短的提示詞中生成引人入勝的解釋視頻，生成分解更復雜想法的視覺效果。

搜索 + 全家桶：Agent 進入 Google 每個角落

搜索：標志性搜索框 25 年來最大一次升級

AI Mode 一周歲了。2025 年的 I/O 上才推出，現在月活超過 10 億，“上線以來每個季度查詢量翻一倍”。

這次 AI Mode 升級到 Gemini 3.5 Flash 驅動。Google 搜索團隊給出的判斷是，人們意識到搜索能做更多事，開始問更長、更具體、跨模態的問題，所以上季度搜索總查詢量創了歷史新高。

圍繞這種變化，Google 這次推出了一個全新的“智能搜索框”。Google 自己給這次搜索框改造下的定義是“標志性搜索框 25 年來最大的一次升級”。

新搜索框會擴展，容納更長更口語化的查詢。一套 AI 驅動的查詢建議系統取代了原來的自動補全，會主動幫你寫復雜、精細的搜索。同時支持多模態輸入。5 月 19 日同步上線。

AI Overviews 和 AI Mode 這次合并成一個無縫體驗。你問一個問題，得到 AI Overview，直接在原頁面繼續追問就進入 AI Mode。5 月 19 日在移動端和桌面端全球同時上線。

搜索框里也長出了 Agent

Information Agents 把搜索從“一次性”變成了 Agent 后臺跑活兒的入口。

你自己創建、定制、管理一個或多個后臺 24/7 跑的 Agent。例如設一個跟蹤某個領域市場變動的 alert，Agent 自己制定監控計劃、確定要用哪些工具和數據（包括 Google 的實時金融數據），達到條件時合成一份帶鏈接的更新推送給你。今夏上線。

更進一步，Generative UI 把 agentic 編程能力注入到了搜索。

例如搜“黑洞如何影響時空？”，得到的是一個 AI Overview 加一個可交互可視化；再追問，搜索會現場為你新建一個可視化。這套能力跑在 Gemini 3.5 Flash 上，背后是 Google DeepMind 和搜索團隊共建的實時代碼生成系統。今夏對所有人免費開放。

同時Google 還把 Antigravity 背后的 agentic 編程能力接進搜索，讓用戶可以用自然語言描述自己想要什么工具，搜索現場為你 build 一個“mini-app”。

Google 給的例子是個性化健身 mini-app，能接入實時天氣、讀你的日歷、知道你的飲食偏好，自動生成餐計劃并附帶帶鏈接的食譜。未來幾個月先對美國 Google AI Pro 和 Ultra 訂閱用戶開放。

雖遲但到的 Google ，用轟炸式發布開卷Agent賽道

Google在此前一段時間在Agent的競爭里缺席了。而這場I/O可以看出它對Agent有多焦慮。而它給出的答案是一套全棧布局。

模型層，3.5 Flash 用速度和價格把 Agent 跑起來的邊際成本壓到企業可以接受的位置；Omni 把 world model 這件事再往前推一步。

產品層，Spark 給所有人，Daily Brief 給所有 AI 訂閱用戶，Information Agents 和 Generative UI 讓 Agent 進入Google最廣泛的“渠道”搜索框，Antigravity 2.0 直接給開發者提供了Claude Code的直接“平替”選擇。

在商業層，UCP、AP2、Universal Cart 讓 Agent 進入真實的交易場景。

別忘了Google還有強大的基礎設施層兜底。Pichai也強調了第八代 TPU 這次第一次走“雙芯片”分工，TPU 8T 專做訓練，TPU 8I 專做推理。配合 JAX 和 Pathways，訓練任務可以跨多個數據中心，全球分布到超過 100 萬顆 TPU，這是“世界最大的訓練集群”。

在I/O上，Pichai一直在提醒人們，Google的AI在各個主要產品里的用戶量級全部是十億級別的。有5個產品已經各自有30億用戶。這是一個沒法忽視的優勢，這種全棧的能力會一直讓Anthropic和OpenAI們忌憚。

他透露，Google 今年的 capex 預計 1800-1900 億美元，是 2022 年（310 億）的 6 倍。每月跨自家產品處理的token已經達到了夸張的 3.2 千萬億（quadrillion）token，是 2025 年 I/O 時 480 萬億的 7 倍。

“為什么我們這么專注于做出既能力非常強、又很高效、很快、價格還很低的前沿模型？因為我們要把它帶給盡可能多的人。這是我們隨著時間會真正發光的地方，就像我們在搜索、推薦和其它領域已經做到的那樣。”在I/O前的小范圍交流里，Pichai這樣說道。

雖遲但到，Google開卷Agent，The show goes on！

點個“愛心”，再走吧

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.