无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

Google I/O 2026 不打模型仗了

0
分享至


文:王智遠 | ID:Z201440

Google I/O 2026 就這么開完了。

兩個小時,幾十個產品更新,一股腦全砸出來。今天打開任意一家科技媒體都能看到產品清單,我就別跟著念了。

我想說的是另一件事:

Pichai 在 keynote 上放了張圖,Google 內部各產品每月處理的 token 量,2024 年 5 月 9.7 萬億,去年 I/O 的時候 480 萬億,今年到了 3.2 千萬億。一年,翻了 7 倍。

你別以為是用戶變多,Google 核心產品的用戶量級一年下來根本沒變,同一批人,開始用 AI 做以前壓根不會做的事,這是看懂整場 I/O 最關鍵的一把鑰匙。

Google 這次發的所有東西,模型、Agent、搜索升級、定價調整、基礎設施,都在追一個目標:

把 Agent 跑起來的成本壓到一條線以下,然后,用自己最大的本錢,把它塞進十幾億人每天都在用的產品里。

這場游戲規則,跟過去兩年的模型競賽,不一個路子。

01

Pichai 這次把一個模型推到了 keynote 最中間。最便宜的那個。

Gemini 3.5 Flash,名字里就帶 Flash;按 Google 自己的產品線邏輯,這是輕量款,不是旗艦。旗艦是 3.5 Pro,還沒發,Pichai 說夏天見,原話是「內部已經在用,還在打磨」。

先上的卻是 Flash,而且給了最中間的位置,排序本身就是態度。

我翻了翻它的基準測試:

3.5 Flash 在 Terminal-Bench 2.1 上跑出 76.2%,3.1 Pro 是 70.3%。

在 GDPval-AA 這個專門衡量「真實經濟價值任務」的基準上,3.5 Flash 拿了 1656 Elo,3.1 Pro 是 1314。MCP Atlas 工具調用基準,83.6%。



翻譯成人話就是:

一個輕量款模型,在編碼和 Agent 任務上,把自家上一代旗艦全干翻了。

這種事以前幾乎不會發生,Flash 和 Pro 之間一直有明確的能力代差,你選 Flash 就是要拿能力換速度和價格。3.5 Flash 把這個默認假設砸碎了。

速度這邊更夸張,Pichai 在臺上報了個數:

每秒輸出 289 個 token,是其他前沿模型的 4 倍;在 Antigravity 2.0 里跑優化版本,能到 12 倍,定價每百萬 token 輸入 1.5 美元,輸出 9 美元。

我算了一下,比 3.1 Pro 的輸入價格低 40%,輸出也低 40%。如果再用上緩存,長上下文場景下的實際成本還能再降一個臺階。

這些數字單看都是參數,放一起看,就講了一件事:Agent 的邊際運行成本,到了一個新的量級。

Pichai 自己把賬算給了在場的人聽,大意是,一家頭部企業每天處理一萬億 token,把 80% 的負載從其他前沿模型遷到 3.5 Flash,一年能省超過 10 億美元。

這是給 CIO 看的財務測算。

Google 自己已經是最大的受益者,今年 3 月,Google 內部每天處理 5000 億 token。現在這個數超過 3 萬億,每隔幾周翻一倍。

增長的來源就一條:

工程團隊全面切到 Antigravity 加 3.5 Flash 的開發流程之后,原來跑不起的任務,突然跑得起了。

這就回到了開頭說的數據,token 消耗一年翻 7 倍,是成本降到某條線以下之后,用法自己長出來的。

3.5 Flash 的意義,不在于「又一個更強的模型」,它真正做的事,是把 Agent 從「技術上可行」推到了「經濟上可行」。

過去兩年大家聊 Agent,聊能不能做得到;這個模型一出來,問題變了,變成誰能把它鋪出去。

02

誰能把 Agent 鋪出去,Google 的第一個回答叫 Gemini Spark,一個 24 小時掛在云端的個人智能體。

你筆記本合上,手機鎖屏,它還在后臺干活,底層跑的是 3.5 Flash,框架是 Google 內部的 Antigravity Harness,部署在 Google Cloud 的專用虛擬機上。

入口就在 Gemini 應用里,9 億月活用戶,打開就能摸到,Google Labs 的副總裁 Josh Woodward 在臺上演示了幾個場景:

給老板發周報,Spark 自己去你的郵箱、文檔、表格、演示文稿里把事實拉出來,用你的語氣寫好草稿。

辦鄰居聚會,Spark 追蹤誰回復了誰沒回,自動在在線表格里建一個實時更新的 RSVP 表,給沒回的人起草催促郵件。

聽起來都是小事,這些小事值得講,因為全程不需要你盯著。

第一批接入的第三方工具是 Canva、OpenTable、Instacart,走的是 MCP 協議。

意思是 Spark 不只幫你在 Google 自家產品里跑腿,它還能幫你訂餐廳、下單買菜;接下來幾周會開放更多第三方接入,夏天還會加 Chrome 瀏覽器集成和 macOS 本地文件訪問。

開放節奏值得注意,Spark 現在只給受信任測試者用,下周以測試版推給美國的 AI Ultra 訂閱用戶,是一層一層放。



這個節奏背后藏著一個問題:用戶憑什么把郵箱、日歷、購物車交給一個 AI。

Google 這次專門花了時間講這件事,Spark 在做什么,每一步都展示思考軌跡,用戶隨時可以打斷;執行敏感操作之前會停下來征求許可,比如要發一封郵件、訂一個日歷會議,它會先問你一聲。

Woodward 的原話里還有一句:

你不需要一直開著電腦確認它在跑,這句話既是產品特性,也在回應用戶心里那個不安。

Spark 是對消費者的回答。對企業的回答是 Antigravity 2.0;Antigravity 1.0 去年 11 月發的,定位是智能編程環境,對標的是 Cursor,用了半年,Google 說已經有數百萬開發者。

2.0 這次換方向了,它從編程工具變成了多智能體編排平臺;具體分三層:

第一層,一款獨立桌面應用,Google 管它叫「與智能體交互的中樞」。

你可以同時起多個智能體,一個寫代碼,一個生成品牌素材,一個做產品架構,并行跑,互不干擾;還能設定計劃任務,讓智能體按時間表自動在后臺執行。

第二層,Antigravity 命令行工具,給習慣待在終端里的開發者用;這個工具直接取代了之前的 Gemini 命令行,6 月 18 日舊版停服,所有用戶必須遷移。

第三層,Antigravity SDK。

這一層是關鍵。Google 給的說明是,SDK 讓外部開發者可以用編程方式調用驅動 Google 自家產品的同一套智能體框架,跟 Gemini 模型協同優化,部署在自己的基礎設施上。

翻譯一下:

Google 試著把自己內部正在用的智能體基礎設施,以 SDK 的形式交到開發者手里,這是對 Claude Code 和 Codex 的正面對位。

Antigravity 這條線下面還有一個單獨發布,叫 CodeMender;一個安全智能體,用 Gemini 的推理能力自動發現并修復關鍵代碼漏洞,直接下筆改代碼,不只是報告問題。

Google 的邏輯很直白:智能體寫的代碼越來越多,安全就得跟上,安全本身也得由智能體來做。

把 Spark 和 Antigravity 2.0 放在一起看,Google 做的事情就很清楚了。

消費者這邊,一個 24 小時在線的個人智能體,接著 9 億月活的 Gemini 應用落地;企業這邊,一個從編程工具進化成編排平臺的開發者工具,附帶 SDK 和命令行,直接競爭 Claude Code。

兩條路同時鋪,中間跑的都是同一個引擎,3.5 Flash。

所以,谷歌的解法是:準備兩條腿一起跑,消費者和開發者一個都不放。

03

鋪出去之后,智能體往哪跑?說出來肯定驚到下巴,答案藏在 Google 最老的那個產品里:搜索。

Google 自己給這次搜索框改造下的定義是「標志性搜索框 25 年來最大的一次升級」;智遠認為,這話有營銷成分,但看完具體改動之后,確實不是小修小補。

先說一個數據:

AI Mode 去年 I/O 才發布,一年時間月活過了 10 億。上線以來每個季度查詢量翻一倍,上季度 Google 搜索的總查詢量創了歷史新高。

這個數字反直覺,過去幾年行業里一直有個敘事:

AI 聊天機器人會蠶食搜索,實際發生的正好反過來;人們發現搜索能做更多事之后,搜索量不降反升,而且漲得很猛。

新搜索框的變化從交互層就開始了,它會隨著你輸入的內容自動擴展,容納更長更口語化的問題。

原來的自動補全換成了一套 AI 驅動的查詢建議系統,是幫你想清楚你到底想問什么,同時支持多模態輸入,文字、圖片、視頻、Chrome 標簽頁都能往里丟。

AI Overviews 和 AI Mode 這次合到一起了,你問一個問題,看到 AI 概覽,直接在原頁面追問就滑入 AI Mode,上下文不斷,越聊越深,推薦的鏈接和來源也越來越精準。5 月 19 日全球同步上線。

這些都是產品層面的更新,真正值得注意的是搜索框里長出來的智能體。

Google 管它叫信息智能體,你可以在搜索里創建一個或者多個后臺智能體,24 小時幫你盯著某件事。

比如:

你讓它跟蹤某個領域的市場變動,智能體會自己制定監控計劃,決定該用哪些數據源,包括 Google 的實時金融數據、新聞、博客、社交帖子,條件觸發的時候合成一份帶鏈接的更新推給你,今夏上線,先給 AI Pro 和 Ultra 訂閱用戶。



再往前一步,搜索里還接入了 Antigravity 的編程能力。

Google 管它叫生成式界面,你搜一個問題,搜索不只給你答案,還能現場給你生成一個可交互的迷你應用。

臺上演示的例子是一個個性化健身應用,能接入實時天氣、讀你的日歷、知道你的飲食偏好,自動生成飲食計劃并附帶食譜鏈接。

這是搜索在幫你造東西。搜索之外,智能體也在進 Google 的其他產品。

Daily Brief 是 Gemini 應用里的第一個開箱即用的智能體。每天早上幫你整理收件箱、日歷和待辦,排好優先級,給出下一步建議。

它的前身是去年 12 月在 Google Labs 上線的一個實驗項目 Cici,很快成了最受歡迎的實驗之一,這次直接收編進了正式產品線。

統一購物車是購物場景的智能體,一個跨 Google 搜索、Gemini 應用、YouTube、郵箱工作的統一購物車,能追蹤降價、監控庫存、查看價格歷史,甚至能發現你買的電腦配件之間的兼容性問題。

Ask YouTube 重新定義了視頻搜索,你問一個問題,它不給你一排視頻列表讓你自己翻,而是直接跳到最相關的那個視頻里最相關的那個片段。

把這些更新攤開看,一個結論就浮出來了。

模型競賽時,比誰的基準分數高,純 AI 公司和平臺公司站在同一起跑線上。

智能體競賽的邏輯完全不同,智能體要連接真實的郵箱、日歷、文檔、購物車、搜索歷史、視頻庫,誰手里有這些東西,誰就有先天優勢。

Google 有 13 個產品超過 10 億用戶,5 個超過 30 億。這不是技術能補的差距。

Anthropic 和 OpenAI 可以做出很好的模型,可以做出很好的智能體框架;它們做不出郵箱,做不出搜索,做不出 YouTube。

這是 Google 在智能體時代最大的本錢,也是這場 I/O 真正在講的故事,模型再強也拼不過管道有多粗。

04

管道粗,得有東西在底下撐著。

Pichai 在 keynote 后半段把話題轉到了基礎設施,開頭就甩了一個數字:2022 年 Google 的資本開支是 310 億美元,今年預計 1800 到 1900 億。6 倍。四年時間。

這筆錢的一大塊砸在了自研芯片上,Google 發布了第八代 TPU,第一次做了雙芯片分工。

TPU 8t 專做訓練,原始算力接近上一代的 3 倍;TPU 8i 專做推理,速度拉滿,兩顆芯片的性能功耗比都提升了約 2 倍。

訓練這邊還有一個值得單獨講的變化。

Google 自己搞了一套訓練調度框架,訓練任務能跨好幾個數據中心跑,全球調度超過 100 萬顆 TPU。Pichai 管這叫「世界上最大的訓練集群」。

這意味著訓練不再被一個機房的物理上限卡住,模型越來越大,訓練周期從幾個月壓到幾周。

推理這邊,TPU 8i 的設計方向就一個字,快。Pichai 原話提到,Google 做了 27 年搜索,學到的最深的一課就是延遲很重要。

3.5 Flash 每秒 289 個 token 的輸出速度,底下撐著的就是這套推理芯片。

把上面幾段的邏輯串起來:3.5 Flash 的速度和價格不是憑空來的,是 1800 億美元的資本開支、自研芯片、全球分布式訓練集群共同托出來的。

純 AI 公司可以在模型層追上來,基礎設施層想追上,難度高了一大截。這是另一層「管道」。

05

最后一塊拼圖是 Gemini Omni,這趴是 DeepMind 的 CEO Demis Hassabis 親自上臺講的,分量夠重。

Omni 能干啥?你給它什么,它給你什么,先從視頻開始,以后圖片和文字也會跟上來。

第一款上線的叫 Gemini Omni Flash,5 月 19 日開始在 Gemini 應用、Google Flow 和 YouTube Shorts 里能用,所有生成的內容自帶水印。

3.5 Flash 解決的是「讓智能體跑起來」,Omni 指向的是更遠的事:讓 AI 不光會寫字,還會造東西。

Omni 不是一個獨立的新東西,以前 Google 的 Veo 管視頻生成,Nano Banana 管圖片編輯,各管各的,互不搭嘎;Omni 把這些全塞進 Gemini 一個框里了。

你上傳一段自己拍的視頻,說一句話讓它改,它就能改里面正在發生的事,加個人進去,換個風格,時間線還給你接得上。

或者你純用文字描述一個想法,Omni 直接給你生成一段帶畫面帶聲音的視頻。

這個能力單看是個很強的演示,放回整場 I/O 的邏輯里看,它在講一件更大的事。

我翻了一下時間線:

今年 4 月 29 日,OpenAI 把面向消費者的 Sora 2 應用關了,只留了付費 API;理由是基礎設施成本和分發策略要調整。11 天之后,Google 的 Gemini 應用里開始出現 Omni 的影子。

同一個方向,一家因為扛不住成本退了一步,另一家選擇往前走。

兩家面對的技術難題差不多。差別在哪?Google 有自研的 TPU 推理芯片壓成本,有 Gemini 應用 9 億月活分攤算力,有 YouTube Shorts 這種現成的臺子來消化視頻生成的產能。

OpenAI 沒有;這不只誰的模型更好的問題,是誰的結構撐得住。

把整場 I/O 從頭到尾串一遍,Google 講的就一件事:

模型層,3.5 Flash 用速度和價格把智能體的成本壓到誰都接得住的位置。

產品層,Spark 給普通人,Antigravity 2.0 給程序員,搜索里長出來的智能體和生成式界面把搜索變成了入口,統一購物車把智能體塞進了真實交易。

基礎設施層,1800 億美元的資本開支、第八代 TPU、百萬顆芯片的訓練集群在底下兜著;每一層都不是孤立存在,屬于一個系統里的不同齒輪。

Pichai 在 I/O 前的小范圍交流里說過一句話:

我們為什么這么執著于做出既強又快又便宜的前沿模型,因為我們要把它帶給盡可能多的人。這是我們真正會發光的地方。

這句話的潛臺詞不難讀,Google 認為智能體時代的終局,是誰能把好的模型、大的管道、深的地基綁在一起,讓智能體真的跑進普通人的生活。

過去兩年,純 AI 公司掌握著行業敘事的主場,這場 I/O 之后,一個老問題值得重新想想:

當競爭從「做出最好的模型」變成「讓智能體跑進真實生活」,窗口在給誰打開,又在給誰關上。



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
他的今日份老婆是雙馬尾,評論只有一個句號

他的今日份老婆是雙馬尾,評論只有一個句號

赴一場山海啊
2026-06-11 00:20:35
20億收購夢碎后,Manus被Meta斷網,創始人慌忙籌錢

20億收購夢碎后,Manus被Meta斷網,創始人慌忙籌錢

Ping值焦慮
2026-06-12 03:58:25
兩大利好突襲!芯片,大消息!

兩大利好突襲!芯片,大消息!

數據寶
2026-06-11 22:00:17
CBA最新消息!北京首鋼或裁掉范子銘,布朗離開浙江廣廈

CBA最新消息!北京首鋼或裁掉范子銘,布朗離開浙江廣廈

體壇瞎白話
2026-06-11 15:51:04
上海青少年抑郁率全國第一:中產父母的精致育兒,正在毀掉下一代

上海青少年抑郁率全國第一:中產父母的精致育兒,正在毀掉下一代

教師吧
2026-06-11 16:49:53
全國多地公交專用道“黃線”變“白線”,原因為何?

全國多地公交專用道“黃線”變“白線”,原因為何?

新京報
2026-06-11 13:28:16
世聯賽戰報:日本3-0橫掃奪冠,中國隊2-3憾負世界第一

世聯賽戰報:日本3-0橫掃奪冠,中國隊2-3憾負世界第一

阿嚼影視評論
2026-06-11 22:40:47
陶昕然拒絕浪姐總決賽返場!現實中“安凌容”體面人,干脆又清醒

陶昕然拒絕浪姐總決賽返場!現實中“安凌容”體面人,干脆又清醒

師維
2026-06-11 12:43:54
新冠后遺癥的長期侵襲,無數人在不知不覺中深陷困境

新冠后遺癥的長期侵襲,無數人在不知不覺中深陷困境

律法刑道
2026-04-01 10:15:47
姚氏入宮祝壽歸來,張廷玉發現妻子容貌異變,其人早已遭人替換。

姚氏入宮祝壽歸來,張廷玉發現妻子容貌異變,其人早已遭人替換。

磊子講史
2026-06-06 19:30:18
一場106-107,可怕的不是輸球,是文班亞馬這番話,有自己打算

一場106-107,可怕的不是輸球,是文班亞馬這番話,有自己打算

林子說事
2026-06-11 14:25:27
伊朗外交部:尚未就伊美協議達成最終結論

伊朗外交部:尚未就伊美協議達成最終結論

財聯社
2026-06-12 04:56:04
CPU都快燒了,或許是水下的米格-25,美媒:中國無帆大型潛艇下水

CPU都快燒了,或許是水下的米格-25,美媒:中國無帆大型潛艇下水

嘯鷹評
2026-06-11 07:41:45
滬金主力合約盤初快速下跌,現跌超4%

滬金主力合約盤初快速下跌,現跌超4%

澎湃新聞
2026-06-11 09:24:21
33歲利物浦中場遠藤航 因傷退出世界杯宣布國家隊退役

33歲利物浦中場遠藤航 因傷退出世界杯宣布國家隊退役

體壇周報
2026-06-12 05:04:10
安理會限制否決權使用,中國對2-11投票結果表示失望

安理會限制否決權使用,中國對2-11投票結果表示失望

雪兒愛追劇
2026-06-12 05:59:45
“火烈鳥”再出擊!俄羅斯政府不提,大V們卻趁機不滿哀嘆

“火烈鳥”再出擊!俄羅斯政府不提,大V們卻趁機不滿哀嘆

鷹眼Defence
2026-06-11 17:19:09
4400萬輛車在“蹭路”?央媒連發三炮,電車養路費這回真要來了

4400萬輛車在“蹭路”?央媒連發三炮,電車養路費這回真要來了

混沌錄
2026-06-11 21:00:07
移民持刀襲擊引爆北愛暴力排外狂潮

移民持刀襲擊引爆北愛暴力排外狂潮

萍聚德國
2026-06-11 00:23:11
片約不斷,還演啥毀啥!《迷墻》“戲混子”男一號女一號該醒醒了

片約不斷,還演啥毀啥!《迷墻》“戲混子”男一號女一號該醒醒了

尋墨閣
2026-06-12 07:03:31
2026-06-12 08:03:00
智遠同學 incentive-icons
智遠同學
暢銷書《復利思維》作者;精神生活與商業探索,關注科技人文、消費電商、品牌營銷、商業認知思維等方面。
762文章數 210關注度
往期回顧 全部

科技要聞

淘寶、京東、拼多多、抖音、小紅書被約談

頭條要聞

特朗普突然取消對伊朗"猛烈打擊":美伊達成重大協議

頭條要聞

特朗普突然取消對伊朗"猛烈打擊":美伊達成重大協議

體育要聞

比起總冠軍,更大的懸念成了FMVP?

娛樂要聞

《花少8》陣容大揭秘!秒殺前一季

財經要聞

干細胞生意:17萬一針的希望

汽車要聞

將搭云輦-M智能磁流變懸架 方程豹方程S系列信息曝光

態度原創

藝術
親子
家居
公開課
軍事航空

藝術要聞

華國鋒的“華氏顏體”為何被公認為書法珍品?

親子要聞

歷經兩年治療,無精子癥患者家庭在滬迎健康寶寶

家居要聞

空間微調 移形換境

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗媒體:已故最高領袖葬禮推遲舉行

無障礙瀏覽 進入關懷版