剛剛,Google開完了他們的產品發布會。
回顧這半年,AI圈的熱鬧,幾乎跟Google沒啥關系。
但了解Google的人都知道,它就喜歡攢一波,然后在I/O大會上,一口氣全放出來。
終于,今年的,又來了。
![]()
我也通宵給大家蹲完,然后整理完了。
可能會是最全的一篇了。
一. AI模型
1.Gemini 3.5 Flash
今年I/O大會的明星之一,Gemini 3.5 Flash。
![]()
一般來說,Flash系列是輕量快速版,主打便宜和快,Pro才是滿血旗艦版。
但現在基本上都流行,新一代的小模型,要比上一代的大模型還要強,所以這次也是一樣,3.5 Flash的能力在編碼能力、Agent能力、工具調用能力都比上一代的3.1 Pro要強不少。
![]()
Terminal-Bench 2.1編碼測試,3.5 Flash拿了76.2%,3.1 Pro只有70.3%。GDPval-AA,衡量真實世界經濟價值任務的,3.5 Flash 1656 Elo,3.1 Pro 1314 Elo,差了三百多分。
跑分上確實強了不少。
不過呢,3.5 Flash在Humanity's Last Exam(人類最后考試)上40.2%,比3.1 Pro的44.4%差,ARC-AGI-2上72.1%也輸給Pro的77.1%。
這兩個benchmark主要考的是世界知識和純抽象推理。
也就是說,這次也是犧牲了知識的能力,換來了干活的能力的加強。
輸出速度方面,比其他前沿模型快4倍。
![]()
價格這塊,輸入$1.50/百萬token,輸出$9.00/百萬token,比3 Flash貴了3倍,但比3.1 Pro便宜40%。
![]()
現在真的全網token提價真的是大勢所趨。。。
然后知識截止日期到2025年1月(感覺拉了個大的),上下文窗口100萬token。
至于Gemini 3.5 Pro,他們親口說的是“Give us until next month to get it to you”,也就是下個月見。
![]()
3.5 Flash今天直接成為Gemini App和AI Mode in Search的默認模型,全球同步上線API、AI Studio、Antigravity等等,所有人也都可以去體驗了。
![]()
2.Gemini Omini Flash
Gemini Omni,這個東西其實發布會之前就已經在推特上炒瘋了。
說真的,其實是有點期待的。
畢竟,谷歌把這玩意稱為“a new model that can create anything from any input”,也就是能根據任何輸入創造出任何東西的全新模型。
而且現在Google的視頻模型,已經被大家認為唯一一個能勉強跟Seedance 2.0打一打的模型了,也是很多AI漫劇公司最后的希望。
在宣發上,看著效果感覺還行。
目前也已經上線了,但是吧,我體驗了一下,只能說,有點拉了。
就真的有一點不太行,而且中文的口音,一股港臺腔,真的怪怪的。
看到一個評論說。
![]()
emmmm。
別說看起來了,用起來也不如Seedance啊。。。
不過有一個功能值得一提,就是它支持保持視頻中某一個片段不變,只修改其他部分。
![]()
不過今天發布的是Gemini Omni Flash,拉一點感覺也能理解,畢竟是Omni家族的第一個模型,google也明確說了,Omni Pro即將發布。
二. Gemini產品1. Gemini App 全新設計
Gemini App的設計語言,正式名字叫Neural Expressive。
一打開網頁端,整體配色,從之前那個灰白色的界面,換成了一個藍色漸變的背景。
![]()
第一眼會覺得挺高級的,但也有點像。。。手機省電模式?
手機端也是。
![]()
工具欄做了一個合并,之前上傳文件、調用工具、選附件是分散在不同地方的,現在全塞進了一個+號里。
點開模型選擇器,底下有一個思維水平的選項,展開以后有標準和擴展兩項。
![]()
最讓我沒想到的是設置里,Google也開始整限額了。。。
打開設置一看,好家伙,兩個進度條,一個當前使用情況,一個每周限額。
![]()
不學Claude好的方面,凈學這方面。。。
目前,新設計Neural Expressive今天起在Android、iOS、Web全球上線。
2. Ask Maps
Google Maps來了一個十年最大升級,加了個叫Ask Mapx的功能。
![]()
你現在,可以直接用自然語言跟地圖對話。
現場舉了個例子,有家長真的問了這么一個問題:“我家孩子剛掉進鴨子池塘,婚禮30分鐘后就開始了,我能走著去哪里給她買件新裙子?”
這種問題你以前在搜索框里根本沒法打,現在可以了。
![]()
Google的生態還是太猛了,把地圖這種東西,接到了Gemini里,還是能產生一些化學反應的。
3. Ask YouTube
YouTube也搞了一個類似的東西,叫Ask YouTube。
你也不用再自己翻視頻了,直接問它“怎么教三歲小孩騎自行車,他已經會騎平衡車了”,它會給你一個整理好的概覽、小貼士、最相關的視頻片段,甚至直接跳到視頻里最對口的那一段。
還能追問,它記得上下文。
跟上面那個功能其實思路是一樣的,把搜索框變成對話框,不管是地圖還是視頻。
![]()
Ask YouTube現在在美國對Premium訂閱者開放,今年夏天全美推廣。
4. Docs live
之前你想讓Gemini幫你寫個文檔,得敲一段很精準的prompt,想清楚了再打字。
然后Docs Live的思路是,你不用打字了,直接說話就行。
![]()
腦子里想到什么就說什么,說亂了也沒關系,Gemini自己整理。
現場他們搞了個演示,一個工程師要給高中母校的職業日做分享,他就對著Gemini一頓說,“把我簡歷從Drive里調出來”“想幾個搞笑的類比”“哦對把學校發的那封郵件里的時間地點也抓出來”“做成表格”“在最前面加個備注讓我別忘了講我哥的故事,加粗”。
全程沒打一個字,就是一直一邊想一邊說,說完文檔就直接出來了。
非常的絲滑。
最有意思的是中途改主意,比如他說Thursday,然后立刻改口說Friday,Gemini就會自動把Thursday抹掉換成Friday,這個還挺好的。
![]()
今年夏天對Pro和Ultra訂閱者開放。Gmail Live和Google Keep的Live模式后面也會接入。
5. Gemini Live升級
Gemini Live的語音更新。
現場放了幾段,利物浦腔的英語、印度哈里亞納方言、巴西里約葡萄牙語。。。
三個口音切來切去玩了一段。
接下來幾周會陸續上線更多。
6. Daily Brief
這是Gemini App里一個新功能,每天早上給你一份個性化摘要。
它會自己翻你的郵箱、日歷、任務清單,挑出今天最重要的事情,按主題分好類,甚至建議你下一步該做什么,比如提醒你還書、出行時間之類的。
![]()
今天起面向美國的Plus、Pro、Ultra用戶開放。
7. NotebookLM
功能上增加了電影級視頻概覽,你丟一堆資料進去,它能直接生成一段帶流暢動畫和視覺效果的講解視頻。
信息圖也升級了,現在有10種預設風格可選,手繪風、可愛風、專業風、科學風、動漫風、黏土風。。。
學習工具這塊,閃卡和測驗都改了,進度會跨設備保存。
最大的變化是,NotebookLM跟Gemini App打通了。Gemini里現在有一個筆記本功能,你在 Gemini里創建的筆記本會自動同步到NotebookLM,反過來也一樣。
還支持上傳EPUB電子書了,幻燈片可以導出PPTX格式,聊天記錄自動保存,可以在對話里直接生成播客、視頻、報告。
![]()
另外NotebookLM也進了Google Classroom,大學生可以在課堂里直接創建自己的課程筆記本,用老師提供的資料生成學習工具。
三. Agent系統
Agent今年是Google整場發布會的真主線。
1. Antigravity2.0
先講Antigravity2.0。
Antigravity是Google的之前的開發平臺,但是真的難用,而且完全沒啥更新,去年11月才發布的,當時發了之后我們每天干的最多的事,就是把Antigravity的Claude額度給反代出來給OpenCode用,后面開始封號,我基本也就沒咋用過了。
今天,終于版本來到了2.0。
![]()
更新內容有幾個。
第一,全新獨立桌面應用。這跟之前是個IDE插件不一樣了,是個真正的Agent工作環境了。
![]()
第二,AntigravityCLI上線,全球可用。
這其實就是直接把Gemini CLI給替代了。
Google官方公告,2026年6月18日之后,Gemini CLI和Gemini Code Assist IDE擴展會停止對Pro/Ultra用戶服務。
![]()
開發者要全部遷到Antigravity CLI。
這條信息對所有用Gemini CLI開發的人都注意一下(雖然我估計可能沒有),別到6月18號才發現自己的工作流掛了。
第三,Antigravity SDK,開發者可以把Google用在Antigravity里的agent harness,直接拿到自己的服務器上跑。
第四,原生語音支持,整合Gemini音頻模型,跟Android、Firebase、AI Studio都打通了。
然后他們現場演示了一下,讓Antigravity配合Gemini 3.5 Flash,從零構建一個可運行的操作系統。
![]()
93個subagent并行跑,12個小時,1.5萬次模型請求,處理26億token,總成本不到$1000。
還真搞了個OS出來,能跑命令行,能跑doom游戲,可以放動畫。
還挺有意思的。
更騷的是3.5 Flash在Antigravity里被專門優化過,跟別的模型相比,不是4倍快,是12倍快了。。。
![]()
Antigravity 2.0全球開放,所有人今天都能用。
2. Gemini Spark
接下來是Gemini Spark。
你的個人AI Agent,感覺是對標了OpenClaw。
![]()
它跑在Google Cloud的專屬虛擬機上,24/7不間斷,你可以關掉你的電腦,Spark也會在云端繼續干活。
由Gemini 3.5 Flash和Antigravity harness驅動,可以處理長鏈路后臺任務。
也直接打通了Google 全家桶,幫你打理各種事。
比如,在工作中讓Spark幫團隊寫一封郵件,匯總最近一周Gemini Live的發布和成績等等。
Spark會自己去翻你的Docs、郵件、聊天記錄,把最重要的信息抓出來,然后按照你預設的寫作風格起草郵件。
![]()
或者是在生活中,籌備一場街區派對。
Spark在Google Sheets里生成實時RSVP追蹤表,自動跟Gmail打通,鄰居回復一句“我來”表格就會自動更新,沒回復的鄰居它自己會生成催回復的郵件草稿。
![]()
然后又從Google Drive里翻出了小區HOA的章程,提醒你周五下午之前不能布置充氣城堡,還在Google Slides里做了一份派對宣傳deck。。。
![]()
![]()
目前,Spark本周對一些測試人員開放,下周開始對美國Google AI Ultra訂閱者開放Beta測試。
注意,是Ultra訂閱者,不是Pro,不過說真的,這年頭誰家好人會沒事給Google沖250刀的Ultra會員啊,過于大冤種了。
所以呢,伴隨著Spark發布的,是Google整個訂閱價格體系的重新洗牌。
Google AI Ultra之前只有一檔,$250一個月,這次拆成兩檔。
![]()
新的$100/月Ultra plan,給開發者、技術lead、內容創作者準備,5倍于Pro的用量、20TB云存儲、YouTube Premium、優先用Antigravity。
老的Ultra plan從$250降到$200/月,保留所有頂配能力。
Spark在$100和$200兩檔都可以用。
按我意思來說,Google你的價格其實還得再降降才行。
3. Android Halo
Spark在云端24/7干活,但你怎么看它在干啥呢。
答案是Android Halo。
![]()
Halo是Android上一個專門給Agent準備的home base,會在狀態欄頂部顯示Agent正在干什么。
Spark做什么、做到哪一步、要不要你確認,都在這條狀態欄里。
今年晚些時候上線。
Halo其實被帶過的比較快,但是我覺得還挺有意思的,可能會是一個新的UI層級。
過去的Android UI都是給App用的,App是底層邏輯。
Halo開始的Android,是給Agent用的,Agent是底層邏輯。
可能未來會誕生很多新的玩法。
四. 視覺生成1. Google Pics
Workspace里的新產品,Google Pics。
![]()
注意是Pics,不是Pix,跟Google Photos區分開。
Pics是圖像創作和編輯工具,做派對傳單、信息圖、活動海報這種東西。
支持目標分割,可以選中圖里任何一個元素單獨編輯。
比如把一只狗變成一只貓,或者把毛衣換個顏色,背景可以完全不動。
文字也能直接在圖里編輯、一鍵翻譯多語種啥的。
![]()
所有輸出自動加SynthID水印,保證可以被溯源。
今年夏天先在美國上Ultra訂閱者。
2. Stitch
Stitch是Google做UI設計的工具。
過去一年,全球用戶用Stitch生成了超過1億張UI畫面,Google說內部自己也在用。
(PS:用過這個的可以舉個手)
![]()
這次更新有幾個,實時語音協作(你說話、UI實時改),導出代碼、直接發布到Netlify、跟Antigravity打通。
Google有段披薩店的演示還挺好玩的。
兩個完全不懂UI設計的人,對著Stitch一通說,“menu突出更多披薩選項”, “header字大一點”啥的。
![]()
UI實時響應,最后一鍵發布上線。
3. Google Flow
老朋友了,Flow就是Google的AI creative studio。
![]()
這次更新有四個。
![]()
1.加入Gemini Omni,可以保留原始視頻里的表演和動作,只改環境和特效。
![]()
2.新Agent功能。一張圖同時生成16段不同機位的視頻,比如你給它一張街景,它給你出16種鏡頭語言的視頻。
![]()
3.大規模場景修改。把所有鏡頭從清晨變成深夜,燈光、陰影、車燈,整個場景自洽切換。
![]()
4.Flow Tools。你可以在Flow里vibe code自己的創意工具,比如做視頻特效、手繪動畫、文字圖層疊加啥的。
![]()
最好玩的是Flow Music。
![]()
現場演示了一段。一個團隊成員錄了一段鋼琴riff,扔進Flow Music,跟它說“往R&B方向走,加女聲”。然后它就給出了一段編曲完整的歌。
效果還可以的,比Suno還差點,但是作為小demo其實夠用了。
所以其實在這里,Flow的發布邏輯就很清晰了。
想做做創意人的整個工作流入口。
從畫板、到劇本、到鏡頭、到剪輯、到調色、到配樂,一站式想全包。
但是坦率的講,功能確實全,但是也真的不咋好用。。。
4. SynthID
還有一個小更新,SynthID。
![]()
Google做的AI水印技術,專門用來標記哪些內容是AI生成的。
已經給超過1000億張圖片和視頻打了水印,還有累計6萬年時長的音頻。
新的變化是,現在你在Chrome里右鍵點一張圖,或者用圈選搜索,就能查這張圖是不是AI生成的。
![]()
還玩了個梗,說去年有一張他吃漢堡的圖在社交媒體傳瘋了,但其實是假的,他原話說“I don't eat hamburgers”。
![]()
最讓我意外的是,Google宣布OpenAI、Kakao、ElevenLabs也加入了SynthID。
![]()
OpenAI也發了公告。
![]()
這是這次發布會最有故事感的一個細節。
過去三年這兩家恨不得搞死對方,今天他們在SynthID這件事上放下芥蒂一起合作了。
AI生成的假圖、假聲音、假視頻這個問題,已經嚴重到大家不得不放下架子一起搞了。
Nvidia去年加入,Sony Pictures、Reuters、TikTok也在路上。
五. Google搜索
AI Mode月活已經突破 10 億,自上線以來每個季度查詢量翻一倍。
然后今天也官宣底層模型升級成了Gemini 3.5。
具體的更新有四個。
1. 重做了搜索框
Google說這是搜索框25年以來最大的一次升級。
以前你只能打字,現在可以丟圖片、文件、視頻進去,搜索會跨模態一起理解。而且它會用AI幫你補全問題,幫你把真正想問的問題梳理出來。
![]()
2. AI Overviews和AI Mode合并了
從搜索結果頁自然過渡到對話式追問,上下文可以一直跟著你。
![]()
3. Search Agents
搜索里可以創建Agent了。可以在搜索里同時啟動多個Agent,讓它們7x24小時在后臺幫你盯著事情。
![]()
比如說,你是炒股的,想盯PE小于15、現金流為正、負債低的生物科技股,AI agent接到指令自己去查,看到價格變動給你推送更新,可以放你方便的把信號和噪音分開等等。
![]()
4. Agentic Coding 進了搜索
搜索現在會針對你的問題,實時從零搭建定制化的交互界面。
比如問黑洞怎么影響時空的,可以直接生成了一個可以拖拽參數的交互式的可視化頁面。
![]()
這玩意背后是Antigravity在驅動。
搜索的時候調用了一個containerized agent環境,讓3.5 Flash實時寫代碼、跑代碼、把渲染結果嵌回搜索結果。
這玩意今年夏天對所有用戶免費開放。
直接在搜索里面嵌入生成式UI,可能是搜索這個產品形態自1998年以來最大的一次進化。
六. Agent電商
這塊整個是新增的板塊,但是反而是今天發布會最有意思的板塊。
兩個支柱協議加一個新產品,湊成了完整的三件套。
1. Universal Commerce Protocol(UCP)
UCP是Google一月份發布的開源協議,定位是Agent電商時代的HTTP。
你可以簡單的理解成,給Agent自己去買東西時候用的一套通用購物規則,類似MCP。
Google在NRF零售展會上提出來的時候,已經拉了Shopify、Etsy、Wayfair、Target、Walmart五家創始合作伙伴一起搞了,還找到一群公司來背書。
這次I/O的新進展是,Amazon、Meta、Microsoft、Salesforce、Stripe官宣加入了UCP的技術委員會。
![]()
Vidya原話是:“it may very well be the first time we've all agreed on something”,這可能是我們所有人第一次達成共識。
![]()
之前只在美國上,現在開始擴展到加拿大、澳大利亞,英國也緊隨其后。
2. Agent Payments Protocol(AP2)
AP2你可以簡單的理解成,給 Agent付款用的授權協議。
![]()
AP2解決的的,其實就是Agent幫你買東西會不會亂花錢的問題。
你可以給Agent設三道護欄。具體品牌、具體商品、支付金額上限,三個條件全滿足,Agent才會下單。
每一筆交易都有tamper-proof digital mandate,也就是篡改防護的數字授權書,如果有問題,你和商家看到的是同一份記錄,可以追溯。
AP2即將先在Gemini Spark上線。
3. Universal Cart
這是這次I/O真正的新發布。
![]()
一個跨商家、跨服務的智能購物車。
你在Search里看到一個東西可以加進去,跟Gemini聊天看到一個東西可以加進去,看YouTube視頻時看到一個東西可以加進去,連讀Gmail時看到一個東西也可以加進去。
![]()
加進去之后這個購物車自動在后臺干活,找折扣、查價格歷史、對你賬戶里的支付卡權益、提醒缺貨補貨、跨商品檢查兼容性。
比如說,你買電腦配件,先加了一塊主板進購物車,之前你已經買過一個CPU。Universal Cart發現你CPU和主板不匹配,主動給你提醒,讓你換個主板。
這種能力是Google搜索過去20年從來沒有的能力。
我自己是真的有點期待了,非常的有意思。
Universal Cart今年夏天美國上線,先在Search和Gemini App里,YouTube和Gmail后面跟進。
Agent+錢這塊的基礎設施,已經開始緩緩漸進了。
七. 其他1. Android XR智能眼鏡
![]()
Android XR眼鏡會有兩條路線。
一類是帶鏡片顯示屏的顯示眼鏡,去年I/O已經展示過,今年晚些時候會擴大測試計劃。
![]()
另一類是今年秋天要發的的首款音頻眼鏡。
![]()
沒有鏡片顯示屏,靠聲音跟你交互,平時聽音樂、拍照、打電話、調App。
Gentle Monster和Warby Parker負責的外觀設計,三星做的硬件,同時支持IOS和Android。
![]()
現場演示挺有意思的。
一個姑娘戴著眼鏡,跟Gemini說帶我去上周跟朋友見面的那個地方,Gemini直接設好了導航,還主動問要不要順路買你常喝的那杯冷萃咖啡?然后自己打開手機上的外賣App幫她下了單。
最后拿眼鏡給觀眾拍了張合影,讓Gemini把照片變成卡通風格,還加了個大飛艇,放在手表上看。
![]()
2. TPU
TPU 這次也有一次比較大的更新。
第八代TPU,是Google歷史上第一次采用了雙芯片路線,分別針對訓練和推理做優化。
訓練芯片叫TPU 8t,主要面向大規模預訓練。原始算力接近上一代的3倍。
提到一套叫Jackson Pathways的訓練基礎設施,可以把訓練任務分布到多個數據中心,不再受單個超大數據中心限制,最高能跨全球超過100萬顆TPU做scaling。
![]()
推理芯片叫TPU 8i,重點是降低延遲、提升生成速度。
![]()
Google現場用一個即將發布的Flash模型做演示,讓它生成一個Chrome Dino小游戲,屏幕上顯示的生成速度接近每秒1500個token。
![]()
速度確實快的有點過于離譜了。
3. AI科研
發布會最后,Google講了AI在科學領域的幾個項目。
一個是Gemini for Science,新發布的科研工具集,包含三個實驗性原型。
![]()
第一個叫假設生成器,基于Co-Scientist底層系統,讓多個agent一起生成、辯論、評估科研假設,每個論點都有可點擊的引用來源。
第二個叫計算發現引擎,基于AlphaEvolve和ERA,并行生成上千個代碼變體,讓科學家幾小時跑完原本要幾個月的實驗。
第三個叫科學技能包,針對生物醫藥,整合了UniProt、AlphaFold Database、AlphaGenome API、InterPro等30多個生命科學數據庫,復雜分析從幾小時壓到幾分鐘。
除了Gemini for Science之外,還有兩個東西。
一個叫Weather Next。AI天氣預報,比傳統模型更準、更早預警。
去年的梅麗莎颶風襲擊牙買加,Weather Next提前3天預測到了,比傳統模型更準確,幫助當地提前撤離居民,救了不少人。
![]()
一個是AI制藥。Google旗下Isomorphic Labs用AI加速新藥研發,已經有多個項目進入臨床前階段,針對免疫疾病和癌癥。Hassabis說目標是“one day solving all disease”,有朝一日治好所有的病。
![]()
除了幾個科研的之外,還有一個Code Mender。能自動找到代碼里的安全漏洞并修好,今天起對一小批專家開放Code Mender API測試。
![]()
程序員看到這塊應該挺安心的。
畢竟Agent寫的代碼越來越多,安全漏洞自動修復這件事,已經是基礎設施級別的需求了。
終于。。。總結完了。。。
Google每次的發布會是真的信息量大到讓人窒息。
最后,Hassabis結束的時候。
他說了一句讓我還蠻動容的話。
他說:
When we look back at this time, I think we'll realize that we were standing in the foothills of the singularity
當我們回望這個時刻時,我想我們會意識到,我們正站在奇點的山腳下。
我也確實相信這句話。
AI,至少在現在看,它是人類智慧的放大器。
也許,我們會開啟一個,科學發現和進步的新黃金時代。
也希望未來。
我們能不斷的,一起見證。
以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。
>/ 作者:卡茲克、可達、Chiyo
>/ 投稿或爆料,請聯系郵箱:wzglyay@virxact.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.