![]()
機(jī)器之心編輯部
今天凌晨,谷歌全面撕掉「克制」標(biāo)簽,向智能體時(shí)代轉(zhuǎn)型了。
![]()
當(dāng)?shù)貢r(shí)間周二,谷歌 I/O 大會(huì)正式舉行,今年一系列新產(chǎn)品的核心邏輯是「24 小時(shí)不停工作的智能體」。
看來(lái) OpenClaw 開(kāi)了頭,以后每個(gè)人手上的 AI 都是要不停工作,誰(shuí)也逃不掉。
Google CEO 桑達(dá)爾?皮查伊(Sundar Pichai)給出了一系列數(shù)字:當(dāng)前,大模型行業(yè)的競(jìng)爭(zhēng)已經(jīng)從刷基準(zhǔn)測(cè)試榜單全面轉(zhuǎn)向了拼智能體工程落地。人們應(yīng)用 AI 的最直觀指標(biāo)自然是 token 的消耗量,兩年前人們通過(guò)谷歌的各種渠道每月消耗 9.7 萬(wàn)億 token,去年這個(gè)數(shù)字增長(zhǎng)到了480 萬(wàn)億,而到了今天,這個(gè)數(shù)字又增長(zhǎng)了七倍,達(dá)到了每月超過(guò) 3.2 千萬(wàn)億。
![]()
谷歌表示,現(xiàn)在每月有超過(guò) 850 萬(wàn)開(kāi)發(fā)者在使用 Gemini 構(gòu)建新的應(yīng)用程序和體驗(yàn)。如今的谷歌已有 13 款產(chǎn)品用戶量均超過(guò) 10 億,其中 5 款產(chǎn)品用戶量超過(guò) 30 億。
它們當(dāng)然都是由 AI 驅(qū)動(dòng)的。就說(shuō)谷歌搜索的「AI 模式」,月活用戶早已超過(guò)了 10 億;Nano Banana 圖像生成模型如今已生成了超過(guò) 500 億張圖像。
在大會(huì)上,谷歌宣布推出最新一代模型系列 Gemini 3.5,稱其集前沿智能與行動(dòng)能力于一身,代表著谷歌在構(gòu)建更強(qiáng)大、更智能的智能體方面邁出了重要一步。
不過(guò),目前首發(fā)的是輕量級(jí)產(chǎn)品Gemini 3.5 Flash,在智能體和編程方面具備前沿性能,尤其擅長(zhǎng)處理復(fù)雜、長(zhǎng)周期、能夠產(chǎn)生現(xiàn)實(shí)價(jià)值的任務(wù)。
至于重量級(jí)版本 Gemini 3.5 Pro,谷歌說(shuō)目前仍在開(kāi)發(fā)中,僅在內(nèi)部投入使用。皮查伊說(shuō)新旗艦?zāi)P?Gemini 3.5 Pro 尚未準(zhǔn)備就緒,現(xiàn)場(chǎng)觀眾都發(fā)出了嘆息聲。
他只好說(shuō)「下個(gè)月一定」。
而 Gemini 3.5 Flash 即日起正式面向全球用戶開(kāi)放:
- 普通用戶可通過(guò) Gemini App 和 Google 搜索中的 AI Mode 使用;
- 開(kāi)發(fā)者可通過(guò)開(kāi)發(fā)平臺(tái) Google Antigravity,以及 Google AI Studio 和 Android Studio 中的 Gemini API 使用;
- 企業(yè)則可通過(guò) Gemini Enterprise Agent Platform 和 Gemini Enterprise 使用。
Gemini 3.5 Flash:具備面向智能體與編程的前沿性能
谷歌在博客中稱,Gemini 3.5 Flash 在多個(gè)維度上的智能水平已經(jīng)接近大型旗艦?zāi)P停瑫r(shí)保持了 Flash 系列一貫的「快」,是目前最強(qiáng)的智能體與編程模型。
數(shù)據(jù)顯示,在 Terminal-Bench 2.1、GDPval-AA、MCP Atlas 等高難度編程和智能體基準(zhǔn)測(cè)試中,得分分別為 76.2%、1656 Elo 和 83.6%,超過(guò) Gemini 3.1 Pro 的表現(xiàn)。
在多模態(tài)理解方面,也同樣處于領(lǐng)先水平,在 CharXiv Reasoning 上取得 84.2% 的成績(jī),按輸出 token 速度計(jì)算,要比其他模型快 4 倍。
![]()
而在 Artificial Analysis 指數(shù)中,3.5 Flash 位于右上象限,以出色速度提供前沿級(jí)智能。而速度與性能之間的平衡,使其非常適合處理長(zhǎng)周期智能體任務(wù),與此同時(shí),成本通常不到其他前沿模型的一半。
官方直稱,「用戶不必再在質(zhì)量和延遲之間做取舍。」
![]()
結(jié)合更新后的開(kāi)發(fā)者平臺(tái) Antigravity 執(zhí)行框架后,3.5 Flash 可以成為部署協(xié)作式子智能體的強(qiáng)大引擎,用于大規(guī)模處理最具挑戰(zhàn)性的任務(wù)。在人類監(jiān)督下,它能夠可靠執(zhí)行多步驟工作流和編程任務(wù),同時(shí)保持前沿性能。
官方展示了幾個(gè)案例,可以來(lái)看一下:
借助 Antigravity,3.5 Flash 利用兩個(gè)智能體對(duì) AlphaZero 論文進(jìn)行合成,并在 6 個(gè)小時(shí)內(nèi)編寫(xiě)出了一款完全可玩的游戲:
![]()
3.5 Flash 利用子智能體在 Antigravity 中創(chuàng)建全新的城市景觀:
![]()
此外,值得注意的是,谷歌還強(qiáng)化了 Gemini 3.5 系列模型的網(wǎng)絡(luò)安全防護(hù),官方稱,開(kāi)發(fā)遵循 Frontier Safety Framework,加強(qiáng)網(wǎng)絡(luò)安全和 CBRN 相關(guān)安全防護(hù),這意味著「它生成有害內(nèi)容的可能性更低,同時(shí)也更不容易誤拒安全問(wèn)題。」
全家桶 AI 升級(jí)
基礎(chǔ)模型的大版本更新之上,是一系列新產(chǎn)品的發(fā)布與更新。
首先引人關(guān)注的是一款名為 Spark 的全新 AI 智能體。Spark 基于 Gemini 3.5,并與包括 Gmail、Docs 和 Slides 在內(nèi)的 Google Workspace 應(yīng)用深度集成。用戶可以教它執(zhí)行各種任務(wù),例如在 Gmail 中創(chuàng)建重要截止日期列表并發(fā)送給自己,或者在冗長(zhǎng)的電子郵件往來(lái)中總結(jié)最新進(jìn)展。
你還可以設(shè)置它執(zhí)行重復(fù)性任務(wù),例如每月自動(dòng)查找信用卡賬單中的隱藏費(fèi)用。
此外,你還可以設(shè)置規(guī)則讓它完成多個(gè)相互關(guān)聯(lián)的任務(wù),從而構(gòu)建完整的工作流程。例如,你可以讓 Spark 查看聊天記錄和電子郵件中的會(huì)議記錄,并在 Google 文檔中生成精美的報(bào)告,同時(shí)還能自動(dòng)撰寫(xiě)一封可以隨報(bào)告一起發(fā)送的電子郵件。
![]()
這家科技巨頭還宣布對(duì)其最大的搖錢(qián)樹(shù)谷歌搜索進(jìn)行有史以來(lái)最大規(guī)模的改造。引入 Gemini 3.5 Flash 之后,它將最新的 AI 模式功能直接添加到搜索框中,同時(shí)允許新的智能體在后臺(tái)執(zhí)行搜索任務(wù)。
現(xiàn)在輸入搜索查詢時(shí),搜索框會(huì)自動(dòng)擴(kuò)展,為用戶提供更多空間,方便他們使用自然語(yǔ)繼續(xù)提問(wèn)。新的 AI 搜索框還允許用戶在搜索查詢的同時(shí)上傳圖片、視頻、文件和 Chrome 標(biāo)簽頁(yè)以便 AI 參考。
更加進(jìn)階的是給搜索框派任務(wù):用戶可以向搜索智能體提供查詢的所有相關(guān)信息,智能體隨后將全天候掃描新聞網(wǎng)站、博客和社交媒體等信息來(lái)源,以查找最相關(guān)、最新的信息。如果用戶正在尋找公寓,他們可以向搜索智能體輸入所有住房要求,AI 會(huì)全天候掃描符合這些條件的新公寓列表。
這是谷歌的搜索框 25 年來(lái)的首次更新。
![]()
另外還有多模態(tài)的新能力。去年,Nano Banana 一波爆火,今年谷歌正式推出 Gemini Omni,這是一個(gè)將 Gemini 的推理能力與創(chuàng)作能力完美融合的全新系列,首個(gè)版本為 Gemini Omni Flash。作為新一代模型,Omni 能夠基于任何形式的輸入內(nèi)容來(lái)生成萬(wàn)物 —— 首批支持的生成形式即為視頻。
借助 Omni,你可以將圖像、音頻、視頻及文本混合作為輸入,進(jìn)而生成基于 Gemini 現(xiàn)實(shí)世界知識(shí)的高質(zhì)量視頻。此外,你還可以通過(guò)對(duì)話交互的方式,輕松對(duì)視頻進(jìn)行編輯。
可以來(lái)看幾個(gè)官方展示的案例。
輸入提示詞:把這座雕塑做成泡泡材質(zhì),之后就會(huì)得到下面這個(gè)內(nèi)容:
![]()
還可以把你自己拍攝的一段視頻交給 Omni,只要告訴它你想把畫(huà)面里發(fā)生的事情改成什么樣,就可以修改動(dòng)作、加入新角色或新物體,甚至還可以把原本一個(gè)瞬間變成意想不到的場(chǎng)景。
比如下面這個(gè)案例,輸入提示詞:公寓里的燈光開(kāi)始隨著音樂(lè)同步亮起:
![]()
官方表示,目前Gemini Omni Flash 正在向全球 Google AI Plus、Pro 和 Ultra 訂閱用戶開(kāi)放,可通過(guò) Gemini App 和 Google Flow 使用。同時(shí),從本周開(kāi)始,還在 YouTube Shorts 和 YouTube Create App 上免費(fèi)向用戶推出。未來(lái)幾周則會(huì)通過(guò) API 向開(kāi)發(fā)者和企業(yè)客戶開(kāi)放。
或許,本次大會(huì)上最能讓人難忘的一句話來(lái)自哈薩比斯:「當(dāng)我們回顧這段時(shí)期時(shí),我想我們會(huì)意識(shí)到,我們當(dāng)時(shí)正站在奇點(diǎn)的山腳下。」
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/#gemini-3-5-flash
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.