網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

I/O大會(huì)開(kāi)完，谷歌連搜索框都變智能體了

2026-05-20 12:02:51　來(lái)源: 機(jī)器之心Pro

河北舉報(bào)

分享至

機(jī)器之心編輯部

今天凌晨，谷歌全面撕掉「克制」標(biāo)簽，向智能體時(shí)代轉(zhuǎn)型了。

當(dāng)?shù)貢r(shí)間周二，谷歌 I/O 大會(huì)正式舉行，今年一系列新產(chǎn)品的核心邏輯是「24 小時(shí)不停工作的智能體」。

看來(lái) OpenClaw 開(kāi)了頭，以后每個(gè)人手上的 AI 都是要不停工作，誰(shuí)也逃不掉。

Google CEO 桑達(dá)爾?皮查伊（Sundar Pichai）給出了一系列數(shù)字：當(dāng)前，大模型行業(yè)的競(jìng)爭(zhēng)已經(jīng)從刷基準(zhǔn)測(cè)試榜單全面轉(zhuǎn)向了拼智能體工程落地。人們應(yīng)用 AI 的最直觀指標(biāo)自然是 token 的消耗量，兩年前人們通過(guò)谷歌的各種渠道每月消耗 9.7 萬(wàn)億 token，去年這個(gè)數(shù)字增長(zhǎng)到了480 萬(wàn)億，而到了今天，這個(gè)數(shù)字又增長(zhǎng)了七倍，達(dá)到了每月超過(guò) 3.2 千萬(wàn)億。

谷歌表示，現(xiàn)在每月有超過(guò) 850 萬(wàn)開(kāi)發(fā)者在使用 Gemini 構(gòu)建新的應(yīng)用程序和體驗(yàn)。如今的谷歌已有 13 款產(chǎn)品用戶量均超過(guò) 10 億，其中 5 款產(chǎn)品用戶量超過(guò) 30 億。

它們當(dāng)然都是由 AI 驅(qū)動(dòng)的。就說(shuō)谷歌搜索的「AI 模式」，月活用戶早已超過(guò)了 10 億；Nano Banana 圖像生成模型如今已生成了超過(guò) 500 億張圖像。

在大會(huì)上，谷歌宣布推出最新一代模型系列 Gemini 3.5，稱其集前沿智能與行動(dòng)能力于一身，代表著谷歌在構(gòu)建更強(qiáng)大、更智能的智能體方面邁出了重要一步。

不過(guò)，目前首發(fā)的是輕量級(jí)產(chǎn)品Gemini 3.5 Flash，在智能體和編程方面具備前沿性能，尤其擅長(zhǎng)處理復(fù)雜、長(zhǎng)周期、能夠產(chǎn)生現(xiàn)實(shí)價(jià)值的任務(wù)。

至于重量級(jí)版本 Gemini 3.5 Pro，谷歌說(shuō)目前仍在開(kāi)發(fā)中，僅在內(nèi)部投入使用。皮查伊說(shuō)新旗艦?zāi)Ｐ?Gemini 3.5 Pro 尚未準(zhǔn)備就緒，現(xiàn)場(chǎng)觀眾都發(fā)出了嘆息聲。

他只好說(shuō)「下個(gè)月一定」。

而 Gemini 3.5 Flash 即日起正式面向全球用戶開(kāi)放：

普通用戶可通過(guò) Gemini App 和 Google 搜索中的 AI Mode 使用；
開(kāi)發(fā)者可通過(guò)開(kāi)發(fā)平臺(tái) Google Antigravity，以及 Google AI Studio 和 Android Studio 中的 Gemini API 使用；
企業(yè)則可通過(guò) Gemini Enterprise Agent Platform 和 Gemini Enterprise 使用。

Gemini 3.5 Flash：具備面向智能體與編程的前沿性能

谷歌在博客中稱，Gemini 3.5 Flash 在多個(gè)維度上的智能水平已經(jīng)接近大型旗艦?zāi)Ｐ停瑫r(shí)保持了 Flash 系列一貫的「快」，是目前最強(qiáng)的智能體與編程模型。

數(shù)據(jù)顯示，在 Terminal-Bench 2.1、GDPval-AA、MCP Atlas 等高難度編程和智能體基準(zhǔn)測(cè)試中，得分分別為 76.2%、1656 Elo 和 83.6%，超過(guò) Gemini 3.1 Pro 的表現(xiàn)。

在多模態(tài)理解方面，也同樣處于領(lǐng)先水平，在 CharXiv Reasoning 上取得 84.2% 的成績(jī)，按輸出 token 速度計(jì)算，要比其他模型快 4 倍。

而在 Artificial Analysis 指數(shù)中，3.5 Flash 位于右上象限，以出色速度提供前沿級(jí)智能。而速度與性能之間的平衡，使其非常適合處理長(zhǎng)周期智能體任務(wù)，與此同時(shí)，成本通常不到其他前沿模型的一半。

官方直稱，「用戶不必再在質(zhì)量和延遲之間做取舍。」

結(jié)合更新后的開(kāi)發(fā)者平臺(tái) Antigravity 執(zhí)行框架后，3.5 Flash 可以成為部署協(xié)作式子智能體的強(qiáng)大引擎，用于大規(guī)模處理最具挑戰(zhàn)性的任務(wù)。在人類監(jiān)督下，它能夠可靠執(zhí)行多步驟工作流和編程任務(wù)，同時(shí)保持前沿性能。

官方展示了幾個(gè)案例，可以來(lái)看一下：

借助 Antigravity，3.5 Flash 利用兩個(gè)智能體對(duì) AlphaZero 論文進(jìn)行合成，并在 6 個(gè)小時(shí)內(nèi)編寫(xiě)出了一款完全可玩的游戲：

3.5 Flash 利用子智能體在 Antigravity 中創(chuàng)建全新的城市景觀：

此外，值得注意的是，谷歌還強(qiáng)化了 Gemini 3.5 系列模型的網(wǎng)絡(luò)安全防護(hù)，官方稱，開(kāi)發(fā)遵循 Frontier Safety Framework，加強(qiáng)網(wǎng)絡(luò)安全和 CBRN 相關(guān)安全防護(hù)，這意味著「它生成有害內(nèi)容的可能性更低，同時(shí)也更不容易誤拒安全問(wèn)題。」

全家桶 AI 升級(jí)

基礎(chǔ)模型的大版本更新之上，是一系列新產(chǎn)品的發(fā)布與更新。

首先引人關(guān)注的是一款名為 Spark 的全新 AI 智能體。Spark 基于 Gemini 3.5，并與包括 Gmail、Docs 和 Slides 在內(nèi)的 Google Workspace 應(yīng)用深度集成。用戶可以教它執(zhí)行各種任務(wù)，例如在 Gmail 中創(chuàng)建重要截止日期列表并發(fā)送給自己，或者在冗長(zhǎng)的電子郵件往來(lái)中總結(jié)最新進(jìn)展。

你還可以設(shè)置它執(zhí)行重復(fù)性任務(wù)，例如每月自動(dòng)查找信用卡賬單中的隱藏費(fèi)用。

此外，你還可以設(shè)置規(guī)則讓它完成多個(gè)相互關(guān)聯(lián)的任務(wù)，從而構(gòu)建完整的工作流程。例如，你可以讓 Spark 查看聊天記錄和電子郵件中的會(huì)議記錄，并在 Google 文檔中生成精美的報(bào)告，同時(shí)還能自動(dòng)撰寫(xiě)一封可以隨報(bào)告一起發(fā)送的電子郵件。

這家科技巨頭還宣布對(duì)其最大的搖錢(qián)樹(shù)谷歌搜索進(jìn)行有史以來(lái)最大規(guī)模的改造。引入 Gemini 3.5 Flash 之后，它將最新的 AI 模式功能直接添加到搜索框中，同時(shí)允許新的智能體在后臺(tái)執(zhí)行搜索任務(wù)。

現(xiàn)在輸入搜索查詢時(shí)，搜索框會(huì)自動(dòng)擴(kuò)展，為用戶提供更多空間，方便他們使用自然語(yǔ)繼續(xù)提問(wèn)。新的 AI 搜索框還允許用戶在搜索查詢的同時(shí)上傳圖片、視頻、文件和 Chrome 標(biāo)簽頁(yè)以便 AI 參考。

更加進(jìn)階的是給搜索框派任務(wù)：用戶可以向搜索智能體提供查詢的所有相關(guān)信息，智能體隨后將全天候掃描新聞網(wǎng)站、博客和社交媒體等信息來(lái)源，以查找最相關(guān)、最新的信息。如果用戶正在尋找公寓，他們可以向搜索智能體輸入所有住房要求，AI 會(huì)全天候掃描符合這些條件的新公寓列表。

這是谷歌的搜索框 25 年來(lái)的首次更新。

另外還有多模態(tài)的新能力。去年，Nano Banana 一波爆火，今年谷歌正式推出 Gemini Omni，這是一個(gè)將 Gemini 的推理能力與創(chuàng)作能力完美融合的全新系列，首個(gè)版本為 Gemini Omni Flash。作為新一代模型，Omni 能夠基于任何形式的輸入內(nèi)容來(lái)生成萬(wàn)物 —— 首批支持的生成形式即為視頻。

借助 Omni，你可以將圖像、音頻、視頻及文本混合作為輸入，進(jìn)而生成基于 Gemini 現(xiàn)實(shí)世界知識(shí)的高質(zhì)量視頻。此外，你還可以通過(guò)對(duì)話交互的方式，輕松對(duì)視頻進(jìn)行編輯。

可以來(lái)看幾個(gè)官方展示的案例。

輸入提示詞：把這座雕塑做成泡泡材質(zhì)，之后就會(huì)得到下面這個(gè)內(nèi)容：

還可以把你自己拍攝的一段視頻交給 Omni，只要告訴它你想把畫(huà)面里發(fā)生的事情改成什么樣，就可以修改動(dòng)作、加入新角色或新物體，甚至還可以把原本一個(gè)瞬間變成意想不到的場(chǎng)景。

比如下面這個(gè)案例，輸入提示詞：公寓里的燈光開(kāi)始隨著音樂(lè)同步亮起：

官方表示，目前Gemini Omni Flash 正在向全球 Google AI Plus、Pro 和 Ultra 訂閱用戶開(kāi)放，可通過(guò) Gemini App 和 Google Flow 使用。同時(shí)，從本周開(kāi)始，還在 YouTube Shorts 和 YouTube Create App 上免費(fèi)向用戶推出。未來(lái)幾周則會(huì)通過(guò) API 向開(kāi)發(fā)者和企業(yè)客戶開(kāi)放。

或許，本次大會(huì)上最能讓人難忘的一句話來(lái)自哈薩比斯：「當(dāng)我們回顧這段時(shí)期時(shí)，我想我們會(huì)意識(shí)到，我們當(dāng)時(shí)正站在奇點(diǎn)的山腳下。」

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/#gemini-3-5-flash

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.