網易首頁 > 網易號 > 正文 申請入駐

Google發力了,硬剛 Claude Code

0
分享至

  Claude 靠Opus4.7搶占風頭,Google 也有大招,而且是三連發,咱逐個拆解

  
Google Gemini 三連發全景速覽

  從桌面端到開發者工具,再到語音合成,三條線同時發力

  Google 這波屬于憋了一股勁,要把 Gemini 生態從頭鋪到尾

  一、Gemini Mac 桌面版

  Google 首次把 Gemini 帶上了 Mac 桌面

  原生 Swift 開發,與 Antigravity 團隊合作,據說從 idea 到原型只用了幾天

  

  直接說體驗重點:

  ① 全局快捷鍵,隨叫隨到

  Option + Space任何界面一鍵呼出 Gemini 迷你對話框,就像 Mac 的 Spotlight 一樣

  還有Option + Shift + Space可以打開完整聊天界面,兩個快捷鍵都可以自定義

  這個體驗真的很順滑

  你在寫代碼突然卡殼了,Option + Space 問一句,答完繼續寫,全程不用切窗口、不用開瀏覽器

  

  ② 窗口共享,看到你在干什么

  這是我覺得最有意思的功能

  點擊「Add files and tools → Share window」,Gemini 就能看到你當前窗口的內容——文檔、代碼、數據表格都行

  它會根據你屏幕上的內容直接給出上下文相關的回答。

  舉個例子:你打開一個 Python 腳本,共享窗口后直接問「這段代碼有什么 bug?」,它能直接看到代碼給你分析,不用再復制粘貼了。

  
③ 創作能力集成

  圖片生成(Nano Banana)、視頻生成(Veo)都內置了

  桌面端直接就是一個創作工作站

  ④ 多設備同步

  同一個 Google 賬號,聊天記錄和記憶跨設備同步——手機上聊到一半,Mac 上接著聊

  系統要求:

  項目

  要求

  系統版本

  macOS Sequoia(15.0)或更高

  芯片

  僅 Apple Silicon(M 系列)

  內存

  8 GB 以上

  磁盤空間

  200 MB 以上

  網絡

  需要穩定連接

  費用

? 下載地址:gemini.google/mac

  說實話,這個桌面 App 的定位很清晰——不開瀏覽器就能用 AI

  對比 ChatGPT 桌面版,Gemini 的窗口共享是差異化亮點,它能直接"看到"你在干什么,上下文理解比純文字對話強多了

  不過目前只支持 Apple Silicon,Intel Mac 用戶暫時無緣

  而且本質上是聯網應用,離線場景下幫不了你

  二、Gemini CLI 支持 Subagents,重頭戲來了

  如果說 Mac App 是給普通用戶的禮物,那 Subagents 就是給開發者的大殺器

  之前用 Gemini CLI 處理復雜任務,最大的痛點是什么?上下文窗口越用越臃腫

  查個代碼架構,跑幾輪測試,上下文就爆炸了,后面的對話質量直線下降

  這個問題在 Claude Code 里也存在,它的解決方案是 Task 工具

  現在 Gemini CLI 的答案是Subagents——一句話概括:主 Agent 終于有了自己的專家團隊。

  
Subagents 架構一覽 什么是 Subagents?

  Subagents 就是跟主 Agent 并肩作戰的「專家」

  
Gemini CLI - Parallel Subagents

  每個 Subagent 都有:

  獨立的上下文窗口—— 不污染主對話

  專屬的系統指令—— 可以定制行為和人設

  獨立的工具集和 MCP 服務器—— 精確控制能做什么

  執行完匯總返回—— 內部可能跑了幾十輪工具調用,但返回給主 Agent 的只是一份精煉總結

  這就意味著,你的主上下文永遠干凈利落,不會因為中間過程膨脹變慢。

  三個內置 Subagent,開箱即用

  名稱

  定位

  什么時候用

  generalist

  通用型,繼承所有工具

  批量重構、跑大量命令、高輸出量任務

  codebase_investigator

  代碼庫探索專家

  架構分析、依賴追蹤、Bug 根因定位

  cli_help

  Gemini CLI 使用專家

  問配置、問命令、問功能怎么用

  還有一個實驗性的browser_agent,可以自動化瀏覽器操作——填表單、點按鈕、提取頁面信息。需要 Chrome 144+ 并在settings.json里手動啟用。=

  自定義 Subagent,一個 Markdown 文件搞定

  重點來了:一個.md文件 = 一個專家 Agent

  舉個例子,定義一個前端專家:

  ---
name: frontend-specialist
description: Frontend specialist in building high-performance,
accessible, and scalable web applications.
tools:
-read_file
-grep_search
-glob
-list_directory
-web_fetch
-google_web_search
model: inherit
---

You are a Senior Frontend Specialist and UI/UX Architect.
Your goal is to design and implement exceptional,
production-grade user interfaces.

### Core Principles:
-Architecture & Scalability
-Performance & Optimization
-Accessibility (A11y)

  文件放到.gemini/agents/目錄,Gemini CLI 自動識別。項目級的放.gemini/agents/(團隊共享),個人全局的放~/.gemini/agents/

  配置項也很靈活:

  字段

  name

  唯一標識,也是 @語法 調用時的名字

  description

  描述,主 Agent 靠這個決定何時派活

  tools

  可用工具列表,支持通配符(*全部、mcp_*所有 MCP 工具)

  model

  指定模型,默認inherit繼承主 Agent

  temperature

  溫度,0-2

  max_turns

  最大對話輪數,默認 30

  timeout_mins

  超時時間,默認 10 分鐘

  
并行執行,效率起飛

  Subagents支持并行運行。比如你要同時調研 5 個模塊的架構,可以一口氣派出 5 個 Subagent 同步執行,總耗時約等于最慢那一個。

  你甚至可以直接說:

? "Run the frontend-specialist on each package in parallel."

  不過要注意:并行執行代碼編輯任務可能會沖突,多個 Agent 同時改文件容易互相覆蓋。并行更適合只讀型任務——分析、調研、測試。

  @ 語法直接點名

  用@符號可以精準派活,跳過主 Agent 的自動判斷:

  @codebase_investigator 幫我梳理認證模塊的調用鏈路
@generalist 把項目里所有文件的 License 頭更新一遍
@security-auditor 審計 src/api/ 目錄的安全性
安全機制

  工具隔離:每個 Subagent 只能用你明確授權的工具,不會越權

  遞歸保護:Subagent不能調用其他 Subagent,防止無限套娃、Token 爆炸。

  還可以配合 Policy Engine(策略引擎)做更細粒度的權限控制,比如只允許某個 Subagent 執行git push

  用/agents命令可以隨時查看當前所有可用的 Subagent:

  
Gemini CLI /agents 命令

  我的判斷:Subagents 是 Gemini CLI 迄今最重要的一次更新。之前我給 Gemini CLI 打了 99 分,現在加上 Subagents,可以認真跟 Claude Code 的 Task 工具掰手腕了。核心解決的問題是:讓 AI 編程從「單打獨斗」進化到「團隊協作」

? Subagents 文檔:https://geminicli.com/docs/core/subagents/ GitHub:https://github.com/google-gemini/gemini-cli
三、Gemini 3.1 Flash TTS:用自然語言「導演」AI 說話

  最后一個更新在語音領域

  Gemini 3.1 Flash TTS 是 Google 最新的文字轉語音模型,核心賣點三個字:能控制

  音質:Elo 1211,性價比最優象限

  在 Artificial Analysis TTS 排行榜上(基于數千次人類盲測偏好),3.1 Flash TTS 拿到了Elo 1211 分。更關鍵的是,它被定位在「最具吸引力象限」——質量高、價格低

  在 TTS 領域,這個定位很有競爭力。ElevenLabs 質量確實好,但貴;開源方案便宜,但效果參差不齊

  
Artificial Analysis TTS 排行榜 Audio Tags:最大的創新

  這是這次 TTS 更新最讓我眼前一亮的功能。你可以在文本里嵌入Audio Tags(音頻標簽),用自然語言直接指導 AI 怎么說話:

  場景導演(Scene Direction)設定環境和對話指令。比如告訴它「這是一個深夜廣播節目,語氣低沉溫暖」,角色就會保持這個狀態。

  角色級控制(Speaker-level Specificity)為每個角色設置獨立的 Audio Profile——語速、語調、口音都可以分別調。甚至可以用 inline tags 在句子中間切換表達方式。

  一鍵導出(Seamless Export)在 Google AI Studio 里調好所有參數后,可以直接導出為 Gemini API 代碼。調試一次,到處復用。

  這個思路很聰明——與其讓用戶在后臺調一堆參數滑塊,不如讓用戶用自然語言直接「導演」。降低了創作門檻,又給專業用戶足夠的精細度。

  其他亮點

  70+ 語言支持,中文在列

  原生多角色對話,做播客、有聲書的朋友有福了

  SynthID 水印,所有生成音頻都帶不可感知水印,標識 AI 生成內容

? 模型卡片:deepmind.google/models/model-cards/gemini-3-1-flash-audio/
總結

  Google 這波三連發,覆蓋面很廣:

  更新

  面向誰

  一句話總結

  Gemini Mac App

  普通用戶

  Option + Space

  隨時呼出,窗口共享是亮點

  Gemini CLI Subagents

  開發者

  主 Agent + 專家團隊,上下文不再爆炸

  Gemini 3.1 Flash TTS

  內容創作者 / 開發者

  Audio Tags 用自然語言控 AI 語音,70+ 語言

  三個更新里,我個人最看好Gemini CLI Subagents。它解決了 AI 編程助手最核心的架構問題——單 Agent 上下文有限,復雜任務需要多 Agent 協作。Google 的實現方式(Markdown 定義 + 工具隔離 + 并行執行)簡潔優雅,上手成本很低。

  桌面 App 方便,TTS 有創新,但真正改變開發者日常工作流的,是 Subagents。

  制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
7國南海搞軍演,轉頭求中國救急?中方一句話:不會拉你一把

7國南海搞軍演,轉頭求中國救急?中方一句話:不會拉你一把

墨印齋
2026-04-23 12:35:16
日媒報道北京國際車展,比亞迪9分鐘充電震撼全場!日本網友炸鍋了...

日媒報道北京國際車展,比亞迪9分鐘充電震撼全場!日本網友炸鍋了...

今日日本
2026-04-26 10:03:45
為啥越來越多男生不主動幫女生搬行李?網友:最怕來一句不加微信

為啥越來越多男生不主動幫女生搬行李?網友:最怕來一句不加微信

夜深愛雜談
2026-04-26 07:36:03
觸目驚心!央視曝光上海一中醫館:從醫生到病人全是演員!

觸目驚心!央視曝光上海一中醫館:從醫生到病人全是演員!

番外行
2026-04-24 08:59:12
山東校長崔玉軍被查,巨額回扣損害教育公平,家長心聲引發關注!

山東校長崔玉軍被查,巨額回扣損害教育公平,家長心聲引發關注!

金哥說新能源車
2026-04-26 08:47:09
33歲章澤天風格大變!穿艷俗紗裙、副乳突出,比實際年齡成熟10歲

33歲章澤天風格大變!穿艷俗紗裙、副乳突出,比實際年齡成熟10歲

阿訊說天下
2026-04-18 14:53:39
東方甄選全員告別:這場逼宮為何徹底失控?

東方甄選全員告別:這場逼宮為何徹底失控?

時尚的弄潮
2026-04-26 06:43:56
電力央企違法違規典型問題被通報!

電力央企違法違規典型問題被通報!

能見
2026-04-26 12:07:39
倆女子大鬧上海地鐵,拳打薅頭滿臉血,攔都攔不住,結局令人舒適

倆女子大鬧上海地鐵,拳打薅頭滿臉血,攔都攔不住,結局令人舒適

奇思妙想草葉君
2026-04-26 02:02:15
58歲江珊差點認不出,膀大腰圓,身材壯碩,滿頭白發太真實

58歲江珊差點認不出,膀大腰圓,身材壯碩,滿頭白發太真實

林輕吟
2026-04-25 07:44:35
突發!臺高層已抵達非洲,大陸徹底看清:特朗普的最壞打算是什么

突發!臺高層已抵達非洲,大陸徹底看清:特朗普的最壞打算是什么

愛下廚的阿釃
2026-04-26 03:10:11
“都絕戶了,還拼命掙錢干嘛?”看見父親50歲就躺平,我崩潰了

“都絕戶了,還拼命掙錢干嘛?”看見父親50歲就躺平,我崩潰了

素十三兒
2026-04-13 07:12:36
052D過橫當水道后,遼寧艦抵臺海,日本向中國抗議,不滿東海行動

052D過橫當水道后,遼寧艦抵臺海,日本向中國抗議,不滿東海行動

老赳說歷史
2026-04-23 16:08:53
人的命,天注定,這10句話,人越活越信

人的命,天注定,這10句話,人越活越信

金沛的國學筆記
2026-04-24 14:22:27
民進黨高層竟敢偷偷離臺,大陸火速行動!美國來陰的,鄭麗文拼了

民進黨高層竟敢偷偷離臺,大陸火速行動!美國來陰的,鄭麗文拼了

致敬明天的太陽
2026-04-26 17:14:46
同是影視巨頭,為何萬達有人接盤,華誼卻無人相救?真相太扎心

同是影視巨頭,為何萬達有人接盤,華誼卻無人相救?真相太扎心

八斗小先生
2026-04-25 11:47:21
網紅莫氏雞煲涼透了!從通宵排隊到空無一人,終究逃不過曇花一現

網紅莫氏雞煲涼透了!從通宵排隊到空無一人,終究逃不過曇花一現

阿郎娛樂
2026-04-23 15:28:38
1949年傅作義上西柏坡會見毛主席,臨行前:我得拿些哈德門做禮物

1949年傅作義上西柏坡會見毛主席,臨行前:我得拿些哈德門做禮物

海佑講史
2026-04-26 19:20:05
時間有變!趙心童VS丁俊暉,央視更改直播頻道,誰能進世錦賽8強

時間有變!趙心童VS丁俊暉,央視更改直播頻道,誰能進世錦賽8強

體育大學僧
2026-04-26 08:50:39
一場4-1,讓中超負分清零第8隊誕生!火爆齊魯德比,海牛掀翻泰山

一場4-1,讓中超負分清零第8隊誕生!火爆齊魯德比,海牛掀翻泰山

小彭美識
2026-04-26 19:21:41
2026-04-26 20:03:00
Ai學習的老章 incentive-icons
Ai學習的老章
Ai學習的老章
3352文章數 11139關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

頭條要聞

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

體育要聞

森林狼3比1掘金:逆境中殺出了多孫穆?!

娛樂要聞

僅次《指環王》的美劇,有第二季

財經要聞

事關新就業群體,中辦、國辦發文

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

親子
手機
房產
游戲
時尚

親子要聞

#健康躍動生活#孩子碰頭別大意,出現這5種情況,立刻就醫

手機要聞

一加Ace 6至尊版規格全揭曉,堆料堆到友商沉默!

房產要聞

新一輪教育大爆發來了!海口,開始瘋狂建學校!

傳言稱索尼PS5數字版游戲需要每30天在線驗證一次

IU的臉,真的有自己的時間線

無障礙瀏覽 進入關懷版