![]()
如果你經(jīng)常用手機的 AI 助手的話,一定碰到過這個問題:
原本點外賣、寫評論、自動修圖干得好好的 AI 助手,一碰到最簡單的「用微信給 XX 發(fā)個消息」,就集體束手無策了。
![]()
這個在 AI 自主能力越來越強時代的「異象」,總算迎來了改觀。根據(jù)騰訊客服表示:
微信正在與華為、小米、榮耀、OPPO 等手機廠商合作推出 A2A 助手能力……可以通過對應(yīng)手機系統(tǒng) AI 助手發(fā)起微信音視頻通話或向指定好友發(fā)送消息。
而在榮耀 500 Pro 上,我們借助最新版本的 YOYO 智能體,體驗了一把微信的 A2A(Agent to Agent)代理功能。
不得不說,動動嘴就能發(fā)消息的感覺確實很絲滑:
![]()
根據(jù)測試,在目前 YOYO 版本 90.10.30.067、微信版本 8.0.72 中,微信 A2A 支持這些功能:
- 發(fā)送文字消息
- 撥打語音/視頻電話
- 打開掃一掃、收付款碼
與此同時,發(fā)送圖片或表情、發(fā)紅包與轉(zhuǎn)賬、打開公眾號頁面等等操作則暫時無法實現(xiàn):
![]()
話說回來,用語音助手操作微信這件事情并不稀奇——九年前的三星 Bixby 就能做到(后來被砍了),如今的 Siri 也一直都支持:
![]()
但能夠在安卓和鴻蒙上——尤其是經(jīng)歷過年初豆包手機的「圍追堵截」之后——實現(xiàn)對大廠 app 的代理操作,的確是個意義非凡的里程碑。
雖然「智能體」(agent)的概念前幾年就已出現(xiàn),但整體還是靠 OpenClaw 的爆火,才逐漸成為了 AI 對接硬件的主流代理方案。
而相比豆包手機或者早期的小藝幫幫忙,我們需要明確一點:
A2A 的實現(xiàn)形式與 OCR 讀屏 + 模擬點擊完全不同,僅僅在結(jié)果上(幫用戶操作手機)殊途同歸。
![]()
小藝操作非鴻蒙 app 時就需要 OCR + 模擬點擊
回想更早幾年,行業(yè)普遍想象的「每個 app 都為手機廠商的 AI 助手開放 API 接口」,A2A 也走出了一條完全不同的路。
為什么 A2A 能夠成為手機廠商 + app 大廠選中的那條路呢?原因很簡單:
A2A 的操作模式,是現(xiàn)階段能夠最大化兼顧數(shù)據(jù)安全性、保證用戶留存、均攤 token 開銷的模式,能夠比較好的兼顧各方的利益。
雖然微信開放測試的智能體能力非常有限,連發(fā)照片這種基礎(chǔ)的操作都還沒有上線,但是我們不難猜測后續(xù)適配好的樣子——
![]()
僅就微信內(nèi)部來說,除了最簡單的「手機智能體 - 微信智能體」模式之外,小程序生態(tài)也有很大概率會逐步覆蓋到這個生態(tài)中。
畢竟很多第三方程序(比如美團、攜程、京東之類的)原本就有各自的智能體服務(wù),將智能體功能移植到微信小程序里并不復(fù)雜。
![]()
美團智能體「小團」
微信可以向外適配系統(tǒng)智能體,也沒有理由會放棄向內(nèi)適配小程序智能體生態(tài)。
而在微信之外,A2A 作為一種通用的實現(xiàn)方案,自然也可以和其他 app 的智能體對接——
今天可以喊 YOYO 用微信發(fā)消息,明天就能喊小布用攜程總結(jié)去年的旅行報告。
到那個時候,距離所謂「OpenAI」智能體手機也就不遠了:
一個「神圣的 A2A 連接著每一個 app」、所有操作都可以由智能體轉(zhuǎn)達和代勞的世界。
![]()
圖|Blizzard Entertainment
有意讓 A2A 生態(tài)連接每一個人的不止微信和國產(chǎn)手機廠商,谷歌、蘋果、微軟之類的國際大廠同樣在研究這條路。
比如前兩周的 Google I/O 上演示的 Gemini Spark。
它在 Android 移動端的執(zhí)行模式同時支持 OCR 模擬點擊、合作軟件 API 接入和 A2A 三種方案,可謂「我全都要」的典型。
![]()
圖|Google
蘋果這邊同樣很積極。
雖然 iOS 26 既沒有合用的系統(tǒng) AI,也沒有什么智能體能力,但今年 WWDC 上蘋果對于 AI Siri 的重構(gòu)中,肯定會包含一些針對智能體的支持。
根據(jù)行業(yè)消息,我們也將有望在今年年末看到字節(jié)跳動與中興再次合作的「豆包手機完全體」。
新的豆包手機據(jù)信會放棄純 OCR 模擬點擊方案,而是選擇和 Gemini 類似的 OCR + API + A2A 的結(jié)合模式,以規(guī)避此前的安全風險和利益沖突。
![]()
初代豆包手機
毫無疑問,A2A 之所以成為大廠的共同選擇、而沒有被「圍剿」,正因為它是最能兼顧各方利益的方案。
同時也是目前能夠看到的,智能體 AI 讓生活變得便利的最直觀表現(xiàn)之一。
然而 A2A 的模式聽起來很美好,但其中的一些商業(yè)模式還需要再考量——比如最重要的算力成本。
畢竟手機端無論是 YOYO 還是小藝,微信里是元寶還是張小龍.skill,這些智能體本身的運行始終都是服務(wù)提供商的一項開銷:
![]()
圖|PE Collective
而未來如何在用戶、手機廠商、軟件開發(fā)商、服務(wù)提供商之間分攤這些 A2A 操作產(chǎn)生的「token 費」,將會是對于所有服務(wù)提供方的考驗。
更壞的情況是,「手機 OS - 微信 OS - 小程序生態(tài)」的嵌套本身已經(jīng)足夠繁瑣了。
如果全部使用智能體代理操作,A2A2A2A 過程中導(dǎo)致的算力浪費也是一個必須要面對的問題。
除此之外,一個過于 A2A 的技術(shù)模式也會引起另一個方面的擔憂:智能體對于人類使用習慣的影響。
![]()
在愛范兒之前的文章中,我們提到了在設(shè)想 OpenAI 手機時,一種純粹由智能體代理人類操作的后果:
為了讓 Agent 更好地工作,你會下意識地讓自己的需求變得更明確、更單一、更具邏輯性,相當于人類主動將自己異化(alienation)成了機器。這就是我們在現(xiàn)代技術(shù)中,最需要警惕的一點:人的機器化。
當然,以上種種情況在短期內(nèi)并不會發(fā)生——
畢竟微信更新 A2A 功能的速度肯定沒有那么快,要完整覆蓋基礎(chǔ)日常功能至少也得大半年,更不用說小程序 A2A 了。
但總目前我們能夠體驗到的 A2A 能力來說,這的確是讓我們在享受到未來科技的同時,還不用擔心被超級 app 生態(tài)圍追堵截的最好方式了。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.