文:董指導
本期要點
大眾對AI充滿期待,但有一個趨勢是許多人并沒有意識到的:未來的電腦/手機等終端,主要使用者將不再是人類,而是Agent智能體。
開發者對AI充滿期待,但有一個狀況是許多人之前沒有想到的:開發一款Agent,并不容易。因為當下的開發設施、運行環境都是為人類使用的App而設計的,并非面向Agent。
當必然的趨勢,和必然的障礙相碰撞,就得到了一個關鍵話題:所有的應用,都值得為Agent重做一遍;而針對Agent開發的基礎設施(Agent Infra),則是前置條件和增長藍海。
在2025 WAIC大會期間,我聆聽了一場阿里云無影的主題分享,而其宣布正式商用的產品AgentBay,正好呼應了上述的關鍵話題。也解答了我的疑惑:為什么Agent開發這么難?又該如何實現?
Agent的“交流電時刻”
新技術在誕生之初,往往會顯現不出其威力,被低估、甚至會顯得落后而被嘲諷。因為技術要發揮效果,必須有與之相配的基礎設施。
正如19世紀八十年代的交流電。
當時電力的使用還不算普及,主流采用的也是愛迪生推廣的直流電。但直流電的傳輸距離很短,超過1公里就會大幅損耗,要么就得密集建立發電站,這也就導致電力成本大幅提升,無法普及。
特斯拉發現的交流電,因電壓高、傳輸損耗小,正好解決了長距離輸送的難題。但是,交流電卻遲遲無法被主流采用:因為并沒有與之兼容的基礎設施。
直到1884年,西屋電氣公司負責人看中了交流電的潛力,開始打造其專屬的基礎設施:建立了全球首個高壓交流輸電網絡,展示了40公里的傳輸能力;并批量生產變壓器,讓高壓電可以降低電壓,更安全地接入家庭和工廠。
與此同時,隨著交流電的效力顯現,也越來越多的企業愿意在應用場景方面與之適配:交流電驅動的電動機、工業設備逐漸增加,基于交流電的家用電器也不斷涌現。
最終,交流電的長距離傳輸,不僅擊敗了直流電成為全球電力系統的標準,更是加速了電力的普及,讓電力從奢侈品轉變為第二次工業革命的核心驅動力。
如今,Agent也迎來了“交流電時刻”。
雖然Manus引起了不少爭議,但也無可辯駁地展示了Agent的魅力:多線程、自主、高效。而一個重要原因是,Agent和人類使用電腦的方式完全不同。
人類和電腦的交互依賴于視覺、觸覺和圖形界面,需要通過鼠標點選、鍵盤輸入、觸屏等方式來操作;但Agent可以則依賴程序接口或底層指令,可以直接通過代碼來調用各種功能,或通過腳本來執行任務。人類只能同時執行幾個任務,而Agent則可以并行多個任務。
總結而言,Agent的交互是機器對機器,代碼對代碼,無需理解人類設計的界面邏輯。這種變化,就像在《黑客帝國》中,Neo突然領悟到所在的世界,其實就是0、1代碼,瞬間就開啟了超能力。
Manus的爆火,也展示了人們對Agent的熱情。然而,截至目前,大眾也詫異:為什么好用的Agent還沒普及。而原因正是因為:
和Agent相配套的基礎設施并不完善。開發者沒有高效的工具、環境來開發,也缺少Agent運行的環境,包括接口、任務拆解等等。
所以,Agent就像當年的交流電一樣,雖然有著巨大的優勢,但仍需等待專屬的基礎設施發展起來。
Agent大規模應用,比“舉辦奧運會”還復雜
就像交流電的高壓,必須能降低才可以安全使用一樣,Agent也必須有一套專屬的基礎設施,來確保Agent真正成為生產力。畢竟,當前的Agent就像花果山的美猴王一樣,雖有本事、也能惹事。
Agent執行任務,不是一步到位,而是步步拆解。然而,現有技術并不能確保每一步都是100%完美執行,因而就存在著“錯誤積累”的難題。假設每一個自主操作準確率為99%,那么10個步驟之后,準確率就僅為90%。結果缺乏可信度,自然也就無法真正使用。
穩定性也是Agent要確保的能力。同樣一個任務,即使重復多次,都應該能準確記住用戶要求,執行結果也應該都符合用戶需求,而不能一次對、一次錯。或者即使在不同電腦上執行任務,也要能符合需求。
隨之而來的使用痛點就是安全性。Agent在自主執行任務時,也許會調用本地終端上的程序、修改刪減本地文件等,但整個執行過程就像個“黑匣子”,可能用戶壓根就不知道。這在金融、醫療等對數據安全、隱私保護要求極高的領域而言,完全不可接受。即使普通用戶,也會格外在意。
縱然Agent完美無瑕,安全又高效,但依然會面臨新的挑戰:完全通用的Agent幾乎是不可能實現的,未來一定是多個Agent協同作業。而且每個Agent的任務也不相同,有的要買票、有的要畫畫、有的要寫報告德、有的要點餐等等,不同任務需要不同的資源配置,可擴展性、彈性,就非常關鍵。
這就像帶兵打仗一樣,有多個兵種,分別使用刀槍輥棒斧鉞鉤叉,而且兵種還會不斷增加,每位士兵都要能立刻拿到武器、沖上戰場;而當任務完成或戰損后,又要盡快結算軍餉、避免吃空餉的情況,這就非常考驗后勤保障了。
但普通的電腦,資源有限,難以支撐高算力、高并發需求。
所以,正如美猴王的成長,既要學習72般變化、駕馭筋斗云等本領,也要有金箍棒當工具、以及緊箍來作約束;現階段要確保Agent能揚長避短、發揮威力:
既要做好工具協調與集成,也要能用產品服務來增強Agent的任務規劃、長期記憶、上下文持續性等能力,以及用技術約束來實現安全、穩定性等要求,以及提供充足、彈性的算力。
每一項產品、服務,又都包含多個技術、指標。比如記憶,要能跨會話存儲、多工具交流等;工具要滿足豐富度、數據一致性、無縫切換;上下文要求任務進度可恢復、多輪對話連貫、實時環境感知等等。
也難怪在WAIC的論壇分享上,阿里云無影的同事表示:Agent大規模應用所面臨的挑戰,其復雜度遠超“舉辦一場奧運會”。那么,如何會成為促進交流電發展的西屋,打造一套降低Agent開發復雜度的基礎設施?
Agent基礎設施,帶來“拎包入住”的便利
科技界對Agent如何發展的認知,是逐漸發展的。
最初,所有的目光都聚焦在Agent應用上,無數創業者在各個場景、領域,尋找Agent的應用機會。
過了一段時間后,大家發現,基于大模型的Agent雖然能力不錯,但是許多現有的應用,并不是針對Agent的,需要讓Agent可以更好地使用各類工具。于是,Anthropic發布了MCP協議(模型上下文協議),實現大模型與外部工具、數據源實現標準化通信;谷歌發布了Agent2Agent協議,實現不同Agent之間的通信、協作。
又過了一段時間后,大家發現,要讓Agent更好用,需要把更底層的能力進行完善。
比如記憶,要有長期記憶、語義記憶、場景記憶等等;多工具使用之間,數據要保持一致性;最好能跨平臺,比如手機、電腦等;安全性和一致性的要求,又決定了沙箱這種虛擬隔離環境,是必然之選;以及應對高算力、高并發狀況等等。
這些思考,最終促成了基礎設施的需求,而且刻畫了其概貌:為Agent智能體設計的云基礎設施(AgentInfra)---將Agent接到的任務直接轉入高性能的云端環境,用沙箱構建適合智能體工作的環境,在云端提供海量MCP工具,并提供彈性的云算力。
美國創業公司E2B,因其沙盒技術迅速獲得一批AI開發者客戶;而國內阿里云無影事業部,則低調發布了無影AgentBay,解決了當下的開發痛點:
目前Agent的工作無非就是系統層面用電腦、用手機,以及應用層面用瀏覽器、以及寫代碼;而無影AgentBay的云上沙箱,覆蓋了上述多個主流環境,讓Agent輕松“打工”。
而且安全沙箱環境,就是一道“防火墻”,數據加密傳輸和權限嚴格隔離功能,既讓開發者放心開發、發布Agent,也讓用戶放心使用。即使Agent犯了錯,也不會對本地環境造成侵入。
交互,一定是最在意的能力。AgentBay也提供視覺理解、自然語言控制、任務解析等多項AI技術;也支持多種交互方式,比如:
原子化工具API(拆分最小功能單元,讓開發者像使用樂高積木一樣自由搭配技術)、AI Agent API(支持智能體自主完成任務拆解、規劃)和ASP遠程串流協議(實現實時數據傳輸)等,從而精準匹配不同場景的需求。
最后,由于用戶未來會使用多個Agent來執行多個任務,因此,必然會有任務中斷、切換。傳統模式下,Agent的運行狀態會隨著中斷而丟失,重啟時又要從零加載,浪費資源、時間。另外,Agent在手機、電腦之間切換時,也會出現信息丟失的情況。
因此,無影AgentBay升級了跨平臺的數據漫游系統,支持狀態和內存級別的持久化,實現資源按需加載、實時切換,而不用“重啟”。
這些標準化的產品、服務,僅需三行代碼即可接入,讓開發者們“拎包入住”,徹底告別繁瑣的安裝和配置。
尾聲:吹響節奏、拉開大幕
雖然阿里云無影啟動Agent基礎設施研發的時間并不久,但多年積累的云電腦技術,順其自然地誕生了無影AgentBay。
顯然,Agent開發的門檻,不會一次性就全部拆光;這套基礎設施仍在發展、完善中。
但正如1890年代的尼亞加拉瀑布水電站,率先采用交流電把電力輸送到了水牛城,吹響了交流電普及的前奏。無影AgentBay的正式商用,也將拉開Agent普及的大幕。
---全文完,歡迎交流
理工/金融 復合背景
暢銷書《英偉達之道》譯者
百億私募/頭部自媒體 雙重經歷
看清科技、商業本質,講出精彩故事
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.