網易首頁 > 網易號 > 正文申請入駐

讓Agent跨越“交流電時刻”

2025-07-31 23:06:07　來源: 董指導聊科技

上海舉報

分享至

文：董指導

本期要點

大眾對AI充滿期待，但有一個趨勢是許多人并沒有意識到的：未來的電腦/手機等終端，主要使用者將不再是人類，而是Agent智能體。

開發者對AI充滿期待，但有一個狀況是許多人之前沒有想到的：開發一款Agent，并不容易。因為當下的開發設施、運行環境都是為人類使用的App而設計的，并非面向Agent。

當必然的趨勢，和必然的障礙相碰撞，就得到了一個關鍵話題：所有的應用，都值得為Agent重做一遍；而針對Agent開發的基礎設施（Agent Infra），則是前置條件和增長藍海。

在2025 WAIC大會期間，我聆聽了一場阿里云無影的主題分享，而其宣布正式商用的產品AgentBay，正好呼應了上述的關鍵話題。也解答了我的疑惑：為什么Agent開發這么難？又該如何實現？

Agent的“交流電時刻”

新技術在誕生之初，往往會顯現不出其威力，被低估、甚至會顯得落后而被嘲諷。因為技術要發揮效果，必須有與之相配的基礎設施。

正如19世紀八十年代的交流電。

當時電力的使用還不算普及，主流采用的也是愛迪生推廣的直流電。但直流電的傳輸距離很短，超過1公里就會大幅損耗，要么就得密集建立發電站，這也就導致電力成本大幅提升，無法普及。

特斯拉發現的交流電，因電壓高、傳輸損耗小，正好解決了長距離輸送的難題。但是，交流電卻遲遲無法被主流采用：因為并沒有與之兼容的基礎設施。

直到1884年，西屋電氣公司負責人看中了交流電的潛力，開始打造其專屬的基礎設施：建立了全球首個高壓交流輸電網絡，展示了40公里的傳輸能力；并批量生產變壓器，讓高壓電可以降低電壓，更安全地接入家庭和工廠。

與此同時，隨著交流電的效力顯現，也越來越多的企業愿意在應用場景方面與之適配：交流電驅動的電動機、工業設備逐漸增加，基于交流電的家用電器也不斷涌現。

最終，交流電的長距離傳輸，不僅擊敗了直流電成為全球電力系統的標準，更是加速了電力的普及，讓電力從奢侈品轉變為第二次工業革命的核心驅動力。

如今，Agent也迎來了“交流電時刻”。

雖然Manus引起了不少爭議，但也無可辯駁地展示了Agent的魅力：多線程、自主、高效。而一個重要原因是，Agent和人類使用電腦的方式完全不同。

人類和電腦的交互依賴于視覺、觸覺和圖形界面，需要通過鼠標點選、鍵盤輸入、觸屏等方式來操作；但Agent可以則依賴程序接口或底層指令，可以直接通過代碼來調用各種功能，或通過腳本來執行任務。人類只能同時執行幾個任務，而Agent則可以并行多個任務。

總結而言，Agent的交互是機器對機器，代碼對代碼，無需理解人類設計的界面邏輯。這種變化，就像在《黑客帝國》中，Neo突然領悟到所在的世界，其實就是0、1代碼，瞬間就開啟了超能力。

Manus的爆火，也展示了人們對Agent的熱情。然而，截至目前，大眾也詫異：為什么好用的Agent還沒普及。而原因正是因為：

和Agent相配套的基礎設施并不完善。開發者沒有高效的工具、環境來開發，也缺少Agent運行的環境，包括接口、任務拆解等等。

所以，Agent就像當年的交流電一樣，雖然有著巨大的優勢，但仍需等待專屬的基礎設施發展起來。

Agent大規模應用，比“舉辦奧運會”還復雜

就像交流電的高壓，必須能降低才可以安全使用一樣，Agent也必須有一套專屬的基礎設施，來確保Agent真正成為生產力。畢竟，當前的Agent就像花果山的美猴王一樣，雖有本事、也能惹事。

Agent執行任務，不是一步到位，而是步步拆解。然而，現有技術并不能確保每一步都是100%完美執行，因而就存在著“錯誤積累”的難題。假設每一個自主操作準確率為99%，那么10個步驟之后，準確率就僅為90%。結果缺乏可信度，自然也就無法真正使用。

穩定性也是Agent要確保的能力。同樣一個任務，即使重復多次，都應該能準確記住用戶要求，執行結果也應該都符合用戶需求，而不能一次對、一次錯。或者即使在不同電腦上執行任務，也要能符合需求。

隨之而來的使用痛點就是安全性。Agent在自主執行任務時，也許會調用本地終端上的程序、修改刪減本地文件等，但整個執行過程就像個“黑匣子”，可能用戶壓根就不知道。這在金融、醫療等對數據安全、隱私保護要求極高的領域而言，完全不可接受。即使普通用戶，也會格外在意。

縱然Agent完美無瑕，安全又高效，但依然會面臨新的挑戰：完全通用的Agent幾乎是不可能實現的，未來一定是多個Agent協同作業。而且每個Agent的任務也不相同，有的要買票、有的要畫畫、有的要寫報告德、有的要點餐等等，不同任務需要不同的資源配置，可擴展性、彈性，就非常關鍵。

這就像帶兵打仗一樣，有多個兵種，分別使用刀槍輥棒斧鉞鉤叉，而且兵種還會不斷增加，每位士兵都要能立刻拿到武器、沖上戰場；而當任務完成或戰損后，又要盡快結算軍餉、避免吃空餉的情況，這就非常考驗后勤保障了。

但普通的電腦，資源有限，難以支撐高算力、高并發需求。

所以，正如美猴王的成長，既要學習72般變化、駕馭筋斗云等本領，也要有金箍棒當工具、以及緊箍來作約束；現階段要確保Agent能揚長避短、發揮威力：

既要做好工具協調與集成，也要能用產品服務來增強Agent的任務規劃、長期記憶、上下文持續性等能力，以及用技術約束來實現安全、穩定性等要求，以及提供充足、彈性的算力。

每一項產品、服務，又都包含多個技術、指標。比如記憶，要能跨會話存儲、多工具交流等；工具要滿足豐富度、數據一致性、無縫切換；上下文要求任務進度可恢復、多輪對話連貫、實時環境感知等等。

也難怪在WAIC的論壇分享上，阿里云無影的同事表示：Agent大規模應用所面臨的挑戰，其復雜度遠超“舉辦一場奧運會”。那么，如何會成為促進交流電發展的西屋，打造一套降低Agent開發復雜度的基礎設施？

Agent基礎設施，帶來“拎包入住”的便利

科技界對Agent如何發展的認知，是逐漸發展的。

最初，所有的目光都聚焦在Agent應用上，無數創業者在各個場景、領域，尋找Agent的應用機會。

過了一段時間后，大家發現，基于大模型的Agent雖然能力不錯，但是許多現有的應用，并不是針對Agent的，需要讓Agent可以更好地使用各類工具。于是，Anthropic發布了MCP協議（模型上下文協議），實現大模型與外部工具、數據源實現標準化通信；谷歌發布了Agent2Agent協議，實現不同Agent之間的通信、協作。

又過了一段時間后，大家發現，要讓Agent更好用，需要把更底層的能力進行完善。

比如記憶，要有長期記憶、語義記憶、場景記憶等等；多工具使用之間，數據要保持一致性；最好能跨平臺，比如手機、電腦等；安全性和一致性的要求，又決定了沙箱這種虛擬隔離環境，是必然之選；以及應對高算力、高并發狀況等等。

這些思考，最終促成了基礎設施的需求，而且刻畫了其概貌：為Agent智能體設計的云基礎設施（AgentInfra）---將Agent接到的任務直接轉入高性能的云端環境，用沙箱構建適合智能體工作的環境，在云端提供海量MCP工具，并提供彈性的云算力。

美國創業公司E2B，因其沙盒技術迅速獲得一批AI開發者客戶；而國內阿里云無影事業部，則低調發布了無影AgentBay，解決了當下的開發痛點：

目前Agent的工作無非就是系統層面用電腦、用手機，以及應用層面用瀏覽器、以及寫代碼；而無影AgentBay的云上沙箱，覆蓋了上述多個主流環境，讓Agent輕松“打工”。

而且安全沙箱環境，就是一道“防火墻”，數據加密傳輸和權限嚴格隔離功能，既讓開發者放心開發、發布Agent，也讓用戶放心使用。即使Agent犯了錯，也不會對本地環境造成侵入。

交互，一定是最在意的能力。AgentBay也提供視覺理解、自然語言控制、任務解析等多項AI技術；也支持多種交互方式，比如：

原子化工具API（拆分最小功能單元，讓開發者像使用樂高積木一樣自由搭配技術）、AI Agent API（支持智能體自主完成任務拆解、規劃）和ASP遠程串流協議（實現實時數據傳輸）等，從而精準匹配不同場景的需求。

最后，由于用戶未來會使用多個Agent來執行多個任務，因此，必然會有任務中斷、切換。傳統模式下，Agent的運行狀態會隨著中斷而丟失，重啟時又要從零加載，浪費資源、時間。另外，Agent在手機、電腦之間切換時，也會出現信息丟失的情況。

因此，無影AgentBay升級了跨平臺的數據漫游系統，支持狀態和內存級別的持久化，實現資源按需加載、實時切換，而不用“重啟”。

這些標準化的產品、服務，僅需三行代碼即可接入，讓開發者們“拎包入住”，徹底告別繁瑣的安裝和配置。

尾聲：吹響節奏、拉開大幕

雖然阿里云無影啟動Agent基礎設施研發的時間并不久，但多年積累的云電腦技術，順其自然地誕生了無影AgentBay。

顯然，Agent開發的門檻，不會一次性就全部拆光；這套基礎設施仍在發展、完善中。

但正如1890年代的尼亞加拉瀑布水電站，率先采用交流電把電力輸送到了水牛城，吹響了交流電普及的前奏。無影AgentBay的正式商用，也將拉開Agent普及的大幕。

---全文完，歡迎交流

理工/金融復合背景

暢銷書《英偉達之道》譯者

百億私募/頭部自媒體雙重經歷

看清科技、商業本質，講出精彩故事

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.