![]()
文:王智遠 | ID:Z201440
5月20號,杭州,阿里云峰會。
我到時,場館外頭已經排起了長隊。說實話,我本來以為就是例行發布會,結果進去一看,展區密度比我想的高不少。
AI原生應用全家桶、合作伙伴展臺、還有那個號稱能把人嚇一跳的超節點服務器實體,一路走下來,信息量是真大。
芯片、模型、平臺、官網,一上午發布的東西輪著來,但真正讓我停下來多看了兩眼的,是千問云的官網。
千問云官網,有什么好看的?
阿里云成立17年,頭一回在主站之外單獨給一個產品做官網。打開首頁,只有一行代碼。這首頁,是給Agent讀的。
一家給人類用戶做了17年服務的云公司,把新官網的首頁做成了一條機器指令。我琢磨了半天:這場大會發了一堆東西,好像都在講同一件事。
什么事?先把發的東西攤開看。
芯片層,平頭哥掏出了新AI芯片,真武M890。又配了自己做的互聯芯片ICN Switch,全裝進一臺叫磐久AL128的超節點服務器里。
128張卡拼成一臺計算機,已經上線百煉,跑著Qwen、DeepSeek、Kimi的模型服務。路線圖也亮出來了,V900、J900排著隊,一年一代,不會停。
模型層,千問發了旗艦模型Qwen3.7-Max,各榜單國產第一。
現場給了一個實戰案例:模型在一塊全新芯片上自己干了35個小時,從零寫出了生產級kernel。性能比官方版本高了10倍。全程沒人碰。
平臺層,百煉推理服務全面升級,上下文緩存、彈性調度、機密推理,六家頭部模型公司的產品全部接進來了。
最后,才是千問云官網。
品類多,信息量大。但我在現場越聽越覺得,這不只一堆產品發布,屬于一次大切換。
劉偉光在臺上說了一句話:人類員工與Agent已經形成了混合工作網絡;他甚至說,未來自己可能要接受一個Agent做他的manager。
李飛飛講云基礎設施,核心判斷是「從資源調度轉向任務調度」。傳統云賣的是算力資源,你買多少用多少。Agent時代的云,要干的事完全不同:理解任務、分派任務、干完了把資源收回來。調度的對象從機器變成了事情。
千問云更直接。所有模型服務封裝成Skills和CLI,Agent一條指令就能學會全站能力,自主調用。人類開發者連集成代碼都不用寫。
三個信號放在一起,指向就清楚了。云計算這個行業,三十年來第一次換用戶了。
回頭看,計算范式的每一次大切換,換的都是用戶;大型機服務的是大機構,PC讓個人第一次有了算力,互聯網把用戶搬到了線上,云計算讓開發者成了最核心的客戶群體。
現在,用戶變成了Agent,屏幕都不需要了;聽起來好像沒什么大不了的,對吧?這次真不一樣。以前換「哪些人在用云」,這次換的,是用云的還是不是人?
你可能說了:換個用戶,至于這么大動靜嗎?至于。
云計算從1990年代中期開始冒頭,到今天差不多三十年。這三十年里,不管底下技術怎么翻新,有三樣東西一直沒人動過,也不需要動。它們是整個行業的默認設置,所有產品都長在這上面。
第一樣:活是可以預估的。
一個電商網站,雙11的流量峰值提前兩個月就能算出來。一個SaaS應用,每天多少人用、每秒多少請求,翻翻歷史數據就知道。
云廠商那套彈性伸縮,人多開窗口、人少關窗口,全是圍著一個假設設計的:活有規律,有波峰有波谷,有周期。
Agent的活沒規律。
一個Agent接到任務,可能瞬間拉起一萬個臨時場子同時跑,三分鐘后全拆光。下一個任務什么時候來、要多少資源、干多久,沒人知道。連Agent自己都不知道,它是邊干邊決定下一步的。
這不叫波峰波谷,波峰波谷的前提是你能畫出一條曲線,然后沿著曲線調配資源。Agent的活根本畫不出曲線。
第二樣:用戶是人。
控制臺有菜單、按鈕、儀表盤。API文檔是寫給人看的,權限體系是按公司的組織架構設計的。什么管理員、開發者、運維,理得清清楚楚。
可Agent呢?
它要可編程的接口、結構化的能力描述、機器能讀懂的反饋。你給它一個漂漂亮亮的控制臺頁面,對它來說就是一面墻。
更難搞的是權限,管人那套權限邏輯,前提是一個人一次只干一件事,權限跟著角色走。
Agent可以一次干一百件事,每件事要的權限都不一樣,干完就釋放。按角色分權限那套老辦法,管不住這種動態的、逐任務的權限需求。
李飛飛在臺上把這個事講得很直接:
要給Agent發身份證。不是給人設計的那種賬號密碼。這事企業真要落地,第一道坎不是Agent夠不夠聰明,是你敢不敢給它開門禁。
第三樣:程序是長期跑的。
傳統云上跑的東西,不管是網頁服務、數據庫還是微服務容器,部署上去就一直跑著。
偶爾更新、重啟,生命周期按月甚至按年算。云的資源分配、監控告警、計費模式,全是給長期跑的程序設計的。
Agent的任務是短命的,啟動,干活,完事,銷毀。下一個任務來了,重新啟動一個全新的,生命周期可能就幾秒鐘。
你要按傳統云的方式給它分配資源、掛載存儲、配網絡,光準備環境的時間就比干活的時間還長。
李飛飛講了一個數字:
他們的臨時場子可以做到眨個眼的功夫就準備好,一分鐘能拉起兩萬個。為什么要做到這種程度?因為Agent的活不等人。Agent等不了。
打個比方:
你開了一家酒店,住的一直是人。房間有門有窗有床有燈,前臺會說話,電梯按樓層。這套東西用了三十年,運轉得很好。
現在來了一批新客人:機器人。它們不睡覺,不需要床,不走電梯,直接從窗戶飛進來;同時入住一萬間房,住三分鐘就退房。你需要一棟完全不同的建筑。
三個假設同時失效,意味著每一層的設計前提都不成立了。彈性伸縮的前提沒了,權限體系的前提沒了,資源分配的前提沒了。
李飛飛在演講里總結了六個核心挑戰:
活干幾秒就結束、數據又多又雜要地方存、流量說來就來毫無規律、環境每次都不一樣、安全管控要到任務級別、資源調度要搞大規模動態分配。
六個挑戰,沒有一個是傳統云計算的老問題。全是新的。
所以,阿里云這次的動作是「重做」;從芯片到操作系統到安全體系到調度邏輯,每一層都要按新的假設重來一遍,這就是我說的:大切換。
切換,說著容易,關鍵是地基怎么打?
最直覺的思路是按產品線排:芯片做了什么,云做了什么,模型做了什么。但聽完整場之后我覺得,換個角度可能更清楚。
按Agent的需求看。一個Agent要能上崗干活,到底需要什么?
先說力氣。力氣就是算力。Agent跟過去的chatbot不一樣。一個chatbot調一次模型就完事了。
一個Agent執行一個任務,可能要連續調幾十次模型,中間還要去查數據庫、跑代碼、操作瀏覽器。成千上萬個Agent同時在線上干活,每個都在密集調用,算力壓力是指數級翻上去的。
這就是真武M890要解決的事。
144GB顯存,片間互聯帶寬800GB/s,性能是上一代的3倍。搭配自己做的互聯芯片ICN Switch,128張卡在一個機柜里組成一臺計算機,卡跟卡之間通信,時延低于150納秒。
150納秒是什么概念?人類眨一次眼大約要300毫秒。150納秒是眨眼時間的兩百萬分之一。Agent的世界里,通信速度就要快到這種程度。
光有芯片還不行,芯片的能力得被釋放出來。
平頭哥有一套全自研的軟件棧叫SAIL,從底層驅動到編程接口到通信庫全部自己寫的,6月份在官網上線,同步在GitHub開源。
大會上還公布了一個事實:真武芯片已經累計出貨56萬片,400多家客戶,20多個行業。這不是實驗室里的東西,是跑真實業務的。
有了力氣,還得有地方干活,這個「地方」就是運行環境。Agent執行任務需要一個獨立的空間,可以理解成工位。傳統云上的工位是虛擬機或者容器,啟動要幾秒甚至幾十秒,Agent用不了,太慢。
阿里云給Agent做的工位叫沙箱,百毫秒級啟動,一分鐘可以拉起兩萬個;干完活,沙箱自動銷毀,資源釋放。下次再來,重新分配一個全新的。
這里有個細節值得說:
Agent跟Agent之間、任務跟任務之間,隔離要求非常高。特別是企業級場景,一個Agent在處理A公司數據,另一個在處理B公司的,兩邊絕對不能串。
阿里云用的是硬件級別的隔離,從物理上徹底隔開。
更底層的地方也在動,龍蜥操作系統在內核級別做了Agent Task OS;操作系統本來是給人寫的程序服務的,現在要給Agent的活服務,內核層面的資源調度邏輯都得改。
有力氣、有工位了,還得有身份。
阿里云推了Agent ID服務,給每個Agent獨立的身份認證、權限邊界、行為審計;等于給Agent辦入職手續:工牌、門禁卡、權限表,一樣不能少。
配套的還有Agent Ops,管Agent整個生命周期,從開發到上線、從考核到進化,全鏈路可追蹤;跟管人其實是一個邏輯。你招了一個員工進來,不能發完工牌就不管了。
有了身份,還得有記憶。
一個Agent如果每次執行任務都從零開始,什么都不記得,效率會很低。李飛飛講記憶的時候用了一個詞:承上啟下。他說人做復雜任務,靠的就是記憶力,長的短的都要有。
阿里云把Agent的記憶分了三層:
短期記憶,一次對話里的上下文,類似你跟同事開會時的工作記憶。長期記憶,跨越多次對話,Agent上周干過什么、學到了什么,下次還能記得。
知識記憶,是外掛的企業知識庫,公司多少年的文檔、流程、規則,向量化之后Agent可以隨時翻。
三層記憶各有各的存法,短期放高速緩存,長期用數據庫存,知識庫走向量檢索。阿里云把自家數據庫、大數據、存儲產品線全拉進來了,各管各的。
有力氣、工位、身份、記憶,還差一樣:安全。
你去銀行租了一個保險柜,往里放什么,銀行不知道,也看不到。銀行只管一件事:保證你的柜子只有你能打開。
阿里云的機密推理技術C-MASK,干的就是這件事。
你的數據進到模型里做推理,全程加密,連阿里云自己都看不見;數據能用,內容你看不到。等于說,你用阿里云的算力、環境、模型,但你最核心的數據,只有自己能碰。
百煉的技術負責人于文淵說了一句話,我覺得說到了點上:「安全不是Agent的可選項,是出廠標配。」
最后,Agent要能變聰明,這就是模型的事;Qwen3.7-Max這次展示了一種新的模型能力:自主完成復雜工程任務。
周靖人在臺上說:
大模型正在從對齊人類偏好,轉向對齊任務目標;過去追求模型說得好,現在要求模型做得到。這個轉變對Agent來說是決定性的。
Agent需要一個能獨立干活的大腦。35個小時無人干預寫出生產級kernel,證明的就是這件事。
算力、運行環境、身份、記憶、安全、智能。六個模塊,每一個都是從頭做的,沒有一個是在老系統上打補丁。
而且這套東西已經在跑了,MiniMax的MaxCloud產品,就跑在阿里云這套Agent基礎設施上,從沙箱隔離到彈性調度到安全防護,全鏈路都用的上面說的這些能力。
全部重做,值不值最后還得看一件事:有沒有人買單。
我查了一下阿里上周的財報。AI模型及應用服務的ARR已經超過80億。管理層給的指引是年底突破300億。消息出來那天,阿里股價漲了8%。
80億到300億,一年翻將近四倍。資本市場不傻,用腳投的票比嘴上說的話誠實。
這里面有一個更值得看的信號:Token驅動的MaaS收入,正在取代ECS成為阿里云最大的產品線。這句話值得停下來想一想。
ECS是什么?云服務器,阿里云起家的東西,賣了十幾年的核心產品。按臺收費,你買多少機器用多少。現在這個位置要讓給Token了。計費單位從「臺」變成了「Token」,整個增長邏輯都變了。
賣機器靠什么增長?靠客戶買更多機器。客戶的IT預算有天花板,一年就這么多錢,買完了就沒了。
賣Token靠什么增長?靠Agent干更多的活。Agent越多、越自主、跑的時間越長,Token消耗就越大;一個Agent執行一次復雜任務可能消耗幾萬個Token,一天執行一百次,一年365天不休息。
這是一個自己轉起來就停不下來的飛輪。
Agent越好用,企業越愿意部署更多Agent。Agent越多,Token消耗越大。Token收入越高,平臺越有錢投入芯片和模型的迭代。
芯片和模型越好,Agent越好用。這個飛輪,才是阿里云全棧重做的真正驅動力。
生態也在跟著聚攏,大會現場,智譜、MiniMax、月之暗面等六家頭部模型公司的代表一起上臺,產品全部接入百煉。
劉偉光在臺上翻出了2023年蔡崇信說的一句話:
阿里云要做AI時代最開放的云;三年過去,百煉變成了一個多模型、多模態的統一入口。
什么叫統一入口?開發者接一套API,就能調所有模型。不用給每家模型公司單獨做適配,不用操心底層的算力調度和成本優化,百煉全包了。
對模型公司來說,上架百煉等于多了一個分發渠道,算力、調度、計費都不用自己操心;對企業來說,在一個地方就能挑到各家最好的模型,還能做對比、做精調、做評估。兩頭都有好處,生態才聚得起來。
還有一個事實容易被忽略:
阿里云是從芯片到HPC、到模型矩陣、到模型平臺、到應用,完整打通五層全棧的云廠商。
全棧的意思是,從最底下的芯片到最上面的應用,中間每一層都是自己的。芯片是平頭哥的,云是阿里云的,模型是千問的,平臺是百煉的。
哪一層出了問題,自己就能改,不用等別人。哪一層有優化空間,自己就能動,不用跟別人協調。
Agent時代,這種全棧能力的價值會被放大。
因為Agent的工作負載穿透所有層,一個Agent執行任務,同時在消耗芯片算力、占用沙箱、調用模型推理、走平臺調度。
任何一層出瓶頸,整個鏈路就卡住。每一層都能動,才有可能做到端到端的優化。
錢在跟著走,生態在聚攏,全棧能力在發揮作用;三件事加在一起,說明一件事:全部重做,才有很多想想空間。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.