![]()
“阿里,在做一種很“新”的云。
如果你在5月20日之后打開阿里云新上線的“千問云”(qianwenai.com),大概率會愣住。
沒有導航欄,沒有產品列表,沒有“立即購買”的按鈕,沒有任何一個你在過去17年里習慣看到的云廠商官網該有的東西。
只有一行字:
“安裝Skills:npx skills add QianWen-AI/qianwen-ai”
這不是設計師偷懶,也不是產品經理短路。
這是阿里云做了一個“違背祖宗”的決定——云的終極用戶,不再是“人”了。
5月20日,阿里云在2026峰會上發布了一套名為“芯-云-模型-推理”的全棧技術體系。聽起來很技術,但翻譯成人話就是:阿里云把自己拆了,然后按照AI Agent(智能體)的體型,重新長了一遍。
如果說過去17年是“人類操作云”的時代,那么從這一天起,阿里云正式宣告:Agentic Cloud時代,開幕。
被“逼瘋”的AI
和遲來的覺醒
先問你一個問題:
現在的AI Agent,活得憋屈嗎?
答案是——非常憋屈。
想象一下這個場景:你有一個智商180的博士生(大模型),你想讓他幫你干點活,比如“在云上部署一個網站,然后監控它的運行狀態”。
結果你發現,這個博士生沒有手、沒有眼睛、不能點鼠標、看不懂驗證碼、沒法登錄控制臺。他想干活,唯一的辦法是——你給他寫一堆代碼,告訴他怎么調用API、怎么傳參數、怎么處理返回結果。
你說:“幫我看看服務器是不是掛了。”
他反手扔給你一份300頁的API文檔:“你先幫我把這段鑒權邏輯寫清楚。”
這就是今天95%的企業正在經歷的現實。阿里云旗下MuleRun團隊觀察了上千家企業后發現:絕大多數企業仍停留在“Copilot階段”——人類承擔80%的工作,AI只打打下手。
不是AI不想干,是基礎設施根本不允許。
過去17年,云計算的交互邏輯是“人->控制臺/API”。這套邏輯對人類很友好——我點點鼠標、寫寫腳本,就能把事辦了。
但Agent不是人。
Agent不看你花里胡哨的儀表盤,不點按鈕,不認識驗證碼。它需要的是結構化的能力描述、明確的調用協議、可預期的反饋機制。
人和Agent之間,存在巨大的“摩擦成本”。
不重構云,Agent永遠只是個“聊天玩具”。
阿里云這次做的事,說穿了就一句話:把云從“給人用”改成了“給Agent用”。
從“芯”到“云”
給Agent鋪一條高速公路
重構不是嘴上說說。阿里云這次動的是全身——芯片、服務器、操作系統、交互協議、運維體系,全拆了重來。
第一刀:算力底座——給Agent修“高速路”
Agent和人的工作方式完全不同。
人上網是“點一下、等一會兒、再點一下”,節奏是離散的。但Agent不是——一個Agent在執行任務時,可能在毫秒級內連續發起數十次模型調用。它不是在“瀏覽”,而是在“狂奔”。
這對底層算力的要求是質的改變。傳統的GPU集群,是為“人”設計的——任務相對穩定,并發可控。但Agent的工作負載是“無規律彈性、短生命周期、瞬時起量即走”。
阿里云亮出的底牌是:平頭哥自研AI芯片“真武M890”+磐久AL128超節點服務器。
![]()
數據是枯燥的,但你可以這么理解:
·M890的性能是上一代的3倍,顯存144GB;
·128顆芯片通過自研互聯芯片ICN Switch連成“一臺計算機”,芯片之間的“對話”延遲低至150納秒(納秒是什么概念?光一秒鐘跑30萬公里,150納秒光只能跑45米);
·單柜帶寬達到Pb/s級。
翻譯成人話:這是一條為Agent專門修建的“多車道無紅燈高速公路”。
以前,成千上萬個Agent同時在云上“狂奔”,會堵車、會撞車、會卡死。現在,真武M890+磐久AL128的組合,讓每個Agent都有自己的快車道。
更值得關注的是平頭哥透露的路線圖:未來兩年還將推出真武V900、J900兩代芯片。截至目前,真武系列芯片已累計出貨56萬片,服務了中國電信、中國一汽、浦發銀行等400多家客戶。
![]()
這不是PPT,是已經在路上跑的車。
第二刀:交互重構——給Agent安上“手和腳”
芯片是心臟,但Agent要干活,還得有手有腳。
阿里云這次發布的首批官方“Skills”,就是Agent的手和腳。
解釋一下什么是Skills:你可以把云產品的API想象成數萬個復雜的“操作按鈕”,每個按鈕背后都有一大堆參數、鑒權邏輯、返回格式。人類工程師要看半天文檔才能搞明白怎么按。
而Skills做的事情是:把這些復雜的API,封裝成Agent能“秒懂”的標準化指令。
首批Skills覆蓋了阿里云12條產品線、60多款云產品。
舉個例子:以前你想讓Agent“部署一個應用并配置監控”,你需要寫一堆代碼,告訴它怎么調ECS的API、怎么配云監控的規則。現在,你只需要用自然語言說一句,Agent自動調用對應的Skills,從識別資源到部署完成,一氣呵成。
傳統云產品的交互邏輯是為人設計的,Agent不看網頁、不點按鈕。阿里現在要做的是讓每一個云產品都變成Agent可以“像調函數一樣調用”的能力模塊。
![]()
這還沒完。
除了Skills,阿里云還把模型服務全面CLI化。什么是CLI化?就是Agent不需要打開任何網頁,直接在命令行里就能完成模型選型、調用、用量查詢、成本分析……全自動。
以前,開發者教Agent用云,像是在教外國人認漢字;現在,Skills和CLI給了Agent一雙能干活的手。
第三刀:運維重構——讓Agent自己給自己“看病”
Agent 24小時不間斷工作,如果出了問題怎么辦?難道還要半夜把人類運維工程師叫起來?
阿里云發布的STAROps全域智能運維平臺,解決的就是這個問題。
這個平臺的核心邏輯是:讓Agent成為運維工程師的“數字員工”。
STAROps有三個核心能力:
1.智能助手:你(或另一個Agent)用自然語言問“過去24小時有哪些告警”,它直接給你答案,不用在日志、指標、鏈路三個系統里來回切。
2.長期任務機制:Agent可以接管巡檢、周期報告、告警分析這些“臟活累活”,一次對齊目標,它能自主執行跨天甚至跨月的運維計劃。
3.數字員工:企業可以為每個團隊構建專屬的SRE智能體,把專家經驗固化下來,新人來了不需要從頭學起。
更重要的是,STAROps內置了一套基于“證據鏈”的根因定位引擎——不是靠“老運維拍腦袋猜”,而是按規則查、按證據判。
阿里云還同步開源了UModel統一數據模型和RCA-100評測基準集(覆蓋2000多條評測數據、700多個運維場景),聯合信通院、小鵬汽車、中科院軟件所等10多家機構發起行業標準倡議。
這意味著什么?
“靠人熬夜救火”的運維時代正在結束,“Agent自治”的運維時代正在開始。
干掉“Copilot”?
是時候來一場效率革命了
如果說芯片和Skills是“骨架和手腳”,那模型就是Agent的“大腦”。
阿里云這次發布的Qwen3.7-Max,不只是又一個大模型版本號迭代。它在做一件更本質的事:從“對齊人類偏好”轉向“對齊任務目標”。
通俗地解釋:
以前的模型,訓練目標是“說得好”——回答問題像人、不胡說八道、有禮貌。
但Qwen3.7-Max的訓練目標是“做得到”——你給我一個任務,我自己規劃、自己執行、自己糾錯、自己交付成果。
這個轉變,是Agent能否真正“干活”的分水嶺。
35小時的“連續劇”:一個讓硅谷都沉默的案例
Qwen3.7-Max有一個案例,值得你花30秒認真看完。
它被放在一個訓練時從未接觸過的全新硬件平臺——平頭哥真武M890芯片上。沒有性能分析數據、沒有硬件文檔、沒有任何示例內核。
只有一個任務描述:“請優化這個推理內核。”
Qwen3.7-Max從零開始,完全自主地工作了35小時。
![]()
圖:Qwen3.7-Max可獨立執行35小時的長程復雜任務
在這35小時里,它干了什么?
·獨立進行了432次內核評估
·調用了1158次工具
·自己寫代碼、自己編譯、自己跑性能分析、自己找瓶頸、自己改架構
·甚至在運行超過30小時后,主動發起了一次關鍵的架構重設計
最終結果:優化后的推理內核,比官方參考實現性能提升了10倍。
10倍。
一個模型,在一個它從未見過的芯片上,從零開始,35小時不眠不休,干出了一個資深工程師團隊可能要干幾周甚至一兩個月的活。
這不是“問答”,這是“工作”。
阿里巴巴通義大模型事業部負責人周靖人點出了本質:
“過去我們追求的是模型‘說得好’,現在要求模型‘做得到’。Qwen3.7-Max的設計初衷,就是讓模型真正成為Agent的智能內核,具備自主規劃、持續迭代、跨工具協作的能力。”
在權威評測中,Qwen3.7-Max的成績也印證了這一點——在三方機構Arena全球大模型盲測總榜中,與GPT、Claude、Gemini的最強模型接近。
近3個月內,千問旗艦模型已經迭代了3.5、3.6、3.7三個版本。阿里顯然在刻意加速——模型能力的進化速度,必須匹配Agent場景的指數級需求增長。
10倍效率差:MuleRun揭示的企業生死線
模型強了,但企業怎么用?
阿里云旗下的Agent產品MuleRun給出了一個讓人后背發涼的數據:
AI Native團隊的效率,是Copilot團隊的10倍。
什么是Copilot?人類承擔80%工作,AI承擔20%——打打下手、寫寫草稿、查查資料。
什么是AI Native?AI承擔80%工作,人類只做20%——關鍵節點決策、最終把關、方向修正。
MuleRun負責人陳宇森說了一句值得所有企業主記住的話:“企業實現AI Native轉型的窗口期,通常只有18個月。”
不是AI淘汰人,是會用的企業淘汰不會用的企業。
MuleRun已經服務了全球43個國家的用戶。幾個案例可以讓你感受一下“AI Native”是什么樣的:
·巴西一位自由職業者:用MuleRun輸出了一整套營銷方案——網站、競品分析、內容策略、預算、短視頻腳本。全程沒打開過Word、PowerPoint、Excel任何一個傳統辦公軟件。
·日本某保健品公司市場部:一個6周的產品上市項目,從策略制定、發邀約郵件,到數據復盤,全部通過MuleRun完成。
·墨西哥某連鎖餐飲店店主:用西班牙語輸入指令,一鍵生成了含本地支付與多語言適配的餐廳官網,立刻上線運營。
·拉美某大型數據中心運營商:同時在幾個國家運營幾十個機房。他們用MuleRun搭建了項目運營看板和站點智能選址工具——這些工作以前需要咨詢公司+運維團隊+高額預算,現在靠一個Agent平臺就能搞定。
·世界泳聯:組織全球頂級賽事時,曾經需要IT、市場、數據、運營四個部門協同。現在,用自然語言指令,MuleRun直接搭出了多語言營銷落地頁、內部管理系統、賽事調度中樞和實時數字孿生控制臺。
MuleRun的數據還有一個細節很有意思:付費用戶每周活躍工作日是2.6天,人均每周完成13個端到端交付的工作任務。
2.6天,13個任務。
換句話說,這些用戶一周真正“干活”的時間不到3天,但產出卻是傳統模式的數倍。
這不是效率提升,這是工作方式的代際差異。
開放
是Agentic Cloud的“基本素養”
聊完芯片、模型、應用,我們回到一個更本質的問題:
阿里云到底想干什么?
如果只是發布一個更強的模型、一個更好的芯片,那充其量是“產品升級”。但阿里云這次的動作,明顯不止于此。
注意一個細節:百煉平臺全面開放,接入了智譜GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6、可靈、Vidu Q3-Pro等第三方模型。
![]()
你沒有看錯。阿里云在自己的官方模型平臺上,大大方方地賣起了競品模型。
這背后的邏輯是什么?
過去,云廠商的競爭邏輯是“我的模型最好,所以你用我的云”。這是“鎖客思維”。
阿里云現在換了一套邏輯:無論你用誰的模型(Qwen還是Kimi),只要你的Agent跑在我的架構上、用我的Skills調用資源、消耗我的Token,你就是我的用戶。
這是一盤更大的棋:
·賣自研芯片(真武),是賣“鏟子”;
·賣MaaS服務(Token),是賣“電”;
·建立Skills標準,是制定“插座規格”。
無論你是開發者、企業、還是另一個Agent,只要你需要“用電”,你就得用我這個規格的“插座”。
這就是為什么阿里云要強調“一個入口、多模型可選”——不是因為我做不出好模型,而是因為我的野心不止于做模型。
一個更值得關注的數據來自資本市場:阿里最新財報披露,AI模型及應用服務ARR(年經常性收入)已超過80億元,預計年底突破300億元。消息發布當天,阿里股價飆漲8%。
更重要的是,阿里云內部有一個判斷:Agent驅動的MaaS收入,將取代ECS(彈性計算服務)成為阿里云最大的產品線。
這意味著什么?
阿里云的增長引擎,正在從“賣算力”全面切換為“賣Token”。
你不再只是為服務器的開機時間付費,你為Agent完成的每一個任務、消耗的每一次推理付費。商業模式的底層邏輯變了。
一行代碼背后的野望
回到開頭那個“什么都沒有”的官網。
千問云首頁上的那行指令,不是一個產品細節,它是一個宣言。
在過去17年里,云的交互邏輯一直是“人登錄控制臺→選產品→配參數→調API”。這套流程對人類來說已經很順暢了,但對Agent來說完全不可用。
阿里云用一行代碼替代了整個官網,是在賭一件事:
未來云的主要消費者,不是人,是Agent。
當這個判斷成立的時候,所有為人類設計的界面、流程、交互邏輯,都將被重寫。
這是一個極其大膽的押注。上一次中國頭部科技公司以如此決絕的方式重構產品入口,可能要追溯到移動互聯網早期——當所有人把PC官網的流量讓位給App的那個階段。
只不過這一次更徹底:App至少還需要人去點開,而Agent只需要“讀”一條指令。
在不遠的將來,你可能不再需要打開任何App。
你的Agent會讀懂這行代碼,幫你買好服務器、搭好環境、寫好代碼、剪好視頻、監控好運行狀態。
你只需要說一句:“幫我做個事。”
然后去忙你真正該忙的事。
當Agent學會使用工具,人類才真正開始只負責創造。
而阿里云,正在鋪設這條創造之路的基石。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.