无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

阿里云換地基了

0
分享至


文:王智遠 | ID:Z201440

5月20號,杭州,阿里云峰會。

我到時,場館外頭已經排起了長隊。說實話,我本來以為就是例行發布會,結果進去一看,展區密度比我想的高不少。

AI原生應用全家桶、合作伙伴展臺、還有那個號稱能把人嚇一跳的超節點服務器實體,一路走下來,信息量是真大。

芯片、模型、平臺、官網,一上午發布的東西輪著來,但真正讓我停下來多看了兩眼的,是千問云的官網。

千問云官網,有什么好看的?

阿里云成立17年,頭一回在主站之外單獨給一個產品做官網。打開首頁,只有一行代碼。這首頁,是給Agent讀的。

一家給人類用戶做了17年服務的云公司,把新官網的首頁做成了一條機器指令。我琢磨了半天:這場大會發了一堆東西,好像都在講同一件事。

什么事?先把發的東西攤開看。

芯片層,平頭哥掏出了新AI芯片,真武M890。又配了自己做的互聯芯片ICN Switch,全裝進一臺叫磐久AL128的超節點服務器里。

128張卡拼成一臺計算機,已經上線百煉,跑著Qwen、DeepSeek、Kimi的模型服務。路線圖也亮出來了,V900、J900排著隊,一年一代,不會停。

模型層,千問發了旗艦模型Qwen3.7-Max,各榜單國產第一。

現場給了一個實戰案例:模型在一塊全新芯片上自己干了35個小時,從零寫出了生產級kernel。性能比官方版本高了10倍。全程沒人碰。

平臺層,百煉推理服務全面升級,上下文緩存、彈性調度、機密推理,六家頭部模型公司的產品全部接進來了。

最后,才是千問云官網。

品類多,信息量大。但我在現場越聽越覺得,這不只一堆產品發布,屬于一次大切換。

劉偉光在臺上說了一句話:人類員工與Agent已經形成了混合工作網絡;他甚至說,未來自己可能要接受一個Agent做他的manager。

李飛飛講云基礎設施,核心判斷是「從資源調度轉向任務調度」。傳統云賣的是算力資源,你買多少用多少。Agent時代的云,要干的事完全不同:理解任務、分派任務、干完了把資源收回來。調度的對象從機器變成了事情。

千問云更直接。所有模型服務封裝成Skills和CLI,Agent一條指令就能學會全站能力,自主調用。人類開發者連集成代碼都不用寫。

三個信號放在一起,指向就清楚了。云計算這個行業,三十年來第一次換用戶了。

回頭看,計算范式的每一次大切換,換的都是用戶;大型機服務的是大機構,PC讓個人第一次有了算力,互聯網把用戶搬到了線上,云計算讓開發者成了最核心的客戶群體。

現在,用戶變成了Agent,屏幕都不需要了;聽起來好像沒什么大不了的,對吧?這次真不一樣。以前換「哪些人在用云」,這次換的,是用云的還是不是人?

你可能說了:換個用戶,至于這么大動靜嗎?至于。

云計算從1990年代中期開始冒頭,到今天差不多三十年。這三十年里,不管底下技術怎么翻新,有三樣東西一直沒人動過,也不需要動。它們是整個行業的默認設置,所有產品都長在這上面。

第一樣:活是可以預估的。

一個電商網站,雙11的流量峰值提前兩個月就能算出來。一個SaaS應用,每天多少人用、每秒多少請求,翻翻歷史數據就知道。

云廠商那套彈性伸縮,人多開窗口、人少關窗口,全是圍著一個假設設計的:活有規律,有波峰有波谷,有周期。

Agent的活沒規律。

一個Agent接到任務,可能瞬間拉起一萬個臨時場子同時跑,三分鐘后全拆光。下一個任務什么時候來、要多少資源、干多久,沒人知道。連Agent自己都不知道,它是邊干邊決定下一步的。

這不叫波峰波谷,波峰波谷的前提是你能畫出一條曲線,然后沿著曲線調配資源。Agent的活根本畫不出曲線。

第二樣:用戶是人。

控制臺有菜單、按鈕、儀表盤。API文檔是寫給人看的,權限體系是按公司的組織架構設計的。什么管理員、開發者、運維,理得清清楚楚。

可Agent呢?

它要可編程的接口、結構化的能力描述、機器能讀懂的反饋。你給它一個漂漂亮亮的控制臺頁面,對它來說就是一面墻。

更難搞的是權限,管人那套權限邏輯,前提是一個人一次只干一件事,權限跟著角色走。

Agent可以一次干一百件事,每件事要的權限都不一樣,干完就釋放。按角色分權限那套老辦法,管不住這種動態的、逐任務的權限需求。

李飛飛在臺上把這個事講得很直接:

要給Agent發身份證。不是給人設計的那種賬號密碼。這事企業真要落地,第一道坎不是Agent夠不夠聰明,是你敢不敢給它開門禁。

第三樣:程序是長期跑的。

傳統云上跑的東西,不管是網頁服務、數據庫還是微服務容器,部署上去就一直跑著。

偶爾更新、重啟,生命周期按月甚至按年算。云的資源分配、監控告警、計費模式,全是給長期跑的程序設計的。

Agent的任務是短命的,啟動,干活,完事,銷毀。下一個任務來了,重新啟動一個全新的,生命周期可能就幾秒鐘。

你要按傳統云的方式給它分配資源、掛載存儲、配網絡,光準備環境的時間就比干活的時間還長。

李飛飛講了一個數字:

他們的臨時場子可以做到眨個眼的功夫就準備好,一分鐘能拉起兩萬個。為什么要做到這種程度?因為Agent的活不等人。Agent等不了。

打個比方:

你開了一家酒店,住的一直是人。房間有門有窗有床有燈,前臺會說話,電梯按樓層。這套東西用了三十年,運轉得很好。

現在來了一批新客人:機器人。它們不睡覺,不需要床,不走電梯,直接從窗戶飛進來;同時入住一萬間房,住三分鐘就退房。你需要一棟完全不同的建筑。

三個假設同時失效,意味著每一層的設計前提都不成立了。彈性伸縮的前提沒了,權限體系的前提沒了,資源分配的前提沒了。

李飛飛在演講里總結了六個核心挑戰:

活干幾秒就結束、數據又多又雜要地方存、流量說來就來毫無規律、環境每次都不一樣、安全管控要到任務級別、資源調度要搞大規模動態分配。

六個挑戰,沒有一個是傳統云計算的老問題。全是新的。

所以,阿里云這次的動作是「重做」;從芯片到操作系統到安全體系到調度邏輯,每一層都要按新的假設重來一遍,這就是我說的:大切換。

切換,說著容易,關鍵是地基怎么打?

最直覺的思路是按產品線排:芯片做了什么,云做了什么,模型做了什么。但聽完整場之后我覺得,換個角度可能更清楚。

按Agent的需求看。一個Agent要能上崗干活,到底需要什么?

先說力氣。力氣就是算力。Agent跟過去的chatbot不一樣。一個chatbot調一次模型就完事了。

一個Agent執行一個任務,可能要連續調幾十次模型,中間還要去查數據庫、跑代碼、操作瀏覽器。成千上萬個Agent同時在線上干活,每個都在密集調用,算力壓力是指數級翻上去的。

這就是真武M890要解決的事。

144GB顯存,片間互聯帶寬800GB/s,性能是上一代的3倍。搭配自己做的互聯芯片ICN Switch,128張卡在一個機柜里組成一臺計算機,卡跟卡之間通信,時延低于150納秒。

150納秒是什么概念?人類眨一次眼大約要300毫秒。150納秒是眨眼時間的兩百萬分之一。Agent的世界里,通信速度就要快到這種程度。

光有芯片還不行,芯片的能力得被釋放出來。

平頭哥有一套全自研的軟件棧叫SAIL,從底層驅動到編程接口到通信庫全部自己寫的,6月份在官網上線,同步在GitHub開源。

大會上還公布了一個事實:真武芯片已經累計出貨56萬片,400多家客戶,20多個行業。這不是實驗室里的東西,是跑真實業務的。

有了力氣,還得有地方干活,這個「地方」就是運行環境。Agent執行任務需要一個獨立的空間,可以理解成工位。傳統云上的工位是虛擬機或者容器,啟動要幾秒甚至幾十秒,Agent用不了,太慢。

阿里云給Agent做的工位叫沙箱,百毫秒級啟動,一分鐘可以拉起兩萬個;干完活,沙箱自動銷毀,資源釋放。下次再來,重新分配一個全新的。

這里有個細節值得說:

Agent跟Agent之間、任務跟任務之間,隔離要求非常高。特別是企業級場景,一個Agent在處理A公司數據,另一個在處理B公司的,兩邊絕對不能串。

阿里云用的是硬件級別的隔離,從物理上徹底隔開。

更底層的地方也在動,龍蜥操作系統在內核級別做了Agent Task OS;操作系統本來是給人寫的程序服務的,現在要給Agent的活服務,內核層面的資源調度邏輯都得改。

有力氣、有工位了,還得有身份。

阿里云推了Agent ID服務,給每個Agent獨立的身份認證、權限邊界、行為審計;等于給Agent辦入職手續:工牌、門禁卡、權限表,一樣不能少。

配套的還有Agent Ops,管Agent整個生命周期,從開發到上線、從考核到進化,全鏈路可追蹤;跟管人其實是一個邏輯。你招了一個員工進來,不能發完工牌就不管了。

有了身份,還得有記憶。

一個Agent如果每次執行任務都從零開始,什么都不記得,效率會很低。李飛飛講記憶的時候用了一個詞:承上啟下。他說人做復雜任務,靠的就是記憶力,長的短的都要有。

阿里云把Agent的記憶分了三層:

短期記憶,一次對話里的上下文,類似你跟同事開會時的工作記憶。長期記憶,跨越多次對話,Agent上周干過什么、學到了什么,下次還能記得。

知識記憶,是外掛的企業知識庫,公司多少年的文檔、流程、規則,向量化之后Agent可以隨時翻。

三層記憶各有各的存法,短期放高速緩存,長期用數據庫存,知識庫走向量檢索。阿里云把自家數據庫、大數據、存儲產品線全拉進來了,各管各的。

有力氣、工位、身份、記憶,還差一樣:安全。

你去銀行租了一個保險柜,往里放什么,銀行不知道,也看不到。銀行只管一件事:保證你的柜子只有你能打開。

阿里云的機密推理技術C-MASK,干的就是這件事。

你的數據進到模型里做推理,全程加密,連阿里云自己都看不見;數據能用,內容你看不到。等于說,你用阿里云的算力、環境、模型,但你最核心的數據,只有自己能碰。

百煉的技術負責人于文淵說了一句話,我覺得說到了點上:「安全不是Agent的可選項,是出廠標配。」

最后,Agent要能變聰明,這就是模型的事;Qwen3.7-Max這次展示了一種新的模型能力:自主完成復雜工程任務。

周靖人在臺上說:

大模型正在從對齊人類偏好,轉向對齊任務目標;過去追求模型說得好,現在要求模型做得到。這個轉變對Agent來說是決定性的。

Agent需要一個能獨立干活的大腦。35個小時無人干預寫出生產級kernel,證明的就是這件事。

算力、運行環境、身份、記憶、安全、智能。六個模塊,每一個都是從頭做的,沒有一個是在老系統上打補丁。

而且這套東西已經在跑了,MiniMax的MaxCloud產品,就跑在阿里云這套Agent基礎設施上,從沙箱隔離到彈性調度到安全防護,全鏈路都用的上面說的這些能力。

全部重做,值不值最后還得看一件事:有沒有人買單。

我查了一下阿里上周的財報。AI模型及應用服務的ARR已經超過80億。管理層給的指引是年底突破300億。消息出來那天,阿里股價漲了8%。

80億到300億,一年翻將近四倍。資本市場不傻,用腳投的票比嘴上說的話誠實。

這里面有一個更值得看的信號:Token驅動的MaaS收入,正在取代ECS成為阿里云最大的產品線。這句話值得停下來想一想。

ECS是什么?云服務器,阿里云起家的東西,賣了十幾年的核心產品。按臺收費,你買多少機器用多少。現在這個位置要讓給Token了。計費單位從「臺」變成了「Token」,整個增長邏輯都變了。

賣機器靠什么增長?靠客戶買更多機器。客戶的IT預算有天花板,一年就這么多錢,買完了就沒了。

賣Token靠什么增長?靠Agent干更多的活。Agent越多、越自主、跑的時間越長,Token消耗就越大;一個Agent執行一次復雜任務可能消耗幾萬個Token,一天執行一百次,一年365天不休息。

這是一個自己轉起來就停不下來的飛輪。

Agent越好用,企業越愿意部署更多Agent。Agent越多,Token消耗越大。Token收入越高,平臺越有錢投入芯片和模型的迭代。

芯片和模型越好,Agent越好用。這個飛輪,才是阿里云全棧重做的真正驅動力。

生態也在跟著聚攏,大會現場,智譜、MiniMax、月之暗面等六家頭部模型公司的代表一起上臺,產品全部接入百煉。

劉偉光在臺上翻出了2023年蔡崇信說的一句話:

阿里云要做AI時代最開放的云;三年過去,百煉變成了一個多模型、多模態的統一入口。

什么叫統一入口?開發者接一套API,就能調所有模型。不用給每家模型公司單獨做適配,不用操心底層的算力調度和成本優化,百煉全包了。

對模型公司來說,上架百煉等于多了一個分發渠道,算力、調度、計費都不用自己操心;對企業來說,在一個地方就能挑到各家最好的模型,還能做對比、做精調、做評估。兩頭都有好處,生態才聚得起來。

還有一個事實容易被忽略:

阿里云是從芯片到HPC、到模型矩陣、到模型平臺、到應用,完整打通五層全棧的云廠商。

全棧的意思是,從最底下的芯片到最上面的應用,中間每一層都是自己的。芯片是平頭哥的,云是阿里云的,模型是千問的,平臺是百煉的。

哪一層出了問題,自己就能改,不用等別人。哪一層有優化空間,自己就能動,不用跟別人協調。

Agent時代,這種全棧能力的價值會被放大。

因為Agent的工作負載穿透所有層,一個Agent執行任務,同時在消耗芯片算力、占用沙箱、調用模型推理、走平臺調度。

任何一層出瓶頸,整個鏈路就卡住。每一層都能動,才有可能做到端到端的優化。

錢在跟著走,生態在聚攏,全棧能力在發揮作用;三件事加在一起,說明一件事:全部重做,才有很多想想空間。



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

周軍律師聊案子
2026-04-21 09:50:16
印度外長很后悔:要不是印度的大恩大德,中國當年哪進得了聯合國

印度外長很后悔:要不是印度的大恩大德,中國當年哪進得了聯合國

史料布籍
2026-06-11 11:21:17
6死7傷!鄉政府大樓被炸震驚中央,四川涼山州6.26特大爆炸案始末

6死7傷!鄉政府大樓被炸震驚中央,四川涼山州6.26特大爆炸案始末

易玄
2024-09-11 10:52:41
伊朗稱用12枚導彈摧毀約旦美軍基地“大量戰機”

伊朗稱用12枚導彈摧毀約旦美軍基地“大量戰機”

財聯社
2026-06-11 11:14:16
安切洛蒂幫大忙!曼聯 3500 萬撿漏雙位置猛將,紅魔這下賺大了

安切洛蒂幫大忙!曼聯 3500 萬撿漏雙位置猛將,紅魔這下賺大了

瀾歸序
2026-06-12 02:24:36
盧偉:隊醫說王哲林撕裂受傷至少缺席半個月 但他不想錯過機會

盧偉:隊醫說王哲林撕裂受傷至少缺席半個月 但他不想錯過機會

狼叔評論
2026-06-11 17:58:06
被拒絕入境美國后,世界杯主裁判回國獲英雄般歡迎

被拒絕入境美國后,世界杯主裁判回國獲英雄般歡迎

觀察者網
2026-06-11 13:26:17
央媒銳評刀郎被神話風波,釋放三個強烈信號,云朵的話有人信了

央媒銳評刀郎被神話風波,釋放三個強烈信號,云朵的話有人信了

小曙說娛
2026-06-11 13:10:23
母女同日落樓身亡:那個12歲女孩,為何在報警10小時后也選擇離開

母女同日落樓身亡:那個12歲女孩,為何在報警10小時后也選擇離開

教師吧
2026-06-11 23:26:25
溫州FC投資人:現在我爸巴不得球隊趕緊結束,讓我回公司接班

溫州FC投資人:現在我爸巴不得球隊趕緊結束,讓我回公司接班

懂球帝
2026-06-11 09:58:04
水晶宮13將入選世界杯創隊史紀錄

水晶宮13將入選世界杯創隊史紀錄

體壇周報
2026-06-11 21:12:23
一婚娶演員,二婚娶主持,如今在江蘇租房住,和四個娃過田園生活

一婚娶演員,二婚娶主持,如今在江蘇租房住,和四個娃過田園生活

素衣讀史
2026-05-11 20:56:03
資本大佬為何總捧劉浩存,因為她踩中了,中國文化三個"隱形規則"

資本大佬為何總捧劉浩存,因為她踩中了,中國文化三個"隱形規則"

白面書誏
2026-06-11 14:57:11
丁太升銳評謝娜開巡演,不帶一個臟字,但句句聽著太毒舌

丁太升銳評謝娜開巡演,不帶一個臟字,但句句聽著太毒舌

生命之泉的奧秘
2026-06-11 16:26:05
馬特烏斯:無C羅的葡萄牙>無梅西的阿根廷,后者對球隊影響更大

馬特烏斯:無C羅的葡萄牙>無梅西的阿根廷,后者對球隊影響更大

天光破云來
2026-06-11 14:06:21
番禺萬博被掏空?虎牙、歡聚集體集體搬遷佛山

番禺萬博被掏空?虎牙、歡聚集體集體搬遷佛山

樓市滅霸
2026-06-11 19:35:55
隨著古伊里雙響炮+比分4-0,阿爾及利亞橫掃南美勁旅

隨著古伊里雙響炮+比分4-0,阿爾及利亞橫掃南美勁旅

俯身沖頂
2026-06-11 10:07:47
伊朗公布最新海上損失情況

伊朗公布最新海上損失情況

新華社
2026-06-10 21:30:08
又一個釋永信?少林寺賬上少了八百萬,新方丈竟是“罪魁禍首”

又一個釋永信?少林寺賬上少了八百萬,新方丈竟是“罪魁禍首”

智慧生活筆記
2026-06-11 00:38:47
法國海軍:在南海遭遇40艘中國軍艦,法軍的龐大力量使中國冷靜

法國海軍:在南海遭遇40艘中國軍艦,法軍的龐大力量使中國冷靜

一曲一場談
2026-06-10 23:03:21
2026-06-12 07:16:49
智遠同學 incentive-icons
智遠同學
暢銷書《復利思維》作者;精神生活與商業探索,關注科技人文、消費電商、品牌營銷、商業認知思維等方面。
762文章數 210關注度
往期回顧 全部

科技要聞

淘寶、京東、拼多多、抖音、小紅書被約談

頭條要聞

中方對菲國防部長特奧多羅及其親屬實施制裁

頭條要聞

中方對菲國防部長特奧多羅及其親屬實施制裁

體育要聞

比起總冠軍,更大的懸念成了FMVP?

娛樂要聞

《花少8》陣容大揭秘!秒殺前一季

財經要聞

干細胞生意:17萬一針的希望

汽車要聞

將搭云輦-M智能磁流變懸架 方程豹方程S系列信息曝光

態度原創

數碼
旅游
藝術
公開課
軍事航空

數碼要聞

傳聞稱蘋果首款觸控屏 MacBook 已“100% 確認”

旅游要聞

訪賽珍珠故居(旅人心語)

藝術要聞

華國鋒的“華氏顏體”為何被公認為書法珍品?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普召開戰情室會議討論對伊朗軍事行動

無障礙瀏覽 進入關懷版