![]()
編輯|吳昕
這一年多來(lái),Agent「外掛」幾乎快把打工人「爽」上天。
只需一句話,它就能秒級(jí)吐出數(shù)萬(wàn)字深度報(bào)告,甚至直接交付一款軟件。把孩子照片剪成 Vlog 發(fā)給老公,或者替你操控瀏覽器訂機(jī)票、填表單,也不在話下。
如今,這種「起飛」的絲滑體感正在反向擠壓底層云服務(wù),掀起一場(chǎng)「土地」風(fēng)暴。
「 4 年前做 AI 要買(mǎi)算力卡,3 年前要卷大模型,而今天,做 AI 就是開(kāi)發(fā)和用好智能體。」在 6 月 5 日的 INSPIRE 創(chuàng)想者大會(huì)上,華為公司董事、華為云 CEO 周躍峰用一句話點(diǎn)破了行業(yè)拐點(diǎn),并將一個(gè)新概念推向臺(tái)前——硅基黑土地。
![]()
華為公司董事、華為云CEO周躍峰
過(guò)去,云服務(wù)被稱為「算力黑土地」。企業(yè)要種 AI,先得有地、有水、有電,也就是算力、存儲(chǔ)、網(wǎng)絡(luò)和數(shù)據(jù)庫(kù)。但 Agent 時(shí)代,它必須變成適合「種植」智能體的「硅基黑土地。」
也是在這一天,華為云一口氣砸下四大層面、十余款 Agentic AI 新品。
從「算力」到「硅基」,兩字之變,背后是大廠解題思路的重要轉(zhuǎn)向:不再倒賣(mài)散裝算力,而是重新定義 Agent 時(shí)代智能體生長(zhǎng)和進(jìn)化的底層土壤。
先把 Agentic Infra 這層土壤變厚
當(dāng)一批數(shù)字「勞動(dòng)力」進(jìn)入企業(yè)流程,一次看似簡(jiǎn)單的任務(wù),背后可能是幾十次模型調(diào)用、多個(gè)工具鏈切換、一串沙箱環(huán)境啟動(dòng)、長(zhǎng)時(shí)間上下文保存,以及 CPU、NPU、存儲(chǔ)、網(wǎng)絡(luò)之間連續(xù)不斷的資源調(diào)度。
這時(shí)候,僅僅死磕模型參數(shù)、 GPU 數(shù)量,遠(yuǎn)遠(yuǎn)不夠。誰(shuí)能把 Token 效率、記憶、調(diào)度、安全這些底層能力做得扎實(shí),才有可能讓上面的 Agent 真正長(zhǎng)出來(lái)。
這正是華為云提出「硅基黑土地」的原因。
在這次 INSPIRE 創(chuàng)想者大會(huì)上,華為云正式提出 Agentic Infra 新范式:高效 Token 工廠、持續(xù)學(xué)習(xí)、通智一體化調(diào)度、安全自治。
![]()
四個(gè)關(guān)鍵詞,正好對(duì)應(yīng) Agent 大規(guī)模落地的四個(gè)基礎(chǔ)難題。
第一個(gè)難題,是 Agent 不能慢。
人和聊天機(jī)器人對(duì)話,等幾秒還能接受。但 Agent 要連續(xù)思考、連續(xù)調(diào)用工具、連續(xù)執(zhí)行任務(wù)。每一步慢一點(diǎn),整條任務(wù)鏈路就會(huì)被拖成「龜速」。
一旦進(jìn)入客服、研發(fā)、金融風(fēng)控、工業(yè)調(diào)度這些真實(shí)生產(chǎn)系統(tǒng),慢和不穩(wěn)定都會(huì)變成業(yè)務(wù)風(fēng)險(xiǎn)。
所以,華為云推出 AICS 靈衢智算集群——憑借創(chuàng)新性的靈衢 UnifiedBus(UB)統(tǒng)一總線協(xié)議+基于 SuperPoD 超節(jié)點(diǎn)架構(gòu),AICS 打破傳統(tǒng)服務(wù)器的物理邊界,讓大規(guī)模智算集群更像一臺(tái)邏輯上的「巨型計(jì)算機(jī)」,也把云底座變成了一個(gè)高效 Token 工廠。
![]()
在集群規(guī)模與算力上,最大可落地 10 萬(wàn)卡超大型智算集群,整體總算力達(dá) 200EFLOPS。
在 Token 生產(chǎn)能力上,千卡硬件每秒 Token 吞吐量達(dá) 500 萬(wàn),推理單 Token 生成時(shí)延壓縮至 10ms 以內(nèi),滿足 Agent 實(shí)時(shí)交互、高并發(fā)在線推理需求。
在服務(wù)穩(wěn)定性上,靈衢智算集群基于全鏈路可觀測(cè)與多級(jí)快恢能力,支持在線推理服務(wù)達(dá)到 99.95% 的可用性。
第二個(gè)難題,是 Agent 不能只有「魚(yú)的記憶」。
AMS Agentic 記憶存儲(chǔ)解決方案,通過(guò) PB 級(jí)記憶空間、KV Cache 分層池化、長(zhǎng)上下文和多輪記憶管理,讓 Agent 可以保存更長(zhǎng)時(shí)間的任務(wù)狀態(tài)和經(jīng)驗(yàn)。換句話說(shuō),就是給智能體配一個(gè)更大的「工作記憶」和「長(zhǎng)期記憶」。
這對(duì)企業(yè)級(jí) Agent 很關(guān)鍵。真正的企業(yè)任務(wù)很少一次問(wèn)答就結(jié)束。一個(gè)研發(fā)任務(wù)可能跑幾個(gè)小時(shí),一個(gè)數(shù)據(jù)分析任務(wù)可能跨多個(gè)系統(tǒng),一個(gè)行業(yè)智能體甚至要在多輪反饋里不斷修正策略。
Agent 要從「能回答」走向「能長(zhǎng)期干活」,記憶能力必須成為基礎(chǔ)設(shè)施的一部分。
第三個(gè)難題,是算力資源要調(diào)得動(dòng)。
Agent 的工作流很雜。有時(shí)要跑大模型推理,有時(shí)要啟動(dòng)沙箱執(zhí)行代碼,有時(shí)要讀寫(xiě)存儲(chǔ),有時(shí)要調(diào)用傳統(tǒng)業(yè)務(wù)系統(tǒng)。訓(xùn)練、推理、Agent 負(fù)載、通用微服務(wù),都會(huì)混在一起搶資源。
如果底層調(diào)度還停留在傳統(tǒng)云原生時(shí)代,就很容易出現(xiàn)尷尬局面:算力拼不起來(lái)、調(diào)不動(dòng)也用不滿,任務(wù)一多還打架。
通智一體化調(diào)度引擎 CCE VolcanoNext ,利用精密的「軟件調(diào)度技術(shù)」、通過(guò)兩個(gè)關(guān)鍵動(dòng)作,立馬讓整體硬件利用率提升了 30% 以上。
一個(gè)是「訓(xùn)推共池」。
把原本割裂的訓(xùn)練和推理算力揉成一張網(wǎng),讓訓(xùn)練、推理、Agent 等多種負(fù)載可以在同一資源池里動(dòng)態(tài)復(fù)用。
另一個(gè)是「碎片整合」,變廢為寶。
訓(xùn)練任務(wù)里常常會(huì)有很多細(xì)碎的資源空隙。 CCE VolcanoNext 能將極其零碎的算力「偷」出來(lái),瞬間打包塞給正在等待響應(yīng)的在線推理任務(wù)(比如去生成一個(gè) Token ),讓算力流失率趨近于零。
第四個(gè)難題,是 Agent 必須管得住。
企業(yè)不是不想用 Agent,而是不敢隨便讓 Agent 進(jìn)生產(chǎn)系統(tǒng)。畢竟能力越強(qiáng),風(fēng)險(xiǎn)越大,企業(yè)越容易緊張。
這也是 AgentSphere 的定位——它提供的是生產(chǎn)級(jí)智能體運(yùn)行環(huán)境,把沙箱隔離、身份權(quán)限、意圖防護(hù)、雙向網(wǎng)絡(luò)防護(hù)、行為審計(jì)放進(jìn)同一個(gè)底座里。
同時(shí),它還足夠快。
AgentSphere 通過(guò)羽量級(jí)沙箱技術(shù),實(shí)現(xiàn) 100ms 級(jí)啟動(dòng)和每分鐘十萬(wàn)級(jí)批創(chuàng)能力,既能支撐 Agent Serving 里的工具調(diào)用,也能支撐 Agentic RL 里大規(guī)模沙箱高頻創(chuàng)建。
ModelArts+AgentArts:
再讓企業(yè)級(jí)智能體觸手可及
話又說(shuō)回來(lái),企業(yè)真正需要的,是上面這些裸算力嗎?其實(shí)不是。
與其說(shuō)人們需要的是電,不如說(shuō)是那些真正進(jìn)入生活、解決問(wèn)題的電器。傳統(tǒng)企業(yè)也一樣,他們更需要可自由支配的模型和智能體能力。
所以,在 Agentic Infra 之上,華為云繼續(xù)鋪了兩層能力:ModelArtsNext 和 AgentArts。前者解決「模型怎么用得更好」,后者解決「 Agent 怎么跑進(jìn)企業(yè)」。
![]()
先看 ModelArtsNext
過(guò)去很多 MaaS 平臺(tái)像一個(gè)模型貨架:這里有 DeepSeek,那里有 Qwen,還有自家的模型,用戶自己選、自己調(diào)、自己試。
但 Agent 時(shí)代,這種方式會(huì)很快遇到問(wèn)題。一個(gè)企業(yè)任務(wù)可能并不只適合一個(gè)模型。寫(xiě)代碼、做客服、查知識(shí)庫(kù)、跑推理、處理多模態(tài)內(nèi)容,不同環(huán)節(jié)對(duì)成本、速度、效果的要求都不一樣。
這時(shí)候,關(guān)鍵不只是「有多少模型」,而是能不能把合適的請(qǐng)求,分給合適的模型。
ModelArtsNext 的模型路由能力,應(yīng)運(yùn)而生。它可以根據(jù)請(qǐng)求特征、實(shí)時(shí)負(fù)載和使用體驗(yàn),動(dòng)態(tài)選擇更合適的模型。用戶可以選擇成本優(yōu)先、效果優(yōu)先,或者均衡模式,讓系統(tǒng)在不同任務(wù)之間自動(dòng)做取舍。
這聽(tīng)上去像一個(gè)后臺(tái)調(diào)度功能,但對(duì)企業(yè)來(lái)說(shuō)很重要。
因?yàn)槠髽I(yè)不是在玩模型評(píng)測(cè)榜,而是在算真實(shí)成本:同樣一個(gè)任務(wù),能不能少花一點(diǎn) Token?同樣一套應(yīng)用,能不能既保證效果,又把推理成本壓下來(lái)?
除了模型路由,ModelArtsNext還把 RLaaS、機(jī)密推理和模型矩陣打包進(jìn)來(lái)。
RLaaS(強(qiáng)化學(xué)習(xí)服務(wù))讓企業(yè)可以用強(qiáng)化學(xué)習(xí)繼續(xù)優(yōu)化自己的智能體,讓模型在真實(shí)業(yè)務(wù)反饋中越用越聰明。
機(jī)密推理面向金融風(fēng)控、AI 編碼等高敏感場(chǎng)景,解決數(shù)據(jù)可信和安全調(diào)用問(wèn)題。
此外,華為云提供豐富的模型矩陣能力,實(shí)現(xiàn)了主流 SOTA 模型(如 DeepSeek、Kimi、智譜GLM等)Day0 上線,能力覆蓋編程、多模態(tài)等豐富場(chǎng)景。企業(yè)可通過(guò) Tokens API、工具鏈、Agent 開(kāi)發(fā)平臺(tái)、智能體應(yīng)用 4 種形態(tài)輕松調(diào)用。
![]()
再往上,就是 AgentArts,負(fù)責(zé)把模型能力封裝成靠譜、合格的「數(shù)字員工」。
企業(yè)級(jí) Agent 一旦進(jìn)入生產(chǎn)環(huán)境,就如同可能影響業(yè)務(wù)結(jié)果的數(shù)字員工,怎么樣才能讓這位「員工」穩(wěn)定、可控、可持續(xù)地進(jìn)入工作流?
AgentArts 對(duì)應(yīng)的,正是這套生產(chǎn)級(jí)要求。
其中,長(zhǎng)程任務(wù),解決的是 Agent 能不能連續(xù)干活的問(wèn)題。企業(yè)任務(wù)往往不是一問(wèn)一答,而是持續(xù)數(shù)小時(shí)甚至數(shù)天的流程。AgentArts 要保障任務(wù)不中斷、異常能恢復(fù)、上下文能延續(xù)。
企業(yè)級(jí)安全,解決的是 Agent 能不能放心用的問(wèn)題。它需要會(huì)話隔離、權(quán)限管控、隱私數(shù)據(jù)保護(hù)和安全沙箱,不能讓一個(gè)能調(diào)用工具的智能體隨便越權(quán)。
行業(yè)知識(shí)深度,解決的是 Agent 能不能懂業(yè)務(wù)的問(wèn)題。不同企業(yè)、不同崗位、不同流程,都有自己的知識(shí)、規(guī)則和經(jīng)驗(yàn)。Agent 要真正干活,就必須把這些行業(yè)資產(chǎn)吃進(jìn)去。
全鏈路可觀測(cè),解決的是 Agent 出問(wèn)題后能不能查清楚的問(wèn)題。它做了什么、調(diào)用了什么工具、哪一步失敗、為什么失敗,都要能被追蹤和復(fù)現(xiàn)。
基于華為云 AgentArts 平臺(tái),企業(yè)可以從 300 多個(gè)行業(yè)資產(chǎn)中靈活選取,組合出適合自己的智能體能力。從實(shí)際落地來(lái)看,這套能力已經(jīng)開(kāi)始跑進(jìn)真實(shí)業(yè)務(wù)場(chǎng)景。
例如,溫氏集團(tuán)通過(guò)華為云 AgentArts,基因組分析效率提升 50%,AI 解讀成功率高達(dá) 95 %以上。此外,遺傳評(píng)估準(zhǔn)確率同步提升 15%。
比起數(shù)Token,華為云更關(guān)心它們?nèi)チ四睦?/strong>
過(guò)去一年,AI 云廠商被 Token 卷上了天。
模型調(diào)用量、Tokens 產(chǎn)出、推理成本、API 價(jià)格,幾乎成了衡量 AI 云熱度的新尺子。
誰(shuí)能承接更多模型調(diào)用,誰(shuí)能生產(chǎn)更多 Token,誰(shuí)就更像握住了 AI 云時(shí)代的新增長(zhǎng)入口。
華為云沒(méi)有回避 Token 經(jīng)濟(jì),也在建設(shè)高效 Token 工廠、MaaS 模型即服務(wù)和 Agentic Infra,但它又不想陷入互聯(lián)網(wǎng)的這套排行榜里。
在媒體見(jiàn)面會(huì)上,周躍峰說(shuō)得很直白:華為云「不太在乎 Token 總量是多少」,也「不太在乎收入的總量是多少」,更在乎國(guó)產(chǎn)化算力系統(tǒng)生產(chǎn)出來(lái)的 Tokens 背后,能不能帶來(lái)健康提升、節(jié)電和生產(chǎn)力提升,而不只是情緒價(jià)值。
![]()
這句話聽(tīng)起來(lái)有點(diǎn)反增長(zhǎng)敘事,其實(shí)點(diǎn)出了華為云和互聯(lián)網(wǎng)云廠商的關(guān)鍵差異。
來(lái)看一個(gè)醫(yī)療案例。針對(duì)中國(guó)病理醫(yī)生缺口高達(dá)14 萬(wàn)的結(jié)構(gòu)性挑戰(zhàn),上海瑞金醫(yī)院聯(lián)合華為,歷時(shí)一年半打造了 RuiPath 病理大模型。
這是國(guó)內(nèi)首個(gè)進(jìn)入醫(yī)院生產(chǎn)流程的臨床級(jí)病理大模型,可覆蓋 90% 的常見(jiàn)癌種和 90% 的下游診斷任務(wù)。
![]()
研發(fā)過(guò)程中,瑞金醫(yī)院提供了百萬(wàn)張高質(zhì)量數(shù)字病理切片和寶貴臨床數(shù)據(jù)。華為云提供的是數(shù)據(jù)工程、模型工程、應(yīng)用工程以及全流程工具鏈支持。
現(xiàn)在,RuiPath 正在按照「頂級(jí)醫(yī)院研發(fā)驗(yàn)證—地市三甲醫(yī)院擴(kuò)展—縣域醫(yī)院復(fù)制應(yīng)用」的路徑向外擴(kuò)散。短短幾個(gè)月,朋友圈已擴(kuò)展到全國(guó) 20 多家醫(yī)院。
比如,邯鄲市中心醫(yī)院,通過(guò)每輪幾十張切片的小樣本微調(diào),讓本地乳腺癌有無(wú)腫瘤判別準(zhǔn)確率提升到接近 100%。
涉縣醫(yī)院、武安市第一人民醫(yī)院這樣的區(qū)域醫(yī)院,也可以在數(shù)據(jù)不出域、安全可控的前提下,通過(guò)端云協(xié)同享受到頂尖專家的診斷能力。
這才是華為云口中「有價(jià)值的 Token」。
它對(duì)應(yīng)的不是一次聊天、一段生成文本、一個(gè) API 調(diào)用,而是一次更準(zhǔn)確的病理判斷,一次基層醫(yī)院診斷能力的提升,一次優(yōu)質(zhì)醫(yī)療資源的下沉。
這一核心差異化,可以追溯到華為最初進(jìn)入云市場(chǎng)時(shí)的底色。
早在多年以前,華為云就曾明確提出,未來(lái) AI 的主場(chǎng)在行業(yè),并把公有云作為面向未來(lái)的重要戰(zhàn)略。那時(shí),很多政府和企業(yè)客戶才剛剛開(kāi)始上云,而政企、運(yùn)營(yíng)商、金融、制造、能源等 2B 場(chǎng)景,恰恰是華為長(zhǎng)期深耕的領(lǐng)域。
所以從一開(kāi)始,華為云的云業(yè)務(wù)就帶著很強(qiáng)的行業(yè)屬性,關(guān)心的是怎樣把云、AI、數(shù)據(jù)和行業(yè)系統(tǒng)結(jié)合起來(lái),變成真實(shí)生產(chǎn)力
相比之下,互聯(lián)網(wǎng)大廠的基因造就了另一套打法。
他們天然擁有高頻流量場(chǎng)景、C 端應(yīng)用、內(nèi)容平臺(tái)和開(kāi)發(fā)者生態(tài)。這些會(huì)帶來(lái)海量模型調(diào)用,也會(huì)反過(guò)來(lái)推動(dòng)模型能力、推理平臺(tái)和工具鏈快速迭代。
他們的 2B 能力,很多時(shí)候也是從高頻互聯(lián)網(wǎng)場(chǎng)景、開(kāi)發(fā)者生態(tài)和大規(guī)模模型調(diào)用中外溢出來(lái)的。
如果 Token 要真正轉(zhuǎn)化為生產(chǎn)力,就必須進(jìn)入政企、傳統(tǒng)企業(yè)的業(yè)務(wù)流程,一對(duì)經(jīng)典矛盾也接踵而至:
傳統(tǒng)企業(yè)組織機(jī)構(gòu)復(fù)雜、業(yè)務(wù)系統(tǒng)復(fù)雜、手握高敏感數(shù)據(jù)、安全合規(guī)要求極高,對(duì)本地化部署、數(shù)據(jù)不出域、業(yè)務(wù)連續(xù)性都有明確訴求。但模型和算力迭代又非常快。如果企業(yè)完全自建,很容易「部署完就落后」。
這就引出了華為云另一個(gè)關(guān)鍵差異化:堅(jiān)持公有云和面向國(guó)計(jì)民生的混合云「兩條腿走路」。
RuiPath 就是一個(gè)很典型的樣本,將原本對(duì)立的「數(shù)據(jù)安全」與「先進(jìn)模型便利」統(tǒng)一起來(lái)。
在醫(yī)院端,先通過(guò)輕量化工具對(duì)原始病理切片進(jìn)行預(yù)處理,提取少量疑似腫瘤區(qū)域特征,再經(jīng)過(guò)加密后上傳云端。這樣一來(lái),原始數(shù)據(jù)和核心診療流程仍然留在醫(yī)院可控范圍內(nèi)。
在云端,華為云通過(guò)全密態(tài)、「可用不可見(jiàn)」等機(jī)制,支撐診斷推理、模型增訓(xùn)和持續(xù)迭代。云端提供的,是瑞金與華為共建的基礎(chǔ)模型能力、算力能力和工具鏈能力。
基層醫(yī)院只需要利用相當(dāng)于傳統(tǒng)訓(xùn)練約 10% 的本院小樣本數(shù)據(jù),就可以在基礎(chǔ)模型之上做本地化適配,快速得到更貼合本院病例特點(diǎn)的專屬模型。
![]()
值得一提的是,雖然云廠商都在講「全棧」,但與華為云「全棧」的「含硅量」和國(guó)產(chǎn)化率,存在天差地別
華為是做通信設(shè)備和硬件出身,它的全棧邏輯也向下扎到了最底層的物理世界,如昇騰 NPU、鯤鵬 CPU、CloudMatrix 超節(jié)點(diǎn)等硬核實(shí)體。
而且,從最底層的「一粒沙子」(芯片算力),到中間層的底層使能(如CANN 架構(gòu)),再到最上層的智能體平臺(tái),全部都是自研。用周躍峰的話說(shuō),華為云要打造不同于「萬(wàn)國(guó)牌」的「另一個(gè)算力平面」
對(duì)中國(guó)企業(yè)而言,這不只是「多了一家云廠商」,而是在主流 GPU 路線之外又多了一種算力選擇、多了一套生態(tài)選擇,也多了一條基礎(chǔ)設(shè)施路線。
開(kāi)放才能致遠(yuǎn)
除了把硅基黑土地做厚,真正讓 AI 長(zhǎng)進(jìn)千行萬(wàn)業(yè),還需要把已經(jīng)驗(yàn)證過(guò)的技術(shù)、工具鏈和行業(yè)經(jīng)驗(yàn)開(kāi)放出去,這也是 INSPIRE 創(chuàng)想者大會(huì)發(fā)布「行業(yè) AI 夢(mèng)工廠」的意義。
首批「夢(mèng)工廠」包括醫(yī)療、具身智能、科學(xué)計(jì)算、智能制造等垂直領(lǐng)域,開(kāi)放華為長(zhǎng)期積累的技術(shù)能力、工具鏈和實(shí)踐經(jīng)驗(yàn),讓行業(yè) AI 不再停留在少數(shù)標(biāo)桿項(xiàng)目里,而是進(jìn)入可復(fù)制、可共建、可持續(xù)迭代的新階段。
![]()
開(kāi)放,也貫穿在華為云的底層生態(tài)里。
從鯤鵬、昇騰,到歐拉操作系統(tǒng)、CANN 系統(tǒng),再到 CCE Volcano、ModelArts 工具鏈,以及與AgentArts 企業(yè)版內(nèi)核同源度超過(guò) 90% 的openJiuwen,華為云正在把更多能力以開(kāi)源開(kāi)放的方式交給產(chǎn)業(yè)。
周躍峰說(shuō),希望華為云在智能體時(shí)代成為一朵最開(kāi)放的云。最終,讓智能體開(kāi)發(fā)這件事變得更普惠。
![]()
任正非曾說(shuō),在方向大致正確的情況下,要先開(kāi)一槍,不能等,大膽往前走。過(guò)去多年,華為云押注行業(yè)、押注國(guó)產(chǎn)化、押注全棧能力,這條路并不輕松,也不會(huì)立刻見(jiàn)效,但也從未動(dòng)搖。
有人說(shuō),一旦認(rèn)定一件事,便全力以赴。在業(yè)內(nèi),華為的執(zhí)行力令許多競(jìng)爭(zhēng)對(duì)手忌憚。
確實(shí)。沒(méi)有一件事情可以隨隨便便成功,但是認(rèn)真干起來(lái),也不可能不成功。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.