![]()
老夏,某大型制造企業(yè)CIO。
這兩天,他恨不得把自己蒸餾了,變成skill,把那些糟心的需求扛起來。
這事兒的起因,是他們集團剛上線了三個Agent智能體。
按老夏原話說,“沒想到招回來仨祖宗,天天供著”。
![]()
智能體上線沒跑兩天,老夏發(fā)現(xiàn)問題了↓
這幫Agent像極了人類員工:為了完成 KPI,會無所不用其極地索取資源,
和之前傳統(tǒng)應用完全不是一個物種。
說白了,是智能體的行為具備一定的不可預測性。
他們發(fā)起瘋來狂燒tokens,
而且絕不默默扛壓,這些壓力會瞬間甩鍋到底層。
![]()
它會逼MaaS層做推理優(yōu)化,逼IaaS層做算力擴容。
只要Agent跑起來,曾經(jīng)界限分明IaaS、PaaS、SaaS邊界會被瞬間打穿。
![]()
而且,Agent運行起來,即便不發(fā)瘋,也是騷操作不斷↓
長上下文、多輪交互、工具調(diào)用、復雜任務拆解…
不止吃 Tokens,底層算存網(wǎng)資源必須像水一樣,隨Agent的狀態(tài)精準供給。
![]()
老夏發(fā)現(xiàn),曾經(jīng)的需求和采購邏輯失效了!
現(xiàn)在想要伺候好這幾個祖宗,
不是多買幾臺云主機、多接幾個API就能解決的
![]()
那個年代,需求多簡單啊,缺啥買啥
缺算力,就買IaaS。計算、網(wǎng)絡、存儲,該擴就擴
缺平臺,就上PaaS。框架、工具、開發(fā)環(huán)境,該上就上
缺應用,就找SaaS。業(yè)務部門要什么,IT部門就訂什么
![]()
而現(xiàn)在,Agent所需資源是流動的邏輯,還不是以前那種云計算講的 Scale-out 彈性伸縮。
老夏想要的是那種能感知全局、動態(tài)調(diào)度、自動協(xié)同的AI底座。
這個AI底座必須包羅萬象:芯片、云、大模型、智能體、AI工具、開發(fā)平臺、算力調(diào)度、推理優(yōu)化...
![]()
有人說:扯半天,老夏要的不就是AI全棧能力嘛,有啥稀缺的?
![]()
但是,老夏不這么認為。
不少廠商的東西,雖然都號稱全棧,但其實就是東拼西湊攢起來的「草臺班子」。
![]()
其實,老夏的這種需求是典型的「既要又要還要」:
?既要架構(gòu)像水一樣隨形就勢
?又要Tokens極致便宜
?還要智能體能從Demo里走出來,進生產(chǎn)線搬磚。
![]()
老夏被這種【新需求】折磨了很久,他都恨不得把自己蒸餾了“鉆”到 IT 系統(tǒng)里搞定這些資源。
當然,這種蒸餾自己只停留在段子里,老夏知道不可能…
直到昨天,他受邀參加「Create2026百度AI開發(fā)者大會」,竟然……找到了答案。
![]()
一上來,百度掌門人李彥宏就甩出了王炸↓
李彥宏提出一個DAA(日活智能體數(shù))概念,認為Token只代表消耗,需要用新的尺度來更多關注產(chǎn)出。
另外還有自我進化,智能體時代,AI在進化,人和組織的協(xié)同也會基于AI發(fā)生變化。
![]()
那怎樣才能提升效率,讓每一個Token都花得值,同時持續(xù)進化呢?
百度現(xiàn)場也公布了一個解決方案,那就是百度智能云全面升級的【新全棧AI云】
![]()
新全棧AI云,讓【芯云模體】互相協(xié)同,成為一個效率更高的AI新底座!
這是像水一樣的自進化底座,可以流動、反饋、重組,支撐不同形態(tài)的Agent。
![]()
接下來的論壇內(nèi)容,老夏又get到了一些新東西。
為了支撐這套“新全棧”,百度智能云拿出了兩個層面的看家本領↓
![]()
作為CIO,老夏一下子就看出了「技術門道」
一、底層升級:AI Infra智能體基礎設施
第①項升級:智能體的推理優(yōu)化方案,性能提升1-3倍
這個方案,做到老夏心坎上了。
Agent跑起來后,如果是長鏈路、大任務推理,最常見的問題是慢和貴,Token成本極易失控。
![]()
百度的做法是把KV Cache從顯存、內(nèi)存到SSD做分層池化。
上下文復用率超90%,這意味著智能體在多輪對話中,重復計算大量減少。
![]()
再配合AFD、PD分離與異步調(diào)度(Prefill節(jié)點、Decode節(jié)點、Cache系統(tǒng)之間),徹底解決長鏈路推理的延遲瓶頸。
至此,推理性能直接飆升1-3倍。
第②項升級:Agentic強化學習優(yōu)化,學習效率提升1倍+
Agent發(fā)布后,不能一成不變,不能成為一個死程序。
![]()
這就涉及到當下最前沿的技術——Agentic強化學習。
百度這次直接給Agent配齊了頂級教室和教材:
教室,就是百度高并發(fā)沙箱,即訓練環(huán)境。
![]()
教材,就是百度提供的全模態(tài)訓練框架,教智能體讀文、看圖、看視頻、讀代碼,甚至像真人一樣操作軟件界面。
![]()
老夏感嘆,“誰能越短時間內(nèi),把智能體在真實反饋中訓練好,誰才真正有資格談智能體落地。”
第③項升級:百舸AI計算平臺6.0,升級為智能工廠
升級后的百舸6.0,相當于給用戶造了一座智能工廠,不再是只提供算力的平臺。
工廠里有四個車間,串聯(lián)起來幫用戶組成一條AI生產(chǎn)線。
![]()
老夏點贊:“正好解決了Agentic AI 和 Physical AI 的規(guī)模化生產(chǎn)的痛點,這就是百舸6.0的價值。”
第④項目升級:發(fā)布全模態(tài)訓練框架LoongForge
LoongForge像一座多模態(tài)訓練樞紐↓
上接不同的模型場景:LLM、VLM、VLA、Diffusion;
下接NVIDIA GPU 和昆侖芯 XPU;
中間用一套代碼打通多模型、多硬件。
![]()
老夏被一組實測數(shù)據(jù)驚到了↓
多模態(tài)訓練加速15%~ 45%。更夸張的事,能在5000多張昆侖芯P800大集群上,跑出90%以上的線性擴展效率。
第⑤項升級:擴建超大集群,吉瓦級AI數(shù)據(jù)中心
百度這次把集群規(guī)模做成了算力航母級。
吉瓦級電力容量,對應十萬級AI加速卡的超大規(guī)模算力集群。
![]()
在現(xiàn)場,老夏還看到了百度天池超節(jié)點,相當震撼!
![]()
二、Agent Infra智能體基礎設施
第①項升級:Harness Engineering駕馭工程
一聽這個,老夏就想起自己公司那三坨“祖宗”。
那簡直就是三個智能體煙囪。
![]()
百度Agent Harness,就要推倒智能體煙囪。
它把長上下文、記憶、子Agent調(diào)度、評估、工具調(diào)用和skills這些共性能力,先做成一套可復用的工程化底座。
![]()
得益于這些能力,做同樣的任務,需要的對話輪次會更少,相比OpenClaw,可以減少23%的token消耗。
Agent Harness讓企業(yè)真正規(guī)模化開發(fā)Agent。
第②項升級:從MaaS升級為Token Factory詞元工廠
在百度智能云上,能調(diào)用150+個SOTA模型,調(diào)用速度比行業(yè)平均水平快25%,秘訣在于Agent-first理念↓
針對長鏈推理場景,通過Cache管理僅計算新增Token,減少百萬級上下文的重復加載。
全局推理資源調(diào)度,大幅提升復雜任務下的Token效能。
![]()
此外,在企業(yè)里,Demo和生產(chǎn)環(huán)境是兩個世界。
新升級的Agent Runtime它提供穩(wěn)定、安全、可觀測的運行環(huán)境,讓智能體真正跑進企業(yè)生產(chǎn)環(huán)境,持續(xù)執(zhí)行任務、持續(xù)產(chǎn)生結(jié)果。
![]()
產(chǎn)品看起來不錯,那實戰(zhàn)怎么樣呢?
老夏在現(xiàn)場看到了一大波頂級客戶的背書——
![]()
![]()
80%央企的選擇
![]()
![]()
100%中國頭部車企的選擇
![]()
800家+金融機構(gòu)的選擇
![]()
1000家+AI硬件廠商的選擇
![]()
頂級具身智能公司的選擇
![]()
![]()
“真香!”
這是老夏從會場出來腦海里唯一的感嘆,百度新全棧這波進化,是在「整頓Agent職場」啊。
不怕Agent騷操作,就怕你沒有自進化的新底座!
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.