![]()
作者 | 胡新周
在商業史的長河中,每一次底層技術的躍遷,都會倒逼整個工業體系的重構。
19世紀末,第一輛汽車駛上街頭,徹底重塑了鋼鐵、橡膠與精密制造的供應鏈邏輯。2007年,第一代iPhone問世,將原本分散的通信、娛樂與計算能力整合成了一個高度協同的“智能終端”。
今天,AI產業正站在一個相似的十字路口。
過去兩年,大模型的爆發讓市場一度陷入對算力規模與模型參數的盲目追逐。但當AI從實驗性的嘗鮮走向核心業務的深水區,人們發現,單純的技術堆砌并未帶來預期的生產力躍遷。相反,芯片廠商賣算力、云廠商賣資源、模型公司賣接口的“層級供給”模式,顯得笨重而低效,讓大量AI項目陷入了“拼積木”式的集成窘境。
這種焦慮,催生了市場對確定性的渴望,也讓企業需求發生了本質變化:它們需要的不再是一堆零散的“算力拼圖”,而是高活躍、高價值、規模化的智能體應用。
而在智能體時代,決定應用能否規模化落地的關鍵,已經從單純的算力供給轉向了“Token效率”。當智能體成為業務的核心載體,每一次調用的成本、響應速度與準確性,直接影響了商業模式的效率。
由此,云廠商的核心競爭力也正在發生根本性轉變:云服務必須被重新定義,成為一套能支撐智能體大規模運行、持續進化、安全可控,且具備極致Token效率的全棧AI基礎設施。
5月13日,百度智能云在以“萬物一體”為主題的百度Create大會上提出的“新全棧AI云”,正是對這一時代命題的回應。
會上,百度創始人李彥宏首次提出AI時代的“度量衡”——日活智能體數(DAA)。
在他看來,Token不一定代表終局,它只代表成本不代表收益,衡量的是投入而非產出;DAA則大致對應移動互聯網時代通用的度量衡日活用戶數(DAU)。“衡量一個平臺和生態的繁榮,更應該看的是DAA這個指標,關注有多少Agent在給人類干活,并交付結果。”李彥宏還預測,未來全球日活智能體數(DAA)可能超過100億。
![]()
這是針對Token效率的另一個解法,而百度也準備了自己的答案。當天,百度智能云宣布面向大規模智能體全面升級為新全棧AI云,打造單位Token的智能水平更好的Agent Infra和每瓦性能更強、性價比更高的 AI Infra。
與傳統的“組裝式”云架構不同,“新全棧”強調芯片、框架、模型與應用在指令集級別的原生對齊,旨在消除跨層級調用的摩擦損耗,為企業構建一個具備長期記憶、工具調用能力與安全圍欄的“智能體基礎設施”(Agent Infra)。
這并非一次簡單的產品升級,而是一場深刻的范式轉移。
▌新需求催發新供給
在承接全球各地海量訂單的“世界超市”義烏,每一個想把AI嵌入生產銷售的廠長都不得不花大量時間進行“粘合”:針對不同環節的問題分別訓練模型,再把識別規則、處置流程逐個配置到每個攝像頭上。
這是AI 1.0時代的一個典型縮影。
傳統云服務采用高度分層的架構:芯片層負責計算,框架層負責調度,模型層負責推理,應用層負責交互。這導致在很長一段時間,企業對AI云的認知和需求是碎片化的,就像工業時代的零件采購——從不同的供應商那里購買服務器、租用存儲空間、調用API接口,自己組裝、調試,最終拼湊出一個能跑的系統。
但在智能體成為主流的AI 2.0時代,這種“拼圖”失效了。
與傳統AI應用不同,智能體是整合式的,它能基于簡單的自然語言指令,自主拆解并執行綜合性的復雜需求。這種變革極大地降低了業務端的摩擦成本、提升了效率,但也對后端服務提出了前所未有的高要求:一個能支撐其大規模并發、持續進化且安全可控的全棧AI基礎設施。
當前仍停留在“組件售賣”階段、零散式供給的云服務,與智能體的系統性需求之間,存在著巨大的錯位。
就像一家汽車制造商,從A公司買引擎,從B公司買變速箱,從C公司買底盤,再找D公司來調校懸掛系統。即便每一個零件都是頂級的,整輛車的性能也往往難以達到極致,因為缺乏底層的系統性協同。
在AI領域,這種協同缺失直接表現為算力的浪費和響應速度的遲滯。
智能體在執行任務時,需要在模型、記憶庫、工具鏈之間進行成千上萬次的跳轉。如果底層基礎設施不能實現“芯-模-端”的無縫打通,每一層之間都有兼容損耗、通信延遲和優化瓶頸,每一次跳轉都是一次性能的磨損,導致協同效率低下、資產沉淀困難、運維成本高昂。
就像讓F1賽車手開拖拉機,哪怕“大腦”再聰明,也很難跑得快。
換句話說,當AI深入各種復雜的應用場景,企業需求從技術單點突破進化為系統重構。新的需求催發新的供給,而新供給背后需要的是一種全新的能力——從層級堆砌轉向全棧協同。
這正是百度智能云提出“新全棧”的邏輯起點:不是簡單的資源集合,而是一個經過深度優化的“智能有機體”。
![]()
過去,全棧能力是AI云廠商的標配,但往往呈現為“分層割裂”的狀態,芯片研發、云底座、訓練模型、智能體開發,各層之間存在明顯的邊界。
“新全棧”徹底打破了這種孤島模式和層級壁壘,將復雜的工程細節封裝在底層,讓AI像一個“智能器官”一樣無縫嵌入企業的業務場景。企業只需要關注業務邏輯本身,就能實現智能體的快速迭代和規模化部署。
比如,通過百度智能云最新發布的一見Claw和智能營銷Hogee,每一個義烏商家都可以擁有專屬的“AI廠長”和“AI店長”。
AI廠長負責安全生產、質量管理、人員管理等,能獨立完成現場感知、判斷、干預、匯報;AI店長則不光能熟練使用多種語言承擔客服、導購工作,還能幫商家復盤銷售數據,結合庫存給出調貨、促銷建議,進行訂單的全流程管理。
再比如,在國家電網的巡檢領域,傳統AI識別準確率只有五六成,一線人員要從大量無效警告中篩查真實缺陷,費時又費力。百度智能云用智能體重新設計了這個流程:小模型在現場初盤,大模型在云端復判,將巡視時間從2.5小時壓縮到了45分鐘,而且準確率提升到了80%以上。
而在必須跨過數據、模型、本體這三座大山的具身智能賽道,百度智能云提供從算力、平臺工具鏈、數據服務、語音交互、安全等的全棧能力,且即將推出“規模化訓練-評測-反饋”的閉環系統,為北京人形、宇樹等具身智能企業打造全模態、全鏈路的模型開發工具鏈。
這也是為什么,在具身智能AI云市場,百度智能云的份額超過第二、第三名之和。
這些案例足以表明,當前企業需要的不再是孤立的資源,而是一套安全可控、快速迭代的系統性底座,讓AI能力從“實驗室demo”真正轉化為“生產線產能”。
新全棧的本質,就是為企業打造這樣一套完整的“數字神經系統”。
▌“大腦”“心臟”與“神經”的完美協同
如果說大模型是AI的大腦,Agent Infra(智能體基礎設施)就是遍布全身的“神經系統”,負責感知、記憶和協調動作。
百度Create大會公布了Agent Infra的兩大升級:
首先,原有的“MaaS模型服務”已升級為“Token Factory詞元工廠”。以Agent-first理念重構產品架構,盡可能減少token重復計算,推理生成速度較市場水平提升約25%。支持文心、DeepSeek、GLM、MiniMax等國產主流模型的調用,提供更具性價比的token服務。
其次,宣布推出“Harness Engineering駕馭工程”,覆蓋長上下文管理、持久記憶、工具調用、子智能體調度、評估反饋及Runtime等能力模塊,并對各模塊進行深度協同優化,在使用瀏覽器、Office等工具來處理辦公場景上的任務時,成功率可以達到95%。
得益于更優的上下文管理,做同樣的任務,需要的對話輪次會更少,相比OpenClaw,可以減少23%的token消耗。
這兩項升級之后,每一次Token消耗,都轉化成更高的業務價值。
而在AI Infra(人工智能基礎設施)層面,作為負責泵血的“心臟”,百度智能云在模型訓推、集群和數據中心建設等層面實現突破性進展,可以提供性能更強、更具性價比的AI算力服務。
![]()
在推理和訓練層面,通過對顯存、內存到SSD的分層池化架構,使KV Cache命中率超過90%,達到業界最高水平。另外,結合AFD分離、PD分離、緩存調度等優化方案,長鏈路Agent推理性能較主流開源社區引擎提升3倍。通過提供全模態統一訓練框架,讓訓練效率領先社區1倍以上,且可以100毫秒內拉起大量沙箱環境,提升強化學習的采樣效率,將Agentic模型強化學習效率提升了1倍以上。
在支撐訓推的算力硬件方面,目前昆侖芯P800已完成規模化驗證,2025年至今已交付多個萬卡集群。在昆侖芯全國產集群上,已成功完成對文心5.1重要版本的訓練,整個集群的有效訓練率達到97%,萬卡規模集群線性擴展度超過 85%,已經可以滿足前沿大模型大規模訓練對計算精度、算子穩定性、框架適配和長周期運行的要求。
此外,基于昆侖芯的天池256卡超節點已經在上個月點亮,將于6月正式上市,吞吐性能較上一代提升25%,并完成包含文心、DeepSeek、GLM、MiniMax等主流模型的適配,推理效率提升50%,網絡架構升級至HPN5.0,端到端時延優化50%,支持按需搭建數十萬卡乃至百萬卡超大集群。
Create大會當天,百度智能云也公布了吉瓦級AIDC升級,通過"網絡向心布局"設計理念,讓計算與網絡距離最短,最大限度提升計算效率,規模化落地風液兼容架構,讓數據中心的整體建設周期縮短約30%。
新全棧的核心競爭力,不在于單一組件的強大,而在于內部深度耦合帶來的系統性優勢。
通過自研芯片、框架、模型、應用的四層全棧打通,百度智能云消除了跨層級調用的摩擦,實現了性能與成本的最優解。就像一個人的大腦直接控制肌肉,無需經過復雜的中間環節,反應速度更快,能量損耗更低。
這種供給方式的進化,讓AI云廠商能夠以更低的門檻、更高的迭代速度,去適配從工業檢測到創意寫作、從自動駕駛到金融風控的萬千場景。它不再是讓客戶去適應技術層級,而是讓整套全棧能力像一個“智能器官”一樣,自動長入客戶的業務場景中。
在這種一體化架構下,AI不再是需要持續投入巨額費用的成本中心,而是將每一次Token的消耗、每一個智能體的運行,都沉淀為可復用的數字資產。隨著使用時間的推移,這些資產會不斷增值,形成企業的核心競爭力。
在 AI 2.0時代,誰能讓“大腦”“心臟”與“神經”完美協同,能就打造出真正具有生命力的“數字員工”。
▌為什么是百度?
在AI 2.0的浪潮中,無數云廠商都在談論“全棧”,但真正能兌現這一承諾的寥寥無幾。百度智能云之所以能成為這場范式轉移的領跑者,背后是十數年的長期沉淀。
早在2010年,百度便開始布局深度學習,遠早于本輪大模型熱潮。2016年,李彥宏提出“All in AI”戰略,兩年后昆侖芯正式量產。2023年,隨著大模型爆發,百度進一步確立“AI原生”的方向。這條清晰的時間線,見證了從技術探索到產業落地的完整閉環。
長達十余年的持續投入,使得百度在算法、算力、數據等核心要素上積累了深厚的復利。即使放到全球來看,在芯片(昆侖芯)、云(新全棧AI云)、模型(文心)、應用(智能體)這四個層面均擁有核心自研技術的公司也十分少見。
與集成開源模型、采購通用芯片、快速搭建平臺的“捷徑”相比,這無疑是一條更艱難、但更堅實的道路。
![]()
今天的“新全棧AI云”,正是百度這十年來深度布局帶來的敏銳“嗅覺”,從而察覺到智能體時代需求與供給的轉變。它不是單一技術的突破,而是上述四層能力在長期磨合后“身心合一”的系統性爆發,也是百度在AI時代難以復制的生態位。
更重要的是,“新全棧AI云”正在重塑云服務的價值邏輯——從賣資源轉向賣能力,成為高效生產更強智能體的通用底座。
通過極致的工程優化提升Token效能,讓每一瓦電力都轉化為更精準的推理與更低的成本,無論是企業構建復雜的工業智能體,還是獨立開發者打造個人助理,都能依托同一套基礎設施,實現從“租算力”到“養數字員工”、從“一次性交付”到“資產沉淀”的跨越。
這種轉變,使得百度智能云能夠從低頻的資源租賃,轉向高頻、高粘性、普惠的智能進化服務。
這意味著,“新全棧”不僅僅是技術的堆疊,更是一種服務理念和開發范式的重構。
到目前為止,百度智能云已經在超過100個場景落地了智能體,支持超2000萬輛L2級輔助駕駛新車交付,接入500萬臺智能家電,服務全球Top 10手機廠商、超1000家AI硬件廠商和80%的央企,在工業制造、智慧能源、交通物流、醫藥醫療、金融等行業持續深耕。
在這些龐大的產業版圖之外,百度智能云的AI基礎設施也正在悄然重塑小微企業主的生產力邊界,賦能無數個“超級個體”的崛起。
通過AI原生應用開發平臺秒噠,用戶無需編寫復雜代碼,用自然語言描述和拖拽組件等方式,即可構建自己的AI智能體應用。從獨立咨詢師打造的自動化研報助手、設計師構建的多模態創作流,到把貨賣到世界各地的義烏小微商家,智能體正在成為個體的“數字分身”,讓他們以一人之力兌現以往需要一個團隊才能完成的交付價值。
這種“事實標準”一旦形成,將產生很強的網絡效應、增加遷移成本。
據沙利文報告,百度智能云在中國自研GPU云市場占據40.4%的份額,排名第一。在國際權威機構Forrester的評估中,百度智能云在產品能力維度得分領先,戰略布局獲得滿分評價。
在AI 2.0時代的競爭中,誰定義了Agent的開發標準、記憶格式和安全規范,誰就掌握了下一代操作系統的入口,甚至有機會成為中國AI時代的Windows和Android。
▌結語
短期的技術熱點層出不窮,但真正的贏家,往往是那些堅持長期主義、深耕底層技術的公司。
百度智能云的新全棧戰略,并非一時的營銷口號,而是十年技術積累的必然結果:通過全棧自研消除層級間的摩擦,通過生態沉淀構建了難以復制的壁壘,通過戰略升維重新定義云服務的價值。
它打破了算力、模型、應用之間的傳統邊界,讓智能體像“流動的邏輯”一樣,無縫融入企業的業務流程。
在AI 2.0時代,技術將逐漸隱形,而智能將變得無處不在。百度試圖繪制的“萬物一體”產業智能化途徑中,每一家企業都將擁有自己的“智能中樞”,每一次決策都將基于全局數據的實時洞察,每一次創新都將得益于系統協同的高效賦能。
這不僅是技術的勝利,也是AI從試水走向深耕的必然歸宿。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.