網易首頁 > 網易號 > 正文 申請入駐

芯橋半導體張鑫:從單點智能到群體協同,芯橋如何打造具身智能的“算力工廠”

0
分享至


4月21日至22日,以“奔赴AGI 重塑未來”為主題的2026中國生成式AI大會(北京站)圓滿舉行。

這場大會集結73位產學研投嘉賓,通過1場開幕式、3場專題論壇、6場技術研討會,全景式解析AI產業的產業脈絡、創新范式、Token經濟與中國機會。

議題跨度很大,從大語言模型、多模態模型、世界模型、智能體、AI眼鏡等前沿模型與應用,到數據、芯片、存儲、通信、云服務等基礎設施。

在這場信息密度超高的大會上,芯橋(北京)半導體有限公司解決方案副總裁張鑫帶來了題為《構建感知、決策、執行一體化的智能算力工廠》的主題演講。

張鑫指出,從GTC大會黃仁勛提出的算力工廠到Agent落地元年,算力需求正從單點爆發走向群體協同。在具身智能場景下,機器人受限于電量與承載面積,無法僅靠單點算力完成任務,必須實現算力的分布式協同。

基于這一判斷,芯橋半導體推出了五位一體的智能算力架構,核心思路是算力分層部署。該架構具備兩大能力:其一,將大算力、高精度的X200芯片部署在邊緣網關或集群上,負責群體路徑規劃與長時間序列的全模態模型計算;其二,將低功耗、大顯存的S200芯片部署在機器人邊端,運行影子模型以應對斷網或異常情況。

芯橋半導體正圍繞系統級調度平臺與安全機制進行深度驗證,涵蓋內存墻優化、模型黑盒應對及無網絡環境下的本地自主執行。芯橋認為,服務端集群本質上是Token工廠,Token經濟正從一次性問答轉變為以長時間為計量單位的持續工作模式,只有當Token成本降到足夠低,推理端才會迎來真正的大爆發。

以下是演講實錄:

一、算力新戰場:從“單點智能”到“群體協同”

各位同仁、各位開發者們,大家好。很榮幸能有這樣一個機會與大家進行交流。這次我們芯橋半導體主要想和大家探討的是:構建感知、決策、執行一體化的智能算力工廠。


今年大家也看到了,在三月份的GTC大會上,黃仁勛反復提到了算力工廠,同時還提到了各種芯片的架構需要重新調整。今年是Agent的落地元年,去年底OpenClaw開始爆火,大家都在推測今年的落地到底是什么樣子。那么,今年會不會把所有的推理場景帶火?整個推理場景的硬件服務器,包括集群、各種各樣的邊緣端場景,到底該怎么用?這其實是今年大家非常關心的一個話題,我們就著這個話題進行一些討論。

我先簡單介紹一下芯橋。芯橋成立的時間其實不算短,我們有自己的研發團隊,專門針對GPU芯片進行研發設計。今年我們的重點,一個是新芯片的研發,另一個是探索更多芯片的落地場景。


在板卡這個場景上,很多企業都在買服務器、建集群,但其實還有很多場景在里面。往年我們落地了很多應用,包括視覺的CV模型、LLM(大語言模型),以及現在的多模態模型,甚至一些Agent在落地時,也都對算力提出了各種要求。

多種場景落地之后,我們發現,今年Agent火爆之后,對卡的要求,或者說對平臺和芯片的要求,也變得多樣了。因為整體需求的爆發,就會導致推理場景不再局限于語言類的模型,而是更偏向于多模態的,比如具身智能,還有一些世界模型,各種各樣的模型都會涌現出來。在不斷落地的過程中,芯片到底應該如何定位呢?今年,我們在董事會討論之后,對整體的拓展方向,以及芯片在未來設計、落地的方向,都做了深刻的思考。

其中,底層硬件和平臺化的優化一定是重中之重。因為現在大家在使用國產芯片時,還是會面臨一定的考驗。我們更希望讓用戶在使用我們的芯片時,能夠非常順滑,無論是以前使用NVIDIA芯片還是NPU芯片,切換到我們這里,甚至在異構計算時,都能達到非常絲滑的效果。


二、機器人電量有限?打破單節點算力天花板

在場景方面,今年春晚的機器人已經火得眾所周知,前兩天亦莊的機器人半程馬拉松比賽也很受關注。在火熱的同時,我們需要思考一個問題:具身智能在單節點(機器人本身)上的算力是否足夠?如果在單節點上遇到了內存墻或者通信墻,或者遇到其他阻礙,我們應該如何調整?因此,借助春晚的人形機器人和剛結束的亦莊半馬比賽這兩個熱點,我們就具身智能這個場景展開后續討論。

目前,我們有很多合作商,大家一起討論具身智能。從整體架構來看,未來可能不能只局限于單點計算。因為機器人本身的電量是有限的,其電路板的承載面積也是有限的,這意味著它在單節點(即一個機器人自身的承載范圍內)的計算能力存在上限。

大家也看到,在春晚舞臺上,宇樹、銀河等許多機器人實際上是在做群體智能,不再是一個機器人單獨完成工作,而是多個機器人協同合作。因此,必然會面臨機器人與機器人之間的協同問題。基于此,我們在與供應商討論后,提出了一個大膽的假設和一套五位一體的架構方案。該方案涵蓋了從最底層的執行層,到最上層的決策層,以及中間過渡的認知層。這一方案整合了芯橋目前所有的芯片產品,力求將各產品的性能最大化地分配和利用。


我們推測,機器人的下一個戰場,除了已經明確的單點算力提升之外,還必然面臨群體智能的升級。此時,我們考慮的就不再是單純的算力提升問題,而是算力的協同問題。我們能否將現有的服務端、邊緣端、網關端等各端的算力聯合起來使用?在服務端與單點節點之間的通信效果上,哪些模型、哪些參數、哪些變量應該存儲到何處,才能達到最優效果?我們對這些問題進行了深入討論。

三、魚群效應:X200大算力上云,S200小模型落地

我們得出的結論是,在類似“魚群效應”的場景中,更適合將大算力放在邊緣網關或直接放在算力集群中。那些長時間序列的事件模型,即持續運行、時間周期很長且需要全模態的視覺模型,應放置在X200算力集群上。而那些經過量化處理的、較小的影子模型,反而應該放在機器人的邊端。這樣一來,當出現異常情況時,邊端可以及時調用這些模型進行處理,避免出現路徑干擾、碰撞,或者因故障導致機器人停機、無法恢復、無法返回原點等問題。


我們在方案設計過程中,充分考慮了不同芯片以及不同搭配的SoC或網關端集群計算的效果,重新對架構進行了調整。

像X200這樣大算力、適合集群類終端計算的芯片,反而應該放置在邊緣網關或集群服務器端,采用高精度(如BF16、FP32)進行計算,承擔群體項目的整體路徑規劃任務,確保由上百個節點組成的群體在路徑規劃、行為規劃以及傳感器返回結果后構建下一秒事件模型的實時計算。這些任務數據量極大、精度要求極高,統一由X200芯片完成。


而S200這種邊緣端芯片,在設計上兼具低功耗和大顯存的特點。它可以滿足邊緣端對影子模型的需求:當出現異常時,邊緣端能夠自主進行足夠長時間序列的世界模型計算,保證機器人在下一秒的行為不會與原有規則或軌跡方案產生過大偏差。同時,大顯存能夠存儲足夠的中間變量,確保機器人有充足的時間完成當前工作并歸位。因此,這款芯片非常適合在邊緣端為機器人提供強大的算力以及足夠大的顯存。


當前,無論是邊緣端還是服務端,內存墻的問題已經非常突出。最近國內外許多論文都在探討同一個問題:如何處理長上下文,才能在最有效的存儲空間內計算出更多高準確率的數據?此外,在解決了內存墻問題之后,能否通過通信手段將更多的顯存整合起來,將單面積很小的顯存匯聚成一個大的顯存池?這也是為了解決通過帶寬來緩解顯存瓶頸的問題。但在邊緣端的單點計算場景中,最直接的方法仍然是擴大顯存,其好處是顯而易見的。

系統層面,我們與眾多供應商、具身智能企業以及算力中心不斷進行磨合與調整。實際上,我們需要一個宏觀調控的平臺,這個平臺既要能夠進行精細調控,也要能夠進行宏觀調控,包括算力分配、不同模型的切換、不同數據的交換以及變量存儲位置的協調,才能達到最優的占比,避免顯存和帶寬的浪費。


再往下到具身智能層面,包括某些傳感器的控制,一直到微觀層面機械手的靈活調整。這些調整有的需要CPU,有的需要GPU,許多中間變量需要共存。因此,整個板間設計和資源調度需要一個平臺進行合理規劃和任務協調。

四、極致安全:斷網環境下的“邊緣自治”

此外,安全問題始終是一個無法回避的話題。從去年的安全會議開始,大家就在討論模型的黑盒問題:它到底是否安全?它內部到底進行了怎樣的計算?我們現在仍然不得而知。直到今天,我們仍然不清楚Transformer架構內部的詳細計算過程,它依舊是黑盒。雖然我們可以通過推理來判斷它給出的結果好壞,但這屬于安全問題的范疇。

例如,在MoE模型出現之后,Anthropic發表了一篇論文討論了這樣的問題:模型給出的結果,究竟是經過思考之后得出的,還是先有了結果再進行思考?這是一個非常底層的安全問題。機器人也同樣存在類似的問題。我們看到它執行的結果與我們的預期可能可以進行調試,但如果加入了真正的思考過程,它給出的結果究竟是我們想要的結果,還是它想讓我們看到的結果?

另外,在工廠這種需要精細化工作的場景中,如果出現斷網或斷電的情況,雖然大家都有UPS(不間斷電源),但難免會有部分區域無法啟動。如果出現斷網,盡管現在許多工廠都在做5G或WiFi覆蓋,但仍然存在很多網絡盲區,例如倉儲區域,或者像某些保密性極高的場所,其中信號干擾非常強。機器人進入這類場景后,可能會面臨斷網。那么,它一旦踏入這樣的區域,是否還能繼續執行原有任務?這一點非常關鍵。在沒有中心調度的情況下,本地設備是否能夠依靠本地的影子模型以及傳感器、CV等多種模型的配合,仍然正確地完成任務?

針對這些問題,我們在芯片層面進行了嚴格的探討,并且正在與供應商進行實時論證,以確保擁有足夠的算力、優質的優化算子庫,以及重新定義的芯片外設方案,從而推動機器人在真正的異常情況下,或者在單點無網絡的計算環境下,依然能夠優質地執行服務端分配的任務,并安全地返回有網絡的環境或原始出發點。整個設計方案仍然圍繞我們五位一體的架構展開,并與不同場景和供應商進行了相互討論與驗證。

實際上,從今年開始,芯片不僅提供算力,也構成了Agent進化的基因。我們的定位與年初GTC上討論的觀點一致:服務端集群本質上就是Token的工廠。Token工廠改變了整個推理的商業價值,過去的推理是一次性的,我提出一個問題,它給出一個結果,再問一個,再給一個,這是一個一個、逐步完成的過程。

但今后將不再是這種模式,而是變成一個長時間序列的、持續且不會停止的工作。因此,整個Token經濟將轉變為以長時間為計量單位的經濟,而不是一次性販賣結果。我們在探討這個問題,以及我們自身芯片產品在未來定位和未來視角時,不再拘泥于現有的訓練模式、推理模式、ChatBot或聊天框,而是著眼于整個未來的Token世界和Token經濟的運作方式。我們需要考慮,整個單點以及整個生態架構應該如何運作,才能使Token經濟更具價值,讓我們的芯片幫助Token經濟實現最大利益。


正如上午有嘉賓提到的:什么時候Token能夠降到最低成本,什么時候能夠讓更多的OpenClaw用到非常便宜的Token,推理端才會迎來真正的大爆發。

以上是我的演講內容,謝謝大家。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
廣東丟G1誰注意賽后?杜鋒憤怒離場被郭艾倫調侃,朱芳雨徐昕握手

廣東丟G1誰注意賽后?杜鋒憤怒離場被郭艾倫調侃,朱芳雨徐昕握手

籃球資訊達人
2026-04-28 22:01:58
大數據分析,在中國,找個身高1米7年入20萬的老公,到底有多難?

大數據分析,在中國,找個身高1米7年入20萬的老公,到底有多難?

深度報
2026-04-18 23:37:27
蔡少芬山姆購物,打扮超酷又瘦又高,買滿三購物車太壕了

蔡少芬山姆購物,打扮超酷又瘦又高,買滿三購物車太壕了

小武侃風云
2026-04-26 18:52:45
太可怕了!境外勢力贊助“躺平網紅”,什么是“躺平網紅”

太可怕了!境外勢力贊助“躺平網紅”,什么是“躺平網紅”

西樓知趣雜談
2026-04-28 21:44:28
無惡意,真心覺得陳都靈瘦的平淡無味!

無惡意,真心覺得陳都靈瘦的平淡無味!

飛娛日記
2026-04-29 06:30:22
牛仔褲的誘惑:它不約束我,它托住我

牛仔褲的誘惑:它不約束我,它托住我

疾跑的小蝸牛
2026-04-28 23:03:43
魯超夏雨荷,被群嘲了

魯超夏雨荷,被群嘲了

大張的自留地
2026-04-29 10:17:47
114-95!文班17+14+6封蓋,馬刺輕取開拓者,4-1挺進西部半決賽

114-95!文班17+14+6封蓋,馬刺輕取開拓者,4-1挺進西部半決賽

全景體育V
2026-04-29 12:25:42
美媒:以色列“三大支柱”難承戰爭之重

美媒:以色列“三大支柱”難承戰爭之重

參考消息
2026-04-28 15:20:11
附加賽球隊要逆天!東部第一活塞顏面盡失,史上最強黑八將至!

附加賽球隊要逆天!東部第一活塞顏面盡失,史上最強黑八將至!

田先生籃球
2026-04-28 12:51:24
19歲中國女孩被困緬甸,交20萬贖金園區仍未放人,同園區脫困者視頻記錄驚魂逃亡路

19歲中國女孩被困緬甸,交20萬贖金園區仍未放人,同園區脫困者視頻記錄驚魂逃亡路

界面新聞
2026-04-28 23:54:13
刑事訴訟法“上訴不加刑”,為何田永明從死緩到死立執?

刑事訴訟法“上訴不加刑”,為何田永明從死緩到死立執?

法律學堂
2026-04-29 00:08:14
陳思誠找小21歲阮巨不是瞎了眼:他比誰都精,要的是情緒穩定

陳思誠找小21歲阮巨不是瞎了眼:他比誰都精,要的是情緒穩定

小貓娛樂叭叭
2026-04-27 20:42:52
至善道人:日本已被逼入絕境,,“亞太戰爭”或將隨時爆發

至善道人:日本已被逼入絕境,,“亞太戰爭”或將隨時爆發

黑翼天使
2026-04-28 21:31:41
巴黎圣日耳曼5-4拜仁,賽后評分出爐:不是登貝萊第1,拜仁9號第1

巴黎圣日耳曼5-4拜仁,賽后評分出爐:不是登貝萊第1,拜仁9號第1

側身凌空斬
2026-04-29 04:58:07
黎巴嫩女孩到沈陽留學,和廣東小伙談戀愛,直言自己是半個中國人

黎巴嫩女孩到沈陽留學,和廣東小伙談戀愛,直言自己是半個中國人

不寫散文詩
2026-04-22 16:12:04
當不成總統了?馬克龍將卸任,臨走前表態,中美俄都是歐洲的敵人

當不成總統了?馬克龍將卸任,臨走前表態,中美俄都是歐洲的敵人

阿離家居
2026-04-29 05:42:35
醫生發現:天天走路鍛煉的冠心病人,不用幾個月,身體迎來5個變化

醫生發現:天天走路鍛煉的冠心病人,不用幾個月,身體迎來5個變化

鬼菜生活
2026-04-29 10:33:42
鐘漢良搭檔的8個女演員cp感排名,朱珠第3,李小冉第2,第1是她

鐘漢良搭檔的8個女演員cp感排名,朱珠第3,李小冉第2,第1是她

娛君墜星河
2026-04-27 18:10:09
055發射鷹擊20視頻,讓外媒嚇破膽:這是對美日菲軍演的回應!

055發射鷹擊20視頻,讓外媒嚇破膽:這是對美日菲軍演的回應!

52赫茲實驗室
2026-04-28 14:53:56
2026-04-29 13:11:00
智東西 incentive-icons
智東西
智東西,AI產業新媒體,專注報道人工智能的前沿技術發展,和技術應用帶來的千行百業產業變革。
11714文章數 117054關注度
往期回顧 全部

科技要聞

夭折的造富神話,逼著中國AI回去賺"慢錢"

頭條要聞

男子強奸大嫂又殺人被執行死刑 大哥:談不上高興難過

頭條要聞

男子強奸大嫂又殺人被執行死刑 大哥:談不上高興難過

體育要聞

巴黎5-4拜仁夜:身價1.55億的“足壇笑話”,成了最硬的底牌

娛樂要聞

單依純演唱會再唱“區區三萬天”宣戰

財經要聞

多地藥店違規串換商品套刷醫保揭秘

汽車要聞

配32寸升降屏 新款別克世紀CENTURY上市53.99萬起

態度原創

教育
時尚
數碼
游戲
公開課

教育要聞

最新!房山區義務教育入學政策出爐

劉浩存:明媚中綻放

數碼要聞

超頻三DV360幻翼水冷首發1399元:配6.67寸2K曲面屏幕

《黑旗RE》完整地圖已出:原版DLC區域盡收其中!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版