![]()
2026年4月8日, SambaNova今日宣布與英特爾達(dá)成新一階段合作協(xié)議,推出一款異構(gòu)硬件解決方案。該方案將用于預(yù)填充(Prefill)的圖形處理器(GPU)、兼作主機(jī)與“行動(dòng)”CPU的英特爾Xeon? 6處理器,以及用于解碼(Decode)的SambaNova可重構(gòu)數(shù)據(jù)流單元(RDU)三者有機(jī)結(jié)合,為最具挑戰(zhàn)性的Agentic AI應(yīng)用提供高端推理服務(wù)。
小編注:SambaNova成立于2017年,總部位于加利福尼亞州圣何塞。該公司提供芯片、系統(tǒng)和云服務(wù)等,是一代AI基礎(chǔ)設(shè)施提供商,致力于為全球企業(yè)、NeoCloud、AI實(shí)驗(yàn)室和服務(wù)提供商以及AI項(xiàng)目提供高效的AI推理,部署性能卓越的模型,降低總擁有成本。
![]()
目前,Agentic AI已從演示階段邁入實(shí)際生產(chǎn)部署。編碼代理能夠編譯并運(yùn)行代碼、調(diào)用工具與API、訪問數(shù)據(jù)庫并協(xié)調(diào)復(fù)雜工作流,所有這些操作均依賴于快速、低延遲的大模型推理。在此過程中,GPU-only架構(gòu)的局限性日益凸顯:GPU雖擅長處理預(yù)填充階段,但CPU及專用推理加速器已成為決定真實(shí)世界Agentic工作負(fù)載執(zhí)行速度、可擴(kuò)展性及生產(chǎn)優(yōu)化效率的關(guān)鍵因素。
在此背景下,SambaNova與英特爾通過聯(lián)合研發(fā)發(fā)現(xiàn),最優(yōu)方案為:以GPU啟動(dòng)任務(wù),由英特爾Xeon? 6處理器執(zhí)行核心工作,再由SambaNova RDU快速完成解碼,從而顯著提升整體效率。該方案以英特爾Xeon 6處理器和SambaNova RDU為核心架構(gòu)。
![]()
SN50 RDU專為重塑推理的“tokenomics”(令牌經(jīng)濟(jì)學(xué))而設(shè)計(jì),能夠?yàn)榇笮驼Z言模型提供高吞吐量、低延遲的解碼能力;而Xeon? 6處理器則憑借卓越的內(nèi)存帶寬、豐富的PCIe通道密度以及片上加速器,為整個(gè)系統(tǒng)提供強(qiáng)大支撐。
在新架構(gòu)中,GPU負(fù)責(zé)高度并行的預(yù)填充階段,高效地將長提示轉(zhuǎn)換為鍵值緩存。SambaNova RDU與Xeon? 6協(xié)同工作,作為專用的高吞吐量、低延遲解碼加速層,確保CPU完成任務(wù)編排后,快速高效地生成輸出token。Xeon 6處理器擔(dān)任主機(jī)CPU和系統(tǒng)控制,負(fù)責(zé)Agentic任務(wù)協(xié)調(diào)、工作負(fù)載分配、工具與API執(zhí)行以及系統(tǒng)級行為控制,同時(shí)作為“行動(dòng)”CPU,承擔(dān)代碼編譯、執(zhí)行及結(jié)果驗(yàn)證等職責(zé)。
![]()
根據(jù)SambaNova的測試數(shù)據(jù),Xeon 6處理器在LLVM編譯時(shí)間上比基于Arm的服務(wù)器CPU快50%以上,在向量數(shù)據(jù)庫性能上比現(xiàn)有x86競品快高達(dá)70%。這些性能提升顯著加速了端到端的編碼代理工作流,幫助開發(fā)者更快地將創(chuàng)意轉(zhuǎn)化為可投入生產(chǎn)的智能代理。
綜上所述,此次公告標(biāo)志著雙方從合作伙伴關(guān)系邁向大規(guī)模商業(yè)部署,彰顯了對技術(shù)的堅(jiān)定信心,并為企業(yè)、服務(wù)提供商及全球云平臺提供了強(qiáng)大且具有競爭力的解決方案。據(jù)悉,該設(shè)計(jì)將于2026年下半年向企業(yè)、云服務(wù)提供商及主權(quán)AI項(xiàng)目正式開放,幫助其在大規(guī)模場景下高效運(yùn)行編碼代理及其他Agentic工作負(fù)載。
小編將在第一時(shí)間分享更多相關(guān)最新動(dòng)態(tài)和爆料,敬請關(guān)注。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.