網易首頁 > 網易號 > 正文 申請入駐

第一時間,寒武紀原生適配DeepSeek-V4!兩大國產之光再次強強聯合

0
分享至



機器之心發布

今天上午,AI 圈心心念念的國產大模型之光 —— DeepSeek-V4 終于上線了!

第一時間,寒武紀基于 vLLM 推理框架完成了對此次 285B DeepSeek-V4-flash 和 1.6T DeepSeek-V4-pro 兩個版本的 Day 0 適配,適配代碼已開源到 GitHub 社區



連同去年 DeepSeek-V3.2 的發布,寒武紀連續兩次都是第一時間發布適配的國產芯片。雙方的緊密合作,得益于寒武紀長期積累的自研 NeuWare 軟件生態與芯片設計技術,也是寒武紀對芯片與算法聯合創新持續投入的延續。DeepSeek-V4 原生運行在寒武紀芯片上,這對中國人工智能產業具有里程碑意義。此前寒武紀對 DeepSeek 系列模型開展深入的軟硬件協同性能優化,并達到了業界領先的算力利用率水平。



GitHub 項目地址:https://github.com/Cambricon/vllm-mlu?sessionid=

本次適配從 “快速模型遷移” 與 “極致性能優化”兩個維度,充分展現了寒武紀的核心技術實力。

快速完成 DeepSeek-V4 新模型適配,實現 Day 0 首發

在軟件生態層面,寒武紀 NeuWare 軟件棧全面擁抱開源社區,原生支持 PyTorch、vLLM、Diffusers 等主流 AI 框架,新模型可快速遷移至寒武紀平臺;

在國產軟件生態層面,寒武紀與眾智 FlagOS 生態持續深度合作,解耦模型與不同架構芯片之間的生態壁壘,進一步降低模型適配遷移成本;

在算子開發層面,寒武紀充分利用 Triton 良好的社區兼容性和易用性進行快速算子開發適配,進一步縮短功能適配周期;

在 AI 協同層面,寒武紀研發了代碼生成智能體 CNAgent,實現算子生成、模型遷移的全流程加速;

在硬件層面,寒武紀芯片原生支持主流低精度數據格式,無需額外轉換即可快速完成功能適配與精度驗證。通過軟硬件協同,寒武紀在模型發布當日即可實現穩定運行,真正做到 Day 0 適配

極致性能優化,釋放 DeepSeek-V4 推理潛能

針對 DeepSeek-V4 的新結構,寒武紀通過自研高性能融合算子庫 Torch-MLU-Ops,對 Compressor、mHC 等模塊進行專項加速;利用 BangC 高性能編程語言,編寫稀疏 / 壓縮 Attention、GroupGemm 等熱點算子的極致優化 Kernel,充分釋放硬件底層性能。

在推理框架優化層面,寒武紀在 vLLM 中全面支持 TP/PP/SP/DP/EP 5D 混合并行、通信計算并行、低精度量化以及 PD 分離部署等優化技術,通過策略優化,在滿足延時約束下達到最佳的詞元吞吐能力,顯著提升端到端推理效率。

硬件特性同樣被深度挖掘:利用 MLU 訪存與排序加速能力,有效加速稀疏 Attention、Indexer 等結構;高互聯帶寬與低通信延時,將 Prefill 和 Decode 兩種不同工作負載場景下的通信占比降至最低,最大化分布式推理的利用率。

正是這種軟硬件一體化的設計思路,使得寒武紀能夠在大模型部署中持續降低算力成本,提升性能上限。寒武紀將繼續深耕大模型軟硬件協同生態,為開發者與客戶提供更快、更省、更高效的大模型部署方案。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
吉林伊通驚現200萬豪華住宅式墓地,獨門獨戶地上地下兩層

吉林伊通驚現200萬豪華住宅式墓地,獨門獨戶地上地下兩層

大象新聞
2026-04-27 13:41:32
美媒:白宮晚宴槍擊后,一女子趁亂順走多瓶紅酒,還有多名與會人員被拍到攜帶酒瓶離開;眾人逃命亂作一團時,好萊塢資深經紀人淡定吃沙拉

美媒:白宮晚宴槍擊后,一女子趁亂順走多瓶紅酒,還有多名與會人員被拍到攜帶酒瓶離開;眾人逃命亂作一團時,好萊塢資深經紀人淡定吃沙拉

魯中晨報
2026-04-27 16:36:04
隨著吳宜澤13-11勝塞爾比,火箭12-13,世錦賽8強對陣出爐附賽程

隨著吳宜澤13-11勝塞爾比,火箭12-13,世錦賽8強對陣出爐附賽程

小火箭愛體育
2026-04-28 00:09:23
炸裂!北京車展惡性事件!尚界展車慘遭人為損毀,法務部硬核發聲

炸裂!北京車展惡性事件!尚界展車慘遭人為損毀,法務部硬核發聲

天天熱點見聞
2026-04-27 06:27:09
暴跌149.75%虧損6211萬,庫存近乎翻番!電驢界愛馬仕賣不動了?

暴跌149.75%虧損6211萬,庫存近乎翻番!電驢界愛馬仕賣不動了?

財經八卦
2026-04-27 17:19:09
央視曝光兒童彩妝玩具問題,汕頭澄海區開展專項整治行動

央視曝光兒童彩妝玩具問題,汕頭澄海區開展專項整治行動

環球網資訊
2026-04-27 17:21:34
特朗普,又變了

特朗普,又變了

南風窗
2026-04-27 16:22:26
車企為什么開始把新車首發押在京東上?

車企為什么開始把新車首發押在京東上?

豹變
2026-04-25 08:00:03
80W全能卷王,輕薄本也能玩3A!惠普星Book Pro 16深度測評

80W全能卷王,輕薄本也能玩3A!惠普星Book Pro 16深度測評

電腦報
2026-04-20 16:51:12
出場時間聯盟第二,不堪重負,季后賽基本報銷!或許你該離開火箭

出場時間聯盟第二,不堪重負,季后賽基本報銷!或許你該離開火箭

老梁體育漫談
2026-04-28 00:48:29
林志玲抱4歲兒子吃早餐,日本老公悠閑坐著吃,家庭地位卑微傳統

林志玲抱4歲兒子吃早餐,日本老公悠閑坐著吃,家庭地位卑微傳統

椰黃娛樂
2026-04-27 14:02:11
男子曝入職全球頂尖科技公司時突然被降薪20萬,拒offer后被嘲諷:你的愛國情懷不值20萬嗎

男子曝入職全球頂尖科技公司時突然被降薪20萬,拒offer后被嘲諷:你的愛國情懷不值20萬嗎

爆角追蹤
2026-04-27 14:54:06
豆包提前查到事業編成績單,全網炸了!

豆包提前查到事業編成績單,全網炸了!

互聯網品牌官
2026-04-27 18:11:08
自導自演白宮記協晚宴槍擊事件?特朗普回應

自導自演白宮記協晚宴槍擊事件?特朗普回應

極目新聞
2026-04-27 19:31:28
千里科技AI戰略發布:L4智駕、原生智駕基座模型,翻開行業新篇章

千里科技AI戰略發布:L4智駕、原生智駕基座模型,翻開行業新篇章

科技每日推送
2026-04-23 18:44:48
云南楚雄一中學教師在校內跳樓輕生,疑留遺書稱遭刻意針對,當地教體局:墜樓教師生命體征趨于平穩,相關部門已介入調查

云南楚雄一中學教師在校內跳樓輕生,疑留遺書稱遭刻意針對,當地教體局:墜樓教師生命體征趨于平穩,相關部門已介入調查

都市快報橙柿互動
2026-04-27 14:52:49
Manus,徹底涼涼了

Manus,徹底涼涼了

技術領導力
2026-04-27 20:37:27
用京東大屏AI手機 一句話搞定外賣、購物、健康問診等生活大小事

用京東大屏AI手機 一句話搞定外賣、購物、健康問診等生活大小事

極果酷玩
2026-04-27 16:22:23
山西澤州發生重大刑事案件,33歲嫌犯潛逃,警方發布協查通報

山西澤州發生重大刑事案件,33歲嫌犯潛逃,警方發布協查通報

極目新聞
2026-04-27 17:56:03
普京稱已收到伊朗最高領袖傳來的信息

普京稱已收到伊朗最高領袖傳來的信息

界面新聞
2026-04-27 21:01:26
2026-04-28 01:07:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12874文章數 142638關注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

體育要聞

人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

娛樂要聞

黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清

財經要聞

Meta 140億收購Manus遭中國發改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態度原創

本地
時尚
數碼
公開課
軍事航空

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

絲巾的10種系法,愛美的女人必看

數碼要聞

LABUBU冰箱還未正式發售就已溢價3000元

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗外長折返伊斯蘭堡內情披露

無障礙瀏覽 進入關懷版