梁文鋒說了句大實話。
"沒有昇騰910B這顆芯片,DeepSeek等國產大模型將依賴英偉達。"
![]()
這話不是客套,2026年4月,DeepSeek V4發布,萬億參數模型全面適配華為昇騰950PR芯片,底層代碼從英偉達CUDA遷移到華為CANN框架,耗時五個月。
中國最火的AI大模型,把算力命脈從美國芯片換成了中國芯片,五個月,重寫一切
遷移過程不是"調幾個接口"那么簡單。
CUDA是英偉達的護城河——它不只是一套編程工具,是十幾年積累的模型、框架、芯片協同演化的生態,全球AI開發者都是在CUDA上寫代碼、調模型、跑訓練。
DeepSeek團隊要做的是:把整套底層代碼全部重寫,不是翻譯,是重構,從指令集到算子適配,從內存管理到分布式訓練策略,從優化器到推理引擎。
五個月,放在AI行業里,這個速度不慢。
但真正的挑戰不在代碼層面。梁文鋒團隊在做適配的時候,還要同時應對外部攻擊,DeepSeek曾遭遇大規模惡意黑客攻擊,團隊一邊修復漏洞一邊推遷移進度,借了華為畢昇防御系統來做攻擊溯源。
![]()
等到V4發布,DeepSeek把華為昇騰NPU和英偉達GPU并列寫進了官方硬件驗證清單,這是第一次有國產萬億級大模型這么做。
梁文鋒為什么選擇這么做呢?
英偉達高端GPU對中國的供應一直不穩定,你今天用H100跑得歡,明天可能就被斷供,對于DeepSeek這種級別的企業,技術路線不可控等于命脈被人掐著。
梁文鋒的選擇本質上是底線思維:與其隨時擔心外面斷供,不如花五個月把根扎到自己的土地上。
還有一個產業層面的邏輯。DeepSeek適配昇騰,不只是為自己省錢,它是給整個中國AI產業打了個樣——頭部大模型用國產芯片跑通了,后面的中小模型公司才會跟上來,芯片和模型之間是協同演化的關系,用的人越多,芯片生態越成熟。
![]()
根據行業分析,DeepSeek全面適配昇騰后,部署成本降了約70%,萬億參數模型能跑在國產芯片上,這個成本變化對AI應用的規模化落地,影響很大,國產算力生態,從"能跑"到"好用"
這事的意義不在DeepSeek一家。
過去國產芯片和AI大模型的關系是"芯片被動適配模型"——模型在英偉達上訓練好了,再嘗試搬過來跑跑。這次V4是反過來:模型和芯片在開發過程中就開始協同優化。
"Sora出來的時候,大家覺得差距又拉大了,但DeepSeek V4適配昇騰這件事,讓我們重新相信,差距可以縮小。"這是行業里的普遍看法。
從產業角度看,華為造芯、DeepSeek煉模,這種頭部企業的深度合作,正在從"單點突圍"走向"生態協同",芯片、框架、模型三層打通,這才有可能真正建成中國自己的AI基礎設施。
![]()
五個月遷移,不是一個技術問題的解決,而是一條路的確認。
你覺得中國AI的底層算力,能徹底擺脫對英偉達的依賴嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.