文/王新喜
2026年4月7日,中國(guó)AI圈炸了。全球頂級(jí)大模型DeepSeek官方宣布:DeepSeek下一代旗艦?zāi)P蚔4將完全運(yùn)行于華為昇騰950PR芯片,技術(shù)架構(gòu)從CUDA全面轉(zhuǎn)向CANN框架。
而最新消息,DeepSeek創(chuàng)始人梁文鋒近日在內(nèi)部溝通中透露,DeepSeekV4將于4月下旬發(fā)布,中國(guó)AI產(chǎn)業(yè)在去“CUDA化”路上邁出關(guān)鍵一步。
![]()
deepseek V4跟國(guó)產(chǎn)AI芯片的適配,這將使得deepseek成為國(guó)內(nèi)首個(gè)在推理階段徹底擺脫英偉達(dá)算力依賴(lài)的萬(wàn)億級(jí)參數(shù)大模型。
![]()
回到2025年初,DeepSeek以低成本訓(xùn)練的V3和R1模型震動(dòng)全球,其極低的開(kāi)發(fā)成本與接近甚至OpenAI的性能表現(xiàn),打破了“算力決定一切”的固有認(rèn)知,為全球AI發(fā)展提供了新思路,這引發(fā)美股科技板塊大幅拋售,市場(chǎng)開(kāi)始重新評(píng)估英偉達(dá)等AI算力基礎(chǔ)設(shè)施公司的估值邏輯。
![]()
但那一輪沖擊背后,DeepSeek使用的算力硬件仍然相當(dāng)程度上依賴(lài)英偉達(dá)的芯片,包括出口限制相對(duì)寬松的H800型號(hào)。
隨后,美國(guó)進(jìn)一步收緊出口管制,英偉達(dá)最頂級(jí)的H100、H200,B200全部禁用,后來(lái)連英偉達(dá)的H20芯片也被禁止向中國(guó)出售。這實(shí)質(zhì)上切斷了中國(guó)AI公司通過(guò)"降規(guī)格版本"獲取高性能算力的渠道。DeepSeek已經(jīng)用算法優(yōu)化把有限算力的性能壓榨到了極致——他們?cè)缙谟?混合專(zhuān)家"架構(gòu),把模型推理成本砍掉了90%,震驚了全球。
DeepSeek需要的不是更好的芯片,而是有自主可控的芯片可用。如今,華為已經(jīng)滿(mǎn)足了DeepSeek的訴求。
![]()
2026年4月6日,據(jù)The Information等媒體爆料,DeepSeek下一代旗艦?zāi)P蚔4已全面遷移至華為昇騰950PR,底層代碼從CUDA重寫(xiě)為CANN框架。
按照行業(yè)慣例,新模型發(fā)布前通常會(huì)提前數(shù)月向芯片廠(chǎng)商開(kāi)放測(cè)試權(quán)限,進(jìn)行針對(duì)性性能優(yōu)化。但DeepSeek這次選擇了完全不同的路徑:他們直接拒絕了英偉達(dá)的早期訪(fǎng)問(wèn)請(qǐng)求,反而把模型優(yōu)先開(kāi)放給華為和寒武紀(jì)等國(guó)產(chǎn)芯片廠(chǎng)商。
這種做法在A(yíng)I圈幾乎是反著來(lái),信號(hào)卻再明確不過(guò):V4從一開(kāi)始就是為國(guó)產(chǎn)算力量身定制,英偉達(dá)被排除在外,要徹底擺脫對(duì)美國(guó)芯片的依賴(lài)。
華為昇騰950PR芯片早在2026年3月21日就正式發(fā)布,并配套華為自研的Atlas 350加速卡方案。
根據(jù)華為公開(kāi)的技術(shù)規(guī)格和第三方機(jī)構(gòu)Digitimes的評(píng)測(cè),Ascend 950PR的算力性能接近被禁英偉達(dá)H20芯片的三倍,多模態(tài)生成速度快60%,自研HBM容量達(dá)112GB,算力利用率從行業(yè)平均60%提升至85%以上,部署成本降至英偉達(dá)方案的1/3。
值得一提的是,華為昇騰950PR芯片配套華為自研的Atlas 350加速卡方案。這張加速卡,使用的是全新昇騰950PR(Ascend 950PR)處理器。其性能方面,Atlas 350的單卡算力達(dá)到了英偉達(dá)H20的2.87倍,更是國(guó)內(nèi)唯一支持FP4低精度的推理產(chǎn)品。
![]()
FP4是一種“用精度換效率”的技術(shù),能讓大型AI模型在更少的顯存中運(yùn)行。原本需要4張加速卡才能支撐的700億參數(shù)模型,現(xiàn)在1張卡即可輕松容納。以700億參數(shù)的大模型為例,原本需要140GB顯存,使用FP4后僅需35GB就能流暢運(yùn)行。
這意味著在相同的硬件條件下,可以部署更大規(guī)模的模型,或者支持更多的并發(fā)推理請(qǐng)求。
在當(dāng)前“Token通脹”的時(shí)代背景下——OpenClaw的Token消耗量一個(gè)月內(nèi)從806億飆升至3580億,增長(zhǎng)了約3.4倍——FP4帶來(lái)的效率提升,直接轉(zhuǎn)化為成本優(yōu)勢(shì)。
華為計(jì)劃2026年全年出貨約75萬(wàn)顆該型號(hào)芯片,并已于今年1月開(kāi)始向字節(jié)、阿里等主要客戶(hù)發(fā)送樣品測(cè)試。這么多合作伙伴支持,意味著這不只是一次技術(shù)升級(jí),更是一次戰(zhàn)略性的"換芯手術(shù)",國(guó)內(nèi)一眾廠(chǎng)商是真的有意識(shí)選擇另外一個(gè)生態(tài)圈了。
DeepSeek V4與華為Ascend 950PR的組合,也將成為國(guó)產(chǎn)算力能否支撐頂級(jí)前沿模型訓(xùn)練的一次真實(shí)檢驗(yàn)。
給世界第二個(gè)選擇,AI大模型生態(tài)迎來(lái)iOS與安卓之爭(zhēng)
因?yàn)槊绹?guó)出口管制,英偉達(dá)的高端芯片對(duì)中國(guó)市場(chǎng)的供應(yīng)一直在收緊,DeepSeek是被現(xiàn)實(shí)逼出來(lái)的生存選擇——誰(shuí)手里有自主可控的芯片,誰(shuí)就能第一時(shí)間通過(guò)自家云服務(wù)把模型跑起來(lái),集成進(jìn)AI應(yīng)用里,不用看任何人的臉色,不用怕任何突如其來(lái)的管制。
![]()
DeepSeek 盡管訓(xùn)練端仍依賴(lài)英偉達(dá)(華為訓(xùn)練芯片950DT預(yù)計(jì)Q4上市),軟件生態(tài)也需完善,但“昇騰+DeepSeek”組合已為國(guó)產(chǎn)AI開(kāi)辟了成本可控、安全自主的新路徑。據(jù)知情人士說(shuō),在V4訓(xùn)練和推理上,昇騰950PR的表現(xiàn)達(dá)到了預(yù)期,否則DeepSeek不會(huì)拍板全面遷移。
國(guó)產(chǎn)AI產(chǎn)業(yè)正從"被迫適應(yīng)"到"主動(dòng)選擇"的歷史性轉(zhuǎn)變,這個(gè)信號(hào)會(huì)帶動(dòng)一批人跟進(jìn),整個(gè)國(guó)產(chǎn)芯片的軟件生態(tài)就能慢慢活起來(lái)。
![]()
DeepSeek帶頭做模型原生適配,華為做芯片和底層框架,國(guó)內(nèi)大廠(chǎng)拿訂單鋪場(chǎng)景,中國(guó)AI有望第一次形成“上游芯片-中游模型-下游應(yīng)用”全鏈條的完整閉環(huán)。從硬件到軟件,從訓(xùn)練到落地,全流程都握在自己手里。
而更大的意義,還在于給出世界第二個(gè)選擇。在去年,DeepSeek橫空出世通過(guò)技術(shù)優(yōu)勢(shì)在世界舞臺(tái)上大放光芒,通過(guò)開(kāi)源策略與低價(jià)API服務(wù),推動(dòng)全球開(kāi)發(fā)者生態(tài)建設(shè),DeepSeek是全球被引用最多的開(kāi)源AI模型之一,有大量開(kāi)發(fā)者在用它的代碼和框架。
如果V4在昇騰上跑起來(lái)效果好,可能會(huì)在全球范圍內(nèi)吸引開(kāi)發(fā)者順著這條路,開(kāi)始認(rèn)真評(píng)估昇騰方案。
以前,搞AI大模型,基本繞不開(kāi)英偉達(dá)的芯片與CUDA生態(tài),現(xiàn)在華為昇騰+CANN的出現(xiàn),全世界的客戶(hù)有了第二選項(xiàng),這意味著所有雞蛋不用放在一個(gè)籃子里了。當(dāng)年安卓替代塞班,不是因?yàn)榘沧扛冗M(jìn),是因?yàn)榻o了整個(gè)行業(yè)另一個(gè)選擇。
![]()
DeepSeek V4接入了華為芯片,它其實(shí)就是中國(guó)AI行業(yè)的"安卓時(shí)刻",一旦在中國(guó)打開(kāi)局面,或?qū)L(fēng)靡全球,包括歐洲、東南亞的一些國(guó)家和企業(yè),都有了一個(gè)性能同樣強(qiáng)大的AI生態(tài)備選項(xiàng)。
原來(lái)圍著英偉達(dá)的CUDA轉(zhuǎn)的圈子,會(huì)慢慢被華為的昇騰生態(tài)吸附過(guò)來(lái),未來(lái)的AI競(jìng)爭(zhēng),也將形成兩大生態(tài)之爭(zhēng),這就像全球手機(jī)市場(chǎng)生態(tài)系統(tǒng)之爭(zhēng),逐步形成蘋(píng)果iOS和谷歌安卓生態(tài),形成雙雄競(jìng)爭(zhēng)的格局,以后AI芯片與算力的競(jìng)爭(zhēng),也將變成兩大生態(tài)的競(jìng)爭(zhēng)。
![]()
相比英偉達(dá)方案,華為芯片加V4組合,硬件采購(gòu)成本降低40%,推理成本降低60%,而且在美國(guó)芯片出口管制下,國(guó)產(chǎn)芯片與國(guó)產(chǎn)模型組合能實(shí)現(xiàn)全鏈路自主可控。
也就是說(shuō),在A(yíng)I硬件成本與供應(yīng)鏈安全可控層面,中國(guó)的AI路線(xiàn)反而有自己的優(yōu)勢(shì)。這對(duì)應(yīng)了東南亞、歐洲等一些國(guó)家追求降本增效,且避免被美國(guó)未來(lái)出口管制掣肘的風(fēng)險(xiǎn)。
因此,這一次DeepSeek與華為的雙向奔赴的結(jié)果如何,不僅關(guān)系到DeepSeek一家公司的技術(shù)路線(xiàn),也將在相當(dāng)程度上決定整個(gè)中國(guó)AI產(chǎn)業(yè)的發(fā)展以及市場(chǎng)客戶(hù)對(duì)國(guó)產(chǎn)芯片的信心走向。今天的昇騰與英偉達(dá)的差距客觀(guān)存在,但這是一場(chǎng)持久戰(zhàn),關(guān)鍵意義在于,今天這扇門(mén)被真正推開(kāi)了一條縫,接下來(lái)就能越開(kāi)越大。
中國(guó)AI在未來(lái)3~5年實(shí)現(xiàn)算力自主,這種"應(yīng)用生態(tài)突圍+硬件換道"的組合拳,可能有望進(jìn)一步打破算力囚牢困境,并且有望通過(guò)這條路線(xiàn)的成功,在全球市場(chǎng)打開(kāi)新的局面,中美AI兩大生態(tài)的較量將拉開(kāi)序幕,我們拭目以待。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.