![]()
突發重大利好!
市場望眼欲穿的DeepSeek模型V4的預覽版本,今天終于正式上線,并同步開源。
DeepSeek-V4擁有百萬字超長上下文,在Agent能力、世界知識和推理性能上,均實現大幅度提升,再一次在開源模型上站到了業界C位。
這推動自主可控芯片板塊應聲大漲,大量資金涌入中芯國際、海光信息、寒武紀、摩爾線程、華虹公司等個股。
DeepSeek-V4這代版本,讓市場等得太久了。
上一代,DeepSeek-V3,還是2024年12月26日發布的,離現在已經有整整484天了。
也就是1年3個月29天。
要知道,大模型發展日新月異,競爭異常激烈,很多頂尖模型每2-3個月就更新一個版本。
DeepSeek這次更新,為什么花了這么久呢?
主要有兩個原因:第一是目標定的高,第二是芯片國產化的大遷徙。
先說目標。
當初的V3,是個很精簡的小模型,總參數只有671B(6710億),預訓練數據14.8T token,上下文128k。
我們看這一次發的V4?Pro(旗艦版),總參數提升到了1.6T(16000億),是V3的2.38倍;
預訓練數據32T~33T token,約V3的2.2倍,上下文1M(100萬)token,約V3的7.8倍。
這就像是一輛經濟型代步車,升級成跑車,還是自研發動機的那種。
這可不是簡單的“放大”尺寸,必須是整個底層架構都要重新設計。
它們之間,需要用到的技術、材料、工藝,完全不是一回事,自然就需要花大量的時間去重新設計。
再說第二個芯片國產化的遷徙。
當下我國的大模型訓練,有一個說一個,主力芯片全都是用的英偉達。
而DeepSeek,是第一個,下決心完全拋棄海外芯片,只用國產貨的企業。
眾說周知,英偉達的CUDA生態經過20年的發展,已經相當成熟了。
轉向用國產芯片,底層代碼又要全部重寫一遍去適配,還要去解決芯片不成熟帶來的各種bug導致的崩潰。
這就相當于把一輛汽油車改成電動車,還要保證續航和速度不變,這工程量是大到難以想象的。
由于國產算力的不足,為了提升模型競爭力,DeepSeek不得不搞出大量的本土化創新。
比如上FP8全鏈路訓練,這東西就像國產模型當初搞出的MOE專家模型一樣,屬于在算力受限情況下,為提升競爭力而進行的創新。
但用海外芯片的,都不需要搞這么復雜。
于是就相當于別人開著成熟的生產線造零件,它非要自己研發生產線,還要保證零件精度,光調試代碼、校準精度,就耗掉了兩個多月。
就這樣,好事多磨,花了比別人多幾倍的時間去更新版本。
不過,好飯不怕晚,如今終于端上來了。
我們看看,這個版本有哪些亮點:
1,百萬字超長上下文。
跟OpenAI GPT?5.4、Google Gemini 3.1 Pro、Anthropic Claude Opus 4.6、通義千問 Qwen 3.5 Plus等大廠處于同一水平。
而遙遙領先于kimi、智譜、minimax等國產創企的模型,后者的長度通常在200k左右。
這個能力在法律文書審核、金融財報分析、科研文獻研讀、多輪智能對話等專業場景中非常重要。
2,Agent能力領跑國內開源。
相較于普通大模型只能被動響應指令,DeepSeek-V4具備完整的自主規劃、工具調用、多智能體協同、復雜任務拆解閉環能力。
無需人工過多干預,就能獨立完成代碼全流程開發、辦公自動化全流程處理、行業解決方案定制、復雜數據推演等高階任務。
這意味著,V4真正從“工具型AI”升級為“協作型AI”,在國內開源模型中一騎絕塵。
3,推理與知識性能登頂。
在MMLU、GSM8K、C-Eval等全球權威AI模型評測基準中,DeepSeek-V4的通識知識準確率、數學邏輯推理、代碼編寫、中文語義理解能力,均位列國內開源模型首位。
核心指標媲美國際頂尖閉源模型,且針對中文語境、本土行業規則做了深度優化,落地實用性遠超海外通用模型。
DeepSeek-V4終于又一次站回到了行業C位,實在是可喜可賀!
但更重要的是,DeepSeek-V4全程采用去美化研發路線,模型訓練、推理優化、生態適配全流程,均基于華為昇騰、寒武紀、海光信息等國產AI芯片完成。
完全不依賴任何海外芯片架構、軟件工具與編譯生態,真正實現“中國模型、中國算力、中國生態”的全鏈路自主可控。
這意味著,國產算力完全有能力支撐世界頂級大模型的全流程運作。
海外芯片,終于可以被國內AI產業拋棄了。
這無疑是給國產自主可控產業鏈打了一劑強心針。
回到A股,DeepSeek-V4直接利好的,主要是芯片制造和AI芯片兩大環節。
相對來說,AI芯片的業績增速,明顯要強于芯片制造。
對比一季度數據:
中芯國際:2025年營收+16.49%,凈利潤+36.29%;
華虹公司:2025年營收+20.18%,凈利潤-1.04%.
海光信息:2026年Q1營收+68.06%,凈利潤+35.82%;
寒武紀:2025年營收+453.21%,凈利潤+555.24%;
摩爾線程:2025年Q3營收+181.99%,凈利潤+18.71%;
沐曦股份:2025年營收+121.26%,凈利潤+43.97%;
很明顯,從營收增速來看,AI芯片環節的四大龍頭跑的快很多。
凈利潤增速上,除了寒武紀已經進入規模化拐點,迎來業績大爆發以外,其它幾家行業競爭力較弱,利潤增速落后于營收增速。
值得注意的是,今天股價表現最出色的,是華虹公司和海光信息。
主要是美股傳導效應的影響。
昨晚,全球模擬芯片巨頭德州儀器,發布了超預期的一季報和第二季度指引,隔夜股價大漲19.43%,創2000年10月以來最大單日漲幅。
德州儀器是全球模擬芯片龍頭,市占率約19%-20%,過去幾年被中國企業發起的價格戰打得節節敗退,股價自2021年之后都沒有漲過。
因此,市場對德州儀器的預期是很低的。
但最新一季度財報,公司營收同比增長19%,凈利潤同比增長31%,大幅超出市場預期。
且受益于芯片漲價潮,公司今年一季度也開始提價了,帶來利潤率的上揚,凈利潤率從28.28%提升到32.02%。
華虹公司主營成熟芯片和模擬芯片代工,是德州儀器的最直接傳導標的。
另外,昨晚英特爾也發布了一季報,盤后股價大漲近20%,創下近年單日最大漲幅。
財報顯示,英特爾一季度營收同比增長7%,剔除股權薪酬、重組費用等非經常性損益后,非GAAP凈利潤15億美元,同比大增156%。
英特爾這番業績大爆發,一方面跟新CEO陳立武的鐵血改革有很大關系,他通過大規模裁員、剝離非核心資產,讓公司得以止血。
另一方面,也跟AI行業從“訓練”轉向“推理”的風口變化有關。
由于AI 推理、智能體(Agent)的爆發,相關需求更吃CPU,讓英特爾的服務器芯片(至強CPU)營收大幅增長了40%,并提價10–15%。
海光信息主營通用CPU和GPU芯片,是英特爾的最直接傳導標的。
我們來看看近幾年的中國AI芯片行業變化。
根據伯恩斯坦(Bernstein)的報告,2023年中國AI芯片市場規模約780億元,英偉達份額約95%,國產芯片只有可憐的5%。
而到了去年,2025年,這一市場的規模大幅增長至1530–1780億元。
AI芯片總出貨約401.6萬張,其中英偉達220萬張,份額下降至55%。
國產出貨約165萬張,提升至45%。
其中——
華為昇騰:81.2萬張,占國產49%,斷層第一;
阿里平頭哥:26.5萬張,占國產16%,排名第二;
百度昆侖芯:11.6萬張,占國產7%,排名第三;
寒武紀:11.6萬張,占國產7%,排名第四;
海光信息(DCU):約8.3萬張,占國產5%,排名第五;
摩爾、沐曦、天數、壁仞:合計約25萬張,占國產15%,平均每家4%左右。
這里面,阿里平頭哥和百度昆侖芯,都是自用為主的專用芯片,類似谷歌的路線。
華為昇騰和寒武紀,在獨立第三方的市場中,相對領先,類似于英偉達和AMD的地位。
海光信息,更偏重CPU業務,類似于英特爾。
摩爾、沐曦、天數、壁仞這些創企,當下市場份額較小,競爭力較弱,未來的不確定性還是比較大的。
我們重點分析一下華為和寒武紀。
華為毫無疑問是國產AI芯片的實力最強者,占據了行業一半的份額,且研發實力領先,自研達芬奇架構、擁有CANN軟件棧(對標CUDA)。
一來是錢多、投入多,二來是產業生態搭建的早,目前已擁有開發者80萬,遠超過寒武紀的10萬。
三來是在利潤率最高的政企市場上,擁有壟斷地位,市場份額在60%-70%左右。
四是產能穩定,由于在自主制造、先進制程研發中投入了大量資源,像中芯國際的N+2/N+3產線,會優先服務、配套華為的需求。
這讓華為的芯片產能得以穩定增長,2024年產量50.7萬張,2025年80.5萬張。
今年預計產能不會大幅增長,維持在80-85萬張左右,但主力產品將從910C切換向950PR(推理)、950DT(訓練),這兩款芯片配套了自研的HBM存儲芯片,性能大幅提升。
明年,2027年,預計隨著新一代國產先進光刻機的量產,中芯國際的先進節點產能將大幅提升,推動華為AI芯片出貨量提升至110-120萬張。
說白了,華為昇騰的核心競爭力,靠的是 “全棧生態 + 政企壟斷 + 產能穩定”,強者通吃效應下,未來市場份額預計提升至80%。
華為昇騰生態標的:
拓維信息(政企運營)、軟通動力(軟件外包)、神州數碼(分銷)、中芯國際(代工)、興森科技(PCB配套)
寒武紀,即沒有華為的強大生態,也沒有阿里、百度的大廠資源,能夠突圍而出。
肯定是有兩把刷子的。
寒武紀最大的競爭力是什么呢?
差異化的技術路線。
根據業內報告,寒武紀的技術有以下特點:
1,自研MLU架構(思元系列)。
國內唯一全棧指令集 + 微架構自主,思元590支持50B參數模型推理,能效比是主流GPU的2倍。
2,Chiplet技術(思元370)。
雙芯粒封裝,LPDDR5內存帶寬3倍于上代,訪存能效達GDDR6的1.5倍,成本比華為低30%+。
3,稀疏計算硬件加速。
跳過零值運算,推理能效提升40%,適配DeepSeek等稀疏化大模型,互聯網推理場景優勢明顯。
4,MagicMind推理引擎。
基于MLIR圖編譯,訓推一體、開發成本低,適配主流框架,推理性能接近 CUDA。
這里面,最核心的就是基于互聯網創企的需求進行優化,推出了稀疏計算硬件加速等獨特技術。
而且,不做云、服務器、終端,不與阿里 、騰訊、字節等大廠業務競爭,自然更獲互聯網巨頭信任。
另外就是價格優勢,思元590價格為昇騰910B的60%,性價比還是可以的。
從市占率來看,寒武紀在2025年國內AI芯片市場的份額約5%–7%,云端推理12%–15%,互聯網推理20%+。
在互聯網行業的市場份額,與華為相比,明顯差距最小。
據業內傳言,2025年字節跳動采購了20多萬張訂單,用于推理集群,是其最大客戶;
由于針對長文本推理做了專項優化,性價比出色,DeepSeek、MiniMax等互聯網創企也會選擇寒武紀的芯片。
過去十幾年,國產AI芯片產業崛起,最大的阻力從來不是單顆芯片的性能,而是軟件生態的壟斷。
英偉達CUDA生態歷經近二十年深耕,和全球開發者進行了深度綁定,成為其最深的護城河,也是國產芯片最難突破的壁壘。
現在,隨著DeepSeek V4模型全面適配國產AI芯片,并成功站上來源大模型的C位,以后肯定會有越來越多的國產大模型追隨著走上這條路。
這意味著英偉達芯片生態的霸權,正在一步步被瓦解。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.