![]()
![]()
等了一年多,DeepSeekV4終于來了。
4月24日,DeepSeek正式發布V4預覽版,同步開源。
兩個版本:V4-Pro,總參數1.6萬億,激活490億;V4-Flash,總參數2840億,激活130億。兩個版本都標配100萬token的超長上下文。
也就是說,從現在起,你用它家的網頁、App或API,默認就能一次性上傳一整本《紅樓夢》、整個項目的代碼庫——AI會全部讀完,不用你自己拆文件。
![]()
01
核心亮點
這次DeepSeek在技術路線上做了一個關鍵選擇。
百萬上下文在2026年4月已不算絕對領先,Gemini、Qwen都到了這個量級。V4真正要回答的不是“能不能做到百萬上下文”,而是“做到了之后,成本撐不撐得住”。
V4給出的答案是一套全新的混合注意力架構。
它在token維度引入壓縮機制,結合自研的DSA稀疏注意力,處理百萬token的算力消耗只有前代V3.2的27%,KV緩存占用只有10%。
注意,這不是“優化了一點點”,而是把同一個任務需要的計算資源直接砍掉了將近四分之三。
Agent能力也被大幅加強。在AgenticCoding評測中,V4-Pro已超過所有開源模型,企業版內部評測反饋,使用體驗優于ClaudeSonnet4.5,交付質量接近Opus4.6非思考模式。
世界知識方面,V4-Pro大幅領先其他開源模型,僅次于谷歌的Gemini-Pro-3.1。數學、STEM、競賽型代碼的評測里,超過了所有已知開源模型。
最刺激的部分來了,價格。
V4-Flash版輸出價僅為GPT-5.5Pro的1.55‰。數字擺在面前時,給人的沖擊力是巨大的——這不是便宜,是便宜到了完全不在同一個量級。
![]()
來源:公開查詢/匯總
![]()
02
黃仁勛擔心的事,還是發生了
今年4月15日,英偉達CEO黃仁勛在接受DwarkeshPatel播客采訪時說了這么一句話:“如果DeepSeek先在華為平臺上發布,那對我們國家來說將是災難性的。”
![]()
僅僅9天后,4月24日,華為同步宣布DeepSeek-V4在昇騰首發。黃仁勛的預言變成了一半的現實。
為什么說一半?因為V4同時在英偉達和華為兩套平臺上做了適配。但從技術報告來看,DeepSeek的設計之初就優先圍繞華為昇騰AI體系做了適配。
定價說明中還有一行灰色小字:受限于高端算力,目前Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調。
這是國內首個在昇騰平臺上原生適配的前沿大模型。寒武紀也完成了Day0適配。一個圍繞國產算力的先進模型運行體系正在成型。
黃仁勛擔心的不是某個具體模型。他擔心的是有一天,全球頂尖的AI模型不再是“默認識別并優先跑在英偉達GPU+CUDA上”。
![]()
如果模型為了在華為芯片上達到最優性能而調整了核心架構,那么英偉達這些年靠CUDA建立的軟件生態護城河,就被繞過去了。
這件事的影響正在現實中發生。
美國商務部長盧特尼克在聽證會上承認,美國政府放寬H200芯片對華出口后,“一塊也沒賣出去”,自獲批以來對華銷量始終為零。中國市場的邏輯變了,曾經英偉達占據中國高端AI芯片市場90%以上份額的時代,結束了。
與此同時,國產GPU與AI芯片廠商的市場份額攀升至41%,年出貨量約400萬張。HW排名第一,占總量近半。
黃仁勛自己也在4月20日說,中國已經具備相當規模的算力資源,美國芯片出口管制背后的主張“極其愚蠢”,是典型的“失敗者心態”。
![]()
03
對全球AI行業意味著什么
DeepSeek從V3到R1到V4,畫出了一條陡峭到近乎刺眼的成本下降曲線。
V2訓練成本是GPT-4Turbo的1/70,V3是GPT-4的1/14,R1是GPT-4o的1/20。現在V4的API定價,大約是GPT-5.4和ClaudeOpus4.6的1/50。
奧爾特曼自己說過,AI成本每12個月降10倍。即便你把OpenAI背后幾十億美元的算力基礎設施都算進去,DeepSeek在單次訓練成本上的優勢依然是數量級的。
OpenRouter平臺的報告顯示,2025年中國開源模型已占全球約三分之一的使用份額。DeepSeek在其中領跑。
所以V4意味著什么?意味著大模型這個賽道的競爭規則變了。
以前玩這個游戲的前提是“至少有幾億美金買H100”。現在門檻被拉低了,低到更多玩家可以入場。而且V4是MIT協議完全開源,權重可下載,任何組織只要有足夠的硬件就能本地部署。
華為昇騰一天比一天成熟,天數智芯、寒武紀等廠商陸續跟上。
中國正在建立起一條完整的“國產模型+國產算力”閉環。黃仁勛擔憂的“兩個生態系統”的局面,正在從可能變為現實。
中信證券的判斷是有道理的:模型平權會帶動整個AI產業鏈。算力成本降下來→用量升上去→AI應用層加速落地→基礎設施層跟著受益。
第一波受益的是模型廠家本身,第二波是AI-nativeSaaS公司。
![]()
04
接下來會怎樣?
接下來說幾個確定性比較高的事。
第一,AGI競賽的玩法變了。以前基本靠堆算力,誰手上H100多誰說了算。V4證明了一條新路徑,架構創新可以替代相當一部分算力堆疊。
接下來這個賽道會分成兩派:一派繼續堆參數燒錢走暴力美學路線,一派走效率優先的輕量路線。
第二,國產算力生態會加速成熟。V4是第一個在昇騰上深度適配的前沿大模型,但不會是最后一個。
現在已經看到端倪:DeepSeek綁定HW,騰訊混元在內部生態跑通,阿里通義Qwen也在適配自家芯片。
三條線各自形成閉環的同時還在互相競爭。IDC數據顯示國產芯片市場份額已經41%,這個數字在未來一兩個季度還會漲。
第三,開源vs閉源的分化會加劇。V4的輸出價比GPT-5.5Pro便宜100多倍。這個價差擺在這里,大量開發者會流向哪一邊,基本不用猜。
一個基本的商業規律:當性能差距縮小到感知不明顯的程度時,成本就成為決定性因素。
DeepSeek證明了開源模型可以靠極致的工程效率跑出頂級性能,而閉源派還在依賴高昂的訂閱費和API調用來覆蓋訓練和營銷成本。
接下來兩年,這條路線之爭可能比芯片層面的競爭更值得關注。
第四,DeepSeek自身的商業模式面臨選擇。它已經跟資本開始接觸,洽談融資,估值超過200億美元,騰訊和阿里被傳都在入局。
這也透露出一個信號:靠幻方自己填錢,可能撐不起下一階段的競賽了。開源意味模型不要錢,算力需要成本。
V4算力消耗比V3少73%,但規模大了之后,總賬單不是一個數量級。
它需要在開源理想和商業現實之間,找到一個平衡點。
2026年的競局這張牌桌上,中國玩家不只DeepSeek一家。
阿里Qwen下載量過10億,字節跳動2024年一年投了110億美元搞AI基礎設施。
開源模型讓全球開發者都有了更便宜的選擇,馬來西亞去年已公開宣布本國主權AI將建在DeepSeek技術之上。
這種擴散速度,比單純比拼benchmark分數要可怕得多。
當然,挑戰依然存在:高端算力產能不足、部分核心技術仍需突破、國際競爭與地緣政治壓力持續加大。
但可以確定的是,中國 AI 已經跨過 “追趕門檻”,站在了全球舞臺的中央。
黃仁勛擔心的 “災難性結果”,對美國而言是挑戰,對中國而言,卻是百年難遇的歷史機遇。
聲明:本文僅為財經熱點分析,觀點僅供參考,不構成任何投資或消費建議。
DeepSeek
對DeepSeek最新版本,您怎么看?
期待您在留言區文明理性發布高見,留言點贊最高的朋友,掃碼文末投行君微信,可以獲得投行圈子精美商務背包一個。
?感謝耐心閱讀,歡迎順手點個“在看”
![]()
聲明:本平臺深耕財經自媒體12年,聚焦資本市場、上市公司和商業、科技最前沿的深度解讀,目前全網粉絲超300萬,歡迎投稿,如采納,將支付稿費。引用文章、圖片如遇版權問題,請與管理員聯系,管理員核實后將及時更正出處、作者、支付一定稿費或進行刪除。商務合作、投稿、資源對接,金融同仁入群請掃碼添加管理員投行-滌生。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.