![]()
作者 | 李家
編輯 | 方堃
沒人會(huì)想到,引爆全球大模型市場的DeepSeek,會(huì)在接下來的十五個(gè)月里陷入一場漫長而孤獨(dú)的沉默。
接連跳票之后,DeepSeek V4終于要來。據(jù)《創(chuàng)智記》從知情人士處獲悉,創(chuàng)始人梁文鋒在內(nèi)部溝通中表示 V4將在4月下旬發(fā)布。這款承載著萬億參數(shù)規(guī)模、百萬級(jí)上下文窗口的新模型,被寄予厚望,但也被重重疑慮包裹,V4究竟還能不能打?
近日,外媒傳出DeepSeek正以100億美金估值融資3億美金,更令很多人惋惜。昨日的大模型王者似乎泯然眾人矣,曾堅(jiān)持獨(dú)立路線的梁文鋒最終也扛不住資本競賽壓力。
這是一個(gè)殘酷的現(xiàn)實(shí):過去一年,DeepSeek失去了寶貴的研發(fā)時(shí)間、人才、融資最佳節(jié)點(diǎn),以及在全球大模型競賽中的優(yōu)勢(shì)。
但很多人卻沒意識(shí)到,這一年時(shí)間,DeepSeek究竟付出了什么?
答案是,這一切的代價(jià),很大程度上源于一個(gè)被外界低估的選擇——為深度適配國產(chǎn)芯片,梁文鋒走上一條更艱難的路。
一位投資人告訴《創(chuàng)智記》,并非梁文鋒不愿更早開啟融資,而是因?yàn)镈eepSeek要走的這條路,顯然不是對(duì)資本利益方的最優(yōu)解,一旦融資,公司戰(zhàn)略必受影響。
2025年,DeepSeek證明了一件事:中國實(shí)驗(yàn)室可以用極低成本,做出接近美國前沿水平的大模型。這個(gè)成就讓DeepSeek從一家技術(shù)公司,變成了象征——中國AI打破美國技術(shù)封鎖的第一個(gè)成功樣本。
而這種象征意義,意味著DeepSeek不再能只做"純粹的技術(shù)選擇"。
當(dāng)國產(chǎn)芯片需要一次頂級(jí)大模型的"認(rèn)證",當(dāng)政策導(dǎo)向需要一家標(biāo)桿企業(yè)"帶頭示范",DeepSeek被推到了那個(gè)時(shí)代的位置上——梁文鋒可以選擇拒絕,代價(jià)可能是更復(fù)雜的外部環(huán)境;他也可以選擇接受,代價(jià)就是犧牲迭代速度、犧牲融資節(jié)奏、犧牲團(tuán)隊(duì)穩(wěn)定。
梁文鋒選擇了后者。
01
“去CUDA化”的代價(jià)
在全球大模型行業(yè),十五個(gè)月足以跨越一個(gè)技術(shù)的代際。
2025年初R1爆紅之后,OpenAI連推GPT-4.5、GPT-5和多個(gè)推理模型變體;Anthropic的Claude系列迭代了三代;國內(nèi)戰(zhàn)場上,字節(jié)豆包月活沖至3.31億,阿里通義千問持續(xù)進(jìn)化,智譜和MiniMax雙雙登陸港交所,市值突破500億美元。同量級(jí)玩家月之暗面,估值也從40億美元漲到了180億美元。
而DeepSeek,從2025年1月到2026年4月,整整十五個(gè)月沒有發(fā)布大模型新版本。這期間不是沒有動(dòng)靜,但這些零散的更新,遠(yuǎn)不足以填補(bǔ)十五個(gè)月的空白。
原計(jì)劃2026年春節(jié)前后亮相的V4,為何一拖再拖?據(jù)多方信源,核心原因指向一個(gè)沉重但很少被公開討論的因素:國產(chǎn)算力深度適配。
這不是簡單的技術(shù)優(yōu)化,而是一次從底層架構(gòu)開始的"換骨"。
DeepSeek的模型長期運(yùn)行在英偉達(dá)GPU生態(tài)上,CUDA的成熟度、工具鏈的完備性、工程師的熟悉度,都是短期內(nèi)無法被替代的優(yōu)勢(shì)。但2025年1月,外媒披露了一個(gè)細(xì)節(jié):R1發(fā)布后,有關(guān)部門鼓勵(lì)DeepSeek采用華為昇騰處理器。2月,梁文鋒出席民營企業(yè)座談會(huì),與任正非、馬化騰等大佬坐在第一排。
政策導(dǎo)向的齒輪開始轉(zhuǎn)動(dòng),DeepSeek從一家技術(shù)公司,被推向了國家自主可控戰(zhàn)略的關(guān)鍵位置。
據(jù)了解,2025年初,DeepSeek嘗試過用華為昇騰910C進(jìn)行訓(xùn)練,但過程坎坷:訓(xùn)練穩(wěn)定性不足,大規(guī)模分布式場景崩潰,芯片間通信速度未達(dá)預(yù)期。但適配沒有停止,V4研發(fā)期間,DeepSeek做了一個(gè)極具象征意義的決定:沒有提前給英偉達(dá)開放測試權(quán)限,反而優(yōu)先將預(yù)發(fā)布版本交給華為新一代昇騰950PR芯片做適配,并同步適配寒武紀(jì)等國產(chǎn)芯片。
這是一次"反常識(shí)"的選擇。全球主流大模型廠商的首發(fā)邏輯,無一例外是優(yōu)先適配英偉達(dá)——生態(tài)成熟、性能最強(qiáng)、市場認(rèn)可度最高。DeepSeek反其道而行,意味著要將大量技術(shù)資源投入到底層代碼遷移、精度對(duì)齊、框架重構(gòu)上,從CUDA全面轉(zhuǎn)向國產(chǎn)生態(tài)。
難度有多大?據(jù)接近項(xiàng)目的人士透露,核心挑戰(zhàn)在于精度對(duì)齊——確保模型在不同硬件生態(tài)下輸出一致,這涉及海量底層代碼調(diào)整。當(dāng)全球廠商保持2-3個(gè)月的迭代節(jié)奏時(shí),DeepSeek的技術(shù)團(tuán)隊(duì)卻在為"國產(chǎn)替代"打地基。這十五個(gè)月的延遲中,相當(dāng)大比例的技術(shù)資源投入了國產(chǎn)芯片適配。
更微妙的是戰(zhàn)略信號(hào)。據(jù)公開報(bào)道,阿里、字節(jié)、騰訊等頭部云廠商已向華為下單數(shù)十萬顆昇騰950PR芯片。它們?cè)诘却鼶eepSeek V4的驗(yàn)證結(jié)果——如果V4能在昇騰上跑通萬億參數(shù)訓(xùn)練與推理,意味著國產(chǎn)芯片終于具備支撐頂級(jí)大模型的能力;相當(dāng)于為行業(yè)探明了當(dāng)下國產(chǎn)算力的能力邊界。
英偉達(dá)CEO?黃仁勛在最新訪談中警告,如果DeepSeek優(yōu)先適配華為平臺(tái),對(duì)美國來說將是“災(zāi)難性的”壞消息?。他真正介意的不是中國做出優(yōu)秀的大模型,而是?全球頂級(jí)開源模型不再以英偉達(dá)的CUDA生態(tài)為默認(rèn)優(yōu)化起點(diǎn)?。
02
“不得不”融資
DeepSeek V4,成了國產(chǎn)芯片的試金石,但梁文鋒必須自己來承擔(dān)試錯(cuò)的成本。
就在V4即將發(fā)布的節(jié)點(diǎn)上,另一條重磅消息傳來:DeepSeek正洽談首次外部融資,估值超100億美元,募資至少3億美元。
從時(shí)間節(jié)點(diǎn)上看,梁文鋒已完成自己的使命,DeepSeek V4深度適配國產(chǎn)芯片;而從市場商業(yè)角度來看,DeepSeek已到了不得不融資的生死攸關(guān)時(shí)刻。
梁文鋒曾是中國AI圈"最難搞"的創(chuàng)始人,他的姿態(tài)很明確:DeepSeek不缺錢,不稀釋股權(quán),不被商業(yè)化時(shí)間表綁架。
底氣來自母公司幻方量化。2025年年收入預(yù)計(jì)50億元人民幣左右。這些錢,直接以研發(fā)預(yù)算形式流入DeepSeek,沒有外部股東、沒有LP、沒有退出壓力。
但幻方的利潤終究有其邊界。V4是萬億參數(shù)級(jí)模型,算力、技術(shù)研發(fā)投入,加上Agent、多模態(tài)方向的并行投入,以及國產(chǎn)芯片適配帶來的額外工程開銷,幻方每年50億的收入,放在大廠千億級(jí)別的AI資本開支面前,顯得捉襟見肘。
更致命的是人才流失。
2026年4月,前DeepSeek研究員郭達(dá)雅——GRPO算法的主要貢獻(xiàn)者,R1推理能力訓(xùn)練方法論的核心人物——加盟字節(jié)Seed團(tuán)隊(duì)。此前,核心成員羅福莉也被小米挖角。挖角的武器不是情懷,而是確定的財(cái)富預(yù)期:字節(jié)有豆包股,小米有上市期權(quán),智譜和MiniMax的員工股票已在港股市場流通。而DeepSeek的員工期權(quán),長期缺乏市場化估值錨點(diǎn),無法兌現(xiàn)。
僅靠技術(shù)理想和個(gè)人聲望,留不住頂級(jí)研發(fā)人才。融資,成了給團(tuán)隊(duì)一個(gè)"可兌現(xiàn)的未來"的必由之路。
但此時(shí)融資,時(shí)機(jī)也堪稱尷尬。V4尚未發(fā)布,市場信心未知,100億美元的估值,在2026年的AI坐標(biāo)系里明顯偏低——智譜和MiniMax市值已破500億美元,月之暗面180億美元,胡潤榜單更將DeepSeek標(biāo)為1450億美元。
十五個(gè)月的空白期里,競爭對(duì)手沒有睡覺。OpenAI和Anthropic的估值已分別達(dá)到8520億和3800億美元,資本儲(chǔ)備不在一個(gè)量級(jí)。V4即便技術(shù)出色,也可能只是"追平差距",而非"再次顛覆"。
結(jié)語
多位與DeepSeek深入合作的AI創(chuàng)業(yè)者向《創(chuàng)智記》表示,"業(yè)界不應(yīng)抱太高期待,V4很難再復(fù)制去年DeepSeek-V3的影響力"。
但如果把DeepSeek的犧牲放在更大的語境下看,它的"悲情"具有某種結(jié)構(gòu)性必然。
如果V4成功在華為昇騰上跑通萬億參數(shù)訓(xùn)練與推理,將意味著國產(chǎn)AI芯片首次具備支撐世界頂級(jí)大模型的全鏈路能力。這不僅會(huì)提振華為昇騰的商業(yè)前景,也會(huì)為整個(gè)國產(chǎn)算力生態(tài)注入強(qiáng)心針——從寒武紀(jì)到摩爾線程、沐曦,國產(chǎn)芯片廠商都在等待這樣一個(gè)"被證明"的時(shí)刻。
從這個(gè)角度看,DeepSeek的十五個(gè)月沉默,是一次技術(shù)理想主義與國家產(chǎn)業(yè)戰(zhàn)略的艱難握手。它犧牲了全球競賽中的先發(fā)優(yōu)勢(shì),犧牲了最佳融資窗口,犧牲了部分核心人才,換來的可能是一條路——一條中國AI產(chǎn)業(yè)擺脫CUDA依賴、走向算力自主的路。
這種選擇值不值得,歷史會(huì)給出答案。V4的遲到,不只是一個(gè)產(chǎn)品的延遲,而是在一場關(guān)于技術(shù)、資本與國家命運(yùn)的復(fù)雜博弈中,一家創(chuàng)業(yè)公司所付出的代價(jià)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.