網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

悲情DeepSeek：為國產(chǎn)芯片崛起，放棄速度和融資

2026-04-21 16:16:52　來源: 創(chuàng)智記

遼寧舉報(bào)

分享至

作者 | 李家

編輯 | 方堃

沒人會(huì)想到，引爆全球大模型市場的DeepSeek，會(huì)在接下來的十五個(gè)月里陷入一場漫長而孤獨(dú)的沉默。

接連跳票之后，DeepSeek V4終于要來。據(jù)《創(chuàng)智記》從知情人士處獲悉，創(chuàng)始人梁文鋒在內(nèi)部溝通中表示 V4將在4月下旬發(fā)布。這款承載著萬億參數(shù)規(guī)模、百萬級(jí)上下文窗口的新模型，被寄予厚望，但也被重重疑慮包裹，V4究竟還能不能打？

近日，外媒傳出DeepSeek正以100億美金估值融資3億美金，更令很多人惋惜。昨日的大模型王者似乎泯然眾人矣，曾堅(jiān)持獨(dú)立路線的梁文鋒最終也扛不住資本競賽壓力。

這是一個(gè)殘酷的現(xiàn)實(shí)：過去一年，DeepSeek失去了寶貴的研發(fā)時(shí)間、人才、融資最佳節(jié)點(diǎn)，以及在全球大模型競賽中的優(yōu)勢(shì)。

但很多人卻沒意識(shí)到，這一年時(shí)間，DeepSeek究竟付出了什么？

答案是，這一切的代價(jià)，很大程度上源于一個(gè)被外界低估的選擇——為深度適配國產(chǎn)芯片，梁文鋒走上一條更艱難的路。

一位投資人告訴《創(chuàng)智記》，并非梁文鋒不愿更早開啟融資，而是因?yàn)镈eepSeek要走的這條路，顯然不是對(duì)資本利益方的最優(yōu)解，一旦融資，公司戰(zhàn)略必受影響。

2025年，DeepSeek證明了一件事：中國實(shí)驗(yàn)室可以用極低成本，做出接近美國前沿水平的大模型。這個(gè)成就讓DeepSeek從一家技術(shù)公司，變成了象征——中國AI打破美國技術(shù)封鎖的第一個(gè)成功樣本。

而這種象征意義，意味著DeepSeek不再能只做"純粹的技術(shù)選擇"。

當(dāng)國產(chǎn)芯片需要一次頂級(jí)大模型的"認(rèn)證"，當(dāng)政策導(dǎo)向需要一家標(biāo)桿企業(yè)"帶頭示范"，DeepSeek被推到了那個(gè)時(shí)代的位置上——梁文鋒可以選擇拒絕，代價(jià)可能是更復(fù)雜的外部環(huán)境；他也可以選擇接受，代價(jià)就是犧牲迭代速度、犧牲融資節(jié)奏、犧牲團(tuán)隊(duì)穩(wěn)定。

梁文鋒選擇了后者。

“去CUDA化”的代價(jià)

在全球大模型行業(yè)，十五個(gè)月足以跨越一個(gè)技術(shù)的代際。

2025年初R1爆紅之后，OpenAI連推GPT-4.5、GPT-5和多個(gè)推理模型變體；Anthropic的Claude系列迭代了三代；國內(nèi)戰(zhàn)場上，字節(jié)豆包月活沖至3.31億，阿里通義千問持續(xù)進(jìn)化，智譜和MiniMax雙雙登陸港交所，市值突破500億美元。同量級(jí)玩家月之暗面，估值也從40億美元漲到了180億美元。

而DeepSeek，從2025年1月到2026年4月，整整十五個(gè)月沒有發(fā)布大模型新版本。這期間不是沒有動(dòng)靜，但這些零散的更新，遠(yuǎn)不足以填補(bǔ)十五個(gè)月的空白。

原計(jì)劃2026年春節(jié)前后亮相的V4，為何一拖再拖？據(jù)多方信源，核心原因指向一個(gè)沉重但很少被公開討論的因素：國產(chǎn)算力深度適配。

這不是簡單的技術(shù)優(yōu)化，而是一次從底層架構(gòu)開始的"換骨"。

DeepSeek的模型長期運(yùn)行在英偉達(dá)GPU生態(tài)上，CUDA的成熟度、工具鏈的完備性、工程師的熟悉度，都是短期內(nèi)無法被替代的優(yōu)勢(shì)。但2025年1月，外媒披露了一個(gè)細(xì)節(jié)：R1發(fā)布后，有關(guān)部門鼓勵(lì)DeepSeek采用華為昇騰處理器。2月，梁文鋒出席民營企業(yè)座談會(huì)，與任正非、馬化騰等大佬坐在第一排。

政策導(dǎo)向的齒輪開始轉(zhuǎn)動(dòng)，DeepSeek從一家技術(shù)公司，被推向了國家自主可控戰(zhàn)略的關(guān)鍵位置。

據(jù)了解，2025年初，DeepSeek嘗試過用華為昇騰910C進(jìn)行訓(xùn)練，但過程坎坷：訓(xùn)練穩(wěn)定性不足，大規(guī)模分布式場景崩潰，芯片間通信速度未達(dá)預(yù)期。但適配沒有停止，V4研發(fā)期間，DeepSeek做了一個(gè)極具象征意義的決定：沒有提前給英偉達(dá)開放測試權(quán)限，反而優(yōu)先將預(yù)發(fā)布版本交給華為新一代昇騰950PR芯片做適配，并同步適配寒武紀(jì)等國產(chǎn)芯片。

這是一次"反常識(shí)"的選擇。全球主流大模型廠商的首發(fā)邏輯，無一例外是優(yōu)先適配英偉達(dá)——生態(tài)成熟、性能最強(qiáng)、市場認(rèn)可度最高。DeepSeek反其道而行，意味著要將大量技術(shù)資源投入到底層代碼遷移、精度對(duì)齊、框架重構(gòu)上，從CUDA全面轉(zhuǎn)向國產(chǎn)生態(tài)。

難度有多大？據(jù)接近項(xiàng)目的人士透露，核心挑戰(zhàn)在于精度對(duì)齊——確保模型在不同硬件生態(tài)下輸出一致，這涉及海量底層代碼調(diào)整。當(dāng)全球廠商保持2-3個(gè)月的迭代節(jié)奏時(shí)，DeepSeek的技術(shù)團(tuán)隊(duì)卻在為"國產(chǎn)替代"打地基。這十五個(gè)月的延遲中，相當(dāng)大比例的技術(shù)資源投入了國產(chǎn)芯片適配。

更微妙的是戰(zhàn)略信號(hào)。據(jù)公開報(bào)道，阿里、字節(jié)、騰訊等頭部云廠商已向華為下單數(shù)十萬顆昇騰950PR芯片。它們?cè)诘却鼶eepSeek V4的驗(yàn)證結(jié)果——如果V4能在昇騰上跑通萬億參數(shù)訓(xùn)練與推理，意味著國產(chǎn)芯片終于具備支撐頂級(jí)大模型的能力；相當(dāng)于為行業(yè)探明了當(dāng)下國產(chǎn)算力的能力邊界。

英偉達(dá)CEO?黃仁勛在最新訪談中警告，如果DeepSeek優(yōu)先適配華為平臺(tái)，對(duì)美國來說將是“災(zāi)難性的”壞消息?。他真正介意的不是中國做出優(yōu)秀的大模型，而是?全球頂級(jí)開源模型不再以英偉達(dá)的CUDA生態(tài)為默認(rèn)優(yōu)化起點(diǎn)?。

“不得不”融資

DeepSeek V4，成了國產(chǎn)芯片的試金石，但梁文鋒必須自己來承擔(dān)試錯(cuò)的成本。

就在V4即將發(fā)布的節(jié)點(diǎn)上，另一條重磅消息傳來：DeepSeek正洽談首次外部融資，估值超100億美元，募資至少3億美元。

從時(shí)間節(jié)點(diǎn)上看，梁文鋒已完成自己的使命，DeepSeek V4深度適配國產(chǎn)芯片；而從市場商業(yè)角度來看，DeepSeek已到了不得不融資的生死攸關(guān)時(shí)刻。

梁文鋒曾是中國AI圈"最難搞"的創(chuàng)始人，他的姿態(tài)很明確：DeepSeek不缺錢，不稀釋股權(quán)，不被商業(yè)化時(shí)間表綁架。

底氣來自母公司幻方量化。2025年年收入預(yù)計(jì)50億元人民幣左右。這些錢，直接以研發(fā)預(yù)算形式流入DeepSeek，沒有外部股東、沒有LP、沒有退出壓力。

但幻方的利潤終究有其邊界。V4是萬億參數(shù)級(jí)模型，算力、技術(shù)研發(fā)投入，加上Agent、多模態(tài)方向的并行投入，以及國產(chǎn)芯片適配帶來的額外工程開銷，幻方每年50億的收入，放在大廠千億級(jí)別的AI資本開支面前，顯得捉襟見肘。

更致命的是人才流失。

2026年4月，前DeepSeek研究員郭達(dá)雅——GRPO算法的主要貢獻(xiàn)者，R1推理能力訓(xùn)練方法論的核心人物——加盟字節(jié)Seed團(tuán)隊(duì)。此前，核心成員羅福莉也被小米挖角。挖角的武器不是情懷，而是確定的財(cái)富預(yù)期：字節(jié)有豆包股，小米有上市期權(quán)，智譜和MiniMax的員工股票已在港股市場流通。而DeepSeek的員工期權(quán)，長期缺乏市場化估值錨點(diǎn)，無法兌現(xiàn)。

僅靠技術(shù)理想和個(gè)人聲望，留不住頂級(jí)研發(fā)人才。融資，成了給團(tuán)隊(duì)一個(gè)"可兌現(xiàn)的未來"的必由之路。

但此時(shí)融資，時(shí)機(jī)也堪稱尷尬。V4尚未發(fā)布，市場信心未知，100億美元的估值，在2026年的AI坐標(biāo)系里明顯偏低——智譜和MiniMax市值已破500億美元，月之暗面180億美元，胡潤榜單更將DeepSeek標(biāo)為1450億美元。

十五個(gè)月的空白期里，競爭對(duì)手沒有睡覺。OpenAI和Anthropic的估值已分別達(dá)到8520億和3800億美元，資本儲(chǔ)備不在一個(gè)量級(jí)。V4即便技術(shù)出色，也可能只是"追平差距"，而非"再次顛覆"。

結(jié)語

多位與DeepSeek深入合作的AI創(chuàng)業(yè)者向《創(chuàng)智記》表示，"業(yè)界不應(yīng)抱太高期待，V4很難再復(fù)制去年DeepSeek-V3的影響力"。

但如果把DeepSeek的犧牲放在更大的語境下看，它的"悲情"具有某種結(jié)構(gòu)性必然。

如果V4成功在華為昇騰上跑通萬億參數(shù)訓(xùn)練與推理，將意味著國產(chǎn)AI芯片首次具備支撐世界頂級(jí)大模型的全鏈路能力。這不僅會(huì)提振華為昇騰的商業(yè)前景，也會(huì)為整個(gè)國產(chǎn)算力生態(tài)注入強(qiáng)心針——從寒武紀(jì)到摩爾線程、沐曦，國產(chǎn)芯片廠商都在等待這樣一個(gè)"被證明"的時(shí)刻。

從這個(gè)角度看，DeepSeek的十五個(gè)月沉默，是一次技術(shù)理想主義與國家產(chǎn)業(yè)戰(zhàn)略的艱難握手。它犧牲了全球競賽中的先發(fā)優(yōu)勢(shì)，犧牲了最佳融資窗口，犧牲了部分核心人才，換來的可能是一條路——一條中國AI產(chǎn)業(yè)擺脫CUDA依賴、走向算力自主的路。

這種選擇值不值得，歷史會(huì)給出答案。V4的遲到，不只是一個(gè)產(chǎn)品的延遲，而是在一場關(guān)于技術(shù)、資本與國家命運(yùn)的復(fù)雜博弈中，一家創(chuàng)業(yè)公司所付出的代價(jià)。

聲明：個(gè)人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.