![]()
![]()
這兩天,全球科技圈和資本圈被一條消息炸鍋。
中國大模型頭部玩家DeepSeek(深度求索)正式啟動成立以來的首次外部融資,目標估值不低于100億美元,計劃募集資金不少于3億美元。
但資本市場還是給了很高的預期。
據說這個周末,無數投資人訂好了機票,務必要在這千載難逢的窗口期見到那個曾經連電話都不接的梁文鋒。
那個曾被拒絕向資本低頭的技術理想主義者,也扛不住了?還是梁文鋒有更大的布局?
![]()
01
100億美元估值?估值邏輯是什么?
100億美元是個什么概念?
參照下同業。2026年1月,智譜AI在港股上市,首日市值528億港元,約合68億美元。MiniMax上市首日市值沖到了1067億港元,約合137億美元。
![]()
數據來源:公開查詢
截至目前公開查詢到的數據,DeepSeek尚未盈利,尚未發布V4,尚未有任何商業化數據,卻已經在融資談判桌上開出了100億美元的價格牌。
這個估值介于智譜和MiniMax之間,但要知道,智譜和MiniMax已經在港交所掛牌交易,有公開市場的定價錨。DeepSeek拿的是私募市場的錢,這個估值意味著投資人對它的技術實力和未來商業潛力給出了極高的溢價。
再看海外。OpenAI在今年3月以8520億美元估值完成1220億美元融資,Anthropic在2月以3800億美元估值完成300億美元G輪融資。
100億美元放在全球舞臺上看,不過是個零頭,但在中國AI獨角獸陣列里,這個數字已經足夠讓VC們瘋狂了。
![]()
![]()
02
DeepSeek的錢包發生了什么?
DeepSeek由量化私募巨頭幻方量化于2023年孵化,創始人梁文鋒同時執掌這兩家橫跨金融與AI的企業。公開工商信息顯示,梁文鋒在DeepSeek直接和間接持有84.29%的股份,擁有幾乎100%的表決權。
這家公司從第一天起就沒有拿過外部VC的錢。
梁文鋒為什么要拒絕資本?
他曾經說得很直接:VC都是幫LP管錢,都得賺錢,談不到一塊去。他的理想(可能是曾經的理想)是做一個純粹的研究機構,追AGI、做開源、不被任何人的商業化時間表綁架。
更重要的是,他確實有錢。
幻方量化2025年收益均值高達56.55%,在百億量化私募中位列第二。按超700億元的管理規模計算,這意味著約350到400億元的利潤。
業內人士估算,幻方量化2025年的強勁表現可能帶來超過7億美元的收入。相比之下,DeepSeekV3的總訓練成本預算僅557萬美元。
從賬面上看,幻方幾個月的利潤足以支撐DeepSeek數年的研發投入。早年間梁文鋒就已經囤了大量的英偉達GPU,2021年砸10億元建螢火二號,把幻方做成了國內屈指可數的萬卡集群公司。
這就是DeepSeek的底氣。在友商拿著PPT融資數億美元的時候,梁文鋒在用自己的錢玩。
但2026年的故事已經不同了。
![]()
數據來源:公開查詢
這張表格揭示了一個殘酷的事實:大模型的燒錢速度在指數級增長。
2025年你花500多萬美元就能訓練出一個震驚世界的模型,2026年你可能需要投入十億美元級別的資金才能跟上節奏。
![]()
02
V4發布前夕,市場變天了
融資消息傳出的時間點很微妙。
DeepSeekV4預計在4月底正式亮相,這原本該是這家公司的又一次高光時刻。但在這個節骨眼上,梁文鋒選擇了向資本開口。
V4的參數規格讓所有人大吃一驚:總參數躍升至約1萬億(MoE架構,每個token僅激活370億參數),上下文窗口擴展至100萬token,首次支持原生多模態。
內部測試基準顯示SWE-bench超80%、HumanEval達90%。這個模型如果真能跑出這樣的成績,將與美國頂尖大模型處于同一水平線。
但問題在于,V4已經被推遲了好幾次。原定春節前后發布,推到2月,再推到3月,目前的口徑是4月下旬。
![]()
綜合業內人士的分析,延期背后至少有三層原因。
1.技術路線本身發生了質變。V4不再是簡單的參數堆疊,而是萬億參數MoE架構、原生多模態、百萬token上下文的全新系統級工程,訓練驗證復雜度陡然上了一個臺階。
2.DeepSeek選擇了一條最難的路:徹底去英偉達化。V4將深度適配華為昇騰芯片,工程師們需要將核心代碼從英偉達的CUDA生態遷移到華為的CANN架構。
精度對齊需要反復調試,同樣的模型在兩種芯片上跑出一致結果極其耗時。
3.身份包袱的壓力。DeepSeek以“效率神話”立身,V4不能有閃失,否則整個敘事就會崩塌。
這些問題的本質指向同一個東西:錢。
更多的錢意味著更多的算力、更多的工程師、更快的調試進度。
![]()
04
人才正在用腳投票
如果說算力壓力是外部推動力,那么人才流失就是內部引爆點。
有媒體報道,自2025年初R1爆紅以來,DeepSeek的核心團隊正在經歷一場“大出血”。V3架構的關鍵貢獻者羅福莉2025年底轉投小米,接手MiMo大模型團隊。第一代大語言模型核心作者王炳宣去了騰訊。
多模態方向核心研究員阮翀加入元戎啟行做首席科學家。OCR系列核心作者魏浩然也在今年春節前后離開。1994年生的核心研究員郭達雅被字節跳動挖走,擔任Agent方向負責人之一。
為什么?因為在這個階段,理想不能當飯吃。對于大部分打工人來說,詩和遠方(老板畫的大餅)不能充饑,解決當下的生活問題,真金白銀進入自己腰包才是實惠的。
DeepSeek從未融資,沒有市場化的估值對標。員工手里的股權承諾就是一張無法兌現的白條。
大廠的期權有行權價、有內部回購機制、有IPO預期。外界只知道DeepSeek很值錢,但到底值多少,沒有人能說清,員工更不知道。
當字節、小米開出“現金+期權+IPO預期”的組合時,梁文鋒拿什么留人?
這個問題只有一個答案:建立市場化的股權激勵機制。而要建立這個機制,首先需要一輪市場化的融資,給公司一個公允價值。
![]()
![]()
05
行業競爭背后的重要籌碼:資本
2026年全球大模型競爭的格局已經徹底變了。海外市場,OpenAI和Anthropic正在上演“資本之王”的爭奪戰。
OpenAI以8520億美元估值完成1220億美元融資,Anthropic緊隨其后以3800億美元估值融資300億美元。這兩家公司的估值已經不能用市盈率來衡量,完全是“市夢率”。
國內賽道呈現“頭部聚集、冷熱分化”的格局。
2026年一季度國內通用大模型融資額同比下滑72%,但資金向頭部集中明顯。階躍星辰在1月完成50億元B+輪融資,刷新國內大模型單筆紀錄。智譜AI和MiniMax相繼登陸港股,市值合計超過1700億元。垂直賽道的競爭同樣激烈,生數科技獲近20億元B輪融資,極佳視界兩個月內融資25億元。
![]()
數據來源:公開查詢
在這張牌桌上,DeepSeek再不拿錢,可能真的會掉隊。
更直觀的數據是:2026年中國日均Token調用量已突破140萬億,兩年間增長了1000多倍。算力消耗進入爆發式增長期,V4的訓練與規模化部署需要數萬張算力卡,投入規模躍升至十億美元級別。
幻方量化再有錢,畢竟是一家量化基金,不可能無限制地往一個燒錢無底洞輸血。
![]()
06
游戲規則變了
過去兩年,DeepSeek用“效率神話”證明了技術可以繞開資本的綁架。
它用500多萬美元的訓練成本做出了對標OpenAI頂級模型的R1,用開源和低價策略顛覆了行業對算力堆疊的迷信。但到了2026年,游戲規則變了。
參數規模從千億級躍升到萬億級,算力需求從百萬美元級膨脹到十億美元級,競爭從技術單點比拼演變為算力、人才、生態的綜合較量。
算力要燒錢,人才要高薪,產品迭代要速度,沒有資本的持續支撐,再強的技術也跑不遠。
接下來,行業將進入更殘酷的資本硬戰,誰能融到更多資金,誰能更快實現商業化,誰能構建更穩固的生態,誰就能活到最后。
對于投資者來說,DeepSeek的入局也是一個明確的信號:大模型賽道已經從“講故事”轉向“看業績”。100億美元的估值不是終點,而是起點。
V4模型的表現、商業化的進展、算力自主的進度,才是決定它能走多遠的關鍵。
參考此前的其他科技行業的成長軌跡,未來1-2年,可能國內大模型賽道將迎來新一輪洗牌,頭部玩家的估值將逐漸回歸基本面。
那些真正能賺錢、能落地的模型,才會獲得資本的長期認可。而DeepSeek的這輪首融,只是這場洗牌的開始。
聲明:本文僅為財經熱點分析,觀點僅供參考,不構成任何投資或消費建議。
DeepSeek
對此,您怎么看?
期待您在留言區文明理性發布高見,留言點贊最高的朋友,掃碼文末投行君微信,可以獲得投行圈子精美商務背包一個。
?感謝耐心閱讀,歡迎順手點個“在看”
![]()
聲明:本平臺深耕財經自媒體12年,聚焦資本市場、上市公司和商業、科技最前沿的深度解讀,目前全網粉絲超300萬,歡迎投稿,如采納,將支付稿費。引用文章、圖片如遇版權問題,請與管理員聯系,管理員核實后將及時更正出處、作者、支付一定稿費或進行刪除。商務合作、投稿、資源對接,金融同仁入群請掃碼添加管理員投行-滌生。
我正在「投行圈子」和朋友們討論有趣的話題,你?起來吧?點擊閱讀原文,加入投行圈子私域會員。?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.