![]()
450億美元,這是成立三年的DeepSeek(深度求索)首次對外開放的融資估值。[1]
如果這筆融資最終完成,DeepSeek將成為全球估值最高的未上市AI公司之一。更重要的是,這是國家大基金首次直接進入大模型賽道。
一年前,DeepSeek還是一家“從不融資”的公司,背靠幻方量化,支撐著全球最具競爭力的開源大模型研發。
梁文鋒,開源模型領域最堅定的技術理想主義者。
在有限的幾次采訪信息中,他曾表示,通用模型不是要不要做,而是該怎么做,“如果一定要找一個商業上的理由,它可能是找不到的,因為劃不來。”[2]
這也讓此次融資備受關注,DeepSeek為什么會在這個時候宣布融資?而國家隊的入場,透露出哪些重要信息?面對技術價值和商業回報,融資后的DeepSeek又會怎么走?
我們來一一拆解。
個人的200億元
2024年冬天,DeepSeek發布V3模型,一夜之間震動全球AI圈。
外界驚嘆于它的性能直逼GPT-4,成本卻只有后者的十分之一。但更讓人震驚的是另一件事:這家公司沒有拿過一分錢外部投資。
梁文鋒的錢都來自幻方量化。過去十年,幻方量化憑借量化交易策略積累了大量利潤,今年,梁文鋒在首輪融資中,將個人的200億元投入了DeepSeek的研發。
200億是什么概念?這差不多是OpenAI在2019年從微軟拿到的第一筆大額投資。不同的是,微軟投給OpenAI的是一個投資組合中的一項,而梁文鋒的200億,幾乎是他的全部身家。
這種把所有籌碼推到桌子中央的姿態,在整個科技創業史上都極為罕見。
一位早期接觸過DeepSeek的投資人回憶:“2024年年中我們去找他,梁文鋒直接說,'我不需要錢,我自己的錢夠燒。'態度非常堅決,不是欲擒故縱,是真的不想稀釋。”
為什么不想稀釋?因為控制權對于DeepSeek的戰略意義,遠超一般創業公司。
梁文鋒在2025年初的一次內部講話中說過一段話,大意是:大模型不是互聯網——互聯網可以燒錢換規模,大模型一旦選錯路線,燒再多錢也追不回來。
所以在路線選擇上,他需要一個不受任何人干擾的決策環境。
一直以來,他的追求都是推進開源AI模型,以實現通用人工智能(AGI)為目標,他帶領下的DeepSeek,使命是突破技術邊界,而非追求盈利。
這也是DeepSeek的戰略邏輯:在技術路線確定的早期,絕對的創始人控制權比資本規模更重要。
2024-2025年的實踐證明,這條路走對了。
![]()
DeepSeek憑借極致的成本控制和開源策略,在GPT-4、Claude、Gemini三大閉源巨頭的夾擊下,硬生生闖了出來。
到2025年底,DeepSeek已經成為全球開發者調用量最大的中國開源模型。
但一個新的問題也隨之浮現——
被需要的煩惱
2026年5月,全球AI大模型單周總調用量達到28.9萬億Token,連續五周上漲。
IDC 預測,全球年度Token消耗量將由2025年0.0005 Peta Token 升至2030年15萬Peta Token。
中國日均Token 調用量從2024 年初1000億增至2025年底100萬億、2026年初140萬億,兩年增長超千倍。
Token調用量飆升意味著什么?意味著算力需求將以更快的速度膨脹。(關于Token的相關內容,可參考文章:)
DeepSeek的開源策略雖然贏得了全球開發者生態,但也帶來了一個煩惱:使用量越大,算力成本越高。
也就是說,當你的模型被全球數百萬開發者免費調用時,每一行代碼的推理成本都需要真金白銀來支撐。
更關鍵的是,大模型的競爭維度變了。
2024年拼的是:誰能訓練出更強的模型;2025年拼的是:誰能把API價格打得更低;到了2026年,競爭變成了:誰能在算力基礎設施上投入足夠多的重資產,形成不可逾越的規模壁壘。
與此同時,2026年上半年的資本市場環境發生了根本性變化。
月之暗面半年融資超39億美元、估值翻了近5倍;階躍星辰綁定手機產業鏈、全力沖刺港股IPO;智譜、MiniMax相繼港股上市,并且市值還在升高。[3]
當所有頭部玩家都在【大舉融資-建設算力-鋪設商業渠道】的飛輪中加速時,僅靠自有資金運作的模式,天花板已經肉眼可見。
DeepSeek需要的不只是更多的錢。它需要的是從一個天才個人主導的技術團隊,進化成一個有國家戰略資源支撐的基礎設施級平臺。
這個轉變的觸發點,就是國家大基金的入場。
大基金的選擇
要理解大基金的選擇,先要回到一個基本事實:大基金從來不是純粹的財務投資者。
大基金一期(2014年設立,1387億元)重點投向了集成電路制造;大基金二期(2019年設立,2041億元)加強對半導體設備和材料的投入。每一期的投資方向,都精準對應著中國當時的“卡脖子”節點。[4]
現在,大基金三期要投什么?
2026年5月,國家發改委的最新表態:加快“人工智能+”落地配套文件,推動央國企開放應用場景,啟動AI立法研究。[5]
大基金的本質任務,是用投資撬動產業鏈。AI已經和芯片、操作系統一樣,被提升到了“國家基礎設施”的戰略高度。
在這個框架下看DeepSeek,它的戰略價值就不止“一家優秀的大模型公司”這么簡單了。
第一,DeepSeek是唯一一個在全球開發者生態中真正站穩腳跟的中國開源大模型。Kimi K2.5開源后表現亮眼,但從全球調用量和第三方集成度來看,DeepSeek仍然是唯一被納入全球主流開發者工作流的中國模型。[6]
![]()
第二,DeepSeek證明了“極致成本+開源”這條路在商業上是可行的。今年4月發布的V4-Pro調用價格為0.025元/百萬Token,處于全球主流模型最低水平,效率優勢已經在定價上體現出來。這對于中國AI產業的整體降本增效,具有標桿意義。
第三,DeepSeek的算力需求體量,已經大到可以反向拉動國產芯片產業鏈了。也是今年4月,DeepSeek正式宣布新一代旗艦大模型DeepSeek V4完成與華為昇騰950P芯片的全鏈路深度適配與優化,訓練、推理、部署全棧兼容,成為國內首個打破英偉達 CUDA 生態壟斷的萬億級大模型。
基于以上,投DeepSeek,不僅是投一家AI公司,也是為國產AI芯片創造了一個確定性的客戶。當DeepSeek的算力集群從千卡擴展到萬卡、十萬卡級別時,它對國產芯片的訂單需求,將成為整個產業鏈迭代的驅動力。
這是一步“一石三鳥”的棋:【押注大模型高地 + 拉動國產芯片需求 + 掌控AI基礎設施的自主權。】
中國大模型的成人禮
過去兩年,中國大模型行業的敘事有不少圍繞“天才”展開。
梁文鋒200億的孤注一擲,楊植麟的天才少年光環,王小川的二次創業傳奇。
這些故事描繪了一個產業的少年期:由少數人的遠見與勇氣驅動,充滿冒險色彩,也充滿個人英雄主義。
而現在,產業正在步入成年。
成年的標志不只是規模擴張,還有底層邏輯的重構:核心矛盾從更強變成更有擔當,資本結構從創始人主導轉向多元力量共治,競爭重心從技術單點突破轉向體系化能力構建。
產業資本帶來落地場景,國資資本注入戰略定力,財務資本推動商業規范。三者合流,幾乎復刻了過去十年中國在新能源、高鐵、5G等領域走過的道路。
當一個產業被納入國家戰略軌道,它的天花板就不再由一家公司的想象力劃定,而是由整個國家的資源配置能力來定義。
這種躍遷當然不只有光鮮的一面,大基金的入場意味著決策環境將變得復雜。
創始人如何在國資訴求與技術理想之間保持平衡?開源社區的全球開發者是否會因為“國家隊”標簽而產生信任波動?這些問題都需要時間給出答案。
以及,技術理想主義者在商業化的進程中,該如何自洽。
結語
林俊旸的故事已經給出了某種前兆。
作為阿里最年輕的P10,他主張從預訓練到Infra團隊必須緊密耦合,推崇OpenAI式的深度溝通模式,公開反對將Qwen團隊拆分為水平化部門。
2026年3月,他因“技術理想與商業現實的碰撞”而離職。這件事情之所以引發輿論不只是行業或者背后的公司在浪尖潮頭,而是技術純粹性與組織管理之間客觀的存在摩擦。[7]
史蒂夫·沃茲尼亞克也是個類似的技術純粹者:“我的心理障礙其實是不想創辦公司,因為我害怕。在商業和政治中,我不會是一個強有力的參與者……但有人說我可以繼續當工程師,這就夠了。”
這段話出自他離開惠普加入蘋果,道出了所有技術理想主義內心最脆弱也最驕傲的部分:愿意為技術燃燒一切,卻不愿在權謀的棋局里耗盡自己。
此刻,梁文鋒正站在相似的分界線上。
參考來源:
[1] 財經. 國家大基金領投DeepSeek首輪融資,投前估值450億美元. 2026.5.28
[2] 觀察者網. DeepSeek創始人,一個“技術理想主義者”. 2025.1.30
[3] 21世紀經濟報道.3440億大基金三期來了 未來投向何方.2024.6.1
[4] 證券時報·人民財訊.估值突破200億美元!月之暗面Kimi完成約20億美元融資.2026.5.8
[5] 澎湃.國家發改委:正在謀劃出臺加快“人工智能+”落地的配套文件. 2026.5.22
[6] CSDN.2026年5月AI模型排行榜. 2025.5.5
[7] 山農下山.阿里,沒有理想的人不傷心?
“AI去往哪里”往期回顧:
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.