為什么DeepSeek突然要融資?人才爭奪戰:大廠的"精準收割"小團隊的困境:每個人都是單點依賴1錢夠多:字節、騰訊、小米的現金儲備,遠超任何創業公司2平臺夠大:技術落地場景多,人才能看到"影響力"3期權夠香:豆包期權四年歸屬,如果業務爆發,收益可能達數億元V4延期:人才流失的直接后果1架構突破:V4可能在架構層面有重大創新,不是簡單升級模型大小,需要更多時間2市場時機:V3已經足夠強,R1又把推理能力打出去了,V4需要一個足夠驚艷的發布時機3算力卡住:訓練大模型需要H100/H800,貿易管制收緊,算力獲取更困難融資能解決問題嗎?1算力投入:可以購買更多GPU,擴大訓練規模2人才競爭:可以提高薪資待遇,留住核心人才3研發加速:可以招募更多人手,加快V4進度1團隊文化:從"純粹研究機構"變成"有投資人對賭的公司",研發節奏會被商業化壓力影響2決策效率:引入外部資本,意味著要向投資人匯報、解釋、妥協3理想主義:AGI夢想可能要給商業化讓路AI創業生態的殘酷現實寫在最后
昨天看到一條新聞,我愣了幾秒——DeepSeek啟動首次外部融資了。
這家曾經放話"不融資"的AI明星公司,終于向資本敞開了大門。目標估值100億美元,融資至少3億美元。
我翻了十幾篇報道,發現這事兒沒那么簡單。表面是融資,背后是一場殘酷的人才爭奪戰。DeepSeek的核心團隊,正在被大廠"精準收割"。
先說個背景。DeepSeek成立于2023年7月,創始人是量化巨頭幻方的梁文鋒。這家公司從一開始就劃了一條線:不接受外部融資,不稀釋股權,不被商業化時間表綁架。
梁文鋒的理由很直接:
"VC都是幫LP管錢,都得賺錢,所以就談不到一塊去。"
他想做的是純粹的研究機構,追AGI、做開源、讓技術本身說話。底氣也很足——幻方2025年全年收益率56.6%,營收超50億人民幣。梁文鋒的錢袋子,比絕大多數AI創業公司的投資人都豐盛。
打個比方:DeepSeek就像一個富二代創業,家里有礦,不需要看投資人臉色。梁文鋒想證明一件事——用"少資源路徑"也能做出頂級模型。DeepSeek-R1做到了,訓練成本560萬美元,性能逼近OpenAI頂級系統。
那為什么現在突然要融資?
兩個原因:研發成本激增,核心人才流失。
這是DeepSeek面臨的最大危機。過去幾個月,多位核心成員離職:
姓名: 郭達雅 | 職位: DeepSeek-Coder/Math主要作者 | 去向: 字節跳動
姓名: 羅福莉 | 職位: V3模型關鍵開發者 | 去向: 小米
姓名: 王炳宣 | 職位: 第一代大語言模型核心作者 | 去向: 騰訊
姓名: 阮翀 | 職位: 多模態核心研究員 | 去向: 元戎啟行
我試著理解了一下這個局面。DeepSeek是一個小團隊,每個人都是單點依賴。流失一個核心研究員,對大廠是局部損失,對DeepSeek意味著整條技術線出現斷層。
郭達雅的案例最能說明問題。
這位95后AI博士,是DeepSeek-Coder、DeepSeek-Math的主要作者。他提出的GRPO算法,能顯著降低訓練資源需求、提升推理效率,后來也被用于DeepSeek R1的訓練。Google Scholar引用量超3800次,是真正的技術骨干。
他3月從DeepSeek離職,加入字節跳動Seed團隊,職級L8,負責Agent方向。市場傳聞字節開出了接近億元年薪的總包。
字節官方否認了"近億元年薪"的說法,但補充了一句:
"如果業務發展良好,不排除部分Seed技術人員四年后收益達到數億元。"
說白了,錢不是問題,問題是錢給得夠不夠久。
薪資差距有多大?
DeepSeek的深度學習研究員最高年薪154萬元。但競爭對手開出的條件是"翻2到3倍問題不大",部分甚至給出8位數總包。
小米請羅福莉,雷軍親自出馬,千萬年薪。字節請郭達雅,現金+字節期權+豆包期權,四年歸屬。如果豆包業務爆發,四年后收益可能達到數億元。
情懷打不過2到3倍的薪資差距。這不是夸張,是人才市場的殘酷現實。
DeepSeek的問題,不是個例。這是整個國產AI硬科技初創公司在巨頭碾壓下面臨的共同困境。
大廠有三大優勢:
創業公司有什么?
情懷、理想、AGI夢想。
但在人才市場上,情懷打不過2到3倍的薪資差距。
對大廠而言,流失一個核心研究員是局部損失;對DeepSeek而言,流失一個核心研究員意味著整條技術線出現斷層。
這不是夸張,是小團隊的先天脆弱性。人少意味著每個人都是單點依賴,沒有人可以被"替代"。
我試了一下理解這個局面:假設你是一個10人的技術團隊,每個人負責一個核心模塊。走了一個人,那個模塊就沒人懂了。大廠有幾百人,走一個還有幾十個備胎。創業公司沒有備胎。
這不是DeepSeek獨有的問題。
我翻了更多報道,發現整個AI行業都在經歷一場人才大洗牌。字節Seed團隊近70名核心員工被挖角,其中包括加入DeepSeek的徐名宇。而DeepSeek首位員工李宇琨,恰恰是2023年從字節跳槽過去的。
人才雙向流動,看起來是"公平競爭"。但問題是,大廠有70個人可以流失,創業公司只有10個人。
這就是"不對稱戰爭"的本質。
DeepSeek V4原定2026年2月中旬發布,現在一推再推,至今仍未正式發布。
根據公開信息,V4將采用萬億參數MoE架構,支持百萬Token上下文,原生多模態能力。更重要的是,它計劃從英偉達芯片遷移到華為昇騰平臺。
這是一個巨大的技術挑戰。遷移訓練平臺不是換個硬件那么簡單,需要重新優化整個訓練流程。核心人才的流失,讓這個挑戰變得更加困難。
V4延期,是人才流失的直接后果。
有意思的是,行業里流傳三種猜測:
無論哪種原因,核心人才的流失都是雪上加霜。
DeepSeek這次融資,估值100億美元,出讓的股權極少(3億美元/100億美元=3%)。這說明梁文鋒還是想保持控制權。
融資能解決什么問題?
但融資解決不了什么問題?
這是一次妥協,也是一次無奈之舉。
DeepSeek的困境,折射出整個AI創業生態的殘酷現實。
大廠碾壓:字節、騰訊、阿里、小米,都在瘋狂搶人。他們有錢、有平臺、有場景,創業公司拿什么競爭?
資本回歸:生數科技融資近20億元,極佳視界兩個月融資25億元,估值破百億。AI創業公司融資潮又來了,但這次是"被迫融資"——不融資就留不住人。
人才定價:AI頂尖人才的身價水漲船高。大模型算法工程師月薪中位數24,760元,頂尖人才年薪逼近200萬元。這已經不是創業公司能承受的范圍。
更殘酷的是:美國對全球AI人才的吸引力正在下降。自2017年以來,前往美國的AI研究人員和開發人員數量已下降了89%。從2024年開始,美國22-25歲的年輕開發者崗位減少了近20%。AI先替代的是"入門級執行",而不是"有經驗的判斷"。
這意味著,全球AI人才競爭正在加劇。中國的大廠們,正在用更高的薪資、更好的平臺、更香的期權,搶奪最頂尖的大腦。
中美競爭:根據斯坦福《2026年AI指數報告》,中美AI模型性能差距僅剩2.7%。DeepSeek-R1曾短暫追平美國頂級模型。但技術領先是一回事,人才留不留得住是另一回事。
一個值得關注的細節:2025年2月,DeepSeek-R1發布時,訓練成本560萬美元,成本利潤率545%。這個數據讓行業意識到,頂級模型能力并非只能通過極端資源堆疊獲得。
但問題是,做出R1的人才,現在正在被大廠挖走。技術可以領先,但人才留不住,一切歸零。
DeepSeek首次融資,不是"AGI理想向資本低頭"那么簡單。這是一場被迫的妥協,是人才困局下的無奈之舉。
梁文鋒曾經想驗證一條"少資源路徑"——用十分之一的錢做出同級模型。DeepSeek-R1做到了。但問題是,做出模型是一回事,留住做模型的人是另一回事。
這是一個殘酷的悖論:技術理想主義需要人才來實現,但人才市場不相信理想主義。當大廠開出2到3倍薪資,當期權四年歸屬后可能價值數億,多少人能抵擋住誘惑?
技術理想主義很美好,但人才市場不相信情懷。當大廠開出2到3倍薪資,當期權四年歸屬后可能價值數億,多少人能抵擋住誘惑?
DeepSeek的困境,是所有AI創業公司的困境。技術可以領先,但人才留不住,一切歸零。
這不是錢的問題,是認知的問題。真正的天才,從來不是被"買"來的,是被"看見"的。
但問題是,大廠也能"看見"他們,而且看得更清楚。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.