網易首頁 > 網易號 > 正文申請入駐

DeepSeek首次融資：AGI理想向資本低頭，還是人才困局的無奈之舉

2026-04-19 13:41:46　來源: AI效率筆記

河南舉報

分享至

為什么DeepSeek突然要融資？人才爭奪戰：大廠的"精準收割"小團隊的困境：每個人都是單點依賴1錢夠多：字節、騰訊、小米的現金儲備，遠超任何創業公司2平臺夠大：技術落地場景多，人才能看到"影響力"3期權夠香：豆包期權四年歸屬，如果業務爆發，收益可能達數億元V4延期：人才流失的直接后果1架構突破：V4可能在架構層面有重大創新，不是簡單升級模型大小，需要更多時間2市場時機：V3已經足夠強，R1又把推理能力打出去了，V4需要一個足夠驚艷的發布時機3算力卡住：訓練大模型需要H100/H800，貿易管制收緊，算力獲取更困難融資能解決問題嗎？1算力投入：可以購買更多GPU，擴大訓練規模2人才競爭：可以提高薪資待遇，留住核心人才3研發加速：可以招募更多人手，加快V4進度1團隊文化：從"純粹研究機構"變成"有投資人對賭的公司"，研發節奏會被商業化壓力影響2決策效率：引入外部資本，意味著要向投資人匯報、解釋、妥協3理想主義：AGI夢想可能要給商業化讓路AI創業生態的殘酷現實寫在最后

昨天看到一條新聞，我愣了幾秒——DeepSeek啟動首次外部融資了。

這家曾經放話"不融資"的AI明星公司，終于向資本敞開了大門。目標估值100億美元，融資至少3億美元。

我翻了十幾篇報道，發現這事兒沒那么簡單。表面是融資，背后是一場殘酷的人才爭奪戰。DeepSeek的核心團隊，正在被大廠"精準收割"。

先說個背景。DeepSeek成立于2023年7月，創始人是量化巨頭幻方的梁文鋒。這家公司從一開始就劃了一條線：不接受外部融資，不稀釋股權，不被商業化時間表綁架。

梁文鋒的理由很直接：

"VC都是幫LP管錢，都得賺錢，所以就談不到一塊去。"

他想做的是純粹的研究機構，追AGI、做開源、讓技術本身說話。底氣也很足——幻方2025年全年收益率56.6%，營收超50億人民幣。梁文鋒的錢袋子，比絕大多數AI創業公司的投資人都豐盛。

打個比方：DeepSeek就像一個富二代創業，家里有礦，不需要看投資人臉色。梁文鋒想證明一件事——用"少資源路徑"也能做出頂級模型。DeepSeek-R1做到了，訓練成本560萬美元，性能逼近OpenAI頂級系統。

那為什么現在突然要融資？

兩個原因：研發成本激增，核心人才流失。

這是DeepSeek面臨的最大危機。過去幾個月，多位核心成員離職：

姓名: 郭達雅 | 職位: DeepSeek-Coder/Math主要作者 | 去向: 字節跳動

姓名: 羅福莉 | 職位: V3模型關鍵開發者 | 去向: 小米

姓名: 王炳宣 | 職位: 第一代大語言模型核心作者 | 去向: 騰訊

姓名: 阮翀 | 職位: 多模態核心研究員 | 去向: 元戎啟行

我試著理解了一下這個局面。DeepSeek是一個小團隊，每個人都是單點依賴。流失一個核心研究員，對大廠是局部損失，對DeepSeek意味著整條技術線出現斷層。

郭達雅的案例最能說明問題。

這位95后AI博士，是DeepSeek-Coder、DeepSeek-Math的主要作者。他提出的GRPO算法，能顯著降低訓練資源需求、提升推理效率，后來也被用于DeepSeek R1的訓練。Google Scholar引用量超3800次，是真正的技術骨干。

他3月從DeepSeek離職，加入字節跳動Seed團隊，職級L8，負責Agent方向。市場傳聞字節開出了接近億元年薪的總包。

字節官方否認了"近億元年薪"的說法，但補充了一句：

"如果業務發展良好，不排除部分Seed技術人員四年后收益達到數億元。"

說白了，錢不是問題，問題是錢給得夠不夠久。

薪資差距有多大？

DeepSeek的深度學習研究員最高年薪154萬元。但競爭對手開出的條件是"翻2到3倍問題不大"，部分甚至給出8位數總包。

小米請羅福莉，雷軍親自出馬，千萬年薪。字節請郭達雅，現金+字節期權+豆包期權，四年歸屬。如果豆包業務爆發，四年后收益可能達到數億元。

情懷打不過2到3倍的薪資差距。這不是夸張，是人才市場的殘酷現實。

DeepSeek的問題，不是個例。這是整個國產AI硬科技初創公司在巨頭碾壓下面臨的共同困境。

大廠有三大優勢：

創業公司有什么？

情懷、理想、AGI夢想。

但在人才市場上，情懷打不過2到3倍的薪資差距。

對大廠而言，流失一個核心研究員是局部損失；對DeepSeek而言，流失一個核心研究員意味著整條技術線出現斷層。

這不是夸張，是小團隊的先天脆弱性。人少意味著每個人都是單點依賴，沒有人可以被"替代"。

我試了一下理解這個局面：假設你是一個10人的技術團隊，每個人負責一個核心模塊。走了一個人，那個模塊就沒人懂了。大廠有幾百人，走一個還有幾十個備胎。創業公司沒有備胎。

這不是DeepSeek獨有的問題。

我翻了更多報道，發現整個AI行業都在經歷一場人才大洗牌。字節Seed團隊近70名核心員工被挖角，其中包括加入DeepSeek的徐名宇。而DeepSeek首位員工李宇琨，恰恰是2023年從字節跳槽過去的。

人才雙向流動，看起來是"公平競爭"。但問題是，大廠有70個人可以流失，創業公司只有10個人。

這就是"不對稱戰爭"的本質。

DeepSeek V4原定2026年2月中旬發布，現在一推再推，至今仍未正式發布。

根據公開信息，V4將采用萬億參數MoE架構，支持百萬Token上下文，原生多模態能力。更重要的是，它計劃從英偉達芯片遷移到華為昇騰平臺。

這是一個巨大的技術挑戰。遷移訓練平臺不是換個硬件那么簡單，需要重新優化整個訓練流程。核心人才的流失，讓這個挑戰變得更加困難。

V4延期，是人才流失的直接后果。

有意思的是，行業里流傳三種猜測：

無論哪種原因，核心人才的流失都是雪上加霜。

DeepSeek這次融資，估值100億美元，出讓的股權極少（3億美元/100億美元=3%）。這說明梁文鋒還是想保持控制權。

融資能解決什么問題？

但融資解決不了什么問題？

這是一次妥協，也是一次無奈之舉。

DeepSeek的困境，折射出整個AI創業生態的殘酷現實。

大廠碾壓：字節、騰訊、阿里、小米，都在瘋狂搶人。他們有錢、有平臺、有場景，創業公司拿什么競爭？

資本回歸：生數科技融資近20億元，極佳視界兩個月融資25億元，估值破百億。AI創業公司融資潮又來了，但這次是"被迫融資"——不融資就留不住人。

人才定價：AI頂尖人才的身價水漲船高。大模型算法工程師月薪中位數24,760元，頂尖人才年薪逼近200萬元。這已經不是創業公司能承受的范圍。

更殘酷的是：美國對全球AI人才的吸引力正在下降。自2017年以來，前往美國的AI研究人員和開發人員數量已下降了89%。從2024年開始，美國22-25歲的年輕開發者崗位減少了近20%。AI先替代的是"入門級執行"，而不是"有經驗的判斷"。

這意味著，全球AI人才競爭正在加劇。中國的大廠們，正在用更高的薪資、更好的平臺、更香的期權，搶奪最頂尖的大腦。

中美競爭：根據斯坦福《2026年AI指數報告》，中美AI模型性能差距僅剩2.7%。DeepSeek-R1曾短暫追平美國頂級模型。但技術領先是一回事，人才留不留得住是另一回事。

一個值得關注的細節：2025年2月，DeepSeek-R1發布時，訓練成本560萬美元，成本利潤率545%。這個數據讓行業意識到，頂級模型能力并非只能通過極端資源堆疊獲得。

但問題是，做出R1的人才，現在正在被大廠挖走。技術可以領先，但人才留不住，一切歸零。

DeepSeek首次融資，不是"AGI理想向資本低頭"那么簡單。這是一場被迫的妥協，是人才困局下的無奈之舉。

梁文鋒曾經想驗證一條"少資源路徑"——用十分之一的錢做出同級模型。DeepSeek-R1做到了。但問題是，做出模型是一回事，留住做模型的人是另一回事。

這是一個殘酷的悖論：技術理想主義需要人才來實現，但人才市場不相信理想主義。當大廠開出2到3倍薪資，當期權四年歸屬后可能價值數億，多少人能抵擋住誘惑？

技術理想主義很美好，但人才市場不相信情懷。當大廠開出2到3倍薪資，當期權四年歸屬后可能價值數億，多少人能抵擋住誘惑？

DeepSeek的困境，是所有AI創業公司的困境。技術可以領先，但人才留不住，一切歸零。

這不是錢的問題，是認知的問題。真正的天才，從來不是被"買"來的，是被"看見"的。

但問題是，大廠也能"看見"他們，而且看得更清楚。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.