核心人才被大廠以千萬(wàn)年薪挖角、算力存貨見(jiàn)底、巨頭全棧反攻,DeepSeek那套"四兩撥千斤"的打法正在被稀釋。但變中也有不變:V4版本又把價(jià)格砍到行業(yè)生死線,開(kāi)源仍是信仰,華為昇騰的硬骨頭還得啃。
———— / BEGIN / ————
6月3日,據(jù)媒體援引消息人士稱(chēng),DeepSeek預(yù)計(jì)將在其首輪融資中籌集約500億元(約合74億美元),該公司的估值可能在3500億至4000億元(合520億至590億美元)之間。而DeepSeek創(chuàng)始人梁文鋒已承諾投入200億元自有資金,騰訊、寧德時(shí)代正分別考慮投資100億元、50億元,或?qū)⒊蔀楸据喨谫Y中最大的兩個(gè)外部投資者。
消息人士還表示,DeepSeek正在與國(guó)家級(jí)人工智能基金、網(wǎng)易、京東等進(jìn)行最后階段的洽談,IDG資本和Monolith Capital也在潛在投資者之列。計(jì)劃中的投資者數(shù)量少于10家,預(yù)計(jì)數(shù)周內(nèi)敲定,但具體條款仍可能變化。截至發(fā)稿,相關(guān)方均未對(duì)此交易有所回應(yīng)。
梁文鋒還是變了。
可以說(shuō),他是過(guò)去兩年中國(guó)AI圈里“不變”的堅(jiān)定代表,當(dāng)同行紛紛融資、上市、搶用戶(hù)、拼商業(yè)化的時(shí)候,他靜如處子。業(yè)內(nèi)人士評(píng)價(jià)DeepSeek像研究機(jī)構(gòu):不設(shè)KPI、不趕Deadline(最后期限)、研究員下午六點(diǎn)多就下班。這背后是據(jù)傳管理規(guī)模超700億元、一年利潤(rùn)約50億元的幻方量化(梁文鋒旗下的量化對(duì)沖基金公司,以下簡(jiǎn)稱(chēng)“幻方”),在持續(xù)輸血。
2025年初R1版本發(fā)布,“DeepSeek時(shí)刻”一度引發(fā)英偉達(dá)等AI、芯片巨頭股價(jià)的劇烈震蕩。隨后,梁文鋒被《Nature》評(píng)為2025年度十大科學(xué)人物。《Nature》稱(chēng),與模型的高度開(kāi)放形成對(duì)比,這位企業(yè)家本人極其低調(diào),“他拒絕了采訪請(qǐng)求”。
彼時(shí)的他,態(tài)度明確——短期內(nèi)沒(méi)有融資計(jì)劃,DeepSeek面臨的問(wèn)題從來(lái)不是錢(qián),而是高端芯片。而如今,他親手推翻了這句話。
梁文鋒1985年生于廣東湛江吳川,父親是小學(xué)教師。據(jù)報(bào)道,他童年里會(huì)反復(fù)拆裝一臺(tái)收音機(jī),那股死磕細(xì)節(jié)的勁頭一直留到現(xiàn)在。少年時(shí),他數(shù)學(xué)出眾,進(jìn)入浙江大學(xué)讀電子信息工程,研究生階段做機(jī)器視覺(jué);畢業(yè)后,他沒(méi)有去大廠,而是一頭扎進(jìn)當(dāng)時(shí)還冷門(mén)的量化投資領(lǐng)域。
2013年,他與校友徐進(jìn)創(chuàng)辦杭州雅克比投資管理公司,2015年又共同創(chuàng)立幻方,班底多為來(lái)自浙江大學(xué)的同儕。據(jù)報(bào)道,公司長(zhǎng)期把約七成年收入投向研發(fā)與人才,十年間,幻方一度做到了千億元資金管理規(guī)模。
早在2019年,幻方就投入近2億元自研深度學(xué)習(xí)訓(xùn)練平臺(tái)“螢火一號(hào)”,搭載約1100塊GPU;兩年后又斥資10億元上線“螢火二號(hào)”,搭載約1萬(wàn)張英偉達(dá)A100 GPU。據(jù)報(bào)道,彼時(shí)國(guó)內(nèi)擁有超過(guò)一萬(wàn)枚GPU的企業(yè)不超過(guò)五家,除幻方外都是互聯(lián)網(wǎng)大廠,單看算力,這家量化公司更早拿到了做AI的入場(chǎng)券。
2023年,38歲的梁文鋒決定“All in”AI。那一年,ChatGPT橫掃全球,國(guó)內(nèi)的普遍共識(shí)是沒(méi)有數(shù)萬(wàn)張高端顯卡、百億元級(jí)別投入,做不出頂級(jí)大模型,與其追趕,不如去做應(yīng)用。他帶著一支百余人的本土團(tuán)隊(duì)入場(chǎng),而當(dāng)時(shí)OpenAI已經(jīng)有約1200名研究人員,Anthropic有500多名。同年7月,DeepSeek成立,第一期研發(fā)由幻方自主出資約30億元。
梁文鋒從一開(kāi)始就選擇了“未被選擇”的路——極致低成本、全面開(kāi)源。
2024年5月,V2版本以創(chuàng)新架構(gòu)把API價(jià)格壓到每百萬(wàn)tokens輸入1元、輸出2元,約為GPT-4 Turbo的百分之一;2025年1月的R1版本,據(jù)其論文顯示,訓(xùn)練成本約29.4萬(wàn)美元、構(gòu)建基礎(chǔ)模型約600萬(wàn)美元,卻做出了媲美頂尖閉源模型的推理能力,并隨即全面開(kāi)源。
在《暗涌》的專(zhuān)訪里,梁文鋒把自己的邏輯講得很透:“封閉技術(shù)是筑墻,開(kāi)源才是建橋”。他也警惕用錢(qián)砸出來(lái)的領(lǐng)先,“一味堆砌算力是飲鴆止渴”,如果提高5%的性能要付出10倍成本,在他看來(lái)“就是不道德的創(chuàng)新”。
這套理念,落到組織上是一種近乎“無(wú)為”的管理。DeepSeek沒(méi)有KPI,也幾乎沒(méi)有固定團(tuán)隊(duì)、匯報(bào)關(guān)系和年度計(jì)劃;戰(zhàn)略按周迭代,研究員可以不經(jīng)審批調(diào)用訓(xùn)練集群的卡、按興趣自由組隊(duì)。梁文鋒相信“創(chuàng)新首先是一個(gè)信念問(wèn)題,首先是敢”,而這種自信“在年輕人身上更明顯”。
支撐這種純粹的,是他對(duì)公司的絕對(duì)控制。天眼查顯示,4月末,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(DeepSeek的運(yùn)營(yíng)主體)注冊(cè)資本由1000萬(wàn)元增至1500萬(wàn)元。其中,梁文鋒認(rèn)繳出資增加500萬(wàn)元至510萬(wàn)元,直接持股比例由1%升至34%。調(diào)整后,他通過(guò)直接與間接方式合計(jì)控制超80%的股權(quán),業(yè)內(nèi)人士把這種控制稱(chēng)作他“保護(hù)理想的防火墻”。
而在首輪對(duì)外融資中,他個(gè)人出資的200億元,看上去又要在這個(gè)估值區(qū)間里擁有主導(dǎo)對(duì)話的權(quán)利。從這一點(diǎn)看,梁文鋒其實(shí)也沒(méi)變,變的是行業(yè)環(huán)境、競(jìng)爭(zhēng)規(guī)則和DeepSeek所處的階段。
從橫空出世那一天起,外界就驚訝于他的獨(dú)特:不融資、不站隊(duì),不靠大廠輸血,卻偏偏走在開(kāi)源、低價(jià)、國(guó)產(chǎn)替代這幾條最難的路上。媒體樂(lè)于把他稱(chēng)作“下一個(gè)任正非”——同樣深居簡(jiǎn)出,同樣攥緊公司控制權(quán),也始終不懼怕“華山一條路”。
但時(shí)代終究不同了。華為可以不上市、不引入資本,而DeepSeek面對(duì)的,是巨頭已經(jīng)跑起來(lái)的速度。梁文鋒撕開(kāi)的或許是一道“紙枷鎖”,這未必是妥協(xié)。只是那條極具浪漫主義的路徑,走到了今天,他確實(shí)該換一副鎧甲了。
變量
2024年底,DeepSeek的V3版本發(fā)布前后,一則熱搜把這家低調(diào)的公司推到了風(fēng)口浪尖。
據(jù)傳,小米創(chuàng)始人雷軍親自下場(chǎng),開(kāi)出千萬(wàn)元年薪,要把DeepSeek研究員羅福莉挖去執(zhí)掌小米的大模型團(tuán)隊(duì)。羅福莉是北京大學(xué)計(jì)算語(yǔ)言學(xué)碩士,讀研時(shí)就以一年八篇頂會(huì)論文成名,后來(lái)從阿里達(dá)摩院轉(zhuǎn)投幻方、再到DeepSeek,參與了V2版本的研發(fā)。
幾乎一夜之間,“AI天才少女”的標(biāo)簽貼滿(mǎn)全網(wǎng)。數(shù)月以后,她在凌晨發(fā)了條朋友圈:“請(qǐng)互聯(lián)網(wǎng)還我一片安安靜靜做事的氛圍吧……我并非什么天才少女,神化一個(gè)人的結(jié)果就是捧得多高、摔得多重。”她說(shuō),自己只想做“難而正確的事”。
羅福莉不是個(gè)例,從2025年下半年起,DeepSeek幾乎成了同行的“獵場(chǎng)”。
提出R1版本核心算法GRPO的郭達(dá)雅去了字節(jié)跳動(dòng)的Seed團(tuán)隊(duì)、第一代大語(yǔ)言模型的核心作者王炳宣加盟騰訊混元、多模態(tài)負(fù)責(zé)人阮翀去了元戎啟行、OCR核心魏浩然也已離開(kāi)……他們大多是DeepSeek歷代模型論文上的署名者,是把這家公司送上神壇的那批人。
挖墻腳的籌碼很直白。據(jù)報(bào)道,大廠為單個(gè)核心研究員開(kāi)出的薪資總包可達(dá)數(shù)千萬(wàn)元乃至上億元。“以前都說(shuō)大模型拼數(shù)據(jù)、算法、算力,現(xiàn)在看,到最后拼的是人。”很多從業(yè)者的這句感慨,DeepSeek應(yīng)該體會(huì)得最深。
2025年底以來(lái),這家以研究著稱(chēng)的公司也開(kāi)始“開(kāi)閘式”招聘產(chǎn)品經(jīng)理、搭建數(shù)個(gè)創(chuàng)新產(chǎn)品團(tuán)隊(duì),探索Agent與C端產(chǎn)品形態(tài)。
而梁文鋒手里沒(méi)有能跟大廠對(duì)標(biāo)的籌碼——沒(méi)有成熟的期權(quán)就留不住人,而要把期權(quán)發(fā)出去、給團(tuán)隊(duì)份額重新定價(jià),融資幾乎是唯一的出口。
除了留人,算力更是“吞金獸”。
DeepSeek早年那些“低成本奇跡”,很大程度上是用幻方囤下的那批顯卡喂出來(lái)的。但是在新的環(huán)境下,存貨顯然不夠用。據(jù)多家媒體報(bào)道,新旗艦產(chǎn)品V4版本要把訓(xùn)練和推理從英偉達(dá)耕耘了二十年的CUDA生態(tài),整體搬到華為昇騰的CANN體系上。這意味著底層代碼近乎重寫(xiě),單輪訓(xùn)練成本據(jù)稱(chēng)超過(guò)5億美元。
最受期待的R2版本遲遲不來(lái),也被認(rèn)為是性能還沒(méi)達(dá)到預(yù)期。被推上“國(guó)產(chǎn)軟硬協(xié)同”試驗(yàn)場(chǎng)的DeepSeek,2026年初拿出的mHC架構(gòu),又一次試圖以算法上的原創(chuàng)去抵消算力上的劣勢(shì)。但很長(zhǎng)一段時(shí)間內(nèi),外界顯然感受到了它的“吃力”。
把時(shí)間往回?fù)埽珼eepSeek原本只是幻方的一條AI“副線”。2024年5月,它把API價(jià)格一路打到每百萬(wàn)tokens輸入1元、輸出2元,當(dāng)月就逼得大廠紛紛跟進(jìn),掀起一場(chǎng)持續(xù)半年多的價(jià)格戰(zhàn),“價(jià)格屠夫”“AI界拼多多”的名號(hào)由此而來(lái)。當(dāng)年底的V3版本,又用不到GPT-4十分之一的訓(xùn)練成本,做出了能與全球一線同臺(tái)比較的模型,把只有少數(shù)美國(guó)巨頭才玩得起大模型的敘事撕開(kāi)了一道口子。
可兩年過(guò)去,情況全變了。據(jù)報(bào)道,2025年8月豆包的月活已達(dá)1.57億,反超DeepSeek。而2026年被多家媒體稱(chēng)作中國(guó)AI的“大年”,春節(jié)前后,豆包、千問(wèn)、元寶與DeepSeek齊齊沖進(jìn)月活過(guò)億,而新模型產(chǎn)品還在接連登場(chǎng)。
有分析師把2025年末視作一道分水嶺:那些算力與生態(tài)深厚的巨頭,對(duì)DeepSeek們發(fā)起了全面反攻,比拼從“單點(diǎn)技術(shù)突破”轉(zhuǎn)向“全棧能力”。當(dāng)戰(zhàn)爭(zhēng)從“四兩撥千斤”升級(jí)為算力、人才、產(chǎn)品、生態(tài)的全面對(duì)耗,DeepSeek那套靠開(kāi)源、能效與克制變現(xiàn)撐起來(lái)的打法,優(yōu)勢(shì)正在被稀釋。
人、顯卡、對(duì)手,三股壓力匯聚一處,錢(qián)自然成了那個(gè)繞不開(kāi)的變量。
普惠
而4月,沉寂一段時(shí)間的DeepSeek“回來(lái)”了。
V4預(yù)覽版上線沒(méi)幾天,就把價(jià)格降到了行業(yè)的生死線:緩存命中場(chǎng)景的輸入價(jià)被砍掉九成,降到每百萬(wàn)tokens幾分錢(qián)。據(jù)開(kāi)發(fā)者拆解,V4版本單位token的推理算力只有上一代V3.2版本的約四分之一。
這仍是梁文鋒的效率邏輯。當(dāng)部分同行控價(jià)保利,把模型當(dāng)成一門(mén)要賺錢(qián)的生意時(shí),DeepSeek又一次逆著風(fēng)向砍了下去。
6月2日,騰訊云宣布,智能體開(kāi)發(fā)平臺(tái)將對(duì)DeepSeek-V4系列模型價(jià)格進(jìn)行下調(diào),最高降幅達(dá)97.5%。這是繼5月22日DeepSeek官方宣布V4-Pro模型API永久降價(jià)、5月27日小米跟進(jìn)旗下MiMo系列降價(jià)最高99%之后,國(guó)產(chǎn)AI大模型領(lǐng)域掀起的又一輪“普惠潮”。
與此同時(shí),6月3日晚,豆包發(fā)布《關(guān)于豆包即將推出專(zhuān)業(yè)版的說(shuō)明》,計(jì)劃面向?qū)I(yè)人群推出付費(fèi)“專(zhuān)業(yè)版”,但強(qiáng)調(diào)日常基礎(chǔ)功能仍然免費(fèi)。一邊降價(jià)普惠,一邊分層收費(fèi),路線分野更清楚了。
價(jià)格之外,DeepSeek這家公司也在變。據(jù)行業(yè)報(bào)道,DeepSeek的員工已經(jīng)開(kāi)始走出實(shí)驗(yàn)室,向各行各業(yè)推銷(xiāo)模型,試著把技術(shù)變成能收費(fèi)的產(chǎn)品;計(jì)劃6月推出的V4.1版本,會(huì)給企業(yè)用戶(hù)配更多工具、強(qiáng)化對(duì)MCP協(xié)議的支持、補(bǔ)上圖像與音頻的理解能力……
用行業(yè)媒體援引知情人士的話說(shuō),這輪融資本身,也在推動(dòng)著DeepSeek加快迭代、“向行業(yè)主流看齊”、把營(yíng)收規(guī)劃真正落地。
回到V4版本本身。除了又一次把模型拉到“白菜價(jià)”之外,梁文鋒還專(zhuān)門(mén)針對(duì)多款主流Agent產(chǎn)品做了適配與調(diào)校。按DeepSeek內(nèi)部的說(shuō)法,在Agentic Coding的評(píng)測(cè)里,V4-Pro版本已經(jīng)做到開(kāi)源模型中的最好水平。
不過(guò),團(tuán)隊(duì)在技術(shù)報(bào)告里也沒(méi)有回避差距,直言V4版本的綜合能力仍落后于GPT-5.4與Gemini-3.1 Pro,整體進(jìn)度比最前沿的閉源模型大約慢三到六個(gè)月。對(duì)標(biāo)最頂尖的那幾個(gè)對(duì)手,梁文鋒要解的其實(shí)始終是同一道題:當(dāng)算力越來(lái)越貴,他還能不能靠架構(gòu)上的極致創(chuàng)新,把成本一次次拉下來(lái)。
“不誘于譽(yù),不恐于誹,率道而行,端然正己。”V4版本的發(fā)布公告里,梁文鋒以這樣的一句總結(jié)表明初心。
他想做的原本是最好的基礎(chǔ)模型和前沿創(chuàng)新,可當(dāng)巨頭掉頭反攻,這種“克制”越來(lái)越奢侈;而要在引入資本的同時(shí)守住路線主導(dǎo)權(quán),他也只能親自押上200億元。
據(jù)行業(yè)報(bào)道,在轉(zhuǎn)向公開(kāi)融資之前,梁文鋒曾與某互聯(lián)網(wǎng)大廠就獨(dú)家注資數(shù)次商談,但對(duì)方“出讓20%股份”的條件沒(méi)有得到他的同意,他最終選擇了一輪誰(shuí)都無(wú)法單獨(dú)主導(dǎo)的多方融資。
分析人士算過(guò)一筆賬,按一百倍市銷(xiāo)率推算,500多億美元的估值需要大約5億美元的年收入來(lái)托底,而DeepSeek的收入結(jié)構(gòu)相對(duì)單一,開(kāi)源又讓大量企業(yè)選擇自行部署、繞開(kāi)了付費(fèi)API。未來(lái)一年,最大的問(wèn)題是它能不能把收入真正放量。
事實(shí)上,DeepSeek已經(jīng)在自建數(shù)據(jù)中心、招募數(shù)據(jù)中心工程師,寧德時(shí)代入股也是補(bǔ)齊“從模型到能源”的全棧邏輯。
可以預(yù)期的是,梁文鋒會(huì)繼續(xù)硬啃華為昇騰。V4版本已經(jīng)在技術(shù)報(bào)告里給華為昇騰和英偉達(dá)各留了一手,他賭的是國(guó)產(chǎn)替代終能跑通,哪怕過(guò)程坎坷。開(kāi)源大概率仍會(huì)是他的信仰,也是他最深的護(hù)城河。
他在《暗涌》專(zhuān)訪里說(shuō)過(guò),要讓中國(guó)的AI從技術(shù)的受益者,變成貢獻(xiàn)者。而這一次,他把自己的200億元也一起押了上去。
本文來(lái)自公眾號(hào):中國(guó)企業(yè)家雜志 作者:陳浩 馬吉英 見(jiàn)習(xí)編輯:張昊 編輯:馬吉英
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.