![]()
文|董文
編輯|宋辰
當DeepSeek核心AI研究員郭達雅,以年薪億元的身價正式入職字節(jié)跳動Seed團隊的消息落地,整個大模型圈的目光再次聚焦到這家曾經風光無限的創(chuàng)業(yè)公司身上。
這位95后技術核心的離職與再就業(yè),本是行業(yè)人才流動中的尋常一幕,卻因為天文數(shù)字般的薪水,以及發(fā)生在DeepSeek新一代旗艦模型V4遲遲未能面世的關鍵節(jié)點,而被賦予了更多神秘的意味。
郭達雅并非近期DeepSeek離職的首個技術大牛。在他之前,王炳宣、魏浩然、阮翀等核心技術人員也已離開,四人覆蓋了DeepSeek 最核心的四條技術主線——多模態(tài)、推理/代碼、基座大模型、OCR(文本識別)。
![]()
當技術天才接連離去、新一代旗艦模型V4數(shù)次跳票、線上平臺突發(fā)長時間宕機,這家曾被寄予厚望的大模型明星公司,站到了技術理想與商業(yè)現(xiàn)實、人才流失與戰(zhàn)略轉型的十字路口。
從橫空出世到陷入困局,僅僅兩年時間,DeepSeek經歷了從國產AI之光到爭議纏身的劇烈轉折。DeepSeek的困境,折射出中國大模型行業(yè)在狂飆突進后,集體面臨的成長陣痛與深層危機。
大咖科技
Tech Chic
突如其來的“技術地震”
2023年成立的DeepSeek,依托幻方量化的資金實力與頂尖科學家團隊,迅速成為國產大模型賽道上的一匹黑馬。
從初代模型驚艷亮相,到R1在推理上比肩國際頂尖水平,DeepSeek一度被視作對抗GPT-4的重要力量,資本與市場關注度一路走高。
但2025年下半年開始,DeepSeek驟然陷入沉寂。
原定密集發(fā)布的新一代模型頻頻跳票。比進度滯后更引人關注的是核心技術團隊的大規(guī)模流失,多位從V1模型到R1模型全程參與的頂尖人才相繼離職,有的被大廠高薪挖走,有的轉向其他賽道創(chuàng)業(yè)。
最新離開的郭達雅深度參與了從V系列模型到R1等關鍵版本的研發(fā)工作,尤其在推理、代碼能力等DeepSeek賴以成名的技術方向上扮演了關鍵設計者的角色。
對于高度依賴頂層架構設計與核心算法突破的大模型項目而言,郭達雅這樣的人才一旦離開,帶來的不僅是人員空缺,更是技術路線、工程經驗與研發(fā)節(jié)奏的斷層,是公司一次難以快速彌補的技術損失。而這樣的人才,DeepSeek半年內就走了四個。
大模型研發(fā)并非簡單的流水線工程,一個核心人物的思路、判斷與經驗,往往貫穿訓練、微調、對齊、工程優(yōu)化等全流程。新人接手,不僅需要時間熟悉代碼與架構,更要重新理解模型設計的底層邏輯,這直接導致了關鍵項目的節(jié)奏被打亂。
![]()
對一家高度依賴核心技術天才的AI初創(chuàng)公司而言,這樣的人員動蕩幾乎等同于“技術地震”。人才出走不僅帶走了關鍵研發(fā)經驗,也直接打亂了模型迭代節(jié)奏,外界對其技術穩(wěn)定性與內部管理的質疑聲隨之四起。
屋漏偏逢連夜雨,敏感時期DeepSeek線上服務又出現(xiàn)長時間宕機,大量企業(yè)客戶受影響,進一步加劇了市場擔憂。曾經一路高歌的明星公司,突然走到了輿論的風口浪尖。
DeepSeek的核心人才流失,并非簡單的行業(yè)挖角,而是理想主義與現(xiàn)實壓力碰撞后的必然結果。
這群年輕的技術天才,最初被DeepSeek純粹的科研氛圍吸引。公司一度推行極簡管理、弱化KPI,梁文峰希望打造一個不受商業(yè)干擾的技術理想國,讓科學家專注于沖擊AGI與全球頂尖模型性能。這種環(huán)境在早期激發(fā)出驚人創(chuàng)造力,也讓團隊對技術本身抱有極高期待。
但變化來得猝不及防。一方面,國內互聯(lián)網大廠開出數(shù)倍薪資與豐厚期權,對核心人才形成難以抗拒的吸引力。同等強度的工作,在大廠能獲得更明確的職業(yè)路徑與更確定的收益,情懷在懸殊的價碼面前逐漸失去說服力。
更深層的矛盾來自公司戰(zhàn)略的突然轉向。
隨著外部芯片環(huán)境收緊與自主可控要求提升,DeepSeek放棄成熟的英偉達架構,全面轉向國產算力適配。
據(jù)悉,DeepSeek V4模型將首次實現(xiàn)與華為昇騰等國產芯片的深度適配。這標志著中國AI產業(yè)在擺脫對國外技術生態(tài)依賴、推進去CUDA化進程中邁出了具有里程碑意義的關鍵一步。
但這同時也意味著DeepSeek核心團隊此前大量研發(fā)成果需要推翻重訓。對于追求技術巔峰的科學家而言,這不僅僅是工作量的陡增。當理想中的AGI探索變成繁重的適配工程,離開或許也就成了意料之中的選擇。
大咖科技
Tech Chic
公司組織與戰(zhàn)略之困
產品延期疊加核心人才變動,外界很自然地將兩者關聯(lián),進而對DeepSeek的持續(xù)研發(fā)能力產生懷疑。對比同期崛起的競品,DeepSeek的這種“落差”顯得更為明顯。
智譜AI今年1月8日完成公開上市后,在資本市場的加持下持續(xù)加大研發(fā)投入,模型能力與商業(yè)化同步推進;Kimi在長文本理解與專業(yè)場景體驗上建立了鮮明壁壘,用戶粘性與商業(yè)變現(xiàn)路徑日漸清晰。
這些AI大模型公司有的登陸資本市場獲得充足“彈藥”,有的在垂直場景賺得盆滿缽滿,而DeepSeek卻仍在模型迭代與人才穩(wěn)定的泥潭中掙扎。這種對比,讓市場上出現(xiàn)了“DeepSeek是否曇花一現(xiàn)”的討論。
模型迭代速度就是生命線,一旦長期沒有重磅產品面世,用戶注意力與行業(yè)關注度就會迅速被競品吸引,技術口碑也會隨之淡化。早期依靠驚艷表現(xiàn)建立起來的領先優(yōu)勢,如果不能持續(xù)通過新版本鞏固,很容易在激烈競爭中被稀釋甚至反超。
深層剖析V4模型的屢次跳票,表面是技術進度問題,本質是DeepSeek在戰(zhàn)略切換與組織管理上的系統(tǒng)性困境。
為了實現(xiàn)代際突破,同時適配全新的國產算力平臺,DeepSeek選擇對模型架構進行激進升級,從參數(shù)規(guī)模到上下文窗口再到多模態(tài)能力,都提出極高目標。
這相當于在高速推進中徹底重構模型,訓練難度、工程復雜度成倍上升,再加上國產芯片生態(tài)尚不完善,適配、集群穩(wěn)定性還需時間,直接導致V4的發(fā)布時間一推再推。
![]()
比技術挑戰(zhàn)更棘手的是組織能力的脫節(jié)。DeepSeek長期依賴高度扁平化的管理模式,創(chuàng)始人梁文鋒一人主導關鍵技術決策,項目推進高度依賴核心天才。
小團隊階段,這種模式高效靈活;但隨著公司擴張、人才流失、攻堅任務加重,組織立刻暴露出短板。核心人員缺位后,技術方向難以快速統(tǒng)一,決策鏈條拉長,原本順暢的研發(fā)節(jié)奏可能會被打亂。
DeepSeek的困境,也是許多中國AI創(chuàng)業(yè)公司的縮影:依靠天才與資本快速起量,卻在規(guī)模擴張、外部環(huán)境劇變時,暴露出短板。
中國大模型在經歷兩年狂飆后,正從單純比拼模型參數(shù)、追求速度,轉向更務實的自主可控、商業(yè)落地與組織建設。
天才出走、模型難產,讓DeepSeek從巔峰驟然承壓。對它來說,V4模型不僅是一次版本升級,更是一場重建市場信心的背水一戰(zhàn)。
最新消息是,梁文鋒在內部會議確認4月下旬將發(fā)布V4模型,希望這一次不再跳票。V4模型的表現(xiàn)究竟會怎樣,也將直接決定這家明星公司的下一程。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.