文 | 世界模型工場
現(xiàn)在中國互聯(lián)網只剩下一個問號:DeepSeek V4,到底發(fā)不發(fā)?
過去一年多,全球模型競爭早已進入拼刺刀模式。
OpenAI、Anthropic、Google等巨頭基本保持2-3個月甚至1個月一次大迭代,新版本快速推向市場驗證、迭代再驗證。
而DeepSeek在過去15個月,大版本更新放緩,V4多次延期,節(jié)奏明顯落后,已從行業(yè)領跑者變成了慢半拍的那個。
等待的焦慮演變成猜疑的漩渦。
4月初,有媒體突然放出風聲:V4可能在未來幾周發(fā)布,但不要對DeepSeek V4有太高期待。
為什么期待已久的發(fā)布,要提前打預防針?
這一年,DeepSeek到底發(fā)生了什么?
國產化的重任
真相或許藏在一條被大多數(shù)人忽略的新聞里。
2025年1月,路透社報道透露了一個細節(jié):Deepseek R1發(fā)布后,有關部門鼓勵DeepSeek采用華為昇騰處理器,而非繼續(xù)使用英偉達。
"鼓勵"二字,在當時的語境下,重量遠超字面意思。
DeepSeek不是普通的創(chuàng)業(yè)公司,它是中國AI打破美國技術封鎖的第一個成功樣本。
這種象征意義,讓DeepSeek迅速從一家技術公司,變成了國家自主可控戰(zhàn)略棋局上的關鍵棋子。
緊接著,2月份梁文峰參加了那場萬眾矚目的民營企業(yè)座談會。
他被安排坐在第一排,和馬化騰、任正非、雷軍等科技大佬,并肩成為新質生產力的國家隊代表。
政策導向的齒輪,由此開始轉動。
據(jù)外媒報道,DeepSeek在2025年初確實嘗試過用華為昇騰910C芯片訓練下一代模型。
但過程遭遇多重技術障礙:訓練穩(wěn)定性不足,大規(guī)模分布式場景下頻繁崩潰,芯片間通信速度未達預期。
華為派遣工程師團隊前往DeepSeek辦公地點提供現(xiàn)場支持,最終仍未能解決訓練階段的適配問題。
結果是妥協(xié)性的,DeepSeek訓練階段繼續(xù)切回英偉達GPU,昇騰芯片僅用于推理環(huán)節(jié)。
這意味著,至少在訓練這一核心環(huán)節(jié),DeepSeek用了近一年時間在試錯。
但適配工作并未停止。2026年,V4版本傳出新動向。
據(jù)爆料,DeepSeek沒有提前給英偉達開放測試權限,反而優(yōu)先把預發(fā)布版本交給華為新一代昇騰950PR芯片做適配。
同時為分散風險,還同步適配了寒武紀芯片。
但技術挑戰(zhàn)依然顯著。
據(jù)媒體報道,這次的目標是從底層代碼層面完成遷移,從英偉達CUDA生態(tài)全面遷移至華為CANN框架,實現(xiàn)訓練與推理全鏈條的國產化替代。
據(jù)接近項目的人士透露,適配工作的核心難點在于精度對齊,確保模型在不同硬件生態(tài)下輸出一致,這涉及大量底層代碼調整。
時間成本由此產生。
當全球主流廠商保持2-3個月模型迭代節(jié)奏時,DeepSeek卻越來越慢,期間可能有相當大比例的技術資源投入了國產芯片適配。
畢竟國產芯片與英偉達在代際性能、生態(tài)成熟度、工具鏈完備性上確實存在差距,模型適配過程耗時巨大。
這與DeepSeek當初純粹追求模型性能提升的路徑,形成明顯分野。
產業(yè)鏈層面的聯(lián)動也在同步發(fā)生。
2026年初,市場傳出阿里、字節(jié)、騰訊已向華為下單數(shù)十萬顆昇騰950PR芯片。
一種合理的猜測是:頭部云廠商在等待DeepSeek V4的驗證結果,以評估國產芯片在大規(guī)模AI訓練中的實際可用性。
若V4成功跑通,華為950PR將從技術樣品轉化為可商用產品。若未能達到預期,相當于為行業(yè)探明了當前國產芯片的能力邊界。
考慮到梁文鋒對模型發(fā)布的要求一貫極高,達不到預期絕不發(fā)的標準,V4終于即將亮相,很可能在推理側已通過效果測試。
如果真的驗證成功,這將是DeepSeek乃至整個中國AI轉向自主可控的關鍵一步。
身份轉型的代價
DeepSeek主動承擔國產算力生態(tài)驗證的重任,這種選擇讓它更像一家國家使命型公司,而非純粹逐利的市場化玩家。
但轉型的代價顯而易見:短期節(jié)奏放緩、人才壓力增大、競爭力暫緩。
根據(jù)2026年3-4月多家獨立評測和社區(qū)數(shù)據(jù),DeepSeek在第三方基準測試中,代碼生成能力已被Claude 4系列(Opus 4.6 / Sonnet 4.6)顯著超越。
DeepSeek的多模態(tài)處理能力也主要局限于文本+圖像,遠落后于Claude和GPT在圖像分析、計算機使用和視頻理解上的表現(xiàn)。
進入2026年,DeepSeek將產品重點轉向更具挑戰(zhàn)性的Agent系統(tǒng)工程。
根據(jù)當前社區(qū)反饋,DeepSeek在代碼Agent和中文搜索Agent領域已接近第一梯隊,但在多工具協(xié)同、長鏈路任務執(zhí)行以及真實環(huán)境魯棒性上,仍與OpenAI、Google等國際頂尖模型存在明顯的系統(tǒng)工程差距。
這種差距,不一定是技術能力的衰退,更像是在市場競爭與國家戰(zhàn)略之間做出權衡后的結果。
組織層面的代價同樣顯性。
2025年下半年起,DeepSeek核心團隊成員開始出現(xiàn)松動。
據(jù)晚點LatePost確認,王炳宣(第一代大模型核心作者)、郭達雅(R1核心作者)、魏浩然(OCR負責人)、阮翀(多模態(tài)負責人)相繼離職。
這些名字背后,是DeepSeek從V1到R1的技術積淀。
流失的動因復雜,但薪酬體系的相對劣勢是顯性因素。
獵頭透露,競爭對手開出的條件是DeepSeek的"兩到三倍",部分大廠直接給出八位數(shù)總包。
DeepSeek作為未外部融資的初創(chuàng)公司(母公司為幻方量化),薪酬雖絕對值不低,但無法匹配字節(jié)、阿里、騰訊等市場化巨頭的股權激勵和估值溢價。
梁文鋒已開始推動公司估值工作,明確期權定價,給團隊更多確定感。
但在智譜、MiniMax等同行上市、股價高漲的背景下,留住頂尖人才的壓力依然不小。
如今的DeepSeek正在陷入一種身份的模糊。
它仍然需要商業(yè)化,仍然需要留住人才,但同時它又被賦予了國產化適配的期待。
這種雙重身份帶來的沖突,或許正是DeepSeek這一年越來越慢的深層邏輯。
因此,市場對V4的性能預期也在下調。
它未必會成為又一次刷屏的王炸模型,但可能是一個產業(yè)意義上的里程碑,證明中國前沿模型可以在國產硬件生態(tài)上達到可用水平。
V4的答卷,對于中國AI產業(yè)的長期走向可能更為重要。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.