網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

DeepSeek更新“前夜”，有些問題得提前理一理

2026-04-10 18:22:33　來源: 鳳凰網(wǎng)科技

北京舉報

分享至

摘要：

V4是不是DeepSeek的分水嶺？

鳳凰網(wǎng)科技出品

作者｜Dale

編輯｜董雨晴

4月10日，據(jù)多位知情人士向《創(chuàng)智記》透露，DeepSeek創(chuàng)始人梁文鋒在內(nèi)部溝通中首次明確了V4的發(fā)布節(jié)奏——備受期待的新一代旗艦大模型DeepSeek V4計劃于4月下旬正式與公眾見面。

鳳凰網(wǎng)科技就此消息向DeepSeek方面詢問，截至發(fā)稿未取得回應(yīng)。

此前，DeepSeek剛剛完成版本更新。首次在模式上進(jìn)行分層，推出了快速和專家兩個模式。在點擊開始入口處，原本“體驗DeepSeekV3.2”的字樣也消失不見了。

優(yōu)等生DeepSeek的煩惱

DeepSeek V4的撲朔，建立在一個復(fù)雜的背景之上。

2025年初，R1的發(fā)布，曾經(jīng)是國內(nèi)大模型創(chuàng)企揮之不去的“陰影”。用了半年時間，這些曾經(jīng)的明星企業(yè)才憑借新的旗艦?zāi)Ｐ突氐焦娨曇埃蛏鲜小⒒蜷_啟新一輪融資。

在成名前，梁文鋒曾與少部分VC進(jìn)行過會談，但據(jù)當(dāng)時與其有過接觸的人士向鳳凰網(wǎng)科技表述，梁文鋒的本意也不是融資，而是看看機構(gòu)的風(fēng)格。

《晚點LatePost》也在報道中寫道，梁文鋒曾在會面中提出類似OpenAI與微軟投資協(xié)議的回報上限條款，但無機構(gòu)接受，此后再無投資人會面。

2025年成名后，DeepSeek的風(fēng)格是更加對內(nèi)收斂,一些原本在社交媒體更新的員工賬號開始停更。

據(jù)《晚點LatePost》報道，DeepSeek不加班，他們不打卡、沒有明確的績效考核，平日多數(shù)成員會在下午6點至7點左右離開公司。

但隨著智譜、MiniMax等公司上市后激增的市值，DeepSeek的估值問題正成為內(nèi)部壓力點。DeepSeek員工對手中未定價的期權(quán)有了更多疑問，梁文鋒近期開始考慮公司估值的問題。

除此之外，從2025年秋天起，梁文鋒開始更多提及“產(chǎn)品化和商業(yè)化”。在公開的招聘信息中，官方HR也表述有產(chǎn)品、設(shè)計、數(shù)據(jù)百曉生等崗位開放。甚至是職能崗也在擴充, 早在2025年11月，DeepSeek還開放過行政招聘，據(jù)相關(guān)人士表述“是因為團(tuán)隊大了，需要更多的行政伙伴”。

變化之下，可能讓拖延數(shù)月的V4存在諸多變數(shù)，但其掀起的熱潮不會遷移。

OpenRouter平臺數(shù)據(jù)顯示，2026 年 2 月，中國大模型在 OpenRouter 上周調(diào)用量首次超過美國模型，這一態(tài)勢一直持續(xù)到3月。本周，排在前五位的模型，依舊有三個來自中國，分別是排名第一的DeepSeek V3.2和排名第二的MiniMax M2.7和第四的MiniMax M2.5。

毫無疑問，DeepSeek V4的到來，有望延續(xù)這份優(yōu)勢。

V4算不算DeepSeek的分水嶺？

把R1和V4放在一起看，這個變化的輪廓會變得更清晰。

R1的突破是范式性的——它在學(xué)術(shù)層面開創(chuàng)了“純強化學(xué)習(xí)激發(fā)推理能力”的新路徑，論文登上Nature封面，以586萬美元的成本實現(xiàn)了對標(biāo)GPT-4的性能，徹底改變了全球?qū)χ袊鳤I模型的認(rèn)知。

Hugging Face在“DeepSeek時刻一周年”回顧中指出，R1“降低了技術(shù)與應(yīng)用門檻，不僅是中國AI發(fā)展的轉(zhuǎn)折點，更在全球范圍內(nèi)引發(fā)了開源模式的深刻變革”。

V4的戰(zhàn)略意義截然不同。它不再回答“中國能不能做出世界級模型”，而是在回答兩個更具體的問題：“中國AI能不能在算力封鎖下持續(xù)進(jìn)化”，以及“大模型能不能變成能賺錢的企業(yè)級產(chǎn)品”。

所以，V4算不算DeepSeek的分水嶺？

如果說R1是DeepSeek在“純推理”路線上站住腳、打響全球名聲的第一槍，那么V4就是DeepSeek證明自己不只是“技術(shù)奇才”、而是能在中國AI產(chǎn)業(yè)生態(tài)中找到不可替代位置的標(biāo)志性產(chǎn)品。

R1的意義在于“做了一件別人覺得中國公司做不了的事”。V4的意義在于“在一個被封鎖的環(huán)境中，自己鋪了一條能走下去的路”。

與此同時，站在學(xué)術(shù)界，新的風(fēng)向也在產(chǎn)生。DeepSeek的使命一度是探索未知，追求AGI。

去年底，姚順雨、林俊旸、楊植麟、唐杰等人在清華同臺，探討的是底層范式的話題。在海外，Yann LeCun言稱LLM是“死胡同”，Jim Fan說“視覺是連接大腦、運動系統(tǒng)和物理世界的最高帶寬通道”。甚至一些觀點認(rèn)為，追求AGI的重任或許該落在世界模型身上了。

敏感的VC，是最早嗅到市場風(fēng)向的人。頗為巧合的是，代表世界模型陣營的李飛飛和楊立昆，均剛剛完成10億美元級別的新融資，國內(nèi)代表生數(shù)科技4月10日也剛剛官宣獲得了A++輪融資，融資金額近20億人民幣。

繪圖｜DeepSeek

就目前披露的信息而言，DeepSeek選擇的仍然是基于LLM架構(gòu)的優(yōu)化和工程化落地。而V4最核心的突破是集中在這三件事上：萬億參數(shù)MoE架構(gòu)、原生多模態(tài)能力和國產(chǎn)芯片適配。

對于DeepSeek來說，在算力和資金都存在約束的情況下，把資源投向架構(gòu)效率和國產(chǎn)化適配，比追逐一個距離產(chǎn)品化還很遙遠(yuǎn)的范式，更務(wù)實、更符合它“少花錢辦大事”的底色。

值得注意的是，DeepSeek并非完全沒有多模態(tài)的積累。此前開源的DeepSeek-OCR系列已經(jīng)展示了將視覺作為文本壓縮媒介的探索，通過將文本以圖片方式輸入，極大減少token消耗。

但這些探索的方向仍然是“優(yōu)化文本模型的效率和成本”，而不是“構(gòu)建對物理世界的理解和預(yù)測”。

如果拉長時間線來看，DeepSeek的這條“分水嶺”可能還有更深的一層含義——它不是一條岔路，而是一道選擇題：在中國AI產(chǎn)業(yè)的現(xiàn)實土壤上，是追隨“世界模型”的范式革命，還是在現(xiàn)有架構(gòu)上把工程優(yōu)化和自主可控做到極致？

當(dāng)然，如果DeepSeek未來真的在視覺和空間推理上投入更多資源，以它的架構(gòu)創(chuàng)新能力，切入“輕量級世界模型”領(lǐng)域并非不可能。但在當(dāng)下，V4的任務(wù)很清楚：在中國AI產(chǎn)業(yè)最需要的方向上，交出一份能打的答卷。

這個選擇是否成立，不需要等太久。4月下旬V4正式發(fā)布后，市場的反饋會給出最誠實的答案。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.