![]()
![]()
臨近4月24日中午,DeepSeek官方公眾號發(fā)布公告:《DeepSeek-V4 預(yù)覽版:邁入百萬上下文普惠時代》。被催更已久的V4終是來了、
![]()
在我看來,寫在這篇公告文章最末尾的一句話,比前面所有跑分數(shù)據(jù)都重要:
“不誘于譽,不恐于誹,率道而行,端然正己。”
這是一個組織,在承受了十五個月的猜測、質(zhì)疑、唱衰之后,對外界的唯一回應(yīng)。把這句話放在更大的背景中讀,它的潛臺詞大約是:我們知道自己在做什么,我們不在乎你們怎么說。
而V4給出的答卷,確實不是一次常規(guī)迭代。
在我看來,V4的核心意義并不在于跑分——盡管V4-Pro在Apex Shortlist上拿到90.2%,Codeforces Rating沖到3206,在開源模型中已是碾壓級的存在。真正的分水嶺,藏在三個數(shù)字里:
第一,成本。 1M上下文中,V4-Pro的單token推理FLOPs只有V3.2的27%,KV Cache只有10%;V4-Flash更極端,分別壓到10%和7%。這意味著上下文從128K擴展到1M,理論負載膨脹近8倍,而單token算力消耗反而下降了。在AI行業(yè),能力提升通常以算力膨脹為代價。V4打破了這個規(guī)律。這種反向的效率革命,讓很多原本只存在于白皮書里的Agent場景,突然有了經(jīng)濟可行性。
第二,芯片。 V4全面運行于華為昇騰、寒武紀(jì)等國產(chǎn)芯片,技術(shù)架構(gòu)從CUDA轉(zhuǎn)向CANN框架。這是全球首個在純國產(chǎn)算力上訓(xùn)練和部署的萬億參數(shù)MoE模型。按黃仁勛話說:“這對美國是糟糕的結(jié)果。” V4驗證了一件事:離開CUDA生態(tài),中國AI的底層算力循環(huán)可以跑通。這個信號對產(chǎn)業(yè)鏈的沖擊,遠比模型本身的跑分更具顛覆性。
第三,Agent。 V4-Pro在Agentic Coding評測中已是開源最佳,內(nèi)部使用體驗優(yōu)于Sonnet 4.5,交付質(zhì)量接近Opus 4.6非思考模式。同時,V4針對Claude Code、OpenClaw、CodeBuddy等主流Agent框架做了專項優(yōu)化——這不是一個“能聊天”的模型,而是一個“能干活”的模型。從V4開始,DeepSeek的定位明確轉(zhuǎn)向Agent基礎(chǔ)設(shè)施。
這三個信號加在一起,指向一個更底層的判斷:V4之后,中國AI應(yīng)用寒武紀(jì)大爆發(fā)的奇點降臨了。
01
奇點
這個判斷需要解釋。
5.4億年前,寒武紀(jì)生命大爆發(fā)。在地質(zhì)尺度上幾乎是一瞬間,海洋中涌現(xiàn)出大量形態(tài)各異的動物門類。更準(zhǔn)確的說法是,可辨識的動物化石群集在化石記錄中驟然陡現(xiàn)。學(xué)界有一個共識:寒武紀(jì)爆發(fā)的前提不是單一因素,而是氧氣濃度、海洋化學(xué)、生態(tài)位空缺、Hox基因演化等多個條件的同步滿足。物種多樣性突然躍升,是因為底層環(huán)境達到了臨界閾值。
今天AI產(chǎn)業(yè)的底層環(huán)境正在達到同一類閾值。
首先是成本閾值。V4-Flash定價每百萬token輸入1元(緩存未命中)、輸出2元。V4全面適配國產(chǎn)芯片,基本證明在Agent時代,在推理側(cè)不過度依賴英偉達高端GPU的可行性。
這一邏輯,意味著一個開發(fā)者用幾美元就能處理一部《三體》體量的上下文。成本下降到這一水平,應(yīng)用場景會從“能做什么”變成“為什么不試試”,這才是Agent落地的真正基礎(chǔ)。
其次是性能閾值。在Agentic Coding評測中,V4-Pro已是開源最強,內(nèi)部使用體驗優(yōu)于Sonnet 4.5。在1M上下文設(shè)置下,V4-Pro的單token推理FLOPs只有V3.2的27%,這一效率突破在全球范圍內(nèi)領(lǐng)先。在數(shù)學(xué)、STEM、競賽型代碼測評中,V4-Pro超越所有已公開評測的開源模型,比肩世界頂級閉源模型。
這楊的基本事實,意味著模型的“智能密度”,單位算力產(chǎn)生的有效智力,已經(jīng)跨過了一個臨界點。
最后是工具鏈閾值。V4針對Claude Code、OpenClaw、CodeBuddy等主流Agent框架做了專項優(yōu)化,在代碼任務(wù)、文檔生成任務(wù)等方面均有提升。百萬上下文成為所有官方服務(wù)的標(biāo)配。
這恰恰是Agent長時間自主工作的前提。它不再是“玩具”,可以直接部署到生產(chǎn)環(huán)境中。
三個閾值同時被突破:成本低到足以鋪量,性能強到足以勝任,生態(tài)準(zhǔn)備好落地。 這不是線性改良,這是相變。
一個有趣的對照是:V4技術(shù)報告中,官方坦承模型能力仍落后GPT-5.4和Gemini-3.1-Pro約3至6個月。這個表態(tài)反而說明,V4的意義不在于追趕誰,而在于它把“基礎(chǔ)智能”這個底座做扎實了。一旦底座成立,上面的應(yīng)用層會自發(fā)涌現(xiàn)。
歷史的經(jīng)驗很直接:每一次底層基礎(chǔ)設(shè)施的質(zhì)變,都會引爆應(yīng)用層的寒武紀(jì)式大爆發(fā)。亞馬遜云服務(wù)將計算成本壓到閾值以下,引爆了全球SaaS創(chuàng)業(yè)潮;4G資費降至閾值以下,引爆了短視頻和直播電商時代。今天DeepSeek V,4正在將基礎(chǔ)智能成本壓到同一類閾值以下,而且這次顛覆的,是智力本身。
02
地震
讓我們把視角拉低,來看看這場寒武紀(jì)爆發(fā)的第一批信號。
最值得關(guān)注的,是產(chǎn)業(yè)鏈的重構(gòu)速度:V4適配華為昇騰950PR之后,寒武紀(jì)、海光信息、摩爾線程等國產(chǎn)芯片企業(yè)同步加速適配,阿里、字節(jié)、騰訊等巨頭加碼采購昇騰芯片。
這不是一家模型公司的發(fā)布,是一整條國產(chǎn)算力產(chǎn)業(yè)鏈的啟動。
應(yīng)用層的連鎖反應(yīng)同樣激烈。最直接的沖擊是Agent經(jīng)濟性的質(zhì)變。以V4-Flash 100萬token的API成本計算,一個需要完整閱讀中型代碼倉庫的任務(wù)預(yù)算僅需幾美元。在這種成本結(jié)構(gòu)下,“讓Agent試錯”首次具備了工程合理性,Agent大規(guī)模部署的經(jīng)濟基礎(chǔ)已經(jīng)成立。
此外,V4-Flash每百萬token輸入0.2元起的價格,幾乎將AI推理推入了一個“水電煤化”的新階段。當(dāng)智能的邊際成本趨近于零,整個應(yīng)用層,客服、電商、教育、醫(yī)療、法律,都將以難以想象的速度被重新定義。
還有一個容易被忽略的信號:V4發(fā)布前,DeepSeek首次啟動外部融資,最新目標(biāo)估值據(jù)說超過200億美元。在我看來,這更像是一個機構(gòu)在完成核心基礎(chǔ)設(shè)施建設(shè)之后,開始為大規(guī)模部署備彈的信號。
03
范式轉(zhuǎn)移
關(guān)于V4的產(chǎn)業(yè)影響,將它放入一個更大的坐標(biāo)系中,會發(fā)現(xiàn)一種更深層的變化正在形成:中國AI從“追趕模型能力”轉(zhuǎn)向了“生態(tài)循環(huán)”,模型、芯片、應(yīng)用正在形成正反饋閉環(huán)。
V4率先證明了國產(chǎn)芯片承載萬億參數(shù)模型的可行性,直接拉動了寒武紀(jì)、海光、摩爾線程等企業(yè)的同步成長。這些芯片企業(yè)有了市場驗證之后,會更有信心投入下一代產(chǎn)品研發(fā)。
下一代芯片性能更強、成本更低,反過來又會降低模型推理成本,催生更多開發(fā)者和應(yīng)用場景。應(yīng)用場景的擴大產(chǎn)生更多數(shù)據(jù)和反饋,進一步推動模型能力的提升。中國“模型—芯片—云”閉環(huán),正在從“邏輯成立”走向“事實成立”的階段。
在芯片生態(tài)層面,盡管參與全球競爭的在預(yù)訓(xùn)練階段,英偉達和它CUDA仍是最佳甚至唯一選項,
但當(dāng)V4成為首個在推理側(cè)不依賴英偉達CUDA的萬億級模型之后,一個轉(zhuǎn)折性信號已然顯現(xiàn):中國AI正在從單點突破走向系統(tǒng)性的代際進化。新的敘事應(yīng)當(dāng)是:中國AI正在建立一個獨立于英偉達生態(tài)的、從芯片到模型到應(yīng)用的完整技術(shù)閉環(huán)。
這個閉環(huán)一旦跑通,其意義遠超任何單模型的能力突破。
DeepSeek V4正在成為一個具有基礎(chǔ)設(shè)施意義的存在,它的開源生態(tài)、成本定價策略和芯片適配路徑,即將快速重塑整個中國AI應(yīng)用生態(tài)的格局。
04
寒武紀(jì)
讓我們把視野拉得更高。
過去幾年的AI產(chǎn)業(yè),一直在回答一個問題:模型能力的上限在哪里?從GPT-4到GPT-5.4,從Claude到Gemini,所有人都在沿著“更大參數(shù)、更高智能”的單一路徑?jīng)_刺。但這個框架有一個盲區(qū):當(dāng)模型智能達到一定水平之后,決定產(chǎn)業(yè)格局的就不再是“誰的模型更聰明”,而是“誰的模型能鋪得更廣、用得更深”。
V4的出現(xiàn),正在讓AI產(chǎn)業(yè)的競爭焦點從“能力競賽”轉(zhuǎn)移到“生態(tài)競賽”。
這不是某個模型的勝利,這是開源生態(tài)對閉源壁壘的勝利,是成本重構(gòu)對算力門檻的勝利,是國產(chǎn)技術(shù)棧對技術(shù)壟斷的勝利,更是開發(fā)者與用戶對少數(shù)巨頭定價權(quán)的勝利。
DeepSeek V4在MIT許可下開源,意味著全球任何開發(fā)者都可以本地部署、自由商用、二次開發(fā)。這種開放程度,正在讓閉源巨頭的護城河加速瓦解。
05
結(jié)語
“不誘于譽,不恐于誹。”
在一個充斥著噪聲和博弈的行業(yè)里,有一種能力是稀缺的:在所有人都質(zhì)疑的時候,保持沉默,繼續(xù)寫代碼;在所有人都唱衰的時候,打開終端,繼續(xù)訓(xùn)練下一個版本。V4遲到了十五個月。
但這十五個月沒有被浪費。它們被用來從CUDA遷移到CANN,用來把上下文從128K拉到1M同時把成本打下來,用來在Agent能力上一步一步逼近了全球第一梯隊。
這些沉默的工程量,不會出現(xiàn)在任何一篇博人眼球的報道里。但它們正在成為未來十年AI應(yīng)用的基石。
你會發(fā)現(xiàn):中國AI應(yīng)用最肥沃的土壤已經(jīng)準(zhǔn)備就緒。一場智能物種的大爆發(fā),正在地表以下積蓄能量。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.