網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

DeepSeek-V4：中國AI應(yīng)用寒武紀(jì)大爆發(fā)奇點降臨

2026-04-24 13:08:51　來源: 硅基星芒AI

北京舉報

分享至

臨近4月24日中午，DeepSeek官方公眾號發(fā)布公告：《DeepSeek-V4 預(yù)覽版：邁入百萬上下文普惠時代》。被催更已久的V4終是來了、

在我看來，寫在這篇公告文章最末尾的一句話，比前面所有跑分數(shù)據(jù)都重要：

“不誘于譽，不恐于誹，率道而行，端然正己。”

這是一個組織，在承受了十五個月的猜測、質(zhì)疑、唱衰之后，對外界的唯一回應(yīng)。把這句話放在更大的背景中讀，它的潛臺詞大約是：我們知道自己在做什么，我們不在乎你們怎么說。

而V4給出的答卷，確實不是一次常規(guī)迭代。

在我看來，V4的核心意義并不在于跑分——盡管V4-Pro在Apex Shortlist上拿到90.2%，Codeforces Rating沖到3206，在開源模型中已是碾壓級的存在。真正的分水嶺，藏在三個數(shù)字里：

第一，成本。 1M上下文中，V4-Pro的單token推理FLOPs只有V3.2的27%，KV Cache只有10%；V4-Flash更極端，分別壓到10%和7%。這意味著上下文從128K擴展到1M，理論負載膨脹近8倍，而單token算力消耗反而下降了。在AI行業(yè)，能力提升通常以算力膨脹為代價。V4打破了這個規(guī)律。這種反向的效率革命，讓很多原本只存在于白皮書里的Agent場景，突然有了經(jīng)濟可行性。

第二，芯片。 V4全面運行于華為昇騰、寒武紀(jì)等國產(chǎn)芯片，技術(shù)架構(gòu)從CUDA轉(zhuǎn)向CANN框架。這是全球首個在純國產(chǎn)算力上訓(xùn)練和部署的萬億參數(shù)MoE模型。按黃仁勛話說：“這對美國是糟糕的結(jié)果。” V4驗證了一件事：離開CUDA生態(tài)，中國AI的底層算力循環(huán)可以跑通。這個信號對產(chǎn)業(yè)鏈的沖擊，遠比模型本身的跑分更具顛覆性。

第三，Agent。 V4-Pro在Agentic Coding評測中已是開源最佳，內(nèi)部使用體驗優(yōu)于Sonnet 4.5，交付質(zhì)量接近Opus 4.6非思考模式。同時，V4針對Claude Code、OpenClaw、CodeBuddy等主流Agent框架做了專項優(yōu)化——這不是一個“能聊天”的模型，而是一個“能干活”的模型。從V4開始，DeepSeek的定位明確轉(zhuǎn)向Agent基礎(chǔ)設(shè)施。

這三個信號加在一起，指向一個更底層的判斷：V4之后，中國AI應(yīng)用寒武紀(jì)大爆發(fā)的奇點降臨了。

奇點

這個判斷需要解釋。

5.4億年前，寒武紀(jì)生命大爆發(fā)。在地質(zhì)尺度上幾乎是一瞬間，海洋中涌現(xiàn)出大量形態(tài)各異的動物門類。更準(zhǔn)確的說法是，可辨識的動物化石群集在化石記錄中驟然陡現(xiàn)。學(xué)界有一個共識：寒武紀(jì)爆發(fā)的前提不是單一因素，而是氧氣濃度、海洋化學(xué)、生態(tài)位空缺、Hox基因演化等多個條件的同步滿足。物種多樣性突然躍升，是因為底層環(huán)境達到了臨界閾值。

今天AI產(chǎn)業(yè)的底層環(huán)境正在達到同一類閾值。

首先是成本閾值。V4-Flash定價每百萬token輸入1元（緩存未命中）、輸出2元。V4全面適配國產(chǎn)芯片，基本證明在Agent時代，在推理側(cè)不過度依賴英偉達高端GPU的可行性。

這一邏輯，意味著一個開發(fā)者用幾美元就能處理一部《三體》體量的上下文。成本下降到這一水平，應(yīng)用場景會從“能做什么”變成“為什么不試試”，這才是Agent落地的真正基礎(chǔ)。

其次是性能閾值。在Agentic Coding評測中，V4-Pro已是開源最強，內(nèi)部使用體驗優(yōu)于Sonnet 4.5。在1M上下文設(shè)置下，V4-Pro的單token推理FLOPs只有V3.2的27%，這一效率突破在全球范圍內(nèi)領(lǐng)先。在數(shù)學(xué)、STEM、競賽型代碼測評中，V4-Pro超越所有已公開評測的開源模型，比肩世界頂級閉源模型。

這楊的基本事實，意味著模型的“智能密度”，單位算力產(chǎn)生的有效智力，已經(jīng)跨過了一個臨界點。

最后是工具鏈閾值。V4針對Claude Code、OpenClaw、CodeBuddy等主流Agent框架做了專項優(yōu)化，在代碼任務(wù)、文檔生成任務(wù)等方面均有提升。百萬上下文成為所有官方服務(wù)的標(biāo)配。

這恰恰是Agent長時間自主工作的前提。它不再是“玩具”，可以直接部署到生產(chǎn)環(huán)境中。

三個閾值同時被突破：成本低到足以鋪量，性能強到足以勝任，生態(tài)準(zhǔn)備好落地。這不是線性改良，這是相變。

一個有趣的對照是：V4技術(shù)報告中，官方坦承模型能力仍落后GPT-5.4和Gemini-3.1-Pro約3至6個月。這個表態(tài)反而說明，V4的意義不在于追趕誰，而在于它把“基礎(chǔ)智能”這個底座做扎實了。一旦底座成立，上面的應(yīng)用層會自發(fā)涌現(xiàn)。

歷史的經(jīng)驗很直接：每一次底層基礎(chǔ)設(shè)施的質(zhì)變，都會引爆應(yīng)用層的寒武紀(jì)式大爆發(fā)。亞馬遜云服務(wù)將計算成本壓到閾值以下，引爆了全球SaaS創(chuàng)業(yè)潮；4G資費降至閾值以下，引爆了短視頻和直播電商時代。今天DeepSeek V，4正在將基礎(chǔ)智能成本壓到同一類閾值以下，而且這次顛覆的，是智力本身。

地震

讓我們把視角拉低，來看看這場寒武紀(jì)爆發(fā)的第一批信號。

最值得關(guān)注的，是產(chǎn)業(yè)鏈的重構(gòu)速度：V4適配華為昇騰950PR之后，寒武紀(jì)、海光信息、摩爾線程等國產(chǎn)芯片企業(yè)同步加速適配，阿里、字節(jié)、騰訊等巨頭加碼采購昇騰芯片。

這不是一家模型公司的發(fā)布，是一整條國產(chǎn)算力產(chǎn)業(yè)鏈的啟動。

應(yīng)用層的連鎖反應(yīng)同樣激烈。最直接的沖擊是Agent經(jīng)濟性的質(zhì)變。以V4-Flash 100萬token的API成本計算，一個需要完整閱讀中型代碼倉庫的任務(wù)預(yù)算僅需幾美元。在這種成本結(jié)構(gòu)下，“讓Agent試錯”首次具備了工程合理性，Agent大規(guī)模部署的經(jīng)濟基礎(chǔ)已經(jīng)成立。

此外，V4-Flash每百萬token輸入0.2元起的價格，幾乎將AI推理推入了一個“水電煤化”的新階段。當(dāng)智能的邊際成本趨近于零，整個應(yīng)用層，客服、電商、教育、醫(yī)療、法律，都將以難以想象的速度被重新定義。

還有一個容易被忽略的信號：V4發(fā)布前，DeepSeek首次啟動外部融資，最新目標(biāo)估值據(jù)說超過200億美元。在我看來，這更像是一個機構(gòu)在完成核心基礎(chǔ)設(shè)施建設(shè)之后，開始為大規(guī)模部署備彈的信號。

范式轉(zhuǎn)移

關(guān)于V4的產(chǎn)業(yè)影響，將它放入一個更大的坐標(biāo)系中，會發(fā)現(xiàn)一種更深層的變化正在形成：中國AI從“追趕模型能力”轉(zhuǎn)向了“生態(tài)循環(huán)”，模型、芯片、應(yīng)用正在形成正反饋閉環(huán)。

V4率先證明了國產(chǎn)芯片承載萬億參數(shù)模型的可行性，直接拉動了寒武紀(jì)、海光、摩爾線程等企業(yè)的同步成長。這些芯片企業(yè)有了市場驗證之后，會更有信心投入下一代產(chǎn)品研發(fā)。

下一代芯片性能更強、成本更低，反過來又會降低模型推理成本，催生更多開發(fā)者和應(yīng)用場景。應(yīng)用場景的擴大產(chǎn)生更多數(shù)據(jù)和反饋，進一步推動模型能力的提升。中國“模型—芯片—云”閉環(huán)，正在從“邏輯成立”走向“事實成立”的階段。

在芯片生態(tài)層面，盡管參與全球競爭的在預(yù)訓(xùn)練階段，英偉達和它CUDA仍是最佳甚至唯一選項，

但當(dāng)V4成為首個在推理側(cè)不依賴英偉達CUDA的萬億級模型之后，一個轉(zhuǎn)折性信號已然顯現(xiàn)：中國AI正在從單點突破走向系統(tǒng)性的代際進化。新的敘事應(yīng)當(dāng)是：中國AI正在建立一個獨立于英偉達生態(tài)的、從芯片到模型到應(yīng)用的完整技術(shù)閉環(huán)。

這個閉環(huán)一旦跑通，其意義遠超任何單模型的能力突破。

DeepSeek V4正在成為一個具有基礎(chǔ)設(shè)施意義的存在，它的開源生態(tài)、成本定價策略和芯片適配路徑，即將快速重塑整個中國AI應(yīng)用生態(tài)的格局。

寒武紀(jì)

讓我們把視野拉得更高。

過去幾年的AI產(chǎn)業(yè)，一直在回答一個問題：模型能力的上限在哪里？從GPT-4到GPT-5.4，從Claude到Gemini，所有人都在沿著“更大參數(shù)、更高智能”的單一路徑?jīng)_刺。但這個框架有一個盲區(qū)：當(dāng)模型智能達到一定水平之后，決定產(chǎn)業(yè)格局的就不再是“誰的模型更聰明”，而是“誰的模型能鋪得更廣、用得更深”。

V4的出現(xiàn)，正在讓AI產(chǎn)業(yè)的競爭焦點從“能力競賽”轉(zhuǎn)移到“生態(tài)競賽”。

這不是某個模型的勝利，這是開源生態(tài)對閉源壁壘的勝利，是成本重構(gòu)對算力門檻的勝利，是國產(chǎn)技術(shù)棧對技術(shù)壟斷的勝利，更是開發(fā)者與用戶對少數(shù)巨頭定價權(quán)的勝利。

DeepSeek V4在MIT許可下開源，意味著全球任何開發(fā)者都可以本地部署、自由商用、二次開發(fā)。這種開放程度，正在讓閉源巨頭的護城河加速瓦解。

結(jié)語

“不誘于譽，不恐于誹。”

在一個充斥著噪聲和博弈的行業(yè)里，有一種能力是稀缺的：在所有人都質(zhì)疑的時候，保持沉默，繼續(xù)寫代碼；在所有人都唱衰的時候，打開終端，繼續(xù)訓(xùn)練下一個版本。V4遲到了十五個月。

但這十五個月沒有被浪費。它們被用來從CUDA遷移到CANN，用來把上下文從128K拉到1M同時把成本打下來，用來在Agent能力上一步一步逼近了全球第一梯隊。

這些沉默的工程量，不會出現(xiàn)在任何一篇博人眼球的報道里。但它們正在成為未來十年AI應(yīng)用的基石。

你會發(fā)現(xiàn)：中國AI應(yīng)用最肥沃的土壤已經(jīng)準(zhǔn)備就緒。一場智能物種的大爆發(fā)，正在地表以下積蓄能量。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.