DeepSeek-V4實測：超高效上下文，更像是token價格戰(zhàn)的序章

2026-04-24 22:14:20　來源: 刺猬公社

北京舉報

分享至

準備好做Agent基模，價格戰(zhàn)可能下半年到來。

文｜陳梅希

編｜園長

沒有開聲勢浩大的全球發(fā)布會，沒有安排老板錄制一檔視頻博客，DeepSeek-V4預(yù)覽版就這么默默更新了，一如它過去所做的那樣。時間選在了周五上午，作為自媒體從業(yè)者也萬分感謝，沒有讓我們在周末的北影節(jié)觀影現(xiàn)場突然離場去研究一個大模型的全新版本。

公告里說的和沒說的

更新通知發(fā)布在DeepSeek的官方公眾號，全文只有1087個字。同步公開的，DeepSeek-V4 模型的開源鏈接和技術(shù)報告。縱覽這些公開信息，有以下幾件事值得關(guān)注：

1.官網(wǎng)、App、API調(diào)用全部上線新模型，分為DeepSeek-v4-pro和DeepSeek-v4-flash兩種，可自行切換調(diào)用。兩種模型均為開源模型。

性能上，開源的DeepSeek-V4-Pro能比肩頂級閉源模型。Agent能力大幅提高，其中Coding能力在其公司內(nèi)部的評測體驗中“優(yōu)于 Sonnet 4.5，交付質(zhì)量接近 Opus 4.6 非思考模式，但仍與 Opus 4.6 思考模式存在一定差距”；文檔和PPT生成能力均大幅提升。（第二部分我們將對其代碼能力和PPT生成能力進行橫向測評。）

DeepSeek內(nèi)部已將員工使用的Agentic Coding 模型切換為DeepSeek-V4，證明其在實際研發(fā)場景中已具備生產(chǎn)力價值。

2.技術(shù)革新方面，這個版本在上下文問題上最值得關(guān)注的是超高的上下文效率，而非上下文規(guī)模。

DeepSeek-V4通過全新的混合注意力機制，在實現(xiàn)超長上下文能力的同時，降低了對計算和顯存的需求，根據(jù)官方文檔：“從現(xiàn)在開始，1M（一百萬）上下文將是 DeepSeek 所有官方服務(wù)的標配。”

閱讀其技術(shù)文檔可以發(fā)現(xiàn)，全新的注意力機制結(jié)合了CSA (Compressed Sparse Attention，壓縮稀疏注意力)和HCA (Heavily Compressed Attention，重度壓縮注意力)，其中CSA搭配DeepSeek自研的稀疏注意力算法，而HCA對鍵值緩存采用更高的壓縮倍率，但保留了Transformer架構(gòu)里的稠密注意力算法。粗淺理解一下，就是壓縮得少的跳著看，已經(jīng)被猛猛壓縮過的那就每個都看。

To enhance long-context efficiency, we design a hybrid attention mechanism combining Compressed Sparse Attention (CSA) and Heavily Compressed Attention (HCA). CSA compresses the KV caches along the sequence dimension and then performs DeepSeek Sparse Attention (DSA) (DeepSeek-AI, 2025), whereas HCA applies more aggressive compression to the KV caches but keeps dense attention.

這種混合注意力機制的核心理念，是在超長上下文中，并不是所有鍵值都需要全注意力和稠密計算。其實帶入人類自己的閱讀體驗也是如此，我們看論文時總是聚精會神地先看摘要、導(dǎo)語和結(jié)論，而在文獻綜述環(huán)節(jié)意識模糊。本科選修網(wǎng)絡(luò)文學(xué)課，老師在第一節(jié)課就告訴我們這學(xué)期要至少讀完兩千萬字的網(wǎng)文，并介紹了一種“掃文”方式：對角線閱讀法，每頁書只看左上角、正中間、右下角，現(xiàn)在想想，這何嘗不是一種稀疏注意力算法。

注意力的壓縮，是為了減少計算量，最終目標是提升超長上下文的效率。根據(jù)技術(shù)報告，“在一百萬tokens上下文中，V4-Pro的推理計算量僅需V3.2的27%，KV緩存占用僅為10%。”

In the one-million-token context setting, DeepSeek-V4-Pro requires only 27% of single-token inference FLOPs and 10% of KV cache compared with DeepSeek-V3.2.

3.按理說，token壓縮結(jié)合稀疏注意力機制提高計算效率后，廠商的計算成本和顯存成本（同等token規(guī)模下）都會大幅減少，最終會反映到token定價上。DeepSeek-V4在今天也公布了定價，每百萬tokens的定價如下：

這個價格，和海外頭部大模型相比，有很大的優(yōu)勢。以DeepSeek-V4自稱交付質(zhì)量接近的Opus 4.6 非思考模型為例，命中緩存的輸入單價為0.5美元/百萬token，未命中緩存的輸入單價為5美元/百萬token，輸出單價為25美元/百萬token。按4月24日當日匯率計算，DeepSeek-V4-pro的三項單價，分別是Opus 4.6的24%、35%和14%。

海外頭部大模型API調(diào)用計價（截至2026.4.24），刺猬公社手動統(tǒng)計，僅供參考；數(shù)據(jù)來源：各平臺官網(wǎng)

但和國內(nèi)競品相比，DeepSeek-V4暫時還沒有對著價格大砍一刀的架勢。

國內(nèi)模型中同樣有百萬上下文能力的是阿里在本月初發(fā)布的Qwen3.6-plus，對單次輸入的token數(shù)進行分層計價，當單次輸入小于256K時，Qwen3.6-plus的輸入和輸出單價均介于DeepSeek-V4-Flash和DeepSeek-V4-Pro之間。

國內(nèi)頭部大模型API調(diào)用計價（截至2026.4.24），刺猬公社手動統(tǒng)計，僅供參考；數(shù)據(jù)來源：各平臺官網(wǎng)、公告

4.準備好做Agent基模，價格戰(zhàn)可能下半年到來

華為昇騰芯片在DeepSeek 官方公告中被提及，雖然只是以出現(xiàn)在圖片注釋中的低調(diào)形式。在更新公告的定價說明截圖下，有一行注釋小字：“受限于高端算力，目前Pro的服務(wù)吞吐十分有限，預(yù)計下半年昇騰950超節(jié)點批量上市后，Pro的價格會大幅下調(diào)。”

這條注釋，也許在宣告一種可能性：在DeepSeek-V4 使用大幅降低計算成本的新注意力機制后，V4-Pro沒有大幅降價，是因為高端算力稀缺，而不是成本不允許降價。換言之，一旦國產(chǎn)高端算力在下半年順利接棒，DeepSeek就有空間大幅下調(diào)token定價。

DeepSeek也做好了充足的、充當Agent 基模的準備，畢竟在更新公告里特意寫道自己“針對 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 產(chǎn)品進行了適配和優(yōu)化”。除了三位耳熟能詳?shù)腁gent選手，CodeBuddy是騰訊云開發(fā)的代碼助手。

超高效上下文，更像是token價格戰(zhàn)的一頁序章。也有從業(yè)者提供了另一種視角：當DeepSeek已經(jīng)公開宣布下半年會大幅下調(diào)V4-Pro價格后，DeepSeek的模型能力線和價格線，將成為閉源模型的“斬殺線”。

實測DeepSeek-V4-Pro

因為更新公告里重點提及了代碼能力、PPT生成能力，刺猬公社基于這兩個領(lǐng)域，對DeepSeek-V4預(yù)覽版進行了簡單的橫向測試，對照的是近期發(fā)布/更新的，分別以這兩項能力為賣點的產(chǎn)品。

1.代碼能力VS阿里秒悟

秒悟是阿里巴巴ATH事業(yè)群于將近10天前發(fā)布的AI開發(fā)平臺，讓0代碼能力的用戶能使用自然語言完成自己的產(chǎn)品開發(fā)。剛上線時，我讓秒悟做了一個《作家推薦器》，通過給用戶做8道選擇題判斷TA可能喜歡的作家，題庫一共30道，覆蓋100位作家。經(jīng)過大概1個小時的調(diào)試后，這個測試小網(wǎng)頁上線了：

雖然不知道為什么秒悟在配色上唯愛清華紫，而且在出文本選擇題的時候像吃了50噸張嘉佳（然而它自己建構(gòu)的作家?guī)炖餂]有張嘉佳），但作為和朋友自娛自樂的小玩具，可用度還是非常高的。我自己做了測試，竟然真的測出了我喜歡的作家。

DeepSeek-V4-Pro正式上線后，我用同樣的提示詞，測試它做網(wǎng)頁的能力。大概5分鐘后，測試網(wǎng)頁完成了。

第一次生成，點擊跳轉(zhuǎn)邏輯并未生效，DeepSeek選擇重寫數(shù)千行代碼，先提供了一個只包含10個作家的簡化版。等簡化版運行成功，它確認自己代碼結(jié)構(gòu)沒有問題后，我讓它把作家?guī)旎謴?fù)到100個，它依然選擇了把代碼全部重寫，而不是讓我替換若干個代碼模塊。

DeepSeek給出的解決方式，讓我恍惚覺得自己擁有無限的token火力，在對這個小小的網(wǎng)頁需求進行過飽和攻擊，而在此過程中，我其實完全沒有付費。

橫向測評之后，秒悟的優(yōu)勢在于0操作門檻，最終的交付結(jié)果是一個用戶可以打開的網(wǎng)頁，用戶可以直接分享給朋友或是互聯(lián)網(wǎng)上的任何人。劣勢在于價格，做一個作家推薦器大概花掉了40000積分，按照積分的零售價格是40塊，如果不想花錢，按每天登錄贈送2000積分的速度，大概連續(xù)登錄20天可以做一個玩具網(wǎng)頁。最終我斥39元巨資訂購了每月100000積分的套餐。

DeepSeek-V4-Pro的最大優(yōu)勢當然是免費，幾千行代碼說寫就寫；另一個優(yōu)勢是快速，雖然沒有左拉一個助手，右拉一個設(shè)計師，建構(gòu)若干項蜂群工程，但不到10分鐘就做完了。劣勢則是只能生成一份代碼，讓我打包成html格式再去瀏覽器打開，如果想直接分享到線上，還需要自己完成部署。另外，如果說使用qwen的秒悟像吃了五十噸張嘉佳老師，那么DeepSeek做出來的作家推薦器就像是吃了五十噸DeepSeek。

2.PPT生成能力VS MaxHermes

測試PPT生成能力時，我直接選擇了使用DeepSeek-V4的技術(shù)文檔，共59頁pdf，要求是生成一個給大學(xué)生做講座用的PPT。

MaxHermes很快完成了一個可以直接下載的PPT文件，結(jié)構(gòu)和美化都做得不錯。劣勢是要花錢，為了使用MaxHermes，我需要花39元買一個基礎(chǔ)版會員，再花49元訂購一個token plan包月。

DeepSeek則生成了代碼，需要在本地用Python運行，沒有那些Agent方便，而且樣式有些過于樸素了。最大優(yōu)點依然是完全免費，留了圖片的占位符，需要用戶自己做一些圖片替換工作。題外話，為什么不管寫網(wǎng)站還是做PPT，大模型們都不約而同地默認選擇了紫色系？

如果用Claude Code 、OpenClaw等Agent產(chǎn)品搭配DeepSeek 4.0的API，應(yīng)該能獲得更便捷的體驗，但就要走DeepSeek的API計費邏輯了，無法像現(xiàn)在這樣完全免費。

更何況，現(xiàn)在是周五晚上9點半國產(chǎn)大模型的更新固然重要使我從早到晚坐在電腦前興奮地敲了一天字但是周五晚上跟朋友約好去五道營喝酒聽歌同樣重要我將在關(guān)注AI進展的同時保衛(wèi)我的線下生活那正是我在開頭就感謝DeepSeek 在周五上午發(fā)布更新的原因。

媒介合作聯(lián)系微信號|ciweimeijiejun

如需和我們交流可后臺回復(fù)“進群”加社群

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.