網易首頁 > 網易號 > 正文申請入駐

DeepSeek?V4 實測：百萬字上下文、Agent、邏輯推理一次看全

2026-04-25 21:00:19　來源: 時代在線網

廣東舉報

分享至

本文來源：消費者報道作者：馮戀閣

從2025年年底，到2026年春節，再走過今年第一季度。Deepseek-V4千呼萬喚始出來。

（圖源：圖蟲）

4月24日，Deepseek官網上線DeepSeek-V4預覽版（以下簡稱“DeepSeek-V4”）并同步開源。

從DeepSeek-R1到DeepSeek-V4，一年間，AI市場競爭已經發生太多變化。

去年DeepSeek R1發布時，市場的觀感是“驚艷”，因為同期產品里，像它這樣性能強又成本低的并不多。

而DeepSeek-V4到來時，大模型廠商們已經上新多輪。比如在DeepSeek-V4上線當日凌晨（北京時間），OpenAI發布了新一代大模型GPT-5.5。而就在前一天（4月23日），騰訊發布了Hy3 preview模型。

關于DeepSeek-V4，DeepSeek在官方賬號只是低調樸素地介紹：“DeepSeek-V4 擁有百萬字超長上下文，在Agent能力、世界知識和推理性能上均實現國內與開源領域的領先。”

今天，開機實驗室就準備實測Deepseek-V4，看看表現如何。

可理解超長文本

DeepSeek-V4分為Pro與Flash兩個版本。

Pro版總參數1.6萬億、激活參數490億，主打旗艦性能；Flash版總參數2840億、激活參數130億，主打輕量高效。

大部分C端用戶使用DeepSeek是通過網頁或者APP，根據官方公告，進入網頁/APP端后，專家模式對應的模型是DeepSeek-V4-Pro；快速模式背后的模型則是DeepSeek-V4-Flash。

百萬上下文，是DeepSeek此次更新的亮點之一，兩款模型均全系標配100萬Token上下文窗口，可一次處理整本著作或百萬字合同等超長文本。

開機實驗室嘗試將近90萬字的《三體》三部曲文本發送給DeepSeek解讀，在快速模式下，DeepSeek可以閱讀全文并給出正確的結論。

（圖源：網頁截圖）

DeepSeek還表示，1M（一百萬）上下文將是DeepSeek所有官方服務的標配。

目前，能將上下文推至百萬級別的模型并不算多，除了DeepSeek-V4，谷歌 Gemini 系列（1M+）、Anthropic Claude Opus 5（1M）等。

開機實驗室同時也對豆包、元寶等模型進行實測，但這些模型暫時還無法閱讀這么長的內容，需要搜網絡資料才能給出答案。

（圖源：網頁截圖）

考AI腦筋急轉彎，是測試AI語境理解和邏輯推理能力的方式之一。

“我要洗車，距離洗車店50米，我開車去還是走路去?”前段時間，這個問題“難倒”了一眾AI，大部分大模型給出的答案都是“走路去”。

但據開機實驗室實測，在快速模式下，DeepSeek建議“走路去”，但是給出了一個算得上可行的解決方案：走到店里讓店員過來開。

（圖源：網頁截圖）

專家模式下，DeepSeek很輕松地發現了問題，建議“開車去”，還嘗試猜測了用戶提出這個問題的顧慮，并表示不用擔心。

（圖源：網頁截圖）

不過，DeepSeek的此次的更新不局限于此。

DeepSeek-V4 針對 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 產品進行了適配和優化，在代碼任務、文檔生成任務等方面表現均有提升。

下圖為DeepSeek-V4-Pro 在某 Agent 框架下生成的PPT內頁。

（圖源：DeepSeek微信公眾號截圖）

據DeepSeek，目前 DeepSeek-V4 已成為DeepSeek公司內部員工使用的 Agentic Coding 模型，據評測反饋使用體驗優于 Sonnet 4.5，交付質量接近 Opus 4.6 非思考模式，但仍與 Opus 4.6 思考模式存在一定差距。

定價層面，DeepSeek-V4-Pro是輸入價格為輸入（未命中）12 元 / 百萬 token、（命中）1 元；輸出 24 元；DeepSeek-V4-Flash是輸入價格為每百萬輸入（未命中）1 元 / 百萬 token、（命中）0.2 元；輸出 2 元。

（圖源：DeepSeek）

從“參數競賽”到“能力競賽”再到“價值競賽”

和去年DeepSeek-R1登場后拉動AI競爭不同，今年，在DeepSeek-V4 登場之前，業界就已經開卷了。

先是春節期間，騰訊、阿里、字節等大廠又是發紅包，又是聯動春晚，吸引用戶體驗；再是這段時間一個大模型“上新”小高潮。

越來越密集的產品發布印證了這樣一個趨勢：2026年模型大戰正在從堆參數、拼速度，正式轉向比落地、比成本。

DeepSeek-V4發布同日凌晨（北京時間），OpenAI發布GPT5.5，幾天前，這家公司發布的GPT image 2在圖像生成上表現出的以假亂真程度以及廣泛的場景適用性讓不少用戶陷入恐慌。

而DeepSeek-V4發布一天前（4月23日），騰訊混元Hy3 preview語言模型發布并開源。

Hy3 preview是騰訊2月宣布混元重建預訓練和強化學習的基礎設施后訓練的第一個模型，它的定位是“實用主義”。

在參數規模上，Hy3 Preview比混元2.0要小，總參數295B，激活參數21B，最大支持256K上下文。但據騰訊，其在復雜推理、指令遵循、上下文學習、代碼、智能體等能力及推理性能上實現了大幅的提升。

同時，這個模型的應用場景范圍不小。上線當日，Hy3 preview已在元寶、ima、CodeBuddy、WorkBuddy、QQ等上線，微信公眾號、和平精英、騰訊新聞、微信讀書等多個主線產品也在陸續上線。

“我們在提升模型的智能上限，并通過與騰訊眾多產品的深度Co-Design，持續提升模型在真實場景中的綜合表現，并開始探索特色模型能力。” 騰訊首席AI科學家姚順雨指出。

IDC中國研究經理程蔭在DeepSeek-V4發布后發文表示，DeepSeek-V4的發布，標志著中國大模型行業正式從“參數競賽”（1.0時代）、“能力競賽”（2.0時代）進入“價值競賽”（3.0時代）——以高效架構、普惠成本、場景落地為核心，解決企業實際問題。

而大模型的競爭升級，也在推動AI產業鏈上下游發生變化。

中信證券認為，對于整個AI產業來說，模型層，DeepSeek新一代模型有望與其他國產模型攜手，驅動中國AI加速走向世界，同時模型訓推進一步降本，更廉價的tokens驅動全球大模型API調用量整體增加。

AI應用層，模型平權有助于緩解市場對于模型與應用矛盾敘事帶來的焦慮，助力千行百業AIAgent落地，利好有壁壘的AI應用公司。

而對于AI基礎設施，降本帶來用量增長使AI Infra受益，國產AI Infra與國產模型相向而行。

在DeepSeek-V4的技術報告里，DeepSeek提到，DeepSeekV4在英偉達GPU與華為昇騰NPU兩大硬件平臺上，完成了細粒度執行分區（EP）方案的有效性驗證。

（圖源：DeepSeek-V4 技術報告）

DeepSeek在發布價格時還表示，受限于高端算力，目前Pro的服務吞吐十分有限，預計下半年昇騰950超節點批量上市后，Pro的價格會大幅下調。

中信證券指出，AI應用爆發對應的國內算力荒將會加速國產卡放量，其中對推理芯片的帶動更加直接。當前國產大模型正積極適配國產算力卡，在國內算力荒背景下國產推理芯片等AI芯片迎來爆發增長機遇，預估國內AI芯片市場當前國產化率約30~40%，2030年有望提升至60~70%。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

時代在線網

時代在線

27348文章數 400關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

親子

健康

本地

公開課

家居要聞

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

DeepSeek?V4 實測：百萬字上下文、Agent、邏輯推理一次看全

漲價浪潮下，DeepSeek推動AI“價格戰”

牛彈琴：伊朗放了美國人鴿子 特朗普被氣壞了

牛彈琴：伊朗放了美國人鴿子 特朗普被氣壞了

那一刻開始，兩支球隊的命運悄然改變了

《八千里路云和月》大結局意難平

DeepSeek V4背后，梁文鋒的轉身

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

自然肌理 溫潤美學

早上叫孩子起床，記住三說，三不說

干細胞如何讓燒燙傷皮膚"再生"？

云游中國｜逛世界風箏都 留學生探秘中國傳統文化

牛彈琴：伊朗放了美國人鴿子特朗普被氣壞了

牛彈琴：伊朗放了美國人鴿子特朗普被氣壞了

2026款樂道L90亮相北京車展樂道L80正式官宣

自然肌理溫潤美學

云游中國｜逛世界風箏都留學生探秘中國傳統文化