網易首頁 > 網易號 > 正文 申請入駐

DeepSeek?V4 實測:百萬字上下文、Agent、邏輯推理一次看全

0
分享至

本文來源:消費者報道 作者:馮戀閣

從2025年年底,到2026年春節,再走過今年第一季度。Deepseek-V4千呼萬喚始出來。


(圖源:圖蟲)

4月24日,Deepseek官網上線DeepSeek-V4預覽版(以下簡稱“DeepSeek-V4”)并同步開源。

從DeepSeek-R1到DeepSeek-V4,一年間,AI市場競爭已經發生太多變化。

去年DeepSeek R1發布時,市場的觀感是“驚艷”,因為同期產品里,像它這樣性能強又成本低的并不多。

而DeepSeek-V4到來時,大模型廠商們已經上新多輪。比如在DeepSeek-V4上線當日凌晨(北京時間),OpenAI發布了新一代大模型GPT-5.5。而就在前一天(4月23日),騰訊發布了Hy3 preview模型。

關于DeepSeek-V4,DeepSeek在官方賬號只是低調樸素地介紹:“DeepSeek-V4 擁有百萬字超長上下文,在Agent能力、世界知識和推理性能上均實現國內與開源領域的領先。”

今天,開機實驗室就準備實測Deepseek-V4,看看表現如何。

可理解超長文本

DeepSeek-V4分為Pro與Flash兩個版本。

Pro版總參數1.6萬億、激活參數490億,主打旗艦性能;Flash版總參數2840億、激活參數130億,主打輕量高效。

大部分C端用戶使用DeepSeek是通過網頁或者APP,根據官方公告,進入網頁/APP端后,專家模式對應的模型是DeepSeek-V4-Pro;快速模式背后的模型則是DeepSeek-V4-Flash。

百萬上下文,是DeepSeek此次更新的亮點之一,兩款模型均全系標配100萬Token上下文窗口,可一次處理整本著作或百萬字合同等超長文本。

開機實驗室嘗試將近90萬字的《三體》三部曲文本發送給DeepSeek解讀,在快速模式下,DeepSeek可以閱讀全文并給出正確的結論。


(圖源:網頁截圖)


(圖源:網頁截圖)

DeepSeek還表示,1M(一百萬)上下文將是DeepSeek所有官方服務的標配。

目前,能將上下文推至百萬級別的模型并不算多,除了DeepSeek-V4,谷歌 Gemini 系列(1M+)、Anthropic Claude Opus 5(1M)等。

開機實驗室同時也對豆包、元寶等模型進行實測,但這些模型暫時還無法閱讀這么長的內容,需要搜網絡資料才能給出答案。


(圖源:網頁截圖)


(圖源:網頁截圖)

考AI腦筋急轉彎,是測試AI語境理解和邏輯推理能力的方式之一。

“我要洗車,距離洗車店50米,我開車去還是走路去?”前段時間,這個問題“難倒”了一眾AI,大部分大模型給出的答案都是“走路去”。

但據開機實驗室實測,在快速模式下,DeepSeek建議“走路去”,但是給出了一個算得上可行的解決方案:走到店里讓店員過來開。


(圖源:網頁截圖)

專家模式下,DeepSeek很輕松地發現了問題,建議“開車去”,還嘗試猜測了用戶提出這個問題的顧慮,并表示不用擔心。


(圖源:網頁截圖)

不過,DeepSeek的此次的更新不局限于此。

DeepSeek-V4 針對 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 產品進行了適配和優化,在代碼任務、文檔生成任務等方面表現均有提升。

下圖為DeepSeek-V4-Pro 在某 Agent 框架下生成的PPT內頁。


(圖源:DeepSeek微信公眾號截圖)

據DeepSeek,目前 DeepSeek-V4 已成為DeepSeek公司內部員工使用的 Agentic Coding 模型,據評測反饋使用體驗優于 Sonnet 4.5,交付質量接近 Opus 4.6 非思考模式,但仍與 Opus 4.6 思考模式存在一定差距。

定價層面,DeepSeek-V4-Pro是輸入價格為輸入(未命中)12 元 / 百萬 token、(命中)1 元;輸出 24 元;DeepSeek-V4-Flash是輸入價格為每百萬輸入(未命中)1 元 / 百萬 token、(命中)0.2 元;輸出 2 元。


(圖源:DeepSeek)

從“參數競賽”到“能力競賽”再到“價值競賽”

和去年DeepSeek-R1登場后拉動AI競爭不同,今年,在DeepSeek-V4 登場之前,業界就已經開卷了。

先是春節期間,騰訊、阿里、字節等大廠又是發紅包,又是聯動春晚,吸引用戶體驗;再是這段時間一個大模型“上新”小高潮。

越來越密集的產品發布印證了這樣一個趨勢:2026年模型大戰正在從堆參數、拼速度,正式轉向比落地、比成本。

DeepSeek-V4發布同日凌晨(北京時間),OpenAI發布GPT5.5,幾天前,這家公司發布的GPT image 2在圖像生成上表現出的以假亂真程度以及廣泛的場景適用性讓不少用戶陷入恐慌。

而DeepSeek-V4發布一天前(4月23日),騰訊混元Hy3 preview語言模型發布并開源。

Hy3 preview是騰訊2月宣布混元重建預訓練和強化學習的基礎設施后訓練的第一個模型,它的定位是“實用主義”。

在參數規模上,Hy3 Preview比混元2.0要小,總參數295B,激活參數21B,最大支持256K上下文。但據騰訊,其在復雜推理、指令遵循、上下文學習、代碼、智能體等能力及推理性能上實現了大幅的提升。

同時,這個模型的應用場景范圍不小。上線當日,Hy3 preview已在元寶、ima、CodeBuddy、WorkBuddy、QQ等上線,微信公眾號、和平精英、騰訊新聞、微信讀書等多個主線產品也在陸續上線。

“我們在提升模型的智能上限,并通過與騰訊眾多產品的深度Co-Design,持續提升模型在真實場景中的綜合表現,并開始探索特色模型能力。” 騰訊首席AI科學家姚順雨指出。

IDC中國研究經理程蔭在DeepSeek-V4發布后發文表示,DeepSeek-V4的發布,標志著中國大模型行業正式從“參數競賽”(1.0時代)、“能力競賽”(2.0時代)進入“價值競賽”(3.0時代)——以高效架構、普惠成本、場景落地為核心,解決企業實際問題。

而大模型的競爭升級,也在推動AI產業鏈上下游發生變化。

中信證券認為,對于整個AI產業來說,模型層,DeepSeek新一代模型有望與其他國產模型攜手,驅動中國AI加速走向世界,同時模型訓推進一步降本,更廉價的tokens驅動全球大模型API調用量整體增加。

AI應用層,模型平權有助于緩解市場對于模型與應用矛盾敘事帶來的焦慮,助力千行百業AIAgent落地,利好有壁壘的AI應用公司。

而對于AI基礎設施,降本帶來用量增長使AI Infra受益,國產AI Infra與國產模型相向而行。

在DeepSeek-V4的技術報告里,DeepSeek提到,DeepSeekV4在英偉達GPU與華為昇騰NPU兩大硬件平臺上,完成了細粒度執行分區(EP)方案的有效性驗證。


(圖源:DeepSeek-V4 技術報告)

DeepSeek在發布價格時還表示,受限于高端算力,目前Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調。

中信證券指出,AI應用爆發對應的國內算力荒將會加速國產卡放量,其中對推理芯片的帶動更加直接。當前國產大模型正積極適配國產算力卡,在國內算力荒背景下國產推理芯片等AI芯片迎來爆發增長機遇,預估國內AI芯片市場當前國產化率約30~40%,2030年有望提升至60~70%。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“媽,我在隧道救了個人,我可能出不去了……”小伙被困后撥通母親電話留下遺言

“媽,我在隧道救了個人,我可能出不去了……”小伙被困后撥通母親電話留下遺言

都市快報橙柿互動
2026-04-26 00:33:10
倆女子大鬧上海地鐵,拳打薅頭滿臉血,攔都攔不住,結局令人舒適

倆女子大鬧上海地鐵,拳打薅頭滿臉血,攔都攔不住,結局令人舒適

奇思妙想草葉君
2026-04-26 02:02:15
丁俊暉爬上球臺逗笑全場觀眾,英媒贊其松弛,沒被趙心童火力沖垮

丁俊暉爬上球臺逗笑全場觀眾,英媒贊其松弛,沒被趙心童火力沖垮

楊華評論
2026-04-26 02:31:00
忘了兩伊戰爭?如今伊朗拿霍爾木茲海峽賭國運,純屬記吃不記打!

忘了兩伊戰爭?如今伊朗拿霍爾木茲海峽賭國運,純屬記吃不記打!

寰球經緯所
2026-04-25 16:00:55
1-0!沙特豪門衛冕亞冠冠軍 少打1人后加時賽絕殺 日本球隊3連亞

1-0!沙特豪門衛冕亞冠冠軍 少打1人后加時賽絕殺 日本球隊3連亞

我愛英超
2026-04-26 05:40:51
俄羅斯的錯誤決不能再犯!攻臺之戰,即使發射一萬枚導彈也不夠用

俄羅斯的錯誤決不能再犯!攻臺之戰,即使發射一萬枚導彈也不夠用

尋墨閣
2026-04-26 08:33:01
4個去中國化最徹底的國家,一個已全盤西化,一個正試圖恢復漢字

4個去中國化最徹底的國家,一個已全盤西化,一個正試圖恢復漢字

你是我心中最美星空
2026-04-26 07:15:09
白宮記協晚宴安全事件嫌疑人為一名來自加州的30歲男子

白宮記協晚宴安全事件嫌疑人為一名來自加州的30歲男子

界面新聞
2026-04-26 10:15:44
森林狼又傷一人:愛德華茲落地左膝過度伸展受傷 被隊友攙扶離場

森林狼又傷一人:愛德華茲落地左膝過度伸展受傷 被隊友攙扶離場

醉臥浮生
2026-04-26 09:48:54
穆杰塔巴傷情曝光!比想象更重,他用一招終結美以斬首戰術

穆杰塔巴傷情曝光!比想象更重,他用一招終結美以斬首戰術

聞識
2026-04-26 04:59:24
賽季報銷!迪文琴佐遭遇右跟腱撕裂 穿上保護靴坐輪椅離開

賽季報銷!迪文琴佐遭遇右跟腱撕裂 穿上保護靴坐輪椅離開

醉臥浮生
2026-04-26 10:46:54
孩子脫臼復位只收100元,家長舉報亂收費!衛健委:應收110元,你還少給了!家長拒繳費后離開!

孩子脫臼復位只收100元,家長舉報亂收費!衛健委:應收110元,你還少給了!家長拒繳費后離開!

醫脈圈
2026-04-25 20:04:06
霍爾木茲海峽,傳來大消息!伊朗總統,最新發聲!比特幣跳水,超9.9萬人爆倉!

霍爾木茲海峽,傳來大消息!伊朗總統,最新發聲!比特幣跳水,超9.9萬人爆倉!

證券時報e公司
2026-04-25 22:11:02
俄羅斯罕見讓步!中國30年心結一朝化解!美媒:歐盟幫了中國大忙

俄羅斯罕見讓步!中國30年心結一朝化解!美媒:歐盟幫了中國大忙

潮鹿逐夢
2026-04-25 19:04:10
湖人消息:裁判報告出爐,老詹達成壯舉,晉級戰出場更新

湖人消息:裁判報告出爐,老詹達成壯舉,晉級戰出場更新

冷月小風風
2026-04-26 10:44:57
G3裁判報告:漏吹斯馬特進線+詹姆斯出界 火箭本該不打加時贏球?

G3裁判報告:漏吹斯馬特進線+詹姆斯出界 火箭本該不打加時贏球?

羅說NBA
2026-04-26 05:02:11
百年品牌底蘊加持:別克至境E7如何填平中國家庭的新能源真空區

百年品牌底蘊加持:別克至境E7如何填平中國家庭的新能源真空區

大眾侃車
2026-04-25 18:32:13
賴清德被摁住,29國24小時內為臺撐腰,大陸三句話回應

賴清德被摁住,29國24小時內為臺撐腰,大陸三句話回應

嘴角上翹
2026-04-26 03:57:43
連續三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

連續三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

街上的行人很刺眼
2026-04-25 10:55:49
假空姐大鬧亞航后續:知情人士透露真實身份,這下輪到女子老實了

假空姐大鬧亞航后續:知情人士透露真實身份,這下輪到女子老實了

離離言幾許
2026-04-26 07:28:42
2026-04-26 11:23:00
時代在線網 incentive-icons
時代在線網
時代在線
27348文章數 400關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

牛彈琴:伊朗放了美國人鴿子 特朗普被氣壞了

頭條要聞

牛彈琴:伊朗放了美國人鴿子 特朗普被氣壞了

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《八千里路云和月》大結局意難平

財經要聞

DeepSeek V4背后,梁文鋒的轉身

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

家居
親子
健康
本地
公開課

家居要聞

自然肌理 溫潤美學

親子要聞

早上叫孩子起床,記住三說,三不說

干細胞如何讓燒燙傷皮膚"再生"?

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版