網易首頁 > 網易號 > 正文 申請入駐

刷屏!DeepSeek V4成本暴降73%,梁文鋒聯手華為寒武紀,源神歸位全體起立

0
分享至


智東西
作者 江宇 陳駿達
編輯 心緣

智東西4月24日報道,今日,DeepSeek正式發布并開源DeepSeek-V4系列預覽版本,這是其繼V3.2之后的新一代旗艦模型體系,智東西第一時間上手實測。

DeepSeek V4“源神”回歸影響力果然不同凡響,幾乎瞬間刷屏,在微博熱搜榜前五占三,僅次于小米YU7GT。


本次發布包含兩款模型:DeepSeek-V4-Pro與DeepSeek-V4-Flash,分別采用MoE架構總參數規模達到1.6T(激活49B)與284B(激活13B),并統一支持最長100萬token上下文

DeepSeek官方同時說明,受限于高端算力,目前DeepSeek-V4-Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,其價格會大幅下調。此外,DeepSeek-V4已獲得寒武紀Day 0適配支持,相關適配代碼已開源至GitHub社區。


DeepSeek-V4-Pro主打性能上限,對標閉源旗艦模型;而DeepSeek-V4-Flash則在參數規模與激活規模上大幅縮小,換取更低延遲與更低成本


相比上一代模型,其在Agent能力、世界知識與復雜推理任務上進一步抬升,并首次將“百萬上下文”作為默認能力開放。

在Agent能力方面,DeepSeek-V4-Pro的Agent能力顯著增強。其在Agentic Coding等評測中進入開源第一梯隊,內部評測顯示交付質量已接近Claude Opus 4.6非思考模式,但與其思考模式仍存在差距。

DeepSeek-V4-Pro在數學、STEM及競賽型代碼等高難度任務中已超過當前已公開評測的開源模型,整體表現接近甚至比肩GPT-5.4、Claude Opus 4.6-Max等頂級閉源模型。

與此同時,DeepSeek-V4在長上下文效率上給出了一組更激進的優化:在100萬token場景下,其單token推理計算量僅為V3.2的27%,KV Cache占用降至約10%,顯著降低長鏈路任務的算力與顯存成本。


同時,官方公布了DeepSeek-V4系列的API定價:DeepSeek-V4-Pro在輸入命中緩存的情況下為1元/百萬tokens,輸入未命中緩存則為12元/百萬tokens,輸出為24元/百萬tokens;DeepSeek-V4-Flash在輸入命中緩存僅0.2元/百萬tokens,未命中輸入1元/百萬tokens,輸出2元/百萬tokens


目前,DeepSeek-V4系列已上線官網與App,并同步開放API與模型權重。

體驗地址:chat.deepseek.com或DeepSeek官方APP
API文檔:https://api-docs.deepseek.com/zh-cn/guides/thinking_mode
開源鏈接:
https://huggingface.co/collections/deepseek-ai/deepseek-v4
https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
技術報告:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

一、Agentic編程能力提升明顯,讀《三體》三部曲燒了54萬token

我們初步感受了下DeepSeek-V4的變化,主要測試的模型是DeepSeek-V4-Pro。

在前端網頁one-shot案例中,DeepSeek-V4-Pro展現出很高的執行效率。由于我們的需求不復雜,模型僅用了5秒鐘進行思考,之后迅速進行開發,這與之前DeepSeek模型在思考上浪費很多token的模式明顯不同。

進入到實際生成過程后,DeepSeek-V4-Pro的輸出長度要明顯長于其他DeepSeek模型。其生成速度較快,基本能做到以5行代碼為單位輸出。

最終,DeepSeek-V4-Pro的生成結果如下,可以看到其網頁的完成度要比DeepSeek-V3.2高一些,設計更為豐富。


▲DeepSeek-V4-Pro打造的網站

網站鏈接:https://mcp.edgeone.site/share/9pD1cRzY1QA8bmmBLDZ8S

不過,這樣簡單的編程題目已經難不住DeepSeek-V4-Pro,我們試著讓它完成一個結合Agent能力與編程的任務:規劃一次去上海的旅行,然后把所有相關信息整合為一個旅行網站,附上對應的景點定位。

執行過程中,可以看到DeepSeek-V4-Pro可以進行復雜多輪工具調用,聯網搜索的條目數量也和之前模型的數量相比有增加,信息收集得更為全面了。


最終,DeepSeek-V4-Pro收集到了完整的行程信息,規劃合理,并且配上了每個景點的定位,點開后就可以直接在導航App里使用,十分便捷。在Agent任務中,可以觀察到它的行動十分果斷,工具調用、思考都在幾秒鐘內解決,token效率不錯。


▲DeepSeek使用Agent能力和編程能力規劃的旅行方案

網站鏈接:https://mcp.edgeone.site/share/4TxFYOy24bgaEwxFoxisj

我們的下一個案例與長文本有關,DeepSeek-V4系列模型常常掛在嘴邊的就是它能一口氣吃下《三體》三部曲,而我們如它所愿上傳了完整的《三體》。

上傳這樣的超長文件后,DeepSeek能夠迅速定位我們指定的內容,成功實現大海撈針。不過,這種超長上下文能力是有代價的,僅僅輸出這一點內容就燒掉了54萬個token。


我們還用“OpenAI更新到了哪一個模型”這一問題,試了試模型的知識截至日期,可以看到,DeepSeek-V4-Pro的知識截止日期目前仍然停在2025年。


此外,這一模型應該暫時還不支持視覺能力,上傳圖像后還是會進行文字提取,沒有文字的圖像會顯示無法處理。


二、百萬上下文成標配,新架構把“長任務成本”壓下來

這一代V4最直接的變化,是把“長上下文”變成默認能力。

不同于傳統通過簡單擴展窗口的方式,DeepSeek-V4-Pro引入了全新的混合注意力架構,將Compressed Sparse Attention與高壓縮注意力(HCA)結合,同時配合DSA稀疏注意力,在token維度進行壓縮。

此外,模型引入了流形約束超連接(mHC)增強傳統殘差連接,并使用Muon優化器提升收斂速度和訓練穩定性。這一系列設計,使得模型在“記得更長”的同時,有效控制計算成本。

從官方給出的數據來看,在100萬token上下文下,DeepSeek-V4-Pro單token推理TFLOPs相比DeepSeek-V3.2下降約3.7倍至9.8倍區間KV Cache占用下降9.5倍至13.7倍


這意味著,過去難以實際運行的超長鏈路任務(如多輪Agent規劃、長文檔處理),開始進入可執行范圍。

三、推理、知識、代碼三線抬升,開源模型逼近閉源上限

從能力結構來看,DeepSeek-V4-Pro的提升是推理、知識與Agent能力的同步抬升。

在知識與推理類任務中,其在SimpleQA、Apex、Codeforces等評測中均超過當前主流開源模型,并在多項任務上接近GPT-5.4與Gemini 3.1 Pro。例如在Apex Shortlist中達到90.2分,已經超越頂級閉源模型;在Codeforces等競賽類任務中,也維持在第一梯隊水平。

在Agent能力相關任務中,DeepSeek-V4-Pro在SWE Verified、Terminal Bench等指標上表現穩定,SWE Verified達到80.6,接近Claude Opus 4.6,明顯高于多數開源模型。其表現同樣超過GLM-5.1 Thinking、Kimi K2.6 Thinking等模型


整體來看,DeepSeek-V4-Pro已是目前開源模型的“天花板”。

四、Agent能力專項優化,開始圍繞真實工作流打磨

這一代DeepSeek-V4明顯強化了對Agent場景的適配。其針對Claude Code、OpenClaw、CodeBuddy等主流Agent框架進行了專項優化,在代碼生成、文檔生成等多步驟任務中表現更穩定。下圖為DeepSeek-V4-Pro在某 Agent框架下生成的PPT內頁示例:


從實際定位來看,DeepSeek-V4-Pro已經被DeepSeek內部作為Agentic Coding模型使用,側重點在于“完成任務”。在簡單任務上,V4-Flash已可與Pro版本接近,而在復雜任務中仍存在明顯差距。

本質上是在為Agent應用提供兩種“算力檔位”。DeepSeek-V4-Flash在簡單Agent任務中已經能夠與Pro“旗鼓相當”,但在復雜任務中仍有差距。這種差異,本質上是推理深度與上下文利用能力的差別。

結語:DeepSeek-V4亮相,國產算力與開源路線的落地之光

DeepSeek-V4的發布不僅展現了團隊在技術和架構上的積淀,也標志著開源大模型在國產算力生態下的實際落地能力。

經過對華為昇騰、寒武紀等國產芯片的適配優化,DeepSeek-V4系列實現了百萬token上下文的穩定支持和高效推理,使長鏈路任務與多步Agent執行成為可能。

這一版本將Pro與Flash的不同定位落到實處,在性能上逼近閉源旗艦模型,在成本上保持高性價比,為國內開發者提供了前所未有的開放選項。

更重要的是,這次發布顯示出開源模型不僅能在全球競爭中站穩腳跟,也能夠借助國產算力和優化架構,將技術潛力轉化為實際可用的生產力。DeepSeek-V4或許是中國開源力量在高性能AI賽道上邁出的關鍵一步,也為國內AI生態的創新和落地提供了明確指引。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
李斌回應樂道L90“背刺老車主”:“直接現金補償”訴求,公司當期將面臨數億元虧損

李斌回應樂道L90“背刺老車主”:“直接現金補償”訴求,公司當期將面臨數億元虧損

驅動中國
2026-04-23 18:56:09
中國制裁有沒有用?看看今天的美國洛馬就知道了,什么叫釜底抽薪

中國制裁有沒有用?看看今天的美國洛馬就知道了,什么叫釜底抽薪

觸摸史跡
2026-04-24 04:58:08
美國想各個擊破,最終目標是中國

美國想各個擊破,最終目標是中國

觀察者網
2026-04-24 08:24:07
貝佐斯沒想到,分走百億資產的前妻,如今竟令自己再次刮目相看

貝佐斯沒想到,分走百億資產的前妻,如今竟令自己再次刮目相看

次元君情感
2026-04-24 11:51:43
“中年返貧三件套”,正在吞掉一代人的存款

“中年返貧三件套”,正在吞掉一代人的存款

十點讀書
2026-04-18 18:36:15
60~75歲老人,除不爬高外,這八件事也沒做,你就是一位寶藏老人

60~75歲老人,除不爬高外,這八件事也沒做,你就是一位寶藏老人

暖風吹過竹林
2026-04-24 09:22:48
鄭麗文贏麻了!民進黨被逼到絕路、做出3大讓步,賴清德服軟了?

鄭麗文贏麻了!民進黨被逼到絕路、做出3大讓步,賴清德服軟了?

似水流年忘我
2026-04-23 18:06:40
我是天津人,全家一起來了趟上海,確實有點想不明白這四件事

我是天津人,全家一起來了趟上海,確實有點想不明白這四件事

王姐懶人家常菜
2026-04-20 03:27:17
永遠不會倒閉的四大行業,選對一輩子衣食無憂!

永遠不會倒閉的四大行業,選對一輩子衣食無憂!

細說職場
2026-04-08 06:22:58
醫生把手指伸入病人“后門”檢查直腸,意外捅好了病人的心臟病

醫生把手指伸入病人“后門”檢查直腸,意外捅好了病人的心臟病

新浪財經
2026-04-21 20:43:23
最全人體穴道圖,有空自己捏捏吧,心肝脾肺腎都暢通了

最全人體穴道圖,有空自己捏捏吧,心肝脾肺腎都暢通了

新浪財經
2026-04-19 01:39:16
吝嗇鬼!開拓者老板被批!NBA總裁緊急回應

吝嗇鬼!開拓者老板被批!NBA總裁緊急回應

籃球教學論壇
2026-04-24 14:39:01
國際媒體稱:戰爭一旦爆發,中國將到達一個無人知曉的地步

國際媒體稱:戰爭一旦爆發,中國將到達一個無人知曉的地步

音樂時光的娛樂
2026-04-23 20:12:38
牡丹花下死!汪峰官宣戀情才2年,森林北又走上了章子怡的老路

牡丹花下死!汪峰官宣戀情才2年,森林北又走上了章子怡的老路

落雪聽梅a
2026-04-24 07:58:40
伊朗“內鬼”竟是美制路由器!美科技巨頭集體沉默,中國早有防備

伊朗“內鬼”竟是美制路由器!美科技巨頭集體沉默,中國早有防備

Thurman在昆明
2026-04-23 19:42:10
中南醫院王行環被雙開后,有女醫生怒斥:他把醫院當“后宮”

中南醫院王行環被雙開后,有女醫生怒斥:他把醫院當“后宮”

時尚的弄潮
2026-04-24 13:11:07
靠,出事了!光刻膠第一真龍,獲高盛、巴克萊、瑞銀聯手掃貨?

靠,出事了!光刻膠第一真龍,獲高盛、巴克萊、瑞銀聯手掃貨?

財報翻譯官
2026-04-24 08:51:38
空降醫院當院長,報道前一天陪父親看病,主治醫生不耐煩:催啥催

空降醫院當院長,報道前一天陪父親看病,主治醫生不耐煩:催啥催

曉艾故事匯
2025-10-28 21:42:30
女兒兼職攢錢買兩萬多項鏈,家長崩潰說虛榮,不料被網友看穿破防

女兒兼職攢錢買兩萬多項鏈,家長崩潰說虛榮,不料被網友看穿破防

侃故事的阿慶
2026-04-24 12:26:32
印媒曾曝料:2020年若不是中國99A坦克急上高原,印度或真會動手

印媒曾曝料:2020年若不是中國99A坦克急上高原,印度或真會動手

混沌錄
2026-04-22 21:15:09
2026-04-24 16:31:00
智東西 incentive-icons
智東西
智東西,AI產業新媒體,專注報道人工智能的前沿技術發展,和技術應用帶來的千行百業產業變革。
11680文章數 117038關注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價格依然"屠夫級"

頭條要聞

女子買二手奔馳里程數偏差20萬公里 看到事故記錄崩潰

頭條要聞

女子買二手奔馳里程數偏差20萬公里 看到事故記錄崩潰

體育要聞

里程碑之戰拖后腿,哈登18分8失誤

娛樂要聞

停工16個月!趙露思證實接拍新劇

財經要聞

19家企業要"鋁代銅",格力偏不

汽車要聞

YU7 GT 5 月上市!小米Vision GT概念車國內首秀

態度原創

健康
數碼
房產
藝術
公開課

干細胞如何讓燒燙傷皮膚"再生"?

數碼要聞

DeepSeek:預計下半年昇騰950超節點批量上市后 V4-Pro模型價格會大幅下調

房產要聞

三亞安居房,突然官宣!

藝術要聞

16幅 佐恩高清油畫 | 瑞典著名畫家

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版