網易首頁 > 網易號 > 正文 申請入駐

DeepSeek V4 即將發布:編程能力首次超越 Claude 和 GPT

0
分享至

先說結論:這次不是吹牛編程能力到底有多強??全項目理解:一次性看懂數十萬行跨文件代碼及調用關系?自動化重構:自動進行項目重構、漏洞檢測與測試用例生成?設計圖轉代碼:Design2Code 準確率達 92%,響應延遲 4 秒五大技術亮點1. 萬億參數 MoE 架構2. 100萬 Token 上下文窗口?可以一次性處理《三體》全集?可以分析整套法律合同?可以理解數十萬行代碼工程3. Engram 條件記憶機制4. 國產芯片深度適配5. 原生多模態架構產品端的變化對開發者意味著什么?對行業意味著什么?寫在最后1API 定價:預計比 Claude 便宜 10-30 倍2上下文窗口:100萬 Token,可以處理整個項目3國產算力:華為昇騰深度適配,自主可控

昨天刷到一個消息,整個人都精神了。

DeepSeek 創始人梁文鋒在內部溝通中透露,DeepSeek V4 將于 4 月下旬正式發布

更關鍵的是,泄露的基準測試數據顯示:V4 在 HumanEval 編程測試中得分90%,超越了 Claude 的 88% 和 GPT-4 的 82%。

這是國產大模型首次在編程能力上超越硅谷頭部玩家

我翻了十幾篇報道,把 V4 的關鍵信息都整理出來了。如果你是開發者,或者關注 AI 行業,這篇文章值得看完。

DeepSeek V4 的消息從去年下半年就開始傳,中間跳票了好幾次,"被發布"的烏龍新聞也不少。

但這次不一樣。

第一,創始人親自背書。梁文鋒在內部溝通中明確說了"4月下旬發布",這是官方層面的確認。

第二,產品端已經動了。4月8日,DeepSeek 上線了"快速模式"和"專家模式",官方明確回應"專家模式是 V4 版本更新的核心功能"。灰度測試界面還出現了"視覺模式"選項,暗示 V4 將具備原生多模態能力。

第三,基準測試數據流出。HumanEval 得分 90%,這個數據來自泄露的內部測試,雖然不是官方發布,但多家媒體都有報道,可信度較高。

簡單說,這次是真的要來了。

先看數據。

模型: DeepSeek V4 | HumanEval 得分: 90%

模型: Claude Opus 4.5 | HumanEval 得分: 88%

模型: GPT-4 | HumanEval 得分: 82%

HumanEval 是 AI 編程能力的標準測試,簡單理解就是"10道編程題能做對幾道"。

V4 能做對 9 道,Claude 能做對 8.8 道,GPT-4 能做對 8.2 道。

差距看起來不大,但這是首次有國產模型在這個測試中超越硅谷頭部

更關鍵的是,V4 不只是"幫你寫代碼",而是"幫你做軟件工程":

有開發者實測,讓 V4 寫一個 p5.js 模擬小球在旋轉六邊形內彈跳的程序,結果軌跡精準、物理邏輯嚴密。

說實話,這個能力已經接近"初級工程師"的水平了。

V4 采用萬億參數混合專家架構,但每次推理只激活約 370 億參數。

這意味著什么?

同樣的能力,十分之一的成本。

速度提升 35 倍,能耗降低 40%,API 價格預計比 GPT-5 和 Claude 便宜 10-30 倍。

這是 V4 最讓我震撼的一點。

100萬 Token 是什么概念?

對比一下:Claude Opus 4.5 是 200K,GPT-4o 是 128K。V4 是它們的 5-8 倍。

而且檢索速度接近 O(1),百萬文本細節查詢秒響應。

這是一個很聰明的架構創新。

傳統 Transformer 把所有知識塞進參數,容易導致長上下文檢索衰退。

V4 把"記憶存儲"和"推理計算"分開,類似人類大腦的海馬體和皮層分工。

結果:記憶準確率達到 98.2%,比 GPT-4o 高 8.5 個百分點。

V4 優先支持華為昇騰、寒武紀、海光等國產 GPU。

通過重寫底層算子,國產芯片推理速度提升 35 倍,達到 80 tokens/s。

這意味著什么?

從模型到硬件的全鏈路自主可控。

V4 不是"文本模型 + 視覺插件"的拼接,而是原生多模態統一架構。

圖文音視頻映射到同一語義空間,理解更深入,生成更自然。

4月8日,DeepSeek 上線了模式分層設計:

模式: 快速模式 | 用途: 日常對話、即時響應 | 特點: 支持圖片、文件識別

模式: 專家模式 | 用途: 復雜推理、數學、編程 | 特點: 深度思考,高峰可能排隊

這個設計很聰明。

簡單問題用輕量模型,復雜問題用強力模型,既節省成本,又保證質量。

灰度測試界面還出現了"視覺模式"選項,雖然還沒全面開放,但暗示 V4 的多模態能力即將落地。

我看了下 V4 的編程能力,有幾個關鍵點:

第一,代碼生成更準確。

HumanEval 90% 的得分,意味著大多數編程任務 V4 都能搞定。

第二,項目級理解能力。

100萬 Token 上下文,可以一次性理解整個項目,不用分段處理。

第三,自動化程度更高。

自動重構、漏洞檢測、測試用例生成,這些以前需要人工做的事情,V4 可以自動完成。

第四,成本更低。

API 價格預計比 GPT-5 和 Claude 便宜 10-30 倍,對高頻調用的開發者來說是重大利好。

第一,國產 AI 首次在核心能力上超越硅谷。

編程能力是大模型的"試金石",V4 的突破意味著國產 AI 已經進入世界第一梯隊。

第二,從"價格戰"轉向"能力戰"。

以前國產 AI 靠便宜搶市場,現在靠能力說話。

第三,國產算力生態加速成熟。

V4 與華為昇騰深度綁定,意味著國產 AI 產業鏈正在形成閉環。

DeepSeek V4 的發布,是國產 AI 的一個里程碑。

從 V1 到 V4,DeepSeek 用不到兩年時間完成了三次關鍵躍遷。這次 V4 在編程能力上超越 Claude 和 GPT,標志著國產大模型已經從"追趕者"變成"領跑者"。

4月下旬,V4 正式發布后,我會第一時間實測,給大家帶來更詳細的評測。

如果你是開發者,建議關注這三點:

如果這篇文章對你有幫助,點個贊、轉發給需要的朋友。有問題評論區聊,我看到都會回。



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
兩個賽季狂轟33球 19歲鋒線神童橫空出世 開價6000萬鎊 8豪門瘋搶

兩個賽季狂轟33球 19歲鋒線神童橫空出世 開價6000萬鎊 8豪門瘋搶

零度眼看球
2026-04-26 07:15:19
劉祝潤配進國家隊!楊希油炸丸子技驚四座,海港有無一將判若兩隊

劉祝潤配進國家隊!楊希油炸丸子技驚四座,海港有無一將判若兩隊

刀鋒體育
2026-04-25 23:47:39
廣東夫妻辦完離婚揮手告別,妻子轉身蹲地大哭,下一秒結局神反轉

廣東夫妻辦完離婚揮手告別,妻子轉身蹲地大哭,下一秒結局神反轉

新時代的兩性情感
2026-04-26 04:57:00
DeepSeek聯手華為掀桌子后,黃仁勛給英偉達下達了死命令

DeepSeek聯手華為掀桌子后,黃仁勛給英偉達下達了死命令

南宗歷史
2026-04-25 10:12:48
國家電網第二批錄了10500人,清華才7個,一所你沒聽過的學校進了444人

國家電網第二批錄了10500人,清華才7個,一所你沒聽過的學校進了444人

老滿說高考
2026-04-24 20:13:49
“見過最廉價的兜底”,一份山姆燒雞,讓低認知母子淪為全網笑柄

“見過最廉價的兜底”,一份山姆燒雞,讓低認知母子淪為全網笑柄

妍妍教育日記
2026-04-15 09:30:09
14場打入12球!羅馬2500萬歐元買來鋒線支柱,荷蘭鋒霸即將破紀錄

14場打入12球!羅馬2500萬歐元買來鋒線支柱,荷蘭鋒霸即將破紀錄

體壇老球迷
2026-04-26 08:32:05
湖人vs火箭G4傷病報告:東契奇傷停 里夫斯杜蘭特均出戰成疑

湖人vs火箭G4傷病報告:東契奇傷停 里夫斯杜蘭特均出戰成疑

醉臥浮生
2026-04-26 06:20:13
驚天內幕!1984年中美黑鷹交易只交付24架,真相竟是戰略失誤!

驚天內幕!1984年中美黑鷹交易只交付24架,真相竟是戰略失誤!

人生錄
2026-04-25 15:13:17
天津4-2 贏球不可怕 可怕的是于根偉賽后一席話 兩三個人都拼到抽筋

天津4-2 贏球不可怕 可怕的是于根偉賽后一席話 兩三個人都拼到抽筋

劉哥談體育
2026-04-26 03:12:41
再見,曼聯!9000萬“大核”決定離隊!斥資2.4億簽下“新中軸”

再見,曼聯!9000萬“大核”決定離隊!斥資2.4億簽下“新中軸”

頭狼追球
2026-04-25 13:27:55
“替父出征”夏卡武與洪森“心亂如麻”:柬埔寨王位暗戰終局將至

“替父出征”夏卡武與洪森“心亂如麻”:柬埔寨王位暗戰終局將至

民間平淡生活
2026-04-25 03:02:36
廣東下一波暴雨,時間確定!

廣東下一波暴雨,時間確定!

羊城攻略
2026-04-25 23:23:56
赫塔費0-2巴塞羅那,賽后評分:不是拉什福德第1,巴薩5號第一

赫塔費0-2巴塞羅那,賽后評分:不是拉什福德第1,巴薩5號第一

凌空倒鉤
2026-04-26 00:20:01
從源頭說,我軍打仗有兩種打法,一是毛主席打法,二是徐向前打法

從源頭說,我軍打仗有兩種打法,一是毛主席打法,二是徐向前打法

品點歷史
2026-04-26 06:45:11
北控出局賽后,京媒罕見點名批評1人,京迷喊話:集體給張帆道歉

北控出局賽后,京媒罕見點名批評1人,京迷喊話:集體給張帆道歉

后仰大風車
2026-04-25 07:10:13
63 歲李玲玉近照曝光!海南度假長相年輕,直言老人不該幫帶娃

63 歲李玲玉近照曝光!海南度假長相年輕,直言老人不該幫帶娃

東方不敗然多多
2026-04-26 08:15:58
蔣萬安發出強硬警告,"中國臺灣省"走向國際,10國選擇明智應對

蔣萬安發出強硬警告,"中國臺灣省"走向國際,10國選擇明智應對

福建睿平
2026-04-25 11:54:44
兩家孩子被醫院抱錯5年,家長含淚換子,孩子的回答看哭了!

兩家孩子被醫院抱錯5年,家長含淚換子,孩子的回答看哭了!

莫地方
2026-04-26 02:00:03
廣東3消息!胡明軒正式發聲,徐昕回應直面杜鋒,徐杰獲MVP候選

廣東3消息!胡明軒正式發聲,徐昕回應直面杜鋒,徐杰獲MVP候選

多特體育說
2026-04-25 11:24:28
2026-04-26 09:07:00
AI效率筆記
AI效率筆記
專注AI工具測評與效率提升。
397文章數 10關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

2萬海員在霍爾木茲海峽成"活靶子":或隨時被炸成灰燼

頭條要聞

2萬海員在霍爾木茲海峽成"活靶子":或隨時被炸成灰燼

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

藝術
家居
親子
房產
軍事航空

藝術要聞

毛澤東寫小字,太瀟灑了

家居要聞

自然肌理 溫潤美學

親子要聞

總感覺她們兩是上輩子的情人!

房產要聞

新一輪教育大爆發來了!海口,開始瘋狂建學校!

軍事要聞

伊朗總統:不會在壓力、威脅下進行談判

無障礙瀏覽 進入關懷版