網易首頁 > 網易號 > 正文 申請入駐

剛發布就落伍!DeepSeek V4竟坦承不如GPT-5.4

0
分享至

2026年4月24日,全球AI行業迎來一個足以載入史冊的日子。

中國AI公司DeepSeek正式發布全新系列模型DeepSeek-V4預覽版并同步開源,總參數高達1.6萬億。而同一天,OpenAI發布的新一代旗艦模型GPT-5.5,API定價飆升至每百萬Token輸出30美元,是前代的三倍。



一邊是“開源普惠、成本重構”,另一邊是“性能登頂、價格翻倍”。同一天的隔空對撞,徹底將AI行業撕裂為兩條完全不同的道路。

這不是巧合,這是一場蓄謀已久的路線攤牌。

01

參數對決

1.6萬億MoE架構的降維打擊

DeepSeek-V4此次推出Pro和Flash兩個版本:DeepSeek-V4-Pro總參數1.6萬億、激活參數49B;DeepSeek-V4-Flash總參數284B、激活參數13B,均原生支持100萬token上下文。

架構上,V4采用了DSA2注意力機制,融合了DeepSeek V3/R1中已驗證的DSA設計與今年初論文中提出的NSA稀疏注意力方案。混合專家系統(MoE)啟用Mega內核結構,每層配置384個專家,每次推理激活其中6個。



這套架構的直接效果是驚人的效率突破——在100萬上下文設置下,V4-Pro的單token推理FLOPs只有前代V3.2的27%,KV Cache只有10%;V4-Flash更極端,分別壓到10%和7%。

這意味著,DeepSeek做了一個大膽的選擇:不拼絕對性能的“越級”,而是把超長上下文的計算成本打穿到極致。官方自己承認,V4的能力水平發展軌跡大約滯后前沿閉源模型3至6個月。但這句話背后隱藏的真實意圖是——當別人在堆性能時,我在拆成本。

而GPT-5.5則在另一條賽道上狂奔。在Terminal-Bench 2.0這項測試復雜命令行工作流的硬核基準中,GPT-5.5得分82.7%,不僅碾壓前代GPT-5.4的75.1%,更將最強競品Claude Opus 4.7的69.4%拉開了超13個百分點。在評估44種職業知識工作能力的GDPval中,GPT-5.5在84.9%的任務中達到或超過行業專家水平。



但注意,DeepSeek V4技術報告公開的對比對手,是GPT-5.4、Opus 4.6,并不含同一天發布的GPT-5.5。在這場同臺競技中,V4的對手已經不是最新一代,真正的差距還需要第三方評測來驗證。

02

30美元 vs 1元錢

AI的階級分裂

如果說參數是武器,價格就是那道真正的撕裂線。

GPT-5.5的API定價為每百萬Token輸入5美元、輸出30美元,GPT-5.5 Pro更是高達輸入30美元、輸出180美元,比GPT-5.4翻了三倍。OpenAI總裁Greg Brockman的辯解是:雖然單價漲了,但GPT-5.5完成相同任務所需Token數量大幅減少,完成相同智能水平任務時綜合成本反而下降約40%。



再看DeepSeek V4:Flash版本1元/百萬Token(緩存未命中),輸出僅需2元;Pro版本也不過12元/百萬Token輸入、24元輸出。按當前匯率簡單換算,GPT-5.5 Pro的輸出價格約是DeepSeek V4-Pro的50倍以上。

這不是價格差異,這是階層分化。

OpenAI選擇了“奢侈品路線”——讓最先進的技術先服務于能付得起錢的企業級客戶。NVIDIA GB200 NVL72系統上部署GPT-5.5后,百萬Token成本確實降到了前代的1/35,但這個降幅的受益方是英偉達內部,不是普通開發者。

DeepSeek則選擇了一條完全相反的路線——開源權重、全量模型可下載,1M上下文成為所有官方服務的標配。不需要依賴特定硬件,不需要支付天價Token費。"普惠"這個詞,DeepSeek是認真的。

03

誰才是真正的“打工人替代者”

如果說價格是用戶的選擇題,Agent能力就是技術路線的最終驗收場。

GPT-5.5的核心定位是“面向真實工作的新型智能”,最大的突破在于Agent能力——用戶無需精細管理每一步,只需下達模糊的多部分任務,模型即可自主規劃、調用工具、檢查結果并持續推進直至完成。



英偉達一位內測工程師的說法極具沖擊力:“失去GPT-5.5的訪問權限,就像被截肢。”這不是公關話術,這是一線開發者的真實反饋。Cursor CEO Michael Truell也給出了實測評價:“GPT-5.5比GPT-5.4明顯更聰明、更持續,對于復雜、長時間運行的任務,它能堅持到底不中途停下。”

而在Agent這條賽道上,DeepSeek V4同樣沒有缺席。V4-Pro在Agentic Coding評測中已達到當前開源模型最佳水平,使用體驗優于Sonnet 4.5,交付質量接近Opus 4.6非思考模式。V4還針對Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent產品進行了專項適配和優化。



但差距也是明擺著的。在Terminal-Bench 2.0 Agent任務中,V4-Pro得分67.9%,低于Gemini 3.1 Pro的68.5%,與GPT-5.5的82.7%差距更是一目了然。

一位行業觀察者的判斷精準而殘酷:“GPT-5.5從模型層面改進了智能體最核心的幾個特征——理解目標、拆解步驟、調用工具、修正過程,并最終交付結果。每一項都不是全新能力,但被放到同一個系統里之后,體驗開始發生變化。”

這句話翻譯過來就是:DeepSeek把Agent的基礎設施鋪好了,但GPT-5.5已經跑在上面的成品賽道上了。

04

開源 vs 閉源

一場沒有回頭路的路線分裂

這場同日對撞的本質,不是“誰更好”的比較題,而是“哪條路能走通”的路線之爭。

OpenAI的GPT-5.5走的是極致性能閉環。它與英偉達GB200/GB300 NVL72系統聯合設計,從訓練到部署,模型和硬件之間從誕生開始就“雙向奔赴”。NVIDIA內部已有超過10,000名員工率先使用,原本耗時數天的調試周期縮短至數小時,復雜多文件代碼庫的實驗周期從數周壓縮至一夜之間。



DeepSeek V4走的是開源生態擴張。模型權重全部公開,API兼容OpenAI ChatCompletions與Anthropic兩套標準,1M上下文向下兼容,全部模型可本地部署,對國產AI硬件(華為昇騰等)和NVIDIA Blackwell架構做了雙重優化。

這兩條路的選擇背后,藏著更深的地緣政治邏輯。DeepSeek V4在KnowYourSymbol評測中以96%領先GPT-5.4的95%和Gemini 2.5 Pro的92.8%,在中文語境和東方知識體系中的表現已展現獨到優勢。而OpenAI則深度綁定英偉達生態,Codex產品被推廣至英偉達全公司,奧爾特曼親自曬出了與黃仁勛的交流郵件。

這不是一場單純的產品競爭,這是兩種AI治理體系和產業生態的全面角力。

05

差距承認了,然后呢?

最有意思的,是DeepSeek這次罕見的“坦誠”。

官方技術報告中明確寫道:V4的能力水平仍落后GPT-5.4和Gemini-3.1-Pro。注意,這里說的甚至不是GPT-5.5,而是上一代的GPT-5.4。



這種公開“認輸”在AI行業極為罕見。但細看之下,這不是認輸,而是一種精妙的重置敘事——我承認我現在追不上你,但我要告訴你,追不上的那段路,我不跟你比了。

V4在長上下文成本上做到了極致,將百萬token推理的KV Cache降到了前代的10%,這種工程化突破的價值遠不止于“省內存”——它打開了允許模型在一個連續語境中讀完100萬本書、追蹤整個代碼倉庫歷史、處理一個企業全部會議紀要的技術通道。

GPT-5.5在智力上跑得更快,但GPT-5.5的400K上下文窗口背后,是每百萬Token 30美元的代價。DeepSeek的1M上下文背后,是1元錢的Flash版入門費。



“更聰明”需要更強算力、更貴硬件、更高單價。而“足夠聰明但更便宜”需要更極致的架構創新和工程優化。哪條路能走得更遠?行業里沒人有標準答案。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
為啥很多店沒生意,卻一直在營業?網友:普通人怕是開不了茶葉店

為啥很多店沒生意,卻一直在營業?網友:普通人怕是開不了茶葉店

帶你感受人間冷暖
2026-04-22 02:21:30
要不起!拉什福德年薪重回1700萬鎊,曝巴薩確認放棄,曼聯還要嗎

要不起!拉什福德年薪重回1700萬鎊,曝巴薩確認放棄,曼聯還要嗎

夏侯看英超
2026-04-25 00:42:53
果然不出所料,國民黨主席鄭麗文表態了!

果然不出所料,國民黨主席鄭麗文表態了!

達文西看世界
2026-04-24 16:08:18
高市突然強硬!日本宣布攻克稀土磁鐵,外媒:稀土牌恐將失效?

高市突然強硬!日本宣布攻克稀土磁鐵,外媒:稀土牌恐將失效?

瘋狂小菠蘿
2026-04-25 10:49:08
原村支書開鏟車當著民警面把人埋了?網友質疑民警未及時制止;山西代縣公安局:已向警督部門反饋,正處置

原村支書開鏟車當著民警面把人埋了?網友質疑民警未及時制止;山西代縣公安局:已向警督部門反饋,正處置

大風新聞
2026-04-24 17:19:02
4月25日俄烏最新:普京受邀參加G20峰會?

4月25日俄烏最新:普京受邀參加G20峰會?

西樓飲月
2026-04-25 16:23:16
10200mAh!新機官宣:4月27日,正式發布上市!

10200mAh!新機官宣:4月27日,正式發布上市!

科技堡壘
2026-04-23 11:33:29
盧特尼克暴怒:中國一塊芯片也沒買,美國的技術封鎖終于迎來反噬

盧特尼克暴怒:中國一塊芯片也沒買,美國的技術封鎖終于迎來反噬

忠誠TALK
2026-04-24 23:06:00
楊絳說:當你的孩子主動給你買衣服、買吃的,或者主動給你發紅包時,不管你缺不缺錢,有多心疼孩子賺錢辛苦,你都要欣然的收下。因為..

楊絳說:當你的孩子主動給你買衣服、買吃的,或者主動給你發紅包時,不管你缺不缺錢,有多心疼孩子賺錢辛苦,你都要欣然的收下。因為..

大愛三湘
2026-04-25 09:51:37
伊朗巴斯基被投毒:100人中毒倒下

伊朗巴斯基被投毒:100人中毒倒下

桂系007
2026-04-25 17:29:24
伊朗國防部發言人:敵人試圖體面逃離戰爭泥潭

伊朗國防部發言人:敵人試圖體面逃離戰爭泥潭

界面新聞
2026-04-25 18:24:09
今晚開始!CCTV-8、騰優愛殺瘋了, 又4部大劇同時開播, 你想追哪部

今晚開始!CCTV-8、騰優愛殺瘋了, 又4部大劇同時開播, 你想追哪部

喜歡歷史的阿繁
2026-04-25 17:31:22
湖人3-0領先火箭!老詹談與布朗尼季后賽神仙連線:他主動要的!

湖人3-0領先火箭!老詹談與布朗尼季后賽神仙連線:他主動要的!

仰臥撐FTUer
2026-04-25 20:40:19
中央紀委國家監委公開通報八起違反中央八項規定精神典型問題

中央紀委國家監委公開通報八起違反中央八項規定精神典型問題

新華社
2026-04-24 17:05:33
提前起飛10分鐘,大學生把海航告了

提前起飛10分鐘,大學生把海航告了

中國新聞周刊
2026-04-24 18:21:10
2015年,97歲溥任離世,溥儀永遠不知,弟弟的三個兒子有多厲害

2015年,97歲溥任離世,溥儀永遠不知,弟弟的三個兒子有多厲害

邊城少爺
2026-04-25 00:20:31
兩兄弟公司破產的真相!小雞嘴女星復出的代價!

兩兄弟公司破產的真相!小雞嘴女星復出的代價!

八卦瘋叔
2026-04-25 11:34:30
6位央企高管酒后大鬧國外機場,為何2年多才被曝出結果?誰在捂?

6位央企高管酒后大鬧國外機場,為何2年多才被曝出結果?誰在捂?

西門老爹
2026-04-25 15:07:02
西方承認,經過中東這一仗才發現,中國手里3張王牌,別人玩不來

西方承認,經過中東這一仗才發現,中國手里3張王牌,別人玩不來

混沌錄
2026-04-22 19:19:05
?米利唐確定手術,賽季報銷+無緣世界杯

?米利唐確定手術,賽季報銷+無緣世界杯

樂道足球
2026-04-25 20:28:04
2026-04-25 20:51:00
電腦報少年派 incentive-icons
電腦報少年派
最新鮮的互聯網產業資訊
3922文章數 1602關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

男童7歲18斤被當腦癱治多年 父母查其出生病歷發現問題

頭條要聞

男童7歲18斤被當腦癱治多年 父母查其出生病歷發現問題

體育要聞

火箭0-3觸發百分百出局定律:本季加時賽9戰8敗

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

旅游
房產
藝術
游戲
公開課

旅游要聞

從“中國游”到“中式生活”:外國人眼中的中國魅力與巨變

房產要聞

新一輪教育大爆發來了!海口,開始瘋狂建學校!

藝術要聞

302米!迪拜又拿下一項全球之最,通體是陶瓷!

LCK第二賽段:Faker冰鳥救世,T1橫掃BRO

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版