无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

剛發布就落伍!DeepSeek V4竟坦承不如GPT-5.4

0
分享至

2026年4月24日,全球AI行業迎來一個足以載入史冊的日子。

中國AI公司DeepSeek正式發布全新系列模型DeepSeek-V4預覽版并同步開源,總參數高達1.6萬億。而同一天,OpenAI發布的新一代旗艦模型GPT-5.5,API定價飆升至每百萬Token輸出30美元,是前代的三倍。



一邊是“開源普惠、成本重構”,另一邊是“性能登頂、價格翻倍”。同一天的隔空對撞,徹底將AI行業撕裂為兩條完全不同的道路。

這不是巧合,這是一場蓄謀已久的路線攤牌。

01

參數對決

1.6萬億MoE架構的降維打擊

DeepSeek-V4此次推出Pro和Flash兩個版本:DeepSeek-V4-Pro總參數1.6萬億、激活參數49B;DeepSeek-V4-Flash總參數284B、激活參數13B,均原生支持100萬token上下文。

架構上,V4采用了DSA2注意力機制,融合了DeepSeek V3/R1中已驗證的DSA設計與今年初論文中提出的NSA稀疏注意力方案。混合專家系統(MoE)啟用Mega內核結構,每層配置384個專家,每次推理激活其中6個。



這套架構的直接效果是驚人的效率突破——在100萬上下文設置下,V4-Pro的單token推理FLOPs只有前代V3.2的27%,KV Cache只有10%;V4-Flash更極端,分別壓到10%和7%。

這意味著,DeepSeek做了一個大膽的選擇:不拼絕對性能的“越級”,而是把超長上下文的計算成本打穿到極致。官方自己承認,V4的能力水平發展軌跡大約滯后前沿閉源模型3至6個月。但這句話背后隱藏的真實意圖是——當別人在堆性能時,我在拆成本。

而GPT-5.5則在另一條賽道上狂奔。在Terminal-Bench 2.0這項測試復雜命令行工作流的硬核基準中,GPT-5.5得分82.7%,不僅碾壓前代GPT-5.4的75.1%,更將最強競品Claude Opus 4.7的69.4%拉開了超13個百分點。在評估44種職業知識工作能力的GDPval中,GPT-5.5在84.9%的任務中達到或超過行業專家水平。



但注意,DeepSeek V4技術報告公開的對比對手,是GPT-5.4、Opus 4.6,并不含同一天發布的GPT-5.5。在這場同臺競技中,V4的對手已經不是最新一代,真正的差距還需要第三方評測來驗證。

02

30美元 vs 1元錢

AI的階級分裂

如果說參數是武器,價格就是那道真正的撕裂線。

GPT-5.5的API定價為每百萬Token輸入5美元、輸出30美元,GPT-5.5 Pro更是高達輸入30美元、輸出180美元,比GPT-5.4翻了三倍。OpenAI總裁Greg Brockman的辯解是:雖然單價漲了,但GPT-5.5完成相同任務所需Token數量大幅減少,完成相同智能水平任務時綜合成本反而下降約40%。



再看DeepSeek V4:Flash版本1元/百萬Token(緩存未命中),輸出僅需2元;Pro版本也不過12元/百萬Token輸入、24元輸出。按當前匯率簡單換算,GPT-5.5 Pro的輸出價格約是DeepSeek V4-Pro的50倍以上。

這不是價格差異,這是階層分化。

OpenAI選擇了“奢侈品路線”——讓最先進的技術先服務于能付得起錢的企業級客戶。NVIDIA GB200 NVL72系統上部署GPT-5.5后,百萬Token成本確實降到了前代的1/35,但這個降幅的受益方是英偉達內部,不是普通開發者。

DeepSeek則選擇了一條完全相反的路線——開源權重、全量模型可下載,1M上下文成為所有官方服務的標配。不需要依賴特定硬件,不需要支付天價Token費。"普惠"這個詞,DeepSeek是認真的。

03

誰才是真正的“打工人替代者”

如果說價格是用戶的選擇題,Agent能力就是技術路線的最終驗收場。

GPT-5.5的核心定位是“面向真實工作的新型智能”,最大的突破在于Agent能力——用戶無需精細管理每一步,只需下達模糊的多部分任務,模型即可自主規劃、調用工具、檢查結果并持續推進直至完成。



英偉達一位內測工程師的說法極具沖擊力:“失去GPT-5.5的訪問權限,就像被截肢。”這不是公關話術,這是一線開發者的真實反饋。Cursor CEO Michael Truell也給出了實測評價:“GPT-5.5比GPT-5.4明顯更聰明、更持續,對于復雜、長時間運行的任務,它能堅持到底不中途停下。”

而在Agent這條賽道上,DeepSeek V4同樣沒有缺席。V4-Pro在Agentic Coding評測中已達到當前開源模型最佳水平,使用體驗優于Sonnet 4.5,交付質量接近Opus 4.6非思考模式。V4還針對Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent產品進行了專項適配和優化。



但差距也是明擺著的。在Terminal-Bench 2.0 Agent任務中,V4-Pro得分67.9%,低于Gemini 3.1 Pro的68.5%,與GPT-5.5的82.7%差距更是一目了然。

一位行業觀察者的判斷精準而殘酷:“GPT-5.5從模型層面改進了智能體最核心的幾個特征——理解目標、拆解步驟、調用工具、修正過程,并最終交付結果。每一項都不是全新能力,但被放到同一個系統里之后,體驗開始發生變化。”

這句話翻譯過來就是:DeepSeek把Agent的基礎設施鋪好了,但GPT-5.5已經跑在上面的成品賽道上了。

04

開源 vs 閉源

一場沒有回頭路的路線分裂

這場同日對撞的本質,不是“誰更好”的比較題,而是“哪條路能走通”的路線之爭。

OpenAI的GPT-5.5走的是極致性能閉環。它與英偉達GB200/GB300 NVL72系統聯合設計,從訓練到部署,模型和硬件之間從誕生開始就“雙向奔赴”。NVIDIA內部已有超過10,000名員工率先使用,原本耗時數天的調試周期縮短至數小時,復雜多文件代碼庫的實驗周期從數周壓縮至一夜之間。



DeepSeek V4走的是開源生態擴張。模型權重全部公開,API兼容OpenAI ChatCompletions與Anthropic兩套標準,1M上下文向下兼容,全部模型可本地部署,對國產AI硬件(華為昇騰等)和NVIDIA Blackwell架構做了雙重優化。

這兩條路的選擇背后,藏著更深的地緣政治邏輯。DeepSeek V4在KnowYourSymbol評測中以96%領先GPT-5.4的95%和Gemini 2.5 Pro的92.8%,在中文語境和東方知識體系中的表現已展現獨到優勢。而OpenAI則深度綁定英偉達生態,Codex產品被推廣至英偉達全公司,奧爾特曼親自曬出了與黃仁勛的交流郵件。

這不是一場單純的產品競爭,這是兩種AI治理體系和產業生態的全面角力。

05

差距承認了,然后呢?

最有意思的,是DeepSeek這次罕見的“坦誠”。

官方技術報告中明確寫道:V4的能力水平仍落后GPT-5.4和Gemini-3.1-Pro。注意,這里說的甚至不是GPT-5.5,而是上一代的GPT-5.4。



這種公開“認輸”在AI行業極為罕見。但細看之下,這不是認輸,而是一種精妙的重置敘事——我承認我現在追不上你,但我要告訴你,追不上的那段路,我不跟你比了。

V4在長上下文成本上做到了極致,將百萬token推理的KV Cache降到了前代的10%,這種工程化突破的價值遠不止于“省內存”——它打開了允許模型在一個連續語境中讀完100萬本書、追蹤整個代碼倉庫歷史、處理一個企業全部會議紀要的技術通道。

GPT-5.5在智力上跑得更快,但GPT-5.5的400K上下文窗口背后,是每百萬Token 30美元的代價。DeepSeek的1M上下文背后,是1元錢的Flash版入門費。



“更聰明”需要更強算力、更貴硬件、更高單價。而“足夠聰明但更便宜”需要更極致的架構創新和工程優化。哪條路能走得更遠?行業里沒人有標準答案。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
新疆籃協重磅換屆!買吾蘭接棒掌舵 杜鋒姐姐卻引發熱議?

新疆籃協重磅換屆!買吾蘭接棒掌舵 杜鋒姐姐卻引發熱議?

你看球呢
2026-06-16 07:00:19
“別選計算機!”211女生哭訴,引來前輩勸退:我從1.4w混成了7k

“別選計算機!”211女生哭訴,引來前輩勸退:我從1.4w混成了7k

妍妍教育日記
2026-06-13 09:35:06
1936年,江清和唐納的結婚照,看江清的長相,有點不一樣

1936年,江清和唐納的結婚照,看江清的長相,有點不一樣

人間頌
2026-06-13 10:59:47
毫無底線!具俊曄公開與大S私密往事,20年前韓國同居小屋曝光

毫無底線!具俊曄公開與大S私密往事,20年前韓國同居小屋曝光

生命之泉的奧秘
2026-06-13 17:34:56
千萬人口城市,即將擴容了

千萬人口城市,即將擴容了

城市財經
2026-06-16 12:19:54
為什么有的精神科醫生不喜歡搭理年輕抑郁患者?網友:神醫!

為什么有的精神科醫生不喜歡搭理年輕抑郁患者?網友:神醫!

夜深愛雜談
2026-06-15 23:20:50
這是一場假球?西班牙隊世界杯首秀戰平佛得角,引發外界熱議!

這是一場假球?西班牙隊世界杯首秀戰平佛得角,引發外界熱議!

羅掌柜體育
2026-06-16 10:53:59
太平島又發生激烈對峙,現場情況很危險,我們必須收回該島執法權

太平島又發生激烈對峙,現場情況很危險,我們必須收回該島執法權

老男孩兒
2026-06-14 13:28:58
博格巴見齊達內激動反應網絡走紅

博格巴見齊達內激動反應網絡走紅

體壇周報
2026-06-16 20:33:29
“摸奶子”再惹爭議,OPPO的流量反噬開始了

“摸奶子”再惹爭議,OPPO的流量反噬開始了

品牌頭版
2026-05-13 10:18:15
董路賽后一語炸鍋!2034 年國足一定進世界杯,否則退出青訓

董路賽后一語炸鍋!2034 年國足一定進世界杯,否則退出青訓

酷侃體壇
2026-06-16 21:47:47
嫁給2米26的姚明是什么體驗?葉莉:每晚睡覺必須留條保命縫

嫁給2米26的姚明是什么體驗?葉莉:每晚睡覺必須留條保命縫

又是美好的日子
2026-06-15 18:32:34
馬克龍失算了,討好特朗普卻得不償失,不到24小時,北京迎來貴客

馬克龍失算了,討好特朗普卻得不償失,不到24小時,北京迎來貴客

小陸搞笑日常
2026-06-16 12:00:44
纖細身形 + 瑜伽褲穿搭文案|瘦小女生穿出別致線條美感

纖細身形 + 瑜伽褲穿搭文案|瘦小女生穿出別致線條美感

只要高興就好
2026-06-03 11:46:20
A股:提前做好準備,明天,周三A股將這樣走

A股:提前做好準備,明天,周三A股將這樣走

財經大拿
2026-06-16 13:50:08
連裝都懶得裝了?漏洞這么多

連裝都懶得裝了?漏洞這么多

走讀新生
2026-04-22 13:46:02
6月這6種魚,全是純野生的,人工養不出來,肉嫩刺少,懂行的在搶

6月這6種魚,全是純野生的,人工養不出來,肉嫩刺少,懂行的在搶

阿龍美食記
2026-06-09 15:26:48
以色列已經告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

以色列已經告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

趣文說娛
2026-04-17 21:37:03
第一批失業的8090后,可能已經沒班可上了

第一批失業的8090后,可能已經沒班可上了

霹靂炮
2026-06-16 23:04:23
特奧多羅沒料到!全家被制裁還不算完,中國斷供化肥才是打中死穴

特奧多羅沒料到!全家被制裁還不算完,中國斷供化肥才是打中死穴

張例喜歡軟軟糯糯
2026-06-16 08:35:19
2026-06-17 00:12:49
電腦報少年派 incentive-icons
電腦報少年派
最新鮮的互聯網產業資訊
3942文章數 1603關注度
往期回顧 全部

科技要聞

DeepSeek融資500億,梁文鋒牢牢握住控制權

頭條要聞

四川警方私扣酒商159瓶茅臺 酒放庫房3年有的已成空瓶

頭條要聞

四川警方私扣酒商159瓶茅臺 酒放庫房3年有的已成空瓶

體育要聞

身價5萬的門將,擋住了12億歐元的狂轟濫炸

娛樂要聞

吳文忻葬禮:2個女兒在靈堂內茫然失措

財經要聞

從123美元到62美元 白銀價格上演過山車

汽車要聞

三車齊發 零跑全新C10/C11/C16上市12.58萬元起

態度原創

游戲
房產
手機
數碼
公開課

《弧光獵人》游先看試玩報告:保護我方奇襲者

房產要聞

最新房價:海口、三亞;新房、二手房全線下跌!

手機要聞

蘋果詳解macOS終端防詐騙粘貼攔截機制

數碼要聞

V社新Steam Machine跑分曝光,配置信息公布

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版