網易首頁 > 網易號 > 正文申請入駐

剛發布就落伍！DeepSeek V4竟坦承不如GPT-5.4

2026-04-24 14:34:49　來源: 電腦報少年派

重慶舉報

分享至

2026年4月24日，全球AI行業迎來一個足以載入史冊的日子。

中國AI公司DeepSeek正式發布全新系列模型DeepSeek-V4預覽版并同步開源，總參數高達1.6萬億。而同一天，OpenAI發布的新一代旗艦模型GPT-5.5，API定價飆升至每百萬Token輸出30美元，是前代的三倍。

一邊是“開源普惠、成本重構”，另一邊是“性能登頂、價格翻倍”。同一天的隔空對撞，徹底將AI行業撕裂為兩條完全不同的道路。

這不是巧合，這是一場蓄謀已久的路線攤牌。

參數對決

1.6萬億MoE架構的降維打擊

DeepSeek-V4此次推出Pro和Flash兩個版本：DeepSeek-V4-Pro總參數1.6萬億、激活參數49B；DeepSeek-V4-Flash總參數284B、激活參數13B，均原生支持100萬token上下文。

架構上，V4采用了DSA2注意力機制，融合了DeepSeek V3/R1中已驗證的DSA設計與今年初論文中提出的NSA稀疏注意力方案。混合專家系統（MoE）啟用Mega內核結構，每層配置384個專家，每次推理激活其中6個。

這套架構的直接效果是驚人的效率突破——在100萬上下文設置下，V4-Pro的單token推理FLOPs只有前代V3.2的27%，KV Cache只有10%；V4-Flash更極端，分別壓到10%和7%。

這意味著，DeepSeek做了一個大膽的選擇：不拼絕對性能的“越級”，而是把超長上下文的計算成本打穿到極致。官方自己承認，V4的能力水平發展軌跡大約滯后前沿閉源模型3至6個月。但這句話背后隱藏的真實意圖是——當別人在堆性能時，我在拆成本。

而GPT-5.5則在另一條賽道上狂奔。在Terminal-Bench 2.0這項測試復雜命令行工作流的硬核基準中，GPT-5.5得分82.7%，不僅碾壓前代GPT-5.4的75.1%，更將最強競品Claude Opus 4.7的69.4%拉開了超13個百分點。在評估44種職業知識工作能力的GDPval中，GPT-5.5在84.9%的任務中達到或超過行業專家水平。

但注意，DeepSeek V4技術報告公開的對比對手，是GPT-5.4、Opus 4.6，并不含同一天發布的GPT-5.5。在這場同臺競技中，V4的對手已經不是最新一代，真正的差距還需要第三方評測來驗證。

30美元 vs 1元錢

AI的階級分裂

如果說參數是武器，價格就是那道真正的撕裂線。

GPT-5.5的API定價為每百萬Token輸入5美元、輸出30美元，GPT-5.5 Pro更是高達輸入30美元、輸出180美元，比GPT-5.4翻了三倍。OpenAI總裁Greg Brockman的辯解是：雖然單價漲了，但GPT-5.5完成相同任務所需Token數量大幅減少，完成相同智能水平任務時綜合成本反而下降約40%。

再看DeepSeek V4：Flash版本1元/百萬Token（緩存未命中），輸出僅需2元；Pro版本也不過12元/百萬Token輸入、24元輸出。按當前匯率簡單換算，GPT-5.5 Pro的輸出價格約是DeepSeek V4-Pro的50倍以上。

這不是價格差異，這是階層分化。

OpenAI選擇了“奢侈品路線”——讓最先進的技術先服務于能付得起錢的企業級客戶。NVIDIA GB200 NVL72系統上部署GPT-5.5后，百萬Token成本確實降到了前代的1/35，但這個降幅的受益方是英偉達內部，不是普通開發者。

DeepSeek則選擇了一條完全相反的路線——開源權重、全量模型可下載，1M上下文成為所有官方服務的標配。不需要依賴特定硬件，不需要支付天價Token費。"普惠"這個詞，DeepSeek是認真的。

誰才是真正的“打工人替代者”

如果說價格是用戶的選擇題，Agent能力就是技術路線的最終驗收場。

GPT-5.5的核心定位是“面向真實工作的新型智能”，最大的突破在于Agent能力——用戶無需精細管理每一步，只需下達模糊的多部分任務，模型即可自主規劃、調用工具、檢查結果并持續推進直至完成。

英偉達一位內測工程師的說法極具沖擊力：“失去GPT-5.5的訪問權限，就像被截肢。”這不是公關話術，這是一線開發者的真實反饋。Cursor CEO Michael Truell也給出了實測評價：“GPT-5.5比GPT-5.4明顯更聰明、更持續，對于復雜、長時間運行的任務，它能堅持到底不中途停下。”

而在Agent這條賽道上，DeepSeek V4同樣沒有缺席。V4-Pro在Agentic Coding評測中已達到當前開源模型最佳水平，使用體驗優于Sonnet 4.5，交付質量接近Opus 4.6非思考模式。V4還針對Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent產品進行了專項適配和優化。

但差距也是明擺著的。在Terminal-Bench 2.0 Agent任務中，V4-Pro得分67.9%，低于Gemini 3.1 Pro的68.5%，與GPT-5.5的82.7%差距更是一目了然。

一位行業觀察者的判斷精準而殘酷：“GPT-5.5從模型層面改進了智能體最核心的幾個特征——理解目標、拆解步驟、調用工具、修正過程，并最終交付結果。每一項都不是全新能力，但被放到同一個系統里之后，體驗開始發生變化。”

這句話翻譯過來就是：DeepSeek把Agent的基礎設施鋪好了，但GPT-5.5已經跑在上面的成品賽道上了。

開源 vs 閉源

一場沒有回頭路的路線分裂

這場同日對撞的本質，不是“誰更好”的比較題，而是“哪條路能走通”的路線之爭。

OpenAI的GPT-5.5走的是極致性能閉環。它與英偉達GB200/GB300 NVL72系統聯合設計，從訓練到部署，模型和硬件之間從誕生開始就“雙向奔赴”。NVIDIA內部已有超過10,000名員工率先使用，原本耗時數天的調試周期縮短至數小時，復雜多文件代碼庫的實驗周期從數周壓縮至一夜之間。

DeepSeek V4走的是開源生態擴張。模型權重全部公開，API兼容OpenAI ChatCompletions與Anthropic兩套標準，1M上下文向下兼容，全部模型可本地部署，對國產AI硬件（華為昇騰等）和NVIDIA Blackwell架構做了雙重優化。

這兩條路的選擇背后，藏著更深的地緣政治邏輯。DeepSeek V4在KnowYourSymbol評測中以96%領先GPT-5.4的95%和Gemini 2.5 Pro的92.8%，在中文語境和東方知識體系中的表現已展現獨到優勢。而OpenAI則深度綁定英偉達生態，Codex產品被推廣至英偉達全公司，奧爾特曼親自曬出了與黃仁勛的交流郵件。

這不是一場單純的產品競爭，這是兩種AI治理體系和產業生態的全面角力。

差距承認了，然后呢？

最有意思的，是DeepSeek這次罕見的“坦誠”。

官方技術報告中明確寫道：V4的能力水平仍落后GPT-5.4和Gemini-3.1-Pro。注意，這里說的甚至不是GPT-5.5，而是上一代的GPT-5.4。

這種公開“認輸”在AI行業極為罕見。但細看之下，這不是認輸，而是一種精妙的重置敘事——我承認我現在追不上你，但我要告訴你，追不上的那段路，我不跟你比了。

V4在長上下文成本上做到了極致，將百萬token推理的KV Cache降到了前代的10%，這種工程化突破的價值遠不止于“省內存”——它打開了允許模型在一個連續語境中讀完100萬本書、追蹤整個代碼倉庫歷史、處理一個企業全部會議紀要的技術通道。

GPT-5.5在智力上跑得更快，但GPT-5.5的400K上下文窗口背后，是每百萬Token 30美元的代價。DeepSeek的1M上下文背后，是1元錢的Flash版入門費。

“更聰明”需要更強算力、更貴硬件、更高單價。而“足夠聰明但更便宜”需要更極致的架構創新和工程優化。哪條路能走得更遠？行業里沒人有標準答案。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.