網易首頁 > 網易號 > 正文申請入駐

麻省理工科技評論：DeepSeek新版本V4之所以重要，有三個原因

2026-04-25 18:00:26　來源: 我不叫阿哏

廣東舉報

分享至

周五，中國人工智能公司DeepSeek發布了其備受期待的新一代旗艦模型V4的預覽版。值得注意的是，得益于全新的設計，該模型能夠更高效地處理大量文本，因此可以處理比上一代更長的提示信息。與DeepSeek之前的模型一樣，V4是開源的，這意味著任何人都可以下載、使用和修改它。

V4 是 DeepSeek自2025 年 1 月發布推理模型R1 以來最重要的版本。R1 在有限的計算資源下訓練而成，其強大的性能和效率震驚了全球人工智能行業，使 DeepSeek 幾乎一夜之間從一支名不見經傳的研究團隊躍升為中國最知名的 AI 公司。它也帶動了其他中國 AI 公司發布開源模型的浪潮。

此后 DeepSeek 一直保持相對低調——但本月初，它在其模型的在線版本中添加了“專家”和“閃光”模式，這實際上是在預告 V4 的發布，引發了人們的猜測，認為這些更新與即將發布的更大版本有關。

雖然該公司已成為中國人工智能雄心的有力象征，但其重返尖端前沿模型領域之前，經歷了數月的審查——包括重大人員離職、先前模型發布延遲以及來自美國和中國政府日益嚴格的審查。

那么，V4 會像 R1 那樣撼動人工智能領域嗎？幾乎肯定不會，但以下三個重要原因說明這次發布意義重大。

1.它為開源模式開辟了新天地。

與之前的R1一樣，DeepSeek聲稱V4的性能可以媲美市面上最好的模型，而價格卻低得多。這對開發者和使用這項技術的公司來說無疑是個好消息，因為這意味著他們可以自主地使用前沿的AI功能，而無需擔心成本飆升。

新模型有兩個版本，均可在 DeepSeek 的網站和應用程序中獲取，開發者還可以通過 API 訪問這兩個版本。V4-Pro 是專為編碼和復雜智能體任務而設計的大型模型，而 V4-Flash 則是運行速度更快、成本更低的精簡版。兩個版本都提供推理模式，模型可以仔細解析用戶的提示，并在解決問題的過程中逐步展示解題過程。

中國頂級人工智能模型如何克服美國制裁

對于 V4-Pro，DeepSeek 的收費標準為每百萬輸入令牌 1.74 美元，每百萬輸出令牌 3.48 美元，遠低于 OpenAI 和 Anthropic 的同類產品。V4-Flash 的價格更低，每百萬輸入令牌約 0.14 美元，每百萬輸出令牌約 0.28 美元，是目前市面上最便宜的頂級型號之一。因此，它對于構建應用程序來說極具吸引力。

就性能而言，V4 相較于 R1 有了巨大的提升，這或許并不令人意外——而且它似乎足以媲美幾乎所有最新的主流 AI 模型。根據該公司公布的結果，在主要基準測試中，DeepSeek V4-Pro 的表現與領先的閉源模型不相上下，與 Anthropic 的 Claude-Opus-4.6、OpenAI 的 GPT-5.4 和 Google 的 Gemini-3.1 等模型的性能相當。與其他開源模型（例如阿里巴巴的 Qwen-3.5 或 Z.ai 的 GLM-5.1）相比，DeepSeek V4 在編程、數學和 STEM 問題上均表現優異，使其成為迄今為止最強大的開源模型之一。

DeepSeek 還表示，V4-Pro 目前在智能編碼任務基準測試中位列最強開源模型之列，并在其他衡量執行多步驟問題能力的測試中表現出色。該公司公布的基準測試結果顯示，其寫作能力和世界知識儲備也處于領先地位。

在與該型號一同發布的技術報告中，DeepSeek 分享了對 85 位經驗豐富的開發人員進行的內部調查結果：超過 90% 的受訪者將 V4-Pro 列為他們進行編碼任務的首選型號之一。

DeepSeek 表示，它已專門針對 Claude Code、OpenClaw 和 CodeBuddy 等流行的代理框架對 V4 進行了優化。

2. 它實現了內存效率的新方法。

V4 的關鍵創新之一是其更大的上下文窗口——即模型一次可以處理的文本量。兩個版本都能處理 100 萬個詞元，足以容納《指環王》三卷和《霍比特人》的總和。該公司表示，這一上下文窗口大小現已成為所有 DeepSeek 服務的默認設置，并且與 Gemini 和 Claude 等尖端模型的版本相當。

但重要的是，我們不僅要了解 DeepSeek 實現了這一飛躍，還要了解它是如何實現的。V4 版本對公司之前的模型進行了重大架構改進——尤其是在注意力機制方面。注意力機制是人工智能模型的一項重要特性，它能幫助模型理解提示文本中各個部分之間的關系。隨著提示文本長度的增加，這種比較的成本也隨之大幅上升，使得注意力機制成為長上下文模型的主要瓶頸之一。

DeepSeek可能已經找到了一種提高人工智能記憶能力的新方法

DeepSeek 的創新之處在于，它讓模型更有選擇性地關注特定內容。V4 版本不再將所有早期文本視為同等重要，而是壓縮舊信息，專注于當前最有可能重要的部分，同時保留附近的完整文本，以免遺漏重要細節。

DeepSeek 表示，這顯著降低了使用長上下文的成本。在包含 100 萬個令牌的上下文中，V4-Pro 的計算能力僅為上一代產品 V3.2 的 27%，內存使用量也降至 10%。V4-Flash 的降幅更大，計算能力和內存使用量分別僅為 10% 和 7%。在實際應用中，這可以降低構建需要處理海量數據的工具的成本，例如能夠讀取整個代碼庫的 AI 編碼助手，或者能夠分析大量文檔且不會忘記先前內容的科研代理。

DeepSeek 對長上下文窗口的興趣并非始于 V4。在過去一年半的時間里，該公司悄然發表了一系列論文，探討人工智能模型如何“記住”信息，并嘗試使用壓縮和數學技術來擴展人工智能模型實際能夠處理的信息量。

3.這標志著邁出了遠離英偉達的艱難道路的第一步。

V4 是 DeepSeek 首款針對中國國產芯片（例如華為 Ascend）進行優化的型號——此舉使得此次發布會在某種程度上考驗了中國本土人工智能產業能否開始擺脫對美國芯片巨頭英偉達的依賴。

這在很大程度上在意料之中，因為《The Information》本月早些時候報道稱，DeepSeek并未向英偉達和AMD等美國芯片制造商提供V4的提前訪問權限，盡管提前提供訪問權限通常是為了讓芯片制造商在新模型發布前優化其支持。據報道，該公司僅向中國芯片制造商提供了提前訪問權限。

華為周五表示，其基于昇騰950系列的昇騰超級節點產品將支持DeepSeek V4。這意味著希望運行自行修改版DeepSeek V4的公司和個人用戶將能夠輕松使用華為芯片。

人工智能現狀：中國即將贏得這場競賽嗎？

路透社此前報道稱，中國政府官員建議DeepSeek在其訓練過程中集成華為芯片。這種壓力符合中國產業政策的總體趨勢：戰略性行業往往被推動，有時甚至是被強制要求，以符合國家自力更生的目標。但在人工智能領域，這種緊迫性尤為突出。自2022年以來，美國出口管制措施切斷了中國企業獲取英偉達最強大芯片的渠道，之后又限制了對降級版中國市場芯片的獲取。北京的回應是加快推進國產人工智能技術棧的建設，涵蓋芯片、軟件框架和數據中心等各個方面。

據報道，中國政府一直在推動數據中心和公共計算項目更多地使用國產芯片，包括禁止使用外國制造的芯片、實行采購配額制，以及要求將英偉達芯片與華為和寒武紀等中國公司的替代芯片搭配使用。

然而，替換英偉達芯片并非簡單地更換芯片就能完成的。英偉達的優勢不僅在于其芯片本身，更在于開發者多年來圍繞這些芯片構建的軟件生態系統。轉向華為昇騰芯片意味著需要調整模型代碼、重建工具，并證明基于這些芯片構建的系統足夠穩定，能夠滿足高強度使用需求。

需要明確的是，DeepSeek似乎并未完全擺脫對英偉達芯片的依賴。該公司的技術報告顯示，它使用國產芯片來運行模型進行推理，也就是在用戶要求模型完成任務時。但清華大學計算機科學教授劉志遠告訴《麻省理工科技評論》，DeepSeek似乎只針對國產芯片調整了V4模型的部分訓練流程。報告并未說明一些關鍵的長上下文特征是否針對國產芯片進行了適配，因此劉志遠認為V4模型可能仍然主要在英偉達芯片上進行訓練。由于這些問題涉及政治敏感性，多位匿名消息人士告訴《麻省理工科技評論》，國產芯片的性能仍然不如英偉達芯片，但更適合用于推理而非訓練。

DeepSeek還將V4未來的成本與此次硬件升級掛鉤。該公司表示，華為昇騰950超級節點在今年下半年開始大規模出貨后，V4-Pro的價格可能會大幅下降。

如果成功，V4 可能是中國正在成功構建并行人工智能基礎設施的早期跡象。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.