網易首頁 > 網易號 > 正文申請入駐

剛剛，DeepSeek V4 雙版本正式上線！

2026-04-24 11:26:05　來源: 機器之心Pro

北京舉報

分享至

機器之心編輯部

終于，全球 AI 圈等待了幾個月的 DeepSeek V4，它終于來了！

今天上午，DeepSeek API 文檔上線，讓我們看到了新版本的「廬山真面目」。

此次，DeepSeek V4 按大小會有兩個版本，分別是DeepSeek-V4-Flash 和 DeepSeek-V4-Pro。上下文長度大家此前已經知道了，是 100 萬 tokens。同時，輸出長度最大為 384K tokens。

就在剛剛，DeepSeek 官方正式宣布上線并開源「DeepSeek-V4 預覽版」

開源鏈接：https://huggingface.co/collections/deepseek-ai/deepseek-v4

根據官方的介紹，此次 DeepSeek-V4 在 Agent 能力、世界知識和推理性能上均實現國內與開源領域的領先。

兩個版本，V4-Pro 與 V4-Flash 的最大上下文長度均為 1M，且同時支持「非思考模式」與「思考模式」，其中思考模式支持 reasoning_effort 參數設置思考強度（high/max）。對于復雜的 Agent 場景建議使用思考模式，并設置強度為「max」。

DeepSeek-V4 發布同時，也公布了其詳細的技術報告。

技術報告鏈接：https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

該系列包括 DeepSeek-V4-Pro（1.6T 參數，49B 激活）和 DeepSeek-V4-Flash（284B 參數，13B 激活），兩者均支持一百萬令牌的上下文長度，旨在提升超長上下文場景下的性能。該系列的關鍵創新包括：

1.混合注意力架構：結合了壓縮稀疏注意力（CSA）和高度壓縮注意力（HCA），這一新方法顯著減少了計算復雜度，提升了長上下文處理的效率，特別適用于涉及數百萬令牌的任務。

2.流形約束超連接（mHC）：增強了傳統殘差連接，提高了信號在層之間傳播的穩定性。

3.Muon 優化器：設計用于加速收斂和提高訓練穩定性，Muon 優化器顯著提升了訓練過程中的模型性能。

4.訓練和后訓練管道：該模型在大量數據集（DeepSeek-V4-Flash 使用 32T 令牌，DeepSeek-V4-Pro 使用 33T 令牌）上進行了預訓練，隨后通過專門的訓練和策略蒸餾進一步優化，確保它們在推理、編程和世界知識任務中表現出色。

5.長上下文效率：這些模型在推理 FLOPs 和 KV 緩存大小上都實現了顯著減少，使得處理一百萬令牌成為可能。例如，DeepSeek-V4-Pro 在與前代模型 DeepSeek-V3 的對比中，FLOPs 降低了 73%，KV 緩存大小減少了 90%。

6.評估結果：DeepSeek-V4-Pro-Max 版本在推理和知識任務上設定了新基準，超越了之前的開源模型，并接近一些專有模型的水平。DeepSeek-V4-Flash-Max 在更多高效的參數規模下，提供了相當的推理性能。

總的來說，DeepSeek-V4 系列在大規模語言模型的效率上邁出了重要一步，能夠有效處理超長序列，從而為復雜的長時間跨度任務開辟了新的可能性。

在另一邊，大家一直在關心 DeepSeek V4 是否使用國產算力，結果也終于揭曉。之前就有報道 DeepSeek V4 新模型，將采用華為技術公司設計的最新芯片，也是真的。

我們發現，昇騰 CANN 將在今晚 7 點直播 DeepSeek V4在昇騰平臺的首發

值得一提的是，寒武紀在軟硬一體生態中，已經完成基于 vLLM 推理框架完成對 285B DeepSeek-V4-flash 和 1.6T DeepSeek-V4-pro 的Day 0 適配，適配代碼已開源到 GitHub 社區。

DeepSeek 官方在發布推文最后說道：「不誘于譽，不恐于誹，率道而行，端然正己。」出自《荀子?非十二子》，是一種超然，任東西南北風的態度。

剩下的，就是大家親自體驗到 DeepSeek-V4 了！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

剛剛，GPT-5.5發布，顛覆勞動理論

機器之心Pro 2026-04-24 10:14:06
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0

港大俞益洲團隊發布首篇「高效視頻世界模型」全面綜述

機器之心Pro 2026-04-24 11:40:34
0 跟貼 0

DeepSeek V4來了：在喧嘩眾聲中，按自己的節奏講開源故事

DeepTech深科技 2026-04-24 13:06:46
0 跟貼 0
天塌了，Pro用戶用不了Claude Code，除非100美元買Max

機器之心Pro 2026-04-22 15:43:42
4 跟貼 4

要更多人用的起，華為Pura X Max10999元起！

熱點科技 2026-04-20 17:41:31
34 跟貼 34

華為 Pura X Max 體驗：折疊屏手機早該如此

愛范兒 2026-04-24 09:10:16
1 跟貼 1
華為Pura X Max：全球首款大闊折太闊了！每個場景都是主場

CNMO科技 2026-04-24 09:00:40
0 跟貼 0

vivo Y600 Pro 拆解：萬級續航看藍廠，是妥協還是極致堆疊？

微機分WekiHome 2026-04-23 18:23:28
0 跟貼 0
華為全球首款大闊折Pura X Max亮相！近7000家授權門店提供新機30分鐘送達服務

快科技 2026-04-21 17:36:09
0 跟貼 0
游騎兵的特殊分隊：隸屬突擊單位，卻能對接美軍Tier1特戰序列

四夕君 2026-04-22 18:56:23
21 跟貼 21
新問界M9及加長版亮相：49.98萬元起，余承東稱要讓同行“永遠追不上”

鳳凰網科技 2026-04-22 21:58:05
2835 跟貼 2835
華為Pura 90 Pro Max上手體驗，高顏值的兩億智拍旗艦

泡泡網 2026-04-20 21:29:26
0 跟貼 0
華為Pura90 Pro Max對比蘋果17 Pro Max，夜景長焦高低立現！

熱點科技 2026-04-20 17:44:31
0 跟貼 0
長按鎖屏，手機變透明？華為Pura90 Pro Max新玩法帥炸了！

熱點科技 2026-04-21 20:44:35
1 跟貼 1
個人微信建了600多個工作群，離職時賬號歸誰

現代快報 2026-04-23 13:49:11
2309 跟貼 2309
華為Pura90 Pro Max超遠距人聲增強，讓手機也有順風耳！

熱點科技 2026-04-20 20:42:10
0 跟貼 0
華為Pura90 Pro Max出廠沒貼膜，余承東回應：新昆侖玻璃加持下沒必要

快科技 2026-04-22 21:20:33
0 跟貼 0
華為Pura 90 Pro Max首發光感無界主題：長按鎖屏手機秒變透明

快科技 2026-04-22 21:20:49
0 跟貼 0
刷屏！DeepSeek V4成本暴降73%，梁文鋒聯手華為寒武紀，源神歸位全體起立

智東西 2026-04-24 13:08:45
0 跟貼 0
狗子乖乖躺著讓雞治病

瀟湘晨報 2026-04-23 17:38:12
97 跟貼 97
HUAWEI Pura X MaX 價格公布：10999元起

快科技 2026-04-21 17:36:34
0 跟貼 0
中介稱"杭州600萬房子355萬急出" 有人看房被"丟路邊"

錢江晚報 2026-04-23 14:45:39
1510 跟貼 1510
半掛模型玩具車買菜，要是超重了怎么辦，雷軍都不敢這么設計！

宇宙搞笑生活 2026-04-23 14:10:00
4 跟貼 4
科學派傳人闖關奪取令牌

浪嫂剪輯 2026-04-23 16:07:32
1 跟貼 1
推薦230 Pro版，奇瑞風云T9L到店實拍，有顏值夠智能你會考慮么？

駕享來電 2026-04-21 19:21:56
3 跟貼 3
深圳水官高速4月26日起停止收費

新快報新聞 2026-04-24 08:16:04
60 跟貼 60
美國指責中國向三個非洲國家施壓，取消賴清德的飛行許可，中方回應

北京青年報 2026-04-23 15:20:42
13 跟貼 13
“窩囊版”蹦極發生意外，景區最新通報

南方都市報 2026-04-23 20:23:51
122 跟貼 122
內蒙古一老板開1.6萬月薪招人放3000只羊，包吃住，有Wi-Fi，有專人送物資，全年無休，回應：更適合夫妻檔，一望無際的大草原常年見不到人

瀟湘晨報 2026-04-23 22:14:14
649 跟貼 649
21.98萬起售，尚界Z7/Z7T貼著小米SU7打

駕仕派 2026-04-24 12:24:00
0 跟貼 0
#展開說# 北京車展人人卷參數別克至境E7上市“拼家庭”

速度計 2026-04-22 15:23:16
0 跟貼 0
騰訊Hy3 preview上線，姚順雨加入后的成績單出爐

華爾街見聞官方 2026-04-23 17:27:12
11 跟貼 11
12000w切割詳細參數

蕭祃記錄風土人情 2026-04-21 10:12:00
1 跟貼 1
海地2014年選出的五青年英雄：一場被云盾擋住的考古

時光慢郵啊 2026-04-23 02:59:06
0 跟貼 0
“還債騎手”被強制下線240次：“開始我很反感過勞提醒，影響賺錢”

澎湃新聞 2026-04-23 15:04:11
271 跟貼 271
9.云鏡地脈圖——懸疑探險小說《歸墟盜者》第一卷《鏡湖迷影》

歸墟盜者 2026-04-22 18:29:13
1 跟貼 1
黎巴嫩再成戰場民眾：在這沒有人沒有失去過親近的人

新京報 2026-04-20 08:22:24
888 跟貼 888
歐盟批準向烏克蘭提供900億歐元貸款方案

新華社 2026-04-23 20:15:08
689 跟貼 689
深藍全新純電轎跑L06 Max發布：售價12.59萬元起

IT之家 2026-04-24 12:11:16
0 跟貼 0

手機 / 數碼

房產 / 家居

剛剛，DeepSeek V4 雙版本正式上線！

剛剛，DeepSeek-V4 預覽版發布 百萬上下文

華誼兄弟被申請破產：曾坐擁百位明星 如今還不起千萬

華誼兄弟被申請破產：曾坐擁百位明星 如今還不起千萬

里程碑之戰拖后腿，哈登18分8失誤

王思聰被綠！戀愛期間女友被金主包養

19家企業要"鋁代銅"，格力偏不

全景iDrive 續航近800km 新款寶馬7系/i7亮相

態度原創

三亞安居房，突然官宣！

16幅 佐恩高清油畫 | 瑞典著名畫家

云游中國｜逛世界風箏都 留學生探秘中國傳統文化

襯衫+半裙，比別人好看不止一點點

剛剛，DeepSeek-V4 預覽版發布百萬上下文

華誼兄弟被申請破產：曾坐擁百位明星如今還不起千萬

華誼兄弟被申請破產：曾坐擁百位明星如今還不起千萬

16幅佐恩高清油畫 | 瑞典著名畫家

云游中國｜逛世界風箏都留學生探秘中國傳統文化