網易首頁 > 網易號 > 正文 申請入駐

從128K到1M上下文,DeepSeek-V4這次升級了什么?

0
分享至

今天上午,DeepSeek-V4模型預覽版正式上線,并且同步開源。距離上次發布R1已經過去15個月,這一年多里AI圈的更新節奏快到讓人眼花繚亂,DeepSeek卻一直保持著低調。今天,這份答卷終于交出來了。



而這次升級最大的亮點就是把百萬字上下文理解能力做成了標配,Agent能力也有了大幅提升,而且使用成本仍然主打“價格屠夫”。那么,它和上一代相比,就叫有哪些變化呢?

丨幾百頁的論文一次讀完

1M(一百萬tokens)上下文,是V4最明確的升級點,作為對比,上一代DeepSeek模型的上下文窗口為128K,這次直接翻了接近8倍。



這意味著什么?簡單來說,你可以一次性扔給AI一整本技術手冊、一份完整的法律合同,或者幾百頁的學術論文讓它通讀處理,而不需要分章節反復喂給它。對于寫代碼的人,丟一整個大型項目的代碼庫進去讓它理解和維護,也變成了現實場景。

背后的技術支撐是DeepSeek自研的DSA稀疏注意力機制(DeepSeek Sparse Attention)。這套方案在token維度進行壓縮,相比傳統的全量注意力計算,大幅降低了對算力和顯存的占用——這也是為什么1M上下文能作為標配,而不是只在高配版本上才提供。



兩個版本的選擇也不復雜。Pro版總參數1.6萬億,Agent編碼能力更強,官方內部已經用它替代Sonet 4.5作為日常編程工具,交付質量接近Opus 4.6非思考模式。Flash版2850億參數,在簡單任務上和Pro表現接近,但響應更快、價格更低。對于多數日常使用場景,Flash就夠用了。

價格方面,Flash版緩存命中時輸入約0.2元/百萬tokens,Pro版緩存命中約1元/百萬tokens。放在整個大模型API市場里看,這個定價依然有明顯的成本優勢,尤其是Flash版,幾乎是同類能力中最便宜的選擇。

丨國產算力全面接棒,下半年還有降價空間

V4的另一個看點,是國產算力的適配速度。



華為昇騰950在發布當天就宣布全面支持DeepSeek-V4系列,通過融合kernel和多流并行技術優化推理性能?;跁N騰950超節點,V4-Flash在8K輸入場景下單卡解碼吞吐可達1600TPS,延遲約10ms。同時,昇騰A3超節點系列產品也完成了全面適配,并提供了基于A3的訓練參考實現,方便開發者進行微調。

寒武紀這邊同樣動作迅速,宣布完成Day 0適配,基于自研高性能融合算子庫Torch-MLU-Ops對V4的新結構做了專項加速,適配代碼已開源到GitHub。



整體來看,DeepSeek-V4的定位很清晰:它不像當年橫空出世那么顛覆,而是穩扎穩打的進階者。1M上下文解決了長文本處理的剛需,Agent能力的提升讓它在編程和自動化任務上更有實戰價值,開源策略加上國產算力適配,則是在構建一個更可持續的生態基礎。

至于能不能追上頭部閉源模型?目前仍然有一定差距,由于不支持圖像視覺等多模態技術,單看文本能力,在arena.ai榜單位列第20位,編程能力則是第14位,整體位列開源模型第一,全球第九的水平。



據了解,DeepSeek此次并未給英偉達或AMD提供提前優化適配的機會,而是將早期訪問權限獨家開放給了國產芯片廠商,完成了從英偉達CUDA生態向華為CANN架構的底層遷移。而它后續不斷優化后,應該會在接下來的4.1或者4.2版本中給大家帶來更多的驚喜。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
騙走50億!用小鮮肉的血抗衰,被央視曝光的“撈金女王”,真栽了

騙走50億!用小鮮肉的血抗衰,被央視曝光的“撈金女王”,真栽了

凡知
2026-04-07 21:16:54
解鎖夫妻“爽”感密碼:3個讓高潮更持久的床上技巧

解鎖夫妻“爽”感密碼:3個讓高潮更持久的床上技巧

精彩分享快樂
2026-03-18 07:00:03
奧一報道的深圳“超尷尬”地鐵站整改了:加了60處標識!

奧一報道的深圳“超尷尬”地鐵站整改了:加了60處標識!

南方都市報
2026-04-28 18:52:13
竇靖童宋妍霏分吃一碗粉!從擋雨到牽手遛狗,多次被拍細節藏不住

竇靖童宋妍霏分吃一碗粉!從擋雨到牽手遛狗,多次被拍細節藏不住

小徐講八卦
2026-04-27 09:23:46
北京公交專用道行駛時間,又有新調整!

北京公交專用道行駛時間,又有新調整!

BRTV新聞
2026-04-28 12:40:41
女兒是一線明星,她開豪車住豪宅,晚年卻自殺5次最終從12樓跳下

女兒是一線明星,她開豪車住豪宅,晚年卻自殺5次最終從12樓跳下

漫婷侃娛樂
2026-04-27 21:53:40
國家下死命令:2027年城投清零!中小城市的公交、供水會漲價嗎?

國家下死命令:2027年城投清零!中小城市的公交、供水會漲價嗎?

顧史
2026-04-21 05:44:11
女子白天睡老公,晚上睡男同事,2019年上夜班的老公將她同事殺死

女子白天睡老公,晚上睡男同事,2019年上夜班的老公將她同事殺死

漢史趣聞
2026-04-26 16:27:51
以軍稱投下超2500枚炸彈 摧毀約600個伊朗目標

以軍稱投下超2500枚炸彈 摧毀約600個伊朗目標

新浪財經
2026-03-02 21:18:48
日本解禁軍售,背負中國人血債的三菱重工又得瑟了

日本解禁軍售,背負中國人血債的三菱重工又得瑟了

補壹刀
2026-04-27 23:49:25
埃里克森為何在阿莫林下課前公開"拆臺"

埃里克森為何在阿莫林下課前公開"拆臺"

綠茵狂熱者
2026-04-28 01:23:45
10億都救不了一命!京東副總裁蔡磊,生命進入倒計時

10億都救不了一命!京東副總裁蔡磊,生命進入倒計時

聽風喃
2026-04-06 11:16:04
140年來最強厄爾尼諾要出現了?氣溫將沖擊高溫極限,真的嗎?

140年來最強厄爾尼諾要出現了?氣溫將沖擊高溫極限,真的嗎?

臨云史策
2026-04-28 11:02:36
別再吵王菲春晚唱功了 謝霆鋒那只20年的金鐲子 早已說明了一切

別再吵王菲春晚唱功了 謝霆鋒那只20年的金鐲子 早已說明了一切

小邵說劇
2026-04-27 21:02:11
曼聯的天亮了!單賽季或5人英超進球上雙,這神跡竟塵封了61年?

曼聯的天亮了!單賽季或5人英超進球上雙,這神跡竟塵封了61年?

仰臥撐FTUer
2026-04-28 20:11:03
機場出租車故意以車輛故障等要求乘客換車,每單可獲50至85元“好處費”,10人被處罰

機場出租車故意以車輛故障等要求乘客換車,每單可獲50至85元“好處費”,10人被處罰

紅星新聞
2026-04-27 16:51:18
4000萬粉絲網紅偷稅被查,細節公布!本人出鏡認錯

4000萬粉絲網紅偷稅被查,細節公布!本人出鏡認錯

深圳晚報
2026-04-28 12:43:24
出差歸來推開門,見妻子和男閨蜜共處一室,多年感情徹底走向終結

出差歸來推開門,見妻子和男閨蜜共處一室,多年感情徹底走向終結

朗威談星座
2026-04-22 00:10:37
五萬戶股東踩雷!002779、603360,被立案后雙雙“一字”跌停

五萬戶股東踩雷!002779、603360,被立案后雙雙“一字”跌停

大眾證券報
2026-04-28 19:27:08
東航7月15日起開通上海浦東—第比利斯直飛航線

東航7月15日起開通上海浦東—第比利斯直飛航線

北京商報
2026-04-28 16:47:54
2026-04-29 03:16:49
機智貓 incentive-icons
機智貓
好產品會讓人幸福的
6360文章數 3770關注度
往期回顧 全部

科技要聞

10億周活目標落空!傳OpenAI爆發內部分歧

頭條要聞

19歲中國女孩被困緬甸 交20萬贖金園區仍未放人

頭條要聞

19歲中國女孩被困緬甸 交20萬贖金園區仍未放人

體育要聞

魔術黑八活塞,一步之遙?!

娛樂要聞

蔡卓妍官宣結婚,老公比她小10歲

財經要聞

中央政治局會議定調,八大看點速覽!

汽車要聞

拒絕瘋狂套娃!現代艾尼氪金星長在未來審美點上

態度原創

時尚
親子
游戲
房產
本地

普通女性春天穿什么好看?這些穿搭值得借鑒,自然舒適

親子要聞

有一點點近視,到底要不要戴眼鏡?

這不爽翻了?曝PS6或能穩穩運行60幀+光追的游戲畫面

房產要聞

紅利爆發!海南,沖到全國人口增量第4??!

本地新聞

用青花瓷的方式,打開西溪濕地

無障礙瀏覽 進入關懷版