網易首頁 > 網易號 > 正文 申請入駐

DeepSeek-V4發布!邁入百萬上下文時代 華為昇騰超節點全面支持

0
分享至

《科創板日報》4月24日訊(記者 黃心怡)DeepSeek-V4的預覽版本今日上線并同步開源。DeepSeek-V4模型上下文處理長度由原有的128K顯著擴展至1M,支持百萬字超長上下文。同時,輸出長度最大為384Ktokens。首次增加了KV Cache滑窗和壓縮算法,減少Attention計算和訪存開銷,并通過模型架構創新更好地支持了Agent和Coding場景。


華為昇騰、天數智芯、寒武紀等國產芯片廠商已經支持DeepSeek-V4新模型。華為昇騰超節點全系列產品支持DeepSeek V4系列模型,實現DeepSeek V4-Pro 20ms和DeepSeek V4-Flash 10ms低時延推理。

DeepSeek方面稱,受限于高端算力,目前V4-Pro的服務吞吐仍有限,預計下半年昇騰950超節點批量上市后,Pro價格會大幅下調。

▍百萬上下文成標配

DeepSeek-V4模型按大小分為兩個版本:DeepSeek-V4-Pro(1.6T參數,49B激活)和DeepSeek-V4-Flash(284B參數,13B激活),且同時支持“非思考模式”與“思考模式”,均擁有百萬字超長上下文的能力。

據介紹,V4系列采用DSA稀疏注意力機制,實現token維度壓縮,讓1M(一百萬字)超長上下文成為標配,降低了長文本處理對計算和顯存的需求,為復雜長程任務提供了支撐。

其中,DeepSeek-V4-Pro,相比前代模型,DeepSeek-V4-Pro的Agent能力有所增強。

在Agentic Coding評測中,V4-Pro已達到當前開源模型最佳水平,并在其他Agent相關評測中同樣表現優異。據評測反饋使用體驗優于Sonnet 4.5,交付質量接近Opus4.6非思考模式,但仍與Opus4.6思考模式存在一定差距。

DeepSeek-V4-Pro在世界知識測評中,大幅領先其他開源模型,僅稍遜于頂尖閉源模型Gemini-Pro-3.1。

在數學、STEM、競賽型代碼的測評中,DeepSeek-V4-Pro超越當前所有已公開評測的開源模型,取得了比肩世界頂級閉源模型的成績。

DeepSeek-V4-Flash模型參數下降至284B,推理成本進一步降低,模型參數和激活更小

相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知識儲備方面稍遜一籌,但展現出了接近的推理能力。而由于模型參數和激活更小,相較之下V4-Flash能夠提供更加快捷、經濟的API服務。

在Agent測評中,DeepSeek-V4-Flash在簡單任務上與DeepSeek-V4-Pro旗鼓相當,但在高難度任務上仍有差距。

▍華為昇騰、天數智芯、寒武紀等國產芯片支持DeepSeek-V4

目前,華為昇騰超節點全系列產品已支持DeepSeek V4系列模型,實現DeepSeek V4-Pro 20ms和DeepSeek V4-Flash 10ms低時延推理

據了解,昇騰950、昇騰A3超節點對DeepSeek V4系列模型全面適配。同時為便于用戶快速微調,提供了基于昇騰A3超節點的訓練參考實現。

基于DeepSeekV4-Pro模型,在8K輸入場景,昇騰950超節點可實現TPOT約20ms時單卡Decode吞吐4700TPS。DeepSeek V4-Flash模型,8K長序列輸入場景下可實現TPOT約10ms時單卡Decode吞吐1600TPS。

基于昇騰A3 64卡超節點結合大EP模式部署,DeepSeek V4-Flash模型,8K/1K輸入輸出場景,基于vLLM推理引擎可實現2000+TPS的單卡Decode吞吐。針對DeepSeek V4-Pro模型,昇騰A3同步支持推理部署,性能持續優化中。

國產GPU廠商天數智芯完成了與DeepSeek-V4的Day 0級適配。據悉,天數智芯以天垓系列訓練芯片與智鎧系列推理芯片為核心,承接DeepSeek-V4的全場景應用。

而寒武紀基于vLLM推理框架完成了對此次285B DeepSeek-V4-flash和1.6T DeepSeek-V4-pro兩個版本的Day 0適配,適配代碼已開源到GitHub社區。

▍下半年昇騰950超節點將批量支持DeepSeek V4

根據DeepSeep官方文檔介紹,DeepSeek V4并不是只在英偉達體系內做優化,而是將細粒度專家并行(EP)方案同時在英偉達GPU和華為昇騰NPU上完成驗證,這說明其推理路徑已經具備跨算力平臺的適配能力。但在開源層面,當前釋放的仍主要是基于CUDA的MegaMoE和DeepGEMM,底層實現深度綁定英偉達工具鏈。

從價格看,DeepSeek V4-Pro輸入(緩存命中)是1元/百萬tokens,輸入(緩存未命中)是12元,輸出是24元;V4-Flash輸入(緩存命中)是0.2元/百萬tokens,輸入(緩存未命中)是1元,輸出是2元。

值得一提的是,官方API頁面在小字中提到,受限于高端算力,目前V4-Pro的服務吞吐仍有限,預計下半年昇騰950超節點批量上市后,Pro價格會大幅下調。這意味著,DeepSeek正嘗試把模型運行時從單一硬件依賴中解耦出來。


此外,華為云首發適配了DeepSeek-V4模型。華為云MaaS模型即服務平臺已為開發者提供免部署、一鍵調用DeepSeek-V4-Flash API的Tokens服務。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
馬斯克:約400萬輛特斯拉HW3車型將無法獲得FSD

馬斯克:約400萬輛特斯拉HW3車型將無法獲得FSD

CNMO科技
2026-04-23 07:44:09
盯上紅海航道!伊朗戰火下,美國意圖“拉攏”這一非洲小國

盯上紅海航道!伊朗戰火下,美國意圖“拉攏”這一非洲小國

財聯社
2026-04-24 10:02:45
特朗普兒媳抖家族猛料:伊萬卡愛提建議,公公喜歡半夜打電話

特朗普兒媳抖家族猛料:伊萬卡愛提建議,公公喜歡半夜打電話

像夢一場a
2026-04-23 22:48:46
只有成熟氣質的阿姨,才能把旗袍穿出這種優雅又迷人的感覺吧

只有成熟氣質的阿姨,才能把旗袍穿出這種優雅又迷人的感覺吧

牛彈琴123456
2026-04-24 11:00:54
去銀行激活社保卡一定要主動提要求,不懂規矩白白被扣費好幾年

去銀行激活社保卡一定要主動提要求,不懂規矩白白被扣費好幾年

芳姐侃社會
2026-04-21 22:04:15
新款大眾ID. Buzz官圖發布!網友:價格25萬起,肯定排隊

新款大眾ID. Buzz官圖發布!網友:價格25萬起,肯定排隊

汽車網評
2026-04-23 23:00:31
馬筱梅正式與玥箖姐弟切割!親手撕下好后媽的人設,自稱問心無愧

馬筱梅正式與玥箖姐弟切割!親手撕下好后媽的人設,自稱問心無愧

觀察鑒娛
2026-04-24 16:26:36
同學聚會,班長讓我給遲到的鎮長讓座,下一秒,縣長向我道歉

同學聚會,班長讓我給遲到的鎮長讓座,下一秒,縣長向我道歉

農村情感故事
2026-03-23 07:31:39
金莎近照曝光翻車!妝容失敗像大媽,穿寬松裙子被猜懷孕

金莎近照曝光翻車!妝容失敗像大媽,穿寬松裙子被猜懷孕

小徐講八卦
2026-04-24 06:06:44
身上突然冒出來的小紅點是什么?2種可能是癌癥先兆,別不當回事

身上突然冒出來的小紅點是什么?2種可能是癌癥先兆,別不當回事

垚垚分享健康
2026-04-22 17:10:07
三步逆襲:四月接好運、五月穩上升、六月事業封神的三大星座。

三步逆襲:四月接好運、五月穩上升、六月事業封神的三大星座。

別人都叫我阿螫
2026-04-24 16:10:33
王室拍“全家福”,拉米拉腿縫搶鏡,熬死婆婆后,她徹底不裝了

王室拍“全家福”,拉米拉腿縫搶鏡,熬死婆婆后,她徹底不裝了

白露文娛志
2026-04-24 16:25:53
火湖G3!傷病情況:火箭2人缺陣,杜蘭特添新傷!里夫斯狀態升級

火湖G3!傷病情況:火箭2人缺陣,杜蘭特添新傷!里夫斯狀態升級

熊哥愛籃球
2026-04-24 11:25:29
男子送相親對象回家遇其忘帶鑰匙,開房遭拒后女子怒斥男子真沒用

男子送相親對象回家遇其忘帶鑰匙,開房遭拒后女子怒斥男子真沒用

番外行
2026-04-24 08:55:30
pdd員工這么“勇”么?網上公開曬收入,月薪9萬8千多元

pdd員工這么“勇”么?網上公開曬收入,月薪9萬8千多元

螞蟻大喇叭
2026-04-23 15:26:43
回加拿大生活的大山,60歲須發皆白很滄桑,重慶妻子仍風韻猶存

回加拿大生活的大山,60歲須發皆白很滄桑,重慶妻子仍風韻猶存

胡一舸南游y
2026-04-04 15:41:43
武漢大爺公交插隊被撞致死,家屬起訴乘客和公交公司,法院判了

武漢大爺公交插隊被撞致死,家屬起訴乘客和公交公司,法院判了

奇思妙想草葉君
2026-04-24 00:26:53
人如果過度節儉,舍不得吃,舍不得穿,那你省下來的其實不是錢,而是……

人如果過度節儉,舍不得吃,舍不得穿,那你省下來的其實不是錢,而是……

不二大叔
2026-04-22 21:22:04
世界最高峰不是珠穆朗瑪峰

世界最高峰不是珠穆朗瑪峰

新科文
2026-04-24 16:57:59
蔡磊目前僅存眼部活動能力,直言病情因高強度工作而加重惡化,稱攻克漸凍癥是最后一場創業:“人生自古誰無死?這次創業無比值得”

蔡磊目前僅存眼部活動能力,直言病情因高強度工作而加重惡化,稱攻克漸凍癥是最后一場創業:“人生自古誰無死?這次創業無比值得”

大象新聞
2026-04-23 23:45:03
2026-04-24 17:28:49
財聯社 incentive-icons
財聯社
以“準確、快速、權威、專業”為新聞準則,為投資者提供專業的投資資訊。
712195文章數 1020398關注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價格依然"屠夫級"

頭條要聞

男子拍下蔣介石故居對面別墅區兩廁所 兩年來無法使用

頭條要聞

男子拍下蔣介石故居對面別墅區兩廁所 兩年來無法使用

體育要聞

里程碑之戰拖后腿,哈登18分8失誤

娛樂要聞

停工16個月!趙露思證實接拍新劇

財經要聞

19家企業要"鋁代銅",格力偏不

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態度原創

旅游
藝術
家居
游戲
手機

旅游要聞

五條專線免費乘車,四大類玩法覆蓋全域!南京江寧“五一”文旅菜單出爐

藝術要聞

新地標!阿里中心·杭州未科,gmp設計

家居要聞

自然肌理 溫潤美學

PS6掌機全新爆料!索尼第一方工作室已同步信息

手機要聞

榮耀暢玩70C手機上架,799元起

無障礙瀏覽 進入關懷版