无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

梁文鋒署名論文!DeepSeek首輪融資后大動作:生成速度大漲85%

0
分享至


智東西
作者 李水青
編輯 心緣

智東西6月27日報道,繼完成500億元融資后,今日,DeepSeek首次放出開源新成果!

剛剛,DeepSeek開源了一套讓現(xiàn)有模型跑得更快的工程方案:推出DeepSeek-V4-Pro-DSpark、DeepSeek-V4-Flash-DSpark模型,并開源推測解碼(Speculative Decoding)框架DSpark以及推測解碼訓練框架DeepSpec


▲DeepSeek-V4-Pro-DSpark開源上新頁面截圖

根據(jù)同步上傳的梁文鋒署名、聯(lián)合北京大學完成的論文《DSpark:基于半自回歸生成的置信度調度推測解碼(DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation)》,將DSpark部署在DeepSeek-V4線上服務系統(tǒng)、承接真實用戶流量時,它有效減少了無效校驗帶來的算力浪費。

相較于成熟的生產基線方案(MTP-1),在保持整體吞吐不變的前提下,DSpark把單用戶生成速度提升60%-85%。更關鍵的是,在嚴格交互時延約束下,DSpark避免了吞吐率大幅滑坡,實現(xiàn)了以往無法達成的性能檔位,推高了整套服務系統(tǒng)的帕累托最優(yōu)邊界。


▲DSpark論文截圖

Hugging Face地址:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-DSpark
GitHub地址:
https://github.com/deepseek-ai/DeepSpec
論文地址:
https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf

根據(jù)Hugging Face上的模型卡,DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark并非新模型,而是在原有版本的基礎上,增加了一個推測解碼模塊,用以加快推理速度、降低成本。

推測解碼,簡單來說,是一種大模型推理無損技術,核心流程為先打草稿、后驗證。其將草稿生成與目標模型校驗解耦,以此加速大語言模型推理。

當前主流并行草稿器能夠單次前向運算生成超長token序列,但由于token之間缺少依賴關系,草稿后續(xù)內容的通過率會快速下滑。此外,如果對整段長候選序列無差別校驗,會把寶貴的批次算力浪費在極易被駁回的token上,從而導致高并發(fā)服務場景下整體吞吐率大幅下降。

為此,DeepSeek提出DSpark推測解碼框架,把高吞吐并行生成與自適應、感知負載的校驗機制結合在一起。為保證草稿質量,DSpark采用半自回歸架構:將并行主干網絡與輕量串行模塊相結合,建模塊內token依賴,緩解末尾內容通過率衰減問題。


▲DSpark架構與解碼流程

為優(yōu)化系統(tǒng)運行效率,DSpark引入置信度調度校驗機制:根據(jù)預估的前綴通過概率與引擎吞吐特征,為每一條請求動態(tài)調整校驗長度。在多領域離線基準測試中,相比當前最優(yōu)的自回歸草稿器與并行草稿器,DSpark能夠顯著提升有效通過序列長度。

如下圖所示,針對這DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark兩款模型,DeepSeek提供了一個最小推理示例。


▲DeepSeek提供的最小推理示例

總的來說,用戶在部署DSpark版本的DeepSeek-V4模型后,有望在生成速度、首token延遲、并發(fā)能力等方面獲得體驗提升。

再來看看DeepSpec,這是一個用于訓練和評估推測性解碼草稿模型(Draft Model)的全棧代碼庫,或者說工具鏈,它包含數(shù)據(jù)準備工具、草稿模型實現(xiàn)、訓練代碼和評估腳本,支持MIT許可。


▲DeepSpec開源上新頁面截圖

DeepSpec的工作流程如下,它會按順序運行各個階段,每個階段的輸出為下一個階段提供反饋:

1、數(shù)據(jù)準備:下載提示,重新生成目標答案,并構建目標緩存。
2、訓練:針對緩存的目標輸出訓練一個模型。
3、評估:在基準任務上衡量推測解碼的接受程度。

目前,DeepSpec支持的算法包括三個草稿模型:DSpark、DFlash和Eagle3。

DeepSpec團隊還在最后向SpecForge(Apache-2.0)、DFlash(MIT)以及Qwen3和Gemma發(fā)文致謝。


▲DeepSeek致謝情況

可以看到,DeepSeek不僅發(fā)布相關模型,還開放完整的訓練框架,供開發(fā)者和企業(yè)用這套工具給自己的Qwen3、Gemma等模型訓練草稿模型。

結語:推理重要度提高,考驗工程化能力

DeepSeek本次發(fā)布雖然低調,也不是新模型迭代,但實際含金量不低。DeepSeek發(fā)布了一套讓現(xiàn)有模型跑得更快的工程方案,有望帶來更快更低成本的推理體驗,并降低推測解碼的落地門檻。

大模型競賽已進入訓練與推理并重的系統(tǒng)博弈階段。本次也是DeepSeek完成融資后,率先落子推理優(yōu)化賽道。戰(zhàn)略意圖也很明確:不僅要加速模型迭代和產品化,還要向下?lián)屨妓懔π矢偁幹聘唿c。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
俄羅斯令中國心涼?真正可怕的不是西方圍堵,而是我們低估了自己

俄羅斯令中國心涼?真正可怕的不是西方圍堵,而是我們低估了自己

探索新高度
2026-06-28 03:46:06
楊紫獲白玉蘭視后,臺下孫儷和觀眾的表情說明一切,宋丹丹沒說錯

楊紫獲白玉蘭視后,臺下孫儷和觀眾的表情說明一切,宋丹丹沒說錯

馬浵在解說
2026-06-27 18:09:55
多人被執(zhí)行死刑!廣西公布5起重大毒品犯罪典型案例

多人被執(zhí)行死刑!廣西公布5起重大毒品犯罪典型案例

環(huán)球網資訊
2026-06-27 12:13:01
她是上海第一名媛:當年和戲子私奔后,生下了6個家喻戶曉的名人

她是上海第一名媛:當年和戲子私奔后,生下了6個家喻戶曉的名人

瑩瑩的歷史說
2026-06-28 03:07:05
蘋果一漲價,亞洲果鏈先崩了

蘋果一漲價,亞洲果鏈先崩了

字節(jié)漫游指南
2026-06-26 15:58:13
烏加特基本確定ACL撕裂,或迫使曼聯(lián)買人!若傷缺一年可獲賠500萬

烏加特基本確定ACL撕裂,或迫使曼聯(lián)買人!若傷缺一年可獲賠500萬

羅米的曼聯(lián)博客
2026-06-28 08:24:03
俄媒女主持人曾言:若中國愿出兵300萬,俄軍很快就能打敗烏克蘭

俄媒女主持人曾言:若中國愿出兵300萬,俄軍很快就能打敗烏克蘭

南宗歷史
2026-03-17 16:53:10
伊朗1-1平局,隊長賽后言論釀世界杯災難

伊朗1-1平局,隊長賽后言論釀世界杯災難

許釔很機智
2026-06-27 16:17:06
高志凱“愛國賽道”彎道超車,直接超越金燦榮、張維為兩位前輩

高志凱“愛國賽道”彎道超車,直接超越金燦榮、張維為兩位前輩

壹家言
2026-06-28 07:02:39
比亞迪新車官宣:6月29日,正式上市!

比亞迪新車官宣:6月29日,正式上市!

科技堡壘
2026-06-27 11:29:21
上海飛舊金山鬧事后續(xù)!美聯(lián)航打破沉默正式回應,285人等三小時

上海飛舊金山鬧事后續(xù)!美聯(lián)航打破沉默正式回應,285人等三小時

椰青美食分享
2026-06-28 00:43:01
臺海一旦開戰(zhàn),西方可凍結3.2萬億中國資產,但中國手里有王炸

臺海一旦開戰(zhàn),西方可凍結3.2萬億中國資產,但中國手里有王炸

生活的哲學
2026-06-28 07:35:50
NBA全明星馬布里錢掙夠家卻散,甘當湖北女婿住岳父母家

NBA全明星馬布里錢掙夠家卻散,甘當湖北女婿住岳父母家

手工制作阿殲
2026-06-28 01:51:27
再過6周恢復跑步訓練!巴特勒稱想在勇士退役 大幅降薪不可避免?

再過6周恢復跑步訓練!巴特勒稱想在勇士退役 大幅降薪不可避免?

羅說NBA
2026-06-28 06:22:50
CCTV5直播!中國男籃VS日本男籃,12人大名單或出爐,贏球=晉級

CCTV5直播!中國男籃VS日本男籃,12人大名單或出爐,贏球=晉級

鳴哥說體育
2026-06-27 17:48:19
長期吃這種水果,可以延壽45%?Nature:是真的,而且它還能抗癌

長期吃這種水果,可以延壽45%?Nature:是真的,而且它還能抗癌

鳳凰衛(wèi)視
2026-06-25 18:14:11
新型出軌太會了:不發(fā)消息不打電話,只靠這兩種方式聯(lián)系,真藏得太深了

新型出軌太會了:不發(fā)消息不打電話,只靠這兩種方式聯(lián)系,真藏得太深了

心理觀察局
2026-06-26 07:37:08
SpaceX 重磅收購!馬斯克進軍光通信!

SpaceX 重磅收購!馬斯克進軍光通信!

EETOP半導體社區(qū)
2026-06-27 18:29:42
真子公主美國素顏出街,褪去皇室光環(huán)隨性自在

真子公主美國素顏出街,褪去皇室光環(huán)隨性自在

述家娛記
2026-06-26 13:53:22
光速為何是宇宙速度極限?如果光速無限,萬物將不復存在!

光速為何是宇宙速度極限?如果光速無限,萬物將不復存在!

宇宙時空
2026-06-26 22:00:08
2026-06-28 09:08:49
智東西 incentive-icons
智東西
智東西,AI產業(yè)新媒體,專注報道人工智能的前沿技術發(fā)展,和技術應用帶來的千行百業(yè)產業(yè)變革。
12141文章數(shù) 117113關注度
往期回顧 全部

財經要聞

兩只股票撐起的韓國股市,半年熔斷?33 次

頭條要聞

佛得角隊長被指正因強奸指控接受調查 事發(fā)于今年3月

頭條要聞

佛得角隊長被指正因強奸指控接受調查 事發(fā)于今年3月

體育要聞

世界杯最火門將,站到了阿根廷和梅西面前

娛樂要聞

四提白玉蘭終封后,楊紫:仍覺不真實

科技要聞

GPT-5.6發(fā)布,你暫時用不了!Mythos也放行

汽車要聞

搭載華為乾崑ADS 5 全新猛士M817上市售29.99萬起

態(tài)度原創(chuàng)

旅游
數(shù)碼
手機
親子
藝術

旅游要聞

不止是花海!昆明人的青春記憶,都藏在這座老牌5A景區(qū)里

數(shù)碼要聞

vivo X Fold6體驗: AI交互直覺最對味的折疊大屏!

手機要聞

iPhone 18或配備罕見的9GB內存,蘋果刀法依舊!

親子要聞

接圖形寶寶回家了,太逗了

藝術要聞

看完他的局部,我原諒了整個世界的不完美

無障礙瀏覽 進入關懷版