網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

DeepSeek剛揣了500億，轉(zhuǎn)頭就把自家的發(fā)動(dòng)機(jī)給拆了

2026-06-28 14:55:06　來(lái)源: 前沿科技學(xué)習(xí)分享圈

北京舉報(bào)

分享至

別人卷參數(shù)，他卷效率。融資到賬第九天，梁文鋒的第一槍，打在了"讓現(xiàn)有模型跑得更快"上。

這幾天，AI 圈又被一個(gè)名字給刷屏了。

DSpark。

我第一眼看到的時(shí)候，還以為是哪家公司又發(fā)新模型了。。。

點(diǎn)進(jìn)去一看——好家伙，又是梁文鋒。

故事是這樣的。

6 月 16 號(hào)，DeepSeek 剛剛完成成立以來(lái)的第一輪外部融資，超 500 億人民幣到賬，投后估值 3300 億。

騰訊、寧德、網(wǎng)易、京東，挨個(gè)排隊(duì)送錢。

按正常劇本走，融了這么多錢，下一步不是憋個(gè)大招放 V4.1，就是開(kāi)個(gè)發(fā)布會(huì)請(qǐng)明星站臺(tái)。

結(jié)果梁文鋒這哥們兒，錢到賬第 9 天，6 月 27 號(hào)，啪的一下，在 GitHub 上低調(diào)掛了一篇論文。

聯(lián)合北大發(fā)的，本人署名。

沒(méi)發(fā)布會(huì)，沒(méi)海報(bào)，沒(méi) PR 通稿。

就這么悄咪咪地，把自家 V4 的"發(fā)動(dòng)機(jī)"拆了重裝。

一、那個(gè)讓我 PTSD 的數(shù)據(jù)

我看到那個(gè)數(shù)據(jù)的時(shí)候，是有點(diǎn) PTSD 的。

單用戶生成速度，比線上原來(lái)的 MTP-1 基線，直接提升 60%–85%。

V4-Flash 在 120 tok/s 嚴(yán)苛檔下的吞吐？

+661%。

我反復(fù)確認(rèn)了好幾遍，沒(méi)看錯(cuò)，就是這個(gè)數(shù)。

什么概念呢。

以前你用 V4-Flash 讓它寫個(gè)長(zhǎng)文，你可以泡杯茶慢慢喝。

現(xiàn)在你點(diǎn)回車的瞬間，唰，全出來(lái)了。

而且最騷的是——

輸出分布跟原模型完全一致。質(zhì)量不掉，純加速。

二、它是怎么做到的

我嘗試用人話講清楚。

以前的大模型，說(shuō)白了就是個(gè)"擠牙膏型"選手。

你讓它寫 100 個(gè)字，它就老老實(shí)實(shí)算 100 次神經(jīng)網(wǎng)絡(luò)，每次蹦一個(gè)字出來(lái)。

慢得摳腳。

后來(lái)圈子里有人想了一招，叫**"推測(cè)解碼"**。

意思是雇一個(gè)"小模型實(shí)習(xí)生"，先唰唰唰幫你猜一長(zhǎng)串草稿，再讓"主模型老師"閉著眼一次性核驗(yàn)，對(duì)的留、錯(cuò)的扔。

聽(tīng)起來(lái)很美好。

但這幫實(shí)習(xí)生干活兒有兩個(gè)毛病。

第一種實(shí)習(xí)生太老實(shí)
，跟老師一樣一個(gè)字一個(gè)字猜，自己也變得很慢。
第二種實(shí)習(xí)生太浪
，一口氣猜十幾個(gè)字，開(kāi)頭還行，越往后越抽象。

明明前文是 of，下一個(gè)該是 course，它非要給你寫個(gè) "of problem"。

這毛病在論文里還有個(gè)正經(jīng)名字——"后綴衰減"。

更騷的事還在后面。

主模型老師不管這些。

你扔過(guò)來(lái) 20 個(gè)字，它就老老實(shí)實(shí)校驗(yàn) 20 個(gè)字。

哪怕后 15 個(gè)字一看就是瞎扯，它也得算一遍。

在高并發(fā)的生產(chǎn)環(huán)境里，這就是災(zāi)難性的算力浪費(fèi)。

三、DSpark 的破局思路

就兩件事。

1. 讓實(shí)習(xí)生別瞎寫

它搞了個(gè) "半自回歸" 的混合架構(gòu)。

前面用并行主干一口氣鋪開(kāi)大塊草稿，后面疊一個(gè)極簡(jiǎn)的串行小模塊，讓每個(gè)字都"瞄一眼"前面已經(jīng)寫出來(lái)的內(nèi)容。

并行的快還在，串行的準(zhǔn)也補(bǔ)上了。

2. 讓老師別傻看

它給每個(gè)草稿字都打了個(gè) "靠譜分"。

調(diào)度器實(shí)時(shí)盯著——

置信度低？跳過(guò)別校。
置信度高？拉滿去驗(yàn)。
服務(wù)器空閑就敞開(kāi)了猜，服務(wù)器繁忙就收著點(diǎn)猜。

簡(jiǎn)單粗暴。

但是有效。

四、和誰(shuí)比？比多少？

對(duì)比對(duì)象

提升

Eagle3

（自回歸草稿）

平均接受長(zhǎng)度 +26.7% ~ +30.9%

DFlash

（并行草稿）

平均接受長(zhǎng)度 +16.3% ~ +18.4%

MTP-1

（線上生產(chǎn)基線）

單用戶生成速度 +60% ~ +85%

而且這套方案不挑模型。

Qwen3-4B、8B、14B 上挨個(gè)驗(yàn)證，全部能打。

五、為什么這件事比 V4.1 還值得說(shuō)

我跟一個(gè)做 Infra 的朋友聊起這事兒。

他來(lái)了一句：

"這玩意比發(fā) V4.1 讓我服多了。"

為啥。

2026 年了，參數(shù)堆到這個(gè)量級(jí)，架構(gòu)創(chuàng)新的邊際收益已經(jīng)在遞減了。

真正的命門，是"同樣一張 H100 能跑出多少 tok/s"。

每提 10%，就是真金白銀。

而 DeepSeek 還把所有東西都開(kāi)源了。

模型權(quán)重
掛在 Hugging Face
DeepSpec 全棧訓(xùn)練代碼
扔在 GitHub
MIT 協(xié)議
，隨便商用

意思是——你拿去給 Qwen3、Gemma 訓(xùn)自己的草稿模型也行，隨便用。

上線一天，906 個(gè) star。

六、寫在最后

這兩年我看了太多發(fā)布會(huì)。

每場(chǎng)都恨不得把自己說(shuō)成下一個(gè) OpenAI。

PPT 上的數(shù)字一個(gè)比一個(gè)嚇人，落到真實(shí)用戶手里，卡得跟幻燈片似的。

但 DeepSeek 一直在悶頭干一件事——

把價(jià)格打下來(lái)。把速度提上去。把代碼扔出來(lái)。把門檻踩下去。

500 億到賬第九天打的第一槍，沒(méi)打在新模型上，打在了"讓現(xiàn)有模型跑得更快"上。

這個(gè)選擇，挺梁文鋒的。

愿我們手里的 AI，

別再是擠牙膏的電子算盤。

而是一臺(tái)，真正能陪你跑起來(lái)的發(fā)動(dòng)機(jī)。

聲明：包含AI生成內(nèi)容

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

馮德萊恩：中歐對(duì)話結(jié)果必須令人滿意否則將進(jìn)行報(bào)復(fù)

澎湃新聞 2026-07-05 07:08:04
10453 跟貼 10453
法國(guó)隊(duì)主帥:安排2名強(qiáng)壯球員保護(hù)姆巴佩以防對(duì)手報(bào)復(fù)

紅星新聞 2026-07-05 09:06:42
2812 跟貼 2812

河南80后男子帶村民養(yǎng)蟬，高峰期一晚上可抓1.2萬(wàn)只：每晚摸三輪爬叉，抓到4小時(shí)內(nèi)冷凍

環(huán)球網(wǎng)資訊 2026-07-05 08:36:34
4032 跟貼 4032

中央安全考核巡查組專家現(xiàn)場(chǎng)質(zhì)問(wèn)：你們管理人員上去過(guò)嗎？

上觀新聞 2026-07-05 14:22:38
21 跟貼 21
哈蘭德將標(biāo)志性長(zhǎng)發(fā)剪成利落短發(fā)，6日凌晨4點(diǎn)迎戰(zhàn)巴西

極目新聞 2026-07-05 17:19:25
1848 跟貼 1848

7月15日，豆包、千問(wèn)下線該功能！

濟(jì)源網(wǎng) 2026-07-05 11:07:47
136 跟貼 136

泰山景區(qū)回應(yīng)修建滾筒式刀片刺繩隔離鐵絲網(wǎng)：與正常游覽路線不交叉不重疊

北京日?qǐng)?bào)客戶端 2026-07-02 08:55:17
20359 跟貼 20359
兩支巴西球隊(duì)有意簽下沃齊尼亞

瀟湘晨報(bào) 2026-07-05 21:08:09
1222 跟貼 1222

知名感冒藥沖上熱搜，全國(guó)銷量暴跌55%，網(wǎng)友：好難買

哈爾濱日?qǐng)?bào) 2026-07-05 11:11:15
258 跟貼 258
全球最大數(shù)據(jù)中心建設(shè)，終止了

上觀新聞 2026-07-05 06:41:18
48 跟貼 48
請(qǐng)客吃早餐花掉12萬(wàn)！全網(wǎng)都在找他

環(huán)球網(wǎng)資訊 2026-07-05 16:57:11
2235 跟貼 2235
耗資33億！宮殿修了，國(guó)王不住了

中國(guó)新聞周刊 2026-07-05 07:31:05
132 跟貼 132
TCL回應(yīng)永樂(lè)款菩薩像現(xiàn)其廣告：未授權(quán)或參與涉事文物展陳

南方都市報(bào) 2026-07-05 21:14:13
1506 跟貼 1506
嫌顧客只點(diǎn)15元麻辣燙，店主稱沒(méi)心思做還追出門嘲諷：吃不起別吃

星視頻 2026-07-05 13:14:29
875 跟貼 875
馬未都：如佛像確為海口五公祠當(dāng)年失竊普庵祖師坐像，愿意高高興興送回

界面新聞 2026-07-05 20:56:35
71 跟貼 71
這些中國(guó)制造“避暑神器”，正在為歐洲降溫！

環(huán)球網(wǎng)資訊 2026-07-05 15:43:12
83 跟貼 83
小店老板守著冰柜嘆氣：今年雪糕棒冰怎么沒(méi)人吃了？

大象新聞 2026-07-05 21:58:07
4 跟貼 4
罕見(jiàn)熱浪來(lái)襲，預(yù)計(jì)美國(guó)超1.65億人面臨高溫健康風(fēng)險(xiǎn)

齊魯壹點(diǎn) 2026-07-05 12:41:27
110 跟貼 110
極目幫辦丨走幾步路就有公廁，有人卻非要在小區(qū)門口隨地小便

極目新聞 2026-07-05 12:09:21
33 跟貼 33
余隆×濮存昕×馮憲珍，中國(guó)首演一版特殊的《哈姆雷特》

澎湃新聞 2026-07-05 22:56:28
6 跟貼 6
她提前4個(gè)月請(qǐng)假，經(jīng)理卻讓她取消

生活觀察員啊 2026-07-06 01:36:12
0 跟貼 0

王楚欽輸球不到24小時(shí)，王皓說(shuō)了大實(shí)話，他跟樊振東早已漸行漸遠(yuǎn)

秋姐居

2026-07-05 09:37:33

蘋果 MacBook Pro 終于要迎來(lái)大改款！全新外觀設(shè)計(jì)

XCiOS俱樂(lè)部

2026-07-05 18:56:02

凌晨4點(diǎn)世界杯15億對(duì)決！巴西vs黑馬：2大巨星必有1人出局

葉青足球世界

2026-07-05 11:20:23

醫(yī)生發(fā)現(xiàn)：能跑能跳的老人，基本在70歲，就已經(jīng)不做這6件事了

芹姐說(shuō)生活

2026-06-30 19:12:40

哈蘭德把標(biāo)志性長(zhǎng)發(fā)剪成了短發(fā)，明天凌晨4點(diǎn)迎戰(zhàn)巴西

第一財(cái)經(jīng)資訊

2026-07-05 22:07:30

新婚當(dāng)晚妻子不讓我碰，第二天我回公司，5個(gè)月后她大著肚子找我

千秋文化

2026-06-22 19:38:55

西瓜上市了！發(fā)現(xiàn)：吃得越多，糖尿病患者壽命或越短？真的嗎？

芹姐說(shuō)生活

2026-07-03 23:51:53

殲16配新航發(fā)，推力達(dá)14噸，比俄制AL31強(qiáng)多少？

精彩一觸即發(fā)

2026-07-05 15:59:24

某大廠因?yàn)橘r償金不夠撤回裁員...

新浪財(cái)經(jīng)

2026-07-03 01:06:15

江蘇一鴨血粉絲店被LV起訴，老板稱實(shí)際侵權(quán)系隔壁餐吧；餐吧老板：修改多次仍被起訴，被索120萬(wàn)元判賠6萬(wàn)元，目前店鋪已倒閉，無(wú)能力賠付

上觀新聞

2026-07-05 08:04:37

體制內(nèi)的人出現(xiàn)了轉(zhuǎn)向

細(xì)說(shuō)職場(chǎng)

2026-07-05 11:39:50

臺(tái)灣歡呼，中國(guó)飛機(jī)來(lái)了！

荊楚寰宇文樞

2026-07-05 23:51:43

伊朗國(guó)葬第2天，穆杰塔巴留下遺憾，中方在現(xiàn)場(chǎng)交底，并提出要求

氧氣過(guò)敏者

2026-07-05 23:52:02

17歲女孩遭200斤男子強(qiáng)奸后續(xù)：更多細(xì)節(jié)難以啟齒，男子母親發(fā)聲

古希臘掌管松餅的神

2024-09-30 10:43:45

西蒙尼：許多人都忘記了梅西2016年退隊(duì)，實(shí)際上沒(méi)缺席過(guò)1場(chǎng)

晚霧空青

2026-07-05 10:21:56

溫網(wǎng)女單爆大冷！2號(hào)種子萊巴金娜7-6 6-1遭橫掃，世界第一薩巴倫卡笑納大禮

體育硬核說(shuō)

2026-07-05 00:13:05

我是天使：那不是翅膀，是我終于接住了自己

疾跑的小蝸牛

2026-07-05 19:58:45

前腳否認(rèn)喜訊，后腳“官宣”大婚，今朱玲玲一句話，再曝霍家處境

報(bào)君知史

2026-07-05 19:05:18

羅體：麥肯尼火爆全美，可能會(huì)有英超球隊(duì)為他至少報(bào)價(jià)5000萬(wàn)歐

硯底沉香

2026-07-05 07:13:04

李冰冰開(kāi)出12萬(wàn)月薪招保姆。其中一位保姆應(yīng)聘，將菜里里外外洗了5、6遍，才給李冰冰看。沒(méi)想到，李冰冰只看了一眼...

大愛(ài)三湘

2026-07-03 22:27:15

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

DeepSeek剛揣了500億，轉(zhuǎn)頭就把自家的發(fā)動(dòng)機(jī)給拆了

華為：邏輯折疊將大幅提升麒麟CPU核心頻率

醫(yī)院給老人一次拔12顆牙種10顆 官方：將頂格行政處罰

醫(yī)院給老人一次拔12顆牙種10顆 官方：將頂格行政處罰

姆巴佩點(diǎn)走巴拉圭：巴黎三代左鋒傳承

霉霉婚禮照片泄露 有四人違規(guī)

揭秘跨境“對(duì)敲”換匯黑產(chǎn)

方程豹鈦9內(nèi)飾曝光 用上了長(zhǎng)聯(lián)屏設(shè)計(jì)/下半年上市

態(tài)度原創(chuàng)

3年賺46億，楊冪喊出一個(gè)安徽富豪

《漫威爭(zhēng)鋒》美國(guó)隊(duì)長(zhǎng)性感皮膚遭修改 粉絲們生氣了

傳奇筑 日常詩(shī)

Intel Xe3P核顯越來(lái)越近！Linux曝光新進(jìn)展

工程車愛(ài)游泳

醫(yī)院給老人一次拔12顆牙種10顆官方：將頂格行政處罰

醫(yī)院給老人一次拔12顆牙種10顆官方：將頂格行政處罰

霉霉婚禮照片泄露有四人違規(guī)

方程豹鈦9內(nèi)飾曝光用上了長(zhǎng)聯(lián)屏設(shè)計(jì)/下半年上市

《漫威爭(zhēng)鋒》美國(guó)隊(duì)長(zhǎng)性感皮膚遭修改粉絲們生氣了

傳奇筑日常詩(shī)