无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

<style id="ev19m"><tbody id="ev19m"></tbody></style>

<noscript id="ev19m"></noscript>

<td id="ev19m"></td>

<small id="ev19m"></small>

<noscript id="ev19m"></noscript>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

MIT何愷明打破GPT壟斷，新語言模型ELF：僅45B訓練量碾壓同級基線

2026-05-13 21:22:58　來源: 知識圈

北京舉報

0

分享至

MIT何愷明團隊發布了新語言模型 ELF（Embedded Language Flows）。他們繞開了目前的自回歸架構，把自己在視覺領域最拿手的擴散模型直接用在了文本生成上。具體做法是：把整個生成過程塞進連續的向量空間，直到最后一步才把數據還原成離散 token。

圖像像素能平滑變色，天生適合擴散模型去噪。但文字不行，詞與詞之間是斷開的，「貓」和「狗」之間沒有任何中間地帶。為了填平這個鴻溝，以前的文本擴散模型做得很擰巴：要么在去噪時每一步都強行去查詞表，要么在模型外面再掛一個獨立的解碼器。ELF 徹底切斷了這種糾纏：中間全不管，讓模型安安心心在連續空間里算去噪，只在最后一刻用同一套網絡把向量轉回文字。

這條路不僅走通了，而且極度省數據。在 OpenWebText 評測中，105M 參數的 ELF-B 僅用32步采樣，困惑度（Gen. PPL）就壓到了約24.1，優于多款基線模型。更重要的是，它只消耗了約45B 訓練 token，而同級別對手通常需要500B 以上，訓練量直接砍掉九成。這個結果證明，語言天生的離散性并沒有堵死連續擴散這條路。

一旦這種思路成熟，未來的大模型有望徹底擺脫只能「從左到右、單向蹦字」的架構束縛。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

惡臭!上海一別墅區傳出高頻尖叫,居民不堪其擾

看看新聞Knews 2026-06-12 22:37:03
8991 跟貼 8991
吉利銀河的單車依賴癥更嚴重了

界面新聞 2026-06-12 15:11:25
67 跟貼 67

鬧心！奧迪純電SUV，提車三天“故障頻發”！上海車主7個月報修10次，結果更鬧心

新民晚報 2026-06-12 19:26:49
602 跟貼 602

中國男籃隊長調整

極目新聞 2026-06-13 10:53:08
2 跟貼 2
公開征求意見！廣州擬繼續在全市所有道路禁止機動車鳴喇叭

南方都市報 2026-06-12 19:04:34
377 跟貼 377

高考，考的不僅僅是分數

環球網資訊 2026-06-12 18:45:15
189 跟貼 189

5個月神話破滅！Donut Lab固態電池被實錘造假背后：從未實際生產過電池電芯，固態電池產業化仍需五到十年

每日經濟新聞 2026-06-11 16:39:10
167 跟貼 167
“張雪機車”車手德比斯奪得超級桿位賽第3名

上觀新聞 2026-06-12 23:01:03
139 跟貼 139

高鐵行李架上驚現寵物蛇列車長硬著頭皮抓網友：看得出害怕但依然硬上！

閃電新聞 2026-06-12 14:16:06
98 跟貼 98
水果店員工用嘴給水果噴水？高校通報：屬實，店鋪已關停！

上觀新聞 2026-06-12 21:14:48
940 跟貼 940
美擬撤走北約歐洲防務三分之一戰機

界面新聞 2026-06-12 13:06:43
1837 跟貼 1837
一睜眼就虧幾十萬！白銀一路下跌，有人虧損七位數，“焦慮，走路都腿軟”

浙江之聲 2026-06-12 18:47:57
106 跟貼 106
美將部分中企列入"中國軍事企業清單" 商務部回應

界面新聞 2026-06-13 09:04:57
23 跟貼 23
僅靠宣傳“吸煙有害健康”難奏效，學者呼吁提高煙草稅來控煙

南方都市報 2026-06-12 14:34:07
224 跟貼 224
海光信息在漢披露：國產CPU處理器性能已比肩英特爾

支點財經 2026-06-11 21:27:18
174 跟貼 174
揭秘：為什么不建議老舊家電“超期服役”?

北青網-北京青年報 2026-06-12 12:00:04
309 跟貼 309
唐斯：OG的絕殺將會與紐約體育史上那些最偉大的時刻并列

北青網-北京青年報 2026-06-13 10:24:01
7 跟貼 7
米奇：我不關注社交媒體我可能在網上“被解雇”212次了

北青網-北京青年報 2026-06-13 10:28:04
19 跟貼 19
意想不到！美國主導比賽，巴拉圭疲于奔命，美國4比1大勝

澎湃新聞 2026-06-13 11:06:27
0 跟貼 0
上海一別墅區天天傳出高頻尖叫，還散發惡臭，居民崩潰求助：居委會說聯系了60多個部門無法介入，直到報警才被帶走

深圳晚報 2026-06-13 12:14:53
0 跟貼 0
自費檢查也追責！“患者自費查個血型，我被罰了2000塊”：醫保飛檢升級，大批醫生開啟 “避險式拒診”

醫客 2026-06-13 12:14:43
0 跟貼 0
小腿骨折、跟腱斷裂，他墜入5米廢井危在旦夕

8099999街頭巷尾 2026-06-13 12:10:06
0 跟貼 0

意外！向余望社媒再次曬照做出重要決定，讓重慶銅梁龍球迷欣喜

意外！向余望社媒再次曬照做出重要決定，讓重慶銅梁龍球迷欣喜

振剛說足球

2026-06-13 10:06:00

3分鐘從第九到第二！德比斯：沒有64號，我連前五都進不了

3分鐘從第九到第二！德比斯：沒有64號，我連前五都進不了

童叔不飆車

2026-06-13 01:22:02

外媒終于發現不對勁：平壤街頭大變樣，朝鮮靠著中國偷偷干件大事

外媒終于發現不對勁：平壤街頭大變樣，朝鮮靠著中國偷偷干件大事

霽寒飄雪

2026-06-13 09:40:16

世界杯體育場外爆發沖突，抗議者追打騎警、掄棍打警察

世界杯體育場外爆發沖突，抗議者追打騎警、掄棍打警察

極目新聞

2026-06-12 13:09:21

30分+32分+36分！隊史首人！布倫森曼巴附體，若奪冠地位能超盧卡

30分+32分+36分！隊史首人！布倫森曼巴附體，若奪冠地位能超盧卡

世界體育圈

2026-06-12 12:56:04

夏天吃魚，這3種魚再貴也要買，比鯽魚鮮，比鱸魚有營養，好吃

夏天吃魚，這3種魚再貴也要買，比鯽魚鮮，比鱸魚有營養，好吃

阿龍美食記

2026-06-11 18:59:35

連續43小時沒合眼，上海30歲骨干教師溺亡前細節曝光

連續43小時沒合眼，上海30歲骨干教師溺亡前細節曝光

大廠編外實習生

2026-06-12 19:37:31

記者：比利時安排熱水浴和桑拿，以適應高溫

記者：比利時安排熱水浴和桑拿，以適應高溫

懂球帝

2026-06-13 05:54:06

溫瑞博2-3日本、林詩棟止步16強！這4個事實，才是王皓最擔心的

溫瑞博2-3日本、林詩棟止步16強！這4個事實，才是王皓最擔心的

十點街球體育

2026-06-13 08:59:19

網紅開價1.2萬吃頓飯，餐廳老板硬剛：我們沒興趣

網紅開價1.2萬吃頓飯，餐廳老板硬剛：我們沒興趣

熱搜摘要官

2026-06-12 01:25:16

伊朗外長：霍爾木茲海峽相關服務將收費

伊朗外長：霍爾木茲海峽相關服務將收費

財聯社

2026-06-13 03:52:12

亞洲最窮國，中國游客去了就是土豪，女性開放為何無人敢定居？

亞洲最窮國，中國游客去了就是土豪，女性開放為何無人敢定居？

抽象派大師

2026-06-10 05:04:32

怎么區分鴨腿和鵝腿，做熟的那種？

怎么區分鴨腿和鵝腿，做熟的那種？

果殼

2026-06-12 12:50:45

他曾擔任中央辦公廳代主任，大肆迫害年邁的彭老總，后被判刑18年

他曾擔任中央辦公廳代主任，大肆迫害年邁的彭老總，后被判刑18年

大運河時空

2026-06-01 20:45:03

李嘉誠又放話了？未來5年，把房子存款換成這3種資產，生活會越好

李嘉誠又放話了？未來5年，把房子存款換成這3種資產，生活會越好

巢客HOME

2026-06-12 10:15:04

女子因鉀過低心臟驟停，醫生：平時寧愿少吃點肉，也要多吃這5物

女子因鉀過低心臟驟停，醫生：平時寧愿少吃點肉，也要多吃這5物

芹姐說生活

2026-06-10 14:57:32

偷雞不成蝕把米！以為能“毀掉”董路，沒成想自己先被扒個底朝天

偷雞不成蝕把米！以為能“毀掉”董路，沒成想自己先被扒個底朝天

曉徙娛樂

2026-06-13 10:37:26

南京美女跑友大璐璐檢查出癌！月跑300公里，經常熬夜喜歡5點晨跑

南京美女跑友大璐璐檢查出癌！月跑300公里，經常熬夜喜歡5點晨跑

千言娛樂記

2026-06-12 17:34:00

女總裁破產那天，我給爸打了個電話：我看上老板了，給點追妻基金

女總裁破產那天，我給爸打了個電話：我看上老板了，給點追妻基金

千秋文化

2026-06-09 22:53:05

24.28萬！全新豐田賽那上市，全系2.5L發動機、6Ah電池！

24.28萬！全新豐田賽那上市，全系2.5L發動機、6Ah電池！

科學技術宅

2026-06-13 09:16:18

全球熱點新聞資訊

247文章數 317688關注度

往期回顧全部

科技要聞

SpaceX上市首日破2萬億美元，馬斯克再封神

頭條要聞

養生館在洗腸液中摻醬油北京100多名老人被坑上千萬

頭條要聞

養生館在洗腸液中摻醬油北京100多名老人被坑上千萬

體育要聞

東道主三戰不敗！美墨開門紅加拿大零的突破

娛樂要聞

12年情懷碎一地！跑男接連翻車

財經要聞

梁文鋒向左，楊植麟向右

汽車要聞

2026重慶車展長城炮Hi4-T正式上市售14.98萬起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

時尚

本地

親子

房產

手機

今日熱點：白鹿起訴蒙淇淇；岳云鵬回應開演唱會質疑……

本地新聞

AK劉彰邂逅河北南大港濕地

親子要聞

如何給寶寶做社交啟蒙？從和同齡人互動開始

房產要聞

海南最賺錢行業曝光！最快4年半，海口全款買三房！

手機要聞

蘋果升級iOS 27版Find My：優化界面，可控制位置共享時長

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<p id="hfojm"><tr id="hfojm"></tr></p>

<td id="hfojm"></td>