无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

<form id="iuupk"></form>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

大模型也需要睡覺！讓AI打個盹，醒來更聰明

2026-05-28 10:30:55　來源: 硅星人

北京舉報

0

分享至

文章轉載于量子位

作者：聞樂

7×24，AI也吃不消。

卡內基梅隆大學和馬里蘭大學發了篇論文，《Language Models Need Sleep》——

大模型處理長上下文的時候，硬撐著不休息，真的會累傻。

這項研究的靈感源自人腦運作機制。

人睡覺的時候海馬體會把白天的短期記憶一遍遍回放，鞏固進皮層突觸，變成長期知識。

研究團隊認為模型也可以這樣，設計了一個睡眠機制，讓大模型上下文窗口快滿的時候別硬撐了，打個盹把最近的上下文反復咀嚼幾遍，壓縮進長期權重，清空緩存，醒了再接著干。

測試發現，合理增加“睡眠”迭代輪次，能明顯提升模型在深度推理類任務上的表現。

尤其是那些需要一步接一步推導的難題，越復雜，模型越需要多睡一會兒。

咋回事？

1

大模型到底怎么了，非要睡覺

Transformer的核心是注意力機制，但注意力有一個天生的短板就是，上下文越長，算力平方級往上躥，KV緩存也線性往上漲。

同樣是推理任務，8K上下文窗口和128K上下文窗口的算力成本差距極大，多出的算力基本都消耗在了歷史信息的關聯計算上。

所以現在的做法兩種：

要么就硬扛，扛不住了就把老信息踢出緩存，但踢出去的東西，模型就當沒發生過；

另一類就是兩年流行的SSM+Attention混合架構，比如Samba、Qwen3.5。

混合架構是想了個折中方案，把老信息壓縮進快速權重fast weight，不占緩存，同時保留信息的可調用能力。

這確實緩解了一部分內存壓力，但團隊發現即便快速權重還有充足容量，當推理步驟變多、邏輯鏈條變長時，模型依舊會出現性能失效的問題。

也就是說當下的瓶頸并非信息存儲能力不足，而是深度推理能力跟不上。

歷史信息被移出KV緩存前，模型僅有一次前向傳播的機會完成信息內化，單次處理根本不足以支撐復雜邏輯的拆解與推導。

這一點和人腦比較像，你白天經歷了一大堆事情，不是當場全消化掉的，而是大腦等你睡著了再處理。

海馬體在睡眠期間一遍遍回放白天的重要片段，把短期記憶鞏固進皮層突觸，變成長期知識。

但這個過程必須離線，也就是你得先睡著，把外部刺激暫時關掉，大腦才能集中算力干消化這件事。

而且它不是回放一遍就完，得多放幾遍。

1

模型的睡眠長什么樣

團隊把人腦這一整套邏輯搬到了模型上。

他們的設計是當模型上下文窗口快滿的時候，不硬撐了，直接讓大模型睡覺。

這里的睡覺是指暫停接收新token，進入純離線狀態，針對已積累的全部上下文，執行多輪遞歸前向傳播。

依靠可學習的局部規則，反復對信息進行提煉整合，逐步更新SSM模塊內的快速權重，完成信息的深度壓縮與消化。

消化完了就清空KV緩存，帶著更新后的權重醒來，接著干活。

從算力分配來看，額外的計算開銷全部集中在“睡眠”階段，模型蘇醒后的正常推理流程和常規模型保持一致，只需要一次前向傳播。

這里的“睡眠時長”，本質上就是信息迭代處理的輪次，輪次越多，代表模型對上下文內容的梳理、打磨次數越充分。

團隊選用元胞自動機、多跳圖檢索、GSM-Infinite無限數學推理三類任務開展測試，因為這幾類任務可以精準控制推理深度與記憶負載兩大變量。

測試結果清晰印證提升睡眠迭代輪次，模型整體性能穩步提升，而且性能提升主要體現在高難度深度推理任務上。

也就是說簡單的題醒著就能秒了，難的題需要睡一覺，得經過多輪梳理，才能理清思路。

只能說，摸魚休息確實是提升效率的妙招，有時候停下來才能好好思考（doge）。

論文地址：https://arxiv.org/abs/2605.26099

點個“愛心”，再走吧

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

“都公示過了，全家等著我去上班呢” 黑龍江女子考編排名第一卻被別人遞補，維權后崗位被取消，當地：審核人員把關不嚴

看看新聞 2026-06-14 09:38:33
6891 跟貼 6891
平田整地要讓農民還貸？每畝200元連交15年！甘肅最新回應

央視新聞客戶端 2026-06-14 15:11:54
5229 跟貼 5229

山東近3億重點工程現“脆皮”底座，承建方承認質量不達標

江西晨報 2026-06-14 22:22:20
140 跟貼 140

國安部披露：石某某前往深山中一處軍事基地，拍攝軍事設施照片記錄“越野成果”，被處罰

政知新媒體 2026-06-14 08:28:49
1226 跟貼 1226
外媒：俄烏戰爭時長已經超過一戰戰斗極其艱苦膠著

參考消息 2026-06-14 11:25:15
1251 跟貼 1251

瑞典稱一天內兩次出動"鷹獅"戰機攔截俄戰機

環球網資訊 2026-06-14 08:55:09
3439 跟貼 3439

布倫森獨扛45分！尼克斯時隔53年再捧NBA總冠軍獎杯

澎湃新聞 2026-06-14 11:32:33
1425 跟貼 1425
廣州一奔馳4S店人去樓空車主售后維保被發配到200公里外

新快報新聞 2026-06-14 16:31:04
189 跟貼 189

港媒：美國以衰落之態迎來建國250周年

參考消息 2026-06-14 20:39:17
930 跟貼 930
主裁判突然吹停比賽，該喝水了？

中國新聞周刊 2026-06-14 22:20:14
52 跟貼 52
宇樹機器人單價兩年降72% 會跳舞的機器人"身價"大跌

財聯社 2026-06-14 10:54:09
271 跟貼 271
女子在浙江考駕照，窗口辦理業務時“系統突然彈出紅色預警”，工作人員瞬間警覺：有問題！

浙江之聲 2026-06-14 17:26:20
117 跟貼 117
罕見兩連降！2萬億居民存款搬去了哪

第一財經資訊 2026-06-14 21:37:00
69 跟貼 69
游客吐槽無錫國保園林寄暢園像“吸煙室”，古建古樹間煙霧彌漫，景區回應：已全面禁煙

上游新聞 2026-06-13 18:13:12
1363 跟貼 1363
班主任給英語老師送花全班尖叫，學生：希望他們能夠永遠幸福

瀟湘晨報 2026-06-14 16:41:19
167 跟貼 167
揭秘：為什么不建議老舊家電“超期服役”?

北青網-北京青年報 2026-06-12 12:00:04
313 跟貼 313
消費者稱湯面中吃出蛆蟲和府撈面:暫未查出類似問題

南方都市報 2026-06-14 17:02:46
194 跟貼 194
買火車票有新優惠政策！

西安發布 2026-06-14 11:31:22
126 跟貼 126
專家：“三新”消費將成為破解傳統消費困局關鍵

證券時報 2026-06-14 17:45:02
353 跟貼 353
鴻蒙開發者跨過千萬門檻后，一群“非程序員”正在涌入

第一財經資訊 2026-06-14 19:26:22
209 跟貼 209
三“新”看就業共赴好前程（校園觀察＠大學生）

人民網 2026-06-14 09:25:58
126 跟貼 126
新華社經濟隨筆：小城煙火升騰中的活力脈動

新華社 2026-06-14 12:40:26
130 跟貼 130
猖狂！南京一印度餐廳未報備，當街慶祝“灑紅節”，現場畫面曝光

小徐講八卦 2026-06-15 06:07:27
0 跟貼 0
莫讓“七天無理由”淪為“七天免費用”

齊魯壹點 2026-06-15 06:57:12
0 跟貼 0
阻斷不良商家的可乘之機

經濟日報 2026-06-15 06:55:38
0 跟貼 0
沒欠薪也沒裁員，被員工索賠60萬！廣州個體診所老板哭訴，太難了

火山詩話 2026-06-15 06:33:17
0 跟貼 0

看完德國7-1庫拉索，球迷認清3個事實，世界杯擴軍后影響比賽質量

看完德國7-1庫拉索，球迷認清3個事實，世界杯擴軍后影響比賽質量

侃球熊弟

2026-06-15 02:59:42

訂單暴增，下單的幾乎都是年輕女性！價格不到50元，還有刺鼻氣味……提醒：存在安全隱患

訂單暴增，下單的幾乎都是年輕女性！價格不到50元，還有刺鼻氣味……提醒：存在安全隱患

深圳晚報

2026-06-14 09:07:46

亞洲之光！日本絕平荷蘭，3戰歐洲強隊不敗，首進世界杯8強不是夢

亞洲之光！日本絕平荷蘭，3戰歐洲強隊不敗，首進世界杯8強不是夢

侃球熊弟

2026-06-15 05:02:46

心理學上有個詞叫：破窗效應。如果你整天不學習，不運動，不節制消費，不反省自律，無興趣愛好、無目標、無期望，生活是不會變好的……

心理學上有個詞叫：破窗效應。如果你整天不學習，不運動，不節制消費，不反省自律，無興趣愛好、無目標、無期望，生活是不會變好的……

LULU生活家

2026-06-11 14:51:01

人口15萬的庫拉索，怎么踢進世界杯的？國家隊26人名單中有25人來自荷蘭，唯一“本地人”是華裔陳達毅，祖籍廣東

人口15萬的庫拉索，怎么踢進世界杯的？國家隊26人名單中有25人來自荷蘭，唯一“本地人”是華裔陳達毅，祖籍廣東

極目新聞

2026-06-14 18:19:21

到底真的假的？網傳幾乎所有大學專業都在勸退…

到底真的假的？網傳幾乎所有大學專業都在勸退…

慧翔百科

2026-06-12 17:40:37

NBA季后賽獎金分配出爐！尼克斯奪冠人均77萬美元索漢收入翻倍

NBA季后賽獎金分配出爐！尼克斯奪冠人均77萬美元索漢收入翻倍

羅說NBA

2026-06-15 05:05:56

國產AI不把用戶當人看！用戶質疑智譜：充錢后根本用不了，運營裝死客服群被罵穿

國產AI不把用戶當人看！用戶質疑智譜：充錢后根本用不了，運營裝死客服群被罵穿

風向觀察

2026-06-14 12:29:38

可憐的法國，邀請不到中國，連沙特都不給面子了

可憐的法國，邀請不到中國，連沙特都不給面子了

虛聲

2026-06-14 20:13:51

岳陽28歲男子去世留40萬房貸，父母放棄繼承，法院判民政局為管理人：管理但不清債

岳陽28歲男子去世留40萬房貸，父母放棄繼承，法院判民政局為管理人：管理但不清債

瀟湘晨報

2026-06-14 18:50:55

“啥需求都滿足！”找耿同學“私了”的上海大學院長被免職

“啥需求都滿足！”找耿同學“私了”的上海大學院長被免職

大江看潮

2026-06-14 09:12:50

殯葬師提醒：老人在家離世，打完120后，家屬千萬別漏了這3個動作

殯葬師提醒：老人在家離世，打完120后，家屬千萬別漏了這3個動作

奇葩游戲醬

2026-06-14 17:05:05

5萬次模擬之后，高盛認為世界杯冠軍六成概率落入這三支球隊

5萬次模擬之后，高盛認為世界杯冠軍六成概率落入這三支球隊

華爾街見聞官方

2026-06-14 16:31:29

砍掉網紅“孤獨樹”，村民梁亞利：麥田被踩沒人賠，要保護莊稼

砍掉網紅“孤獨樹”，村民梁亞利：麥田被踩沒人賠，要保護莊稼

上觀新聞

2026-06-14 18:08:35

中央氣象臺發布暴雨黃色預警、強對流天氣藍色預警，廣東沿海局地有特大暴雨

中央氣象臺發布暴雨黃色預警、強對流天氣藍色預警，廣東沿海局地有特大暴雨

界面新聞

2026-06-14 18:10:21

場上乏善可陳，荷蘭vs日本看臺驚現美女球迷

場上乏善可陳，荷蘭vs日本看臺驚現美女球迷

天光破云來

2026-06-15 05:12:03

78歲老帥落淚！世界杯首秀吞1-7慘案賽后崩潰：實在受不了被暴揍

78歲老帥落淚！世界杯首秀吞1-7慘案賽后崩潰：實在受不了被暴揍

風過鄉

2026-06-15 05:41:17

巴拉圭“胸神”16年后重返世界杯，靠火辣身材爆紅，愿為贏球裸奔

巴拉圭“胸神”16年后重返世界杯，靠火辣身材爆紅，愿為贏球裸奔

深析古今

2026-06-14 15:32:00

世界杯上演超燃2-2！荷蘭全攻全守回來了，日本踢出亞洲最高水平

世界杯上演超燃2-2！荷蘭全攻全守回來了，日本踢出亞洲最高水平

足球評論qs

2026-06-15 05:56:22

DeepSeek研究員控訴字節工地周末半夜2點施工擾民，隨后社媒賬號被封

DeepSeek研究員控訴字節工地周末半夜2點施工擾民，隨后社媒賬號被封

回旋鏢

2026-06-14 12:52:08

硅（Si）是創造未來的基礎，歡迎來到這個星球。

3159文章數 10506關注度

往期回顧全部

科技要聞

Anthropic最強模型被禁，傳亞馬遜通風報信

頭條要聞

伊朗稱伊美諒解備忘錄已最終敲定

頭條要聞

伊朗稱伊美諒解備忘錄已最終敲定

體育要聞

8年8隊奪冠，鄧肯那句話，現在還給了馬刺

娛樂要聞

鄧超攜子觀戰NBA，等等帥氣十足

財經要聞

金價跌至900元關口，大媽又來抄底了！

汽車要聞

狂歡置換價7.99萬第三代豪越L歡樂PLUS大7座版上市

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

教育

旅游

健康

軍事航空

藝術要聞

218米！建行最大的獨棟辦公樓，和農行長得一模一樣！

教育要聞

高考用了假的2B鉛筆，真的會得0分嗎？機器能否順利識別？

旅游要聞

6月14日最佳情報|五龍潭夏日遛娃好去處，煙臺現丁達爾現象！

老人、小孩、孕婦，吃粽子有啥風險

軍事要聞

特朗普:美伊協議周日簽還有終極手段

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<p id="2wtnx"><ins id="2wtnx"></ins></p>