![]()
導語
在日常經驗中,我們常把“遺忘”理解為信息的流失:時間久了,記憶就會慢慢消失;學習新知識,也可能覆蓋舊內容。然而,從短視頻推薦到大語言模型,再到人類被線索喚醒的記憶體驗,這些現象或許指向另一種解釋。這篇發表于 Neuron 的研究提出“鍵值記憶”框架,將記憶拆分為“索引”與“內容”兩個部分:海馬體負責提供檢索線索,新皮層負責存儲信息本身。在這一視角下,遺忘不再是內容消失,而更像是“找不到入口”——信息仍在,只是暫時無法被提取。這一跨越人工智能與腦科學的統一模型,不僅重塑了我們對記憶機制的理解,也為持續學習與智能系統設計提供了新的思路。
關鍵詞:鍵值記憶(key–value memory)、海馬體、新皮層、記憶檢索、遺忘機制、Transformer、持續學習、認知神經科學
賈梓杏丨作者
張江丨審校
刷短視頻時,平臺似乎總能“剛好知道你想看什么”;用AI寫文案時,模型可以順暢地接著你的思路往下生成;而當我們回憶童年趣事,一些零散的線索——一段旋律、一種氣味——往往就能勾起完整的場景。
這些看似毫不相關的體驗,其實都指向一個共同的問題:信息是如何被“存住”,又是如何被“找回”的?
在人工智能中,一個常見的解釋是鍵值記憶(key–value memory):系統通過線索定位信息,再提取對應內容。近年來,神經科學研究也提出類似視角。2025年發表于 Neuron 的論文《Key-value memory in the brain》嘗試用“索引—內容分工”來理解大腦:海馬體更偏向提供檢索線索,新皮層更多承擔信息存儲。
這并不意味著大腦就是一個簡單的“鍵值系統”,但這個框架提供了一種有啟發性的統一視角,讓我們重新審視一個熟悉卻復雜的問題:記憶是如何被組織的,又為什么會“遺忘”。
一、什么是鍵值記憶?AI的“記憶秘訣”很簡單
鍵值記憶聽起來專業,實則邏輯我們每天都在用:手機通訊錄里,姓名是“鍵”(Key),電話號碼是“值”(Value),找姓名就能快速查號碼——這就是它的核心:“鍵”定位,“值”存儲,分工明確。
AI領域里,鍵值記憶早已是標配:ChatGPT等大模型的Transformer架構、檢索增強生成(RAG)技術,核心都是鍵值配對。它的優勢,源于對傳統記憶模型短板的突破。
傳統自聯想記憶(Auto-Associative Memory)(如圖1左圖所示),可以追溯到神經科學先驅約翰·霍普菲爾德在上世紀提出的Hopfield網絡。在這個模型中,記憶以整體模式的形式被存儲:只要給定一個不完整或帶噪聲的輸入,網絡就會自動“收斂”到最接近的完整記憶。這種機制就像把照片和名字寫在同一張紙上——回憶時需要同時還原整個內容,因此一旦信息變多或彼此相似,就容易混淆或出錯。
而鍵值記憶將“定位”和“存儲”分開:“鍵”只負責找位置,“值”只負責存內容,像書的目錄(鍵)和正文(值),各司其職、互不干擾。以回憶過程為例,只需要給模型一個輕量的Key,而不是一個全量的內容,就能實現Key到Value的查找。
鍵值記憶的流程只有兩步,和查字典、找通訊錄完全一致:
1. 寫入記憶:將“鍵”和“值”綁定存入系統(比如記單詞時,拼寫是鍵、中文意思是值);
2. 讀取記憶:用“查詢線索”匹配鍵,提取對應的值(比如看到單詞拼寫,提取中文意思)。
![]()
圖 1:自聯想記憶與鍵值記憶的結構對比(作者繪制),前者通過整體模式匹配進行記憶恢復,后者將記憶拆分為“鍵”(用于定位)與“值”(用于存儲),實現解耦檢索。
神奇的是,Transformer、多層感知機(MLP)乃至人類大腦,都是這套流程的不同實現——這正是論文最核心的發現:人工與自然智能,記憶底層邏輯高度一致。
二、大腦的“鍵值分工”:
海馬體是“索引員”,新皮層是“倉庫管理員”
人類大腦本身就是一套天然的鍵值記憶架構,論文通過大量實驗,明確了兩個核心腦區的分工:海馬體負責“鍵”,新皮層負責“值”。
簡單認識兩個腦區:海馬體是“記憶之門”,體積小但關鍵,受損會導致無法形成新記憶;新皮層是“記憶倉庫”,占大腦大部分體積,存儲常識、技能、感官體驗等。
過去科學家只知兩者分工不同,卻不懂協同邏輯。直到1995年O’Reilly等人的工作[1]發表,人們才認識到:海馬體不存具體內容,只編“索引”(鍵);新皮層不負責定位,只存“內容”(值)。
比如第一次去某一家特別的餐廳,海馬體編碼“鍵”——位置、裝修、同行的人;新皮層存儲“值”——味道、心情。后來看到相似裝修(查詢線索),海馬體匹配鍵,從新皮層提取值,完整記憶就浮現了。
![]()
圖 2:大腦中海馬體和皮層的位置示意圖,藍色彎曲狀的區域即為海馬體圖源[1]
論文基于大量經典認知神經科學實驗,建立了海馬體編碼鍵、新皮層存儲值的分工框架。其中兩組實驗證據[2][3]最直接、可重復性最強:
實驗1:記憶并未消失,而是會隨時間發生泛化,并可被線索重新精確化
為了檢驗記憶是在消失,還是在變得難以精確提取,研究者設計了經典的情境恐懼實驗。大鼠在環境A中經歷電擊后,會形成情境特異性恐懼記憶。
在短期測試中,這種記憶表現得非常精確:大鼠能區分高度相似的環境B和完全不同的環境C,只在A表現出明顯恐懼反應。但隨著時間推移,這種精確性下降——大鼠開始對相似環境B也產生恐懼反應,表現出明顯的“記憶泛化”。
關鍵發現是,這種變模糊的記憶并非真正丟失。當研究者只提供一個簡單線索(例如將大鼠短暫帶回環境A進行提示)后,大鼠對A與B的區分能力可以恢復,重新表現出對A的特異性恐懼反應。
這一結果表明:記憶內容本身仍然存在,只是隨著時間推移,檢索過程變得不穩定,導致提取結果變得泛化;而合適的線索可以重新激活原本精確的記憶,使其“從模糊回到清晰”。
![]()
圖 3:小鼠情境恐懼實驗流程圖[4]。大鼠在環境A形成恐懼記憶,短期內可區分相似環境B與不同環境C,但隨時間出現泛化;通過回到A進行提示后,記憶可重新恢復精確性。
實驗 2:海馬體通過拉開相似記憶的表征來減少混淆,實現索引分離
為了理解大腦如何區分高度相似的記憶,研究者讓大鼠學習兩條高度重疊的迷宮路線(約80%路徑相同),并要求它們準確區分不同路線以獲得食物獎勵。
在學習初期,由于兩條路線高度相似,大鼠容易混淆,對應的神經活動模式也彼此接近。隨著學習深入,海馬體中的表征逐漸發生變化:即使在重疊路段,兩條路線的神經活動模式也被明顯拉開,相似度持續下降。這種變化與行為表現直接相關——表征分離越明顯,大鼠的區分準確率也越高。
相比之下,新皮層中的表征始終保持較高相似性,更穩定地反映路線本身的視覺與空間特征,并不會主動放大差異。
這說明,在面對相似記憶時,大腦并不是單純依賴存儲內容來區分,而是通過海馬體提高不同記憶之間的區分度,減少檢索時的相互干擾。相對而言,新皮層更專注于保持內容本身的穩定與完整。
從這個角度看,兩者形成了一種分工:一側負責把相似記憶區分開,另一側負責把內容盡可能準確地保留下來。這種分工方式,與鍵值記憶中定位與存儲分離的思路是相契合的。
三、我們到底為什么會“遺忘”?
從鍵值記憶的視角來看,遺忘不再被簡單理解為記憶內容的逐漸消失。相關研究(如Berens et al.[4]提出,記憶表現下降往往可以拆解為兩個維度:能否被提取,以及提取是否精確。很多情況下,大腦記憶一旦存儲,就長時間保存在新皮層,不會被擦除;遺忘本質是海馬體的“鍵”失效,找不到索引,無法提取內容。
這一觀點與“鍵值記憶”框架形成了直接對應關系:如果將記憶內容視為“值”,將檢索線索視為“鍵”,那么遺忘更可能發生在“鍵”失效或匹配困難的環節,而不是“值”本身被刪除。在這一假說下,一個自然的問題是:這種“檢索失敗”是否能夠在行為實驗中被觀察到。為此,研究者設計了兩類經典實驗。
第一類實驗關注時間對記憶表現的影響。受試者需要記憶屏幕上目標出現的位置,并在不同時間間隔后進行回憶測試。結果顯示:隨著時間延長,能夠成功回憶的人數下降,但只要能夠回憶,他們報告坐標的精度與第一天毫無差別。這說明記憶內容(值)始終清晰,變弱的是海馬體的索引能力(鍵)——時間久了,線索匹配效率下降,導致“搜不到”而非“記錯了”。
第二類實驗則考察干擾的作用。受試者依次學習多組單詞列表,并在最后回憶其中某一組。結果發現,被遺忘程度主要取決于該組內部信息的復雜度,而與后續學習內容的長度關系不大。這意味著遺忘并非“新記憶覆蓋舊記憶”,而是相似記憶的索引互相競爭、互相干擾,導致檢索失敗。
四:AI的“遺忘”,能被“喚醒”
有趣的是,鍵值記憶框架也為理解AI的“災難性遺忘”提供了新視角。
在傳統機器學習的解釋中,當模型先學習識別“貓”,再學習識別“狗”時,“貓”的知識被新任務“覆蓋刪除”了。但在這篇論文所提出的框架下,可以從另一種角度理解這一過程:模型并非完全“忘記”了貓的知識,而是在參數空間中仍然保留相關信息的情況下,后續學習的表征在推理時占據了更強的激活優勢,從而在檢索階段抑制了舊任務的輸出。這與鍵值記憶中“內容仍在,但索引競爭導致無法順利提取”的機制具有一定形式上的相似性。
這種視角也與人類記憶中的一些現象形成呼應。例如,在日常體驗中,我們常常會出現“明明知道但一時想不起來”的情況。這類現象通常被解釋為信息并未丟失,而是在提取過程中受到干擾或索引路徑暫時失效。不過需要強調的是,人類記憶系統依賴海馬體與新皮層的協同結構,而當前人工神經網絡是單一參數系統,兩者在實現機制上并不相同。
盡管如此,這種“現象相似但機制不同”的對應關系,為理解不同智能系統中的記憶可及性問題提供了一種統一的描述語言。
在機器學習研究中,類似的現象也在標準的連續學習(continual learning)設置中被反復觀察。例如多任務學習MLP實驗:任務1識別MNIST手寫數字(0和1),準確率達99%;任務2識別FashionMNIST服飾(T恤和褲子),準確率達95%,不做任何抗遺忘處理。結果表明:任務2訓練后,任務1準確率從99%暴跌到9%,復現“災難性遺忘”。但推理時放大任務1的“鍵值對”分量(模擬激光激活大腦沉默記憶),無需重新訓練,準確率隨放大系數回升,最終回到99%。這類現象進一步提示,“遺忘”在許多情況下更接近于檢索競爭,而非信息徹底消失。
![]()
圖 4:連續學習中的遺忘與再激活 [5]。模型在先后學習任務1(MNIST)與任務2(FashionMNIST)后,任務1性能顯著下降,但通過增強對應任務的激活路徑,可部分恢復其輸出能力。
這證明:任務1的記憶沒被擦掉,只是被干擾成“沉默記憶”,放大鍵值分量就能喚醒——和人類的遺忘與喚醒,邏輯完全一致。
五、結語:人工與自然智能的“記憶共鳴”
這篇論文的核心貢獻,并不在于提出某種新的工程方法,而在于提供了一種統一的解釋框架——用鍵值記憶的視角,將腦科學、認知心理學與機器學習中的記憶機制聯系起來,使“信息如何被存儲與檢索”這一問題可以在同一抽象層面被討論。
需要指出的是,鍵值記憶仍是一種計算層面的建模工具,更適合作為解釋框架,而非對大腦機制的最終定論。大腦記憶系統涉及多腦區協同與多尺度動態過程,其復雜性遠超過簡單的“鍵—值”二分結構。因此,這一框架的意義不在于宣稱“大腦等同于某種計算模型”,而在于提供了一種跨領域可對話的概念語言,使不同學科能夠在同一抽象層面討論記憶問題。
在這一框架下,一些現象獲得了更統一的理解:無論是人類記憶中的“暫時想不起來”,還是機器學習中的災難性遺忘,都可以被看作是檢索過程受阻或競爭增強的結果,而非信息完全消失。這一視角也為人工智能提供了啟發:通過引入類似“索引與內容分離”的結構設計,或增強特定路徑的選擇性激活,有望提升模型在連續學習中的穩定性。
從更宏觀來看,這種跨領域對照并不是結論,而是一種起點。它提示我們,當人工智能與神經科學在同一概念框架下對齊時,既可能加深對大腦的理解,也可能推動更具持續學習能力的人工系統設計。
感興趣可查看論文官方代碼倉庫(https://github.com/kazuki-irie/kv-memory-brain),親身體驗鍵值記憶的魅力——了解AI的記憶邏輯,也是在了解我們自己的大腦。
參考資料
[1]McClelland, J.L., McNaughton, B.L., and O’Reilly, R.C. (1995). Why there are complementary learning systems in the hippocampus and neocortex: insights from the successes and failures of connectionist models of learning and memory. Psychol. Rev. 102, 419–457. https://doi.org/10. 1037/0033-295X.102.3.419.
[2]Wiltgen, B.J., Zhou, M., Cai, Y., Balaji, J., Karlsson, M.G., Parivash, S.N., Li, W., and Silva, A.J. (2010). The hippocampus plays a selective role in the retrieval of detailed contextual memories. Curr. Biol. 20, 13361344. https://doi.org/10.1016/j.cub.2010.06.068
[3]Chanales, A.J.H., Oza, A., Favila, S.E., and Kuhl, B.A. (2017). Overlap among spatial memories triggers repulsion of hippocampal representations. Curr. Biol. 27, 2307–2317.e5. https://doi.org/10.1016/j.cub.2017. 06.057.
[4]Gutiérrez B J, Shu Y, Gu Y, et al. HippoRAG: Neurobiologically Inspired Long-Term Memory for Large Language Models[J]. arXiv preprint arXiv:2405.14831, 2025.
[5]Gershman et al., Key-value memory in the brain, Neuron (2025), https://doi.org/10.1016/j.neuron.2025.02.029
[6]Berens, S.C., Richards, B.A., and Horner, A.J. (2020). Dissociating memory accessibility and precision in forgetting. Nat. Hum. Behav. 4, 866–877. https://doi.org/10.1038/s41562-020-0888-8.
[7]Wiltgen, B.J., Zhou, M., Cai, Y., Balaji, J., Karlsson, M.G., Parivash, S.N., Li, W., and Silva, A.J. (2010). The hippocampus plays a selective role in the retrieval of detailed contextual memories. Curr. Biol. 20, 13361344. https://doi.org/10.1016/j.cub.2010.06.068
[8]Chanales, A.J.H., Oza, A., Favila, S.E., and Kuhl, B.A. (2017). Overlap among spatial memories triggers repulsion of hippocampal representations. Curr. Biol. 27, 2307–2317.e5. https://doi.org/10.1016/j.cub.2017. 06.057.
[9]Berens, S.C., Richards, B.A., and Horner, A.J. (2020). Dissociating memory accessibility and precision in forgetting. Nat. Hum. Behav. 4, 866–877. https://doi.org/10.1038/s41562-020-0888-8.
作者:賈梓杏 中山大學物理與天文學院CIBR吉妮實驗室實習生 審核:張江 北京師范大學系統科學學院教授 出品:中國科協科普部 監制:中國科學技術出版社有限公司、北京中科星河文化傳媒有限公司
![]()
NeuroAI讀書會
神經科學和人工智能領域的多位著名學者近日發表 NeuroAI 白皮書認為,神經科學長期以來一直是推動人工智能(AI)發展的重要驅動力,NeuroAI 領域的基礎研究將推動下一代人工智能的進程。文章發表后引發熱議:神經科學是否推動了人工智能?未來的人工智能是否需要神經科學?
本著促進神經科學、計算機科學、認知科學和腦科學等不同領域的學術工作者的交流與合作,集智俱樂部聯合北京師范大學柳昀哲、北京大學鮑平磊和昌平實驗室呂柄江三位研究員共同發起了,聚焦在視覺、語言和學習領域中神經科學與人工智能的相關研究,期待能夠架起神經科學與人工智能領域的合作橋梁,激發跨學科的學術火花。讀書會已完結,現在報名可加入社群并解鎖回放視頻權限。
詳情請見:
1.
2.
3.
4.
5.
6.
7.
8.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.