網易首頁 > 網易號 > 正文申請入駐

AI最重要的能力，不是推理，而是記憶？

2026-05-12 18:55:17　來源: 數據猿DataYuan

內蒙古舉報

分享至

“現在大部分AI，都是“金魚”記憶。

“你記不記得我昨天說的那個項目？”

每天，大量的用戶向ChatGPT、Claude、Gemini拋出這個問題，然后收獲一個禮貌而陌生的回答：“我沒有之前對話的記憶，可以提供更多信息嗎？”

AI的智商在飆升——OpenAI的模型在數學競賽中屢創佳績，Google的Gemini能一口氣讀完長文檔。但在這個關于“記得你”的最基本問題上，AI像個金魚。

這是個笑話，也是個信號。當整個行業都在比拼“誰更聰明”時，一個被忽視的真相正在浮出水面：推理能力正在被快速攻克，而記憶才是真正的瓶頸。2025年12月，OpenAI CEO薩姆·奧爾特曼在采訪中直言，AI的下一大步將來自“無限記憶”——能夠長期記住用戶、偏好和過往互動的能力。他坦言，當前的AI記憶功能“依然非常原始、非常早期”。

大多數AI都是“金魚”？

主流大模型的設計存在一個根本性的缺陷：每次對話都是獨立的。模型處理完當前請求后，不會保留任何關于這次交互的信息。下次你再打開對話框，它就像第一次見你一樣——不記得你的名字、你的偏好、你三小時前說的關鍵信息。

這不是某個產品的疏忽，而是整個技術范式的結構性缺陷。當前主流大模型采用的Transformer架構天生缺乏真正的“長期記憶”模塊，所有信息都必須在有限長度的上下文窗口中一次性提供。

Gartner在2026年的報告中指出，至少50%的生成式AI項目在概念驗證后即被放棄，原因包括數據質量低下、風險控制不足、成本攀升或商業價值不清晰。這背后反映的正是數據基礎和治理能力跟不上AI模型迭代速度的深層問題。

“回憶”不等于“記憶”

問題擺在那里，解法也在分化。

2025年至2026年，一個全新的技術方向正在成形——“AI記憶層”（AI Memory Layer）。這些項目的核心理念很簡單：給AI配一個專屬的“記憶芯片”，讓它能夠跨對話、跨場景地記住、學習和成長。

從技術路徑上看，當前市場呈現幾個不同的探索方向：

第一類：外掛記憶層。以Mem0、Zep等為代表，它們作為獨立的記憶服務運行在AI模型之外。當你跟AI對話時，這個系統會自動提取關鍵信息——你的名字、職業、偏好、說過的重要事情——存儲起來，下次你再提起時，它能把這些記憶“喂”給AI。根據官方數據，Mem0項目在GitHub上已獲得約41000顆星，Python包下載量超1400萬次。AWS也選擇Mem0作為其新Agent SDK的AI記憶提供商。

圖示：Mem0記憶層在AWS數據流中的位置

第二類：架構級革新。更具顛覆性的是直接在模型內部重構“記憶”模塊。2026年1月，DeepSeek發表了關于“Engram”模塊的論文，提出“查—算分離”架構——將事實性記憶從神經網絡計算中剝離，轉向確定性的高效查找。據論文所述，在處理2萬字以上長文本時，推理延遲降低62%，同時保持98.7%的語義一致性。這一技術將MoE（混合專家模型）專注的復雜組合推理與靜態記憶的常數時間O(1)查找相分離。

大模型上的“記憶檢索”架構實踐時間尚短，能否在實踐中落地并經受住考驗仍有待觀察。

當AI真的記住你

體驗的代差正在形成

理論講完了，我們來聊聊體驗——這才是用戶真正關心的。

想象兩個場景：

場景A：你打開AI，像往常一樣說“幫我寫個方案”。它問：“請問是關于什么項目的？”你答：“上次說的那個電商平臺。”它又問：“你能再提供一些背景信息嗎？我不記得了。”你嘆了口氣，開始重新錄入需求清單。

場景B：你打開AI，它主動問候：“早安，上次那個電商平臺的方案進展如何？需要我續寫第三章的數據分析部分嗎？”

這不是科幻。2025年4月，OpenAI將ChatGPT的記憶功能升級為可參考全部歷史對話的長期記憶系統，能跨對話保留用戶偏好、工作內容與常用格式。Google也為Gemini上線了“個人智能”功能，可經用戶授權后調取Gmail、Google Photos等個人數據，實現跨應用的語境理解。xAI則于2025年4月引入了長期記憶能力，Anthropic于同年8月加入了對過往對話的Recall功能。

但這場記憶競賽才剛起步。人類所有的公開數據可能都會被大模型用完，后期AI很大的一個方向會是下沉到每個人身邊，實現個性化，記憶這件事情就變得非常重要。

記憶能帶來多大的提升？

+26%準確率vs91%更快響應

Mem0在官方博客和GitHub頁面中公布了一系列基準測試數據，將其記憶方案與兩種替代方案進行對比：

數據來源：Mem0官方README及研究摘要

最值得關注的是第一個數字——對OpenAI原生記憶的性能超越。當一個“外掛”記憶層能夠比AI模型自帶的原生記憶更準確地回憶信息時，這本身就說明：當前主流AI的記憶能力還遠未成熟。獨立基準測試機構Cognee的對比研究顯示，不同記憶方案在同樣的LOCOMO數據集上表現存在顯著差異，且小規模測試中結果波動較大。

但這場記憶競賽真正的價值或許不在benchmark分數本身。在醫療、金融、法律等高風險領域，一個記錯關鍵信息的AI帶來的代價，不會是“準確率低了幾個百分點”這么簡單位的一句話。

當然，記憶也不是萬能藥

記憶技術正受到產業界和學術界的密切關注，但這條路上仍有幾個核心挑戰尚未解決。

記憶污染與遺忘。如果AI記住了錯誤信息，如何修正？更重要的是，當注入大量新知識時，模型可能“覆蓋”舊記憶——這在學術界被稱為“災難性遺忘”。如何在學習新內容的同時保留舊記憶，仍是前沿研究方向之一。

隱私悖論。AI“記住你”的能力越強，隱私風險就越大。你的偏好、習慣、弱點都可能被記錄。Gartner預測，到2027年，超過40%的AI相關數據泄露將由跨境不當使用生成式AI造成。有學者提出“數據下毒”等保護性策略，但這些措施是否能投入實際應用仍有待觀察。Gartner預計，到2026年，應用AI信任、風險和安全管理（AI TRiSM）控制措施的企業將減少至少50%的不準確或非法信息攝入。

評測標準之爭。記憶系統的評測本身也充滿爭議。比如，有人質疑Mem0的基準測試存在“數據造假”“毫無意義的測試”，這一行業事件凸顯了記憶系統評估方法論的混亂。如果連“哪個記憶系統更好”都無法達成共識，那么整個產業走向標準化和成熟還需要時間。

更深層的問題是：當AI真的能記住一切，人類還愿意跟它對話嗎？

記憶正在成為AI的下一個戰場

回望AI發展的編年史，每個階段都有不同的主角。

第一階段是“算力”：英偉達的GPU成為硬通貨。第二階段是“模型”：OpenAI、Google、Anthropic圍繞參數量的競賽尚未結束。第三階段，我們正在進入——記憶。

這不是說推理不重要。推理是AI的智商，記憶是AI的經驗。一個只有智商沒有經驗的AI，像個天才兒童——聰慧但不可靠。一個既有智商又有經驗的AI，才是真正可靠的專家。

奧爾特曼坦言，當前的AI記憶仍處于“GPT-2時代”——言下之意是，它離真正的成熟還有好幾個代際的差距。誰能在“記憶”這個點上實現突破，誰就可能定義下一代AI的形態——不是更聰明的AI，而是更懂你的AI。

而對于用戶來說，真正的變革或許不是AI能做多難的數學題，而是它能否在你開口之前，就知道你要說什么。

畢竟，我們需要的不是一個每次都要重新認識的陌生人，而是一個陪伴我們、理解我們、記住我們的——伙伴。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.