![]()
“現在大部分AI,都是“金魚”記憶。
“你記不記得我昨天說的那個項目?”
每天,大量的用戶向ChatGPT、Claude、Gemini拋出這個問題,然后收獲一個禮貌而陌生的回答:“我沒有之前對話的記憶,可以提供更多信息嗎?”
AI的智商在飆升——OpenAI的模型在數學競賽中屢創佳績,Google的Gemini能一口氣讀完長文檔。但在這個關于“記得你”的最基本問題上,AI像個金魚。
這是個笑話,也是個信號。當整個行業都在比拼“誰更聰明”時,一個被忽視的真相正在浮出水面:推理能力正在被快速攻克,而記憶才是真正的瓶頸。2025年12月,OpenAI CEO薩姆·奧爾特曼在采訪中直言,AI的下一大步將來自“無限記憶”——能夠長期記住用戶、偏好和過往互動的能力。他坦言,當前的AI記憶功能“依然非常原始、非常早期”。
大多數AI都是“金魚”?
主流大模型的設計存在一個根本性的缺陷:每次對話都是獨立的。模型處理完當前請求后,不會保留任何關于這次交互的信息。下次你再打開對話框,它就像第一次見你一樣——不記得你的名字、你的偏好、你三小時前說的關鍵信息。
這不是某個產品的疏忽,而是整個技術范式的結構性缺陷。當前主流大模型采用的Transformer架構天生缺乏真正的“長期記憶”模塊,所有信息都必須在有限長度的上下文窗口中一次性提供。
Gartner在2026年的報告中指出,至少50%的生成式AI項目在概念驗證后即被放棄,原因包括數據質量低下、風險控制不足、成本攀升或商業價值不清晰。這背后反映的正是數據基礎和治理能力跟不上AI模型迭代速度的深層問題。
“回憶”不等于“記憶”
問題擺在那里,解法也在分化。
2025年至2026年,一個全新的技術方向正在成形——“AI記憶層”(AI Memory Layer)。這些項目的核心理念很簡單:給AI配一個專屬的“記憶芯片”,讓它能夠跨對話、跨場景地記住、學習和成長。
從技術路徑上看,當前市場呈現幾個不同的探索方向:
第一類:外掛記憶層。以Mem0、Zep等為代表,它們作為獨立的記憶服務運行在AI模型之外。當你跟AI對話時,這個系統會自動提取關鍵信息——你的名字、職業、偏好、說過的重要事情——存儲起來,下次你再提起時,它能把這些記憶“喂”給AI。根據官方數據,Mem0項目在GitHub上已獲得約41000顆星,Python包下載量超1400萬次。AWS也選擇Mem0作為其新Agent SDK的AI記憶提供商。
![]()
圖示:Mem0記憶層在AWS數據流中的位置
第二類:架構級革新。更具顛覆性的是直接在模型內部重構“記憶”模塊。2026年1月,DeepSeek發表了關于“Engram”模塊的論文,提出“查—算分離”架構——將事實性記憶從神經網絡計算中剝離,轉向確定性的高效查找。據論文所述,在處理2萬字以上長文本時,推理延遲降低62%,同時保持98.7%的語義一致性。這一技術將MoE(混合專家模型)專注的復雜組合推理與靜態記憶的常數時間O(1)查找相分離。
大模型上的“記憶檢索”架構實踐時間尚短,能否在實踐中落地并經受住考驗仍有待觀察。
當AI真的記住你
體驗的代差正在形成
理論講完了,我們來聊聊體驗——這才是用戶真正關心的。
想象兩個場景:
場景A:你打開AI,像往常一樣說“幫我寫個方案”。它問:“請問是關于什么項目的?”你答:“上次說的那個電商平臺。”它又問:“你能再提供一些背景信息嗎?我不記得了。”你嘆了口氣,開始重新錄入需求清單。
場景B:你打開AI,它主動問候:“早安,上次那個電商平臺的方案進展如何?需要我續寫第三章的數據分析部分嗎?”
這不是科幻。2025年4月,OpenAI將ChatGPT的記憶功能升級為可參考全部歷史對話的長期記憶系統,能跨對話保留用戶偏好、工作內容與常用格式。Google也為Gemini上線了“個人智能”功能,可經用戶授權后調取Gmail、Google Photos等個人數據,實現跨應用的語境理解。xAI則于2025年4月引入了長期記憶能力,Anthropic于同年8月加入了對過往對話的Recall功能。
但這場記憶競賽才剛起步。人類所有的公開數據可能都會被大模型用完,后期AI很大的一個方向會是下沉到每個人身邊,實現個性化,記憶這件事情就變得非常重要。
記憶能帶來多大的提升?
+26%準確率vs91%更快響應
Mem0在官方博客和GitHub頁面中公布了一系列基準測試數據,將其記憶方案與兩種替代方案進行對比:
![]()
數據來源:Mem0官方README及研究摘要
最值得關注的是第一個數字——對OpenAI原生記憶的性能超越。當一個“外掛”記憶層能夠比AI模型自帶的原生記憶更準確地回憶信息時,這本身就說明:當前主流AI的記憶能力還遠未成熟。獨立基準測試機構Cognee的對比研究顯示,不同記憶方案在同樣的LOCOMO數據集上表現存在顯著差異,且小規模測試中結果波動較大。
但這場記憶競賽真正的價值或許不在benchmark分數本身。在醫療、金融、法律等高風險領域,一個記錯關鍵信息的AI帶來的代價,不會是“準確率低了幾個百分點”這么簡單位的一句話。
當然,記憶也不是萬能藥
記憶技術正受到產業界和學術界的密切關注,但這條路上仍有幾個核心挑戰尚未解決。
記憶污染與遺忘。如果AI記住了錯誤信息,如何修正?更重要的是,當注入大量新知識時,模型可能“覆蓋”舊記憶——這在學術界被稱為“災難性遺忘”。如何在學習新內容的同時保留舊記憶,仍是前沿研究方向之一。
隱私悖論。AI“記住你”的能力越強,隱私風險就越大。你的偏好、習慣、弱點都可能被記錄。Gartner預測,到2027年,超過40%的AI相關數據泄露將由跨境不當使用生成式AI造成。有學者提出“數據下毒”等保護性策略,但這些措施是否能投入實際應用仍有待觀察。Gartner預計,到2026年,應用AI信任、風險和安全管理(AI TRiSM)控制措施的企業將減少至少50%的不準確或非法信息攝入。
評測標準之爭。記憶系統的評測本身也充滿爭議。比如,有人質疑Mem0的基準測試存在“數據造假”“毫無意義的測試”,這一行業事件凸顯了記憶系統評估方法論的混亂。如果連“哪個記憶系統更好”都無法達成共識,那么整個產業走向標準化和成熟還需要時間。
更深層的問題是:當AI真的能記住一切,人類還愿意跟它對話嗎?
記憶正在成為AI的下一個戰場
回望AI發展的編年史,每個階段都有不同的主角。
第一階段是“算力”:英偉達的GPU成為硬通貨。第二階段是“模型”:OpenAI、Google、Anthropic圍繞參數量的競賽尚未結束。第三階段,我們正在進入——記憶。
這不是說推理不重要。推理是AI的智商,記憶是AI的經驗。一個只有智商沒有經驗的AI,像個天才兒童——聰慧但不可靠。一個既有智商又有經驗的AI,才是真正可靠的專家。
奧爾特曼坦言,當前的AI記憶仍處于“GPT-2時代”——言下之意是,它離真正的成熟還有好幾個代際的差距。誰能在“記憶”這個點上實現突破,誰就可能定義下一代AI的形態——不是更聰明的AI,而是更懂你的AI。
而對于用戶來說,真正的變革或許不是AI能做多難的數學題,而是它能否在你開口之前,就知道你要說什么。
畢竟,我們需要的不是一個每次都要重新認識的陌生人,而是一個陪伴我們、理解我們、記住我們的——伙伴。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.