網易首頁 > 網易號 > 正文申請入駐

三分天下：為什么Agent Memory框架是死路

2026-04-19 21:41:15　來源: 老馮云數

北京舉報

分享至

幾個月前，老馮寫過一篇。那篇文章里我做了個判斷：Agent 基礎設施的下一場熱鬧會發生在“記憶”這個方向，圍繞著“Agent 該怎么記住東西”會冒出一大批創業公司和開源項目，資本會涌進來，架構圖會畫得越來越花。

果不其然，Mem0 又融了一輪，MemGPT 改名 Letta 繼續融，Zep、Cognee、Hindsight、MemoryScope、Memobase、SuperMemory、Graphiti、LangMem、EverMemOS——一抓一大把。

每家的技術博客上都掛著差不多的架構圖：底下一個 episodic 層，中間一個 semantic 層，頂上一個 reflection 或 procedural 層，層與層之間箭頭來回穿梭，寫著 consolidation、retrieval、forgetting。GitHub star 在漲，arXiv 論文在刷榜，技術大會每場都有一個 Agent Memory 的 track。熱鬧是真的熱鬧。

但這次我想潑個冷水： 這條賽道火歸火，但也許兩年后就不存在了 。

這不是論證，而是直覺。但這句話得先說清楚，我不是說 Agent 不需要記憶——恰恰相反，記憶是整場 Agent 革命里最重的籌碼，是終局壁壘所在。我說的是： Agent 需要記憶，但不需要今天這種被稱作“Memory 框架”的東西 。

這兩句話聽起來像同一件事，其實差兩個字，差一條賽道的生死。

下面講講為什么 —— 當然，這只是老馮的個人觀點。

一、終局是三分天下

要看清今天的賽道，得先把終局畫出來。

這里先交代一句：下面說的“終局”指的是 嚴肅的企業級 Agent，以及任何把數據當成核心資產的組織與個人 。消費端也許另一幅圖景——普通用戶用一個 ChatGPT、一個 Gemini，廠商順手把記憶也做了。

老馮對 AI Agent 的終局判斷很簡單 —— 三分天下 。一個成熟的 Agent，在終局狀態下，大體就是這樣一副架子：

DB_URL=postgres://user:pass@host:5432/memory

一個 URL 提供智力，一個 URL 提供記憶，中間由 Harness 負責把模型套起來、駕馭它去完成具體任務——加載 Skills、組織 context、調用工具、處理循環。想換模型廠商？換 MODEL_URL。想把數據遷到別家？換 DB_URL。想本地自建？兩個都換成 localhost。三層徹底解耦：智力層由模型廠商提供，記憶層由數據庫廠商提供， 駕馭執行的那一層由 Harness 承擔 ——Claude Code、Cursor、Devin 這些今天還在爆發式演化的產品，本質上都是 Harness。

這套格局不是架構師一廂情愿的設計品味，它背后有一套很樸素的動力學。

終局里真正的壁壘，不在算力，也不在模型。算力短期關鍵長期攤平，和“永恒的電力壟斷不存在”是一回事。模型中期關鍵長期平權，開源模型一年一個臺階往上追，GPT-5 和 DeepSeek V4 的差距比 GPT-4 時代已經小了一大截。再過兩年，Agent 能用的模型大概率是個豐儉由人的菜市場。真正拿得住的壁壘只有一樣—— 私有數據 。

而嚴肅的企業用戶不會允許自己的核心數據被“一鍋端”，也不會允許它和別家的數據無序混在同一個服務商的黑箱里。一旦被鎖住，這家服務商對你就有永恒的議價權——過去三十年從數據庫到云的采購史，都是這條邏輯寫的。于是博弈的終點就是上面那副架子—— 模型廠商管智能，Harness 管駕馭執行，數據庫廠商管記憶 ，三方互不吞并、互相制衡。

三分天下的圖畫完了—— 模型、Harness、數據庫，各自獨立，各自為王 。

現在可以回頭問那個關鍵問題：今天市面上這些 Memory 框架，坐在哪一塊上？

二、Memory 框架是什么？

先對 Memory 框架做一次顆粒度區分，免得一竿子打翻一船人。

今天被塞進“Memory 框架”這個筐里的項目，其實不是同一種東西，大致可以分成四類，每一類的命運不一樣。

第一類，數據庫套殼 SDK 。代表是早期的 Mem0、LangMem、MemoryScope、SuperMemory 這一批。它們的核心能力就是在一個數據庫（通常是 PG+pgvector 或 SQLite）上封裝一套“extract / store / retrieve / update”的 API，把 episodic 和 semantic 分兩張表，加幾條重要性打分和時間衰減規則。這一類離“數據庫薄薄一層皮”這個描述最貼切， 技術上沒有壁壘，產品上有一點用戶心智 。

第二類，知識圖譜 / 時序圖譜構建器 。代表是 Graphiti、Cognee、Hindsight。它們做的事比第一類要重一些——bi-temporal knowledge graph、增量實體消歧、沖突檢測與失效、hybrid 檢索（語義 + 關鍵詞 + 圖遍歷）。這類項目的策略層確實有工程含量，不是“幾條 SQL”能一筆帶過的。但它們的命運是—— 策略層會被模型吸收（模型自己會做實體消歧、沖突判斷），存儲層會歸回數據庫（圖能力通過 PG 擴展或專用圖數據庫承載），獨立賽道依然不成立 。

第三類，Agent Runtime / Agent OS 。代表是 Letta/MemGPT。它們做的根本不是 Memory 框架該做的事——把 context window 當 RAM、把外部存儲當 Disk、讓模型自己通過 tool call 在兩者之間 swap——這是操作系統意義上的虛擬內存管理。它門檻不低，但它的準確名字是 Agent Runtime ，是 Harness 下位的執行引擎層。其實，它應該歸到 Runtime / Harness 賽道，不是 Memory 賽道。

第一類會被 Skill + 模型自己寫 SQL 直接替代；第二類的策略層會被模型吸收，存儲層會歸回數據庫；

三、它沒有壁壘

回到第一類（數據庫套殼 SDK）——這一類占了市面上的大多數，也是這篇文章主要的打擊對象。

把它們拆到最細，干的事情就兩件： 替 Agent 設計幾張表的 schema，替 Agent 封裝幾條 SQL 。

所謂 episodic 和 semantic 分表，是 schema 設計。所謂重要性打分、時間衰減、反思壓縮，是寫入時跑的幾段規則。所謂向量召回加 BM25 加 cross-encoder 重排加 RRF 融合，是查詢組合。所有 PR 稿的術語、所有類腦箭頭圖剝掉，底下就是 建表和 SQL 。

建表和 SQL 有壁壘嗎？這是程序員第一周就會的東西。那框架憑什么值錢？憑它們“替 Agent 想好了該怎么建表、怎么寫查詢”。

那“替 Agent 想好”這件事，值多少？

老馮前陣子琢磨過這個——用 PG 加幾個擴展加一組存儲過程，把 Mem0 干的事從頭糊一遍，幾天夠了。最后沒做。為什么沒做？ 沒意思，沒壁壘 。任何一個懂點 PG 的工程師，周末抽一下午就能寫出個基礎版 Mem0，功能上九成相似。剩下那一成是 UI、是 SaaS 控制臺、是發布節奏、是開發者關系——那是運營和產品的壁壘，不是技術壁壘。

那“教會 Agent 怎么用這套東西”又要多少？ 一個 Skill，一張 markdown 。

幾百個 token 的一段指令，告訴模型“你有一個 PostgreSQL 數據庫連接在 DATABASE_URL，用戶說話時你自己判斷哪些事實值得存，每次回答前做向量加全文的混合檢索，發現新舊沖突就 UPDATE 舊的”——就這樣。Mem0 那套 ADD / UPDATE / DELETE / NOOP 流水線、Cognee 的圖譜構建、Graphiti 的時序圖——這些“認知架構”能做的事，現在的模型自己寫 SQL 就能做到，而且寫得比你干凈。

Claude 的 Skills 機制已經把這條路走通一半。用戶寫個 memory-skill.md，描述清楚“記憶怎么存、怎么查”，Claude 在需要時自動調用，不需要任何外部 Memory 框架。哪天 Anthropic 或 OpenAI 把一個官方 memory skill 作為最佳實踐發出來，這一整批項目從模型側就被架空了。

你以為的護城河，其實是一張寫著幾百字的 markdown 。生產環境里這張 markdown 背后自然會接上受控工具和固化的數據庫 pipeline——但那些位置該歸 Harness 的歸 Harness，該歸數據庫的歸數據庫，依然沒有獨立 Memory 框架的位置。

四、苦澀的教訓

上一節是從產業結構上說 Memory 框架沒位置。再往深一層，從方法論上也有一把刀—— The Bitter Lesson 。

Sutton 2019 年那篇一千多字的博客，講的事很簡單：過去七十年，AI 領域反復上演同一個劇本——研究者把自己對某個領域的精心理解編碼進系統，短期看效果不錯，長期必輸給“讓模型自己學”的通用方法。國際象棋的評估函數輸給搜索，圍棋的棋譜先驗輸給自我對弈，語音識別的音素建模輸給統計方法，CV 的 SIFT 輸給深度學習。每一次，靠“領域理解”的路線都輸了，贏的是看起來“沒有智慧”、只是能吃算力和數據的方法。

這把刀落到 Memory 框架上要小心——它不打所有系統抽象。操作系統、數據庫、編譯器都是人類設計的抽象，它們沒有被端到端學習吃掉，也不會被吃掉，因為它們提供的是可靠的底層積木，不是替 AI 做決策。Sutton 打的是后者。

Memory 框架的問題在于它 站在后者那一邊 。它硬編碼的那些東西——什么信息值得記、記在哪一層、什么時候觸發反思、怎么組合向量和全文——每一項都是“替 Agent 做認知決策”的意見，而不是通用積木（向量存儲、全文檢索、事務、索引這些真正的積木，早就被數據庫提供了）。今天 Agent 需要這些意見，只是因為模型還不夠強；等模型強到能自己判斷——這件事已經在發生——這些手工認知策略會像 SIFT 遇見 AlexNet 那樣，一夜之間變成廢鐵。

產業結構上它沒位置，方法論上它也撐不住。兩條線在這里合攏。

五、真正的壁壘

那什么有壁壘？

三分天下那張圖里，嚴格來說只有兩個位置上的壁壘是確定的，另一塊的壁壘還在成形。

模型那塊 會打血戰。閉源和開源拉鋸、價格一年一腰斬、廠商排名每半年洗一次牌。這塊有壁壘，但壁壘屬于少數幾家頭部模型廠商，且局勢仍在劇烈變動。

Harness 那塊 還沒定型。Claude Code / Codex 現在跑在最前面，但其他的也開始露頭：OpenClaw，Hermes；Letta/MemGPT 那支 Agent Runtime 方向如果真能做成也挺有意思。Harness 這塊今天剛長出些壁壘，又被 Claude Code 開源給掀翻拉平到一個水平線。

剩下那塊—— 數據庫 ——是全局里 確定性最高 的位置。

確定性來自一個結構性事實： 數據庫不在 AI 沖擊的范圍內 。

什么東西會被 AI 沖擊？價值來自“信息加工”的東西——文案、設計、初級編程、法律文書、客服、PPT。它們的本質是把信息 A 映射到信息 B，而 LLM 做的就是這件事。LLM 有多強，它們被壓縮得有多狠。

那什么不在這個前線上？ 物理世界的持久化層 。數據庫干的事情是在真實的磁盤上、通過真實的操作系統和文件系統、對抗真實的斷電和崩潰、在多節點間用真實的網絡達成共識，讓字節在二十年后還能被準確讀回來。這件事的本質不是信息加工，是 物理世界的可靠性保證 。LLM 再聰明變不出一塊磁盤，保證不了 fsync 的語義，也不會代替兩階段提交。

Agent 越強大，它越需要一個可靠的物理世界錨點。Agent 革命不會削弱數據庫的價值， 只會放大它 。

所以三分天下的終局里，模型那塊會打到流血，Harness 那塊還在摸索， 只有數據庫這塊地基，三十年前就定了，三十年后還會在 。

六、數據庫的盡頭是 PG

那具體到記憶層，會是哪個數據庫？

這里要分階段看。

現階段 ——對一個跑在本地的個人 Agent、或者單機場景下的輕量 Agent 來說， SQLite 甚至文件系統也完全夠用 。SQLite 零運維、文件形態、本地跑、原生支持 JSON 和向量擴展，單體 Agent 的記憶需求它完全扛得住。相當多的 Agent 應用在本地持久化上就是直接用 SQLite。這個階段講“記憶層需要 PG”是過度工程。

但往前演化一步——一旦 Agent 需要跨 Agent 協作、跨設備持久化、跨組織可遷移、面對多租戶和并發——也就是需要“通用可遷移的記憶層”——局勢就會收斂。收斂到哪？

PostgreSQL 。

原因有三層。

第一層，事實已經在發生 。相當一部分認真做 Agent 基礎設施的嚴肅項目都在向 PG 或 PG 兼容后端靠攏——Letta 官方支持 PG + pgvector，Hindsight 明確只支持 PG + pgvector，Tiger Data 直接把產品線命名為 Agentic Postgres。這不是 PG 生態自我證明（Supabase、Neon 這種本來就是 PG 家族的不算），是 原本站在其他路線上的項目在往 PG 收斂 。

第二層，線纜協議（Wire Protocol）是事實標準 。PG 協議之于通用記憶層，就像 HTTP 之于應用層——夠老、夠穩、夠通用、夠開放，沒有哪家廠商能擁有它，也沒有哪家廠商能替換它。模型在訓練語料里見過幾百萬次 SQL 和 psql，它天然會說這門語言，不需要額外訓練。私有協議的數據庫在 AI 時代已經輸了一半，因為模型不熟它。

第三層，擴展生態已經把記憶層需要的所有檢索原語覆蓋了 。向量有 pgvector，全文有 tsvector 加 GIN，圖有 AGE 以及新一代基于 PG 的圖擴展，時序有 TimescaleDB，地理有 PostGIS，水平擴展有 Citus。這些都是擴展插進來的，不是重寫整個系統——因為 PG 三十年前就做了個關鍵決定：不替上層預設語義。這是 PG 真正牛逼的地方，三十年后任何新工作負載都能插進來。

所以這條演化路徑是清楚的—— 在“通用可遷移的記憶層”這件事上，除了 PG 協議沒別的選 。圖數據庫、對象存儲、端側 SQLite、專用搜索系統——它們會在各自的專用場景里繼續存在，這不沖突。但在“通用 Agent 記憶”這個場景里，PG 就是那個終局。

SQLite 和 PG 在架構紀律上是一族人——都是通用持久化層、都不預設上層語義、都有幾十年的可靠性積累、都不在 AI 沖擊的前線上、都有靈活的擴展極致。SQLite 是端側和本地場景的 PG，PG 是服務端和協作場景的 SQLite。它們是同一條路上的兩個 size。

真正被三分天下分食掉的，是那種“介于數據庫和應用之間的中間件”——也就是今天的 Memory 框架。

回到三分天下這張圖。模型層在流動，Harness 層在成形，記憶層在沉淀。三塊地盤各自為王，沒有哪一塊是今天“Memory 框架”的位置。它們不是某一方的對手——它們是過渡態下代管了三方工作的中間商，而真空一旦被填滿，中間商就無處可去。

十年后再回望 2026 年這場 Memory 框架喧嘩，會看到一件很平淡的事——那些號稱“給 Agent 設計認知”的框架，最后真正留下來的代碼，是它們最樸素的那一部分： 把數據老老實實塞進 PostgreSQL 的那幾行 SQL 。

其他的，都會被端到端學習吃掉。

數據庫老司機

點一個關注 ??，精彩不迷路

對 PostgreSQL， Pigsty，下云，AI 感興趣的朋友

歡迎加入 PGSQL x Pigsty 交流群 QQ 619377403

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.