一個(gè)好萊塢演員,這周在AI圈干了件大事。
![]()
電影《生化危機(jī)》女主角Alice,《第五元素》里的Leeloo——Milla Jovovich,拍了三十年戲。就是這個(gè)人,開源了一個(gè)AI記憶系統(tǒng),叫MemPalace。
MemPalace發(fā)布到GitHub上,48小時(shí),2萬+star。
![]()
前幾天剛寫完今天又刷到一個(gè)記憶系統(tǒng)。
兩件事說的是同一個(gè)方向:AI的記憶不能被篩掉,不管是"只記錯(cuò)誤"還是"只記結(jié)論",都會(huì)丟掉最重要的部分。
一件事在不同地方被獨(dú)立發(fā)現(xiàn)了。
大模型越來越聰明,但不記得你是誰
我每天用AI。聊業(yè)務(wù)、聊決策、聊判斷。有時(shí)候一個(gè)session聊兩三個(gè)小時(shí),把一件復(fù)雜的事拆得很透徹。然后關(guān)掉窗口。第二天再開,它不記得我是誰了。
就像你雇了一個(gè)普林斯頓博士生,極其聰明,什么都懂。但他有阿爾茨海默癥。
Milla遇到的是同一個(gè)問題,只不過場景更具體。
她在做一個(gè)大型游戲項(xiàng)目,用AI輔助設(shè)計(jì)——世界觀、角色設(shè)定、關(guān)卡邏輯。做著做著她發(fā)現(xiàn),每次開新session,之前的設(shè)計(jì)細(xì)節(jié)全沒了,走過的彎路得重新走,做過的權(quán)衡得重新做。AI每次都在給她一個(gè)"全新的建議",而不是一個(gè)"了解這個(gè)項(xiàng)目的合作者"。
![]()
她想了想,覺得解決記憶這件事,比繼續(xù)做游戲更重要。干脆停掉游戲,專門來解決這個(gè)問題。
不要AI自己決定記什么
Milla不是第一個(gè)想到這件事的人。她去試了Mem0和Zep。這是目前最主流的AI記憶產(chǎn)品,有專業(yè)團(tuán)隊(duì),有融資,在行業(yè)里被廣泛推薦。
用完之后,她發(fā)現(xiàn)兩個(gè)產(chǎn)品有同一個(gè)問題。
這兩個(gè)產(chǎn)品的邏輯是:讓AI自己來判斷什么值得保存。對話結(jié)束后,AI會(huì)提煉摘要,把"重要的事"存下來。聽起來很合理。
![]()
但問題來了。AI保留的是結(jié)論。
你當(dāng)時(shí)為什么做這個(gè)決策、推翻了哪些備選方案、接受了哪些代價(jià)、糾結(jié)了多久——這些東西被當(dāng)成"冗余信息"扔掉了。下次你問"當(dāng)初為什么選這個(gè)方向",它不知道。它只知道你選了什么,不知道你怎么想的。
Milla說她想要的不是這個(gè)。她想要AI記住推理的過程,不只是結(jié)論。那些被推翻的方案、改變主意的原因,才是最有價(jià)值的部分。
結(jié)論是死的,推理過程是活的。
這不是技術(shù)問題,是設(shè)計(jì)問題——誰來決定什么值得記?
信息放對了地方,比算法更聰明
Milla找了老朋友、工程師Ben Sigman。兩個(gè)人合作了6個(gè)月。她負(fù)責(zé)架構(gòu)邏輯,Ben寫代碼。
起點(diǎn)是一個(gè)簡單的想法:不讓AI決定記什么。全存。但存下來要能被找到。
"全存"聽起來簡單,實(shí)際上是個(gè)很大的工程判斷。大多數(shù)人做記憶系統(tǒng),首先想的是怎么"篩選"。Milla的判斷反過來:篩選會(huì)丟東西,不如全留,把檢索做好。
設(shè)計(jì)靈感來自古羅馬的記憶宮殿術(shù)。古人記憶大量內(nèi)容的方法,是在腦子里建一座宮殿,把要記的事情放在不同的房間里,需要時(shí)走進(jìn)去取。結(jié)構(gòu)幫助檢索,而不是大腦幫助篩選。
![]()
MemPalace的架構(gòu)就是這么來的。每個(gè)項(xiàng)目、每個(gè)人、每個(gè)主題,對應(yīng)一個(gè)"翼樓"(Wing)。翼樓里按話題分"房間"(Room)。房間之間有"走廊"(Hall),按記憶類型分類:決策、里程碑、偏好、發(fā)現(xiàn)。最底層,存的是原始對話完整文本,一個(gè)字不刪。
![]()
數(shù)據(jù)驗(yàn)證了這個(gè)判斷。不加任何分類,你想找的東西能被找出來的概率是60.9%;加了項(xiàng)目分類和話題分類之后,直接拉到94.8%。差了34個(gè)百分點(diǎn)——不是算法更聰明了,是信息放對了地方。
這套系統(tǒng),Milla堅(jiān)持做成了完全本地運(yùn)行的——不上云,不調(diào)外部API,數(shù)據(jù)不離開你的電腦。存儲(chǔ)成本一年0.7美元。在LongMemEval——AI記憶領(lǐng)域的標(biāo)準(zhǔn)基準(zhǔn)測試——上跑出了96.6%,是所有不依賴額外API方案里的最高分。
![]()
龍蝦的記憶其實(shí)也是這個(gè)設(shè)計(jì)方向:用文件系統(tǒng),不用向量數(shù)據(jù)庫。文件你能直接打開看、改、搜索;向量數(shù)據(jù)庫你不知道AI到底存了什么。可以被人看到的記憶,信任成本低得多。Milla做的這套,本質(zhì)上是同一個(gè)判斷。
與其看起來厲害,不如做對的事
這個(gè)項(xiàng)目我覺得有意思的地方,不只是技術(shù)。
它發(fā)布沒多久,社區(qū)就把數(shù)據(jù)扒了。壓縮效果夸大了,滿分是加了外援跑出來的,有個(gè)功能根本沒接進(jìn)去。挑出來的全是真問題。
但他們沒刪評論,寫了封公開信,一條條認(rèn)。
最后一句話是:"與其看起來厲害,不如做對的事。"
然后star繼續(xù)漲。
我覺得這說明了一件事:真正站得住的,是那個(gè)96.6%。扒皮之后反而比發(fā)布時(shí)更可信——因?yàn)樵摽涞牡胤秸J(rèn)了,剩下的才是真的。
更好的記憶
一個(gè)演員和一個(gè)工程師,6個(gè)月,沒有大團(tuán)隊(duì),沒有融資,在AI記憶這個(gè)方向上跑出了行業(yè)最高分。
方向其實(shí)已經(jīng)清楚了。
不是更聰明的模型,是更好的記憶。
最后,如果你想體驗(yàn)龍蝦為工作提效,現(xiàn)在就可以試試:
國內(nèi)版:easyclaw.cn
國際版:easyclaw.com
企業(yè)版:easyclaw.work
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.