一個(gè)產(chǎn)品經(jīng)理用AI兩天生成了40+篇交叉鏈接的研究筆記,圖譜漂亮得像星座圖。三周后他讓AI繼續(xù)干活,AI在原地打轉(zhuǎn)——不是內(nèi)容丟了,是結(jié)構(gòu)爛掉了。
這不是RAG(檢索增強(qiáng)生成)能解決的問題。這是所有把筆記當(dāng)數(shù)據(jù)庫用的人,遲早要踩的坑。
01 | 為什么Obsidian+LLM成了新配方
作者用Obsidian當(dāng)主力知識(shí)庫很久了。老用戶都懂:筆記一多,維護(hù)成本指數(shù)級上漲。怎么讓讀者跟上思路?怎么從同一張知識(shí)圖譜里榨出新視角?
他缺兩塊拼圖:一是MCP協(xié)議(后來換成Obsidian CLI),二是Agentic AI(帶工具的LLM)。
但真正的秘密 sauce 在第三層——Obsidian CLI和LLM之間的那個(gè)中間層。「為什么不用RAG?」因?yàn)榧兾谋疚募貌僮鳌ndrej Karpathy那篇爆火的LLM知識(shí)庫帖子也是這個(gè)思路,看點(diǎn)贊數(shù)就知道踩中什么了。
兩條技術(shù)路線驚人地相似:
原始素材 → AI編譯 → 結(jié)構(gòu)化知識(shí) → 人工審核
都用Obsidian當(dāng)知識(shí)前端,都用Markdown當(dāng)通用載體,都把知識(shí)當(dāng)成AI維護(hù)、人類策展的活資產(chǎn)。核心共識(shí):本地優(yōu)先。你的庫存在自己機(jī)器上,沒有云檢索服務(wù),沒有向量數(shù)據(jù)庫,訪問自己的知識(shí)不需要API。
關(guān)鍵區(qū)別:這不是RAG。RAG每次查詢都從原始素材里抓碎片。Obsidian給你的是結(jié)構(gòu)化知識(shí)——文件連成圖譜,筆記互相鏈接。檢索像是在查索引過的數(shù)據(jù)庫。
部署按分鐘算:Obsidian、一個(gè)運(yùn)行時(shí)、一條構(gòu)建命令,完事。
02 | 結(jié)構(gòu)腐爛:40篇筆記的三周宿命
最深的共識(shí):沒結(jié)構(gòu)的知識(shí)會(huì)腐爛。每個(gè)搞AI的都經(jīng)歷過——AI能編譯結(jié)構(gòu),規(guī)模小的時(shí)候(一個(gè)研究方向、幾個(gè)主題、每主題百來篇文章)跑得挺順。
但規(guī)模上去呢?多個(gè)研究方向、多人共用庫、跨領(lǐng)域交叉?不同會(huì)話的Agent改同一個(gè)實(shí)體,沒有共享Schema,沒有校驗(yàn),沒有引用完整性。
作者被這個(gè)問題燉了很久。
細(xì)節(jié)很重要。他的Agent花了兩天編譯出一個(gè)研究Wiki,40+篇單一主題筆記,交叉鏈接,按子領(lǐng)域組織,F(xiàn)rontmatter干凈。Obsidian圖譜視圖里漂亮得像星座。
三周后他回來擴(kuò)展研究,讓Agent接著干。Agent在自己造的房子里迷路了。
知識(shí)沒丟,每篇筆記都在。但結(jié)構(gòu)從三個(gè)地方悄悄爛掉了:
引用完整性斷裂。初始化階段作者手動(dòng)重組過幾篇筆記,鏈接指向的錨點(diǎn)失效。Agent不知道哪些鏈接還活著,哪些已經(jīng)變成僵尸指針。
Schema漂移。早期筆記用的Frontmatter字段,后期Agent換了新標(biāo)準(zhǔn)。同一批研究里混著兩種元數(shù)據(jù)格式,查詢時(shí)漏掉一半結(jié)果。
上下文窗口污染。Agent每次啟動(dòng)都把整個(gè)圖譜塞進(jìn)提示詞,但三周后的圖譜比當(dāng)初大了四倍。關(guān)鍵關(guān)聯(lián)被噪聲淹沒,Agent開始 hallucinate 不存在的鏈接。
03 | 本地優(yōu)先的代價(jià)與解法
Karpathy的架構(gòu)和作者的在哲學(xué)上同步,但工程細(xì)節(jié)暴露了盲區(qū)。兩人都假設(shè)「結(jié)構(gòu)化一次,受益永久」,沒給結(jié)構(gòu)本身設(shè)計(jì)維護(hù)協(xié)議。
作者現(xiàn)在的實(shí)驗(yàn)方向:給Obsidian CLI加一層Schema校驗(yàn),Agent每次寫入前跑一遍lint。引用完整性用雙向鏈接的反向索引兜底,Broken link自動(dòng)進(jìn)待修復(fù)隊(duì)列。
更激進(jìn)的思路是版本化——不是Git那種全文快照,是圖譜結(jié)構(gòu)的diff。Agent每次會(huì)話前先看「結(jié)構(gòu)變更日志」,比重新掃描整個(gè)庫省token,也比瞎猜鏈接狀態(tài)靠譜。
但這些都還在燉。目前能確定的是:本地優(yōu)先省掉了云服務(wù)的租金,沒省掉結(jié)構(gòu)維護(hù)的人力。AI編譯知識(shí)的速度,和人類驗(yàn)證結(jié)構(gòu)完整性的速度,差距在拉大。
那個(gè)40篇筆記的研究Wiki,作者最終手工重建了鏈接圖譜。花了大半天——比AI生成原始內(nèi)容還久。他現(xiàn)在每次啟動(dòng)Agent前,先跑一遍自定義的「圖譜健康檢查」腳本。輸出是一串紅色警告,像體檢報(bào)告上的異常指標(biāo)。
你讓AI幫你整理筆記的時(shí)候,想過怎么讓AI記住它上次怎么整理的嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.