![]()
![]()
![]()
RAGFlow v0.25.2 已于 2026 年 5 月 10 日發(fā)布。這一版本的關(guān)鍵詞非常明確:API 繼續(xù)統(tǒng)一、數(shù)據(jù)源刪除同步能力增強、權(quán)限控制更嚴(yán)格、性能瓶頸被修復(fù)、兼容性持續(xù)維護。如果你正在關(guān)注 RAGFlow 的升級節(jié)奏,v0.25.2 是一次覆蓋面非常廣的版本更新,既有架構(gòu)層面的持續(xù)演進,也有大量面向生產(chǎn)可用性的修補與增強。
一、v0.25.2 版本總覽
本次版本主要分為三大方向:
1)API 繼續(xù)重構(gòu)與統(tǒng)一
RAGFlow 持續(xù)推進 Web API 向 RESTful 規(guī)范遷移,同時強調(diào)保持舊接口兼容。這意味著新舊客戶端在遷移過程中不會被強制打斷,整體升級更平滑。
2)數(shù)據(jù)源刪除文件同步能力增強
本次新增了一個輕量級 snapshot 機制,用于同步多個數(shù)據(jù)源中的已刪除文件,并盡可能真實反映遠端數(shù)據(jù)源狀態(tài)。該能力覆蓋多個數(shù)據(jù)源,說明 RAGFlow 在“同步一致性”方面進一步強化。
3)大量 bug 修復(fù)與安全/性能提升
從元數(shù)據(jù)可見性問題、重復(fù) chat 輸出、過濾性能瓶頸,到權(quán)限檢查、兼容性路由、導(dǎo)出下載、數(shù)據(jù)集訪問控制等,本次版本對生產(chǎn)環(huán)境中的關(guān)鍵問題做了系統(tǒng)性修正。
二、核心改進:API 統(tǒng)一繼續(xù)推進,舊接口保持兼容
v0.25.2 延續(xù)了前幾個版本的方向:Web API 向 RESTful 風(fēng)格持續(xù)重構(gòu)和統(tǒng)一。這類改動通常意味著:
? 路由命名更統(tǒng)一
? 資源表達方式更清晰
? 接口層次更適合長期維護
? 客戶端調(diào)用體驗更一致
更重要的是,本次更新特別強調(diào)了一個原則:所有 legacy 端點都保持向后兼容。也就是說,雖然內(nèi)部接口正在逐步規(guī)范化,但舊版本的調(diào)用方式仍然可用。這對于正在使用 RAGFlow 的團隊非常關(guān)鍵,因為它降低了升級風(fēng)險,也減少了遷移成本。
這次還出現(xiàn)了多個與 RESTful 重構(gòu)相關(guān)的更新點,例如:
? 文檔預(yù)覽/下載遷移到 RESTful API
? 文檔下載增加兼容路由
? 完整的舊文檔 API 向后兼容維護
? 路由名稱調(diào)整
? legacy 系統(tǒng)健康檢查路由保留
這說明 RAGFlow 并不是簡單地“換接口”,而是在做一套漸進式 API 重構(gòu):新規(guī)范逐步落地,老調(diào)用繼續(xù)可用,保證系統(tǒng)演進不中斷。
三、數(shù)據(jù)源同步重大升級:刪除文件同步機制上線
本次最值得關(guān)注的功能之一,是輕量級 snapshot 機制的引入。它的目的很明確:用于同步遠端數(shù)據(jù)源中被刪除的文件,從而讓本地狀態(tài)更忠實地反映遠端真實變化。
這項能力覆蓋了多個數(shù)據(jù)源,包括:
? Moodle
? DingTalk AI Table
? RSS
? WebDAV
? Asana
? Zendesk
? IMAP
? Seafile
以及本次還擴展到:
? dingtalk-ai-table
? moodle
? rss
? webdav
? asana
? zendesk
? seafile
? rdbms
從更新描述看,這不是單點修補,而是一次跨數(shù)據(jù)源的能力擴展。它解決的是同步系統(tǒng)中非常現(xiàn)實的問題:遠端數(shù)據(jù)源刪了文件,本地如果不知道,就會產(chǎn)生臟數(shù)據(jù)、誤檢索、誤展示、甚至誤引用。
這個機制帶來的直接價值
? 刪除內(nèi)容能夠被更及時識別
? 數(shù)據(jù)源狀態(tài)更一致
? 檢索結(jié)果更可靠
? 數(shù)據(jù)同步更貼近真實遠端狀態(tài)
? 后續(xù)文檔管理與權(quán)限控制更容易保持正確性
此外,這次更新中還包含了多個與同步相關(guān)的修復(fù):
? 數(shù)據(jù)源空列表同步修復(fù)
? 文件批量刪除優(yōu)化
? 文檔刪除權(quán)限檢查補充
? 刪除文檔 UUID 校驗移除
? 連接器服務(wù)時間設(shè)置與日志間隔修正
? 同步文檔 ID 按連接器作用域隔離,避免跨知識庫沖突
可以看出,v0.25.2 不只是“支持刪除同步”,而是順手把整條同步鏈路的穩(wěn)定性、隔離性、正確性都加強了一遍。
四、性能優(yōu)化:元數(shù)據(jù)過濾從內(nèi)存處理下沉到 Elasticsearch
這次版本里有一個非常明確的性能改進點:元數(shù)據(jù)過濾不再在內(nèi)存中處理,而是下推到 Elasticsearch。
這項優(yōu)化非常重要,因為內(nèi)存過濾通常會帶來以下問題:
? 數(shù)據(jù)量大時性能明顯下降
? 過濾邏輯難以擴展
? 會產(chǎn)生額外的內(nèi)存開銷
? 檢索鏈路容易出現(xiàn)瓶頸
本次改動后,過濾邏輯交給 Elasticsearch 執(zhí)行,說明系統(tǒng)更合理地利用了檢索引擎能力。對于大規(guī)模數(shù)據(jù)集場景,這種優(yōu)化往往能帶來非常明顯的收益。
除此之外,性能類修復(fù)還包括:
? 避免 embedding 累積中的 O(n2) 數(shù)組增長
? RocksDB 元數(shù)據(jù)并發(fā) CREATE/DROP 沖突重試
? 圖譜構(gòu)建中的合并并發(fā)和 checkpoint 恢復(fù)
? 文件批量刪除優(yōu)化
? 任務(wù)日志數(shù)量上限放寬
? 繼續(xù)優(yōu)化數(shù)據(jù)過濾與檢索鏈路
這些變化表明,v0.25.2 不只是修小 bug,而是在處理大數(shù)據(jù)量、大并發(fā)環(huán)境下的真實使用問題。
五、聊天與多模態(tài)能力增強
本次在 chat 體驗方面也有較多更新:
? 簡化 chat,并支持多模態(tài) chat
? 支持多模態(tài) chat 流式輸出
? 修復(fù)聊天頁面 LaTeX 公式無法顯示
? 修復(fù)雙重轉(zhuǎn)義的 LaTeX 反斜杠和 HTML 實體
? 修復(fù)重復(fù) chat 輸出
? 修復(fù)非流式工具調(diào)用追加到 chat history 的異常
? 修復(fù)對話中的思考顯示折疊與深度研究檢索標(biāo)簽分離
? 修復(fù)聊天頁中書寫公式顯示問題
? 修復(fù)部分輸出與消息展示錯誤
這些修復(fù)說明 RAGFlow 在對話層的目標(biāo)并不是只做“能聊”,而是進一步讓復(fù)雜能力在前端表現(xiàn)上保持穩(wěn)定。例如:
? 公式內(nèi)容能正確渲染
? 多模態(tài)請求可流式返回
? 工具調(diào)用歷史更穩(wěn)定
? deep research 的展示標(biāo)簽更清晰
? 聊天輸出重復(fù)問題被處理
這類體驗修復(fù)對最終用戶感知非常明顯,尤其是在知識問答、文檔分析、多模態(tài)輔助場景里。
六、權(quán)限控制全面收緊:多處接口補上授權(quán)檢查
v0.25.2 在安全性方面非常明顯的一點,就是權(quán)限檢查更嚴(yán)格了。多個接口都補上了 tenant 級別的授權(quán)控制或 IDOR 防護,避免越權(quán)訪問和跨租戶泄露。
本次涉及的安全與權(quán)限修復(fù)包括:
? 文檔刪除權(quán)限檢查
? beta 文檔下載授權(quán)檢查
? 文檔下載 endpoint 加強租戶授權(quán)
? chatbot SDK endpoint 強制 tenant 級授權(quán)
? memory 與 message endpoint 強制 tenant 權(quán)限
? 文件 ancestry 接口補權(quán)限檢查
? /files/link-to-datasets 授權(quán)缺失修復(fù)
? 私有數(shù)據(jù)集訪問檢查中的越權(quán)修復(fù)
? agent 權(quán)限問題修復(fù)及回滾
? team member 無法編輯 agent 的修復(fù)
? hybrid 模式下認(rèn)證問題修復(fù)
? CLI 登錄、注冊、注銷相關(guān)修復(fù)
? document download 兼容路由同時保留授權(quán)邏輯
這些修復(fù)共同指向一個目標(biāo):多租戶環(huán)境下的數(shù)據(jù)隔離必須嚴(yán)格。這對于企業(yè)部署尤其重要,因為一旦權(quán)限邊界不清晰,就可能造成數(shù)據(jù)泄露或者誤操作。
七、模型與推理能力持續(xù)擴展:更多 provider 接入
v0.25.2 中,模型接入能力繼續(xù)擴展,新增或完善了多個 provider 支持,包括:
? FuturMix
? Vllm
? Ollama
? xAI
? lm-studio
? OpenAI
? Nvidia
? OpenRouter
? HuggingFace
? 阿里云相關(guān)能力
? ZhipuAI 的 Rerank
? Gitee AI 的 Rerank
? SiliconFlow 的 Balance
? DeepSeek 的 Balance
? Aliyun 的 Encode(embeddings)
? Bedrock 相關(guān)修正
? MiniMax GroupId header 支持
? 繼續(xù)優(yōu)化 model service 的統(tǒng)一調(diào)用邏輯
同時還有以下相關(guān)改進:
? 使用統(tǒng)一的 GetChatModel,減少重復(fù)函數(shù)
? 修正 IMAGE2TEXT 到 CHAT 的 fallback 與 model_type 歸一化
? 修復(fù)本地模型連接檢查的全局狀態(tài)污染
? 修復(fù)不同 provider 的 ListModels 和 CheckConnection 接口對接
? 修復(fù) agent completion 的兼容性
? 支持 non-stream runtime agent completion
這意味著 RAGFlow 的模型生態(tài)繼續(xù)變寬,同時內(nèi)部調(diào)用鏈也在變得更統(tǒng)一、更可維護。
八、數(shù)據(jù)集、文檔、檢索與 RAG 相關(guān)修復(fù)
圍繞數(shù)據(jù)集與文檔的修復(fù)非常多,覆蓋面很廣:
? 允許搜索多個數(shù)據(jù)集
? 修復(fù)數(shù)據(jù)集文件頁面路由錯誤
? 修復(fù)數(shù)據(jù)集文件過濾 API
? 修復(fù) document api 的向后兼容
? 修復(fù)知識庫 prompt 中 document_metadata 為空導(dǎo)致的 citation 崩潰
? 修復(fù) tag parser id
? 修復(fù) handle id as keyword
? 修復(fù) kb_ids 在 SQL 拼接前的 UUID 校驗
? 修復(fù)文檔導(dǎo)出元數(shù)據(jù)丟失
? 修復(fù)文檔生成器輸出補充 base64
? 修復(fù)文檔轉(zhuǎn)換的向后兼容
? 修復(fù)過濾條件下 rerank 不應(yīng)繞過閾值
? 修復(fù)嵌入模型切換后已有 chunks 的恢復(fù)問題
? 修復(fù) shared dataset 訪問時的私有數(shù)據(jù)集授權(quán)繞過
? 修復(fù) file ancestry 相關(guān)越權(quán)
? 修復(fù) dataset search 多數(shù)據(jù)集 UI
? 修復(fù)刪除 last file 的問題
? 修復(fù) sync 中 document IDs 按 connector 作用域隔離
? 修復(fù) filter api 在 dataset document 中的行為
這些更新集中體現(xiàn)了 RAGFlow 的核心定位:文檔檢索、數(shù)據(jù)集管理、RAG 召回、rerank、導(dǎo)出、轉(zhuǎn)換、權(quán)限控制必須形成閉環(huán)。任何一個環(huán)節(jié)不穩(wěn)定,最終都會影響問答、引用和業(yè)務(wù)結(jié)果。
九、開發(fā)者與 CLI 能力增強
本次版本也強化了 Go 相關(guān)能力與 CLI 工具鏈,包括:
? CLI 支持 text、image、video 聊天
? CLI 登錄修復(fù)
? CLI 注冊修復(fù)
? CLI 注銷修復(fù)
? Go CLI 支持?jǐn)?shù)據(jù)集搜索
? Go CLI 支持 embed 和 rerank
? Go 管理 ingestion tasks
? Go 側(cè)日志模塊遷移到 common
? Go 側(cè) auth 修復(fù)
? Go 側(cè) provider 實現(xiàn)持續(xù)擴展
這些內(nèi)容說明 RAGFlow 不只是 Web 產(chǎn)品,也在持續(xù)建設(shè)命令行和程序化使用能力,方便自動化、調(diào)試和運維集成。
十、其他值得關(guān)注的細節(jié)修復(fù)
除了上面的大方向,這次版本還有不少細節(jié)修復(fù),同樣影響生產(chǎn)穩(wěn)定性:
? 版本信息修復(fù)
? 任務(wù)日志更多展示
? 路由名稱調(diào)整
? 樹形圖/畫布運行路徑感知修復(fù)
? 文檔預(yù)覽下載元數(shù)據(jù)保留
? 兼容歷史健康檢查路由
? 支持 local provider 的代碼執(zhí)行組件
? 去除部分過時模型
? Turkish 本地化字符串更新
? SSL 證書配置指南補充
? README 與版本引用更新
? release notes 和發(fā)布時間同步修正
? docs 全面更新到 v0.25.2
這些內(nèi)容雖然看起來零散,但它們是成熟產(chǎn)品持續(xù)迭代中非常重要的一部分:讓系統(tǒng)更穩(wěn)定、文檔更準(zhǔn)確、升級更順暢、運維更友好。
十一、v0.25.2 的整體意義
如果把這次更新濃縮成一句話,那就是:
RAGFlow v0.25.2 是一次以兼容性為前提、以穩(wěn)定性和安全性為重點、以同步與檢索性能優(yōu)化為亮點的綜合升級。
它沒有只做單一功能,而是同時推進了:
? REST API 統(tǒng)一
? 刪除文件同步
? 多數(shù)據(jù)源一致性
? 權(quán)限與安全
? 檢索性能
? 多模態(tài)聊天
? 模型 provider 擴展
? CLI 與 Go 側(cè)增強
? 向后兼容維護
這類版本通常最適合生產(chǎn)環(huán)境關(guān)注,因為它解決的不是表面功能,而是實際落地中的關(guān)鍵痛點。
十二、總結(jié)
代碼地址:github.com/infiniflow/ragflow
RAGFlow v0.25.2 這次更新內(nèi)容非常密集,覆蓋范圍也非常廣。從 API 重構(gòu)到數(shù)據(jù)源刪除同步,從元數(shù)據(jù)過濾性能到聊天展示修復(fù),從租戶權(quán)限到多 provider 支持,再到 CLI 與 Go 側(cè)完善,幾乎可以說是一次“全棧型”的版本升級。
我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業(yè)洞察。 歡迎關(guān)注“福大大架構(gòu)師每日一題”,發(fā)消息可獲得面試資料,讓AI助力您的未來發(fā)展。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.