![]()
作者 | 唐小引
出品 | CSDN(ID:CSDNnews)
過去兩年,有一句話反復出現在技術媒體、播客,乃至大模型的回答里:RAG 已死。
說這話的人來自各方。有人是為了推銷更新的架構,有人真的相信超長上下文窗口終將讓檢索技術變得多余。還有一類人——張穎峰帶著一絲諷刺意味地告訴我——「本質上自己就在做 Retrieval(檢索),卻也在宣稱 RAG Dead」。
與此同時,RAGFlow 的 GitHub Star 數字在漲。
RAGFlow 是一款開源 RAG 引擎,在全球開發者社區有相當高的知名度。2025 年 GitHub 年度 Top 10 項目榜單上,它是為數不多來自中國團隊的項目之一。背后的公司叫 InfiniFlow(中文名英飛流),聯合創始人是張穎峰和金海,2023 年 8 月成立于上海。
兩年多過去了,這家公司剛剛完成架構重組,以紅籌方式在香港落地控股主體,正在為更大規模的出海商業化做準備。Pre-A 融資已完成兩輪,投資方分別是創新工場和北極光創投,合計數百萬美元。
本期《萬有引力》,我和張穎峰做了一次長談。
![]()
從蘭州到 Infra,一個搜索老兵的「第一次創業」
張穎峰是蘭州人。
高考報志愿的時候,他選了上海交通大學的電子工程專業。理由很簡單:「別人說這個專業挺熱門的。」為什么熱門,他自己也說不上來。就這樣去了上海,然后再也沒有回去。
真正開始理解計算機,是工作之后的事。進入搜索領域的那家公司,成了他人生里最關鍵的一次塑造——「對我為人、技術上的影響,遠遠高于學校。」他在那里做搜索系統,后來深入到推薦系統,做了十幾年 Infra。
搜推方向的人,通常在大廠日子過得不錯。搜推是幾乎所有互聯網公司的現金流引擎,這個方向的工程師一直稀缺且昂貴。張穎峰在這個系統里待了很久,然后在 2021 年初加入了矩陣起源——一家做 HTAP 數據庫的創業公司。就是在那里,他認識了金海。
金海的背景和張穎峰互補。他是向量數據庫領域的早期建設者,曾在 Zilliz 負責數據庫研發,主導了 Milvus 1.0 的開發——「向量數據庫」這個概念,某種程度上是從那時候被做起來的。來到矩陣起源之后,他們兩人做的是另一種類型的數據庫,HTAP,和向量數據庫方向完全不同。
但在矩陣起源的兩年里,他們聊了很多。「基本上探討了做 Infra 的每個可能方向,以及后面該怎么演進。推倒了一切之后,最后找了數據庫的方向。」
兩個做后臺出身的人,都比較低調,不喜歡打造個人人設——更希望大家記住的是產品,而不是創始人是誰。也正因為這種性格,他們在大的戰略決策上往往能迅速達成一致:「我們兩個做 Infra 的背景比較多,很多 Sense 和 Vision 差不多。」
從矩陣出來,他們決定一起創業。
此時是 2023 年,大模型剛剛開始火。兩個做 Infra 出身的人,頂著「AI 原生數據庫」的旗號,拿到了晨暉創投領投、曦域資本跟投的天使輪融資。融資當時沒有對外做 PR,除非去查企查查,否則并不知道是哪個投資機構投了他們。
公司英文名叫 InfiniFlow。這個名字是 2020 年張穎峰在 GitHub 注冊組織時起的,靈感來自他早就加了微信的袁進輝——一流科技 OneFlow(創業硅基流動前),「我就叫無限流(InfiniFlow)。」
那時候,他們做的第一個項目叫 Infinity。一個數據庫,名字取自 InfiniFlow 里的前半段。
RAGFlow 出現的時候,「Infinity」已經用掉了,只剩下「Flow」還懸在那里。
這個偶然,后來變成了整個產品理念的注腳。
「RAGFlow 從打樣變成了主打」
2023 年公司剛成立,張穎峰和金海很快面臨一個現實問題:底層 Infra 離業務太遠,看不見,摸不著,連給投資人展示都很難。于是,他們決定給數據庫做一個「打樣」——選一個場景,向外界展示這個數據庫怎么用。2023 年大模型火的背景下,RAG 是最直接的使用場景。RAGFlow 就這樣誕生了,在公司成立的第一天開始開發。
2024 年 4 月 1 日,愚人節,RAGFlow 對外開源。流量躥升,比 Infinity 高出幾十倍。
唐小引:RAGFlow 開源之后,你們是怎么做的決定?
張穎峰:對外不再單獨去講這個數據庫,而是把 RAGFlow 這個產品作為公司的主打產品。換句話說,RAGFlow 從一個打樣、一個 Demo,最后上升到公司的主打產品。而我們公司原本的主打產品,從定位上來說,會定位成 RAGFlow 的一個組件。
當時之所以做出這個決策,來自于兩方面的認知。第一方面的認知是流量,這很顯然。第二方面的原因是,我們在做 RAGFlow 的過程中發現,如果說一個數據庫離業務有一公里遠,那我們做了 RAGFlow 大概又往前推進了幾百米。但是離最后的一百米,我們可能還沒有做。所以我們認為 RAGFlow 本身其實也是一個 Infra,也是個技術層或者說中間層的組件。更深的一個體會是,數據庫其實是整個 RAG 這一層的一個組件。把數據清洗、檢索之后的補齊增強這些工作全部都做了之后,它和數據庫加在一起,共同起到的角色才是數據庫。
唐小引:當時你們做這個決策,是立即達成一致,還是有過爭論?
張穎峰:這種大的決策,其實我們反而覺得很快。因為我們兩個做 Infra 的背景比較多,很多 Sense 和 Vision 差不多。但具體細節上——比方說我們要推出一個功能,到底要做還是不應該做——可能我有我的觀點,他有他的觀點,這些細節我們會不斷去碰撞。換句話說,一個 Infra 產品,其實是在這些細節上最終不斷去卷出來的。它一定是在每個細節把所有短板都補齊之后,才能把腳跟站穩。
那個懸著的「Flow」,張穎峰越看越覺得是「偶然中的必然」。
「我們到現在發現真的是要 Flow 起來。數據注入要 Flow——PDF、文件、Memory、Skills 這些數據進入系統,這個過程要靈活可編排。Retrieval 的過程也要 Flow——不是一來一回就結束了,要幾百幾千來回,要包含查目錄、補全、補齊意圖。而且要把這個 Flow 暴露給智能體,讓智能體來決定怎么 Flow。所以這個名字還真挺符合未來產品的行為和預期的。」
「完全是 PPT 融資」
張穎峰曾經有過兩次,快要轉型了。
第一次是 23 年。從上家公司離開后,他們在市場上找了半年融資,遲遲沒有進展。「我們當時已經在想,如果遲遲沒有融資,公司可能會去做一些轉型。不能做純粹的研發型公司了,可能得去做項目類的公司,支撐公司至少有一個相對標準的現金流,能夠活下去。」就在即將轉型的時候,天使輪的 Offer 來了。
第二次是 24 年。產品迭代很快,開源做得很好,但是沒人投。那時候也在想后面出路是什么、怎么轉型。這時候,第二輪的 Offer 也接到了。
唐小引:23 年的融資是怎么談的?
張穎峰:完全是 PPT 融資。因為我們不可能拿一個寫了一些代碼、連做 Demo 都沒辦法做的 Infra 數據庫,去給投資人展示它究竟有什么強大的能力,完全展示不了。我們能展示的就是在 GitHub 上提交代碼的時間戳,大概現在有多少規模了,只能這么去展示。
23 年在國內拿到融資的初創企業以大模型為主。除了大模型之外,在 Infra 層面拿到融資的其實很少。24 年情況更糟糕。整個 24 年,他們一直維持在個位數的團隊,但同時要支持兩款產品的研發——一款是最開始公司成立的初衷 Infinity,另一款就是后面從打樣變成主打的 RAGFlow。同時做這兩款產品還要做開源,當時人力上非常緊缺。
唐小引:Pre-A 融資,和汪華老師聊,他主要問你們什么?
張穎峰:我們當時的開源指標非常好,所以汪華老師沒有對我們做太多的 Challenge。他更關心的是決心問題——到底有沒有決心去出海,出海的決心有多大。因為對于效率類、工具類軟件,出海圈里人大概都知道,最終其實不是一個可選項。他問的核心就是敢不敢肉身出去——把自己放到海外,直接面向海外用戶、海外客戶,去簽訂合同,最終完成整個商業化的閉環。
第二輪是創新工場,第三輪是北極光創投。兩輪融資先后腳敲定,選擇披露的時候,索性把這兩個合在一起來披露,對外都叫 Pre-A。北極光給他們 Offer 的時候,RAGFlow 當時 Star 大概只有三萬還是四萬,「更多還是看中 RAGFlow 產品在全球開源社區的生態位、流量以及技術壁壘」。
Offer 到了之后,他們把公司架構做了調整,這個調整需要一些必要的手續,持續了比較長時間,直到最近才完成交割。
「非常感謝新老股東在我們最需要睡覺的時候能夠把枕頭送過來。能在這種階段支持我們做長期的事情,是需要勇氣的。」
「國內企業是為服務付費,不是為產品付費」
這個問題,我上一次見張穎峰的時候就很想問。那次他愁眉不展,開口就是商業化的困局。
唐小引:去年見你,你還很愁商業化,現在跑得怎么樣了?
張穎峰:國內現在應該說是啟動一段時間了,整體上還好,因為我們相對來說比較挑客戶。海外的話現在還沒開始,把這兩輪 Close 掉之后,主要還是針對全球化商業化去做一個布局。本質上我們現在還是在做產品以及商業化從零到一的階段。
從開源去做商業化這條路線是非常清楚的。但 RAGFlow 開源到現在應該是整整兩年,為什么沒有從一開源的時候就去做商業化呢?本質上還是在于人手極度不夠。RAGFlow 本身在過去社區已經跑得足夠快了,但內部面臨很多問題。這些問題導致如果直接用它作為一個基座去服務企業,是會出現問題的。所以得等到把這些問題修得差不多了,才會有信心面向企業。
大家可能也很容易想到一點——你這么慢,很多過去的流量都錯過了。「這確實是這樣。但我們做這個產品不是去蹭流量的。只要把產品打磨得足夠好,最終一定能被企業所接納。」
唐小引:做國內市場和做海外市場,現在看有什么不同?
張穎峰:核心點在于賬期和周期很長,銷售成本非常高。跟一個客戶簽下來可能不是幾個月這么簡單,可能會拉長到一年甚至更久。投資人喜歡訂閱制,一年一付一直付下去。但國內基本上沒幾家企業愿意每年付費。不是付不起,而是流程不一樣。決定一套采購要做立項審批,有的還要招標。這套流程折騰下來,第二年再走一遍肯定不做了。所以通常會選擇買斷。
買斷從商業角度來說并不是一個特別好的方式。買斷無非也就是幾年,過了幾年怎么續費呢?后面只能說是維護和升級的費用,這個費用相比正常的一年訂閱費用要低很多。另外,這些相對比較大的企業通常都會有定制類的需求。國內企業可能愿意為產品付費,不是說沒有,但至少不會很多,它通常是為服務去付費的。那為服務付費的話,就會導致我們去交付去實施這么一個項目,可能就會非常的重。
所以他們做了取舍——在國內的策略,還是以渠道、以賦能為主,不大會去建一個很大的銷售網絡。重點展開整個渠道的建設,扶持更多的渠道商,讓他們能夠在國內市場成功。「我們希望的是他們用我們的工具來做好他們的產品。」
「出海是必選項,不是可選項」
張穎峰去年在法國GOSIM第一次當面見到了 TiDB 創始人黃東旭。他們的微信其實加了十幾年,「那會兒國內做 Infra 的人不多,圈子很小,很容易認識。」但真正坐下來聊,是在巴黎那一次。
唐小引:跟東旭老師請教了什么?
張穎峰:見了面,當時主要是向他請教一些在海外的具體做法。像東旭他們,很早就下定了決心,大概在 18、19 年左右下定決心出去,經歷了挺長時間。正好那時彈藥儲存也比較多。經歷了挺長一段時間之后,現在局面總算完全打開了。我們產品的定位跟 TiDB 多少有些類似,大家都是數據類產品,屬于 Data Infra。Data Infra 產品的目標用戶一般相對會稍微有些規模,坐席超過十人之后,對數據隱私、合規這些問題可能都會比較看重。所以做這個方向的創業,必須堅定決心面向海外用戶。
走在他們前面的還有很多其他公司,比如 StarRocks,比如 PingCAP 的 TiDB,包括 Dify——從開源走向商業化這條路都已經證明是可行的,是非常好的一條路線。「因為有這些成功的示范,我們更加堅定從這條路能夠走出來的決心。」
唐小引:現在大家都在著力出海,但也有一種去全球化的趨勢,地緣政治因素越來越復雜,你怎么看?
張穎峰:我們現在也沒有那么激進。因為這個事情坦率地說誰也不知道會怎么樣。我們能做的就是快速去適應這個變化。所以我們現在先往香港放。未來會怎么樣,就跟著市場走。我們不會走得很極端,我們還是按照合法合規的方式去做。未來如果海外走不下去需要回來,該拆架構就要去拆,一切取決于市場。
唐小引:那你的出海計劃,具體路徑是什么?
張穎峰:開源商業化路徑比較清楚。第一步肯定要有一個正式的 SaaS。雖然現在來說 SaaS 已經不性感了,但 SaaS 是一個標準的服務企業用戶的途徑。只有 SaaS 推出來之后,才能說這件事情剛剛開始。SaaS 的本質,某種程度上可以理解為一個大號的 Demo,能讓企業用戶刷信用卡先用起來。用起來之后,才能真正體會系統跟自己產品之間怎么融合對接。
現在線上服務一直都有,只是我們一直叫 demo.ragflow.io,一直沒有叫 Cloud。根本原因在于沒有去收費。沒有收費就意味著告訴用戶還沒準備好。沒準備好,企業就不會認真評估這個產品。從正式收費那天開始,才是正式告訴企業:我們差不多可以了,可以來體驗。
SaaS 之后,配套的商業化 GTM 團隊就要同步展開——做開發者關系,做社區,把更多面向開發者的流量,逐漸轉化到 B 端。當這些角色走到一定程度之后,就是真正要肉身出去了,跟一些稍微大一些的企業、腰部企業,去做專門的部署,比如私有化,或者 BYOC。
唐小引:海外重點布局哪里?
張穎峰:是由數據來告訴我,在哪個地方局面先打開,就在哪個地方先來做。現在數據包括日韓、東南亞、歐洲、北美都有。對于北美來說,它是個重要的區域,但是不是商業化的重點區域,現在不知道。得等 SaaS 出來之后,看哪些區域收入相對比較高。
「Retrieval 是永恒的」
這是張穎峰講到技術時說得最多、也最篤定的一句話。
唐小引:拋開浮華和輿論的喧囂,現在 RAG 賽道的真實現狀是什么?
張穎峰:RAG 現在不能叫一個純賽道了。RAG 其實現在越來越會變成一個技術,它已經不是產品了,是個技術。到底是這個技術用在 Memory、知識庫、智能體,還是用在什么底座,都是有可能的。在智能體生態當中,現在的 RAG 產品會怎么演進,我覺得可能是兩個方向。一類是把自己盡可能變得去接管上下文,更加去配合智能體對 Retrieval 的需求——這條路線相對來說會更加的重,因為它的目的是為了把數據編排、注入流程、檢索流程都要做到足夠的可定制、透明和參數化,讓智能體容易使用。另外一條路線可能就會變得更加簡單,就是樸素 RAG——每個公司自己拿 AI 寫代碼,很快就能擼出這么一個小的 RAG 框架,這不是什么難事兒。
唐小引:你怎么看 RAG 和 Agent 的關系?長期是融合還是各自獨立發展?
張穎峰:這個觀點我們從公司一開始成立到現在都沒變過。我們一直認為 RAG 就是數據庫,Agent 就是應用。沒有 RAG,整個智能體回答不會好。但 RAG 這個詞,在現在環境里大家普遍比較關注表面的東西,可能這個詞聽起來不夠性感。做任何框架的都會說這個過時了。說 RAG 已經過時,差不多從 23 年就一直有。但從最終角度來看,它并沒有發生什么變化。
他喜歡用圖書館打比方。「你問我個問題,我如果記住了,我就直接回答,這就是模型。我要記得不那么清楚,那我就去圖書館搜一下查一下。所以 RAG 其實就是圖書館事先建好的那些索引。那這個索引到底是什么?向量索引、全文索引、目錄,還是樹導航結構,這都不重要。一切都是為了保證檢索快速有效的手段,什么有效就用什么。」
唐小引:現在有一種觀點——只要有足夠長的上下文窗口,加上組織良好的 Markdown 文件,就不需要 RAG 了。這個邏輯通嗎?比如 Karpathy 做的 LLM Wiki。
張穎峰:某種程度上可以這么講。但這就好比我問一個人,他記憶是不是足夠好。他記憶可能是挺好的,但是他能把所有事情都記下來嗎?上下文窗口它畢竟不是無限的,即使真做到無限那也是假無限。因為它一定是以遺忘某些上下文為前提,才能導致這么一個假的無限的結果。所以真實的上下文窗口一定是有限的。在這個上下文窗口里面,我們所要做的事情就是把能夠注意的事情塞到窗口里面去,把不愿意注意的事情盡快過濾。
Karpathy 那種做法,我覺得應該叫筆記。比方說桌上有那么一兩本書,這一兩本書大概以前都掃過一遍,有個筆記記下來了,接下來問,根據筆記快速定位到那兒,大概就可以了。這種屬于數據量不是那么大。但如果數據量還挺多的,那可能還要去根據索引去找一下。所以 Retrieval 不是一個簡單的來回,不是說我去搜了返回了,交給大模型結束了。RAGFlow 也正在把這類做法,連同其他知識增強手段一起打包到一個統一的知識編譯層,統一服務 Agent 對上下文的需求,后續版本就會推出。
講到這里,他話鋒一轉,說了我認為整個采訪里信息密度最高的一段話。
張穎峰:現在有一件非常重要的事情正在發生:RAG 的用戶,正在從人轉向智能體。
這個轉變,意味著一切都在變。
人問的問題很短、很模糊,沒有人會問很長的問題,就問幾個字。但智能體不一樣,智能體問的問題都是非常長的——因為問題是智能體經過模型做出來的 Prompt 給到的。這是第一點。
第二點,人用 RAG 可能查個十次了不起了。但智能體不一樣,請求的次數可能是人的超過一兩個數量級——搜索次數可能是一百次、一千次。搜索的頻率和行為都有很大不同。
用戶變了,產品的姿勢也要變:要把整個 Retrieval 能力全部暴露出來,讓智能體來決定怎么調用。「我到底是應該以什么樣的方式來做檢索?是查到的結果馬上就回答,還是覺得不太可信再去補一補?還是查到結果再去做聯想,在圖譜里面遨游一番找到其他相關結論?這些選擇、這些開關全部都應該暴露出來,讓智能體來操心。」
這就是從「RAG 引擎」到「上下文引擎」的本質。
這也意味著,Retrieval 正處于一個變革前夜。當用戶從人轉向智能體,新的技術挑戰隨之而來:全文索引如何處理智能體發出的超長查詢而不至于結果過噪?底層系統如何支撐從每次十次變成每次一千次的檢索頻率?這些問題,還沒有標準答案。
唐小引:那有什么是你認為的反共識,但你很篤定堅持的?
張穎峰:反共識比方說 RAG 會一直持續下去。不管是國內媒體還是全球媒體,我最近發現一個很有意思的現象,明明是自己在做 Retrieval,特別是面向 Agentic Retrieval 的一些產品,他們自己也在宣稱 RAG Dead 等等。這個其實更多是從營銷角度去講的。說明 RAG 這個事兒從流量角度來說確實是在下降的,但從內核角度來說它又是不變的。所以我說的從來都是內核。
作為產品形態的 RAG 可能不會長久,因為 RAG 本身其實是一種簡單的智能體。但是 Retrieval 這件事情它是永恒的。如果說智能體需要一個數據底座,那么這個底座一定也只能是以 RAG Retrieval 這種技術為中心構建的底座,也只能是以 RAG 為中心的技術去構建。
「Agent 到底做不做」
唐小引:你們從 RAG 引擎到上下文引擎,這個演進背后是怎么想的?
張穎峰:去年我們當時就已經判定,可能我們剛剛做出來不多久的這套 Agent,場景會逐漸受限。所以一方面在繼續維護功能,但另一方面其實已經在思考,接下來的布局可能要有所調整。所以我們在去年第四季度剛開始的時候,就提出了「Context Engine」的口號。當然只是提口號,限于人力也沒有實質性舉措。但提出口號后,沒想到過了三個月 LangChain 就火成這個樣子了,到現在 Claude 也火成這個樣子了。這一切都驗證了我們當時的判定是對的,智能體真的已經在席卷整個軟件行業了。
唐小引:那 Agent Harness 這件事,做還是不做?
張穎峰:天下智能體的江湖有十分,五分可能在龍蝦、Hermes,剩下一兩分大概有 LangChain,現在 Claude Code 作為 Agent 也逐漸成為主流。這么多智能體,我們可能不一定能夠作為一個流量的入口去抓住 Agent Harness 這件事情。所以我們還是要把握住自己擅長的不變的事情,就是變成所謂的 Context Engine——但它的核心跟我們過去做的 RAG 沒有本質的區別。雖然我們口號一直在變,先是 AI 原生數據庫,后面是 RAG 引擎,到現在是上下文引擎。但是這件事情本身其實沒有什么變化,它只是為了應對多變的 AI 生態做出的調整。
唐小引:你和金海在這一點上有分歧嗎?
張穎峰:會有一些分歧,因為都會有好處。比方說股東也會覺得你們要占領流量入口。但另外一方面,流量入口有了固然好,但不是想占就一定能占的。像 LangChain,還有現在的 Claude,這些項目的火其實都是偶然現象。如果我們轉型把自己定位成做 Agent 框架的公司,其實很難說競爭優勢到底是什么。因為我們的錨點永遠都是在底層的 Retrieval,做搜索這塊一直是我們的錨點。如果我們過分追逐熱點,很難說優勢體現在什么地方。如果真做了一個 Demo 一夜爆紅,那是另外一種情況,但這種情況只是黑天鵝,不能構成我們形成決策的主要原因。
關于 MCP,他的觀點已經變了。「之前認為 MCP 很好,它就像 TCP/IP 協議一樣,大家所有的工具調用都用 MCP 包裝好。」但現在他不這么認為了——「因為大模型已經被訓練成對寫代碼特別的友好。所有的智能體都是 Coding Agent,對所有工具的調用都會是以寫代碼的方式去調用。所以這個工具到底是 MCP 還是普通的 API,都可以。MCP 確實不那么重要。但你說它完全不需要,那倒也不是。反正都已經包成了 API 了,那就放在那兒去用就可以了。」
「RAGFlow 年中發布 1.0,把 Python 換成 Go」
唐小引:今年年中要發 RAGFlow 1.0,1.0 會帶來什么?
張穎峰:1.0 首先代表的是穩定性。來自社區的槽點也蠻多的,更新頻繁,開發人員有限,有很多情況顧此失彼。但到 1.0 狀態就代表產品形態基本定型了,穩定了,生產可用了。
我們現在還在做一件事情,把在線 Retrieval 這部分正在從 Python 全部切換到 Go 語言。切換原因是性能。Infinity 性能非常好,但加了 RAGFlow 性能優勢發揮不出來,都是拜 Python 所賜。RAG 的用戶正從人走向智能體,發給 RAGFlow 的請求會幾個數量級往上漲,我們不能再讓 Python 成為系統瓶頸。所以會在合適階段把 Online 這部分全部切換到 Go 語言實現。Offline 這部分,數據怎么編排注入,不會改,因為對 Python 生態更友好。
1.0 就是讓性能大幅提升,產品穩定性和形態處于穩定狀態。大家就可以放心用了,感謝社區用戶陪我們跑了兩年才有個 1.0。
唐小引:我看 RAGFlow 的 PR 現在有一百多個 Open,一個月前是五十多個,漲得很快。社區貢獻者越來越多是好事,但也帶來了問題?
張穎峰:現在比較苦惱的點,就是每天都會有用戶到社區領 Issue,領完就讓 Cursor 幫他們生成代碼提交,但他們基本上都沒有測過。這大大增加了維護成本。這就是現在沒有合并的 PR 一百多個的原因。
我感覺這也沒有什么特別好的辦法。我們自己雖然也用 AI 寫代碼,但我們會有人為這個 PR 兜底。但是社區大大降低了提 PR 門檻之后,沒有人為這個 PR 兜底,就只能我們來兜。人手就有點捉襟見肘。所以我們現在主要是選擇性 Review:如果提的 Feature 比較重要,我們會重點看;不是那么重要的,就先往后放了。有了 AI Coding 之后,人的價值其實就是為這些事情兜底,只有人才能兜底。
「Infinity 論文剛被 VLDB 錄用,24 年的工作,26 年還是 SOTA」
Infinity 數據庫現在,他們只是維持一個最低規模的團隊,基本上停止所有新 Feature 的研發,主要是來不停地測試。但張穎峰說,「即使站在現在來看,Infinity 的特性在整個行業也是非常領先的。我相信在后面還有很多比較新的特性要去做。這個事情是要跟隨著 Retrieval、跟隨著信息檢索的演進去同步迭代的。」
唐小引:兩年前的工作,現在依然很領先,為什么?
張穎峰:其實很簡單,對于 RAG 所需要的數據庫應該具備什么能力,我們很早就有很清晰的認知:本質上它就是個索引數據庫,需要具備各種各樣的索引,需要能夠允許用戶任意組合這些索引。因為每種索引都有自己的長短處,多種索引組合在一起。所以 Infinity 本質上就是一個索引數據庫。Infinity 本身的特性在 24 年其實就已經足夠先進了。最近我們剛跟浙大合作的論文就是 Infinity,剛剛被 VLDB 錄用。像 24 年的工作在 26 年還能被錄用,說明它現在仍然是 SOTA 的。我們所做的唯一的事情就是讓它穩定。
他們今年年中的目標,是希望能夠把 Infinity 作為 RAGFlow 的正式默認選項。現在默認是 Elasticsearch,Infinity 一直沒有作為正式選項,是因為一直沒有足夠的信心。他們現在主要是在測試,也把在線的一些平臺數據做了雙寫——同時寫到 ES 和 Infinity 里面去,目的就是為了發現更多的缺陷。
「RAGFlow 和 Infinity 雙劍合璧的那天,我們希望是在今年的年中。合并的那天之后,這個事情才真正閉環了。」
「老登」來創業的得與失
從業二十多年,這是張穎峰第一次真正意義上的創業。
唐小引:走現代創業流程,是第一次?
張穎峰:對。最早那次創業是二十多年前,當時都沒有風險融資這個事兒,不能完整叫創業。所以這次是正兒八經自己走完一個標準的創業流程,自己說了算,自己主導融資,組建公司,這是第一次。其他幾次更多是加入別人的團隊。
唐小引:見 VC 的時候,有沒有遇到因為年齡被打擊的情況?
張穎峰:實際上這個事情確實挺敏感的。我自己融資也不會去說年齡,因為這肯定不是個優勢。跟我年齡相差不大的同學,其實已經很少在一線做這些事情了。從我的角度講,年齡對這個事有優勢也有劣勢。優勢在于對事情的觀察會更加長久。就像前面講的,我跟金海討論做不做產品 Feature,是討論推導得出來的,不是腦袋一拍激情行動。我們是通過長時間積累推導出來的,把各個可能的組合排列盡可能的列全之后,找到每個可能的強項和弱項,我們才去動手。
唐小引:那劣勢呢?
張穎峰:老登明顯讓人感覺不太愿意跟上最新形勢,不光是生理,更多是心理認知,會導致距離快速迭代的生態漸行漸遠。作為創始人絕對要避免這種情況。如果我來投資,我也不會特別關注跟我年齡差不多的人的創業。因為跟我年齡差不多的人,選擇創業深入一線的已經很少了。
但過于年輕也有不擅長的點,在于過分關注可變的事情。如果總是追逐可變的事情,沒追上怎么辦?什么是不變的點,什么是錨點,這個很難把握。年輕人做事相對不太愿意沉浸性投入,過段時間興趣就轉移了,不會長時間投入一件事情。這就是為什么做 Infra 的人,年輕人有,但數量肯定比中登老登少很多。
唐小引:創業至今,有什么 Bitter Lessons 嗎?
張穎峰:教訓其實也沒什么。現在一個標準創業流程,就是想到事情付諸實施,拿到融資,把公司搭起來。所幸在這個流程當中,雖然經歷過困難時期,但整體還算幸運。在 23 年、24 年全行業低谷時,我們都拿到了 Offer,能讓公司按預期往前走,已經非常幸運了。什么時候有資格來說這個事兒?在商業化做出顯著成果的時候,我們可能才會有資格來說到底受了什么教訓。
唐小引:那創業這件事,對你來說是痛苦多,還是享受多?
張穎峰:創業者角度來說,其實是比較享受這個過程的。艱苦是艱苦,但其實是享受創業這個事兒。如果覺得很痛苦,或者痛苦大于其他選擇,那就不要做這事兒了。因為創業,特別是像我們做這個方向,不可能像做 Agent 賽道或者上層 C 端賽道,流量一下就起來能變現了。我們這個變現確實需要挺長時間的積淀才能完成,天然周期較長。如果不能享受這個過程,還是不要做。
認識張穎峰至今,每次見面,我總感覺他的頭發又白了些。他對這個觀察毫不在意,還反問我:「你看我頭發又白了幾根是吧?」
他不太在意很多事。最近有投資人來找,他連 PPT 都沒有,「就是對著屏幕空講,就像咱們現在聊天一樣」。袁進輝老師白發比他多,貼紙做得粗糙也沒關系,下個版本會改。
問他工作之外有什么愛好,他想了一下說:「中年男人沒什么愛好,就是工作。家里孩子也比較大了,也就趁著這個時間,按照自己喜歡的事情去做。」
表面上看比較好說話。但在某些核心準則上,很固執。
「我習慣在某些核心準則上一定要達到預期。如果跟預期不一樣,就會覺得很不爽很不舒服。」
這大概是他和金海走到一起創業的原因——兩個都有很強烈的「自己說了算」的意圖。也大概是他在「RAG 已死」的喧囂里,能夠保持定力的原因。
InfiniFlow。Infinity 被用掉了,剩下一個 Flow。
張穎峰說,這是「偶然中的必然」。
Retrieval 已經存在了三四十年,它正處于變革前夜——用戶在變,行為在變,技術需要隨之創新。但它本身,不會消失。張穎峰相信,它還會一直存在下去。
那個 Flow,還沒有到終點。
免費領取 100 小時 AI 算力|CSDN 讀者福利
加入 AI 開發者計劃獲取:
? AI 算力資源
? 官方技術社群
? Workshop 與 AI Academy
? 開發者專屬福利
立即掃碼,前 50 名額外領取「瑞幸咖啡」
咖啡領取鏈接: https://s.csdn.cn/4nPsOp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.