當我們在維基百科搜索一個詞條時,你期待的是真相,至少在AI時代,總得有一個地方能(大概率)給我點真東西吧。可以,但在 Halupedia 搜索一個詞條時,得到的也是真相——一個三秒鐘前剛被發明出來的真相。
Halupedia 是一個長得像維基百科的網站,但它的每一篇文章都是 AI 幻覺。
![]()
你輸入一個詞條,如果之前沒有人搜索過,大語言模型就會在幾秒鐘內為你生成一篇措辭嚴謹、引用詳實、學術氣十足的百科文章——關于一個從未存在過的事物。如果已經有人搜過了,你會讀到他們的那份幻覺,它甚至有交叉引用、有學術期刊、有 19 世紀學者的考證語氣。一切都令人信服,除了一切都是假的。
這是行為藝術,還是會成為以后的數據污染源頭?答案可能是:二者兼是。
虛構宇宙的「世界觀管理」
如果 Halupedia 只是一個隨機生成胡話的工具,它早就淹沒在無數 AI 玩具項目里了。真正讓它有趣的是一個工程細節:它在維護自己的「小宇宙」。
每當 AI 生成一篇新文章,文中的每一個超鏈接都會被附上一段隱藏的元數據(context 屬性),描述這個鏈接將要指向的、尚未生成的未來文章應該包含什么內容。當有人點擊這個鏈接時,系統會把所有指向該詞條的元數據匯總起來,作為「既定事實」注入到生成提示中。
![]()
很神奇,AI 在這里被要求的是, 可以幻覺,可以胡說八道,但不能自相矛盾,就算都是編出來的信息,也要前后一致。
這套機制被稱為 link hints,它讓 Halupedia 從一個隨機幻覺生成器,變成了一個擁有內在一致性的虛構宇宙。寫過小說、愛玩游戲的人會立刻認出這是什么:這就是世界觀管理,只不過管理者不是作者,而是一套數據庫和系統提示詞。
換句話說, Halupedia 是一部沒有作者的小說,每一個點擊鏈接的用戶都在無意中參與了創作,但沒有人擁有全本。 某種程度上, 這也復現了維基百科的「眾人拾柴火焰高」,只是過程更加簡單無腦,隨便輸入點兒東西,剩下的等 AI 來生成。
一面照見互聯網未來的鏡子
但 Halupedia 不只是好玩,它的存在指向一個正在發生的、令人不安的問題:當 AI 生成的內容開始喂養下一代 AI 時,會發生什么?
第一代大語言模型的訓練數據來自人類寫作的互聯網——維基百科、論壇帖子、新聞報道、學術論文。這些數據雖然嘈雜,但至少源于人類的真實經驗和知識。然而,隨著 AI 生成的文本在互聯網上呈指數級增長,未來模型的訓練數據將不可避免地包含大量 AI 自己寫的東西。信號被噪聲稀釋,每一輪訓練都像是在復印一份已經模糊的復印件。
Halupedia 的創作者 Bart?omiej Strama 顯然意識到了這一點。當有人為項目捐贈了 token 費用時,他的回復是:
![]()
——你為污染大語言模型訓練數據所做的貢獻,必將造福社會。
嘲諷模式拉滿了,你甚至無法判斷他是諷刺還是認真的,實際上,這些內容雖然是即時生成的,卻不可能百分之百是幻覺,LLM 的生成機制決定了它只能在已有知識的縫隙里編造。
![]()
以上面的案例來說,「迦勒底」是真的,「算術」是真的,但「迦勒底算術」是假的, 幻覺發生在組合層,不在元素層面 。就像你不可能憑空夢見一種你從未見過過的顏色,LLM 也不可能憑空捏造一個跟訓練數據毫無關系的概念。
這反而是它最危險也最迷人的地方:它的幻覺之所以令人信服,恰恰是因為每一篇文章里都有大量真實的存在。真實的年代、真實的地名、真實的學術體裁、真實的引用格式,可是搭建在這些真實之上的那個核心命題是假的。
如果 Halupedia 的內容被未來的搜索引擎爬蟲抓取、被未來的模型當作訓練數據,那些措辭嚴謹的幻覺文章就會成為下一代 AI「知識」的一部分。
一個故意制造幻覺的網站,最終可能讓所有 AI 都開始產生同樣的幻覺。
當幻覺照進現實
Halupedia 目前面臨的最大問題,恰恰暴露了它作為「開放式虛構系統」的脆弱性。由于任何人都可以輸入任何詞條作為生成提示,比如一些用戶開始輸入種族主義或冒犯性的內容,這部分網站管理也在想辦法應對。
這是一個所有開放式 AI 系統都面臨的困境:你給了用戶創造的自由,就必須承擔他們濫用這種自由的代價。Halupedia 的創作者承認,目前的內容審核「sometimes too strict」,但仍然不夠。
這就成了一個有趣的悖論是:在一個一切都是虛構的世界里,唯一真實的傷害來自用戶帶進來的現實世界的惡意。
![]()
某種程度上,這可能是目前互聯網上最誠實的 AI 項目,不是因為它說的都是真話——恰恰相反,它說的全是假話,但它是唯一一個從一開始就告訴你「這里沒有真相」的地方。在一個越來越多的 AI 生成內容偽裝成事實的互聯網上,Halupedia 至少給了你一個清晰的標簽,這是幻覺,已經過精心炮制,請隨意享用。
問題是,當你關掉 Halupedia,回到 Google 搜索結果頁的時候,你還能分得清哪些是幻覺、哪些不是嗎?
也許整個互聯網,正在慢慢變成一個沒有標簽的 Halupedia。
我們正在招募伙伴
簡歷投遞郵箱 hr@ifanr.com
?? 郵件標題 「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.