互聯網時代,傳統媒體圍繞用戶訪問點擊建立了廣告和直接收費兩種商業模式。但人工智能搜索的出現,特別是使用RAG(Retrieval-Augmented Generation,檢索增強生成)技術的公司能讓用戶多數時候直達答案省去點擊。所以傳統媒體開始了對RAG模式的AI服務商的大規模維權,用版權侵權起訴野蠻生長的AI公司,用反壟斷起訴沒那么野蠻的,總之就是告你沒商量。
一、RAG技術破壞的是傳統媒體網站生態
作為版權人的傳統媒體認為,和傳統大模型訓練后輸出模式相比,AI搜索結果頁能直接替代對源網站進行訪問,沒人訪問網站就沒有廣告點擊,也沒有了付費訂閱,內容真正的創作者就沒有了收入來源,所以AI搜索不是在創新,而是在系統性劫持原創內容,破壞創作生態。
而其中的罪魁禍首,就是RAG模式。傳統大模型,比如OpenAI的早期模式,是通過海量數據訓練,讓模型消化知識,輸出時模型基于概率生成新文本,絕大多數情況下,不會對訓練素材,比如某篇特定文章進行完整復制。而在RAG模式下,AI收到用戶提問會在后臺實時檢索互聯網,找到相關內容,然后將這些內容增強進輸出內容。此時,如果AI服務商在輸出端不做控制的,生成的內容就有可能會和被檢索到的文檔非常相似,將構成法律意義上的復制。
但即便AI服務商在進行控制,讓輸出的內容具有更強的轉換性,不構成對被檢索內容的復制,實際搜索結果頁也會對提供原創內容的源網站起到替代作用,用戶多數情況下也無需訪問源網站,這實際破壞了被抓取內容網站的生態。
二、CNN起訴野蠻人Perplexity
Perplexity是一家印度裔創業者創設的人工智能服務商,可能因為其基礎模型能力不夠強,所以其RAG模式的運營非常激進,完全不尊重法律和行業傳統。2026年5月,美國CNN公司向紐約南區聯邦法院起訴Perplexity,根據訴狀,用野蠻生長形容Perplexity毫不為過。
Perplexity首先通過自家爬蟲大規模抓取CNN的新聞、圖片、視頻,建立起一個巨大索引,當用戶向Perplexity提問時,系統會根據問題檢索CNN的相關文章全文,然后把文章內容直接裝進模型上下文并生成答案。這些答案在很大程度上就是對CNN原文的大段復現,甚至逐段復制。
CNN在訴狀中提供了大量對比圖證據。左欄是CNN原文,右欄是Perplexity的輸出,大面積標紅的文字表明兩者高度一致。例如,當用戶詢問“盧比奧放棄了哪個職務”的問題時,Perplexity的付費Pro版直接輸出了CNN文章的大量逐字內容,也就是說,用戶向Perplexity支付費用即可獲取CNN的版權內容,但CNN本身分文未得。Perplexity的Comet瀏覽器甚至能繞過CNN的付費墻,將付費訂閱文章的全文逐字輸出給未訂閱用戶。
![]()
CNN還在訴狀里指明了Perplexity的兩類惡意技術行為:Perplexity的爬蟲公然無視網站的robots協議中設置的禁止抓取規則,爬取本不允許被機器訪問的內容,這其中包括一部分付費墻后的新聞。其爬蟲還被Cloudflare抓到,如遇攔截,會偽裝成普通瀏覽器,比如假裝成Mac電腦上的Chrome瀏覽器用戶,并通過未公開的IP段發起請求。
三、文明人谷歌也被告了
相比Perplexity,谷歌要文明的多,其早期的理念是幫助用戶離開搜索引擎,并建立了一個相對良性的生態,搜索結果僅提供兩三行提示性的摘要片段,用戶若想獲取實質性內容,必須點擊訪問來源網站。這樣媒體網站就可以通過谷歌導流來的用戶實現廣告和直接收費的模式。
但到了AI時代,谷歌也變質了,其正蛻變為讓用戶留下來的答案引擎。近年來谷歌力推的AI搜索模式讓用戶查詢后可以直接獲得AI生成的答案。AI搜索在搜索結果置頂會大大減少搜索推薦的流量,不但頭部搜索結果的點擊率下滑嚴重,大量搜索還以零點擊告終。
不過即便如此,谷歌提供的AI搜索也比Perplexity有節操:尊重robots協議,網站如果在robots文件中禁止抓取,谷歌會直接不索引這些內容,也不會對網站生成AI摘要。谷歌的AI搜索對RAG模式進行了改進,輸出內容是從多個來源抽取片段,拼在一起,并在每個段落邊上標明來源鏈接,其體驗也盡量保持引用并鏈接這一搜索引擎的傳統框架。而且谷歌不會在AI摘要中直接給出付費墻后全文的核心內容,而是仍然引導用戶前往原站訂閱或登錄。
但谷歌原本建立的搜索生態,還是被AI摘要打破,傳統媒體網站訪問量不可避免的大幅下滑。蛋糕變小總有人要承擔責任,2025年9月,旗下擁有Billboard、Rolling Stone、Variety、The Hollywood Reporter等標志性媒體品牌的Penske媒體集團在華盛頓特區聯邦法院起訴了谷歌,但選擇的武器不是版權法,而是反壟斷法。
Penske訴狀的核心邏輯是:媒體原本允許谷歌抓取網站內容,是為了獲得搜索流量;但谷歌改變規則,把網站內容進一步用于谷歌的AI搜索產品。雖然谷歌也提供了退出機制,網站使用nosnippet等標簽,就可以停止谷歌對內容摘要展示,但問題在于,谷歌很霸道,此時不但AI搜索不顯示摘要,正常谷歌搜索也不會顯示網站摘要,導致網站徹底失去了谷歌的搜索曝光與推薦,徹底退出谷歌搜索生態,但退出谷歌搜索,對媒體網站而言會失去絕大部分訪問流量,幾乎等于死亡。
這種狀態,也正是反壟斷法中的經典問題:壟斷者利用市場支配地位迫使交易相對人接受不公平條件。所以Penske不得不祭起反壟斷訴訟這個利器。根據訴狀,本案相關市場大致可以分為:第一,通用搜索市場,這是谷歌在其他案件中已經被美國法院認定具有壟斷地位的市場。第二,在線數字出版流量分發市場,媒體依賴谷歌導流。第三,AI搜索市場,谷歌試圖將原有搜索優勢延伸到AI時代。
Penske認為谷歌濫用了其在搜索市場的支配地位,通過將搜索索引與AI內容授權捆綁的捆綁交易,以及在搜索結果頁優先展示自家的AI摘要而非原網站鏈接的自我優待,人為制造了競爭對手無法逾越的壁壘,破壞了原本健康的互聯網內容生態。
最后,每一次科技進步都會伴隨著效率的大幅提升,AI搜索的RAG模式雖然看似也提升了效率,讓訪問者減少點擊網頁即可直達結果,但其行為卻打破了原有內容創作的生態,不合理的損害了內容原創者的利益,長此以往,會導致原創內容萎縮。所以,通過訴訟對該模式,或者說對中立技術背后的利益分配機制進行反思是必要的。
這里不得不說一下我國的遺憾,美國的訴訟先聚焦的是未經許可的訓練行為是不是構成侵權,然后再推進到對RAG模式的法律定性,而我國司法機關目前似乎為了保護新生的人工智能產業,對訓練問題的審判都非常審慎克制,所以筆者這樣的中國知識產權律師只能將視線投向大洋彼岸,研究美國的案例了。
本文作者:游云庭,知識產權律師。Email: yytbest@gmail.com,本文僅代表作者觀點。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.