![]()
圖源:Unsplash / Ire Photocreative
撰文|梅寶
論文造假的戰場,正在向引文蔓延。
在學術論文中,引用他人的研究成果既是基本的學術規范,也是確保新研究建立在堅實科學基礎上的重要支撐。然而,隨著越來越多的科研人員習慣借助AI處理日常科研工作——包括梳理文獻、潤色表達、激發思路乃至探索具體的實驗技巧——一個令人尷尬的問題也隨之浮現:AI正在憑空捏造根本不存在的參考文獻。
過去,在公開發表的論文中引用虛假文獻(fabricated references)幾乎是難以想象的事,畢竟這直接觸碰科研誠信的底線。而如今,隨著AI輔助寫作日趨普及,論文參考文獻列表愈發冗長,虛假引用的識別成本變得越來越高,守住參考文獻誠信的底線,會成為一場新的持久戰嗎?
3年間,虛假引用頻率上漲超10倍
2026年5月,國際著名醫學期刊《柳葉刀》(The Lancet)發表了哥倫比亞大學馬克西姆·托帕茲(Maxim Topaz)教授及其同事的一篇通訊文章,發現公開發表的論文中存在虛假引用現象。雖然出現虛假引用的論文占比還比較低,但這一占比在過去三年迅速上升。
談及這一發現的緣起,托帕茲對專注于報道全球醫療、生物醫藥的權威STAT提到:這項研究工作源于自己的一次尷尬經歷。他原本希望利用AI來協助編輯一篇要投稿給期刊的文章。盡管他檢查引用是否準確,期刊編輯還是指出了其中一處錯誤的引文。“我感到非常尷尬,這種情況差點就發生在我身上。正因如此,我開始思考其他人的處境。”
于是,托帕茲帶領團隊開發了一套自動化的引用驗證系統,對2023年1月至2026年2月期間收錄在PubMed Central開放獲取數據庫中的250萬篇生物醫學論文進行了地毯式掃描,篩查了1.2億條引用文獻。這些文獻中,研究團隊只保留了那些帶有PubMed 標識符(PMID)的文獻,數量約9710萬條;再通過文本相似度分析,將引用該參考文獻的論文所標注的數據與PubMed、Crossref、OpenAlex 、Google Scholar 等數據庫中的實際數據進行比對。如果某個參考文獻的標題,在這些數據庫里找不到對應的真實出版物,那么該文獻即被判定為虛假引用。
最終,在9710萬條可查證的引用中,他們發現了4046條虛假引用。這些虛假引用散布在2810篇論文中,其中綜述類文章的虛假引用比例比研究類論文高,有2564篇論文包含一至兩條虛構的參考文獻,246篇論文包含三條及以上虛構的參考文獻。
如果從時間維度來看,2023年,每2828篇論文中有一篇存在虛假引用。到2025年,這一比例上升至每458篇論文中有一篇。2026年前7周內,每277篇論文中有一篇。不到三年的時間,存在虛假引用的論文比例,從萬分之四飆升至萬分之57,上漲了十幾倍。
![]()
來源:Fabricated citations: an audit across 2·5 million biomedical papers, Maxim Topaz, Nir Roguin, Pallavi Gupta, Zhihong Zhang, Laura-Maria Peltonen, May 9, 2026, Lancet
這個事實提示:虛假引用的增加,或許與AI在科研界的廣泛使用有關。2022年底至2023年間,以ChatGPT為代表的大語言模型進入公眾視野。論文從投稿到發表通常需要100到200天的周期,2024年中期恰好是第一批借助大語言模型“快速寫作”的論文涌入論文數據庫的時間。
該是誰的鍋?
AI只是一門技術,虛假引用不應該由AI來背鍋。在《柳葉刀》當期的評論文章中,波士頓大學醫學院的霍華德·鮑赫納(Howard Bauchner)博士認為,虛假引用的責任應該由作者來承擔。如果發現某篇論文中存在偽造的參考文獻,那么該論文就應該被撤回。在已發表的論文中編造參考文獻屬于學術不端行為,理應受到相應的嚴肅處理。
然而,截至研究結果發表時,對于98.4%的涉事論文,出版商沒有采取任何行動,既未撤稿,也未更正。虛假引用似乎沒有文章數據造假那么嚴重,但是最終也會流向醫學領域,對臨床診療實踐造成潛在危害。“當你作為一名臨床醫生,根據指南提供臨床診療時,回頭去查看該指南引用的文章,卻發現這些引文根本查不到,”托帕茲說,“這非常令人擔憂。”
托帕茲建議采取四項措施。首先,出版商應在同行評審開始前將自動化參考文獻驗證整合到投稿流程中,現有驗證工具可供使用,其采用障礙主要在于機構層面而非技術層面。其次,索引服務應為文章記錄添加完整性元數據(integrity metadata),以便下游用戶評估參考文獻的可靠性。第三,當虛假引用影響論文結論時,出版商應對現有出版物進行追溯性審查,并發布更正或撤稿聲明。第四,當前主要研究誠信數據庫(research integrity databases)中尚未設立“虛假引用”這一獨立分類,建立此分類有助于實現系統化的追蹤與問責機制。
本次研究分析中,虛假引用在各個期刊中的分布并不均勻,超過三分之一的偽造引用來自兩家出版商。托帕茲沒有給出具體名稱,只是提到它們都是大型開放獲取出版商,通過向作者收取高額費用來獲取收入。
而對于出版商們的態度,STAT曾聯系了幾大最久負盛名的科學出版商,其中,《科學》(Science)系列期刊發言人表示,它們使用自動化工具來核查參考文獻,目前還未在其期刊發現任何一篇發表的論文存在虛假引用的問題。《新英格蘭醫學雜志》和《美國醫學會雜志》(JAMA)的發言人則稱,他們的期刊都有相應工具來驗證引用信息,并且所有在其期刊上發表文章的作者都同意文責自負。出版商PLOS的倫理負責人雷內·霍赫(Renee Hoch)則說,“我們希望將自動化核查工具融入到我們的出版工作中,目前正在探索相關解決方案。”
除了制度上的優化措施,或許我們還需要思考,生成式AI的普及將對學術界的論文引用方式帶來怎樣的改變。
西北大學研究科研誠信與人工智能應用倫理的教授穆罕默德·侯賽尼(Mohammad Hosseini)曾對STAT表示,“過去,人們會先閱讀論文,然后再做筆記。在撰寫論文時,人們會思考:‘這篇論文或這本書是否與我的研究相關?’這是一個需要深入思考的過程。如今人們只是憑直覺給ChatGPT或其他AI工具輸入提示詞,然后得到一堆引用文獻,隨意添加在論文里。這種做法并不健康,這意味著人們對學術文獻的閱讀越來越表面化,這對研究人員、社會以及我們的學術出版方式都沒有好處。”
學術誠信的底線,不應該因為技術手段的進化而降低。正如卡內基梅隆大學計算機科學家尼哈爾·沙阿(Nihar Shah)曾對《自然》雜志提到:“隨著自主人工智能科學日益受到重視,我們期望作者在多大程度上真正去研讀他們所引用的論文?”研究人員必須對學術文獻保持主動的閱讀與批判性審視。將知識的溯源完全讓渡給人工智能,不僅侵蝕了學術研究的嚴謹性,更是在動搖科學出版的基石。
參考資料:
- [1] https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(26)00603-3/fulltext
- [2] https://www.statnews.com/2026/05/07/lancet-study-finds-steep-rise-fraudulent-citations-academic-papers/
- [3] https://www.nature.com/articles/d41586-026-00748-w
- [4] https://www.medpagetoday.com/practicemanagement/informationtechnology/121165
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.