无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI催生生物醫(yī)學(xué)科研危機?頂尖科學(xué)家差點被AI假文獻(xiàn)蒙騙,每經(jīng)獨家對話親歷者、《柳葉刀》文章作者M(jìn)axim Topaz

0
分享至


2026年5月,《柳葉刀》刊發(fā)的一篇“AI引文造假”文章(correspondence,通訊稿件),在中國的醫(yī)學(xué)科研圈火了。

基于對PubMed Central(一個美國網(wǎng)上醫(yī)學(xué)文獻(xiàn)檢索系統(tǒng))收錄的約250萬篇生物醫(yī)學(xué)論文開展的篩查,這篇文章指出,過去幾年生物醫(yī)學(xué)論文參考文獻(xiàn)造假率漲幅超12倍,2023年每萬篇論文約出現(xiàn)4條偽造參考文獻(xiàn),到2026年初達(dá)到每萬篇56.9條。

有意思的是,該項研究牽頭人Maxim Topaz不僅是哥倫比亞大學(xué)護(hù)理學(xué)院副教授、醫(yī)療AI研究員,還是全球前2%頂尖科學(xué)家。但即便是這位常年和AI(人工智能)打交道的專家,也曾在評論寫作中被一篇AI生成的虛假文獻(xiàn)“唬”過。

對此,我們能做什么?《每日經(jīng)濟新聞》記者(以下簡稱“NBD”)就此專訪了Maxim Topaz,以下是采訪實錄。

虛假引文遍布各類文獻(xiàn),98.4%的問題論文未被更正或撤稿

NBD:是什么契機或經(jīng)歷,讓你開始關(guān)注生物醫(yī)學(xué)論文中的引文造假問題?

Maxim Topaz:一切源于我自身的一次“驚險經(jīng)歷”。當(dāng)時,我借助人工智能聊天工具,為一篇擬投向期刊的評論潤色。我本身從事人工智能研究,清楚人工智能存在“幻覺”問題,因此特意核對了所有引文,確保內(nèi)容準(zhǔn)確。即便經(jīng)過多輪修改與自查,期刊編輯還是就其中一篇參考文獻(xiàn)提出了質(zhì)疑。原來這款人工智能工具悄悄植入了一條虛假文獻(xiàn),而我此前的核查并未發(fā)現(xiàn)。

這件事讓我深受觸動。比起失誤本身,更值得警惕的是背后的隱患:連常年和人工智能打交道的專業(yè)人士都會中招,普通研究者自然也難以幸免。于是我萌生了調(diào)研的想法。此前,從未有人統(tǒng)計過虛假引文最終流入經(jīng)過同行評審、正式發(fā)表文獻(xiàn)的比例,而參考文獻(xiàn)是整個科學(xué)體系的根基。一旦引文失去可信度,整個科研大廈都會搖搖欲墜。我們團(tuán)隊正是為了填補這一研究空白,開展了此次調(diào)研。

NBD:你同時任職于哥倫比亞大學(xué)護(hù)理學(xué)院與數(shù)據(jù)科學(xué)研究所,這種跨學(xué)科背景對搭建這套自動化引文核驗系統(tǒng)起到了哪些關(guān)鍵作用?團(tuán)隊在研發(fā)過程中遇到的最大技術(shù)難題是什么?

Maxim Topaz:臨床醫(yī)學(xué)與數(shù)據(jù)科學(xué)兩大領(lǐng)域的專業(yè)能力缺一不可。臨床醫(yī)學(xué)知識能幫助團(tuán)隊判斷哪些問題會造成實際影響,同時掌握不同細(xì)分領(lǐng)域正規(guī)引文的特征,以此區(qū)分普通引文錯誤和惡意造假;數(shù)據(jù)科學(xué)技術(shù)則讓大規(guī)模自動化核驗成為可能,徹底擺脫人工核查的局限。

研發(fā)過程中最大的技術(shù)難題是誤判問題。本次需核驗的參考文獻(xiàn)超過9700萬條,哪怕系統(tǒng)的誤判率極低,也會產(chǎn)生海量錯誤預(yù)警信息。我們面臨的核心挑戰(zhàn)是精準(zhǔn)區(qū)分蓄意造假、無心筆誤,以及標(biāo)題簡寫等正常格式問題。

對此,團(tuán)隊搭建了多層級核驗流程,其中包含大語言模型初篩環(huán)節(jié),并邀請獨立人工審核人員對結(jié)果進(jìn)行校驗,最終系統(tǒng)準(zhǔn)確率達(dá)到91%。在海量數(shù)據(jù)下打造一套可靠、可信的核驗系統(tǒng),是整個項目最難攻克的一關(guān)。

NBD:本次核查覆蓋約250萬篇生物醫(yī)學(xué)論文、1.25億條參考文獻(xiàn),為何選擇開展如此大規(guī)模的分析?業(yè)內(nèi)此前對引文造假的認(rèn)知,和你們調(diào)研得出的實際情況存在多大差距?

Maxim Topaz:之所以開展大規(guī)模調(diào)研,是因為單篇論文的引文造假發(fā)生率本就偏低,僅憑個別案例無法得出可靠結(jié)論。我們本次共核查2471758篇開放獲取論文、超過1.25億條參考文獻(xiàn),只有這樣才能統(tǒng)計出造假問題的整體發(fā)生率,更重要的是梳理出其長期變化趨勢。

業(yè)內(nèi)過往認(rèn)知與現(xiàn)實情況相差極大。此前,大家普遍認(rèn)為引文造假只是個別作者品行不端,或是寫作疏忽導(dǎo)致的小眾問題。但數(shù)據(jù)顯示,虛假引文如今已遍布各類生物醫(yī)學(xué)文獻(xiàn);自2023年至今,引文造假率漲幅超12倍。在本次核查開展時,98.4%存在造假引文的論文既未被更正,也未被撤稿。簡言之,這一問題的嚴(yán)重程度、整改滯后性都遠(yuǎn)遠(yuǎn)超出了行業(yè)以往的預(yù)判。


2023年1月至2026年2月,PubMed Central每萬篇論文的偽造參考文獻(xiàn)季度發(fā)生率

圖片來源:文章《偽造引用:對250萬篇生物醫(yī)學(xué)論文的核查分析》

綜述論文是引文造假重災(zāi)區(qū),將誤導(dǎo)醫(yī)生和政策制定者

NBD:為何引文造假率從2024年年中開始急劇攀升?在你看來,主要誘因是人工智能、論文代寫產(chǎn)業(yè)鏈,還是期刊評審流程存在漏洞?

Maxim Topaz:時間節(jié)點很有指向性。大型語言模型在2022年末至2023年開始全面普及,而生物醫(yī)學(xué)論文從投稿到發(fā)表通常需要100至200天。因此,借助人工智能輔助撰寫的論文,從2024年年中起開始大量出現(xiàn)在美國國立醫(yī)學(xué)圖書館數(shù)據(jù)庫中。這也恰好是造假率驟增的轉(zhuǎn)折點。

需要說明的是,本次研究僅證實了問題的存在,并未直接界定成因。論文代寫產(chǎn)業(yè)泛濫、期刊索引規(guī)則與評審機制的變化,同樣推高了造假比例,且各類因素相互疊加:正是因為期刊缺乏有效的核驗環(huán)節(jié),人工智能生成或代寫產(chǎn)業(yè)鏈產(chǎn)出的虛假引文才得以順利發(fā)表。

因此,無法將問題歸咎于單一原因。客觀來講,人工智能讓編造引文變得輕而易舉,而現(xiàn)行的審核機制原本就沒有針對這類造假設(shè)計排查手段。

NBD:和以往人為編造的引文相比,人工智能生成的虛假引文有哪些核心差異?又會帶來哪些更廣泛的影響?

Maxim Topaz:二者最本質(zhì)的區(qū)別在于錯誤類型。過去的引文問題多是粗心導(dǎo)致的疏漏,比如頁碼寫錯、文獻(xiàn)觀點引用有誤,但被引用的文章本身是真實存在的。

如今人工智能生成的引文對應(yīng)的文獻(xiàn)完全子虛烏有。這些假引文格式規(guī)范,署上真實且業(yè)內(nèi)知名的研究者姓名,貼合論文主題,發(fā)表日期也設(shè)置得合情合理,足以蒙混過初步檢查,常規(guī)的同行評審也往往難以識破。

其深遠(yuǎn)危害在于,引文本是科研人員驗證研究結(jié)論的核心依據(jù),如今大規(guī)模造假已成現(xiàn)實。問題從“引文內(nèi)容有誤”演變?yōu)椤耙梦墨I(xiàn)根本不存在”,這不再是證據(jù)質(zhì)量下降,而是直接切斷了科學(xué)論證的證據(jù)鏈。

NBD:在核查過程中,你們發(fā)現(xiàn)過最極端、最令人震驚的引文造假案例是什么?看到這些案例時,你有何感受?

Maxim Topaz:最典型的案例是2025年某開放獲取腫瘤學(xué)期刊上一篇聚焦細(xì)分外科領(lǐng)域的論文。在該論文經(jīng)核驗的30條參考文獻(xiàn)中,有18條為造假內(nèi)容。這些假引文精準(zhǔn)匹配論文研究方向,作者均為該領(lǐng)域真實專家,發(fā)表時間也集中在2023至2024年。

還有一個現(xiàn)象同樣值得警惕。在某期刊一年內(nèi)刊發(fā)的11篇論文中,反復(fù)出現(xiàn)兩位相同署名作者,這些論文包含15條虛假引文,且涉及多個互不相關(guān)的前沿研究領(lǐng)域。

比起單篇問題論文,我更擔(dān)憂這類批量造假的現(xiàn)象。更讓人不安的是,這些問題論文一直留在公開文獻(xiàn)庫中,還會被其他論文繼續(xù)引用,卻沒有任何標(biāo)注警示、更正說明,行業(yè)也未對此質(zhì)疑。

NBD:綜述類論文的引文造假率比其他類型論文高出57%,而綜述又是臨床診療指南的制定基礎(chǔ)。為何綜述類論文尤其容易遭到人工智能驅(qū)動的引文造假侵襲?

Maxim Topaz:多重因素疊加,讓綜述論文成為造假重災(zāi)區(qū)。首先,綜述的參考文獻(xiàn)列表篇幅更長,虛假引文更容易渾水摸魚;其次,撰寫綜述需要梳理、歸納大量文獻(xiàn),這也是研究者最常借助人工智能輔助的環(huán)節(jié),而該工作場景恰恰極易催生虛假引文。

此外,綜述處于整個科研證據(jù)鏈的上游:各類系統(tǒng)評價依托綜述撰寫,臨床診療指南又以系統(tǒng)評價為依據(jù)。我們的數(shù)據(jù)顯示,綜述論文每萬篇的引文造假數(shù)為16.7條,其他類型論文為10.6條。這57%的差距帶來的危害遠(yuǎn)比數(shù)字本身更大,綜述中的造假內(nèi)容不會止步于此,還會層層傳導(dǎo),最終影響臨床醫(yī)生和政策制定者依賴的核心證據(jù)體系。

若業(yè)界不及時管控,文獻(xiàn)庫污染恐將難以逆轉(zhuǎn)

NBD:虛假引文會如何誤導(dǎo)臨床決策、威脅患者安全?醫(yī)學(xué)界是否低估了這類現(xiàn)實風(fēng)險?

Maxim Topaz:虛假引文會沿著完整的證據(jù)鏈產(chǎn)生負(fù)面影響。臨床診療指南依托系統(tǒng)評價制定,目前已有證據(jù)證實,部分代寫論文已被納入撰寫指南所用的系統(tǒng)評價中。如果一份指南引用的論文本身含有大量虛假引文,那么其提出的治療方案就失去了應(yīng)有的科學(xué)支撐。

需要明確的是,我們并未追蹤患者的實際診療結(jié)果,因此無法量化虛假引文直接造成的醫(yī)療傷害,也不會妄下此類論斷。但現(xiàn)有科研證據(jù)體系存在結(jié)構(gòu)性風(fēng)險,且這一風(fēng)險確實被醫(yī)學(xué)界低估了。

已有系統(tǒng)評價發(fā)現(xiàn),醫(yī)學(xué)論文中約四分之一的參考文獻(xiàn)存在各類錯誤,這足以說明,參考文獻(xiàn)核驗并非同行評審的常規(guī)環(huán)節(jié)。連普通的引文錯誤都無法全面排查,想要識破精心偽裝的人工智能造假引文,自然難上加難。

NBD:你們的研究為行業(yè)提出了四項改進(jìn)建議。在你看來,目前哪一項建議最為緊迫,卻又最難落地?主要阻礙是什么?

Maxim Topaz:當(dāng)下最緊迫的是第一條建議,即期刊出版商需在同行評審啟動前,將自動化引文核驗納入論文投稿流程。目前相關(guān)技術(shù)已經(jīng)成熟,落地障礙并非技術(shù)問題,而是體制與成本問題。出版商需要投入資金、調(diào)整沿用已久的工作流程,這也是該建議看似可行、推進(jìn)起來卻阻力重重的原因。

而落地難度最大的是對已發(fā)表文獻(xiàn)開展回溯清理。對數(shù)百萬篇存量論文逐一篩查、發(fā)布更正內(nèi)容,需要高昂成本;且沒有任何一家機構(gòu)愿意全權(quán)負(fù)責(zé)這項工作,同時學(xué)界也缺乏動力去復(fù)盤、修正已經(jīng)刊發(fā)的論文。

總結(jié)來說,當(dāng)下最該立刻推進(jìn)的是在投稿環(huán)節(jié)落實事前引文核驗;而最難完成的是清理早已被污染的存量學(xué)術(shù)文獻(xiàn)。

NBD:作為率先系統(tǒng)性揭露生物醫(yī)學(xué)領(lǐng)域引文造假危機的學(xué)者,未來3至5年,你對整個行業(yè)最大的擔(dān)憂是什么?你呼吁全球科研界、期刊出版商及監(jiān)管機構(gòu)立刻采取哪一項行動?

Maxim Topaz:我最大的擔(dān)憂是形成惡性循環(huán)。一篇含虛假引文的論文發(fā)表后,會被后續(xù)新論文繼續(xù)引用,甚至被用于訓(xùn)練新一代人工智能模型,進(jìn)而讓造假內(nèi)容不斷傳播、放大。若不及時管控,文獻(xiàn)庫被污染的速度會遠(yuǎn)遠(yuǎn)超過清理修復(fù)的速度。

我向全球科研界、出版商和監(jiān)管機構(gòu)呼吁,立刻落實一項舉措:將自動化引文核驗定為同行評審前的標(biāo)準(zhǔn)流程。

直白來講,問題的根源是未經(jīng)核查的人工智能生成內(nèi)容流入永久學(xué)術(shù)文獻(xiàn)。我們并非要禁止使用人工智能工具,而是要把核驗環(huán)節(jié)嵌入整個工作流程。人工智能本身并非隱患,真正的風(fēng)險是任由未經(jīng)審核的人工智能產(chǎn)出內(nèi)容,并堂而皇之地進(jìn)入學(xué)術(shù)體系。

策劃|何強 郭榮村 金喆

統(tǒng)籌|易啟江

記者|林姿辰

編輯|黃博文

視覺|鄒利

排版|黃博文


|每日經(jīng)濟新聞 nbdnews 原創(chuàng)文章|

未經(jīng)許可禁止轉(zhuǎn)載、摘編、復(fù)制及鏡像等使用

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
日本的報應(yīng)來了!中國再一次詮釋了什么叫“不戰(zhàn)而屈人之兵”!

日本的報應(yīng)來了!中國再一次詮釋了什么叫“不戰(zhàn)而屈人之兵”!

薛小榮
2026-06-16 13:36:04
全英超看傻!6400 萬水貨連沙特都踢不明白,利物浦還要撿回來!

全英超看傻!6400 萬水貨連沙特都踢不明白,利物浦還要撿回來!

奶蓋熊本熊
2026-06-16 01:31:01
王毅將出席國新辦新聞發(fā)布會

王毅將出席國新辦新聞發(fā)布會

新京報
2026-06-16 16:46:29
原來他是梁洛施男友,是我們熟悉的他,比李澤楷小16歲帥氣有才華

原來他是梁洛施男友,是我們熟悉的他,比李澤楷小16歲帥氣有才華

一娛三分地
2026-06-15 21:48:37
高市早苗接班人浮現(xiàn)!專家:一旦他上臺,中日關(guān)系將重大迎利好

高市早苗接班人浮現(xiàn)!專家:一旦他上臺,中日關(guān)系將重大迎利好

共工之錨
2026-06-16 00:31:27
人民幣突然大漲!有存款的人偷著樂,4類人直接受益,2類人要留心

人民幣突然大漲!有存款的人偷著樂,4類人直接受益,2類人要留心

王二哥老搞笑
2026-06-16 15:09:16
日本打工人爽了!

日本打工人爽了!

東京在線
2026-06-15 15:52:28
臺媒集體炸鍋,直呼臺灣海峽沒了

臺媒集體炸鍋,直呼臺灣海峽沒了

果媽聊娛樂
2026-06-14 18:45:19
真的錯怪國足了?當(dāng)18強賽“死亡之組”的真相在世界杯賽場上演

真的錯怪國足了?當(dāng)18強賽“死亡之組”的真相在世界杯賽場上演

智道足球
2026-06-16 14:24:31
4人離隊!全部奪冠!下一個愛德華茲

4人離隊!全部奪冠!下一個愛德華茲

籃球教學(xué)論壇
2026-06-16 16:22:28
在中國就得守中國的法律!山姆總部被約談!

在中國就得守中國的法律!山姆總部被約談!

看看新聞Knews
2026-06-15 14:30:30
那位差點改寫泰國歷史的長公主走了,小孩都能扛過去的病終結(jié)了她

那位差點改寫泰國歷史的長公主走了,小孩都能扛過去的病終結(jié)了她

普陀動物世界
2026-06-12 18:32:23
盧卡申科公開向澤連斯基道歉,烏克蘭海軍浴火重生

盧卡申科公開向澤連斯基道歉,烏克蘭海軍浴火重生

史政先鋒
2026-06-16 16:59:22
9天5板,A股又誕生一只翻倍牛股,10萬股民狂歡

9天5板,A股又誕生一只翻倍牛股,10萬股民狂歡

21世紀(jì)經(jīng)濟報道
2026-06-16 11:39:45
撤銷人民公社毀了毛主席的農(nóng)村工業(yè)化戰(zhàn)略?毀了兩條腿走路布局?

撤銷人民公社毀了毛主席的農(nóng)村工業(yè)化戰(zhàn)略?毀了兩條腿走路布局?

覃仕勇說史
2026-06-15 11:20:32
張鎮(zhèn)麟無畏“抱頭哥”稱謂,遼寧助教加盟浙江,廣廈男籃續(xù)約布朗

張鎮(zhèn)麟無畏“抱頭哥”稱謂,遼寧助教加盟浙江,廣廈男籃續(xù)約布朗

中國籃壇快訊
2026-06-16 16:45:11
大連新人4.6萬辦婚宴遇冰碴預(yù)制菜,酒店欠薪外購預(yù)制菜敷衍賓客

大連新人4.6萬辦婚宴遇冰碴預(yù)制菜,酒店欠薪外購預(yù)制菜敷衍賓客

齊魯壹點
2026-06-15 21:29:55
16年總冠軍含金量遭質(zhì)疑,勇騎球員連爆內(nèi)幕,勇士輸?shù)恼嬖?>
    </a>
        <h3>
      <a href=兵哥籃球故事
2026-06-16 11:30:16
地鐵上看見的,好漂亮,這顏值可以去當(dāng)明星了

地鐵上看見的,好漂亮,這顏值可以去當(dāng)明星了

阿芒娛樂說
2026-06-13 20:20:07
美國發(fā)話也不行,中方正式通告全球:打日本,中國具備“正當(dāng)性”

美國發(fā)話也不行,中方正式通告全球:打日本,中國具備“正當(dāng)性”

鳳語談
2026-05-28 12:13:58
2026-06-16 18:12:49
每日經(jīng)濟新聞 incentive-icons
每日經(jīng)濟新聞
中國主流財經(jīng)全媒體平臺。
1592908文章數(shù) 2726599關(guān)注度
往期回顧 全部

科技要聞

DeepSeek融資500億,梁文鋒牢牢握住控制權(quán)

頭條要聞

青海發(fā)生6.3級地震 多地網(wǎng)友反映有震感

頭條要聞

青海發(fā)生6.3級地震 多地網(wǎng)友反映有震感

體育要聞

身價5萬的門將,擋住了12億歐元的狂轟濫炸

娛樂要聞

吳文忻葬禮:2個女兒在靈堂內(nèi)茫然失措

財經(jīng)要聞

2萬億存款去哪兒了?

汽車要聞

smart #6上市后 竟然很少被討論參數(shù)

態(tài)度原創(chuàng)

健康
親子
本地
手機
公開課

粽子一次吃多少不傷胃?專家講解

親子要聞

女兒求后媽去開家長會,后媽會去嗎

本地新聞

這屆年輕人為什么都在找心流時刻?

手機要聞

本月發(fā)布!REDMI K90至尊版開啟預(yù)約:驍龍8E+最強風(fēng)冷

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版