網易首頁 > 網易號 > 正文 申請入駐

頂會論文造假:50多篇ICLR論文怎么騙過同行評審的

0
分享至

當一篇論文的參考文獻有一半查無出處,它憑什么能通過兩輪評審?ICLR 2026的丑聞給出了一個令人不安的答案。

從法庭到頂會:同一種幻覺,同一種漏洞


法律界早就踩過這個坑。2023年的Mata v. Avianca案里,律師用ChatGPT寫訴狀,結果引用了六個根本不存在的判例。法官沒接受"我不懂AI"的借口,直接開出了制裁罰單。

這不是個案。研究顯示,即便是加了檢索增強(檢索增強生成,即讓模型先查資料再回答)的法律寫作工具,面對復雜查詢時也會捏造近三分之一的引用。而且這些不是實驗室原型,是正經在售的商業產品。

學者James把這類錯誤分成兩檔:

「誤植型」——曲解或錯引真實來源;「憑空捏造型」——直接發明案例、法條、引文。ICLR 2026的論文們兩樣都占了:有的把前人工作的基線性能寫錯,有的干脆引用不存在的數據集和"前人研究",搜索引擎根本抓不到。

核心問題被一句點破:大語言模型的優化目標是"下一個詞最像人話",不是"這句話為真"。指望下一代模型自動解決這個問題,屬于一廂情愿。

評審機制是怎么被攻破的

一個小型機器學習會議的程序主席講過一件事:一篇"明顯是AI寫的、打磨得很漂亮"的論文,差點騙過兩個超負荷工作的審稿人。最后是個志愿者發現,一半參考文獻根本解析不出來。ICLR 2026只是把這套劇本放大了。

技術層面,幻覺有幾條滲透路徑:

第一,"請總結X方向的相關工作"——這種提示詞會讓模型在不確定時依然輸出看似合理的綜述,夾帶私貨。

第二,虛構的會議名、數據集名、基準測試名,聽起來像真的。

第三,根本沒跑過的消融實驗,被寫成"我們嘗試了A/B/C三種設置"。

審稿人面對 polished 的文本,加上自身時間壓力,驗證動力天然不足。而生成式工具的輸出又恰好擅長"看起來對"。

責任該由誰扛?

法律學者Shamov的觀點值得注意:個人追責不夠,因為"經過認證"的工具本身就被證明不可靠。他主張責任分散到三層——工具開發商、機構/平臺、實際使用者。

學術出版完全對得上這個框架:

? 廠商做寫作和文獻工具

? 會議方定政策和評審流程

? 作者和審稿人選擇并驗證輸出

目前三層都在失靈。工具沒內置事實核查,會議沒針對AI寫作調整審稿標準,作者和審稿人則普遍缺乏驗證紀律。

清單:AI輔助研究的五條底線

既然幻覺是模型結構的內稟特性, workaround 必須從流程入手。參考法律和安全關鍵領域的做法,可以列出這幾條:

1. 參考文獻必須逐條核驗

不是抽查,是全部。用學術搜索引擎、期刊官網、作者個人頁交叉確認。ICLR 2026的造假論文里,"查無此文"的引用占了相當比例——這本是審稿環節就能攔截的。

2. 數據集和基準測試要驗證可獲取性

論文聲稱用了某個數據集?去官方倉庫下載試試。聲稱在某個基準上跑了分數?找 leaderboard 核對。很多幻覺數據集的名字起得很像真的,但域名、機構、年份對不上。

3. 消融實驗保留執行痕跡

代碼版本、隨機種子、運行日志。不是說作者都會造假,而是這些痕跡讓"聲稱跑過"變成"可以復現"。

4. 工具輸出標記與隔離

哪些段落是AI生成的初稿,哪些是經人工改寫的事實陳述,應當有明確區分。這不是為了懲罰使用AI,而是為了在出問題時快速定位。

5. 審稿流程增加對抗性檢查

現在的審稿是"找亮點",需要補一道"找硬傷"的工序。可以隨機抽取引用、數據集、實驗配置進行強制核驗,也可以引入專門的"紅隊"審稿人。

一個行業級的問題

ICLR 2026不是孤立事件。法律、安全、軟件工程都出現了同樣的模式:流暢的AI輸出被當作事實,治理規則跟不上技術擴散速度。

區別在于,法律界已經用判例和制裁建立了底線。學術界的反應還在"建議"和"倡導"層面。當一篇頂會論文的引用有50%是假的,它損害的不只是那屆會議的聲譽——而是整個同行評審制度的可信度。

如果明年的投稿系統不強制要求參考文獻哈希校驗,不接入數據集注冊表,我們是在等下一個ICLR 2027嗎?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
太陽報:在輸給曼城后,阿爾特塔給全隊放了兩天假

太陽報:在輸給曼城后,阿爾特塔給全隊放了兩天假

懂球帝
2026-04-24 09:27:09
華為系“圍獵”小米

華為系“圍獵”小米

電動汽車觀察家
2026-04-23 15:21:05
金融大老虎蔡鄂生的桃色往事

金融大老虎蔡鄂生的桃色往事

資本董事局
2026-04-23 20:46:15
交通部官宣:6月1日起,私家車跑順風車全面合法,不用辦證

交通部官宣:6月1日起,私家車跑順風車全面合法,不用辦證

記錄生活日常阿蜴
2026-04-24 08:12:12
張文宏談長壽:決定壽命的不一定是基因!做好4件事,活100歲也不稀奇

張文宏談長壽:決定壽命的不一定是基因!做好4件事,活100歲也不稀奇

人民日報健康客戶端
2026-04-24 07:37:43
烏度卡:G3要打出更快節奏,要讓對手瘋狂包夾杜蘭特付出代價

烏度卡:G3要打出更快節奏,要讓對手瘋狂包夾杜蘭特付出代價

懂球帝
2026-04-24 13:40:08
何潤東亮相蘇超后爆火!沒收一分錢出場費,格局不是一般明星能比

何潤東亮相蘇超后爆火!沒收一分錢出場費,格局不是一般明星能比

洲洲影視娛評
2026-04-22 16:13:43
老球王戴維斯:我不想貶低丁俊暉,但誰都知道趙心童是更好的球員

老球王戴維斯:我不想貶低丁俊暉,但誰都知道趙心童是更好的球員

楊華評論
2026-04-24 03:04:33
G3輸猛龍!阿特金森直指核心被限制+不滿末節防守,米切爾談攻守

G3輸猛龍!阿特金森直指核心被限制+不滿末節防守,米切爾談攻守

籃球資訊達人
2026-04-24 12:05:27
1.5億打了20分被棄用!為了鐵人稱號,常規賽全勤,季后賽沒勁了

1.5億打了20分被棄用!為了鐵人稱號,常規賽全勤,季后賽沒勁了

你的籃球頻道
2026-04-24 12:18:36
永遠不會倒閉的四大行業,選對一輩子衣食無憂!

永遠不會倒閉的四大行業,選對一輩子衣食無憂!

細說職場
2026-04-08 06:22:58
98年劉平平成為植物人,王光美哭成淚人,劉源將姐姐接到家里照顧

98年劉平平成為植物人,王光美哭成淚人,劉源將姐姐接到家里照顧

雍親王府
2026-04-24 10:15:06
演員文章開飯店,爆火不到3天便遇“滑鐵盧”,糟心事一件接一件

演員文章開飯店,爆火不到3天便遇“滑鐵盧”,糟心事一件接一件

復轉這些年
2026-04-23 22:17:29
西安事變死了多少人?難怪蔣介石關押張學良一輩子

西安事變死了多少人?難怪蔣介石關押張學良一輩子

雍親王府
2026-04-24 10:55:11
白人女性與黑人女性的體味差異,網友真實分享引發熱議

白人女性與黑人女性的體味差異,網友真實分享引發熱議

特約前排觀眾
2025-12-22 00:20:06
中國中鐵工程局黨委書記、董事長,總經理、黨委副書記調整,均由其他單位調任!

中國中鐵工程局黨委書記、董事長,總經理、黨委副書記調整,均由其他單位調任!

新浪財經
2026-04-24 01:08:56
陳毅接管上海卻鎮不住場子,陳賡推薦了一個人,讓他徹底放下了心

陳毅接管上海卻鎮不住場子,陳賡推薦了一個人,讓他徹底放下了心

老謝談史
2026-04-23 05:24:38
ESPN:唐斯表達長期留隊意愿 季后賽表現或將決定是否留隊

ESPN:唐斯表達長期留隊意愿 季后賽表現或將決定是否留隊

北青網-北京青年報
2026-04-24 13:56:04
新疆生產建設兵團建設工程(集團)原董事長夏建國被查

新疆生產建設兵團建設工程(集團)原董事長夏建國被查

新京報
2026-04-24 10:13:29
繼人民日報發聲后,官媒再次三問董宇輝,言辭犀利,字字揭他老底

繼人民日報發聲后,官媒再次三問董宇輝,言辭犀利,字字揭他老底

離離言幾許
2026-04-23 20:04:00
2026-04-24 14:16:49
薛定諤的BUG
薛定諤的BUG
有態度網友ytd
1713文章數 37關注度
往期回顧 全部

頭條要聞

華誼兄弟被申請破產:曾坐擁百位明星 如今還不起千萬

頭條要聞

華誼兄弟被申請破產:曾坐擁百位明星 如今還不起千萬

體育要聞

里程碑之戰拖后腿,哈登18分8失誤

娛樂要聞

王思聰被綠!戀愛期間女友被金主包養

財經要聞

19家企業要"鋁代銅",格力偏不

科技要聞

剛剛,DeepSeek-V4 預覽版發布 百萬上下文

汽車要聞

全景iDrive 續航近800km 新款寶馬7系/i7亮相

態度原創

教育
旅游
數碼
房產
公開課

教育要聞

告訴孩子:千萬不要被4種朋友借運,后果比早戀可怕100倍

旅游要聞

“經典IP+特色文化”擦亮文旅金字招牌 特色品牌旅游專列圈粉國內外游客

數碼要聞

專訪巴可王紅波:顯示行業競爭下半場,深耕八大垂直行業與構建共贏生態

房產要聞

三亞安居房,突然官宣!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版