這項研究名為“開放研究與證據中的系統置信度”(SCORE),經濟學、教育學、心理學及社會學等多個社會科學學科,865位研究人員對發表在這些學科的62種期刊上的論文做了詳細梳理。研究成果以三篇論文的形式發表在今年4月1日的《自然》期刊上,旨在開發出一套能夠對社會科學研究成果進行“置信度評分”的自動化工具。
對學術共同體來說,科學研究的可復現事關知識積累的基礎,它意味著若在相同條件下,對同一組數據進行完全相同的分析,理應得出完全一致的結論。可惜的是,研究人員在對這些論文的數據分析過程進行復現時發現,在他們重點關注的164項研究中,僅有49%的研究結果在統計學意義上得到了成功重現。
開放科學中心(Center for Open Science)的研究主管蒂姆·埃林頓(Tim Errington)表示,在“不發表,就出局”的整體學術環境下,這樣的結果并不令人太意外。或許對公眾來說,這一結果又成為本就遭遇嚴重質疑的“文科”危機新的鐵證。但埃林頓提醒,這并不必然表示當前的科研工作質量低劣。可能有少數研究結果的不可復現是由于學術不端等原因,但更普遍的原因可能是因為其未能提供足夠翔實的數據或者實驗細節。
![]()
電影《實驗者》劇照。
對此埃林頓強調,對于科研人員來說,應該注重更開放地共享數據,對采用的研究方法保持更高的透明度,更方便后人檢驗。此外,參考前人研究的學者們也要保持相當的批判和懷疑精神,不應對論文的結論“照單全收”。加拿大渥太華大學“可重復性研究所”(Institute for Replication)的創始人、經濟學家阿貝爾·布羅德爾(Abel Brodeur)就表示,他對新發表的論文總是持懷疑態度:“我通常會耐心等待數年,直到看到大量其他研究也進行了類似的分析并得出了相似的結果,我才會對某項特定的研究發現產生信心。”
與自然科學相比,社會科學領域的可復現性危機有其復雜性。社會科學研究的對象是人,人復雜的社會行為可能更難量化,受到的影響因素也會更多。全美學者協會(national association of scholars)的大衛·蘭道爾(David Randall)就表示,研究領域內部的“政治傾向”與“群體思維定勢”,以及前文提到的巨大發表壓力,也很容易導致大量不可重復的研究被批量炮制出來。
如何改善這樣的狀況,讓社會科學研究的精確性變得更高?蘭道爾指出,首先應該強化研究的預注冊機制,確保研究數據的開放性。更重要的是,要將研究的數據收集和分析環節分離,將其指派給不同的、相互獨立的研究人員負責。這并不僅僅是技術改變,蘭道爾認為,這涉及人文社科整體學術文化的一場巨變。比如,學術體制會面臨一個難題:如何在大規模的研究團隊中分配職位聘用、晉升的機會?如何進行獎勵?畢竟,在這樣的模式下,可能更難判定哪個環節的成員對研究有最大的功勞。更重要的是,對研究數據的嚴苛,可能讓社科研究變得更加昂貴。在一個世界范圍內的文科都遭遇經費緊張的時代,這是一個必須考慮的問題。
1. Half of social-science studies fail replication test in years-long project
https://www.nature.com/articles/d41586-026-00955-5
2. We Know Social Science Is Shoddy. It's Time to Actually Fix It
https://www.realclearscience.com/articles/2026/04/15/we_know_social_science_is_shoddy_its_time_to_actually_fix_it_1176655.html
3. Is AI leading to a reproducibility crisis in science?
https://www.nature.com/articles/d41586-023-03817-6
撰文/劉亞光
編輯/劉亞光
校對/楊利
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.