最近在B站上很火的一個(gè)UP主,是耿同學(xué)講故事。這位公開(kāi)舉報(bào)學(xué)術(shù)大牛學(xué)術(shù)造假,短短數(shù)天已經(jīng)將數(shù)位院長(zhǎng)杰青拉下馬。
![]()
耿同學(xué)講故事截屏 圖源網(wǎng)絡(luò)
在學(xué)術(shù)圈里,耿同學(xué)的存在就仿佛梁山好漢一樣,是替天行道的化身。我們今天來(lái)詳細(xì)的講一講他究竟是怎么打假的,學(xué)術(shù)偵探究竟是什么樣的,以及一些其他的問(wèn)題。
首先,學(xué)術(shù)偵探是什么樣的?
學(xué)術(shù)偵探在國(guó)外早已經(jīng)非常成熟,耿同學(xué)可以說(shuō)是中國(guó)第1個(gè)公開(kāi)的半職業(yè)學(xué)術(shù)偵探——他聲稱自己是博士肄業(yè),目前應(yīng)該是全職UP主的狀態(tài),所以姑且稱之為半職業(yè)。真正做學(xué)術(shù)能夠做到國(guó)際級(jí)別的應(yīng)該都聽(tīng)過(guò)比如Elizabeth Bik(伊麗莎白比克)、Sholto David(肖托大衛(wèi))、Leonid Schneider(列昂尼德施耐德)、楊沐這幾位的名字,也都知道有一個(gè)平臺(tái)叫pubpeer專門(mén)用來(lái)討論這些可疑的論文,諸如science nature這樣的大期刊也會(huì)刊登同行的評(píng)論,討論學(xué)術(shù)不端問(wèn)題。
耿同學(xué)所做的和這些人幾乎一樣,只不過(guò)他應(yīng)該是第1位公開(kāi)的中國(guó)本土學(xué)術(shù)偵探(楊沐是華人,但是在哥大任教)。當(dāng)然,除了比較出名的大學(xué)術(shù)偵探外,還有無(wú)數(shù)活躍在pubpeer這樣的平臺(tái)上的無(wú)名英雄,亦如同一場(chǎng)戰(zhàn)役中有出名的大將軍,也有無(wú)聞的小士兵。
這些人的履歷和他們的工作都高度類似:本身也是研究人員,或者是前研究人員,熟悉各種各樣的套路,既包括常見(jiàn)的學(xué)術(shù)不端,也包括論文期刊評(píng)審的各個(gè)環(huán)節(jié)以及學(xué)術(shù)機(jī)構(gòu)的運(yùn)作方法。結(jié)合著自己的專業(yè)知識(shí)和經(jīng)驗(yàn),他們會(huì)在預(yù)印本平臺(tái)和電子期刊上檢查著論文,尋覓著造假的蛛絲馬跡,一旦發(fā)現(xiàn)便予以公開(kāi),要求期刊更正撤稿、機(jī)構(gòu)處理相關(guān)人員。
這一過(guò)程比想象中的要難很多。首先最根本的,你當(dāng)然可以指出問(wèn)題,但想要讓那些有權(quán)力處罰的人意識(shí)到這是問(wèn)題,并真的做出處罰,還是要有很多工作要做。學(xué)術(shù)大牛手握不少經(jīng)費(fèi),所屬的單位總是會(huì)有意識(shí)的庇護(hù)他們,大的期刊也不愿意撤下高引用量的論文,而且還有很多學(xué)者本身也引用過(guò)有問(wèn)題的論文,如果引用的部分有問(wèn)題,又被作為關(guān)鍵的信息使用在自己的論文里,那自己的論文也很危險(xiǎn),至少也意味著要被更正或者結(jié)論要被推翻。因此對(duì)于學(xué)術(shù)偵探而言,雖然他們查到的問(wèn)題可能顯而易見(jiàn),但處理起來(lái)并不容易。楊沐在2020年時(shí)盯上了天普大學(xué)的多明尼克普拉提科,一位研究阿爾茲海默癥的意大利裔學(xué)者,最終折騰到幾天前才終于把他的論文搞撤稿,整整時(shí)隔6年。
而且很多人雖然在做學(xué)術(shù),身處崇高的學(xué)術(shù)殿堂里,人品也不一定多高尚。學(xué)術(shù)偵探通常會(huì)面臨著打擊報(bào)復(fù)、恐嚇威脅,長(zhǎng)期干下去,精神壓力也不小。
通常情況下,學(xué)術(shù)偵探做這些行為不會(huì)有金錢(qián)的報(bào)酬,是純粹自帶干糧的,耿同學(xué)也爽快的表示自己需要靠帶貨掙錢(qián)。但也有例外:國(guó)外的科研機(jī)構(gòu)因造假受罰時(shí),是可能將一部分罰金分給學(xué)術(shù)偵探“吹哨人”的,在吹哨人本人受到攻擊、誹謗、威脅等情況時(shí)更是如此。比如肖托大衛(wèi)就舉報(bào)過(guò)著名的丹娜法伯癌癥研究所,該研究所隨后與美國(guó)政府達(dá)成了1500萬(wàn)美元的庭外和解,肖托大衛(wèi)分得263萬(wàn)。這其實(shí)是非常好的一件事,在國(guó)外也有制度化的趨勢(shì),只可惜對(duì)于耿同學(xué)而言,未免過(guò)于遙遠(yuǎn)。
然后我們?cè)賮?lái)說(shuō)一說(shuō)這些學(xué)術(shù)偵探通常是怎么工作的。
并不是所有的學(xué)術(shù)造假都可以容易查到,有些可以很難,甚至需要完全重復(fù)做對(duì)方做的實(shí)驗(yàn)才能查清,這需要巨大的資金和時(shí)間。因此這些學(xué)術(shù)偵探往往聚焦于那些“一眼假”的東西:圖片的復(fù)制、數(shù)據(jù)的偽造、AI的使用。這一模式最早是由比克確立下來(lái),她處理這樣一篇問(wèn)題論文大概只用一分多鐘左右,雖然不能保證篩查過(guò)的論文沒(méi)有別的問(wèn)題,但至少提供了一個(gè)快速篩查論文的途徑。
這些學(xué)術(shù)偵探幾乎清一色都是生物醫(yī)學(xué)科學(xué)領(lǐng)域,耿同學(xué)也是北航的生物醫(yī)學(xué)系博士畢業(yè)。這是因?yàn)檫@個(gè)學(xué)科的研究確實(shí)有容易造假的點(diǎn),最核心的就是圖片。
生物醫(yī)學(xué)往往需要用蛋白質(zhì)印跡法對(duì)蛋白質(zhì)進(jìn)行測(cè)量,測(cè)量的結(jié)果用圖像表征出來(lái),大致是白底上的一塊一塊黑色圖像,即所謂的蛋白質(zhì)印跡。因?yàn)檫@些圖像就是一個(gè)一個(gè)大致矩形的黑色塊,于是某些“不法分子”就會(huì)用復(fù)制粘貼的手段,偽造這些印記,最終把蛋白質(zhì)印跡變成自己希望出現(xiàn)的樣子。當(dāng)然,除了單純復(fù)制粘貼之外,也會(huì)有些人耍點(diǎn)小聰明,比如對(duì)圖像進(jìn)行拉伸、反轉(zhuǎn)、更改亮度等,不過(guò)雖說(shuō)如此,這些印記仍然與原來(lái)的印記高度相似,關(guān)鍵的特征仍然存在。所以如果被用來(lái)表征不同的蛋白質(zhì),就可以確定是偽造的了。
我們來(lái)看楊沐等人對(duì)剛才提到的多米尼克普拉提克的問(wèn)題論文的審查:
![]()
在上面的一張圖里,左側(cè)是普拉提克18年在aging cell期刊上發(fā)表的文章,右邊的圖像則發(fā)表在15年的文章。我們可以看到,雖然屬于不同的實(shí)驗(yàn),不同的樣本,較寬的紅框里的8個(gè)蛋白質(zhì)印跡和較窄的紅框里的4個(gè)印跡形狀都是相似的,尤其是較窄的紅框,基本上是原來(lái)的模樣復(fù)制了過(guò)來(lái)。下圖中的紅框里的印記出現(xiàn)在19年普拉提克發(fā)表在分子神經(jīng)生物學(xué)期刊的論文里,也是在表征不同的蛋白質(zhì),但圖像也一模一樣。
還有就是顯微鏡圖片。細(xì)胞圖片其實(shí)看起來(lái)大同小異,所以某些人就重復(fù)粘貼,當(dāng)然狡猾一點(diǎn)的也會(huì)做一些翻轉(zhuǎn)、變形、調(diào)對(duì)比度之類的處理,還會(huì)故意只在一張圖片中的一部分使用復(fù)制的圖像,其他部分或是真實(shí),或是用AI擴(kuò)圖,總之圖片半真半假。當(dāng)然也正如蛋白質(zhì)印跡的造假,仔細(xì)看也是可以看出圖像的重復(fù)問(wèn)題的:
![]()
這是由比克指出的普拉提克問(wèn)題論文中的問(wèn)題:所有涂成同一顏色的方框里的圖像都一模一樣,還有一些標(biāo)了箭頭的來(lái)向讀者提醒圖像翻轉(zhuǎn)的結(jié)果。普拉提克這樣的操作非常典型。
接下來(lái)就是數(shù)據(jù)。這一點(diǎn)耿同學(xué)做的就已經(jīng)非常典型:不同實(shí)驗(yàn)的數(shù)據(jù),最后一位的值應(yīng)該是隨機(jī)的,因?yàn)檫@一位往往是估讀值而不是準(zhǔn)確值。比如我們用普通的格尺來(lái)測(cè)量,格尺上的最小分度值是一毫米,那我們正常測(cè)出來(lái)的結(jié)果應(yīng)該是某某.某毫米,小數(shù)點(diǎn)后的那位就是估讀的。因此,對(duì)于一組五六個(gè)數(shù)據(jù),從第一個(gè)數(shù)據(jù)到最后一個(gè)數(shù)據(jù)最后一位一模一樣,或者按照同樣的方式排列的可能微乎其微。而人們?cè)谠旒贁?shù)據(jù)的時(shí)候,很少會(huì)一個(gè)一個(gè)的去偽造,那樣時(shí)間太長(zhǎng),比較省事的是把Excel表格拿過(guò)來(lái)一拉,通通都加上或者減去或者都乘除一個(gè)特定的值,因此他們與其他的數(shù)據(jù)比末位或是雷同,或是有著統(tǒng)一的加減乘除數(shù)量關(guān)系,比如都加了1。
![]()
比如我們看耿同學(xué)對(duì)上大學(xué)者蘇某的舉報(bào)。真正做實(shí)驗(yàn)出現(xiàn)這樣的數(shù)據(jù),結(jié)果幾乎為零。再比如說(shuō)這樣的:
![]()
之后就是用AI做的偽造,不過(guò)這個(gè)也越來(lái)越難。首先現(xiàn)在的AI水平越來(lái)越高,生成的文字越來(lái)越不帶AI的特征,而且也確實(shí)有不少期刊是允許使用者使用AI的。雖說(shuō)如此,仍然有很多低級(jí)錯(cuò)誤是不應(yīng)該出現(xiàn)的,比如出現(xiàn)了AI大語(yǔ)言模型回答的套語(yǔ),這顯然不是我們正常寫(xiě)文章時(shí)會(huì)用的詞。
我們也有必要強(qiáng)調(diào)幾點(diǎn):
首先,這樣的篩查并不能保證排查出所有的造假,實(shí)際上只是能夠排查出用特定方法進(jìn)行的學(xué)術(shù)不端。比如說(shuō)我在本科時(shí)就遇到過(guò)這樣的事:讓我們用印度的衛(wèi)星導(dǎo)航系統(tǒng)的數(shù)據(jù),但是印度的衛(wèi)星數(shù)據(jù)不好看,于是老師便指示學(xué)生使用了美國(guó)GPS衛(wèi)星的導(dǎo)航數(shù)據(jù),掛了印度的羊頭,賣(mài)了美國(guó)的狗肉。我最終沒(méi)有在這項(xiàng)研究上署名,只是給同學(xué)幫了點(diǎn)忙,算是沒(méi)有失節(jié)。不過(guò)這樣的造假只有可能是我們自己知道,用耿同學(xué)這些人的方法是查不出來(lái)的,畢竟我們的數(shù)據(jù)并不是憑空偽造的,只是換了個(gè)不正確的名字而已。
其次就是耿同學(xué)他們這樣做是有專業(yè)性的。比如說(shuō)顯微鏡圖片,如果是在同一張載玻片上取不同位置的圖片,那在某些地方出現(xiàn)重復(fù)其實(shí)也是可以理解的。也就是說(shuō),單純靠圖像的重復(fù),其實(shí)不足以成為造假的證據(jù),關(guān)鍵還是需要依靠學(xué)術(shù)偵探的專業(yè)水平來(lái)判斷到底有沒(méi)有合理的解釋能夠出現(xiàn)這樣的情況,除了偽造之外,是否不可能用其他方式產(chǎn)生這樣的圖像。因此恐怕不是什么人想做都能做的,學(xué)術(shù)偵探的專業(yè)水平不能次于一般的研究者,否則確實(shí)會(huì)誤傷無(wú)辜。
由此便說(shuō)到第3點(diǎn):這樣的學(xué)術(shù)打假工作有沒(méi)有可能借助AI之類的科技賦能手段高效的完成呢?答曰是有困難的。正如第2條所說(shuō),學(xué)術(shù)打假人的學(xué)術(shù)水平不能次于一般水平,要能夠區(qū)分出正常的重復(fù)以及非正常的重復(fù)。所以用AI檢查圖像是否重復(fù),數(shù)據(jù)是否雷同,很簡(jiǎn)單,但關(guān)鍵是要能夠說(shuō)明這背后真的意味著學(xué)術(shù)不端。現(xiàn)在的AI距離這個(gè)還有相當(dāng)大的差距。
還有就是,其實(shí)我們本不需要這樣的學(xué)術(shù)偵探。他們做的這些工作,學(xué)者所在的工作單位和投稿的期刊、期刊邀請(qǐng)的同行審稿人做起來(lái)要容易很多。學(xué)術(shù)偵探只能以同行的身份提出質(zhì)疑,卻無(wú)權(quán)開(kāi)展調(diào)查,無(wú)權(quán)要求公開(kāi)相關(guān)數(shù)據(jù)。這些科研機(jī)構(gòu)和期刊做起來(lái)都是順理成章的,科研機(jī)構(gòu)自不必說(shuō),很多頂尖期刊投稿時(shí)也都要求同時(shí)上交原始數(shù)據(jù)。所以恰恰是因?yàn)樗麄儧](méi)有做好本職工作,才能讓學(xué)術(shù)偵探有出來(lái)工作的必要。
說(shuō)完這個(gè),再說(shuō)一下耿同學(xué)本身。我特別喜歡的是他的爽快:“接廣告是為了掙錢(qián),罵杰青是為了爽。”
光是坦承掙錢(qián),就不知?jiǎng)龠^(guò)多少扭捏作態(tài)的人。而且他也不只純粹的“罵”,他也算是言必有中的,跟某A這種胡編亂造的比起來(lái)簡(jiǎn)直沒(méi)有任何可比性(這世上有胃移植手術(shù)這么個(gè)東西嗎)。總有些人不愿意談錢(qián),但事實(shí)也是所有人都離不開(kāi)錢(qián),掙錢(qián)吃飯,若是不偷不搶,有何可避諱?但這點(diǎn)不是所有人能明白的。王夷甫不稱錢(qián)為錢(qián),非要說(shuō)是阿堵物,彼以為雅,我以為俗:矯情。
倒是鄭板橋爽快,賣(mài)字賣(mài)畫(huà),明碼標(biāo)價(jià):“大幅六兩、中幅四兩、小幅二兩、豎條對(duì)聯(lián)一兩、扇子斗方5錢(qián)。凡送禮物食物總不如白銀為妙,公之所送,未必弟之所好也。送現(xiàn)銀則中心喜樂(lè),書(shū)畫(huà)均佳。禮物既屬糾纏,賒欠尤為賴賬,年老神倦,不能陪諸君子作,無(wú)益語(yǔ)言也。”民國(guó)的郭守廬也撰一對(duì)聯(lián)賣(mài)文:“妻不會(huì)賣(mài)乖鬻俏,子不會(huì)得勢(shì)拿權(quán),一支禿筆,與我生命相連。沒(méi)甚新鮮,為得金錢(qián);當(dāng)不上舊時(shí)名流,交不上時(shí)髦政客,沒(méi)字招牌,哪里有人認(rèn)得。管甚黑白,出張潤(rùn)格。”貌似自嘲,實(shí)在諷世,更妙。
所以這樣看來(lái),耿同學(xué)還真有點(diǎn)豪俠氣質(zhì),無(wú)非是武松這樣的大俠靠的是拳腳筋骨,他靠的是自己做學(xué)問(wèn)的經(jīng)驗(yàn)而已,至若坦蕩爽朗,則別無(wú)二致。我本人也偶爾動(dòng)心,想過(guò)這樣的生活,只可惜尚在樊籠里,留作來(lái)世未了因也。
作者:海北尬生,因其嘗求學(xué)于北海之北,每不顧環(huán)境而放尬言,故起此名也。喜航天,愛(ài)讀書(shū),本學(xué)理工,愛(ài)好文學(xué)。
~the end~
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.