朱自清散文AI率超60%
畢業論文“證明自己是人”有多難?朱自清《荷塘月色》AI率超60%,學生被迫“降智”寫作
一篇寫于1927年的傳世散文,在近一個世紀后的大模型檢測工具面前,竟被判定為“機器生成”?
近日,“朱自清散文AI率超60%”的話題沖上熱搜,徹底撕開了高校AI查重領域的荒誕亂象。更讓無數學子崩潰的是:一個字一個字手寫的論文,在檢測系統面前被判AI率高達80%——寫完8000字證明自己不“水”還不夠,還得證明自己是“人”。
一、經典遭殃,學生崩潰
事情的起因并不復雜。有人將朱自清的名篇《荷塘月色》上傳至某AI內容檢測系統,結果令人咋舌——這篇寫作于近一個世紀前的散文,被判定AI生成內容的疑似度超過62%。
![]()
這不是孤例。在類似的測試中,劉慈欣《流浪地球》片段被測出超過52%的AI率;唐朝詩人王勃的《滕王閣序》更是被某些檢測軟件標上了接近百分之百的AI生成標簽。一篇駢文、一篇散文、一篇科幻小說,跨越一千多年的時間跨度,在算法眼中統統被歸為“疑似AI出品”。
如果說經典被誤判讓網友覺得“離譜”,那么大學生們的遭遇則是一場真實的畢業噩夢。
一名博主將純手寫的58000字論文提交知網AIGC檢測,單次花費120元,換來的AI率竟高達86.8%。飽含個人情感的致謝部分、客觀的研究技術描述部分被大面積標紅,學生的滿腔心血在算法的“審視”下被輕率地否定。
一位中文系大四學生小禾同樣遭遇了“反智”審查。她一個字一個字“手搓”的段落,被系統識別為AI創作。離譜的是,自己論文中引用的曹丕的詩詞,竟然也被判定為AI所寫。小禾無奈感嘆:“曹丕身處三國,要怎樣穿越才有AI?”
二、荒謬悖論:越像“人話”,越像AI
這場風波的核心,源于AIGC檢測工具底層邏輯的“水土不服”。
所謂AIGC檢測,簡單來說就是運用人工智能生成內容技術,從語言模式和語義邏輯等多個維度對論文文本進行分析比對,區分判定文本內容中“人工智能生成”的比例。
然而,規范的學術寫作本身就要求邏輯清晰、用詞準確、結構嚴謹——這些被學術訓練所塑造出的“優秀”文本特征,恰恰與AI通過海量數據訓練后生成的“完美”文本高度相似。一個令人哭笑不得的悖論就此誕生:寫作功底扎實、行文流暢、用詞豐富的學生,因文章“過于工整”而極易被判為AI生成;反倒是表達生澀、邏輯跳躍、甚至滿口“口水話”的文字,因為更“像人”而安全過關。
有網友用自己的親身經歷說明了算法的“偏執”:一篇英語作文只因用了一個高級詞“devoid”(缺乏),被判定AI率高達18%;而將這個詞換成更簡單的“without”之后,AI率瞬間歸零。
“越是人話,AI率越高”——這個被無數學子驗證過的“鐵律”,正在倒逼學生舍棄長久以來習得的嚴謹學術表達,自降維度去揣測、迎合機器的喜好。
三、被迫“反智”:放棄通順、故意寫“笨”
面對大學里嚴苛的AI率硬性門檻(文科不超過20%、理工醫科不超過15%),學生們被迫踏上了一場“反智”的修改攻堅戰。
網絡上流傳著各種“降AI率邪術”,其核心邏輯出奇一致:盡可能抹去文章的“學術感”與“邏輯性”。學生們總結出一套“奇葩”法則:少用專業術語,把“心肌梗死”改回“心臟肌肉因為缺血壞死”;刪掉“首先、其次、因此、綜上所述”這類邏輯連接詞;拆掉長句和排比句,干脆大白話。將飽含古韻的“xx之喜”改成“xx的快樂”,將文雅的“直抒胸臆”變成“直接抒發心中的情感”。一位學生甚至苦笑說,改完之后,早就忘了論文原本要表達什么,只記得如何“騙過”那套冷冰冰的檢測系統。
指導老師們對此也深感困惑:他們幫學生改得更規范、更學術化的語言,在檢測中往往被標紅;而學生為了過關故意寫出的啰嗦、生硬的“口水話”,反而能順利通關。這種“劣幣驅逐良幣”的現象,使得原本培養學術能力的寫作訓練,完全扭曲成了一場旨在“迎合機器喜好”的行為藝術。
四、產業鏈升級:“AI降AI”兩頭收割
更令人警惕的是,圍繞AI檢測的一整套灰色產業鏈已悄然成型。
當前,知網AIGC檢測單價為2元/千字符。在各大高校,AI檢測的結論被設為一紙“生死線”,直接關系到學生能否參加畢業論文的盲審與答辯。
于是,一條完美的“閉環生意”應運而生:一些AI查重平臺一邊推出“一鍵生成文獻綜述和論文大綱”的服務助長學生用AI速成論文,一邊又對賣力兜售“AI降重服務”,用AI降AI——寫論文靠它,檢測論文也是它,左右逢源、兩頭不虧。
在各大社交平臺上,所謂的“人工降重”商家公開叫賣,收費標準從千字幾元到十幾元不等。不過,有學生反映,把論文交給陌生賣家降重,還存在內容被轉賣的潛在風險。
五、“你的論文,AI來審判”:專家呼吁摒棄“唯AI率論”
針對當前的AI檢測亂象,不少專家認為應當從治本出發。
中南大學某講師表示,一篇論文質量好壞,關鍵仍在于學生有沒有自己的思考和原創性的洞見,這些是冰冷的算法無法觸及的領域。目前多數高校對于AI生成比例超標的處理,與對待查重這類明確學術不端的態度有所不同,大多仍以引導修改為主。這種審慎的處理方式也從側面反映出,業界學界已經意識到當下AI檢測技術的局限性。
歸根到底,學術的核心評價標準始終應該是論文的“思想深度”與“創新價值”,而不應是一串單薄冰冷的數字。有媒體評論犀利地指出, “你的論文,AI來審判”讓學生苦于自證,是將工具判斷凌駕于人的判斷之上。
不少高校也在探索更柔性的方案。南京航空航天大學教務處副處長李鑫表示,考慮到當前檢測技術精確性有限,學校將合格率定在40%是為了引導同學們合理使用大模型,同時不以是否通過AIGC檢測作為唯一評價依據。對于不通過AIGC檢測的論文,學校將組織專家通過論文評閱、學生答辯等方式綜合研判。
國際上的情況也不樂觀。相關研究表明,廣泛使用的AI檢測工具對非母語者的誤報率約達61%,因為檢測模型主要基于母語者的語料訓練,會將其相對較低的詞匯復雜度等特征誤判為AI痕跡。
復旦大學、中國傳媒大學等高校已經開始嘗試更加符合現實情況的處理方式——不將單一檢測數據當作絕對依據,而是結合論文內容和質量進行綜合研判。
技術的使命應當是解放人、成就人,而非束縛人、為難人。AI檢測工具本應只是一道輔助審核的屏障,而不應成為喧賓奪主的“終極裁判”。當冰冷的算法開始以單一標準裁決人類智慧的結晶,鼓勵學生打磨出“更不完美”的文字以求“安全過關”,這不僅是教育評價體系的悲哀,更是在AI重塑世界的當下,我們必須面對的深刻反思:機器越學越像人類,為什么人類寫作卻要反向“降智”來證明自己是人?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.