去年秋天,華中一個人口超百萬的縣,某所中學的晚自習悄然發生了變化。作業平臺后臺顯示,學生提交答案的速度突然快了近三分之一,正確率還往上竄。班主任在群里夸“這屆孩子突然開竅了”,但緊接著的月考,全班平均分往下掉了兩成。老師們面面相覷,誰也沒往同一個答案源頭上想——直到研究者把30個月的追蹤數據攤開,才發現這一升一降背后,藏著AI進入課堂后最隱秘的代價。
這是一個覆蓋2.6萬余名中學生的研究,跨度從初一到高三。研究人員拿到了每月閉卷考成績、作業分數與完成時長,以及中考、高考等關鍵升學成績。他們還采集了學生自己報告的AI使用時間點——有人早,有人晚,恰好構成了一組天然對照。整個觀察期內,自稱用過AI的學生比例從幾乎為零飆升到八成左右,出現兩波明顯跳漲:一次是2024年9月DeepSeek V2.5發布,另一次是2025年1月DeepSeek R1上線。學生們最常用的工具依次是豆包、DeepSeek、ChatGLM、文心一言和通義千問。
![]()
用差分法剝離掉其它干擾后,研究者發現了一條清晰卻令人不安的軌跡:使用AI后六個月,學生作業平均分漲了18%,單次作業用時從64分鐘驟降到45分鐘。但幾乎在同一時間,閉卷月考的成績下降了20%。作業完成得又快又好,一關上書本就露餡,這種典型的“代勞”模式在數據里藏不住。
更扎心的數字來自升學考試。中考和高考的大考成績下跌幅度同樣達到18%至24%,但這個過程比月考慢得多。研究者發現,常規考試的成績滑坡半年內就能看得很清楚,而升學考試的全面影響,竟然要差不多兩年才會徹底浮出水面。也就是說,要是只跟蹤一個學期,很可能得出“AI對學習沒什么壞處”的錯誤結論。這正是短期評估最危險的地方。
研究進一步揪出了一個龐大的“代做群體”。持續使用AI超過五個月的學生中,約81%能在50分鐘內搞定作業,比不使用AI的最快一批學生還要迅速。他們作業成績亮眼,一到大考就崩盤。快速完工、高作業分、低考試分這三項疊在一起,研究團隊給出了直白的判斷:這些學生不是在用AI輔助學習,而是把學習直接外包給了AI。
但AI并非天生有害。數據里還有另一群使用者,他們用AI的時間和不用的同學差不多,考試分數并沒有受到負面影響,同時作業成績還有所提高。而且,這群人此前的基礎成績并無突出優勢,排除了“好學生本來就會用AI”的正向篩選解釋。問題不在于AI本身,而在于它有沒有替代了學生本該自己完成的思考。一旦AI從“助手”變成“槍手”,那些在作業上偷的懶,最終都會在兩年后的大考上結結實實地還回來。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.