網易首頁 > 網易號 > 正文申請入駐

2.6萬學生兩年追蹤：用AI寫作業，考試分數為何暴跌24%

2026-07-05 02:11:24　來源: 碳基打工人

北京舉報

分享至

去年秋天，華中一個人口超百萬的縣，某所中學的晚自習悄然發生了變化。作業平臺后臺顯示，學生提交答案的速度突然快了近三分之一，正確率還往上竄。班主任在群里夸“這屆孩子突然開竅了”，但緊接著的月考，全班平均分往下掉了兩成。老師們面面相覷，誰也沒往同一個答案源頭上想——直到研究者把30個月的追蹤數據攤開，才發現這一升一降背后，藏著AI進入課堂后最隱秘的代價。

這是一個覆蓋2.6萬余名中學生的研究，跨度從初一到高三。研究人員拿到了每月閉卷考成績、作業分數與完成時長，以及中考、高考等關鍵升學成績。他們還采集了學生自己報告的AI使用時間點——有人早，有人晚，恰好構成了一組天然對照。整個觀察期內，自稱用過AI的學生比例從幾乎為零飆升到八成左右，出現兩波明顯跳漲：一次是2024年9月DeepSeek V2.5發布，另一次是2025年1月DeepSeek R1上線。學生們最常用的工具依次是豆包、DeepSeek、ChatGLM、文心一言和通義千問。

用差分法剝離掉其它干擾后，研究者發現了一條清晰卻令人不安的軌跡：使用AI后六個月，學生作業平均分漲了18%，單次作業用時從64分鐘驟降到45分鐘。但幾乎在同一時間，閉卷月考的成績下降了20%。作業完成得又快又好，一關上書本就露餡，這種典型的“代勞”模式在數據里藏不住。

更扎心的數字來自升學考試。中考和高考的大考成績下跌幅度同樣達到18%至24%，但這個過程比月考慢得多。研究者發現，常規考試的成績滑坡半年內就能看得很清楚，而升學考試的全面影響，竟然要差不多兩年才會徹底浮出水面。也就是說，要是只跟蹤一個學期，很可能得出“AI對學習沒什么壞處”的錯誤結論。這正是短期評估最危險的地方。

研究進一步揪出了一個龐大的“代做群體”。持續使用AI超過五個月的學生中，約81%能在50分鐘內搞定作業，比不使用AI的最快一批學生還要迅速。他們作業成績亮眼，一到大考就崩盤。快速完工、高作業分、低考試分這三項疊在一起，研究團隊給出了直白的判斷：這些學生不是在用AI輔助學習，而是把學習直接外包給了AI。

但AI并非天生有害。數據里還有另一群使用者，他們用AI的時間和不用的同學差不多，考試分數并沒有受到負面影響，同時作業成績還有所提高。而且，這群人此前的基礎成績并無突出優勢，排除了“好學生本來就會用AI”的正向篩選解釋。問題不在于AI本身，而在于它有沒有替代了學生本該自己完成的思考。一旦AI從“助手”變成“槍手”，那些在作業上偷的懶，最終都會在兩年后的大考上結結實實地還回來。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.