今天早上,我在網上無意中看到了今年高考數學I卷的最后一題,第19題。
對我來說,那道題就是天書。
![]()
看著這張被不少考生和老師熱議的試卷截圖,我一時興起,隨手把它發給了國內某家號稱推理能力很強的大型AI模型。我半開玩笑地問了一句:“你能看懂這道題嗎?”
我原本以為,對于在各種測試中表現亮眼、寫代碼作詩都不在話下的AI來說,這不過是幾秒鐘內給出答案的常規操作。然而接下來發生的事情,讓我有點意外。
屏幕上的光標開始不斷閃動,AI進入了長達七八分鐘的“思考”狀態。它一段一段地輸出推理過程,又不斷推翻重來,像是在不同思路之間反復試探,卻始終找不到出口。差不多十分鐘后,它終于停了下來。
但結果卻有點出人意料。
它先表示自己“可以看懂題目”,緊接著話鋒一轉,用了一個“但是”,開始提出一連串疑問:是不是條件不完整?是不是哪里存在歧義?隨后,它還要求我提供更準確的題目來源。
那一刻的觀感其實挺微妙的——它并不是完全“不會”,但顯然也沒有真正走通。
我當時甚至有點懷疑,它是不是更傾向于根據來源去尋找現成的解析,而不是繼續往下推理。
帶著這個疑問,我又換了幾款AI模型。
當然,這一次是用了不同的問法:為什么這樣一道高中數學題,會讓AI顯得這么吃力?
綜合這些回答,我大致拼出了一個更容易理解的解釋。
我們平時常見的數學題,哪怕難度不低,往往也有一定路徑可循,就像走迷宮,雖然復雜,但多少有經驗可以參考。而AI最擅長的,正是在大量“路徑”中快速匹配和套用。
但這道壓軸題不太一樣。它給出了一套新的定義和規則,更像是臨時換了一種“玩法”。原有的經驗不再直接適用,必須從頭搭建思路。
難點主要集中在最后一問。那一問不是單純計算,而是要求證明一個結論。按照多方解釋,這一步往往需要用到反證思路,同時還要自己找到一個關鍵的切入點。
問題就在這里:這種“從無到有搭思路”的過程,對AI來說并不穩定。它可以展開推理,但在關鍵轉折處,容易反復嘗試卻無法收斂,最后表現為來回打轉。
從結果看,這道題確實起到了一個很有意思的效果:它沒有靠復雜計算“卡人”,而是更依賴思路本身。
這也讓我這個旁觀者多少看懂了一點出題思路。
這些年,關于“刷題”“模板化”的討論一直很多。而這道題顯然在刻意回避套路:不拼熟練度,不拼誰見得多,而是看面對陌生設定時,能不能把邏輯一點點搭起來。
換句話說,它更像是在考“怎么想”,而不是“會不會”。
在AI已經能處理大量標準問題的背景下,這種命題方式多少有點現實意味:如果一道題可以完全靠套模板解決,那么機器往往也能做到。但一旦需要臨時構建思路,人和機器之間的差異就會被放大。
我最后又問了一個問題:如果有人能在考場上獨立完成這道題,大致處在什么水平?
得到的回答也比較一致:這樣的學生不會很多,通常屬于思維能力比較突出的那一小部分學生。放在更大的范圍里看,也依然是拔尖的。
最后,非常希望有關部門最后能公布解開這答題的考生比例,也能讓咱們了解了解中國的基礎數學教育究竟處于什么樣的水平。
the end
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.