![]()
全網震撼!菲爾茲獎得主把未解數學題扔給GPT-5.5 Pro,不到兩小時拿到博士論文級證明。整個過程中,他沒給出任何數學思路。
今天,菲爾茲獎得主Timothy Gowers在個人博客上發了一篇長文——
最近一次使用ChatGPT 5.5 Pro的體驗
標題平平無奇,內容卻讓整個數學圈坐不住了。
![]()
文中,他親手驗證了一個令整個數學界不寒而栗的事實:
GPT-5.5 Pro,用了不到兩個小時,獨立完成了一項博士論文級別的數學研究。
而Gowers本人在整個過程中,數學貢獻幾乎為0。
![]()
兩個小時,一章博士論文級成果。
![]()
全程2小時,菲爾茲獎得主貢獻為0
事情是這樣的。
這幾天,Timothy Gowers拿到了ChatGPT 5.5 Pro的測試權限,決定搞一次真刀真槍的測試。
他從數學家Melvyn Nathanson的一篇新論文中,挑出了幾個關于加法數論中集合求和的未解問題。
![]()
這些問題的核心是:給定一個k個整數的集合A,它的h重求和集hA的可能大小有哪些?
要實現特定大小的求和集,集合的「直徑」最小能是多少?
![]()
Nathanson自己給出了一個指數級的上界:2^k - 1。
于是,Gowers把問題扔給了GPT-5.5 Pro。17分鐘05秒后,AI給出了一個構造,直接把上界從指數級干到了二次方級。
而這,顯然已經是最優的了。
更讓人坐不住的,是Gowers在整個過程中扮演的角色。
他沒有給出任何數學思路,沒有提供關鍵引理,更沒有指出證明方向,
Gowers只是充當了一個「情緒價值提供者」和「排版助手」,給出的提示詞極其簡單——
對,這個想法不錯,試試看能不能成;
把這段推導寫成標準的LaTeX論文格式。
![]()
博客中,Gowers在反復強調:提示詞「不包含任何數學輸入」。
AI走的每一步推理、每一個構造、每一處關鍵轉折,都是它自己想出來的。
僅用了幾個小時,AI就完成了人類可能需要數月,甚至數年才能完成的工作。
換句話說,人類頂級數學家在這場合作中的智力貢獻,約等于0。
AI給出原創想法,震驚MIT博士生
如果故事到這里就結束了,那頂多算是「AI又解了一道數學題」。
但后面發生的事情,才真正讓人細思極恐。
Gowers繼續追問ChatGPT:那一般情況的h呢?這個問題的難度陡然上升。
因為當h=2的時候,數學家們已完全搞清了所有可能的求和集大小。但對于一般的h,甚至不知道完整的答案是什么。
此前,MIT博士生Isaac Rajagopal已經證明了一個指數級的上界。
![]()
Gowers于是讓GPT去看看能不能改進拉Rajagopal的結果。
第一輪:GPT思考了16分41秒,把上界從k的指數級改進到了k^(1/2+ε)的指數級。
這是對拉Rajagopal工作的「常規修改」。
第二輪:Gowers說,能不能再進一步,搞到多項式級?
GPT思考了13分33秒,表示「有戲」,但需要驗證兩個技術性命題。
Gowers讓它自己驗證,9分12秒后,GPT完成了驗證,并在隨后的31分40秒內寫出了完整的預印本論文。
![]()
論文地址:https://drive.google.com/file/d/1IkJBcWYz_3J_QGsESBmMa-jrEHAJDcJB/view
最終結果:N(h,k) ≤ O(k^{10h3})——從指數級,直接躍升到多項式級。
![]()
Rajagopal本人看完后,給出了一個讓人五味雜陳的評價:
ChatGPT這個想法很原創、很巧妙。如果是我自己想出來的,我會非常驕傲。
然而,我需要一兩周才能完成的腦力風暴,GPT只用了不到一個小時。
![]()
更重磅的是,Rajagopal詳細分析了GPT的核心創新——
它使用了h2-耗散集(h2-dissociated sets)來控制h階以下的關系。「這個思路,據我所知,完全是原創的」。
不得不說,當一個MIT學生用「我會為這個想法感到驕傲」來評價一個AI的數學證明時,某種范式轉移已經悄然發生了。
頂級數學家警告:危機來了
菲爾茲獎得主Gowers沒有停留在「ChatGPT很厲害」的層面,他直接把話題拉到了最尖銳的問題:
博士生怎么辦?
這才是這篇博客真正的重量級炸彈。
![]()
在組合數學領域,有大量論文會提出一系列新的組合參數,并附帶一串未解問題。
這些問題通常不是特別難,它們的價值在于給初入科研的學生提供一個「可以攻克的目標」,讓他們在解決一個「正式的開放問題」中獲得信心和成就感。
但現在,這條路被AI截斷了。Gowers的原話說得很直白:
過去,只要有人提出問題就夠了。
但現在,僅僅被提出是不夠的,它還必須足夠難,難到LLM解決不了。
![]()
![]()
2026年至今,已有15個Erd?s開放問題被解決,其中11個明確標注了AI的貢獻。
就在幾周前,一個23歲、沒有高等數學學位的年輕人Liam Price,用GPT-5.4 Pro在80分鐘內解決了一個困擾數學家60年的Erd?s問題。
菲爾茲獎得主陶哲軒親自驗證了這個證明,并將其擴展為一個新理論的起點。
![]()
過去需要數年訓練才能達到的研究能力門檻,正在被AI一夜之間碾平。
Gowers直言,「若是AI在數學領域以目前這個速度發展下去,那么我們將很快面臨一場危機」。
![]()
對此,OpenAI研究員Sebastien Bubeck深表贊同。
![]()
但也有人冷靜指出:這只是一次實驗,不能過度外推。Nathanson的問題雖然是開放問題,但難度未必代表數學前沿的天花板。
Gowers自己也承認,他「沒有完整答案」,只是在記錄自己的經歷。
過去兩年,類似的「AI攻克數學」敘事出現過好幾次,仔細看都會發現具體條件限制不少。
但這一次,說話的人是菲爾茲獎得主,他的判斷標準不需要額外背書。
![]()
AI數學加速度,已不可逆轉
把時間線拉長一點就會發現,AI在數學領域的進步曲線幾乎是垂直的。
2023年,GPT-4做不了大多數本科數學題;2024年,o1在數學競賽中拿到了金牌水平;2025年,o3在前沿研究中開始展現推理能力。
![]()
2026年5月,GPT-5.5 Pro獨立完成了博士論文級別的證明。
三年,從本科到博士。
Gowers的實驗揭示了一個臨界點:AI不只是工具了。至少在某些問題上,它已經是一個能獨立產出原創結果的研究者。
那些曾經需要數年苦修才能叩開的大門,現在只需要一個提示框和兩個小時。
門檻沒了。但門后面的世界,可能比我們想象的更大,也更陌生。
參考資料:
https://x.com/wtgowers/status/2052830948685676605?s=20
https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/
文章來源:新智元。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.