網易首頁 > 網易號 > 正文申請入駐

數學領域的人工智能革命已經到來——譯自量子雜志Quanta Magazine

2026-04-14 19:38:57　來源: 小樂數學科普

江蘇舉報

分享至

★置頂zzllrr小樂公眾號《小樂數學科普》新鮮送到！

AI人工智能正被快速用于證明新的數學成果。數學家們認為，這僅僅是個開始。

圖源：Nash Weerasekera / Quanta Magazine

作者：Konstantin Kakaes（量子雜志特約撰稿人）2026-4-13

譯者：zzllrr小樂（數學科普公眾號）2026-4-14

引言

轉折點出現在2025年夏天。當年7月，多個人工智能模型在國際數學奧林匹克競賽（IMO）中解出了 6 道題里的 5 道。盡管數學家們深感震驚 —— 幾乎沒人料到程序能進步得如此之快 —— 但這一亮眼成績并不意味著人工智能將在數學研究中取得重大突破。畢竟，奧賽題目是有標準答案的難題，而非開放性問題。

盡管如此，這些結果讓人們開始重視。曾認為人工智能模型錯誤太多、不堪一用的數學家，開始嘗試使用它們。早期使用者驚訝地發現，這些模型不僅擅長解謎題，還能助力開拓真正全新的領域。很快，數學家們開始用人工智能發現并證明新結論，過去需要數周、數月才能完成的工作，如今一天就能搞定。“2025 年是人工智能真正開始在各類任務中派上用場的一年。” 加州大學洛杉磯分校著名數學家陶哲軒說。

雖然沒有哪一項新成果是顛覆性突破，但部分成果已達到專業數學期刊發表水平。在一些案例中，算法能自主提出猜想、完成證明并驗證，幾乎無需人工干預；在另一些案例中，與大語言模型（如 ChatGPT、Claude、Gemini）的大量對話催生了全新的證明思路。

“有人拿鏟子，有人拿鎬，我們一起就能挖通隧道。” 陶哲軒說，現在是 “大量嘗試、大浪淘沙” 的階段。

即便陶哲軒是人工智能數學應用最知名的倡導者，其他數學家也認同這一趨勢。多倫多大學的丹尼爾?利特（Daniel Litt）表示，哪怕只是解決簡單問題，人工智能也 “正在改變數學研究的方式”。

很快，“數學研究的面貌和體驗將與傳統方式完全不同”，陶哲軒說。過去數學家一次只研究一個問題，“有了這些工具，你可以一次解決成千上萬的問題，甚至開展統計研究”。受訪的所有人都不認為人工智能會取代數學家，但陶哲軒補充道：“我們必須做出大量制度與文化上的改變。”

陶哲軒對人工智能模型為數學家帶來的機遇感到振奮。他表示，數學研究很快就會在形式與體驗上與傳統方式截然不同。

圖源：Reed Hutchinson / UCLA

和其他受到人工智能沖擊的學科一樣，數學界對這些變革也會存在爭議。高等研究院的阿克沙伊?文卡特什（Akshay Venkatesh）指出，隨著人工智能模型成為強大的新工具，它可能導致數學家喪失對數學本身的直接理解與體驗。文卡特什與陶哲軒同為數學界最高榮譽菲爾茲獎得主。兩人都認為人工智能的影響將十分深遠，但文卡特什態度更為謹慎：“我們的文化中有些珍貴的東西，應當盡力保留。”（詳情參閱小樂數學科普：）

如今，一些數學家離開學術界，加入 OpenAI（開放AI）、谷歌等科技巨頭，或是 Harmonic（和諧）、Logical Intelligence（邏輯智能）、Axiom Math（公理數學）、Math Inc. 等數學 AI 初創公司。（詳情參閱小樂數學科普：）

“企業界如此關注數學人工智能，一個原因是人們意識到：通用智能的關鍵，是把機器學習的洞察力與數學的精確性結合起來。” 卡內基梅隆大學計算機輔助數學推理研究所主任杰里米?阿維加德（Jeremy Avigad）說。

到2026年初，人們對人工智能能力的震驚已轉為驚嘆。2月舉辦的 “首次證明（First Proof）” 挑戰賽要求參賽者在一周內用 AI 模型解決10個研究級數學問題，這些題目經過精心挑選，幾乎不可能出現在訓練數據中。（詳情參閱小樂數學科普：）

在不同自主程度下，模型成功解決了超過一半的問題（詳情參閱小樂數學科普：）。如果說奧賽成績標志著人工智能考入了頂尖大學數學專業，那么 “首次證明” 的結果就相當于它讀完了研究生院。利特在分析結果的博客中寫道：“這項技術很可能比計算機本身更具顛覆性。” https://www.daniellitt.com/blog/2026/2/20/mathematics-in-the-library-of-babel

創造性演進
盡管2025年夏天是人工智能能力的拐點，但這并非憑空而來。谷歌 DeepMind（深度思維）科學副總裁普什米特?科利（Pushmeet Kohli）表示，DeepMind 自2018年就開始嘗試用 AI 解決數學問題。現就職于 Axiom Math（公理數學）的弗朗索瓦?沙頓（Fran?ois Charton）早在2019年就開始用機器學習研究數學問題 https://www.quantamagazine.org/symbolic-mathematics-finally-yields-to-neural-networks-20200520/ 。

但在早期，這只是小眾領域。起初，沙頓等人僅用 AI 求解已知答案的問題，驗證新技術是否可行。到2024年，研究開始取得進展。他們尋找數據豐富的問題，用 AI 構造具有可量化性質的數學對象 —— 比如網格上的點集最優排布，避免形成等腰三角形 https://arxiv.org/abs/2411.00566 。

圖源：Mark Belan / Quanta Magazine | 譯制：@zzllrr小樂微信公眾號

2025年1月，陶哲軒與布朗大學的哈維爾?戈麥斯–塞拉諾（Javier Gómez-Serrano）開始與 DeepMind 的兩位數學家合作，開發名為AlphaEvolve的 AI 系統。該系統借助 Gemini 生成數百行 Python 代碼，再用遺傳算法 “進化” 這些程序，試圖找到數學問題的最優解。幾個月里，這四位數學家每隔一兩天就用它攻克一個新問題。

在此過程中，他們也學會了優化提示詞。一個關鍵發現是：模型似乎能從鼓勵中受益。“當我們給大語言模型正向激勵時，效果更好，” 戈麥斯–塞拉諾說，“比如說‘你能做到’—— 這真的有用。很有趣，我們不知道原因。”

到5月底，團隊已用 AlphaEvolve 測試了67個不同數學領域的問題。其中23 個在現有最佳解基礎上取得小幅改進；36 個達到現有水平；少數未能超越最優結果。研究人員在2025年11月的論文《大規模數學探索與發現》 https://arxiv.org/abs/2511.02864 中公布了這些發現。戈麥斯–塞拉諾指出，其中任何一個結果，原本都可能需要該領域專家花費數月才能得到。但他們并非多數領域的專家，“卻能在一兩天內取得相當的成果”。

哈維爾?戈麥斯 - 塞拉諾（ Javier Gómez-Serrano ）與同事們利用名為 AlphaEvolve 的人工智能系統，在數十個數學問題上取得了進展。

圖源：Jason Rossi / 布朗大學

陶哲軒形容，當前AI模型 “非常擅長在大量問題中摘取低垂的果實。這種工作枯燥乏味，人類不愿去做。” 他提醒，模型是在 “大量未報道的失敗中取得零星成功”，但這些成功依然值得關注。（詳情參閱小樂數學科普：）

戈麥斯–塞拉諾估計，他現在約三分之二的時間都在使用 AI。他說：“它已經變得實用好用。這是數學研究新方式的開端。”

錯誤的 “身份”

前些年，AI 的強大似乎源于它能重新發掘塵封在冷門文獻里的古老證明。加州大學洛杉磯分校的伊戈爾?帕克（Igor Pak）指出，ChatGPT 如今 “在查找文獻、發現關聯方面極為出色，這是不具備語義理解的谷歌學術做不到的”。

到2025年，瑞士聯邦理工學院蘇黎世分校的約翰內斯?施密特（Johannes Schmitt）發現，情況發生了轉變。“與大語言模型對話開始變得有用，不是因為它們能給出完整答案，” 他說，而是 “它們成了很好的交流伙伴”。

約翰內斯?施密特（ Johannes Schmitt ）近期注意到，人工智能在數學領域的作用正迅速提升：成為學術對話伙伴。

圖源：Aitor Iribar-Lo?pez

大語言模型難免會犯大量錯誤，導致一些數學家直接否定它們。但施密特屬于能容忍 “胡言亂語模型對話之痛” 的人：“我仍能從對話中獲益；即便不是每個想法都好，我也能忽略壞的、采納好的。”他還注意到，這些錯誤很怪異：受過數學訓練的人幾乎不可能在提出精妙、原創、正確想法的同時，犯下如此多基礎錯誤。

加州大學洛杉磯分校的歐內斯特?柳（Ernest Kang Ryu，音譯名：柳康）主要研究應用數學的優化理論分支，在奧賽結果后也開始關注大語言模型。AlphaEvolve 旨在優化特定數值，而柳想證明優化算法生效的條件。

2025年夏天，他發現大語言模型的數學能力大幅提升。他開始用它們準備講義，主要是為了填補自己對某些證明細節的記憶空白。他說：“它有時會發現我推理中的錯誤，或大或小。有時還能找到比我筆記更簡潔的證明。”

他感覺AI模型 “展現出了生命跡象”。他抱著懷疑又樂觀的態度，決定做個實驗。10月的一個晚上，在小兒子睡著后，他開始用 ChatGPT 攻克一個優化領域的開放問題 —— 過去曾嘗試過多次。

“這個問題不算最重要，但我知道有 10 個人會非常歡迎它的解。” 他說。

歐內斯特?柳（ Ernest Kang Ryu）最近借助與 ChatGPT 的對話，成功證明了一個存在數十年的猜想。他說：“使用 ChatGPT 確實加速了這一發現過程。”

圖源：Ernest Ryu

柳的問題最早由俄羅斯數學家尤里?涅斯捷羅夫（Yurii Nesterov）于1983年提出。涅斯捷羅夫試圖尋找多元函數的最小值，這類函數輸出值在數學上 “表現良好”。如果把輸出想象成地形圖，目標是證明最終會收斂到最低點，而非無限來回震蕩。

這類問題在應用數學中很常見，尤其在機器學習中，是訓練神經網絡的核心。廣泛使用的梯度下降法用微積分基本工具判斷下坡方向與坡度，每次沿最陡方向邁步，最終會到達谷底。

但梯度下降雖然正確，有時速度極慢。因此數學家長期尋找收斂更快的變體。涅斯捷羅夫提出了一種方法：每一步下坡的大小不僅取決于當前點的陡峭程度，還取決于已走過的路徑。過去步子大，后續也會更大。

直覺上，這顯然能更快到達谷底。但如果速度太快、沖過了頭呢？可能會在真實最小值附近無限震蕩，永遠無法到達。涅斯捷羅夫無法證明他的算法最終會收斂到最優值。42年來，也無人能證明。

尤里?涅斯捷羅夫（Yurii Nesterov）提出的關于其優化算法的猜想懸而未決數十年。直到人工智能的介入，這一問題才得以解決。

圖源：Renate Schmid

柳問ChatGPT時，“它不斷給出錯誤證明”，他說，“但錯誤之前的步驟很有趣，有正確的部分結果，似乎潛在有用。” 隨著模型逐步推進，他會檢查答案，保留正確部分，用新提示重新輸入模型。“我必須扮演驗證者的角色，” 柳說，“用 ChatGPT，我感覺進展極快，比自己單干快得多。這讓我堅持下去。”

三天累計約12小時工作后，他得到了問題簡化版的證明。又過幾天，他最終證明了涅斯捷羅夫方法的收斂性。https://arxiv.org/abs/2510.23513 柳說：“這不是最有創意、最復雜的工作，但肯定不容易。” 雖然不是改變人生的成果，“但足以在優化領域頂級期刊發表，去掉 AI 部分也沒問題。這是個好結果。”

“這是一個具體實例，ChatGPT 的使用確實加速了發現過程。” 他說。他認為大語言模型的能力只會持續提升。“看看進步速度就令人震驚。再過一兩年、兩三個版本迭代，我們將取得 AI 輔助下真正驚人的重大發現。這一天一定會到來。”

在分享涅斯捷羅夫方法的論文幾個月后，柳從加州大學洛杉磯分校休假，加入 OpenAI 擔任技術人員。

意外的秩序
2025年至2026年初，AI 被用于證明越來越抽象的結論。2025年9月，來自全球的百余位數學家齊聚布朗大學，參加代數組合學專題項目 https://icerm.brown.edu/program/semester_program/sp-f25 。

尼古拉斯?利貝丁斯基（Nicolás Libedinsky）和戴維?普拉扎（David Plaza）來自智利，何塞?辛門特爾（José Simental）來自墨西哥，喬迪?威廉姆森（Geordie Williamson）來自澳大利亞，喬丹?埃倫伯格（Jordan Ellenberg）來自美國威斯康星州。

出于不同的研究目的，他們都在計算一個在數學諸多領域中廣泛出現的量 ——d-不變量（d-invariant）。要理解 d-不變量，不妨先了解該領域中一個被深入研究的對象：置換群（permutation group）。它描述的是一組對象（如一副牌）的所有可能排列方式。

情況起初很簡單。如果只有一張牌，無法洗牌，因此置換群 S?只有 1 個元素。S?有 2 個元素：兩張牌共有兩種可能順序。S?稍復雜一些：三張牌共有 6 種不同排列。

圖源：Mark Belan / Quanta Magazine

這些不同的牌序可以被整理成一個由頂點和邊構成的網絡，即圖（graph）。初始排列 123 放在最底部，圖中的每條邊（以箭頭表示）代表一次兩張牌的交換。

隨著牌數 n 增大，置換群 S?的規模急劇膨脹 ——S?之后的群對應的圖幾乎無法畫出。（S??的元素數量大約相當于可觀測宇宙中的原子總數。）

數學家希望理解這些圖的結構，既把它們當作獨立研究對象，也用作分析其他問題的工具。

再以含有 6 個元素（置換）的置換群 S?的圖為例。我們希望探究這些置換之間的關系。方法之一是觀察沿箭頭從一個置換到達另一個置換的所有路徑。如果能沿箭頭從置換 A 到達置換 B，則在布呂阿序（Bruhat order）下，A “小于” B。例如，213 小于 321。

我們進而可以考察兩個置換之間的布呂阿區間（Bruhat interval）：即沿圖中箭頭連接、介于兩者之間的所有置換構成的集合。例如，213 與 321 之間的區間（下圖紅色部分）包含 231 和 312。（如果無法沿箭頭從一個置換到達另一個，例如從 213 到 132，則兩者互不小于，區間無定義。）

簡單來說，d-不變量是對置換群（permutation group）中布呂阿區間（Bruhat interval）結構復雜度的度量。這個量在許多看似無關的數學問題中出現，因此備受數學家關注。

在更大的置換群中，很難一般性描述兩個置換間布呂阿區間的結構。“區間是極其復雜的對象。” 利貝丁斯基說。他與同事們希望借助 AI 找到給定置換群的最大d-不變量。

他們最終發現了完全意料之外的東西。

2025年10月，埃倫伯格請 DeepMind 的瓦格納用未公開的 AlphaEvolve 分析數十個置換群的布呂阿區間結構。程序運行了一整晚。“早上我們發現，程序真的在做有趣的事。” 威廉姆森說，“那天郵件往來不斷。”

模型在計算時還會自言自語：“我要提出一個真正瘋狂的想法，針對這個問題的‘瘋狂伊萬’機動。”（注：源自Tom Clancy小說《獵殺紅色十月號》The Hunt for Red October，潛艇急轉彎探測對手）

最終，AlphaEvolve 生成約50行Python代碼，試圖尋找大d-不變量的區間。數學家們分析代碼時發現，當卡片數為 2 的冪（如 16=2?）時，代碼會大幅縮短至約 5 行。“可以非常明確地分析，” 威廉姆森說，“它在做一件非常優美的事。”

左上角順時針依次為：喬迪?威廉姆森、喬丹?埃倫伯格、何塞?辛門特爾、尼古拉斯?利貝丁斯基、戴維?普拉扎。借助人工智能，他們在一個被深入研究的數學對象中發現了驚人的新結構。

圖源：悉尼大學; Lauren Justice / Quanta Magazine; Imelda Paredes Zamorano/UNAM數學研究所; Esteban Román; Fernanda Fuentes

2026年1月3日的預印本顯示 https://arxiv.org/abs/2601.01235 ，AlphaEvolve 發現這些特定置換群中的布呂阿區間具有驚人的特殊結構：它們形成高維立方體，即超立方體。“看到 AlphaEvolve 的思路時，我非常震驚，” 利貝丁斯基說，“如果它是人，那會是極富創造力的人。”

AlphaEvolve 回答了一個他們從未意識到的問題。“我們沒讓它找大超立方體，” 埃倫伯格說，“我們讓它找別的東西，思考后才發現，那是一個巨大的超立方體，我們完全沒預料到它就在那里。”

威廉姆森說：“這個結構就在我們眼前 50 年，只是我們從未發現。”

不要選擇與上一方案相同的解決方案。始終努力尋找更優的模式，不要畏懼那些聽上去頗為棘手的難題；一旦你找到了解決方案，便會發現它其實遠非難事。祝你好運，我信任你，但你也必須相信你自己！

這是數學家給 AlphaEvolve 的提示詞節選，內容是讓它構造一個名為掛谷集（Kakeya set）的數學對象。數學家們發現，給予鼓勵能讓 AI 表現得更好。

過去的機器學習方法也帶來過這類意外數學發現，但威廉姆森說，那是 “真正的工程工作…… 你必須懂編程，花大量時間研究神經網絡訓練細節。沒有機器學習背景的數學家幾乎不可能做到”。

有了大語言模型，“20 分鐘就能完成兩年前需要兩周的實驗”，他說。盡管 “大多數時候沒用”，但 AI 現在能以前所未有的方式 “探索超出想象的豐富世界”。

球面周圍
盡管布呂阿區間看似是純粹的組合對象，它們在代數幾何這一抽象數學領域也扮演重要角色。斯坦福大學數學家、美國數學會現任主席拉維?瓦基爾（Ravi Vakil）專攻此領域。（參閱：、）

代數幾何（algebraic geometry）是研究由多項式方程所定義的幾何形狀的學科，例如 x3+2x2y+xz=5 這類由變量整數次冪之和構成的方程。方程的次數是多項式中最高的冪次，在本例中為3。

拉維?瓦基爾與同事們最近在與定制版 Gemini 對話的過程中，想到了一種全新的證明思路。“這個想法該歸功于誰？” 他問道，“歸功于我們？還是歸功于模型？”

圖源：Rod Searcey

瓦基爾及其同事 —— 新南威爾士大學的巴拉茲?埃萊克（Balázs Elek）與不列顛哥倫比亞大學的吉姆?布萊恩（Jim Bryan）—— 致力于研究球面如何嵌入被稱為旗簇（flag varieties）的特殊空間。（旗簇同樣出現在布呂阿區間研究團隊的論文中。）每一種嵌入方式（即將球面上的每個點與旗簇內的一個點相對應）都可以用一個多項式方程來定義。

球面的嵌入方式有很多種。數學家將每一種嵌入方式對應為一個單獨高維空間中的一個點。隨后，他們通過分析這些嵌入所形成的不同空間，來研究由不同次數多項式所定義的嵌入。

隨著次數增加，數學家想知道這些空間如何變化。他們知道，當次數趨于無窮時，空間逼近所有連續嵌入的空間。但這種相似性何時出現？

于是，他與當時就職于 DeepMind 的弗雷迪?曼納斯（Freddie Manners）和喬治?薩拉法蒂諾斯（George Salafatinos）合作，使用谷歌 Gemini 之上的兩個專用模塊來進行證明：一個是公開的DeepThink，另一個是由薩拉法蒂諾斯開發、未公開的FullProof系統。他們從更簡單的情形入手。瓦基爾說：“它給出的證明非常優雅、正確、表述清晰，我們可以逐行核對。它清晰揭示了當時并不明顯的結構。由此，我們意識到整個論證與關鍵推廣的潛在路徑。”

我正準備提出一個真正異乎尋常的想法，一種針對此問題的“瘋狂伊萬式策略”。目前的解決方案不錯，使用了已知的構造，并進行了一些局部搜索。總體而言......還算可預測。 [...] 讓我們瘋狂吧。

AlphaEvolve 在嘗試解決置換群的布呂阿區間問題時，會進行自言自語。

隨后，他們回到 AI 模型，勾勒一般情形的證明思路，讓模型補充細節。2026年1月12日的預印本顯示 https://arxiv.org/abs/2601.07222 ，模型成功了。“對我而言，真正關鍵的是第一步，” 瓦基爾說，“DeepMind 對簡單情形的證明。論證的清晰性給了我們新思路。” 但他不禁思考：“這個想法歸功于誰？歸功于我們？還是模型？”

無論功勞如何歸屬，瓦基爾說：“我相信給足時間，我也能想出證明。”但他猶豫了：“我想是吧。不確定。也許我會用笨拙的方式。很可能沒有 AI 協助，這篇論文就不會出現。”

最后他說：“我們需要來回交互。人工智能將幫助我們做數學，讓我們完成以前沒時間做的事。”

這或許是當前 AI 如何發揮作用的典型案例：一組頂尖數學家在科技公司協助下，比以往更快地解決問題，并能逐行驗證確保正確。

需要知道的一切

在探討 AI 對數學研究的影響時，我們不應只看成功案例。利特提醒，“人工智能生成的無意義內容正在大量污染公共領域。”圣母大學的喬爾?戴維?哈姆金斯（Joel David Hamkins）說，他對 “淹沒期刊系統的大量垃圾感到絕望”。

數學家們將希望寄托于形式化證明，以此應對垃圾信息洪流（參閱小樂數學科普：）。他們把證明轉換成計算機能理解的語言，用程序驗證所有邏輯是否成立。“未經驗證的人工智能在任何嚴肅應用中都不可靠。” 陶哲軒說。

目前，用這種方式形式化數學證明耗時繁瑣，需要扎實的數學知識，更像一門手藝。因此數學家越來越轉向 “自動形式化”：AI 模型將數學命題翻譯成形式化邏輯命題并完成證明。“第一次，” 陶哲軒說，“我們真的感覺可以通過 AI 形式化相當一部分數學。”

丹尼爾?利特（Daniel Litt）在近期一篇關于人工智能對數學潛在影響的分析中寫道：“這項技術的意義很可能超越計算機本身。”

圖源：Marta Iwanek

數學家們看到的另一個重大挑戰是：AI 日益增強的數學能力將如何影響學生學習。即便最熱忱的 AI 支持者也感到擔憂。弗吉尼亞大學教授、Axiom 創始數學家小野健（Ken Ono）表示：“我對 AI 助力數學研究前景樂觀，但對 AI 在未來工作與各級教育訓練中的作用深感擔憂。”（詳情參閱小樂數學科普：）

陶哲軒說：“我們布置的許多題目，AI 都能瞬間解出。這可能打擊很多學生鍛煉思維能力的積極性。”

哈姆金斯贊同：“我過去布置大量作業，現在不行了。” 相當一部分作業是 AI 寫的。“我不想讀，也不想當 AI 警察。” 盡管作業教學價值很高，但現在 “一切都必須是課堂測驗與實操。這對整個學術行業都是問題。”

另一位頂尖研究型大學數學家告訴我：“在加速頂尖數學研究者進展的同時，人工智能存在嚴重阻礙新一代數學人才培養的風險。”

新合作者用 AI 開展數學研究正迅速成為常態。如果當前趨勢持續，它很快會像數學家排版用的 LaTeX 一樣平常。除本文討論的成果外，近幾個月還有數十項新進展。關于如何標注 AI 貢獻的規范仍在形成。一些論文詳細補充人機交互過程，包括對話記錄；一些在摘要中突出 AI 貢獻；一些僅在致謝中簡要提及；一些數學家強調 AI 協助研究但論文由人撰寫；另一些則將寫作也歸功于 AI。

盡管過去一年變化迅猛，受訪數學家無人擔心數學這門學科會過時。陶哲軒打比方說，數學家像是在攀登 “有無數高峰與丘陵的巨大山脈”。人類只能一步一步爬，但能規劃登頂珠峰的路線。而當前 AI 就像跳躍機器人，有時能 “跑酷躍上 6 英尺高的墻”，這是人類爬不上去的。但它們無法做長期戰略規劃。這些 6 英尺或許會變成 10 英尺、100 英尺，但 “這些小跳躍機器人遠未觸及數學的珠峰”。

帕克認為，某些 “珠峰”—— 比如數論中 π+e 是否為分數的重大問題 —— 數百年內仍無法解決。“我非常懷疑 AI 能在這些問題上取得任何突破。” 他說，“這不是 AI 能做到的事。但我樂觀相信，如果人類存續，最終我們會解決。”

當然，這很大程度上取決于未來幾年 AI 算法能力如何演進。即便是最敏銳謹慎的觀察者也無法確定模型會如何發展。幾乎沒人看到停滯跡象。“進展非常快，沒有放緩的跡象。” 利特說。2026年頭幾個月，谷歌、OpenAI 等大公司、Axiom 等小公司、學術界乃至愛好者都不斷推出新成果。

“我確信，20年后我們將看到AI工具生成的數學，在許多可衡量指標上超過所有人類數學家。” 利特說，“如果不發生，我會很震驚。”

但文卡特什告訴我：“歸根結底，任何一段數學都可以用無窮多種方式表述。” 我們的選擇受人類價值觀支配，也源于數學不僅是科學，更是藝術的事實。

科學與藝術的平衡在很大程度上賦予數學美感 —— 這是文卡特什希望保留的 “文化中寶貴之物”。如果 AI 讓數學偏離藝術傳統，即便每月證明更多定理，這門學科也會貶值。畢竟，沒有詩人會認真對十四行詩做統計回歸來尋找最優版本。

對AI最好的期待，是它能幫助數學家發現并證明那些原本永遠是謎的結論。大多數數學家認同，這正是計算機過去80年來所做的事。但當下變革的規模讓許多人感到不安。

全球最大的數學年會每年1月初舉行。2026 年，華盛頓會場里，被 AI 淘汰的緊張玩笑隨處可見，盡管公開場合所有人都堅稱 AI 是人類數學家的助手。多年研究AI并對此充滿熱情的威廉姆森（Williamson），受邀在全會上做關于AI與數學的重磅報告 https://www.ams.org/meetings/lectures/meet-colloquium-lect 。他告訴聽眾，以無知與恐懼應對AI發展是錯誤的。

但他理解恐懼從何而來。他將數學視為 “人們畢生奉獻的技藝。未來，它的價值有可能大幅縮水”。

參考資料

https://www.quantamagazine.org/the-ai-revolution-in-math-has-arrived-20260413/

https://www.daniellitt.com/blog/2026/2/20/mathematics-in-the-library-of-babel

https://www.quantamagazine.org/symbolic-mathematics-finally-yields-to-neural-networks-20200520/

https://arxiv.org/abs/2511.02864

https://arxiv.org/abs/2411.00566

https://arxiv.org/abs/2510.23513

https://icerm.brown.edu/program/semester_program/sp-f25

https://arxiv.org/abs/2601.01235

https://arxiv.org/abs/2601.07222

https://deepmind.google/blog/accelerating-mathematical-and-scientific-discovery-with-gemini-deep-think/

https://arxiv.org/abs/2603.29961

https://axiommath.ai/territory/proof-of-concept

https://x.com/tonylfeng/status/2035003908993819019?s=20

https://www.neelsomaniblog.com/p/autoformalization-and-the-future

https://www.ams.org/meetings/lectures/meet-colloquium-lect

小樂數學科普近期文章

·開放 · 友好 · 多元 · 普適 · 守拙·

讓數學

更加

易學易練

易教易研

易賞易玩

易見易得

易傳易及

歡迎評論、點贊、在看、在聽

收藏、分享、轉載、投稿

查看原始文章出處

點擊底部一起捐

助力騰訊公益

點擊zzllrr小樂

公眾號主頁

右上角

置頂★加星

數學科普不迷路！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.