網易首頁 > 網易號 > 正文 申請入駐

當人工智能開始檢查數學家的工作時會發生什么?

0
分享至

當人工智能開始檢查數學家的工作時會發生什么?
一家初創公司取得了一項突破性進展,令科學界震驚:他們將現代證明方法轉化為編程語言,以便利用人工智能進行驗證。但并非所有人都為此歡欣鼓舞。


作者:瑪儂·比肖夫, 編輯:黛西·尤哈斯


數學領域或許即將迎來一個新時代——這正是部分研究者長期以來所期盼的。數學家們很快就能利用計算機快速、嚴謹地驗證證明,確保已發表證明的正確性,并為進一步的研究奠定基礎。這樣的工具將有助于專家們應對日益加速且數量龐大的數學研究。

用于檢驗數學論證(例如證明)的計算機程序已經存在了幾十年。但是,將人類編寫的證明翻譯成計算機嚴格的編程語言——這是使用現有工具進行驗證的先決條件——極其耗時。這種翻譯過程被稱為形式化,有時可能需要數月甚至數年。

隨著首批大型語言模型的開發,數學家們燃起了希望:或許有一天機器可以自動完成這種翻譯。然而,與人類語言不同,形式化編程語言不允許任何形式的變體。每一個術語、符號和引用都必須精確定義。

但現在,一家名為Math, Inc.的初創公司宣布在形式化證明方面取得了初步成功。該公司的人工智能Gauss已經形式化了數學家瑪麗娜·維亞佐夫斯卡(Maryna Viazovska)關于高維球體排列的兩個復雜證明。維亞佐夫斯卡曾憑借其中一個證明榮獲2022年菲爾茲獎。然而,數學界對Gauss形式化證明的反應較為冷淡,部分原因是該項目的發展并未如許多專家所愿。隨著其他人工智能和數學領域的初創公司探索形式化,這個案例或許能為數學家們在充滿不確定性的未來中可能面臨的挑戰提供一些啟示。

打包難題


2016年,維亞佐夫斯卡解決了困擾數學界數十年的難題,成為該領域的中心人物:如何以最節省空間的方式排列球體?要找到最節省空間的單一方案,首先必須證明所有其他無窮多種球體排列方式都需要更多空間。直到1998年,人們才證明金字塔形排列——就像超市里堆放的橘子——確實是三維空間中最緊湊的排列方式。

但在更高維度上,球體的排列變得復雜得多,因為更高維度允許更多的排列方式和對稱性。維亞佐夫斯卡使用了一種特別巧妙的解決方案,這種方案僅適用于八維和二十四維空間:將空間利用率最高的三維排列方式轉移到這些更高維度,然后證明轉移后產生的空隙恰好足以在每個維度中容納一個額外的球體。

她首先著手證明八維空間的情況,并因此榮獲2022年菲爾茲獎。她的同事,麻省理工學院的數學家亨利·科恩,說服她與幾位合作者——包括羅格斯大學的斯蒂芬·米勒、現任高等科學研究院的丹尼洛·拉德琴科以及當時在石溪大學的阿比納夫·庫馬爾——共同開發24維空間的證明。一周之內,他們就成功了。

但這些證明能否被形式化,并由計算機驗證呢?2023年,維亞佐夫斯卡遇到了西達爾特·哈里哈蘭,當時哈里哈蘭正在倫敦帝國理工學院攻讀數學碩士學位,并從事一種名為LEan的形式化流程的研究。他們開始交流想法。“我們只是兩個好奇心強、渴望學習的人——事情就是這樣開始的,”他說。

兩人決定將維亞佐夫斯卡的證明形式化,方法是將其中引用的每個術語、定義和定理都翻譯成 Lean 代碼。他們與同事合作,于 2025 年 6 月推出了一個網站,記錄他們的形式化項目。團隊將維亞佐夫斯卡的原始工作分解成許多小的子任務,并將它們記錄在網上,以便更廣泛的 Lean 社區可以預約參與子任務。

與此同時,瑞士洛桑聯邦理工學院的數學博士生奧古斯特·波魯克斯 (Auguste Poiroux) 于 2025 年夏末幫助創立了初創公司 Math, Inc.。“我們希望能夠自動將論文或書籍的內容轉換為精益代碼并立即進行檢查,”波魯克斯解釋道。

Math, Inc.公司了解到了Hariharan及其同事的項目,并與他們取得了聯系。“2025年秋季,Math, Inc.公司的人告訴我們,他們已經將我們項目的部分內容正式化,并與我們分享了一些成果,”Hariharan回憶道,他現在是卡內基梅隆大學的博士生。“之后就失去了聯系。我們不知道他們的進展如何,甚至不知道他們是否還在繼續。”

“我們團隊規模很小,”波伊魯克斯說,“我們意識到無法同時改進我們的系統并推進哈里哈蘭的項目。所以我們專注于人工智能。”在接下來的幾周里,Math, Inc. 團隊成員進一步開發了他們基于代理的語言模型,名為 Gauss。

最終,該軟件似乎能夠將數學表達式翻譯成精益代碼,并在無需人工干預的情況下自動進行檢查。“我們以維亞佐夫斯卡的八維證明為例進行測試,”波魯克斯說,“結果系統突然輸出了完整的形式化證明。這完全出乎我們的意料。”

數學的未來


波魯和他的同事們欣喜若狂。哈里哈蘭的團隊卻不這么認為。“說實話,我們非常驚訝,”哈里哈蘭說。“這是我們的項目;我們花了兩年多的時間和大量精力——結果數學公司就解決了它。”

哈里哈蘭和他的同事原本計劃將部分形式化成果作為學生本科畢業論文的基礎。“但我想,事情就是這樣。人工智能具有顛覆性,”哈里哈蘭說道。

“當時我們太興奮了,沒有充分考慮后果,”波魯克斯說。“我明白,從外人的角度來看,這可能看起來像是我們故意隱瞞進展。以后我們一定會更加謹慎。”

Math, Inc. 隨后著手解決第二個維亞佐夫斯卡證明,該證明涉及24 維空間中的最優球體堆積問題。“在這種情況下,我們只給了高斯論文,沒有其他任何東西,”波魯克斯說。“系統將其轉換成了大約 12 萬行的精益代碼。”該代碼此后已通過驗證。

Math, Inc. 目前正與 Hariharan 及其他專家合作,進一步推進自動形式化,并使其覆蓋更多數學領域。“在許多領域,Lean 仍然缺少必要的構建模塊——我們目前還無法對這些領域的證明進行形式化,”Poiroux 說。

當數學的大部分內容能夠被形式化時,新的可能性將會出現。Math, Inc. 的系統不僅僅是翻譯機器:它們能夠檢測并糾正論文中的細微錯誤,這種能力預示著未來人工智能或許會掌控整個數學領域——甚至在研究方面超越人類。

“當我們的模型能夠完全理解數學時,它們就可以用完全不同的方式思考數學,”波魯克斯說,“并有可能得出全新的結果。”

本文最初發表于《科學光譜》(Spektrum der Wissenschaft),經授權轉載。原文為德語,由人工智能輔助翻譯,并經編輯審閱。

版權與許可
MANON BISCHOFF是一位理論物理學家,也是《科學美國人》的德語姊妹刊物《科學光譜》的編輯。


https://www.scientificamerican.com/article/what-happens-when-ai-starts-checking-mathematicians-work/

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“老婆,把你陪嫁房給我弟結婚用”妻子:抱歉,陪嫁房我賣掉了

“老婆,把你陪嫁房給我弟結婚用”妻子:抱歉,陪嫁房我賣掉了

多久情感
2026-04-19 11:18:48
人走茶涼具象化!武亮直播破防了,他紅著眼說:團隊又走了兩個人

人走茶涼具象化!武亮直播破防了,他紅著眼說:團隊又走了兩個人

樂悠悠娛樂
2026-04-20 11:18:01
40歲李小萌太豐滿,穿抹胸裙都兜不住好身材,難怪直男都喜歡她

40歲李小萌太豐滿,穿抹胸裙都兜不住好身材,難怪直男都喜歡她

蓓小西
2026-04-19 09:00:52
半場21分!真不像斷過跟腱的樣子啊...

半場21分!真不像斷過跟腱的樣子啊...

左右為籃
2026-04-20 11:57:07
女演員千萬別整容!看“金像獎紅毯”章子怡,舒淇同框,就懂了

女演員千萬別整容!看“金像獎紅毯”章子怡,舒淇同框,就懂了

觀察鑒娛
2026-04-20 14:58:23
劉曉慶只比鄧婕大5歲,二人狀態大不同,科技臉和原裝臉一眼就懂

劉曉慶只比鄧婕大5歲,二人狀態大不同,科技臉和原裝臉一眼就懂

蓓小西
2026-03-28 09:17:09
“毒包子”養廢了多少孩子,很多家長還在喂,看完文章停下來吧

“毒包子”養廢了多少孩子,很多家長還在喂,看完文章停下來吧

枕邊聊育兒
2026-04-20 08:46:22
4月20日油價變化,汽柴油下調780元/噸,今天降幅增加180元/噸!

4月20日油價變化,汽柴油下調780元/噸,今天降幅增加180元/噸!

豬友巴巴
2026-04-20 09:04:16
日本敢與中國叫板的三張底牌:家底、海底、臥底

日本敢與中國叫板的三張底牌:家底、海底、臥底

孝沛與世界
2026-04-18 02:02:26
美伊在阿曼灣交鋒畫面曝光!特朗普:伊貨船試圖突破美軍海上封鎖,被武力攔截并控制;伊朗:發射多架無人機打擊美艦

美伊在阿曼灣交鋒畫面曝光!特朗普:伊貨船試圖突破美軍海上封鎖,被武力攔截并控制;伊朗:發射多架無人機打擊美艦

極目新聞
2026-04-20 10:30:29
伊朗宣布參加2026年美加墨世界杯,公布了30人男足國家隊名單;伊朗體育部長曾表示不可能參加今夏的美加墨世界杯

伊朗宣布參加2026年美加墨世界杯,公布了30人男足國家隊名單;伊朗體育部長曾表示不可能參加今夏的美加墨世界杯

封面新聞
2026-04-20 10:28:18
你來一艘,我直接去一個編隊!中國海軍133艦隊直插日本咽喉水道

你來一艘,我直接去一個編隊!中國海軍133艦隊直插日本咽喉水道

聞識
2026-04-20 09:10:20
湖人對陣火箭G2賽前迎來利好消息:東契奇、里夫斯復出時間表出爐

湖人對陣火箭G2賽前迎來利好消息:東契奇、里夫斯復出時間表出爐

野渡舟山人
2026-04-20 06:30:25
左小青這狀態,鯊瘋了!明媚動人,若隱若現

左小青這狀態,鯊瘋了!明媚動人,若隱若現

只要高興就好
2025-12-10 19:09:26
鍾欣潼22歲清純動人畫面罕曝光,英皇釋出Twins昔日三週年片段

鍾欣潼22歲清純動人畫面罕曝光,英皇釋出Twins昔日三週年片段

粵睇先生
2026-04-20 00:45:03
五一放假通知來了!中小學生同時迎來一個好消息

五一放假通知來了!中小學生同時迎來一個好消息

老特有話說
2026-04-18 18:42:39
中國瘋狂買大豆爆倉,商家靈機一動:榨油賣給印度換錢

中國瘋狂買大豆爆倉,商家靈機一動:榨油賣給印度換錢

說宇宙
2026-04-19 12:10:03
東體:收獲海港首球的楊希賽后發了紅包,李帥也一同跟上

東體:收獲海港首球的楊希賽后發了紅包,李帥也一同跟上

懂球帝
2026-04-20 12:28:10
騙走50億被央視曝光!用小鮮肉的血抗衰,“撈金女王”這次真栽了

騙走50億被央視曝光!用小鮮肉的血抗衰,“撈金女王”這次真栽了

翰飛觀事
2026-04-08 17:13:46
日本突襲!28萬億市場,中國被踢出局,高市早苗亮出3張底牌

日本突襲!28萬億市場,中國被踢出局,高市早苗亮出3張底牌

阿甘天天傳
2026-04-20 02:26:43
2026-04-20 15:43:00
科學的歷程 incentive-icons
科學的歷程
吳國盛、田松主編
3187文章數 15015關注度
往期回顧 全部

科技要聞

拋棄OpenAI,Anthropic為何成中國AI新偶像

頭條要聞

拼多多等被罰近36億:有人吞證據抗法 執法人員骨折

頭條要聞

拼多多等被罰近36億:有人吞證據抗法 執法人員骨折

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

鹿晗生日上熱搜,被關曉彤撕下體面

財經要聞

月之暗面IPO迷局

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態度原創

數碼
時尚
家居
教育
旅游

數碼要聞

告別性能/靜音妥協:HyperX暗影精靈PRO16狂暴模式,2026硬核指南

今年最流行的衣服竟然是它?高級又氣質!

家居要聞

自然慢調 慢享時光

教育要聞

“博士+碩士”是按問題導向的改革,別異化成又一場學歷競賽

旅游要聞

山水科技交融掀起春日文旅熱潮——三月三廣西河池金城江龍江第一灣舉辦國潮活動

無障礙瀏覽 進入關懷版