網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

不用人類插手！中國(guó)AI破解數(shù)學(xué)界十年未解難題

2026-04-13 20:25:40　來(lái)源: 金投網(wǎng)

浙江舉報(bào)

分享至

據(jù)研發(fā)團(tuán)隊(duì)介紹，中國(guó)一個(gè)人工智能框架已自主解決了美國(guó)數(shù)學(xué)家在十多年前提出的一個(gè)公開(kāi)問(wèn)題——安德森猜想。

前不久，北京大學(xué)牽頭的研究團(tuán)隊(duì)發(fā)了一篇預(yù)印本論文，論文稱，通過(guò)整合數(shù)十年的數(shù)學(xué)文獻(xiàn)，他們的AI框架彌合了自然語(yǔ)言推理與機(jī)器形式驗(yàn)證之間的鴻溝，成功解決了美國(guó)數(shù)學(xué)家丹·安德森早在2014年就提出的一個(gè)懸而未決的問(wèn)題，并在幾乎無(wú)需人類干預(yù)的情況下自動(dòng)完成了證明的形式化。

其實(shí)這些年隨著大語(yǔ)言模型發(fā)展，AI搞數(shù)學(xué)已經(jīng)不是新鮮事了，比如谷歌的Gemini Deep Think，都已是能在最頂尖的青年數(shù)學(xué)競(jìng)賽國(guó)際奧數(shù)上拿到金牌水平了。但要說(shuō)AI能完全自己搞定研究級(jí)別的數(shù)學(xué)難題，之前還真不行。

這是因?yàn)閿?shù)學(xué)證明最講究的就是百分之百嚴(yán)謹(jǐn)，哪怕是大專家寫的證明，都可能藏著你看不出來(lái)的小漏洞，大語(yǔ)言模型本身又容易“胡編亂造”，結(jié)果根本靠不住，所以此前就算是利用AI執(zhí)行數(shù)學(xué)計(jì)算，都得大量靠人類盯著，沒(méi)法實(shí)現(xiàn)全自動(dòng)。

這次中國(guó)團(tuán)隊(duì)的思路就特別妙，直接讓兩個(gè)AI智能體分工干活。第一個(gè)叫Rethlas，專門“想思路”，它就像人類數(shù)學(xué)家一樣，借助數(shù)學(xué)定理搜索引擎Matlas探索解題策略，先攢出一個(gè)像模像樣的候選證明草稿；第二個(gè)叫Archon，專門“把草稿變嚴(yán)謹(jǐn)”，它會(huì)用專門的定理搜索工具，把非正式證明轉(zhuǎn)換成可以被機(jī)器完全驗(yàn)證的正式項(xiàng)目。

他們拿這套方法去試安德森那道交換代數(shù)里的問(wèn)題——交換代數(shù)是現(xiàn)代代數(shù)幾何、數(shù)論的基礎(chǔ)。AI自己給了一個(gè)反例的非正式證明，推翻了原來(lái)問(wèn)題的前提，隨后僅用80小時(shí)的智能體運(yùn)行時(shí)間，就把整個(gè)證明的形式化驗(yàn)證全做完了。整個(gè)過(guò)程中，人類只干了一件事：幫AI下了幾個(gè)它無(wú)法自行獲取的付費(fèi)文件，連“這個(gè)證明對(duì)不對(duì)”這種數(shù)學(xué)判斷，都完全沒(méi)用人類出手。

研究人員寫道：“總的來(lái)說(shuō)，我們的結(jié)果表明，對(duì)于真正的數(shù)學(xué)公開(kāi)問(wèn)題，非正式推理智能體和形式智能體可以有效協(xié)作。”事實(shí)上，AI和數(shù)學(xué)本來(lái)就是互相成就的，數(shù)學(xué)為AI發(fā)展提供理論基礎(chǔ)，而AI工具則可以加速數(shù)學(xué)研究本身。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.