據(jù)研發(fā)團(tuán)隊(duì)介紹,中國(guó)一個(gè)人工智能框架已自主解決了美國(guó)數(shù)學(xué)家在十多年前提出的一個(gè)公開(kāi)問(wèn)題——安德森猜想。
![]()
前不久,北京大學(xué)牽頭的研究團(tuán)隊(duì)發(fā)了一篇預(yù)印本論文,論文稱,通過(guò)整合數(shù)十年的數(shù)學(xué)文獻(xiàn),他們的AI框架彌合了自然語(yǔ)言推理與機(jī)器形式驗(yàn)證之間的鴻溝,成功解決了美國(guó)數(shù)學(xué)家丹·安德森早在2014年就提出的一個(gè)懸而未決的問(wèn)題,并在幾乎無(wú)需人類干預(yù)的情況下自動(dòng)完成了證明的形式化。
其實(shí)這些年隨著大語(yǔ)言模型發(fā)展,AI搞數(shù)學(xué)已經(jīng)不是新鮮事了,比如谷歌的Gemini Deep Think,都已是能在最頂尖的青年數(shù)學(xué)競(jìng)賽國(guó)際奧數(shù)上拿到金牌水平了。但要說(shuō)AI能完全自己搞定研究級(jí)別的數(shù)學(xué)難題,之前還真不行。
這是因?yàn)閿?shù)學(xué)證明最講究的就是百分之百嚴(yán)謹(jǐn),哪怕是大專家寫的證明,都可能藏著你看不出來(lái)的小漏洞,大語(yǔ)言模型本身又容易“胡編亂造”,結(jié)果根本靠不住,所以此前就算是利用AI執(zhí)行數(shù)學(xué)計(jì)算,都得大量靠人類盯著,沒(méi)法實(shí)現(xiàn)全自動(dòng)。
這次中國(guó)團(tuán)隊(duì)的思路就特別妙,直接讓兩個(gè)AI智能體分工干活。第一個(gè)叫Rethlas,專門“想思路”,它就像人類數(shù)學(xué)家一樣,借助數(shù)學(xué)定理搜索引擎Matlas探索解題策略,先攢出一個(gè)像模像樣的候選證明草稿;第二個(gè)叫Archon,專門“把草稿變嚴(yán)謹(jǐn)”,它會(huì)用專門的定理搜索工具,把非正式證明轉(zhuǎn)換成可以被機(jī)器完全驗(yàn)證的正式項(xiàng)目。
![]()
他們拿這套方法去試安德森那道交換代數(shù)里的問(wèn)題——交換代數(shù)是現(xiàn)代代數(shù)幾何、數(shù)論的基礎(chǔ)。AI自己給了一個(gè)反例的非正式證明,推翻了原來(lái)問(wèn)題的前提,隨后僅用80小時(shí)的智能體運(yùn)行時(shí)間,就把整個(gè)證明的形式化驗(yàn)證全做完了。整個(gè)過(guò)程中,人類只干了一件事:幫AI下了幾個(gè)它無(wú)法自行獲取的付費(fèi)文件,連“這個(gè)證明對(duì)不對(duì)”這種數(shù)學(xué)判斷,都完全沒(méi)用人類出手。
研究人員寫道:“總的來(lái)說(shuō),我們的結(jié)果表明,對(duì)于真正的數(shù)學(xué)公開(kāi)問(wèn)題,非正式推理智能體和形式智能體可以有效協(xié)作。”事實(shí)上,AI和數(shù)學(xué)本來(lái)就是互相成就的,數(shù)學(xué)為AI發(fā)展提供理論基礎(chǔ),而AI工具則可以加速數(shù)學(xué)研究本身。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.