无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

留給人類數(shù)學(xué)家的懸賞不多了!谷歌DeepMind一口氣解決9道埃爾德什問題

0
分享至

AI進軍數(shù)學(xué)界的速度太快了。

OpenAI前腳剛用內(nèi)部模型突破埃爾德什的80年單位距離問題,谷歌DeepMind后腳就解決一個同樣卡了人類56年的埃爾德什數(shù)學(xué)難題——

最新發(fā)布AlphaProof Nexus,一套由Gemini驅(qū)動的智能體框架,一出手就是9個埃爾德什開放問題


除了這9道,它還順手證明了OEIS整數(shù)序列百科里的44個猜想、搞定了一道擱置15年的代數(shù)幾何難題、還改進了凸優(yōu)化領(lǐng)域里一個沿用已久的理論邊界。

推理成本呢?每道題幾百美元,整套證明代碼也全都開源放在了GitHub上。


這篇論文共有20位作者,其中的Aja Huang,也是2016年AlphaGo的核心研究員。

56年沒人做出來的題,AI 給了什么答案

AlphaProof Nexus解決的這幾道題,咱挑三道最有意思的說說。

Erd?s ,1970年提出,懸置56年

這道題問的是:你能不能找出一個無限大的整數(shù)集合,滿足兩個聽起來很別扭的條件:

第一,任意從中挑三個不同的數(shù)字a、b、c,a永遠不能整除b加c的和。

第二,這組數(shù)不能太零散,在自然數(shù)里要保持一定的密度。

簡單理解就是,這群數(shù)字之間,既不能一個數(shù)整除另一個數(shù),也不能一個數(shù)整除另外兩個數(shù)的和,同時數(shù)字還要分布得相對密集,不能只挑寥寥幾個數(shù)投機取巧。

從1970年開始,就沒人能給出這個集合的完整構(gòu)造,各種局部進展有,但始終拼不成一個整體解。


AI的解法是用中國剩余定理把大問題拆成許多個獨立的區(qū)塊,每個區(qū)塊內(nèi)部用三項等差數(shù)列的回避集來滿足約束,然后把所有區(qū)塊拼回一個完整的無限集。


Erd?s ,1996年提出,30年沒有定論

這道題聽著就更奇怪了。

想象兩個數(shù)字集合:第一個集合里全是“在三進制下只由數(shù)字0和1組成的整數(shù)”,第二個集合里全是“在四進制下只由數(shù)字0和1組成的整數(shù)”。把這兩個集合里所有數(shù)字兩兩相加,得到一個新集合。

問:這個新集合里的數(shù)字在自然數(shù)中出現(xiàn)的頻率(數(shù)學(xué)上叫下密度)是不是正的?

直覺上你可能會覺得,兩種集合包含的數(shù)字本來就不算很多,加起來應(yīng)該也挺稀疏的。

但稀疏到什么程度?是徹底稀到密度歸零,還是多少保持一點正密度?

這中間的差別非常微妙,1996年提出后一直沒定論。

AI的答案是:密度為零。


證明思路是log?除以log?是無理數(shù)。這意味著3的冪次和4的冪次可以以任意精度彼此逼近。

利用這一點,AI構(gòu)造了一個歸納性稀疏化論證:不斷找到兩個幾乎對齊的尺度,讓密度以0.99的比率一步步衰減,直到徹底歸零。

一個純數(shù)論的性質(zhì),解決了一個組合幾何的問題。

Erd?s ,1992年提出,卡了人類34年。

這是個平面幾何題,AI證明了存在這樣一個無限擴展的平面點集:

你從中任意挑出有限個點,總能發(fā)現(xiàn)其中大部分點是不共線的——

隨便截一段,看起來都挺正常,但當(dāng)你試圖把這個無限集合拆分成有限個“絕對沒有任何三點共線”的子集時,辦不到。

一個集合的每個有限局部都正常,但整體頑固得不可拆分。這種全局與局部的張力,是組合幾何里最難的那一類問題。

AI把完全圖的每條邊映射到平面上一個點,用二次多項式編碼坐標(biāo),再拉上無窮Ramsey定理完成證明,把一個幾何問題翻譯成了圖論和邏輯的語言。

除了這三道,還有六道分別在整除集構(gòu)造、范德瓦爾登數(shù)間隙、西頓集孤立點、集合拆分密度等領(lǐng)域。


同時,AlphaProof Nexus還在OEIS整數(shù)序列百科里證明了44個開放猜想,在代數(shù)幾何那邊解決了一道希爾伯特函數(shù)對數(shù)凹性的15年懸案,凸優(yōu)化那邊改進了一個錨定梯度下降法的理論邊界。


菲爾茲獎得主陶哲軒曾經(jīng)提醒過,AI目前解決埃爾德什問題的實際成功率大約在1-2%,這次谷歌的系統(tǒng)挑戰(zhàn)了353道題,解開9道,比例剛好對上了。

用幾百美元算力換一道56年難題

AlphaProof Nexus的架構(gòu)核心用一句話就能說清楚,Gemini 3.1 Pro生成Lean語言證明步驟→Lean編譯器逐行檢查→報錯直接反饋給模型→模型根據(jù)報錯修改→再檢查→循環(huán)到全部通過。


好家伙,這有點像平時寫代碼,只不過現(xiàn)在Debug的是數(shù)學(xué)定理……


在這套框架里,DeepMind設(shè)計了四個Agent

最簡單的Agent A是同時啟動多個獨立子Agent,先靠Gemini 3.1 Pro梳理解題思路,動手編寫證明代碼。

寫完立刻交給編譯器核驗,一旦報錯,錯誤信息就會傳回模型,讓它不斷修改、重試,直到通關(guān)。

全程沒有額外輔助工具,純靠寫代碼+查錯循環(huán)。


Agent B多了一樣?xùn)|西,AlphaProof。

AlphaProof是DeepMind之前專門為奧數(shù)級別題目訓(xùn)練過的強化學(xué)習(xí)證明工具。

當(dāng)Agent A模式在某個小步驟上反復(fù)卡住、編譯器反復(fù)報錯也修不過來時,Agent B可以調(diào)用AlphaProof做一次強化學(xué)習(xí)驅(qū)動的樹搜索,專門攻擊這個局部難點。

Agent C引入了進化算法的思路。

前面兩種Agent的子Agent都是各自獨立工作的,互不交流。

Agent C是所有子Agent共享一個證明草圖種群,每一個子模塊都會產(chǎn)出不同的證明草稿。

然后由另一個模型從合理性、清晰度、新穎性三個維度給每一份草稿打分,用Elo評分系統(tǒng)排名。

高分草稿會相互組合,衍生出新解法,低分草稿直接淘汰,整個種群在證明空間里做進化搜索。

Agent D是全功能完全體,進化篩選思路+專項工具攻克難點+大模型邏輯推理,三股力量在一個框架里協(xié)同,也是這次批量破解難題的主力。


這么看下來,我以為最強的Agent D應(yīng)該會碾壓一切,Agent A只當(dāng)個對照組。

結(jié)果沒想到論文里表明最簡單的Agent A,同樣能解出全部9道題

沒有進化算法,沒有AlphaProof,就一個LLM循環(huán)加編譯器反饋的Agent A,只是在難題上更費錢一點。


研究團隊把原因歸為兩個:

  • 一是Gemini 3.1 Pro本身的能力已經(jīng)足夠強了;

  • 二是Lean編譯器的那層實打?qū)嵉募m錯反饋,對AI的引導(dǎo)作用,遠比人們預(yù)想的更大。

這個結(jié)果或許也在預(yù)示著,未來隨著大模型能力持續(xù)升級,復(fù)雜的多工具組合系統(tǒng),可能不再是剛需,只用大模型+專業(yè)校驗工具這套簡單循環(huán),就能搞定大多數(shù)數(shù)學(xué)難題。

而且這套方案的優(yōu)勢也體現(xiàn)在成本上,單題僅需幾百美元。

埃爾德什生前為這些難題設(shè)置了懸賞,只是他不會想到——

解開這些謎題的可能不是人類智慧,而是算力。

論文地址:https://arxiv.org/abs/2605.22763v1
Github地址:https://github.com/google-deepmind/alphaproof-nexus-results

參考鏈接:
[1]https://x.com/pushmeet/status/2058936037754224998
[2]https://the-decoder.com/google-deepminds-alphaproof-nexus-solves-decades-old-math-problems-for-a-few-hundred-dollars/

文章來源:量子位。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
北京樓市開始離譜了!海淀中關(guān)村學(xué)區(qū)房從13萬變成8.5萬,雞娃家長開始進場了

北京樓市開始離譜了!海淀中關(guān)村學(xué)區(qū)房從13萬變成8.5萬,雞娃家長開始進場了

民生格物
2026-06-09 21:36:08
1986年丁玲病逝,沈醉聊起當(dāng)年她被捕,說:她叛變,我不會不知道

1986年丁玲病逝,沈醉聊起當(dāng)年她被捕,說:她叛變,我不會不知道

簡史檔案館
2026-06-10 11:05:03
循環(huán)壽命超10萬次 曾轟動全球的Donut全固態(tài)電池被證實造假!實際為鋰電池

循環(huán)壽命超10萬次 曾轟動全球的Donut全固態(tài)電池被證實造假!實際為鋰電池

中國能源網(wǎng)
2026-06-09 11:00:21
神經(jīng)科醫(yī)生:只要低密度脂蛋白不超過這個值,腦梗風(fēng)險不用太焦慮

神經(jīng)科醫(yī)生:只要低密度脂蛋白不超過這個值,腦梗風(fēng)險不用太焦慮

荊醫(yī)生科普
2026-06-10 19:30:08
世界首富貓為何破產(chǎn)?老佛爺給它留了150萬刀遺產(chǎn),如今蝸居公寓落差太大!

世界首富貓為何破產(chǎn)?老佛爺給它留了150萬刀遺產(chǎn),如今蝸居公寓落差太大!

新歐洲
2026-06-10 19:23:11
理想翻車?車主被全網(wǎng)嘲“沒素質(zhì)”,訂單大量流失

理想翻車?車主被全網(wǎng)嘲“沒素質(zhì)”,訂單大量流失

時光慢旅人
2026-06-08 17:22:06
德尚:姆巴佩已經(jīng)踢了3年中路,我們這些教練都很蠢嗎?

德尚:姆巴佩已經(jīng)踢了3年中路,我們這些教練都很蠢嗎?

懂球帝
2026-06-10 14:38:05
又一“國民飲料”塌房,背后全是科技與狠活,網(wǎng)友:又搞擦邊

又一“國民飲料”塌房,背后全是科技與狠活,網(wǎng)友:又搞擦邊

南宗歷史
2026-06-10 19:15:07
韓國股市連續(xù)3日熔斷,股民至少被強平3000億韓元!散戶借錢抄底,銀行人士:股市調(diào)整時,散戶買盤就會擴大

韓國股市連續(xù)3日熔斷,股民至少被強平3000億韓元!散戶借錢抄底,銀行人士:股市調(diào)整時,散戶買盤就會擴大

每日經(jīng)濟新聞
2026-06-10 23:00:08
直線拉升!美國CPI,“救市”了

直線拉升!美國CPI,“救市”了

中國基金報
2026-06-10 21:26:51
昔日茅臺多空分歧引發(fā)“決裂”?但斌辟謠被段永平拉黑:只是取關(guān),非常尊重段總

昔日茅臺多空分歧引發(fā)“決裂”?但斌辟謠被段永平拉黑:只是取關(guān),非常尊重段總

每日經(jīng)濟新聞
2026-06-10 20:31:07
1夜4大轉(zhuǎn)會!巴薩第一筆清洗 皇馬1.5億砸小蜘蛛 曼聯(lián)高價簽中場!

1夜4大轉(zhuǎn)會!巴薩第一筆清洗 皇馬1.5億砸小蜘蛛 曼聯(lián)高價簽中場!

寶哥精彩賽事
2026-06-11 00:59:01
晚節(jié)不保!黃百鳴被判入獄后,更多惡行被扒,李小冉也曾是受害者

晚節(jié)不保!黃百鳴被判入獄后,更多惡行被扒,李小冉也曾是受害者

嘴角上翹的弧度
2026-06-10 21:31:05
尼科-帕斯:從一開始我就知道傷勢并不嚴重,幸運的是我已經(jīng)康復(fù)了

尼科-帕斯:從一開始我就知道傷勢并不嚴重,幸運的是我已經(jīng)康復(fù)了

懂球帝
2026-06-10 23:55:43
馬斯克:我原來那輛特斯拉目前正在地球火星之間飛行 至少還要飛1000萬年

馬斯克:我原來那輛特斯拉目前正在地球火星之間飛行 至少還要飛1000萬年

快科技
2026-06-10 17:28:07
郭京飛、任素汐《迷墻》勸退無數(shù)人?這顏值把“丑”刻在骨子里!

郭京飛、任素汐《迷墻》勸退無數(shù)人?這顏值把“丑”刻在骨子里!

楓塵余往逝
2026-06-10 04:42:18
“你念幼兒園?”女子穿幼態(tài)褲子開家長會,穿艾莎都比這個體面!

“你念幼兒園?”女子穿幼態(tài)褲子開家長會,穿艾莎都比這個體面!

番外行
2026-06-06 13:29:54
女排名將李娟:前男友與魏秋月結(jié)婚,如今她也已成家,有一雙兒女

女排名將李娟:前男友與魏秋月結(jié)婚,如今她也已成家,有一雙兒女

冷紫葉
2026-06-10 16:13:34
100條健康常識,條條是干貨,建議為家人收藏!

100條健康常識,條條是干貨,建議為家人收藏!

詩詞天地
2026-04-24 14:07:58
伊朗襲擊美軍第五艦隊

伊朗襲擊美軍第五艦隊

財聯(lián)社
2026-06-10 08:52:15
2026-06-11 07:03:00
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識,交流思想
5604文章數(shù) 64624關(guān)注度
往期回顧 全部

科技要聞

史上最大IPO將至:1.8萬億美元的信仰豪賭

頭條要聞

杭州店主回應(yīng)2188元天價面:一天200個電話不分晝夜罵

頭條要聞

杭州店主回應(yīng)2188元天價面:一天200個電話不分晝夜罵

體育要聞

2026世界杯,我們看什么?

娛樂要聞

蒙淇淇發(fā)文開撕白鹿!輿論再次反轉(zhuǎn)

財經(jīng)要聞

SpaceX IPO或誕生4000名百萬富翁

汽車要聞

埃安i60 530寧德時代版上市限時煥新價10.36萬起

態(tài)度原創(chuàng)

家居
親子
游戲
本地
旅游

家居要聞

空間微調(diào) 移形換境

親子要聞

“猜猜誰是女兒”遭網(wǎng)友群嘲,硬裝嫩的家長,輸了面子也輸了認知

《鬼武者:劍之道》團隊游民采訪:保留精髓并創(chuàng)新

本地新聞

世界杯還沒開始,蘇超已經(jīng)火到爆梗

旅游要聞

一封來自玉龍雪山的夏日請柬!文旅歌曲《麗江夏日的請柬》發(fā)布

無障礙瀏覽 進入關(guān)懷版