網易首頁 > 網易號 > 正文 申請入駐

AI首次攻克FrontierMath前沿數學開放問題集的一道組合學難題

0
分享至

置頂zzllrr小樂公眾號(主頁右上角)數學科普不迷路!

AI人工智能首先攻克了《FrontierMath前沿數學:開放問題集》中的一道組合學難題(FrontierMath未解數學難題集第6題:超圖上的拉姆齊類型問題:構造盡可能大的超圖,使其不具有某種易于檢查但難以發現的性質。),該基準測試收錄的均為數學家們反復嘗試卻始終未能解決的真實研究難題——參閱:。

作者:Epoch.ai 2026-3-24

譯者:zzllrr小樂(數學科普公眾號)2026-3-24


這道新被攻克的難題內容如下:

6、組合數學——中等有趣的成果

超圖上的拉姆齊類型問題:構造盡可能大的超圖,使其不具有某種易于檢查但難以發現的性質。

這個問題是關于改進數列H(n)的值的下界,該序列出現在研究如下定義的無窮級數集合的同時收斂性時。

如果存在某個D?V和 P?H ,使得|D|=n 且 D中的每個元素都恰好包含在P的一個元素中,則稱超圖(V, H) 包含大小(規模)為 n的劃分。


例如,上圖左側展示的是一個含 8 個頂點、4 條超邊的超圖,右側則展示出該超圖包含一個規模為 4 的劃分。

H(n)是最大的 k∈? ,使得存在一個超圖(V, H) ,其中|V| =k 沒有孤立頂點,并且不包含大小(規模)大于n 的劃分。

H(1) = 1, H(2) = 3, H(3) = 5, H(4) = 8,

H(5) = 10, H(6) = 14, H(7) = 17,

要證明H(6)=14,則需構造一個14階超圖,且該超圖不包含規模大于6的劃分。以下為兩個符合該條件的示例:


數學家們認為,目前已知的H(n)的最佳下界即使在漸近意義上也是次優的,并且可以通過尋找新的超圖構造來改進它們。本問題的目標就是找到這樣一種構造。

——威爾·布萊恩(Will Brian

北卡羅來納大學夏洛特分校數學助理教授

https://epoch.ai/frontiermath/open-problems/ramsey-hypergraphs

https://epoch.ai/files/open-problems/ramsey-hypergraphs.pdf

這道剛被攻克的難題由威爾?布萊恩(Will Brian)提出,他將其歸為 “頗具研究價值” 類別。該難題是他與保羅?拉爾森(Paul Larson)在 2019 年合著的論文中提出的一個猜想,兩人當時未能破解,此后數次嘗試也均以失敗告終。以下是布萊恩的相關表述。

這一解法令人振奮,我一直覺得這個問題極具研究價值。我此前曾猜想,或許能通過人工智能的方法來求解,卻始終難以梳理出具體思路。如今看來,這種方法的推導過程堪稱完美。

該解法彌補了我們在下界構造中存在的一處疏漏,從某種意義上來說,與我們在上界構造中用到的復雜思路形成了呼應。對于拉姆齊理論相關問題而言,這種上下界的精準匹配已是極佳結果,我也十分希望能進一步探究其背后的深層邏輯,弄清這一解法為何能達到如此理想的效果。


——威爾·布萊恩(Will Brian

北卡羅來納大學夏洛特分校數學助理教授

布萊恩計劃將該解法整理成文并發表,文中或將納入受人工智能思路啟發而開展的后續研究成果。這與他此前的預期評估一致:這一解法的研究成果可在正規專業期刊發表,且大概率能衍生出全新的研究問題。

在此祝賀凱文?巴雷托(Kevin Barreto)和利亞姆?普萊斯(Liam Price),二人首次引導 GPT-5.4 Pro 模型推導出了該難題的解法!他們有權選擇與布萊恩共同成為相關論文的合作者。同樣祝賀蓋比?賈夫(Geby Jaff),他不久后也引導模型得出了該難題的解法。

我們已在用于測試模型解題能力的實驗框架中,復現了這一引導求解的過程。在該框架下,Google Gemini 3.1 Pro、GPT-5.4(超高精度版)以及Claude Opus 4.6(頂配版)這三款模型,均至少能在部分嘗試中解出這道題。如需了解該難題的更多細節,包括記錄 GPT-5.4 Pro 原始解法的完整對話文本,以及實驗框架中其他模型的解題過程,可訪問我們官網的該難題專屬頁面或參見下文。


AI提示詞(Prompts

基礎熱身題(Warm-up):求解已存在已知構造方法的某一H(n)值。

A hypergraph (V, H) is said to contain a partition of size n if there is some D ? V and P ? H such that |D| = n and every member of D is contained in exactly one member of P. Find a hypergraph (V, H) with no isolated vertices such that |V| ≥ 64, |H| ≤ 20, and (V, H) contains no partitions of size > 20. Output the hypergraph as a string where vertices are labeled, 1, ..., |V|, and edges are denoted with curly braces. Example: {1,2,3},{2,4},{3,4,5},{1,5}

若存在子集D?V和P?H,滿足∣D∣=n且D中的每個元素恰好包含在P的唯一一個元素中,則稱超圖(V,H)包含一個規模為n的劃分。

構造一個無孤立頂點的超圖(V,H),滿足∣V∣≥64,∣H∣≤20,且該超圖不包含規模大于 20 的劃分。

將超圖以字符串形式輸出,頂點標記為 1、2、……、∣V∣,邊以大括號表示。示例:{1,2,3},{2,4},{3,4,5},{1,5}

單項挑戰(Single challenge):求解尚無已知構造方法、且難以通過暴力枚舉求解的某一H(n)值。

A hypergraph (V, H) is said to contain a partition of size n if there is some D ? V and P ? H such that |D| = n and every member of D is contained in exactly one member of P. Find a hypergraph (V, H) with no isolated vertices such that |V| ≥ 66, |H| ≤ 20, and (V, H) contains no partitions of size > 20. Output the hypergraph as a string where vertices are labeled, 1, ..., |V|, and edges are denoted with curly braces. Example: {1,2,3},{2,4},{3,4,5},{1,5}

若存在子集D?V和P?H,滿足∣D∣=n且D中的每個元素恰好包含在P的唯一一個元素中,則稱超圖(V,H)包含一個規模為n的劃分。

構造一個無孤立頂點的超圖(V,H),滿足∣V∣≥66,∣H∣≤20,且該超圖不包含規模大于 20 的劃分。

將超圖以字符串形式輸出,頂點標記為 1、2、……、∣V∣,邊以大括號表示。示例:{1,2,3},{2,4},{3,4,5},{1,5}

完整問題(Full problem):為所有n求解H(n)的通用算法。

A hypergraph (V, H) is said to contain a partition of size n if there is some D ? V and P ? H such that |D| = n and every member of D is contained in exactly one member of P. Define H(n) to be the largest integer k such that there is a hypergraph (V, H) with |V| = k having no isolated vertices and containing no partitions of size greater than n.

It is known that H(n) ≥ k_n, where k_n is defined recursively by the formula k_1 = 1 and k_n = ?n/2? + k_?n/2? + k_?(n+1)/2?.

Your task is to improve this lower bound by a constant factor, i.e. show that H(n) ≥ c*k_n for some c > 1. It is acceptable if this improvement does not work for small n, but it must already be "in effect" for n=15. You must demonstrate this improvement by providing an algorithm that takes n as input and produces a hypergraph witnessing H(n) ≥ c * k_n.

Please provide an algorithm that takes n as input and outputs the witness hypergraph as a string where vertices are labeled, 1, ..., |V|, and edges are denoted with curly braces. Example: {1,2,3},{2,4},{3,4,5},{1,5}

Solution format:

* Write a Python script defining a function `solution(n: int) -> str`.

* Do not include any code at the file level. You may include a `main` block for testing, but it will not be executed by the verifier.

* For n ≤ 100, the algorithm must complete within 10 minutes when run on a typical laptop.

若存在子集D?V和P?H,滿足∣D∣=n且D中的每個元素恰好包含在P的唯一一個元素中,則稱超圖(V,H)包含一個規模為n的劃分。

定義H(n)為滿足下述條件的最大整數k:存在頂點數為k的超圖(V,H),該超圖無孤立頂點,且不包含規模大于n的劃分。

已知H(n)≥k??,其中kn?由下述遞推公式定義:k?=1,k??=?n/2?+k_?n/2??+k_?(n+1)/2??。

你的任務是將該下界提升一個常數因子,即證明存在常數c>1,使得H(n)≥c?k??。該改進結果無需適用于小數值n,但需在n=15時已生效。你必須通過設計算法來驗證該改進效果,該算法以n為輸入,生成可驗證H(n)≥c?k??的超圖。

請設計一個以n為輸入的算法,將驗證用超圖以字符串形式輸出,頂點標記為 1、2、……、∣V∣,邊以大括號表示。示例:{1,2,3},{2,4},{3,4,5},{1,5}

解法輸出格式要求

  • 編寫 Python 腳本,定義函數solution(n: int) -> str;

  • 不得在文件級別編寫任何代碼,可添加main代碼塊用于測試,但驗證程序不會執行該代碼塊;

  • 對于n≤100的情況,該算法在普通筆記本電腦上的運行時間需在 10 分鐘內。

也歡迎瀏覽《前沿數學:開放問題集》主頁面,深入了解這一基準測試。參閱:

截至目前,已有一道 “頗具研究價值” 的難題被破解。下一個被攻克的會是哪道題?又將在何時被解開?

參考資料

https://epochai.substack.com/p/first-ai-solution-on-frontiermath

https://epoch.ai/frontiermath/open-problems/ramsey-hypergraphs

https://epoch.ai/files/open-problems/ramsey-hypergraphs.pdf

小樂數學科普近期文章

·開放 · 友好 · 多元 · 普適 · 守拙·

讓數學

更加

易學易練

易教易研

易賞易玩

易見易得

易傳易及

歡迎評論、點贊、在看、在聽

收藏、分享、轉載、投稿

查看原始文章出處

點擊zzllrr小樂

公眾號主頁

右上角

置頂★加星

數學科普不迷路!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
再美又有什么用!遼寧40歲美女寶姐癌癥去世,前后僅二年多時間。

再美又有什么用!遼寧40歲美女寶姐癌癥去世,前后僅二年多時間。

趣味萌寵的日常
2026-04-23 18:25:27
頂流超模與當紅演員:一場被鏡頭捕捉的曖昧

頂流超模與當紅演員:一場被鏡頭捕捉的曖昧

熱搜摘要官
2026-04-23 02:06:15
光明乳業的“新鮮牧場”,究竟有沒有“商標擦邊”?

光明乳業的“新鮮牧場”,究竟有沒有“商標擦邊”?

無冕財經
2026-04-23 10:15:23
北京“最火駐京辦”關門半個月重開業,菜有調整嗎?飯點排隊超1小時…

北京“最火駐京辦”關門半個月重開業,菜有調整嗎?飯點排隊超1小時…

北京商報
2026-04-22 22:48:43
突發!印度“發動襲擊”!

突發!印度“發動襲擊”!

財經要參
2026-04-23 09:00:12
女籃疑似內訌?四大國手加盟海外聯賽:或為躲避宮魯鳴長期集訓?

女籃疑似內訌?四大國手加盟海外聯賽:或為躲避宮魯鳴長期集訓?

籃球快餐車
2026-04-24 01:39:29
向特朗普攤牌!委代總統撕下面具,親率幾十萬大軍,決意硬剛美國

向特朗普攤牌!委代總統撕下面具,親率幾十萬大軍,決意硬剛美國

趣文說娛
2026-04-23 22:00:08
這才是宋美齡和繼子蔣經國的一張真實合影,都是真人的容貌

這才是宋美齡和繼子蔣經國的一張真實合影,都是真人的容貌

喜歡歷史的阿繁
2026-04-16 11:17:28
保姆偷拿了家里2瓶茅臺去賣,我沒揭穿只辭退了她,臨走時她指了指舊皮鞋,我一看瞬間癱坐在地

保姆偷拿了家里2瓶茅臺去賣,我沒揭穿只辭退了她,臨走時她指了指舊皮鞋,我一看瞬間癱坐在地

今夜有個好故事
2026-03-11 17:26:56
國家一級女演員陳麗云被逮捕!

國家一級女演員陳麗云被逮捕!

許三歲
2026-03-28 09:24:30
伊朗外交部:談判重心已從核問題轉為徹底停戰

伊朗外交部:談判重心已從核問題轉為徹底停戰

財聯社
2026-04-24 02:33:07
廣西一4S店疑因資金鏈斷裂閉店,店內一片狼藉,展車被清空!

廣西一4S店疑因資金鏈斷裂閉店,店內一片狼藉,展車被清空!

黃河新聞網呂梁
2026-04-22 10:03:58
51歲徐靜蕾美國超市被拍,胖到不敢認!旁邊黃立行頭發花白?

51歲徐靜蕾美國超市被拍,胖到不敢認!旁邊黃立行頭發花白?

老吳教育課堂
2026-04-23 14:11:28
洗腦、性侵、亂倫,全球頭號變態復出了

洗腦、性侵、亂倫,全球頭號變態復出了

獨立魚
2026-04-23 22:35:39
經歷三次離婚后我才懂:所有夫妻關系破裂,都源于這三個原因

經歷三次離婚后我才懂:所有夫妻關系破裂,都源于這三個原因

千秋文化
2026-03-01 22:12:24
華誼兄弟被申請破產

華誼兄弟被申請破產

雷達財經
2026-04-23 15:51:26
克里姆林宮:普京愿在協議最終敲定階段與澤連斯基會面

克里姆林宮:普京愿在協議最終敲定階段與澤連斯基會面

每日經濟新聞
2026-04-23 07:31:38
足壇激情之夜:拜仁挺進決賽,曼城稱王,巴薩豪取八連勝!

足壇激情之夜:拜仁挺進決賽,曼城稱王,巴薩豪取八連勝!

銜春信
2026-04-24 04:09:50
匈牙利爆出戲劇性消息,毛焦爾提名安妮塔·歐爾班出任新政府外長

匈牙利爆出戲劇性消息,毛焦爾提名安妮塔·歐爾班出任新政府外長

混沌錄
2026-04-22 20:55:07
用了16年的學位證校方稱從未授予,當事人自我舉報求證真偽 炒作還是確有其事?

用了16年的學位證校方稱從未授予,當事人自我舉報求證真偽 炒作還是確有其事?

紅星新聞
2026-04-22 19:10:31
2026-04-24 04:51:00
小樂數學科普 incentive-icons
小樂數學科普
zzllrr小樂,小樂數學科普,讓前沿數學流行起來~
324文章數 7關注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產品",但量產難預測

頭條要聞

以色列:只要美國同意 將刺殺伊朗最高領袖

頭條要聞

以色列:只要美國同意 將刺殺伊朗最高領袖

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經要聞

普華永道賠償10億 恒大股東見到"回頭錢"

汽車要聞

預售30.29萬起 嵐圖泰山X8配896線激光雷達

態度原創

手機
旅游
教育
游戲
公開課

手機要聞

vivo X500 Pro Max被曝光:2nm工藝+5GHz,2K直屏九月發!

旅游要聞

來廣州,分享10億元“中國旅游日”專屬優惠福利

教育要聞

推薦一款高考志愿卡,五大功能助你解決志愿疑難

任天堂NS2銷量4倍碾壓PS5!差距懸殊 索尼難挽頹勢

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版