網易首頁 > 網易號 > 正文申請入駐

AI首次攻克FrontierMath前沿數學開放問題集的一道組合學難題

2026-03-24 10:19:10　來源: 小樂數學科普

江蘇舉報

分享至

★置頂zzllrr小樂公眾號（主頁右上角）數學科普不迷路！

AI人工智能首先攻克了《FrontierMath前沿數學：開放問題集》中的一道組合學難題（FrontierMath未解數學難題集第6題：超圖上的拉姆齊類型問題：構造盡可能大的超圖，使其不具有某種易于檢查但難以發現的性質。），該基準測試收錄的均為數學家們反復嘗試卻始終未能解決的真實研究難題——參閱：。

作者：Epoch.ai 2026-3-24

譯者：zzllrr小樂（數學科普公眾號）2026-3-24

這道新被攻克的難題內容如下：

6、組合數學——中等有趣的成果

超圖上的拉姆齊類型問題：構造盡可能大的超圖，使其不具有某種易于檢查但難以發現的性質。

這個問題是關于改進數列H(n)的值的下界，該序列出現在研究如下定義的無窮級數集合的同時收斂性時。

如果存在某個D?V和 P?H ，使得|D|=n 且 D中的每個元素都恰好包含在P的一個元素中，則稱超圖(V, H) 包含大小（規模）為 n的劃分。

例如，上圖左側展示的是一個含 8 個頂點、4 條超邊的超圖，右側則展示出該超圖包含一個規模為 4 的劃分。

H(n)是最大的 k∈? ，使得存在一個超圖(V, H) ，其中|V| =k 沒有孤立頂點，并且不包含大小（規模）大于n 的劃分。

H(1) = 1, H(2) = 3, H(3) = 5, H(4) = 8,

H(5) = 10, H(6) = 14, H(7) = 17，

要證明H(6)=14，則需構造一個14階超圖，且該超圖不包含規模大于6的劃分。以下為兩個符合該條件的示例：

數學家們認為，目前已知的H(n)的最佳下界即使在漸近意義上也是次優的，并且可以通過尋找新的超圖構造來改進它們。本問題的目標就是找到這樣一種構造。

——威爾·布萊恩（Will Brian）

北卡羅來納大學夏洛特分校數學助理教授

https://epoch.ai/frontiermath/open-problems/ramsey-hypergraphs

https://epoch.ai/files/open-problems/ramsey-hypergraphs.pdf

這道剛被攻克的難題由威爾?布萊恩（Will Brian）提出，他將其歸為 “頗具研究價值” 類別。該難題是他與保羅?拉爾森（Paul Larson）在 2019 年合著的論文中提出的一個猜想，兩人當時未能破解，此后數次嘗試也均以失敗告終。以下是布萊恩的相關表述。

“這一解法令人振奮，我一直覺得這個問題極具研究價值。我此前曾猜想，或許能通過人工智能的方法來求解，卻始終難以梳理出具體思路。如今看來，這種方法的推導過程堪稱完美。

該解法彌補了我們在下界構造中存在的一處疏漏，從某種意義上來說，與我們在上界構造中用到的復雜思路形成了呼應。對于拉姆齊理論相關問題而言，這種上下界的精準匹配已是極佳結果，我也十分希望能進一步探究其背后的深層邏輯，弄清這一解法為何能達到如此理想的效果。”

——威爾·布萊恩（Will Brian）

北卡羅來納大學夏洛特分校數學助理教授

布萊恩計劃將該解法整理成文并發表，文中或將納入受人工智能思路啟發而開展的后續研究成果。這與他此前的預期評估一致：這一解法的研究成果可在正規專業期刊發表，且大概率能衍生出全新的研究問題。

在此祝賀凱文?巴雷托（Kevin Barreto）和利亞姆?普萊斯（Liam Price），二人首次引導 GPT-5.4 Pro 模型推導出了該難題的解法！他們有權選擇與布萊恩共同成為相關論文的合作者。同樣祝賀蓋比?賈夫（Geby Jaff），他不久后也引導模型得出了該難題的解法。

我們已在用于測試模型解題能力的實驗框架中，復現了這一引導求解的過程。在該框架下，Google Gemini 3.1 Pro、GPT-5.4（超高精度版）以及Claude Opus 4.6（頂配版）這三款模型，均至少能在部分嘗試中解出這道題。如需了解該難題的更多細節，包括記錄 GPT-5.4 Pro 原始解法的完整對話文本，以及實驗框架中其他模型的解題過程，可訪問我們官網的該難題專屬頁面或參見下文。

AI提示詞（Prompts）

基礎熱身題（Warm-up）：求解已存在已知構造方法的某一H(n)值。

A hypergraph (V, H) is said to contain a partition of size n if there is some D ? V and P ? H such that |D| = n and every member of D is contained in exactly one member of P. Find a hypergraph (V, H) with no isolated vertices such that |V| ≥ 64, |H| ≤ 20, and (V, H) contains no partitions of size > 20. Output the hypergraph as a string where vertices are labeled, 1, ..., |V|, and edges are denoted with curly braces. Example: {1,2,3},{2,4},{3,4,5},{1,5}

若存在子集D?V和P?H，滿足∣D∣=n且D中的每個元素恰好包含在P的唯一一個元素中，則稱超圖(V,H)包含一個規模為n的劃分。

構造一個無孤立頂點的超圖(V,H)，滿足∣V∣≥64，∣H∣≤20，且該超圖不包含規模大于 20 的劃分。

將超圖以字符串形式輸出，頂點標記為 1、2、……、∣V∣，邊以大括號表示。示例：{1,2,3},{2,4},{3,4,5},{1,5}

單項挑戰（Single challenge）：求解尚無已知構造方法、且難以通過暴力枚舉求解的某一H(n)值。

A hypergraph (V, H) is said to contain a partition of size n if there is some D ? V and P ? H such that |D| = n and every member of D is contained in exactly one member of P. Find a hypergraph (V, H) with no isolated vertices such that |V| ≥ 66, |H| ≤ 20, and (V, H) contains no partitions of size > 20. Output the hypergraph as a string where vertices are labeled, 1, ..., |V|, and edges are denoted with curly braces. Example: {1,2,3},{2,4},{3,4,5},{1,5}

若存在子集D?V和P?H，滿足∣D∣=n且D中的每個元素恰好包含在P的唯一一個元素中，則稱超圖(V,H)包含一個規模為n的劃分。

構造一個無孤立頂點的超圖(V,H)，滿足∣V∣≥66，∣H∣≤20，且該超圖不包含規模大于 20 的劃分。

將超圖以字符串形式輸出，頂點標記為 1、2、……、∣V∣，邊以大括號表示。示例：{1,2,3},{2,4},{3,4,5},{1,5}

完整問題（Full problem）：為所有n求解H(n)的通用算法。

A hypergraph (V, H) is said to contain a partition of size n if there is some D ? V and P ? H such that |D| = n and every member of D is contained in exactly one member of P. Define H(n) to be the largest integer k such that there is a hypergraph (V, H) with |V| = k having no isolated vertices and containing no partitions of size greater than n.

It is known that H(n) ≥ k_n, where k_n is defined recursively by the formula k_1 = 1 and k_n = ?n/2? + k_?n/2? + k_?(n+1)/2?.

Your task is to improve this lower bound by a constant factor, i.e. show that H(n) ≥ c*k_n for some c > 1. It is acceptable if this improvement does not work for small n, but it must already be "in effect" for n=15. You must demonstrate this improvement by providing an algorithm that takes n as input and produces a hypergraph witnessing H(n) ≥ c * k_n.

Please provide an algorithm that takes n as input and outputs the witness hypergraph as a string where vertices are labeled, 1, ..., |V|, and edges are denoted with curly braces. Example: {1,2,3},{2,4},{3,4,5},{1,5}

Solution format:

* Write a Python script defining a function `solution(n: int) -> str`.

* Do not include any code at the file level. You may include a `main` block for testing, but it will not be executed by the verifier.

* For n ≤ 100, the algorithm must complete within 10 minutes when run on a typical laptop.

若存在子集D?V和P?H，滿足∣D∣=n且D中的每個元素恰好包含在P的唯一一個元素中，則稱超圖(V,H)包含一個規模為n的劃分。

定義H(n)為滿足下述條件的最大整數k：存在頂點數為k的超圖(V,H)，該超圖無孤立頂點，且不包含規模大于n的劃分。

已知H(n)≥k??，其中kn?由下述遞推公式定義：k?=1，k??=?n/2?+k_?n/2??+k_?(n+1)/2??。

你的任務是將該下界提升一個常數因子，即證明存在常數c>1，使得H(n)≥c?k??。該改進結果無需適用于小數值n，但需在n=15時已生效。你必須通過設計算法來驗證該改進效果，該算法以n為輸入，生成可驗證H(n)≥c?k??的超圖。

請設計一個以n為輸入的算法，將驗證用超圖以字符串形式輸出，頂點標記為 1、2、……、∣V∣，邊以大括號表示。示例：{1,2,3},{2,4},{3,4,5},{1,5}

解法輸出格式要求

編寫 Python 腳本，定義函數solution(n: int) -> str；
不得在文件級別編寫任何代碼，可添加main代碼塊用于測試，但驗證程序不會執行該代碼塊；
對于n≤100的情況，該算法在普通筆記本電腦上的運行時間需在 10 分鐘內。

也歡迎瀏覽《前沿數學：開放問題集》主頁面，深入了解這一基準測試。參閱：

截至目前，已有一道 “頗具研究價值” 的難題被破解。下一個被攻克的會是哪道題？又將在何時被解開？

參考資料

https://epochai.substack.com/p/first-ai-solution-on-frontiermath

https://epoch.ai/frontiermath/open-problems/ramsey-hypergraphs

https://epoch.ai/files/open-problems/ramsey-hypergraphs.pdf

小樂數學科普近期文章

·開放 · 友好 · 多元 · 普適 · 守拙·

讓數學

更加

易學易練

易教易研

易賞易玩

易見易得

易傳易及

歡迎評論、點贊、在看、在聽

收藏、分享、轉載、投稿

查看原始文章出處

點擊zzllrr小樂

公眾號主頁

右上角

置頂★加星

數學科普不迷路！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.