无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

陶哲軒驚呼“變天”,AI用6小時改寫數學史

0
分享至

一塊閃亮的數學獎牌,剛剛被寫入代碼的智能體在6小時內摘下,而人類為此思考了30年。

PART 01

AI六小時破解30年數學難題

2025年12月,人工智能領域迎來里程碑事件:Harmonic公司開發的AI系統“亞里士多德”僅用6小時便攻克了困擾數學界30年的埃爾德什問題#124簡化版。這一突破被學界稱為“數學智能體時代的開端”,而菲爾茲獎得主陶哲軒則犀利指出:AI正在高效收割數學界的“低垂果實”,讓人類研究者得以聚焦更具挑戰性的核心問題。

埃爾德什問題#124自1995年提出以來,一直是組合數論領域的頑固堡壘。其核心命題探討:給定k個不小于2的自然數d?,若∑1/(d?-1) ≥ 1,是否所有足夠大的自然數n都能表示為特定0-1組合的和?這個看似簡潔的問題,卻讓數學家們在最大公約數(gcd)約束和邊界案例驗證中陷入長達三十年的僵局。

“亞里士多德”的突破性在于其完全獨立的證明能力。它采用創新的“vibe proving”方法論,融合強化學習與蒙特卡洛樹搜索,在無需人類干預的情況下遍歷上億種證明路徑,最終輸出100%可驗證的定理。整個過程僅耗時6小時,而通過Lean形式化驗證系統的檢驗只需1分鐘。

耐人尋味的是,當通用AI巨頭ChatGPT和Gemini面對同一問題時,卻集體“折戟”。陶哲軒分析指出:Gemini僅能給出排除數字1后gcd條件成為必要的基礎觀察;ChatGPT則表現出明顯的“路徑依賴”,大量引用已有網頁和論文,未能提出原創性觀點。

這種差異揭示了專業AI與通用AI的本質分野——當“亞里士多德”被設計為“邏輯工匠”,基于形式邏輯生成可驗證代碼時,ChatGPT類模型仍是“猜詞機器”,依賴統計概率生成文本。

PART 02

“人機協同”的科研革命

陶哲軒將數學未解問題的分布描述為“長尾特征”。大多數難題并非超高難度,而是因人類數學家資源有限而被擱置的“低垂果實”。AI的自動化能力恰恰擅長處理這類問題。

在埃爾德什問題網站上,“未解”標簽最近減少了近十個,這并非因為人類突然解決了這些問題,而是AI通過文獻檢索發現它們早已被攻克。這種現象揭示了AI作為“清道夫”的價值——它能清理最容易解決的問題,讓人類聚焦于真正具有挑戰性的核心難題。

HarmonicMath創始人Vlad Tenev提出的“Vibe證明時代”已經到來。這一概念意味著AI不僅能輔助驗證,還能獨立創造。在數學領域,這種變革尤為深刻,因為數學的形式化特性使其非常適合AI參與。

微軟前AI副總裁Sebastien Bubeck激動地分享道:“該解決方案100%由AI生成,總計耗時6小時。”這一效率與人類數學家30年的掙扎形成鮮明對比,凸顯了AI在科研效率方面的革命性提升。

PART 03

AI當前局限與信息學學生的不可替代性

盡管“亞里士多德”取得了突破,但它解決的是原問題的簡化版本。原版埃爾德什問題#124不允許使用數字1且需要滿足額外的最小公約數條件,這一更復雜的版本仍有待解決。

AI在數學推理中面臨的主要挑戰之一是“超長推理鏈”問題。高中數學證明可能只需10到40步,而像黎曼猜想這樣的難題,證明路徑可能長達百萬步。美國加州理工學院的謝爾蓋·古科夫指出,這類超長路徑極難處理,AI必須在指數級增長的可能路徑中找到正確解法。

DeepMind的AlphaProof和AlphaGeometry2在國際奧數競賽中表現出色,但專家們普遍認為,它們仍缺乏真正的數學洞察力。競賽題有一定“套路”,而真正的數學研究更開放、復雜。初創公司Epoch AI的FrontierMath測試顯示,面對全新技術難題,LLM幾乎集體“交白卷”。

數學家董彬指出,AI在數學研究中的理想角色是“AI學徒”——用訓練數學家的方式培養AI助手。但目前,AI更適用于“單點突破”,從局部解決某些具體問題,而非全面替代人類直覺和創造力。

PART 04

信息學學生的四維能力重構

當AI開始收割數學“低垂果實”,信息學學生亟需重構能力模型,在以下四個維度建立新優勢:

人機協同的架構思維——“亞里士多德”的成功源于其專業定位——與通用大模型不同,它專為數學證明設計,融合強化學習、蒙特卡洛樹搜索與Lean形式化語言。這種“領域專用智能”架構思維值得信息學學生深入學習。正如DeepSeek-V3.2-Speciale模型展現的,通過融合定理證明能力,專業模型在IMO、ICPC等賽事中已超越多數人類選手。

形式化驗證的必備技能——Lean證明系統的應用標志著數學驗證進入程序化時代。信息學學生需掌握形式化驗證工具,將自然語言證明轉化為機器可驗證代碼。這不僅是防范AI幻覺的有效手段,更是未來科研協作的基礎能力。埃爾德什#124的證明在GitHub公開后,全球研究者均可參與驗證與拓展(github.com/plby/lean-proofs)。

直覺引導的算法設計——當前AI在依賴性質觀察與解題直覺的題目上仍存在明顯局限。如AlphaProof解決3個IMO問題耗時3天,而人類選手僅需4.5小時。信息學學生應強化元認知能力,在AI陷入局部最優時提供方向性指導,這正是人類思維不可替代的核心價值——正如PatternBoost AI系統開發者所言:“探索性思維是數學的核心”。

問題發現的戰略眼光——倫敦數學科學研究所何楊輝指出:AI能幫助證明問題,卻無法幫助確定需要解決的關鍵問題。信息學學生需培養科學發現的前瞻力,在AI清理“低垂果實”后,精準識別真正值得攻堅的“數學高峰”。這種能力建立在對學科發展脈絡的深刻理解與跨領域知識融合基礎上。

PART 05

教育轉型:從工具使用者到智能體架構師

面對AI的沖擊,信息學教育正在經歷范式轉變。2025年CNCC論壇達成共識:信息學奧賽應繼續堅持以計算思維培養為核心,同時更加重視學生發現問題和提出問題的能力。微軟前AI副總裁塞巴斯蒂安·布貝克激動地分享AI攻克埃爾德什難題的消息時,強調“解決方案100%由AI生成”。

但走進普林斯頓高等研究院,數學家們已在全新實驗室工作:人類提出大膽猜想,AI負責驗證與反例生成;人類構建理論框架,AI完成繁瑣計算;人類捕捉靈感火花,AI將其轉化為嚴謹證明。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
出軌率高的女人,不用看長相,一般有這3個特征

出軌率高的女人,不用看長相,一般有這3個特征

荔子言
2026-06-16 11:13:56
隆江豬腳飯!曾經的打工人神飯,如今快涼透了

隆江豬腳飯!曾經的打工人神飯,如今快涼透了

草莓甜甜
2026-05-25 15:55:15
衛報:因凡蒂諾每天要看兩場世界杯,卡航為他提供私人飛機

衛報:因凡蒂諾每天要看兩場世界杯,卡航為他提供私人飛機

懂球帝
2026-06-16 17:24:08
歷史罕見信號全部重合!這次不是回調,是全球性大危機要來了

歷史罕見信號全部重合!這次不是回調,是全球性大危機要來了

流蘇晚晴
2026-06-11 14:24:06
迪麗熱巴34歲首曝與陳飛宇戀愛,手扶脖子現身那天,熱搜爆了三次

迪麗熱巴34歲首曝與陳飛宇戀愛,手扶脖子現身那天,熱搜爆了三次

人間娛事集
2026-06-15 07:05:20
純欲天花板:那不是一種風格,是一種境界

純欲天花板:那不是一種風格,是一種境界

疾跑的小蝸牛
2026-06-16 21:24:07
新任國防部新聞發言人陳曦亮相,簡歷公布

新任國防部新聞發言人陳曦亮相,簡歷公布

南方都市報
2026-06-16 15:41:47
中央定調:事業單位這三類人員不允許彈性延遲退休,到齡就得退休

中央定調:事業單位這三類人員不允許彈性延遲退休,到齡就得退休

職場資深秘書
2026-06-14 09:25:33
不靠球星也身家千萬!“世界杯太太團”集體轉型,靠自己活成豪門

不靠球星也身家千萬!“世界杯太太團”集體轉型,靠自己活成豪門

金融八卦女
2026-06-16 14:00:13
央視直播!就在明天女排VS德國,趙勇賽前訓話,全力拿下首勝!

央視直播!就在明天女排VS德國,趙勇賽前訓話,全力拿下首勝!

蘭亭墨未干
2026-06-16 08:42:43
事實證明馬杜羅政權垮臺之后,委內瑞拉人確實更有盼頭了

事實證明馬杜羅政權垮臺之后,委內瑞拉人確實更有盼頭了

玲兒愛唱歌
2026-06-04 07:05:24
果然不出所料,伊朗挺過美以40天狂轟濫炸的背后有高人指點!

果然不出所料,伊朗挺過美以40天狂轟濫炸的背后有高人指點!

故事終將光明磊落
2026-06-16 15:25:02
東北3歲網紅小吃播繼續吃飯,父母2個人都不怎么吃

東北3歲網紅小吃播繼續吃飯,父母2個人都不怎么吃

九方魚論
2026-06-14 00:09:08
普京連夜抄家!5500億盧布全充公,寡頭們瑟瑟發抖

普京連夜抄家!5500億盧布全充公,寡頭們瑟瑟發抖

億通電子游戲
2026-06-16 05:49:35
國內將逐漸停止“CT檢查”?做完身體就垮了?醫生告訴您真相

國內將逐漸停止“CT檢查”?做完身體就垮了?醫生告訴您真相

芹姐說生活
2026-06-13 23:13:37
蒙古國總理最新涉華表態

蒙古國總理最新涉華表態

南方都市報
2026-06-16 09:30:43
匈奴一夜消失兩千年,DNA結果震驚歐洲:祖上還有這層關系?

匈奴一夜消失兩千年,DNA結果震驚歐洲:祖上還有這層關系?

抽象派大師
2026-06-16 03:15:16
冰箱別只囤肉!囤這7種菜,隨吃隨取還省事,凍半年都特好吃

冰箱別只囤肉!囤這7種菜,隨吃隨取還省事,凍半年都特好吃

江江食研社
2026-06-15 19:30:09
提幫功遞紙巾遭親姐一把推開,泰王沉默,詩妮娜躲在角落行大禮

提幫功遞紙巾遭親姐一把推開,泰王沉默,詩妮娜躲在角落行大禮

白露文娛志
2026-06-16 16:39:58
中一簽門檻600萬,首日平均暴漲229%!北交所打新能玩嗎?

中一簽門檻600萬,首日平均暴漲229%!北交所打新能玩嗎?

21世紀經濟報道
2026-06-16 13:39:32
2026-06-16 23:11:00
電腦報少年派 incentive-icons
電腦報少年派
最新鮮的互聯網產業資訊
3942文章數 1603關注度
往期回顧 全部

科技要聞

DeepSeek融資500億,梁文鋒牢牢握住控制權

頭條要聞

四川警方私扣酒商159瓶茅臺 酒放庫房3年有的已成空瓶

頭條要聞

四川警方私扣酒商159瓶茅臺 酒放庫房3年有的已成空瓶

體育要聞

身價5萬的門將,擋住了12億歐元的狂轟濫炸

娛樂要聞

吳文忻葬禮:2個女兒在靈堂內茫然失措

財經要聞

2萬億存款去哪兒了?

汽車要聞

三車齊發 零跑全新C10/C11/C16上市12.58萬元起

態度原創

藝術
家居
數碼
公開課
軍事航空

藝術要聞

約旦最大的體育場開始建設,計劃2029年完工!

家居要聞

綠意盎然 自然之境

數碼要聞

GPU-Z發布2.70.0更新,提升內核驅動安全性

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美伊達成諒解備忘錄 內塔尼亞胡表態

無障礙瀏覽 進入關懷版