網易首頁 > 網易號 > 正文 申請入駐

谷歌最新論文宣告AI成獨立科研主體

0
分享至

日前,谷歌DeepMind 與多所頂尖學術機構的研究者聯合發布論文《Aletheia:自主攻克FirstProof數學難題挑戰賽》(arXiv:2602.21201) 。


論文的核心是,評估名為 Aletheia 的數學研究代理系統在 FirstProof 這一公開挑戰中的表現。

在沒有人類干預的情況下,Aletheia成功完成多道研究級數學難題。

這不是簡單的“算對了題”,而是達到了接近學術發表標準的證明水平。

這意味著 AI 開始真正觸及“數學創造力”,這個長期被認為是人類專屬的領域。

FirstProof 不是簡單的算術或者基礎證明題,而是由專業數學家設定的一組十個研究級難度的問題。

這些問題往往涉及抽象概念和嚴謹推理,傳統上只有受過訓練的數學家才能應對。組織方希望通過這個挑戰評估當前 AI 在數學領域的真實能力邊界。


Aletheia 也并不是一個普通的自動答題機器人,而是一個結合了生成式模型和驗證機制的智能體,基于谷歌最新的大模型架構 Gemini 3 Deep Think。

它的設計目標不僅是輸出答案,而是在 無人類干預的前提下 盡可能自動地提出數學證明。

也就是說,從理解題意、構思思路、生成證明草稿,到最終輸出一段嚴謹 LaTeX 格式的證明文本,整個過程都是由智能體自主完成的。

Aletheia 由三個核心模塊構成:

猜想生成:從數學文獻中識別有價值的開放問題,并生成形式化命題。

自主證明搜索:結合符號推理、啟發式搜索與自我修正,尋找形式化證明。

嚴謹驗證:使用自動證明檢驗器與自我批判機制,過濾無效論證并確保正確性。


整個流程完全自動化,無需人類撰寫提示、選擇問題或審核中間步驟。Aletheia 自主判斷哪些問題可解、哪些方向有價值、以及證明何時完成且正確。

論文作者為了評估其真實能力,在整個流程中嚴格排除了人為提示和干預,只保留最終專家對結果的判斷與評價。

在 FirstProof 的十個問題中,Aletheia 成功給出了六個問題的可評估解答,被獨立數學專家(有些來自論文作者之外的學術界)認為,滿足出版前的“可修訂發表”標準。


更重要的是,這種能力是在沒有人工設計思路的情況下實現的,充分體現了 AI 在數學推理上從輔助工具向真正“研究伙伴”的轉變。

值得注意的是,Aletheia 并不是在所有問題上都做到了完美。在那些極其復雜或高度依賴深厚數學直覺的問題上,它仍然無法給出有效輸出。所以說,暫時它還不是完全合格的數學家。

但總的來說,這項工作標志著 AI 在數學研究領域取得了實質性的進展。

從 ChatGPT 或 Gemini 這類大語言模型能會話式討論數學,到 Aletheia 能在沒有人類引導的情況下解決復雜證明問題,是科研史上的一次重要里程碑。

雖然距離完全取代人類數學家還有很長的路要走,但這一成果無疑推動了人工智能在創意推理與科學發現方面的邊界。

這不僅對數學界是重要突破,也預示著未來 AI 將在數學、物理、計算機科學,乃至整個基礎科研領域,承擔越來越重要的角色。

也就是說,AI第一次真正從“輔助工具”進化為獨立科研主體,開創了“AI自主做科學研究”的全新范式。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
一文綜合!普京出席勝利日紅場閱兵式并發表講話,都說了什么?

一文綜合!普京出席勝利日紅場閱兵式并發表講話,都說了什么?

環球網資訊
2026-05-09 18:24:27
皮皮蝦老板身亡后續!舉報者被罵仍繼續追責,不止為了錢這么簡單

皮皮蝦老板身亡后續!舉報者被罵仍繼續追責,不止為了錢這么簡單

法老不說教
2026-05-09 15:05:10
剛剛!官宣退役,20年生涯成就金牌藍領!哈登已老,東皇回歸渺茫

剛剛!官宣退役,20年生涯成就金牌藍領!哈登已老,東皇回歸渺茫

體育新角度
2026-05-09 18:37:24
錢朝陽任南方電網董事長、黨組書記

錢朝陽任南方電網董事長、黨組書記

界面新聞
2026-05-09 16:13:05
2026年WTA1000羅馬站 女單第三輪鄭欽文將迎戰奧斯塔彭科

2026年WTA1000羅馬站 女單第三輪鄭欽文將迎戰奧斯塔彭科

極目新聞
2026-05-09 12:01:54
文章虧大了!老鄉張藝謀攜7位陜西演員,上演40集央視大劇,缺他

文章虧大了!老鄉張藝謀攜7位陜西演員,上演40集央視大劇,缺他

冷紫葉
2026-05-08 23:20:13
司機舉報鄭州街頭有人“偷小孩”,稱一女子將路邊小孩抱上車迅速開走,交警核實:是誤會,家長擔心車被貼條,抱孩子上車離開時太慌張了

司機舉報鄭州街頭有人“偷小孩”,稱一女子將路邊小孩抱上車迅速開走,交警核實:是誤會,家長擔心車被貼條,抱孩子上車離開時太慌張了

極目新聞
2026-05-09 16:06:16
斯諾克巨星邀請賽:吳宜澤4-2被逆轉!世錦賽后首敗,希金斯復仇

斯諾克巨星邀請賽:吳宜澤4-2被逆轉!世錦賽后首敗,希金斯復仇

劉姚堯的文字城堡
2026-05-09 18:19:25
大快人心!中國民航新規出爐:日本航空過境中國好日子即將到頭!

大快人心!中國民航新規出爐:日本航空過境中國好日子即將到頭!

影像溫度
2026-05-09 10:27:26
“漢坦病毒”來勢洶洶,建議:每家備好5樣東西,關鍵時刻能救命

“漢坦病毒”來勢洶洶,建議:每家備好5樣東西,關鍵時刻能救命

健康科普365
2026-05-08 15:00:16
特斯拉把百萬豪車專屬色,免費給了Model 3/Y

特斯拉把百萬豪車專屬色,免費給了Model 3/Y

全棧遛狗員
2026-05-09 14:54:29
他活埋近5000紅軍,逃往國外安享晚年,如今國內竟還有人紀念他!

他活埋近5000紅軍,逃往國外安享晚年,如今國內竟還有人紀念他!

興趣知識
2026-05-08 00:23:54
難以置信!連云港一工廠以遭遇群體性阻撓、無法經營為由停產整頓

難以置信!連云港一工廠以遭遇群體性阻撓、無法經營為由停產整頓

火山詩話
2026-05-09 16:19:21
國防部:已成功配齊“航母五件套”

國防部:已成功配齊“航母五件套”

大象新聞
2026-05-09 16:46:07
衛星圖像下駭人一幕:伊朗哈爾克島附近海域浮現大片油污

衛星圖像下駭人一幕:伊朗哈爾克島附近海域浮現大片油污

財聯社
2026-05-09 09:30:22
這下輪到銀行發愁了!越來越多的儲戶,要把存款分散到多家銀行

這下輪到銀行發愁了!越來越多的儲戶,要把存款分散到多家銀行

夢史
2026-05-09 00:53:33
美國公開UFO秘密文件,阿波羅宇航員目擊神秘天體,布滿萬億粒子

美國公開UFO秘密文件,阿波羅宇航員目擊神秘天體,布滿萬億粒子

譯言
2026-05-09 07:43:22
云南兩所中學“五一”期間頂風違規補課:影響惡劣,多人將被追責

云南兩所中學“五一”期間頂風違規補課:影響惡劣,多人將被追責

澎湃新聞
2026-05-09 16:58:26
生活由普京擔保,來中國療養,葉利欽人生中最后那8年過得怎樣?

生活由普京擔保,來中國療養,葉利欽人生中最后那8年過得怎樣?

云霄紀史觀
2026-04-25 20:20:46
吳石犧牲后,主席很后悔:最大錯誤就是沒集中兩個野戰軍攻打臺灣

吳石犧牲后,主席很后悔:最大錯誤就是沒集中兩個野戰軍攻打臺灣

興趣知識
2026-05-05 16:02:25
2026-05-09 19:24:49
AI先鋒官 incentive-icons
AI先鋒官
AIGC大模型及應用精選與評測
503文章數 74關注度
往期回顧 全部

科技要聞

美國政府強力下場 蘋果英特爾達成代工協議

頭條要聞

國防部證實:中方建造的"麒麟"級潛艇首艇交付巴基斯坦

頭條要聞

國防部證實:中方建造的"麒麟"級潛艇首艇交付巴基斯坦

體育要聞

成立128年后,這支升班馬首奪頂級聯賽冠軍

娛樂要聞

50歲趙薇臉頰凹陷滄桑得認不出!

財經要聞

存儲芯片上演造富潮

汽車要聞

軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

態度原創

家居
藝術
房產
教育
公開課

家居要聞

菁英人居 全能豪宅

藝術要聞

齊白石 紫藤蜜蜂

房產要聞

低價甩賣!??谶@個地標商業,無人接盤!

教育要聞

商學院地理位置怎么影響求職?雷丁與北部城市的差距,比你想的大

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版