網易首頁 > 網易號 > 正文 申請入駐

AI人工智能時代的數學家們——塔瑪拉?G?科爾達(Tamara G. Kolda)

0
分享至

置頂zzllrr小樂公眾號《小樂數學科普》新鮮送到!

譯者按:

本文屬于關注AI時代一線數學家們的系列報道《AI人工智能時代的數學家們》之一,作者是塔瑪拉?G?科爾達(Tamara G. Kolda),她是美國工業與應用數學學會(SIAM)會士,她的專業領域為數學算法與數據科學計算方法,尤其專注于張量分解和隨機化算法。


塔瑪拉?G?科爾達(Tamara G. Kolda)

本文最初作為特邀文章(原文標題:《AI人工智能時代的數學研究——未來AI人工智能能否成為真正的合作者?》)發表于Silicon Reckoner博客,并且再次發表在SIAM官網。作者感謝Michael Harris提供機會與讀者分享此文。本文也可在作者的博客MathSci.ai上閱讀。


圖源:mathsci.ai

作者:Tamara G. Kolda(塔瑪拉?G?科爾達)2026-2-21

譯者:zzllrr小樂(數學科普公眾號)2026-4-3

“首次證明”(First Proof,也即首輪驗證) 實驗的結果已經出爐。首次證明(First Proof)是一個由數學家團隊發起的項目,參閱,負責人包括Mohammed Abouzaid(斯坦福)Nikhil Srivastava(UC伯克利)Rachel Ward(UT 奧斯汀)Lauren Williams(哈佛),旨在測試人工智能系統能否獨立解決研究級別的數學問題。項目提出了10 道原創問題,來自作者們在不同數學領域的真實研究,這些問題已有答案但尚未公開發表。(我本人也是問題貢獻者之一,參閱第10題)這些都是專業級問題,通常需要至少具備專業知識的研究生才能解答。該項目旨在建立一種真實可信的評估方式,衡量 AI 進行真正數學研究的能力 (參閱:),并且計劃未來用新題目重復這項實驗。

那么,AI 系統在第一批問題上表現如何?各大 AI 公司與個人研究者都提交了他們的解題嘗試,其中不少采用了AI 與人類協作的方式。我們自己測試了Gemini Deep ResearchChatGPT 5.2 Pro,它們在 10 道題中解出了2 道 (參閱)。我貢獻的第 10 題正是這兩道之一。積極的一面是,AI 找到了一種已發表的方法,而這種方法并未出現在我的原始解答中。但消極的一面是,AI 并未給出該方法的任何引用來源。我只是因為兩份 AI 生成的答案高度相似,才懷疑它們調用了已知結論,最終不得不自己手動溯源。無論我們從這項實驗中得出什么結論,有一點已經非常明確:現代 AI 的出現,將永遠改變數學研究。

在深入展開之前,我想從數學角度解釋一下什么是現代 AI 系統:它本質上是一組由訓練數據學習得到權重的方程系統。數百年來我們一直在使用數學模型,只不過通常只包含少量參數。在我剛做研究時,我從事電路仿真模型,一般只有十幾個參數。而今天的 AI 模型擁有數十億甚至上萬億參數,大到足以存儲人類知識的總和!關于 AI 是否靠 “記憶訓練數據” 工作,目前存在大量爭論。但無論如何,AI 系統歸根結底是一個確定的數學過程:一組方程生成輸出,而這種形式化也意味著它容易受到數學攻擊。 https://arxiv.org/abs/2307.15043 盡管我尊重其他人可能持有不同觀點,但我個人對 “AI 擁有意識或真正推理能力” 的說法不抱任何幻想;相反,我對 AI 系統在設計與訓練上展現的創造力與突破感到震驚。

事實上,當我在自己的數學研究中不斷嘗試使用 AI 時,我越來越被它們的能力所打動。如果某個解法在 AI 的訓練數據中可獲取,或能通過網絡搜索找到,那么 AI 很有可能解出這道題。令人印象深刻的是,即便解法使用了不同術語,或者需要從多個來源拼湊,AI 往往也能做到。在我看來,AI 做到這一點的可能性,與相關方法在文獻中的普及程度成正比。但有一個問題 —— 而且是致命問題——AI 模型無法可靠地提供知識來源。而缺乏事實核查是一個真正的隱患。AI 可能會自信滿滿地引用不存在、不真實的結論,或者直接剽竊已有文獻,正如我在自己那道題的解答中觀察到的那樣。狀態好的時候,AI 能讓人眼前一亮;狀態差的時候,我見過它歪曲自己實際完成的工作,被指出錯誤時裝作懊悔,然后再次重蹈覆轍。這一切都意味著,很難區分高質量結果與數學垃圾:那些乍一看合理、但深究細節就會崩塌的答案。問題在于,人們太容易不加驗證地接受 AI 的輸出了。

我對未來學術出版的擔憂之一,是“人類–AI 拼湊垃圾”的現象日益增多 —— 人類未經仔細、耗時的驗證,就把 AI 生成的劣質內容胡亂拼接成文。(“拼湊垃圾scrapple”類似肉碎混合制成的廉價食品,是粗制濫造spam的代名詞。)作為SIAM(美國工業與應用數學學會)出版事務副主席,我處理過大量涉及作者誠信的案例,也親眼看到了依賴 AI 走捷徑帶來的代價。編輯與審稿人需要花費更多精力來甄別低劣的學術成果。明顯的情況包括偽造引用;不那么明顯的則包括論證薄弱、引用缺失與邏輯混亂。我們已經在NeurIPS等會議上看到了 “人類–AI 拼湊垃圾” 帶來的負面影響:虛構引用正在危及這個曾經備受贊譽的學術平臺的公信力。

那么,數學的未來將會怎樣?我們不妨假設,目前 AI 系統存在的所有問題(比如引用錯誤與虛構事實)都能被解決。到那時,數學家的角色會是什么?

首先也是最重要的一點:數學家的核心角色是判斷力—— 決定該提出什么問題、該證明什么定理、該編寫什么算法。這需要擁有經驗的人來完成,這也是導師的核心工作:幫助初入研究的學者選擇值得研究的問題。作為一名應用數學家,我的主要職責,是把利益相關方提出的模糊問題,轉化為具體的數學問題。一旦問題被歸約為數學形式,我常常會與才華橫溢的合作者一起尋找答案。

回頭來看,AI 能勝任這個角色嗎?也許 AI 可以解出一個給定的數學問題,但它沒有主動求解的意愿,沒有產生創造性洞見的動力,對問題是否有意義沒有判斷,對正確的研究路徑沒有立場。

與之相反,我的合作者們都有自己的觀點。他們能夠和我辯論我們提出的問題是否恰當,啟發我采用截然不同的方法,有時甚至徹底改變我的數學觀念。

未來的數學家無疑會把 AI 系統當作強大的工具來使用 —— 就像當年他們使用計算機和互聯網一樣 —— 但數學家不會被 AI 取代

我對數學研究未來的期望是:研究成果將由那些真正關心工作結果、對結果的正確性負有責任感、并愿意付出艱苦努力(包括仔細核查 AI 的輸出)的人來完成。

致謝

我衷心感謝我的同事Mohammed Abouzaid(斯坦福)Andrew Blumberg(哥倫比亞)Ernest Davis(NYU紐大)Gary Marcus(NYU, Emeritus)Dan Spielman(耶魯)Nikhil Srivastava(UC伯克利)以及Lauren Williams(哈佛),感謝他們對本文的見解與反饋。

參考資料

https://www.mathsci.ai/post/future-of-math-in-age-of-ai/

https://1stproof.org

https://www.siam.org/publications/siam-news/articles/essay-the-future-of-math-research-in-the-age-of-ai/

https://www.nytimes.com/2026/02/07/science/mathematics-ai-proof-hairer.html

https://www.scientificamerican.com/article/first-proof-is-ais-toughest-math-test-yet-the-results-are-mixed/

https://www.theatlantic.com/technology/2026/01/ai-memorization-research/685552/

https://arxiv.org/abs/2307.15043

https://fortune.com/2026/01/21/neurips-ai-conferences-research-papers-hallucinations/

https://www.nytimes.com/2026/01/25/opinion/ai-human-judgment.html

小樂數學科普近期文章

·開放 · 友好 · 多元 · 普適 · 守拙·

讓數學

更加

易學易練

易教易研

易賞易玩

易見易得

易傳易及

歡迎評論、點贊、在看、在聽

收藏、分享、轉載、投稿

查看原始文章出處

點擊zzllrr小樂

公眾號主頁

右上角

置頂★加星

數學科普不迷路!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
注意!中老年男性有性生活和沒性生活,差別居然這么大?

注意!中老年男性有性生活和沒性生活,差別居然這么大?

皓皓情感說
2026-04-22 08:20:32
東莞市一棟獨棟別墅333萬起被拍賣,25個人加價229次后816萬成交

東莞市一棟獨棟別墅333萬起被拍賣,25個人加價229次后816萬成交

天天話事
2026-04-24 08:08:37
蔣介石曾孫蔣友松突然宣布:兩蔣靈柩必須遷回浙江奉化

蔣介石曾孫蔣友松突然宣布:兩蔣靈柩必須遷回浙江奉化

深度報
2026-04-20 22:37:17
中莫聲明落地,莫桑比克全方位鼎力挺華,破格拿下中方獨一份優待

中莫聲明落地,莫桑比克全方位鼎力挺華,破格拿下中方獨一份優待

書紀文譚
2026-04-23 23:09:11
廣西一佳人好漂亮, 身高169cm,體重50kg 美的讓人移不開眼

廣西一佳人好漂亮, 身高169cm,體重50kg 美的讓人移不開眼

動物奇奇怪怪
2026-04-15 18:16:01
16頁PPT舉報德育副校長私生活:瘋批,主角照片曝光,知情人發聲

16頁PPT舉報德育副校長私生活:瘋批,主角照片曝光,知情人發聲

溫柔看世界
2026-04-22 12:03:24
網傳上海公司發氦氣斷供聲明 霍爾木茲海峽封鎖限制全球氦氣供應鏈

網傳上海公司發氦氣斷供聲明 霍爾木茲海峽封鎖限制全球氦氣供應鏈

六子吃涼粉
2026-04-23 11:19:07
“易中天”一季度業績狂飆,市值1.88萬億超過貴州茅臺

“易中天”一季度業績狂飆,市值1.88萬億超過貴州茅臺

21世紀經濟報道
2026-04-23 23:57:12
鳳凰傳奇現狀,一個年入千萬,一個負債累累,真相不簡單

鳳凰傳奇現狀,一個年入千萬,一個負債累累,真相不簡單

可愛的巴比龍
2026-04-23 14:18:40
屬鼠人當心:4月24日,就算你閉門不出,這件“怪事”也會找上門

屬鼠人當心:4月24日,就算你閉門不出,這件“怪事”也會找上門

一口娛樂
2026-04-24 05:04:04
現在這形勢,大家做好長期打算吧!

現在這形勢,大家做好長期打算吧!

英國報姐
2026-04-23 21:11:57
申花剛擊敗海牛隊!斯盧茨基賽后就發聲做出重要決定,事關特謝拉

申花剛擊敗海牛隊!斯盧茨基賽后就發聲做出重要決定,事關特謝拉

張麗說足球
2026-04-23 11:12:18
美預測:臺海一旦開打,9國將展開混戰,中俄朝將對陣6國聯軍

美預測:臺海一旦開打,9國將展開混戰,中俄朝將對陣6國聯軍

琴音繚繞回
2026-04-23 10:11:11
前國腳楊晨:在老家北京生活,演員妻子風韻猶存,兒子沒走足球路

前國腳楊晨:在老家北京生活,演員妻子風韻猶存,兒子沒走足球路

素衣讀史
2026-04-22 20:16:55
中國工資重回3000時代,月薪3000元成常態

中國工資重回3000時代,月薪3000元成常態

念得小柔
2026-04-22 16:42:12
小寶與王某雷,誰探訪花的數量更多?

小寶與王某雷,誰探訪花的數量更多?

挪威森林
2026-01-31 12:15:26
都是窮,河南的窮,四川的窮,有什么差別

都是窮,河南的窮,四川的窮,有什么差別

高廣銀
2026-04-10 06:09:37
華為余承東并非狂妄!智界V9電磁壓鑄雙專利算法護航,難以模仿!

華為余承東并非狂妄!智界V9電磁壓鑄雙專利算法護航,難以模仿!

牛鍋巴小釩
2026-04-23 13:10:35
臺灣第一千金蔣孝章有多美?端莊優雅絕佳的福相,卻下嫁三婚男!

臺灣第一千金蔣孝章有多美?端莊優雅絕佳的福相,卻下嫁三婚男!

海佑講史
2026-04-23 06:00:11
窮可以讓一個女人卑微到什么程度?看網友的評論引起萬千共鳴

窮可以讓一個女人卑微到什么程度?看網友的評論引起萬千共鳴

夜深愛雜談
2026-03-01 21:28:54
2026-04-24 09:47:00
小樂數學科普 incentive-icons
小樂數學科普
zzllrr小樂,小樂數學科普,讓前沿數學流行起來~
324文章數 7關注度
往期回顧 全部

科技要聞

凌晨突發!GPT-5.5正式上線:跑分更猛

頭條要聞

用了16年的學位證"失效"男子舉報自己 高校最新通報

頭條要聞

用了16年的學位證"失效"男子舉報自己 高校最新通報

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經要聞

19家企業要"鋁代銅",格力偏不

汽車要聞

預售30.29萬起 嵐圖泰山X8配896線激光雷達

態度原創

時尚
本地
藝術
數碼
家居

今年最好看的3個顏色,太適合夏天了!

本地新聞

SAGA GIRLS 2026女團選秀

藝術要聞

江青對聯驚艷眾人,書法與寫字的界限究竟在哪?

數碼要聞

重磅回歸!當貝超級盒子正式開啟預約 4月27日全網開售

家居要聞

浪漫協奏 法式風格

無障礙瀏覽 進入關懷版