網易首頁 > 網易號 > 正文 申請入駐

OpenAI發布《AI作為科學合作者》報告

0
分享至


人工智能正從一個被動的工具,演變為能主動參與推理、激發靈感的“研究伙伴”。2026年1月26日,美國OpenAI公司發布《AI作為科學合作者》(AI as a Scientific Collaborator)報告。報告基于隨機抽樣的ChatGPT用戶的完整匿名對話數據,就AI工具在日常研究工作中如何使用、AI在促進科學研究新突破上的潛力、不同科學家使用AI工具的差異進行了分析,并就如何利用AI促進科學與數學研究提出了政策建議。

1. 科研協作新常態:ChatGPT已成科學家高頻伙伴

報告指出,在ChatGPT平臺上,一個專注而活躍的科研用戶群體正在迅速壯大。他們包括博士生、博士后、在職研究人員及STEM領域教職員工,使用AI進行技術推導、高等數學、工程仿真等高階任務。

通過對ChatGPT用戶2025年1月-12月的隨機抽樣對話數據分析,發現關于高級科學和數學主題的消息量每周平均增長了約47%,從570萬條消息增加到近840萬條消息。截至2026年1月,每周有近130萬用戶討論高級科學和數學主題。


這些跡象共同表明,ChatGPT正在加速推進前沿研究:每月有數千萬條高級硬科學和數學提示的產生,源于一個不斷壯大的用戶群體,他們正使用該系統進行嚴肅的科學和工程工作,以造福社會并支持經濟增長。

2.從工具到伙伴:AI深度介入研究全流程

報告指出,科學家、數學家和工程師將ChatGPT視為一個高度可用的技術協作伙伴:他們可以使用這個工具進行迭代計算、將想法轉化為代碼、驗證假設,并將復雜的材料提煉成可操作的思維模型。在OpenAI的分析中,“高級”硬科學提示被定義為那些面向研究、需要研究生或研究水平專業知識才能給出合格答案的提示。在這一群體中,用戶行為模式與普通用戶存在差異,這些差異直接映射出現代科研工作流程的特征。

研究任務主要集中在以下領域:編程(編寫、修改和調試代碼)、數據分析(清理和合并數據集、運行統計分析、解釋結果)、數學推理(推導、證明策略、代數驗證、復雜計算、不同形式體系之間的轉換)以及文獻綜述和綜合(查找參考文獻、理解最新研究成果)。


與ChatGPT的普通用戶相比,高級科學和數學用戶的表現如下:發送的信息量大約是普通用戶的3.5倍;涉及編程類內容的提問頻率高出近12倍;每周平均提交9次知識概覽型指令,而普通用戶僅1.5次。

3.能力突破:AI在科學前沿已能解決“專家級”問題

報告顯示,在過去兩年中,大型語言模型已經從早期在基礎算術上的表現不穩定,發展到能夠處理多步數學推理,足以應用于實際數學工作。這種進步主要得益于促進逐步推理的方法,以及與計算器、代碼執行等工具的緊密集成,以確保精確計算。

2025年至2026年初,AI在數學領域的最大突破來自于“慢思考”(test-time compute scaling)技術的應用。模型不再急于選定單一推理路徑,而是通過更多計算量來探索替代方案并進行自我檢查。同時,通過訓練過程中獎勵可驗證結果(如生成正確答案或可執行代碼),AI在數學與編程方面的表現更加可靠,足以在人類指導下發揮實際作用。

2025年7月,OpenAI的模型在國際數學奧林匹克競賽(IMO)中達到金牌水平,與DeepMind并列,標志著AI在數學推理能力上的重要突破。在旨在測試多步驟問題解決能力的美國數學邀請賽(AIME)中,GPT-5.2在沒有外部工具的情況下更是取得了滿分。

目前,GPT-5.2系列在數學能力上持續進步,已能解決諸如谷歌FrontierMath問題集的專家級問題,即即使是數學專業的優秀博士生,也無法在幾個小時內解決它們。在該基準測試的1-3級中,GPT-5.2思考模式解決了40.3%的問題。

在物理學、化學和生物學等學科領域,ChatGPT類大型語言模型正日益支持技術推理和工具輔助的研究工作流程,以及科學寫作。例如,在專業級科學問答基準GPQA測試中,GPT-5.2 Pro和GPT-5.2 Thinking的準確率分別達到93.2%和92.4%,表明其在多學科研究生級科學問題解答上得到了很高水平。

AI正在將科學家從繁瑣的文獻檢索、書目整理和常規行政報告中解放出來,成為科學研究中可靠的工作流程協調者。例如,在物理領域,AI正被應用于美國國家實驗室等大型設施中,協助實時數據分析、實驗控制與決策優化。在化學與生物學中,AI通過結合專業模型(如圖神經網絡、蛋白質結構預測模型)與通用語言模型,實現從分子設計到實驗規劃的全流程輔助,顯著提升了研究效率與成功率。

4.案例見證:AI作為“合作者”已在多個領域產出實質成果

報告特別指出,AI已在多個具體研究場景中展現出“合作者”的潛力。例如,在數學領域,GPT-5.2輔助解決了數個長期未解的“埃爾德什問題”;在生物學中,OpenAI與RetroBioSciences合作,通過蛋白質工程模型在數月內設計出具有潛在抗衰老功能的細胞重組因子,將傳統需要數年試錯的研發周期大幅壓縮。

這些進展表明,AI正在從“輔助工具”逐步轉變為“研究伙伴”,在數學推導、實驗設計、數據分析甚至理論構建中發揮實質性作用。盡管目前AI仍無法獨立完成如牛頓創立微積分那樣的范式級突破,但它已在連接不同學科、整合既有知識、加速發現進程方面展現出明確價值。

未來幾年,隨著模型能力持續提升、與科學工具的深度融合,AI有望進一步推動多個學科進入“加速發展期”,成為全球科研體系中不可或缺的協作力量。

5.政策呼吁:構建美國國家AI科研新生態

報告就如何利用人工智能加強美國的科學創新以確保2026年是人工智能和科學年提出了包含四大支柱的政策建議:

一是擴大AI技能培養,為美國勞動力和未來科學家做好準備。

建議啟動一項國家人工智能勞動力計劃,支持從K-12階段的人工智能課程,到社區學院和大學的AI學位與證書項目,并為在職人員提供短期培訓。國會和相關部門可授權撥款,用于各州學校的AI與數據科學課程開發與教師培訓,同時設立“AI技能團”或專項基金,通過圖書館、就業中心和學校為社區提供免費的AI講習班和培訓。

二是開放數據并拓展開放研究合作,加速科學發現。

AI輔助的科學研究能將數十年的發現過程壓縮至數年,尤其是在研究人員能廣泛接觸前沿AI工具和新開放數據的情況下。OpenAI支持建立國家AI研究資源,作為一個共享平臺,為學術和非營利研究者提供大規模計算資源與高質量數據集,并呼吁盡快通過并落實相關立法,確保充足的資金與健全的治理機制。各機構應識別高價值數據集,并以機器可讀形式提供,用于AI研發,同時維護數據隱私與安全,對敏感數據進行脫敏處理,并對真實研究用途默認開放訪問。

三是將AI基礎設施(包括能源、計算與芯片)作為國家戰略資產進行現代化。

計算能力是AI驅動發現的關鍵工具。確保美國境內擁有充足的計算資源,取決于現代化基礎設施以及對美國電網的充分擴容,以避免科學進步受能源短缺制約。聯邦政策應利用《芯片與科學法案》賦予的權限,設立AI基礎設施樞紐,劃定AI創新區并優先支持高容量數據中心及相關能源投資,同時簡化審批流程。通過公私合作,可為聯邦資助的研究人員獲取尖端AI系統能力提供支持,并加強在美國本土布局、建設和制造AI芯片所需的半導體供應鏈。

四是提供廣泛、規模化接觸前沿AI系統的途徑,并強化創新生態系統。

聯邦政府應建立國家前沿AI訪問配額制度,讓大學、國家實驗室和非營利機構的研究人員能夠以足以支持持續實驗、方法開發和驗證的規模,使用先進AI系統。訪問機制應基于廣泛、輕量化的申請流程,既支持開放探索,也服務于具體研究項目,將AI使用視為類似望遠鏡觀測時間或超算機時的國家共享科研資源。為促進AI技術向更廣泛經濟領域擴散,聯邦政策應擴大“小企業創新研究計劃”(SBIR)以覆蓋AI技術應用,并建立區域創新孵化器,將AI技術人員與地方產業需求對接。

這些建議旨在系統性構建美國在AI時代的科研優勢,通過人才、數據、硬件與訪問機制的全方位提升,推動人工智能真正成為國家科技競爭力的核心引擎。

資料來源:

OpenAI. AI as a Scientific Collaborator From biology to black holes, ChatGPT is accelerating research. https://cdn.openai.com/pdf/f4b4a5da-b2de-418d-9fcd-6b293e9dc157/oai_ai-as-a-scientific-collaborator_jan-2026.pdf

[本文為教育部國別和區域研究基地中國教育科學研究院國際教育研究中心成果]


本文由中國教育科學研究院比較教育研究所“教育國際前沿”課題組負責人張永軍整理,編輯劉強。點擊左下角閱讀原文可下載該文獻。

本文為原創,歡迎轉載。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
三星長公主前夫:離婚拿了8370萬揮霍一空,和巫女女友淪為階下囚

三星長公主前夫:離婚拿了8370萬揮霍一空,和巫女女友淪為階下囚

照見古今
2026-04-22 18:42:23
一女子離婚5年后,走投無路去取前夫給的6萬,柜員卻說初始只有600塊,剛想罵人,柜員:你要不要看看轉賬備注...

一女子離婚5年后,走投無路去取前夫給的6萬,柜員卻說初始只有600塊,剛想罵人,柜員:你要不要看看轉賬備注...

感覺會火
2026-04-24 12:12:00
黃仁勛警告:若DeepSeek率先適配華為,對美國是"極其愚蠢"的結果

黃仁勛警告:若DeepSeek率先適配華為,對美國是"極其愚蠢"的結果

新浪財經
2026-04-23 20:52:12
張雪遺憾落敗僅4天,人民日報發文,沒有夸贊,卻讓張雪口碑暴漲

張雪遺憾落敗僅4天,人民日報發文,沒有夸贊,卻讓張雪口碑暴漲

老吳教育課堂
2026-04-23 18:58:07
福建富豪許世輝超市內湊孫!緊盯特價商品,獨子去世,曝女婿上門

福建富豪許世輝超市內湊孫!緊盯特價商品,獨子去世,曝女婿上門

裕豐娛間說
2026-04-23 17:26:11
女子意圖舉報保險公司高管丈夫婚外情,被掐死后裝入行李箱拋尸,丈夫一審被判無期,父親抗訴:這么小的事情為什么要殺人;被告也提起上訴

女子意圖舉報保險公司高管丈夫婚外情,被掐死后裝入行李箱拋尸,丈夫一審被判無期,父親抗訴:這么小的事情為什么要殺人;被告也提起上訴

大風新聞
2026-04-24 10:29:10
A股:上午沖到4084反復跳水,種種跡象表明,A股或迎更大調整行情?

A股:上午沖到4084反復跳水,種種跡象表明,A股或迎更大調整行情?

股市皆大事
2026-04-24 12:31:38
俄羅斯為什么刪除20年法院數據:審判記錄一夜清空

俄羅斯為什么刪除20年法院數據:審判記錄一夜清空

律法刑道
2026-04-22 08:53:34
繼德國之后,英國也開始貼出“中文標語”?中國游客:不能夠接受

繼德國之后,英國也開始貼出“中文標語”?中國游客:不能夠接受

潮鹿逐夢
2026-04-02 12:31:48
女籃198斤大碼美模博士,精通芭蕾舞,25歲轉型成國家隊的第4選擇

女籃198斤大碼美模博士,精通芭蕾舞,25歲轉型成國家隊的第4選擇

閱微札記
2026-04-23 09:38:28
美高官:先打中國再打朝鮮,打不過就核戰,因為中國火箭軍太強大

美高官:先打中國再打朝鮮,打不過就核戰,因為中國火箭軍太強大

易昂楊
2026-04-24 09:04:08
難以相信!她已經61歲了,看起來竟然像三四十歲的樣子!

難以相信!她已經61歲了,看起來竟然像三四十歲的樣子!

科學發掘
2026-04-23 08:35:50
26次非受迫性失誤!世界第一薩巴倫卡首戰如此狼狽,自曝狀態全無

26次非受迫性失誤!世界第一薩巴倫卡首戰如此狼狽,自曝狀態全無

體育妞世界
2026-04-24 09:28:42
八千里路云和月:鐵樹不是林長庚,也不是朱管家,而是不起眼的他

八千里路云和月:鐵樹不是林長庚,也不是朱管家,而是不起眼的他

匹夫來搞笑
2026-04-24 10:21:22
2-0!西甲亂套了:塞維利亞5輪4敗+只領先降級區1分,11隊要保級

2-0!西甲亂套了:塞維利亞5輪4敗+只領先降級區1分,11隊要保級

體育知多少
2026-04-24 09:08:48
經濟下行,一種新型騙局出現了。

經濟下行,一種新型騙局出現了。

老陸不老
2026-04-24 09:49:50
3-10爆冷出局!斯諾克排名大洗牌 丁俊暉第15 一人或將登頂世界第

3-10爆冷出局!斯諾克排名大洗牌 丁俊暉第15 一人或將登頂世界第

youyou喜歡你
2026-04-24 12:40:50
瓜迪奧拉離職計劃浮出水面,曼城已敲定繼任人選!

瓜迪奧拉離職計劃浮出水面,曼城已敲定繼任人選!

夜白侃球
2026-04-24 10:45:12
軍購案協商無果,韓國瑜重磅宣布,國民黨一人和鄭麗文唱反調

軍購案協商無果,韓國瑜重磅宣布,國民黨一人和鄭麗文唱反調

DS北風
2026-04-23 18:36:06
陳坤為演林則徐增重十幾斤:他是活人感特別強的英雄

陳坤為演林則徐增重十幾斤:他是活人感特別強的英雄

草莓解說體育
2026-04-24 12:45:49
2026-04-24 13:36:49
國際與比較教育研究所 incentive-icons
國際與比較教育研究所
中國教育科學研究院
442文章數 408關注度
往期回顧 全部

科技要聞

剛剛,DeepSeek-V4 預覽版發布 百萬上下文

頭條要聞

特朗普:不會對伊朗動用核武器 已從軍事上拿下了伊朗

頭條要聞

特朗普:不會對伊朗動用核武器 已從軍事上拿下了伊朗

體育要聞

里程碑之戰拖后腿,哈登18分8失誤

娛樂要聞

王思聰被綠!戀愛期間女友被金主包養

財經要聞

19家企業要"鋁代銅",格力偏不

汽車要聞

全景iDrive 續航近800km 新款寶馬7系/i7亮相

態度原創

藝術
時尚
房產
本地
健康

藝術要聞

16幅 佐恩高清油畫 | 瑞典著名畫家

今年最好看的3個顏色,太適合夏天了!

房產要聞

三亞安居房,突然官宣!

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

干細胞如何讓燒燙傷皮膚"再生"?

無障礙瀏覽 進入關懷版