網易首頁 > 網易號 > 正文 申請入駐

人工智能在某些創造力測試中超越普通人

0
分享至

研究人員對人工智能和10萬名人類進行了創造力測試。 人工智能可以超越普通人類的創造力——但最具想象力的頭腦仍然無疑是人類的。

  • 日期:
  • 2026年1月25日
  • 蒙特利爾大學
  • 概括:
  • 一項大規模的新研究對比了超過10萬名人類和當今最先進的人工智能系統,得出了一個令人驚訝的結果:生成式人工智能在某些創造力測試中已經能夠超越普通人類。像GPT-4這樣的模型在旨在衡量原創思維和創意生成的任務中表現出色,有時甚至超越了典型的人類反應。但人工智能的上限依然存在。最具創造力的人類——尤其是排名前10%的人群——仍然遠遠領先于人工智能,尤其是在詩歌和故事創作等更復雜的創意工作方面。

最新研究表明,人工智能在某些創造力測試中能夠超越普通人——這對于生成模型而言是一個引人注目的轉折點。圖片來源:Shutterstock

像 ChatGPT 這樣的生成式人工智能系統真的能創造出原創的想法嗎?蒙特利爾大學心理學系的 Karim Jerbi 教授領導的一項新研究,并邀請了著名人工智能研究員 Yoshua Bengio 參與,以前所未有的規模探討了這個問題。這項研究是迄今為止對人類創造力和大型語言模型創造力進行的最大規模的直接比較。

這項發表在《科學報告》(自然系列)上的研究指出,人工智能的發展正經歷著重大轉變。生成式人工智能系統如今已達到在某些創造力指標上超越普通人類的水平。與此同時,最具創造力的人仍然展現出明顯且持續的優勢,甚至超越了最強大的人工智能模型。

人工智能達到人類平均創造力水平

研究人員評估了包括 ChatGPT、Claude、Gemini 等在內的幾種領先的大型語言模型,并將它們的性能與超過 10 萬名人類參與者的測試結果進行了比較。研究結果凸顯了一個明顯的轉折點。一些人工智能系統,例如 GPT-4,在旨在衡量語言創造力差異的任務中,其表現甚至超過了人類的平均水平。

“我們的研究表明,一些基于大型語言模型的AI系統在特定任務上的表現已經超越了人類的平均創造力,”卡里姆·杰爾比教授解釋說。“這一結果或許令人驚訝,甚至令人不安,但我們的研究也凸顯了一個同樣重要的觀察結果:即使是最好的AI系統,其創造力水平仍然不及最具創造力的人類。”

該研究的共同第一作者,蒙特利爾大學的博士后研究員安托萬·貝勒馬爾-佩潘和康考迪亞大學的博士候選人弗朗索瓦·萊斯皮納斯進行的進一步分析揭示了一個引人注目的模式。盡管一些人工智能模型現在的表現已經超越了普通人,但創造力的巔峰仍然牢牢掌握在人類手中。

事實上,當研究人員考察最具創造力的那半數參與者時,他們的平均得分超過了所有測試過的AI模型。而在最具創造力的前10%人群中,這種差距甚至更大。

“我們與多倫多大學的杰伊·奧爾森合作,基于超過 10 萬名參與者的數據,開發了一個嚴謹的框架,使我們能夠使用相同的工具比較人類和人工智能的創造力,”卡里姆·杰爾比教授說道,他同時也是 Mila 的副教授。

科學家如何衡量人類和人工智能的創造力

為了公平地評估人類和機器的創造力,研究團隊采用了多種方法。主要工具是發散聯想任務(DAT),這是一種廣泛使用的心理測試,用于測量發散創造力,即根據單一提示產生多樣化原創想法的能力。

由該研究的合著者杰伊·奧爾森(Jay Olson)創建的DAT測試要求參與者(無論是人類還是人工智能)列出十個含義盡可能不相關的單詞。一個極具創意的回答示例包括“星系、叉子、自由、藻類、口琴、量子、懷舊、天鵝絨、颶風、光合作用”等單詞。

這項任務的表現與寫作、創意生成和創造性問題解決等其他成熟的創造力測試結果密切相關。雖然這項任務以語言為基礎,但它遠不止于詞匯量。它調動了跨多個領域創造性思維所涉及的更廣泛的認知過程。DAT 還具有實用優勢,只需兩到四分鐘即可完成,并且公眾可以在線訪問。

從詞匯表到真正的創意寫作

研究人員隨后探索了人工智能在這種簡單的詞語聯想任務上的成功是否能夠推廣到更復雜、更貼近現實的創意活動中。為了驗證這一點,他們將人工智能系統和人類參與者在創作俳句(一種三行短詩)、撰寫電影劇情簡介和創作短篇小說等創意寫作挑戰中的表現進行了比較。

結果遵循著熟悉的模式。雖然人工智能系統有時表現優于普通人類,但技藝最精湛的人類創作者始終能創作出更優秀、更具原創性的作品。

人工智能的創造力可以調整嗎?

這些發現引出了另一個重要問題:人工智能的創造力是固定的,還是可以塑造的?研究表明,人工智能的創造力可以通過改變技術設置來調整,尤其是模型的溫度。這個參數控制著生成響應的可預測性或創新性。

在較低溫度設置下,人工智能會產生更安全、更常規的輸出結果。在較高溫度下,響應會變得更加多樣化、更難以預測,也更具探索性,從而使系統能夠超越既有的思維模式。

研究人員還發現,創造力很大程度上受指令編寫方式的影響。例如,鼓勵模型運用詞源學思考詞源和結構的提示,能夠帶來更多意想不到的聯想,并提升創造力得分。這些結果強調,人工智能的創造力高度依賴于人類的指導,因此交互和提示是創造過程的核心組成部分。

人工智能會取代人類創作者嗎?

這項研究對人工智能可能取代創意專業人士的擔憂提出了較為平衡的觀點。雖然人工智能系統在某些任務上已經能夠達到甚至超越人類的平均創造力水平,但它們仍然存在明顯的局限性,并且需要依賴人類的指導。

“盡管人工智能在某些測試中已經能夠達到人類的創造力水平,但我們需要超越這種誤導性的競爭觀念,”卡里姆·杰爾比教授說道。“生成式人工智能首先已經成為服務于人類創造力的極其強大的工具:它不會取代創造者,而是會深刻地改變人們想象、探索和創造的方式——對于那些選擇使用它的人來說。”

研究結果并非預示著創意職業的終結,而是表明人工智能未來將成為創意助手。通過拓展思路、開辟新的探索路徑,人工智能或許能夠增強而非取代人類的想象力。

“通過直接比較人類和機器的能力,像我們這樣的研究促使我們重新思考創造力的含義,”卡里姆·杰爾比教授總結道。

關于這項研究

題為“人類和大型語言模型中的發散性創造力”的論文于 2026 年 1 月 21 日發表在《科學報告》上。該研究匯集了來自蒙特利爾大學、康考迪亞大學、多倫多大學密西沙加分校、魁北克人工智能研究所 (Mila) 和谷歌 DeepMind 的科學家。

這項研究由卡里姆·杰爾比教授領導,安托萬·貝勒馬爾-佩潘(蒙特利爾大學)和弗朗索瓦·萊斯皮納斯(康考迪亞大學)共同擔任第一作者。研究團隊還包括約書亞·本吉奧,他是Mila和LoiZéro的創始人,也是深度學習領域的先驅,而深度學習正是ChatGPT等現代人工智能系統背后的技術。

  1. Antoine Bellemare-Pepin、Fran?ois Lespinasse、Philipp Th?lke、Yann Harel、Kory Mathewson、Jay A. Olson、Yoshua Bengio、Karim Jerbi.人類的發散性創造力與大型語言模型.科學報告, 2026; 16 (1) DOI: 10.1038/s41598-025-25157-3

引用此頁面

蒙特利爾大學。“研究人員對人工智能和10萬名人類的創造力進行了測試。” ScienceDaily。ScienceDaily,2026年1月25日。 / releases / 2026 / 01 / 260125083356.htm>。


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

混沌錄
2026-04-19 17:27:06
廣東省最厲害的八個醫院科室

廣東省最厲害的八個醫院科室

白宸侃片
2026-04-20 11:30:58
不愧是嫁給上海首富的美女主持人,54歲了還像30出頭的

不愧是嫁給上海首富的美女主持人,54歲了還像30出頭的

舊時光老師
2026-04-19 19:08:29
德國戰敗后,古德里安為什么能無罪釋放?他是一個有底線的軍人

德國戰敗后,古德里安為什么能無罪釋放?他是一個有底線的軍人

小莜讀史
2026-04-18 14:46:46
李雨桐泄露薛之謙手機號、身份證號,被北京朝陽警方行政拘留

李雨桐泄露薛之謙手機號、身份證號,被北京朝陽警方行政拘留

封面新聞
2026-04-19 18:38:11
醪糟再次被關注!醫生發現:高血脂患者喝醪糟,不用多久4大變化

醪糟再次被關注!醫生發現:高血脂患者喝醪糟,不用多久4大變化

芹姐說生活
2026-04-19 15:52:53
2-1!本菲卡絕殺葡體!穆帥再封神:30輪不敗+升至第2,劍指冠軍

2-1!本菲卡絕殺葡體!穆帥再封神:30輪不敗+升至第2,劍指冠軍

小徐講八卦
2026-04-20 05:35:41
罰15億!拼多多一員工故意關門,對抗調查,導致執法人員手指骨折

罰15億!拼多多一員工故意關門,對抗調查,導致執法人員手指骨折

魔都姐姐雜談
2026-04-19 08:03:27
博主稱民宿內多個針孔攝像頭直播大學生隱私,合肥警方:受害人房內已拆除,老板報警了

博主稱民宿內多個針孔攝像頭直播大學生隱私,合肥警方:受害人房內已拆除,老板報警了

揚子晚報
2026-04-20 11:36:49
16分鐘被定位2639次!國家安全部緊急提醒:手機軌跡恐成泄密地

16分鐘被定位2639次!國家安全部緊急提醒:手機軌跡恐成泄密地

有范又有料
2026-04-18 16:35:23
伊朗軍方:美軍向伊朗貨船開火,伊方發射無人機還擊

伊朗軍方:美軍向伊朗貨船開火,伊方發射無人機還擊

界面新聞
2026-04-20 07:04:17
世錦賽戰報:16強決出5席!中國2勝2負1領先,世界亞軍4-10一輪游

世錦賽戰報:16強決出5席!中國2勝2負1領先,世界亞軍4-10一輪游

球場沒跑道
2026-04-20 05:38:54
小S淚灑自責不該帶全家去日本發生憾事!曝大S「最后反常舉動」

小S淚灑自責不該帶全家去日本發生憾事!曝大S「最后反常舉動」

達達哥
2026-04-20 12:47:34
安徽阜陽一服刑人員在監獄突然死亡,檢察院重新認定為“非正常死亡”,獄警一審因虐待被監管人員罪獲刑

安徽阜陽一服刑人員在監獄突然死亡,檢察院重新認定為“非正常死亡”,獄警一審因虐待被監管人員罪獲刑

極目新聞
2026-04-20 10:46:44
殲-10C在伊朗現身,巴空軍三次嘗試未成功

殲-10C在伊朗現身,巴空軍三次嘗試未成功

余塩搞笑段子
2026-04-20 10:11:44
認知存在嚴重缺陷,小米公司敗了

認知存在嚴重缺陷,小米公司敗了

浙江車網
2026-04-20 09:20:38
五預警齊發!雷暴大風、暴雨、冰雹……“組團”來襲!上海這天雨勢明顯

五預警齊發!雷暴大風、暴雨、冰雹……“組團”來襲!上海這天雨勢明顯

魯中晨報
2026-04-20 11:12:11
恩愛8年難抵殘酷現實?鹿晗生日引爆熱搜,被關曉彤徹底撕下體面

恩愛8年難抵殘酷現實?鹿晗生日引爆熱搜,被關曉彤徹底撕下體面

阿褲趣聞君
2026-04-20 09:55:19
一伊朗油輪突破美國封鎖進入伊朗水域

一伊朗油輪突破美國封鎖進入伊朗水域

每日經濟新聞
2026-04-20 07:10:32
28年前失蹤的女老板終于被找到:被謀殺后埋尸天臺花壇28年,嫌疑人改名、變年齡、整容,還主動發短信催警察“還我清白”

28年前失蹤的女老板終于被找到:被謀殺后埋尸天臺花壇28年,嫌疑人改名、變年齡、整容,還主動發短信催警察“還我清白”

大風新聞
2026-04-20 09:25:10
2026-04-20 15:48:49
科學的歷程 incentive-icons
科學的歷程
吳國盛、田松主編
3187文章數 15015關注度
往期回顧 全部

科技要聞

拋棄OpenAI,Anthropic為何成中國AI新偶像

頭條要聞

拼多多等被罰近36億:有人吞證據抗法 執法人員骨折

頭條要聞

拼多多等被罰近36億:有人吞證據抗法 執法人員骨折

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

鹿晗生日上熱搜,被關曉彤撕下體面

財經要聞

月之暗面IPO迷局

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態度原創

親子
本地
旅游
時尚
公開課

親子要聞

dhea什么時候吃最好時間?高齡備孕女人吃什么提高生育能力?

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

旅游要聞

山水科技交融掀起春日文旅熱潮——三月三廣西河池金城江龍江第一灣舉辦國潮活動

今年最流行的衣服竟然是它?高級又氣質!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版