无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

谷歌DeepMind利用AI發現了全新的博弈論算法,命名為AlphaEvolve

0
分享至

近日,Google DeepMind發布最新研究成果,提出一種名為AlphaEvolve的方法,用大語言模型驅動的進化式搜索框架,自動發現新的多智能體強化學習算法。這項工作已經以論文形式發布,題為《Discovering Multiagent Learning Algorithms with Large Language Models》。



多智能體強化學習主要研究多個智能體在同一環境中博弈與協作的問題,廣泛應用于博弈論、自動對弈系統以及復雜策略優化場景。長期以來,這一領域的重要算法框架,如反事實遺憾最小化(CFR)和策略響應預言機(PSRO),雖然理論基礎扎實,但具體變體的設計往往依賴研究者不斷試驗、調參和經驗判斷。

Google DeepMind此次提出的AlphaEvolve,則嘗試改變這一傳統路徑。研究團隊將大語言模型用于生成和修改算法代碼,通過自動化演化過程,在大規模搜索空間中探索可能的算法結構。系統不再僅僅優化參數,而是直接對算法邏輯本身進行改寫和組合,從而產生新的訓練規則和更新機制。



在論文中,研究團隊報告了兩個主要成果。

其一是提出了一種名為VAD-CFR的新型遺憾最小化方法。該方法在傳統CFR框架基礎上,引入了與波動性相關的折扣機制、強調一致性的樂觀更新方式,以及特定的策略累積調度方案。在多個測試環境中,VAD-CFR的表現優于當前常用的Discounted Predictive CFR+等基線算法。

其二是在PSRO框架下,演化出一種名為SHOR-PSRO的元求解器。該方法將樂觀遺憾匹配與溫度控制的平滑最優響應策略結合起來,并通過動態調整混合系數,實現從策略多樣性探索到均衡收斂的平穩過渡。實驗結果顯示,SHOR-PSRO在收斂速度和穩定性方面優于傳統靜態元求解器。

研究團隊在論文中指出,這些新算法中包含一些“非直觀”的機制組合,也就是說,它們并非研究者憑借經驗自然會想到的結構,但在實證測試中表現良好。這意味著,AI系統不僅可以輔助調參,還可以參與到算法結構設計本身。



這項工作的意義在于,算法設計這一長期以來被視為高度依賴人類創造力和理論直覺的領域,開始出現由AI系統自動生成有效方案的案例。過去,多智能體強化學習算法往往需要多年迭代改進,而現在,大語言模型驅動的演化系統能夠在較短時間內探索大量可能路徑,并篩選出具有競爭力的方案。

從更廣的視角看,這種“用AI設計訓練AI的算法”的模式,可能會在強化學習、博弈論優化乃至更一般的機器學習框架中產生影響。如果類似方法在更多任務上被驗證有效,未來算法創新的方式可能會逐步發生變化。

目前,這項研究仍處于學術驗證階段,相關算法的實際應用效果還有待更多場景測試。但可以確定的是,AI正在從“執行既定算法”走向“參與算法創造”,這為人工智能研究帶來了新的方向。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
阿奴諾比升FMVP榜首!或復刻伊戈達拉模式 皮爾斯:直接給他頒獎

阿奴諾比升FMVP榜首!或復刻伊戈達拉模式 皮爾斯:直接給他頒獎

醉臥浮生
2026-06-13 06:20:14
百姓躺平擺爛,食稅群體怎么辦?

百姓躺平擺爛,食稅群體怎么辦?

律法刑道
2026-06-03 09:30:48
央八開播!諜戰劇《諜報上不封頂》定檔,肖戰領銜,又有大劇看了

央八開播!諜戰劇《諜報上不封頂》定檔,肖戰領銜,又有大劇看了

不似少年游
2026-06-13 09:36:29
漁民釣到86斤深海稀有月亮魚,全身血紅布滿銀斑,網友:價值幾萬

漁民釣到86斤深海稀有月亮魚,全身血紅布滿銀斑,網友:價值幾萬

貍貓之一的動物圈
2026-06-13 11:54:17
“鵝腿阿姨”塌房:CBD不相信人設

“鵝腿阿姨”塌房:CBD不相信人設

一刻talks丨硬科技趣思想
2026-06-12 21:00:47
比亞迪大漢高清實拍!5米25車長-奔馳S都得讓座

比亞迪大漢高清實拍!5米25車長-奔馳S都得讓座

網上車市
2026-06-13 02:49:10
創業失敗負債5億,日本男子綁26個氣球欲飛往美國,至今下落不明

創業失敗負債5億,日本男子綁26個氣球欲飛往美國,至今下落不明

怪羅
2026-06-12 17:36:07
罕見,房貸連續兩個月負增長了

罕見,房貸連續兩個月負增長了

城市財經
2026-06-13 11:34:46
美眾議院集體表決通告全球:不再承認"一中"原則?這次不能再忍

美眾議院集體表決通告全球:不再承認"一中"原則?這次不能再忍

安珈使者啊
2026-06-12 09:47:46
鐵了心要與中國開戰?俄專家曾大膽預測:日本或要同時迎戰中朝

鐵了心要與中國開戰?俄專家曾大膽預測:日本或要同時迎戰中朝

阿芒娛樂說
2026-06-13 11:22:21
一名中國球迷現場看世界杯開幕式“破防”:要是有我們的球隊該多好

一名中國球迷現場看世界杯開幕式“破防”:要是有我們的球隊該多好

上游新聞
2026-06-12 14:06:08
清華副教授蔣勁松去世,享年61歲

清華副教授蔣勁松去世,享年61歲

大風新聞
2026-06-12 16:05:15
瑞舒伐他汀最致命的副作用!嚴重可腎衰竭!早點知道能保命

瑞舒伐他汀最致命的副作用!嚴重可腎衰竭!早點知道能保命

健康科普365
2026-06-12 20:15:05
易號人物 | 是什么造就了“天才標槍少女”嚴子怡?

易號人物 | 是什么造就了“天才標槍少女”嚴子怡?

復元體育
2026-06-13 09:56:48
A股:緊急提醒2.5億股民!從后天6月15日起,A股或迎一輪大級別變盤?

A股:緊急提醒2.5億股民!從后天6月15日起,A股或迎一輪大級別變盤?

趨勢清風俠
2026-06-13 10:54:56
真正厲害的男人,追中年女人只用一招:不糾纏、不討好、不著急

真正厲害的男人,追中年女人只用一招:不糾纏、不討好、不著急

楓紅染山徑
2026-06-13 13:12:47
一路走好!泰國王室宣告47歲帕公主去世,母親頌妃迎來最絕望結局

一路走好!泰國王室宣告47歲帕公主去世,母親頌妃迎來最絕望結局

娛說瑜悅
2026-06-12 17:11:11
你的公積金是什么段位?

你的公積金是什么段位?

細說職場
2026-06-13 13:11:51
北京連續七天有雨,出門別忘帶傘

北京連續七天有雨,出門別忘帶傘

新京報
2026-06-13 10:55:05
6月13日,人社部關于2026年退休人員養老金的調整通知公布了嗎?

6月13日,人社部關于2026年退休人員養老金的調整通知公布了嗎?

社保小達人
2026-06-13 11:13:08
2026-06-13 14:24:49
知識圈 incentive-icons
知識圈
全球熱點新聞資訊
247文章數 317688關注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

頭條要聞

美國4比1大勝 美國主導比賽巴拉圭疲于奔命讓人意外

頭條要聞

美國4比1大勝 美國主導比賽巴拉圭疲于奔命讓人意外

體育要聞

東道主三戰不敗!美墨開門紅加拿大零的突破

娛樂要聞

12年情懷碎一地!跑男接連翻車

財經要聞

梁文鋒向左,楊植麟向右

汽車要聞

2026重慶車展 長城炮Hi4-T正式上市售14.98萬起

態度原創

藝術
房產
親子
手機
軍事航空

藝術要聞

書法各體臨習方法

房產要聞

海南最賺錢行業曝光!最快4年半,海口全款買三房!

親子要聞

如何給寶寶做社交啟蒙?從和同齡人互動開始

手機要聞

Counterpoint發W20數據:蘋果、華為增,剩下的全在降

軍事要聞

伊外長披露伊美諒解備忘錄草案部分內容

無障礙瀏覽 進入關懷版