來源:新浪財(cái)經(jīng)
如果說過去幾輪世界杯,人們討論最多的是AI會不會“集體翻車”,那么澳大利亞與埃及這場比賽,則呈現(xiàn)出另一種完全不同的畫風(fēng),AI沒有形成共識。
北京時(shí)間7月4日凌晨2點(diǎn),澳大利亞與埃及戰(zhàn)成1:1。賽前,在聯(lián)想集團(tuán)×咪咕視頻《世界杯預(yù)測人機(jī)大戰(zhàn)》中,12家大模型并沒有像以往那樣集體押向一邊,而是出現(xiàn)了本屆賽事最明顯的一次“意見分裂”。
最終,12家AI形成了三個(gè)陣營:2家支持澳大利亞取勝;4家支持埃及取勝;6家認(rèn)為雙方將在90分鐘內(nèi)戰(zhàn)平。這意味著,平局第一次成為AI陣營中的主流觀點(diǎn),比賽結(jié)束后回看,這6家堅(jiān)持平局判斷的大模型,成為本場比賽最大的贏家。其中,通義千問、Kimi、智譜、MiniMax、階躍五家模型不僅猜中了平局方向,更直接命中了1:1的準(zhǔn)確比分。中移九天雖然預(yù)測的是0:0,但同樣命中了平局結(jié)果。
![]()
最終,AI陣營取得了6家命中勝平負(fù),5家命中準(zhǔn)確比分。這是本屆世界杯AI預(yù)測中少見的一次“高質(zhì)量平局預(yù)測”。
相比之下,人類嘉賓陣營則出現(xiàn)了明顯分化。顏強(qiáng)、韓喬生都預(yù)測埃及1:2取勝;閻鶴祥則看好澳大利亞2:1獲勝;只有張路和蘇東堅(jiān)持戰(zhàn)平。其中,張路直接命中1:1比分,蘇東預(yù)測0:0,同樣判斷正確了比賽方向。最終,5位嘉賓中有2位猜中平局,其中1位命中準(zhǔn)確比分。
![]()
如果單純比較勝平負(fù),這場比賽AI與人類都沒有出現(xiàn)壓倒性優(yōu)勢,但真正值得關(guān)注的是另一件事。過去的世界杯預(yù)測中,大模型越來越容易形成“共識”。面對強(qiáng)弱分明的比賽,12家模型往往會給出高度一致的判斷;即便出現(xiàn)冷門,也常常表現(xiàn)為“集體翻車”。而澳大利亞與埃及這場比賽,卻完全不同,模型之間出現(xiàn)了明顯分歧。有人相信澳大利亞的整體實(shí)力;有人更看好埃及的反擊效率;也有人認(rèn)為雙方實(shí)力接近,平局概率最高。
最終,沒有共識,反而更接近真相。從某種意義上說,這也說明,大模型的預(yù)測能力正在進(jìn)入新的階段。它們不再只是簡單輸出相似答案,而是在面對勢均力敵的比賽時(shí),開始根據(jù)各自的數(shù)據(jù)體系、權(quán)重模型和推理邏輯,得出不同結(jié)論。而這種差異,恰恰也是AI預(yù)測越來越有意思的地方,它不只是告訴你誰會贏,更是在展示不同模型究竟是如何理解一場足球比賽。
對于本屆世界杯來說,這場1:1也留下了一個(gè)很有意思的紀(jì)錄:第一次,不是AI集體猜對,而是AI先“吵”出了三個(gè)答案,最后平局派贏了。
本文為“世界杯預(yù)測人機(jī)大戰(zhàn)”每日戰(zhàn)報(bào),由新浪財(cái)經(jīng)聯(lián)合聯(lián)想集團(tuán)、咪咕視頻共同呈現(xiàn)。活動詳情請關(guān)注咪咕視頻APP。每晚9點(diǎn),聯(lián)想集團(tuán)與咪咕視頻聯(lián)合出品的《人機(jī)大戰(zhàn):誰是世界杯預(yù)言家》在咪咕視頻熱播,敬請觀看!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.