本文來源:時代財經 作者:趙姝嬋 龐宇
![]()
圖片來源:視覺中國
2026年美加墨世界杯小組賽硝煙散盡,32強完整名單正式揭曉。在綠茵場上傳統強隊與黑馬球隊激烈角逐的同時,綠茵場之外,一場由人工智能主導的“預測人機大戰”也迎來了階段性“結算”。
在聯想集團聯合咪咕視頻發起的“世界杯預測人機大戰”中,12家國內主流AI大模型和人類專家分別對104場賽事的結果進行了預測。最終數據顯示,AI陣營的整體預測準確率超越人類專家,且部分AI模型更是押中佛得角等并無世界杯歷史數據的冷門球隊,得出一些“反共識”的結果。
![]()
圖片來源:聯想官方供圖
從5月28日到世界杯開賽前,聯想天禧AI作為“總召集人”,向12家國內主流AI大模型和人類專家發送了一份《2026世界杯32強競猜統一考試》答題卡,要求在賽前提交自己的“答卷”。
北京時間6月28日,隨著J組收官戰阿爾及利亞隊與奧地利隊以3:3握手言和,各家AI預測的排名也隨之揭曉。其中,騰訊混元以命中29支晉級球隊的成績位列榜首,MiniMax與訊飛星火則以命中28支的成績緊隨其后。AI陣營的整體勝率達到61.9%,領先人類專家7.3%。
更具看點的是,在賽前預測時,12家AI里就有四家大膽看好“新軍”佛得角。這一“反共識”的預測,被佛得角的戰績一一印證——該隊連續逼平西班牙、烏拉圭等傳統強隊,以不敗戰績出線。
商湯科技技術總監馬林向時代財經記者解釋稱,之所以AI大模型能押中佛得角這匹“最大黑馬”,原因在于模型能夠穿透紙面實力的表象,挖掘深層數據。佛得角雖為世界杯“新軍”,但其球員多在歐洲聯賽體系下成長,且近年來預選賽表現強勢。AI模型通過捕捉其足球防守紀律、反擊效率以及球員結構等深層數據變量,得出了比人類經驗更為理性的結論。
不過,AI在展現“反共識”能力的同時,也暴露出在極端不確定性下的局限。以佛得角對陣沙特為例,這場比賽12家AI判斷結果分化為三種:DeepSeek、Kimi、階躍、訊飛星火預測沙特阿拉伯勝;通義千問、中移九天、天禧AI、騰訊混元、商湯小浣熊預判雙方平局;百度文心、智譜、MiniMax看好佛得角取勝。盡管最終結果是平局,但沒有任何一家模型精準命中0:0的最終比分。
這一現象揭示了當前AI預測普遍存在“進攻火力高估”盲區。即便有5家模型預判了平局,它們給出的比分也均包含至少1粒進球。據聯想官方數據,在小組賽出現的9場平局中,AI的預測命中率不足3%。由此看來,AI大模型更擅長處理結構化數據與確定性趨勢,但對于足球這種集臨場心理、突發傷病及偶然性多重因素的團體運動,還是有AI大模型無法估測的部分。
這屆世界杯黑馬頻出,讓AI的預測變得五花八門。這其實暴露出大模型“底層邏輯趨同”的短板。因為大模型本質上是靠歷史數據做推演的“概率壓縮器”。在強弱分明的常規比賽里,大家吃著同樣的數據,自然得出同樣的結論;但一旦遇到沒見過的球隊,或是比賽中出現了創新戰術或者極端打法,AI就會因為缺乏歷史參照而“集體失靈”。因為它們并沒有真正理解比賽,只是在面對未知時,各自憑概率猜測。
事實上,對世界杯結果預測的“人機大戰”并非聯想一家的獨角戲,多家頭部大模型廠商也早已下場參與:千問上線了專屬的足球預測AI助手,不僅覆蓋了全部104場比賽供用戶與AI同臺競猜,還同步發起了“球場計劃”——當用戶的競猜積分達到一定數額后,千問將為鄉村學校捐建足球場。
月之暗面(Kimi)也搭建了300個專屬Agent,分別負責戰術分析、球員狀態追蹤、賽程計算以及賠率監測等細分方向,最終生成了一份長達224頁的深度預測報告,展現其多智能體協同處理復雜任務的能力。此外,Anthropic的Claude Fable 5模型也基于賽事結構(48隊參賽、冠軍需踢8場)、北美夏季高溫以及球隊陣容年齡曲線等宏觀變量給出預測。
這些多元化的參與方式,不僅讓AI預測從單純的“勝負競猜”演變為涵蓋數據分析、多Agent協同、公益互動及宏觀推演的綜合技術展示,也讓這場圍繞世界杯的“人機大戰”成為各大廠商檢驗大模型落地能力的絕佳試驗場。但從更高維度看,在商業決策、宏觀經濟研判乃至社會治理等復雜系統中,AI同樣面臨著“數據完備”與“現實混沌”的博弈。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.