網易首頁 > 網易號 > 正文申請入駐

AI預測“世界杯32強”準確率超人類：押中“黑馬”佛得角，卻常常高估球隊進攻火力

2026-06-30 00:36:37　來源: 時代財經

廣東舉報

分享至

本文來源：時代財經作者：趙姝嬋龐宇

圖片來源：視覺中國

2026年美加墨世界杯小組賽硝煙散盡，32強完整名單正式揭曉。在綠茵場上傳統強隊與黑馬球隊激烈角逐的同時，綠茵場之外，一場由人工智能主導的“預測人機大戰”也迎來了階段性“結算”。

在聯想集團聯合咪咕視頻發起的“世界杯預測人機大戰”中，12家國內主流AI大模型和人類專家分別對104場賽事的結果進行了預測。最終數據顯示，AI陣營的整體預測準確率超越人類專家，且部分AI模型更是押中佛得角等并無世界杯歷史數據的冷門球隊，得出一些“反共識”的結果。

圖片來源：聯想官方供圖

從5月28日到世界杯開賽前，聯想天禧AI作為“總召集人”，向12家國內主流AI大模型和人類專家發送了一份《2026世界杯32強競猜統一考試》答題卡，要求在賽前提交自己的“答卷”。

北京時間6月28日，隨著J組收官戰阿爾及利亞隊與奧地利隊以3:3握手言和，各家AI預測的排名也隨之揭曉。其中，騰訊混元以命中29支晉級球隊的成績位列榜首，MiniMax與訊飛星火則以命中28支的成績緊隨其后。AI陣營的整體勝率達到61.9%，領先人類專家7.3%。

更具看點的是，在賽前預測時，12家AI里就有四家大膽看好“新軍”佛得角。這一“反共識”的預測，被佛得角的戰績一一印證——該隊連續逼平西班牙、烏拉圭等傳統強隊，以不敗戰績出線。

商湯科技技術總監馬林向時代財經記者解釋稱，之所以AI大模型能押中佛得角這匹“最大黑馬”，原因在于模型能夠穿透紙面實力的表象，挖掘深層數據。佛得角雖為世界杯“新軍”，但其球員多在歐洲聯賽體系下成長，且近年來預選賽表現強勢。AI模型通過捕捉其足球防守紀律、反擊效率以及球員結構等深層數據變量，得出了比人類經驗更為理性的結論。

不過，AI在展現“反共識”能力的同時，也暴露出在極端不確定性下的局限。以佛得角對陣沙特為例，這場比賽12家AI判斷結果分化為三種：DeepSeek、Kimi、階躍、訊飛星火預測沙特阿拉伯勝；通義千問、中移九天、天禧AI、騰訊混元、商湯小浣熊預判雙方平局；百度文心、智譜、MiniMax看好佛得角取勝。盡管最終結果是平局，但沒有任何一家模型精準命中0:0的最終比分。

這一現象揭示了當前AI預測普遍存在“進攻火力高估”盲區。即便有5家模型預判了平局，它們給出的比分也均包含至少1粒進球。據聯想官方數據，在小組賽出現的9場平局中，AI的預測命中率不足3%。由此看來，AI大模型更擅長處理結構化數據與確定性趨勢，但對于足球這種集臨場心理、突發傷病及偶然性多重因素的團體運動，還是有AI大模型無法估測的部分。

這屆世界杯黑馬頻出，讓AI的預測變得五花八門。這其實暴露出大模型“底層邏輯趨同”的短板。因為大模型本質上是靠歷史數據做推演的“概率壓縮器”。在強弱分明的常規比賽里，大家吃著同樣的數據，自然得出同樣的結論；但一旦遇到沒見過的球隊，或是比賽中出現了創新戰術或者極端打法，AI就會因為缺乏歷史參照而“集體失靈”。因為它們并沒有真正理解比賽，只是在面對未知時，各自憑概率猜測。

事實上，對世界杯結果預測的“人機大戰”并非聯想一家的獨角戲，多家頭部大模型廠商也早已下場參與：千問上線了專屬的足球預測AI助手，不僅覆蓋了全部104場比賽供用戶與AI同臺競猜，還同步發起了“球場計劃”——當用戶的競猜積分達到一定數額后，千問將為鄉村學校捐建足球場。

月之暗面（Kimi）也搭建了300個專屬Agent，分別負責戰術分析、球員狀態追蹤、賽程計算以及賠率監測等細分方向，最終生成了一份長達224頁的深度預測報告，展現其多智能體協同處理復雜任務的能力。此外，Anthropic的Claude Fable 5模型也基于賽事結構（48隊參賽、冠軍需踢8場）、北美夏季高溫以及球隊陣容年齡曲線等宏觀變量給出預測。

這些多元化的參與方式，不僅讓AI預測從單純的“勝負競猜”演變為涵蓋數據分析、多Agent協同、公益互動及宏觀推演的綜合技術展示，也讓這場圍繞世界杯的“人機大戰”成為各大廠商檢驗大模型落地能力的絕佳試驗場。但從更高維度看，在商業決策、宏觀經濟研判乃至社會治理等復雜系統中，AI同樣面臨著“數據完備”與“現實混沌”的博弈。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.