出品|《態度》欄目
作者|漢雨棣
編輯|丁廣勝
北京時間2026年6月12日凌晨三點,歷史上規模最大的世界杯正式開打。
這是世界杯歷史上第一次擴軍至48支球隊,更長的賽程、更復雜的對陣規則,以及橫跨三個國家的地理跨度,都讓這屆比賽成了史上變數最多的一屆。在茶余飯后的討論中,球迷們為梅西的謝幕戰、姆巴佩的封神路、或是亞馬爾能否真正加冕新球王吵得不可開交。
在賽場之外,科技界與金融界的巨頭們已經悄悄掀起了另一場戰爭——除了傳統懂球的體育數據公司,國內外最頂尖的AI大模型,如Kimi、DeepSeek以及ChatGPT等,都紛紛接到了來自用戶的同一道考題:
“誰能奪得2026年世界杯冠軍?”
在已結束的多場比賽中,多款AI大模型的預測已初步應驗:千問精準命中了揭幕戰的比分和紅牌細節,百度文心以近五成的勝率暫居“人機大戰”排行榜首位,階躍星辰則憑借反共識判斷成為唯一猜中比利時平局的贏家。當然,AI也并非無所不能——在西班牙被佛得角逼平的一役中,包括DeepSeek、Kimi在內的絕大多模型集體失準。
與此同時,像高盛這樣的華爾街頂級投行也帶著他們預測經濟危機的數學武器加入戰場。當硅谷的算力碰上綠茵場的玄學,一場大規模的“AI算命”正式拉開帷幕。
千問AI球賽預測的技術負責人在與《態度》欄目交流中表示,當前各模型的冠軍預測并沒有本質區別,其邏輯并非提供標準答案,而是將概率轉化為綜合判定下的確定性選擇,旨在給用戶明確參考,而非“端水”式結論。他進一步透露,各家大模型進行此次預測的核心目標并非炫技,而是降低互動門檻,繼續尋找類似于“AI點奶茶”“AI打車”實用落地場景。
事實上,世界杯預測的意義,可能早已不只是預測本身。對于模型廠商而言,世界杯這樣一個持續一個多月、全民關注、結果不斷驗證的超級事件,本身就是檢驗模型能力、吸引用戶參與和培養使用習慣的天然場景。
某種程度上,這也是一場心照不宣的“流量局”。相比告訴用戶誰一定會奪冠,廠商們更在意的是讓用戶在世界杯期間不斷回來提問、追問和驗證結果。今天問冠軍歸屬,明天問小組出線,后天問淘汰賽走勢。在一次次互動中,大模型正在尋找繼“AI搜索”“AI寫作”“AI點奶茶”之后,新的高頻使用場景。
畢竟,對于大模型公司來說,世界杯冠軍只有一個,但用戶的注意力,卻是一場持續四十多天的爭奪戰。
1、從Deepseek到ChatGPT,為何都押注西班牙?
我們看看,這些AI預測,到底比當年章魚保羅靠譜多少?
以DeepSeek、Kimi、豆包為代表的國內頂尖AI大模型,預測方式都比較"樸素"。你問它"誰會奪冠",它綜合歷史戰績、球員實力、賽程安排,給你一個答案。
本質上,這和你問一個"博覽群書的球迷"沒太大區別,只不過這個球迷讀過的資料遠比普通人多。
![]()
Deepseek推理過程
![]()
Gemini推理過程
結果上,這些AI幾乎一邊倒:豆包、元寶、通義千問、文心一言和Kimi,都把西班牙列為最大奪冠熱門,理由也基本一致——2024歐洲杯冠軍、平均年齡24.5歲的年輕陣容、成熟的傳控體系。
從結果來看,這些大模型似乎達成了某種共識。但如果進一步拆解預測過程,會發現它們預測的主要依據是互聯網上的各類信息,拿歷史數據 + 賽前信息 → 單次輸出結論。可以說,這是一個輿情分析的工具,其給出的結果仍然是一種概率游戲。
其中比較有特點的,是Kimi的算法。它用了"Agent集群"架構,同時調度300個子Agent并行研究。這300個智能體分工明確:有的負責戰術分析,有的專門盯球員狀態,有的計算賽程和旅途消耗,還有的專門"唱反調"——負責找出主流預測里可能被忽略的風險。它們累計完成了超過10萬次模擬推演。
這套架構試圖解決傳統單模型的一個老問題:確認偏差(Confirmation Bias)。一個基于歷史數據訓練的模型,容易陷入"強隊永遠強、弱隊永遠弱"的思維定式、。正是這套系統,讓Kimi發現了一個有趣的結論:德國隊的奪冠概率,可能被市場嚴重低估了。不過Kimi自己也說得很清楚:這不是"德國隊將奪冠"的確定性斷言,而是"模型識別到了一個可能存在的概率偏差"。
千問的相關負責人告訴《態度》欄目:這些模型預測并沒有本質的區別。該預測模型并非提供標準答案,而是綜合所有可能影響比賽結果的因子(包括客觀存在因素、主觀因素及潛在變量),通過設定閾值和權重,給出一個最大可能性的判定結果。其核心邏輯是將概率轉化為綜合分析下的確定性選擇,旨在為用戶提供明確的參考,而非模棱兩可的“端水”式結論。
在大模型產品風靡之前,量化機構曾是世界杯預測的主力。本屆世界杯中,高盛采用“Elo評級 + 歷史統計規律 + 金融建模邏輯”的框架,核心思路可概括為“找規律、建模型、給概率”。相比之下,Opta走的是體育數據型路線,專注足球本身,積累了海量比賽級歷史數據,并通過蒙特卡洛模擬輸出概率分布。
四者結果居然高度一致:西班牙是最大熱門,法國緊隨其后,阿根廷和英格蘭也是有力競爭者。這說明在強隊判斷上,不同方法論得到了相似的結論——這本身也是一種交叉驗證。
2.與章魚保羅相比,區別何在?
說起世界杯預測,很難不提到章魚保羅。
2010年南非世界杯,一只住在德國奧博豪森海洋館的章魚,成了全世界最著名的“預言家”。它的方法極為簡單:工作人員把兩支參賽隊的國旗貼在兩個貝殼上,里面放上食物,保羅游向哪個貝殼,哪支球隊就是預測贏家。就是這樣,它預測對了8場比賽,準確率100%。連同2008年歐洲杯的預測,它職業生涯總計14次預測,猜中13場,準確率高達92.85%。
整個世界杯期間,它是比德國隊還要出名的“明星”。德國人因為它預測德國會負于西班牙,揚言要把它烤了;阿根廷人因為它預測德國會贏,憤怒地要求“把這只章魚做成湯”。它在2010年世界杯結束四個月后平靜地去世了,留下一個永恒的謎題。
章魚保羅的預測,和這些AI模型有什么本質區別?最直觀的差異在于方法和邏輯——章魚保羅的選擇是完全隨機的,沒有任何信息輸入和推理過程;而AI模型則依托海量數據、算法訓練和概率建模。
然而從歷史戰績來看,AI預測世界杯的表現其實并不出色。2018年俄羅斯世界杯,微軟以及多家投行的AI集體把西班牙、德國、巴西列為奪冠前三,結果冠軍是法國。2022年卡塔爾世界杯,部分機構AI押中了阿根廷,但整體場次命中率——半島電視臺58.7%,FiveThirtyEight 57.1%——比亂猜強一點,但遠遠稱不上“神準”。
為什么在信息輸入和算法上遠勝于隨機選擇,AI的預測準確率卻沒有顯著壓倒章魚保羅?原因之一在于,在單屆世界杯的有限場次內,隨機和理性之間的準確率差距,可能遠比我們想象的小。
更重要的是,足球比賽本身就有一個讓所有預測者都頭疼的特征:高度非線性。一張紅牌,一個脫手,一場淋雨,都可能把整場比賽送向截然不同的方向。在這種混沌系統里,再精密的模型,也只能給出“概率”,而不是“答案”。
即便如此,AI預測的價值仍然不能簡單否定。當Kimi的報告分析西班牙的年齡結構、法國的賽程難度、德國的概率偏差,當高盛的模型量化“衛冕冠軍效應”,當Opta的數據告訴你英格蘭進四強的概率是30%——這些信息本身是有價值的,哪怕最終預測是錯的。它給了我們一個更豐富的觀察框架,讓看球這件事,從“憑感覺站隊”變成了“帶著數據思考”。
AI產品廠商也充分意識到了這一點。我們對話的相關AI產品負責人表示,針對當前賽程后半段長達四十多天且變數較多的情況,現階段給出的冠軍預測更多是一種概率游戲,精準度和趣味性有限。團隊計劃在淘汰賽階段,基于更準確的數據和已發生的賽事結果,重新進行對位分析和預測,以提供更具參考價值和精準度的結論,避免過早下定論導致的偏差。
AI預測世界杯的意義,或許不在于"預測對了",而在于它讓人們以一種更結構化的方式理解比賽。如果AI真的能百分之百預測比賽結果——那足球也就沒什么意思了。
