記者|溫夢華
編輯|何小桃 張益銘 易啟江 校對|金冥羽
還有幾個小時,2026年美加墨世界杯即將打響(北京時間6月12日凌晨)。而賽場外的AI(人工智能)賽事研判、實力比拼,早已先行開啟。
6月8日,國產大模型Kimi稱將通過Agent(智能體)集群同時調度300個子Agent,公開預測104場世界杯賽事,并提出德國隊或爆冷奪冠。Kimi同時上線了一場“押注”活動:1萬億Token(詞元)獎池,用戶選隊、球隊贏了就可以瓜分Token,將體育賽事與AI用戶運營深度綁定。
《每日經濟新聞》記者(以下簡稱每經記者)注意到,千問也緊隨其后上線了相關活動。每經記者實測發現,豆包、元寶、DeepSeek、文心一言等國產大模型在被問及“2026年世界杯誰會奪冠”時,多數預測答案為“西班牙隊”,判斷邏輯也高度趨同。
熱鬧之下,Kelly Bench最新數據卻顯示,包括GPT等在內的頂級模型在足球賭盤上表現慘淡。
既然AI賭不贏,Kimi、千問等AI大模型為何還要押注世界杯?這背后,實際上是AI大模型行業的集體焦慮:當寫詩、做題、對話的“內卷”走到盡頭,各家廠商急于證明自己能夠理解復雜、動態、充滿不確定性的現實世界。
“萬億Token狂歡”:世界杯成AI“用戶拉新戰場”
面對世界杯的巨大流量,一眾品牌早已摩拳擦掌,這一次下場“押注”除了傳統贊助商,還有手握萬億Token的AI大模型們。
6月8日,Kimi發文稱,將通過Agent集群同時調度300個子Agent,公開預測104場世界杯賽事,并在每輪賽前公開預測、賽后復盤。
Kimi的預測策略并沒有完全隨大流。它并未否認當前多數主流模型將西班牙隊和法國隊列為奪冠最大熱門,同樣認為兩者的奪冠概率位居前列,但它提出了另一個關注點:德國隊的奪冠概率可能被市場低估。
![]()
Kimi月之暗面公眾號
當網友們熱議“AI預測究竟準不準”“AI懂不懂球”時,Kimi在文章開頭就坦承“我們的預測很可能是錯的”,并稱希望通過這次嘗試,把分析過程、預測結果和賽后復盤放在同一個透明框架中。
此外,Kimi還拿出1萬億Token獎池,用戶預測冠軍隊、pick(挑選)的球隊每次獲勝就可以參與瓜分Token。截至6月11日18時,Kimi App顯示,實時排行的隊伍支持率TOP5分別為阿根廷、法國、西班牙、巴西、葡萄牙,有43.33%的參與用戶選擇了阿根廷。
![]()
Kimi“預測冠軍隊搶萬億Token”活動截圖
那么,Kimi押注世界杯并豪擲萬億Token,究竟是能力展示,還是一次品牌營銷?
長期關注世界杯等知名賽事的體育咨詢專家、關鍵之道創始人張慶告訴每經記者,Kimi此次活動類似于春晚搶紅包、集福瓜分獎金等互聯網平臺常用打法,更像一種營銷活動。
“每一屆世界杯都是巨大的流量池,各個企業都希望有機會參與,獲得更多曝光、引流機會。而大模型天然適合做這類數據分析和預測。”張慶向每經記者指出,當下,大模型競爭激烈,尤其是用戶注意力和使用頻次的競爭,通過世界杯一方面會加持品牌聲量,另一方面也有利于提升大模型的數據用戶積累和活躍度。
深耕人工智能產業多年的技術專家王巖(化名)在接受每經記者采訪時坦言,大模型預測世界杯冠軍,是體育熱點、Token補貼和Agent展示疊加形成的傳播事件。
王巖認為,熱點借勢只是入口,真正競爭點在于誰能把抽象模型能力轉化為用戶可感知結果。這意味著,AI大模型企業在品牌傳播上,不再只發布參數、榜單和技術報告,轉為借高關注賽事制造用戶體驗入口;而在商業競爭上各家模型爭奪的則是用戶心智、使用頻次、社交傳播和開發者注意力。
截至目前,多少用戶參與了Kimi“押注”世界杯的活動?通過用Agent集群預測世界杯冠軍,Kimi又將獲得哪些方面的能力提升?Kimi(月之暗面)方面向每經記者表示:“暫無回應”。
![]()
多款國產大模型預測西班牙隊 精準共識還是算法趨同?
不只Kimi,其他AI大模型玩家也試圖“分一杯世界杯的羹”。例如,千問也推出“決戰美加墨,與千問一起預測,贏萬元現金”的活動,加入這場AI“秀肌肉”爭奪戰。
![]()
千問App截圖
“我前兩天也用DeepSeek、豆包預測了2026年世界杯冠軍,想對比它們誰分析的有道理,但我看到它們給出的預測和相關理由都有明顯局限性。”張慶向每經記者分享道。
在國產大模型眼中,誰是“2026年世界杯冠軍隊伍”?每經記者實測DeepSeek、Kimi、豆包、元寶、千問、文心一言、智譜清言發現:DeepSeek押寶法國隊,Kimi看好阿根廷隊,而千問、豆包、元寶、文心一言、智譜清言5款國產大模型則均預測支持西班牙隊。
每款AI大模型給出的“奪冠隊伍”理由分析略有不同。值得注意的是,投票西班牙隊的AI大模型們,其判斷邏輯高度趨同,核心理由之一均為“權威數據模型、機構高度一致看好”。
![]()
![]()
大模型的預測到底準不準?能否獲得球迷的青睞?
上海財經大學特聘教授胡延平向每經記者表示,AI大模型已經初步展露出基于全局動態信息和深度復雜推理的特定預測能力,使得各家大模型有基礎、有信心來進行預測,但足球是圓的,預測的成功率、精準度方面還有待觀察。
“世界杯預測無疑是展示模型與智能體水準的一個上佳機會窗口,不過預測的效果也是一把雙刃劍。個人預期這屆世界杯,水準最高的預測模型,成功率能達到60%~80%左右。”胡延平坦言。
不過,Kelly Bench在2023—2024賽季英格蘭超級聯賽的模擬中顯示,其評估的每個前沿模型在整個賽季都虧損了,并且許多都經歷了破產。其中,Claude Opus 4.7目前以-3.7%的平均投資回報率領先;有4個模型避免了所有的破產。
![]()
Kelly Bench截圖
“AI更多是一個輔助工具,基于戰隊歷史戰績、世界杯排名、賠率、國際足聯等大量數據的多維度預測,AI大模型呈現了客觀數據統計,所以作為參考工具還是有意義的,但不會完全依賴它的結果。”一位長期關注世界杯的資深球迷告訴每經記者。
在上述球迷看來,相比大模型的預測,每個球迷都更青睞自己喜歡的球隊,喜好也會占一大部分判斷,而且越到決賽越是球員臨場發揮和心理上的博弈,不確定性太多了。
![]()
不再比誰更會“聊” 押注世界杯背后AI們集體想拼什么?
當Kimi拿出萬億Token、調動300個子Agent對世界杯賽事進行并行預測,當千問、豆包、元寶爭先恐后地給出各自的奪冠熱門隊伍時,這場看似娛樂化的“AI押注戰”背后,AI大模型廠商究竟想“秀”什么?又在集體“卷”什么?
“本輪大模型預測世界杯冠軍,是生成式AI從問答工具走向公共事件運營的典型樣本。”王巖向每經記者指出,公眾看到的是冠軍預測,企業展示的則是Agent協同、長上下文處理、實時檢索、概率解釋和高并發服務能力,商業上爭奪的則是用戶時長、付費轉化和資本敘事。
![]()
Kimi月之暗面公眾號
當下,AI大模型的競爭早已不局限于單純的參數榜單,而是從“會聊天”轉向“能辦事”,從“比模型”轉向“比場景”。然而,《Build for the Future 2025》全球研究顯示,在調研全球1250多家企業后,僅5%的公司實現了AI價值的規模化應用。Gartner數據也顯示,截至2025年底,嵌入真正AI Agent的企業應用占比不足5%。
胡延平觀察到,大模型和智能體正從對話走向任務,從預訓練走向持續學習,從數據語料走向持續多維的現實感知。“預測世界杯這類探索項目會加速這個進化過程。未來行動智能體所需要的能力體系,也是在走向‘感知-交互-決策-協同’這個方向。”
不過,王巖坦言,世界杯預測可以成為Agent能力的公開壓力測試,但不能自動證明Agent能力提升,大模型在這場押注中訓練和檢驗的是長任務組織、概率校準和用戶交互能力。
“Kimi的300個Agent代表分析覆蓋面增加,不直接代表預測準確率提升。相關Agent任務Token消耗研究顯示,同一任務的Token消耗可相差幾十倍,更多Token并不必然帶來更高準確率。同樣,相關Prediction Arena研究也顯示,多個前沿模型在Kalshi真實預測市場57天交易測試中最終收益為-16.0%至-30.8%,研究量與結果沒有相關性。”王巖向每經記者進一步分析道。
正如王巖所言:“當前Agent的最大缺口,正在從‘能否給出合理計劃’轉向‘能否穩定完成長周期真實任務’。”這意味著,誰能率先落地“實戰能力”,誰就將有機會在愈發激烈的爭奪賽中脫穎而出。
(免責聲明:文章內容和數據僅供參考,不構成投資建議。投資者據此操作,風險自擔。)
|每日經濟新聞 nbdnews 原創文章|
未經許可禁止轉載、摘編、復制及鏡像等使用
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.