網易首頁 > 網易號 > 正文申請入駐

Kimi預測世界杯，Agent的公開大考

2026-06-09 16:49:36　來源: 21世紀經濟報道

廣東舉報

分享至

21世紀經濟報道記者雷晨

距離2026年美加墨世界杯開幕越來越近，大模型公司也開始把目光投向這項全球關注度最高的體育賽事。

6月8日，月之暗面（Kimi）宣布，將利用其“Agent集群”能力，對本屆世界杯全部104場比賽進行公開預測，并在賽前發布判斷結果、賽后進行復盤。同時，平臺推出總規模1萬億Tokens的互動活動，用戶可以選擇支持的球隊參與獎勵分配。

表面上，這是一場借勢世界杯的營銷活動；但放在大模型行業競爭進入深水區的當下，它更像一次公開能力測試。

當參數規模、跑分成績和長文本能力逐漸失去新鮮感，AI公司開始尋找新的證明題：模型究竟能否走出聊天窗口，在真實世界中完成復雜任務。

相比最終冠軍，更值得關注的是：AI究竟如何做出預測，以及Kimi為何選擇在此刻，將Agent能力置于全世界監督下的公開考場？

AI的決策能力測試

如果把時間線拉長，AI預測體育賽事并不新鮮；真正新的，是大模型開始以“分析團隊”而非“統計工具”的身份進入賽場。

早在大模型出現之前，國際足聯、Opta、FiveThirtyEight等機構就長期利用Elo評級、預期進球（xG）、蒙特卡洛模擬等統計方法預測世界杯、歐洲杯以及各大職業聯賽結果。2018年俄羅斯世界杯期間，多家高校和研究機構推出基于機器學習的預測模型；2022年卡塔爾世界杯前，包括尼爾森、Opta在內的數據公司也發布過奪冠概率榜單。

這些模型能夠提供概率判斷，但大多屬于固定數據集計算工具，更像一個復雜計算器，而非能夠獨立完成研究分析的系統。大模型時代到來后，行業嘗試讓AI承擔更完整的分析任務。預測比賽不再只是輸出概率，而是要像分析師一樣主動搜集信息、拆解問題、判斷變量并形成結論。

足球比賽本身高度復雜。球隊實力、球員狀態、戰術打法、傷病情況、賽程安排、天氣因素、主客場環境，甚至裁判尺度和球員臨場情緒，都可能影響最終結果。傳統模型通常只關注部分因素，例如歷史交鋒、球隊排名或博彩賠率，但沒有單一指標能決定勝負。

Kimi此次預測并非依靠單一模型，而是由最多300個Agent組成協同系統。不同Agent分工明確：有的分析球隊實力和歷史戰績，有的關注進攻防守效率，有的跟蹤球員傷病和陣容變化，還有的監測賠率波動、媒體報道和市場情緒。最終，各Agent的分析結果會被統一匯總、交叉驗證，形成綜合判斷。

這一模式類似現實中的多團隊協作。在投資機構或咨詢公司中，復雜課題通常需要不同團隊分別收集和分析信息，再由負責人整合形成最終判斷。Agent受到追捧，本質上并不是因為它能回答更多問題，而是因為它試圖把AI從信息消費者變成任務執行者。從查找資料到拆解問題，從調用工具到形成結論，Agent希望完成的是一整套工作流程，而不僅僅是一次問答。

值得注意的是，Kimi使用的底層方法并非全新。無論是Elo評級、FIFA排名體系、預期進球模型還是蒙特卡洛模擬，在體育數據分析領域早已廣泛應用。真正的變化在于，大模型承擔了“組織者”和“協調者”角色，將不同工具、不同數據源以及不同分析路徑整合起來，形成統一判斷。

冷門屢見不鮮：2014年西班牙小組賽出局，2018年德國隊無緣16強，2022年阿根廷首戰負于沙特。這表明，預測的價值不在于絕對正確，而在于分析過程的透明度、判斷依據的清晰性，以及結果偏差后的復盤能力。

從技術驗證角度看，世界杯幾乎是Agent最理想的公開考場。它既擁有現實世界的復雜性，又具備明確可驗證的結果；既充滿隨機性，又不會像金融投資或醫療診斷那樣直接影響用戶利益。

一位工業互聯網領域技術負責人指出，目前許多消費級AI仍屬于“黑盒”模式，用戶無法了解推理來源。但在工業、金融、醫療等高風險領域，是否具備可解釋性和可追溯性是決策系統能否被信任的關鍵。

Kimi需要一個新的故事

如果說世界杯是一場足球盛宴，那么對于Kimi而言，它更像一次能力展示。預測比賽只是表象，展示Agent能力才是真正目的。

過去一年，聊天機器人新鮮感逐漸減弱，企業和投資者更關心AI是否能真正完成復雜任務，而非僅僅輸出文字或回答問題。大模型行業競爭邏輯正在發生變化：2023年和2024年側重模型規模、長文本能力和基準測試成績；2025年以來，重點逐漸轉向Agent及復雜任務執行能力。

OpenAI推出Operator，讓AI直接操作網頁完成任務；Anthropic強化Claude在編程和辦公場景的Agent能力；微軟則希望Copilot嵌入企業工作流。這一趨勢顯示，市場關注的不是模型本身，而是AI能否創造可量化價值。

在此背景下，Kimi近半年動作頻繁。公司陸續推出K2系列模型更新，提升復雜推理和工具調用能力；發布Agent集群，讓多個Agent協作完成任務；上線Kimi Work，讓AI參與調研分析和文檔生成；推出WebBridge，增強模型與互聯網信息的實時交互能力。

而世界杯預測幾乎涵蓋了Agent能力的全部要求。它要求系統實時獲取信息、分析變量、整合多源數據，并在賽后復盤解釋判斷偏差。這正是企業級Agent未來希望完成的工作模式。

對于Kimi來說，如今的問題已經不再是證明自己能做出一個優秀的大模型，而是證明自己能夠找到大模型之后的增長空間。

資本市場也在關注這一點。就在世界杯預測活動發布前夕，關于Kimi的融資消息再次傳出。

21世紀經濟報道從知情人士處獲悉，Kimi計劃啟動新一輪融資，目標規模最高20億美元，公司估值可能達到300億美元。

資本市場上，投資者關注的重點正在從模型能力轉向商業化能力。

一位長期關注AI行業的投資人士表示，當前市場越來越看重AI是否能夠創造實際價值，而不僅僅是展示技術先進性。相比參數規模和跑分成績，企業更關心的是AI能否幫助用戶節省時間、降低成本或者創造新的收入。

世界杯終將決出冠軍，但對于Kimi而言，更重要的或許是證明另一件事：當比賽結束、熱度散去之后，Agent是否已經具備進入真實工作場景的能力。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.