21世紀經濟報道記者 雷晨
距離2026年美加墨世界杯開幕越來越近,大模型公司也開始把目光投向這項全球關注度最高的體育賽事。
6月8日,月之暗面(Kimi)宣布,將利用其“Agent集群”能力,對本屆世界杯全部104場比賽進行公開預測,并在賽前發布判斷結果、賽后進行復盤。同時,平臺推出總規模1萬億Tokens的互動活動,用戶可以選擇支持的球隊參與獎勵分配。
![]()
表面上,這是一場借勢世界杯的營銷活動;但放在大模型行業競爭進入深水區的當下,它更像一次公開能力測試。
當參數規模、跑分成績和長文本能力逐漸失去新鮮感,AI公司開始尋找新的證明題:模型究竟能否走出聊天窗口,在真實世界中完成復雜任務。
相比最終冠軍,更值得關注的是:AI究竟如何做出預測,以及Kimi為何選擇在此刻,將Agent能力置于全世界監督下的公開考場?
AI的決策能力測試
如果把時間線拉長,AI預測體育賽事并不新鮮;真正新的,是大模型開始以“分析團隊”而非“統計工具”的身份進入賽場。
早在大模型出現之前,國際足聯、Opta、FiveThirtyEight等機構就長期利用Elo評級、預期進球(xG)、蒙特卡洛模擬等統計方法預測世界杯、歐洲杯以及各大職業聯賽結果。2018年俄羅斯世界杯期間,多家高校和研究機構推出基于機器學習的預測模型;2022年卡塔爾世界杯前,包括尼爾森、Opta在內的數據公司也發布過奪冠概率榜單。
這些模型能夠提供概率判斷,但大多屬于固定數據集計算工具,更像一個復雜計算器,而非能夠獨立完成研究分析的系統。大模型時代到來后,行業嘗試讓AI承擔更完整的分析任務。預測比賽不再只是輸出概率,而是要像分析師一樣主動搜集信息、拆解問題、判斷變量并形成結論。
足球比賽本身高度復雜。球隊實力、球員狀態、戰術打法、傷病情況、賽程安排、天氣因素、主客場環境,甚至裁判尺度和球員臨場情緒,都可能影響最終結果。傳統模型通常只關注部分因素,例如歷史交鋒、球隊排名或博彩賠率,但沒有單一指標能決定勝負。
Kimi此次預測并非依靠單一模型,而是由最多300個Agent組成協同系統。不同Agent分工明確:有的分析球隊實力和歷史戰績,有的關注進攻防守效率,有的跟蹤球員傷病和陣容變化,還有的監測賠率波動、媒體報道和市場情緒。最終,各Agent的分析結果會被統一匯總、交叉驗證,形成綜合判斷。
這一模式類似現實中的多團隊協作。在投資機構或咨詢公司中,復雜課題通常需要不同團隊分別收集和分析信息,再由負責人整合形成最終判斷。Agent受到追捧,本質上并不是因為它能回答更多問題,而是因為它試圖把AI從信息消費者變成任務執行者。從查找資料到拆解問題,從調用工具到形成結論,Agent希望完成的是一整套工作流程,而不僅僅是一次問答。
值得注意的是,Kimi使用的底層方法并非全新。無論是Elo評級、FIFA排名體系、預期進球模型還是蒙特卡洛模擬,在體育數據分析領域早已廣泛應用。真正的變化在于,大模型承擔了“組織者”和“協調者”角色,將不同工具、不同數據源以及不同分析路徑整合起來,形成統一判斷。
冷門屢見不鮮:2014年西班牙小組賽出局,2018年德國隊無緣16強,2022年阿根廷首戰負于沙特。這表明,預測的價值不在于絕對正確,而在于分析過程的透明度、判斷依據的清晰性,以及結果偏差后的復盤能力。
從技術驗證角度看,世界杯幾乎是Agent最理想的公開考場。它既擁有現實世界的復雜性,又具備明確可驗證的結果;既充滿隨機性,又不會像金融投資或醫療診斷那樣直接影響用戶利益。
一位工業互聯網領域技術負責人指出,目前許多消費級AI仍屬于“黑盒”模式,用戶無法了解推理來源。但在工業、金融、醫療等高風險領域,是否具備可解釋性和可追溯性是決策系統能否被信任的關鍵。
Kimi需要一個新的故事
如果說世界杯是一場足球盛宴,那么對于Kimi而言,它更像一次能力展示。預測比賽只是表象,展示Agent能力才是真正目的。
過去一年,聊天機器人新鮮感逐漸減弱,企業和投資者更關心AI是否能真正完成復雜任務,而非僅僅輸出文字或回答問題。大模型行業競爭邏輯正在發生變化:2023年和2024年側重模型規模、長文本能力和基準測試成績;2025年以來,重點逐漸轉向Agent及復雜任務執行能力。
OpenAI推出Operator,讓AI直接操作網頁完成任務;Anthropic強化Claude在編程和辦公場景的Agent能力;微軟則希望Copilot嵌入企業工作流。這一趨勢顯示,市場關注的不是模型本身,而是AI能否創造可量化價值。
在此背景下,Kimi近半年動作頻繁。公司陸續推出K2系列模型更新,提升復雜推理和工具調用能力;發布Agent集群,讓多個Agent協作完成任務;上線Kimi Work,讓AI參與調研分析和文檔生成;推出WebBridge,增強模型與互聯網信息的實時交互能力。
而世界杯預測幾乎涵蓋了Agent能力的全部要求。它要求系統實時獲取信息、分析變量、整合多源數據,并在賽后復盤解釋判斷偏差。這正是企業級Agent未來希望完成的工作模式。
對于Kimi來說,如今的問題已經不再是證明自己能做出一個優秀的大模型,而是證明自己能夠找到大模型之后的增長空間。
資本市場也在關注這一點。就在世界杯預測活動發布前夕,關于Kimi的融資消息再次傳出。
21世紀經濟報道從知情人士處獲悉,Kimi計劃啟動新一輪融資,目標規模最高20億美元,公司估值可能達到300億美元。
資本市場上,投資者關注的重點正在從模型能力轉向商業化能力。
一位長期關注AI行業的投資人士表示,當前市場越來越看重AI是否能夠創造實際價值,而不僅僅是展示技術先進性。相比參數規模和跑分成績,企業更關心的是AI能否幫助用戶節省時間、降低成本或者創造新的收入。
世界杯終將決出冠軍,但對于Kimi而言,更重要的或許是證明另一件事:當比賽結束、熱度散去之后,Agent是否已經具備進入真實工作場景的能力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.