无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

Kimi預測世界杯,Agent的公開大考

0
分享至

21世紀經濟報道記者 雷晨

距離2026年美加墨世界杯開幕越來越近,大模型公司也開始把目光投向這項全球關注度最高的體育賽事。

6月8日,月之暗面(Kimi)宣布,將利用其“Agent集群”能力,對本屆世界杯全部104場比賽進行公開預測,并在賽前發布判斷結果、賽后進行復盤。同時,平臺推出總規模1萬億Tokens的互動活動,用戶可以選擇支持的球隊參與獎勵分配。


表面上,這是一場借勢世界杯的營銷活動;但放在大模型行業競爭進入深水區的當下,它更像一次公開能力測試。

當參數規模、跑分成績和長文本能力逐漸失去新鮮感,AI公司開始尋找新的證明題:模型究竟能否走出聊天窗口,在真實世界中完成復雜任務。

相比最終冠軍,更值得關注的是:AI究竟如何做出預測,以及Kimi為何選擇在此刻,將Agent能力置于全世界監督下的公開考場?

AI的決策能力測試

如果把時間線拉長,AI預測體育賽事并不新鮮;真正新的,是大模型開始以“分析團隊”而非“統計工具”的身份進入賽場。

早在大模型出現之前,國際足聯、Opta、FiveThirtyEight等機構就長期利用Elo評級、預期進球(xG)、蒙特卡洛模擬等統計方法預測世界杯、歐洲杯以及各大職業聯賽結果。2018年俄羅斯世界杯期間,多家高校和研究機構推出基于機器學習的預測模型;2022年卡塔爾世界杯前,包括尼爾森、Opta在內的數據公司也發布過奪冠概率榜單。

這些模型能夠提供概率判斷,但大多屬于固定數據集計算工具,更像一個復雜計算器,而非能夠獨立完成研究分析的系統。大模型時代到來后,行業嘗試讓AI承擔更完整的分析任務。預測比賽不再只是輸出概率,而是要像分析師一樣主動搜集信息、拆解問題、判斷變量并形成結論。

足球比賽本身高度復雜。球隊實力、球員狀態、戰術打法、傷病情況、賽程安排、天氣因素、主客場環境,甚至裁判尺度和球員臨場情緒,都可能影響最終結果。傳統模型通常只關注部分因素,例如歷史交鋒、球隊排名或博彩賠率,但沒有單一指標能決定勝負。

Kimi此次預測并非依靠單一模型,而是由最多300個Agent組成協同系統。不同Agent分工明確:有的分析球隊實力和歷史戰績,有的關注進攻防守效率,有的跟蹤球員傷病和陣容變化,還有的監測賠率波動、媒體報道和市場情緒。最終,各Agent的分析結果會被統一匯總、交叉驗證,形成綜合判斷。

這一模式類似現實中的多團隊協作。在投資機構或咨詢公司中,復雜課題通常需要不同團隊分別收集和分析信息,再由負責人整合形成最終判斷。Agent受到追捧,本質上并不是因為它能回答更多問題,而是因為它試圖把AI從信息消費者變成任務執行者。從查找資料到拆解問題,從調用工具到形成結論,Agent希望完成的是一整套工作流程,而不僅僅是一次問答。

值得注意的是,Kimi使用的底層方法并非全新。無論是Elo評級、FIFA排名體系、預期進球模型還是蒙特卡洛模擬,在體育數據分析領域早已廣泛應用。真正的變化在于,大模型承擔了“組織者”和“協調者”角色,將不同工具、不同數據源以及不同分析路徑整合起來,形成統一判斷。

冷門屢見不鮮:2014年西班牙小組賽出局,2018年德國隊無緣16強,2022年阿根廷首戰負于沙特。這表明,預測的價值不在于絕對正確,而在于分析過程的透明度、判斷依據的清晰性,以及結果偏差后的復盤能力。

從技術驗證角度看,世界杯幾乎是Agent最理想的公開考場。它既擁有現實世界的復雜性,又具備明確可驗證的結果;既充滿隨機性,又不會像金融投資或醫療診斷那樣直接影響用戶利益。

一位工業互聯網領域技術負責人指出,目前許多消費級AI仍屬于“黑盒”模式,用戶無法了解推理來源。但在工業、金融、醫療等高風險領域,是否具備可解釋性和可追溯性是決策系統能否被信任的關鍵。

Kimi需要一個新的故事

如果說世界杯是一場足球盛宴,那么對于Kimi而言,它更像一次能力展示。預測比賽只是表象,展示Agent能力才是真正目的。

過去一年,聊天機器人新鮮感逐漸減弱,企業和投資者更關心AI是否能真正完成復雜任務,而非僅僅輸出文字或回答問題。大模型行業競爭邏輯正在發生變化:2023年和2024年側重模型規模、長文本能力和基準測試成績;2025年以來,重點逐漸轉向Agent及復雜任務執行能力。

OpenAI推出Operator,讓AI直接操作網頁完成任務;Anthropic強化Claude在編程和辦公場景的Agent能力;微軟則希望Copilot嵌入企業工作流。這一趨勢顯示,市場關注的不是模型本身,而是AI能否創造可量化價值。

在此背景下,Kimi近半年動作頻繁。公司陸續推出K2系列模型更新,提升復雜推理和工具調用能力;發布Agent集群,讓多個Agent協作完成任務;上線Kimi Work,讓AI參與調研分析和文檔生成;推出WebBridge,增強模型與互聯網信息的實時交互能力。

而世界杯預測幾乎涵蓋了Agent能力的全部要求。它要求系統實時獲取信息、分析變量、整合多源數據,并在賽后復盤解釋判斷偏差。這正是企業級Agent未來希望完成的工作模式。

對于Kimi來說,如今的問題已經不再是證明自己能做出一個優秀的大模型,而是證明自己能夠找到大模型之后的增長空間。

資本市場也在關注這一點。就在世界杯預測活動發布前夕,關于Kimi的融資消息再次傳出。

21世紀經濟報道從知情人士處獲悉,Kimi計劃啟動新一輪融資,目標規模最高20億美元,公司估值可能達到300億美元。

資本市場上,投資者關注的重點正在從模型能力轉向商業化能力。

一位長期關注AI行業的投資人士表示,當前市場越來越看重AI是否能夠創造實際價值,而不僅僅是展示技術先進性。相比參數規模和跑分成績,企業更關心的是AI能否幫助用戶節省時間、降低成本或者創造新的收入。

世界杯終將決出冠軍,但對于Kimi而言,更重要的或許是證明另一件事:當比賽結束、熱度散去之后,Agent是否已經具備進入真實工作場景的能力。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
滬女點外賣備注“牛蛙不燒”,商家害怕差評送活娃應對!

滬女點外賣備注“牛蛙不燒”,商家害怕差評送活娃應對!

咸魚金腦袋
2026-06-12 22:06:53
水利部對七省啟動洪水防御Ⅳ級應急響應

水利部對七省啟動洪水防御Ⅳ級應急響應

界面新聞
2026-06-13 07:23:33
堪比中船特氣、碾壓MLCC!被低估的AI真正“卡脖子”核心即將爆發

堪比中船特氣、碾壓MLCC!被低估的AI真正“卡脖子”核心即將爆發

侃故事的阿慶
2026-06-12 01:51:09
尼克斯奪冠軍點 老板與官方起爭端

尼克斯奪冠軍點 老板與官方起爭端

體壇周報
2026-06-13 01:47:17
女多男少!圖瓦婚戀市場將崩盤?這場俄烏沖突最受傷的民族已出現

女多男少!圖瓦婚戀市場將崩盤?這場俄烏沖突最受傷的民族已出現

歷史擺渡
2026-06-11 12:10:03
不裝了!景甜借腹生子最新消息,被曝停工失聯,上億豪宅降價甩賣

不裝了!景甜借腹生子最新消息,被曝停工失聯,上億豪宅降價甩賣

翰飛觀事
2026-06-12 09:41:26
膝蓋疼就只能躺著?大錯!這4個動作比吃藥還管用,越動越好得快

膝蓋疼就只能躺著?大錯!這4個動作比吃藥還管用,越動越好得快

徐孟醫生說疼痛
2026-06-12 07:00:20
外資控制蒙古銅礦,340萬人淪為性旅游后花園

外資控制蒙古銅礦,340萬人淪為性旅游后花園

清歡百味
2026-06-11 18:45:10
央視曝光紅旗16F:中國攻克美國未掌握技術

央視曝光紅旗16F:中國攻克美國未掌握技術

書寫傳奇
2026-06-13 01:03:55
被罵到關閉社交賬號!韓國球迷觀戰世界杯,遭墨西哥人拉眼角歧視

被罵到關閉社交賬號!韓國球迷觀戰世界杯,遭墨西哥人拉眼角歧視

全景體育V
2026-06-13 08:30:20
哪些書像是來自另一個維度的智慧?網友:讀完才知道我是井底之蛙

哪些書像是來自另一個維度的智慧?網友:讀完才知道我是井底之蛙

夜深愛雜談
2026-06-10 22:43:03
周大福回應加盟店前股東卷款千萬失聯:此事已知悉,正在跟消費者進行溝通,并配合相關部門調查,暫時沒有最新信息及后續安排

周大福回應加盟店前股東卷款千萬失聯:此事已知悉,正在跟消費者進行溝通,并配合相關部門調查,暫時沒有最新信息及后續安排

大風新聞
2026-06-12 22:15:04
湖北省700萬退休人員養老金將迎調整,看看過去3年是如何變化的?

湖北省700萬退休人員養老金將迎調整,看看過去3年是如何變化的?

暖心人社
2026-06-12 17:50:52
山東醫藥大學再通報“展某某學位證無法認證”

山東醫藥大學再通報“展某某學位證無法認證”

界面新聞
2026-06-12 20:30:09
發現一個奇怪現象:村里凡是大學畢業的,無論博士、碩士還是本科,過年回家都很安靜;那些早早外出打工的,表現得卻很熱情~

發現一個奇怪現象:村里凡是大學畢業的,無論博士、碩士還是本科,過年回家都很安靜;那些早早外出打工的,表現得卻很熱情~

犀利強哥
2026-06-12 22:20:47
全員跑路!東方甄選初代主播全軍覆沒,離職潮根本剎不住

全員跑路!東方甄選初代主播全軍覆沒,離職潮根本剎不住

雷科技
2026-06-11 12:07:08
連續43小時沒合眼,上海30歲骨干教師溺亡前細節曝光

連續43小時沒合眼,上海30歲骨干教師溺亡前細節曝光

大廠編外實習生
2026-06-12 19:37:31
沃爾沃XC90放“大招”!給出22.6萬優惠,網友:這也太狠了

沃爾沃XC90放“大招”!給出22.6萬優惠,網友:這也太狠了

汽車網評
2026-06-12 21:44:03
泰國帕公主離世:提幫功失去靠山,二王子回國奪嫡迎最佳時機?

泰國帕公主離世:提幫功失去靠山,二王子回國奪嫡迎最佳時機?

白露文娛志
2026-06-12 14:22:28
炸!一女網友在網上直言:算不上小三,只是二房,比原配小十幾歲

炸!一女網友在網上直言:算不上小三,只是二房,比原配小十幾歲

魔都姐姐雜談
2026-06-10 08:37:46
2026-06-13 09:03:00
21世紀經濟報道 incentive-icons
21世紀經濟報道
中國商業新聞領導者
253271文章數 744433關注度
往期回顧 全部

體育要聞

歐洲恐韓?肉德維德?

頭條要聞

47歲泰國長公主去世 70多歲泰王現繼承危機

頭條要聞

47歲泰國長公主去世 70多歲泰王現繼承危機

娛樂要聞

一天4個瓜,肖戰熱巴最意外

財經要聞

梁文鋒向左,楊植麟向右

科技要聞

剛剛,人類歷史上首位萬億美元富豪誕生!

汽車要聞

標配激光雷達/雙動力可選 昊鉑S600限時售17.99萬起

態度原創

時尚
房產
數碼
手機
公開課

今日熱點:白鹿起訴蒙淇淇;岳云鵬回應開演唱會質疑……

房產要聞

海南最賺錢行業曝光!最快4年半,海口全款買三房!

數碼要聞

喬思伯TM-280 AIO水冷首發499元:3.95英寸鋁飾板冷頭

手機要聞

三星官網公布Galaxy A27 5G手機參數,搭載驍龍6 Gen 3芯片

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版