![]()
文/識局智庫研究組
今天凌晨3點,2026美加墨世界杯揭幕。
首戰,墨西哥 2:0 干掉南非。
如果你這兩天刷過微博或科技號,大概率已經看到那條“AI 章魚哥”的消息——阿里千問賽前把比分、進球者(35 歲的墨西哥老將希門尼斯)、甚至南非會吃紅牌這三件事全押中了,連巴西名哨桑帕約執法偏嚴這種細節都寫進了預測里。
同一晚,聯想拉著DeepSeek、Kimi、文心一言、通義千問、中移九天等11家大模型組了局“人機大戰”,AI 集群勝率 91.7%,人類對 81.6%。
朋友圈里一片“國產 AI 封神了”的驚嘆。
但如果你把鏡頭往后拉一點,會發現這件事遠不止“AI 會不會看球”那么簡單。
01
這一場,千問的預測確實漂亮。
它把ESPN的Elo評分(墨西哥1800vs南非1526)、墨西哥城2240米海拔的主場加成、賽日橙色暴雨預警、巴西裁判桑帕約的執法尺度這幾個變量燉成一鍋,吐出來的2:0連希門尼斯頭球和點名南非紅牌都對得上。
但單場命中在足球預測里說明不了太多,足球的魅力本來就是不可預測,一次揭幕戰樣本連統計意義都談不上。
更值得說的是另一家高調下場的——Kimi。
6月8日,月之暗面宣布 Kimi 將通過“Agent 集群”調度最多 300 個子 Agent,逐輪預測并復盤全部104場,還配了1萬億Token的獎池讓用戶跟著瓜分。
看著挺唬人,但 Kimi 自己公布的回測成績看起來挺誠實:用同一套方法滾2018和2022兩屆世界杯,整體準確率大概在50%-60%之間,略遜于市場賠率。
換句話說,300個Agent開會的結論,并沒有穩定跑贏博彩公司由真金白銀砸出來的隱含概率。
Kimi 在報告里也反復強調“我們很可能錯”,并把市場賠率定位成“共識偏差研究變量”而不是參照系。這個姿態比預測本身有意思,承認不準,反而才是這場秀的真正產品。
02
把Kimi的300個子Agent 拆開看,分工是這樣的:
戰略層盯“冠軍周期”這種宏觀敘事;
戰術層算 xG(預期進球)、xT(預期威脅)這些量化指標;
執行層啃 16 個場館的地理、氣候、旅行距離;
還有一組叫“反方 Agent”,專職給前面所有人的結論挑刺——傷兵漏沒漏?天氣權重過高?是不是被熱門隊名氣帶了節奏?
這架構往深里看,其實并不是為了猜比分設計的。
一套Elo+Poisson+Dixon-Coles+Monte Carlo 的傳統體育建模,一個量化分析師用 Python 兩周就能搓出來,犯不著調動300個Agent還搞“辯論協議”。
月之暗面真正想給外界看的,或許是 Kimi Work(6月3日剛公測的通用本地 Agent)在多智能體協同上的天花板——能同時拉 300 條線程各管一攤、還能交叉驗證、還能把推理鏈攤給你看。
選世界杯當考場也不是隨便挑的。104 場、48 隊、橫跨美加墨三國時區海拔、每天都有新比分可以驗,而且全民圍觀。
這是 2026 年夏天極少數“普通人也看得懂、技術圈也認賬、連續一個月有得寫”的公開場景。做 Agent 協同 DEMO 如果選個金融風控,老百姓看不懂;選個代碼生成,又被吐槽“又卷 coding benchmark”。世界杯剛好卡在中間。
03
時間點更有意味。
Kimi宣布300 Agent預測世界杯的同一周,6月8日,媒體曝出月之暗面新一輪融資投前估值已跳到300億美元,比一個月前“突破 200 億美元”又上了一個大臺階,半年時間里從43億美元翻了近七倍。
同期的國產大模型資本化地圖是這樣的:
智譜年初登港交所,6月1日又公告要回科創板,募150億人民幣;
MiniMax 緊跟著交了科創板輔導備案,“A+H”雙平臺齊跑;階躍星辰被傳要去港交所遞表,目標估值 120 億美元;
DeepSeek傳出首輪融資規模破 500 億、投后 3500-4000 億人民幣,騰訊出 100 億、寧德時代出 50 億。
“六小虎”的局,從比參數打到比資本化,只用了半年。
這個背景下再看世界杯這波扎堆,Kimi 秀 Agent Swarm、千問秀多模態變量融合、聯想拉 11 家組“人機大戰”綁咪咕流量,每家都在借世界杯講自己那個“AGI 落地”的故事給資本市場聽。
AGI的遠期敘事這兩季度其實在降溫,投資人開始追問 ARR、追問 API 調用、追問企業級部署。這時候有一場全民圍觀的“AI 公開考試”,比發十篇技術博客都管用。
04
所以這場“忽悠”究竟忽悠了誰?
說“忽悠”可能重了,但這事兒確實有兩層觀眾要看清。
一層是看熱鬧的。
揭幕戰千問那三個細節全中,有運氣成分但也有真東西——把海拔、天氣、裁判庫、xG 指標都喂進去,命中率確實能比盲猜高一段。
但單場神準不要外推到整個賽事,Kimi 自己的回測已經把天花板畫好了:50%-60%,打平博彩盤口都費勁。
后面 103 場走完,大概率還是“偶爾驚艷、整體平庸”的曲線。
另一層是看產業的。
“國產 AI 扎堆預測世界杯”這個現象本身,比任何單場比分都值得細品。
2026年6月這個節點,六小虎估值全線沖頂、IPO 路徑分化、AGI 遠期敘事又有點講不動了,大家急需一個成本低、曝光高、還能秀新能力的公域舞臺。世界杯剛好砸過來,不蹭是傻子。
千問蹭的是“多模態+環境變量”的落地感,Kimi 蹭的是“300 Agent 協同”的架構感,聯想蹭的是“天禧生態+FIFA 官方伙伴”的生態感,DeepSeek、豆包、文心一言集體押西班牙奪冠,押的是“我會跟主流共識站在一起”。
表面是看球,底下全是各自的估值劇本。
05
104場踢完,真正值得回看的或許還不是哪家居然猜中了決賽比分,而是哪家能把“Agent 集群+公開可驗推理鏈”這個故事講圓。
這個故事若圓得漂亮,下一輪融資的Term Sheet上就能多一項“已通過大規模社會場景壓力測試”的加持。
足球是圓的,估值是熱的,300個Agent算的既是前者,更是后者。
更多探討,歡迎進讀者群交流!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.