无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

神準?別被AI預測世界杯勝負忽悠了!

0
分享至



文/識局智庫研究組

今天凌晨3點,2026美加墨世界杯揭幕。

首戰,墨西哥 2:0 干掉南非。

如果你這兩天刷過微博或科技號,大概率已經看到那條“AI 章魚哥”的消息——阿里千問賽前把比分、進球者(35 歲的墨西哥老將希門尼斯)、甚至南非會吃紅牌這三件事全押中了,連巴西名哨桑帕約執法偏嚴這種細節都寫進了預測里。

同一晚,聯想拉著DeepSeek、Kimi、文心一言、通義千問、中移九天等11家大模型組了局“人機大戰”,AI 集群勝率 91.7%,人類對 81.6%。

朋友圈里一片“國產 AI 封神了”的驚嘆。

但如果你把鏡頭往后拉一點,會發現這件事遠不止“AI 會不會看球”那么簡單。

01

這一場,千問的預測確實漂亮。

它把ESPN的Elo評分(墨西哥1800vs南非1526)、墨西哥城2240米海拔的主場加成、賽日橙色暴雨預警、巴西裁判桑帕約的執法尺度這幾個變量燉成一鍋,吐出來的2:0連希門尼斯頭球和點名南非紅牌都對得上。

但單場命中在足球預測里說明不了太多,足球的魅力本來就是不可預測,一次揭幕戰樣本連統計意義都談不上。

更值得說的是另一家高調下場的——Kimi。

6月8日,月之暗面宣布 Kimi 將通過“Agent 集群”調度最多 300 個子 Agent,逐輪預測并復盤全部104場,還配了1萬億Token的獎池讓用戶跟著瓜分。

看著挺唬人,但 Kimi 自己公布的回測成績看起來挺誠實:用同一套方法滾2018和2022兩屆世界杯,整體準確率大概在50%-60%之間,略遜于市場賠率。

換句話說,300個Agent開會的結論,并沒有穩定跑贏博彩公司由真金白銀砸出來的隱含概率。

Kimi 在報告里也反復強調“我們很可能錯”,并把市場賠率定位成“共識偏差研究變量”而不是參照系。這個姿態比預測本身有意思,承認不準,反而才是這場秀的真正產品。

02

把Kimi的300個子Agent 拆開看,分工是這樣的:

戰略層盯“冠軍周期”這種宏觀敘事;

戰術層算 xG(預期進球)、xT(預期威脅)這些量化指標;

執行層啃 16 個場館的地理、氣候、旅行距離;

還有一組叫“反方 Agent”,專職給前面所有人的結論挑刺——傷兵漏沒漏?天氣權重過高?是不是被熱門隊名氣帶了節奏?

這架構往深里看,其實并不是為了猜比分設計的。

一套Elo+Poisson+Dixon-Coles+Monte Carlo 的傳統體育建模,一個量化分析師用 Python 兩周就能搓出來,犯不著調動300個Agent還搞“辯論協議”。

月之暗面真正想給外界看的,或許是 Kimi Work(6月3日剛公測的通用本地 Agent)在多智能體協同上的天花板——能同時拉 300 條線程各管一攤、還能交叉驗證、還能把推理鏈攤給你看。

選世界杯當考場也不是隨便挑的。104 場、48 隊、橫跨美加墨三國時區海拔、每天都有新比分可以驗,而且全民圍觀。

這是 2026 年夏天極少數“普通人也看得懂、技術圈也認賬、連續一個月有得寫”的公開場景。做 Agent 協同 DEMO 如果選個金融風控,老百姓看不懂;選個代碼生成,又被吐槽“又卷 coding benchmark”。世界杯剛好卡在中間。

03

時間點更有意味。

Kimi宣布300 Agent預測世界杯的同一周,6月8日,媒體曝出月之暗面新一輪融資投前估值已跳到300億美元,比一個月前“突破 200 億美元”又上了一個大臺階,半年時間里從43億美元翻了近七倍。

同期的國產大模型資本化地圖是這樣的:

智譜年初登港交所,6月1日又公告要回科創板,募150億人民幣;

MiniMax 緊跟著交了科創板輔導備案,“A+H”雙平臺齊跑;階躍星辰被傳要去港交所遞表,目標估值 120 億美元;

DeepSeek傳出首輪融資規模破 500 億、投后 3500-4000 億人民幣,騰訊出 100 億、寧德時代出 50 億。

“六小虎”的局,從比參數打到比資本化,只用了半年。

這個背景下再看世界杯這波扎堆,Kimi 秀 Agent Swarm、千問秀多模態變量融合、聯想拉 11 家組“人機大戰”綁咪咕流量,每家都在借世界杯講自己那個“AGI 落地”的故事給資本市場聽。

AGI的遠期敘事這兩季度其實在降溫,投資人開始追問 ARR、追問 API 調用、追問企業級部署。這時候有一場全民圍觀的“AI 公開考試”,比發十篇技術博客都管用。

04

所以這場“忽悠”究竟忽悠了誰?

說“忽悠”可能重了,但這事兒確實有兩層觀眾要看清。

一層是看熱鬧的。

揭幕戰千問那三個細節全中,有運氣成分但也有真東西——把海拔、天氣、裁判庫、xG 指標都喂進去,命中率確實能比盲猜高一段。

但單場神準不要外推到整個賽事,Kimi 自己的回測已經把天花板畫好了:50%-60%,打平博彩盤口都費勁。

后面 103 場走完,大概率還是“偶爾驚艷、整體平庸”的曲線。

另一層是看產業的。

“國產 AI 扎堆預測世界杯”這個現象本身,比任何單場比分都值得細品。

2026年6月這個節點,六小虎估值全線沖頂、IPO 路徑分化、AGI 遠期敘事又有點講不動了,大家急需一個成本低、曝光高、還能秀新能力的公域舞臺。世界杯剛好砸過來,不蹭是傻子。

千問蹭的是“多模態+環境變量”的落地感,Kimi 蹭的是“300 Agent 協同”的架構感,聯想蹭的是“天禧生態+FIFA 官方伙伴”的生態感,DeepSeek、豆包、文心一言集體押西班牙奪冠,押的是“我會跟主流共識站在一起”。

表面是看球,底下全是各自的估值劇本。

05

104場踢完,真正值得回看的或許還不是哪家居然猜中了決賽比分,而是哪家能把“Agent 集群+公開可驗推理鏈”這個故事講圓。

這個故事若圓得漂亮,下一輪融資的Term Sheet上就能多一項“已通過大規模社會場景壓力測試”的加持。

足球是圓的,估值是熱的,300個Agent算的既是前者,更是后者。

更多探討,歡迎進讀者群交流!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
首次拿頂薪!CBA這6人等續約,張鎮麟雙豐收,27歲國手輔佐胡金秋

首次拿頂薪!CBA這6人等續約,張鎮麟雙豐收,27歲國手輔佐胡金秋

體壇大事記
2026-06-12 09:12:46
平壤街頭大變樣,外媒發現不對勁,朝鮮正靠著中國偷偷干大事!

平壤街頭大變樣,外媒發現不對勁,朝鮮正靠著中國偷偷干大事!

讓心靈得以棲息
2026-06-12 02:53:32
廣州機場外籍人員滯留:啥都不帶就想入境?網友表態規矩不是擺設

廣州機場外籍人員滯留:啥都不帶就想入境?網友表態規矩不是擺設

安珈使者啊
2026-06-11 11:34:45
安切洛蒂幫大忙!曼聯 3500 萬撿漏雙位置猛將,紅魔這下賺大了

安切洛蒂幫大忙!曼聯 3500 萬撿漏雙位置猛將,紅魔這下賺大了

瀾歸序
2026-06-12 02:24:36
河南“零分女生”蔣多多:因不滿高考制度,在試卷上寫8000字長文

河南“零分女生”蔣多多:因不滿高考制度,在試卷上寫8000字長文

混沌錄
2026-06-09 22:03:13
阿森納再加碼!8600 萬挖 “姆巴佩式” 天才,直接換掉奪冠老臣

阿森納再加碼!8600 萬挖 “姆巴佩式” 天才,直接換掉奪冠老臣

瀾歸序
2026-06-12 03:13:58
第一次對「反骨裝修」產生了敬意!父母不理解,入住后卻超爽

第一次對「反骨裝修」產生了敬意!父母不理解,入住后卻超爽

裝修秀
2026-06-12 10:30:05
全網首份指令級拆解:看華為昇騰 950DT 芯片如何撬動 DeepSeek 75%降價與字節鎖單

全網首份指令級拆解:看華為昇騰 950DT 芯片如何撬動 DeepSeek 75%降價與字節鎖單

AI前線
2026-06-12 18:21:02
終于感受到國企降薪有多狠了

終于感受到國企降薪有多狠了

細說職場
2026-06-12 13:50:35
勇士隊格林在總決賽G4后向尼克斯隊杰倫·布倫森道歉:對不起

勇士隊格林在總決賽G4后向尼克斯隊杰倫·布倫森道歉:對不起

好火子
2026-06-11 22:43:29
18歲女生高考后從張家界墜亡,遺言令人唏噓:若得輪回,永不相逢

18歲女生高考后從張家界墜亡,遺言令人唏噓:若得輪回,永不相逢

第四思維
2025-08-15 09:35:03
大S又被具俊曄帶上熱搜了,她的隱私被具俊曄拿去綜藝里曝光

大S又被具俊曄帶上熱搜了,她的隱私被具俊曄拿去綜藝里曝光

西樓知趣雜談
2026-06-12 21:39:38
損失兩萬億,普京心腹當場掀桌,俄內部矛盾激化,財長硬剛到底!

損失兩萬億,普京心腹當場掀桌,俄內部矛盾激化,財長硬剛到底!

涵豆說娛
2026-06-12 22:11:20
女子因鉀過低心臟驟停,醫生:平時寧愿少吃點肉,也要多吃這5物

女子因鉀過低心臟驟停,醫生:平時寧愿少吃點肉,也要多吃這5物

芹姐說生活
2026-06-10 14:57:32
伊朗武裝部隊發言人:將對美國威脅作出強力回應

伊朗武裝部隊發言人:將對美國威脅作出強力回應

財聯社
2026-06-10 23:28:14
被美國父親拋棄后,他跟母親來到中國,靠自己成明星媽媽的依靠

被美國父親拋棄后,他跟母親來到中國,靠自己成明星媽媽的依靠

青橘罐頭
2026-06-05 14:38:41
吳媽揮淚“斬”無招

吳媽揮淚“斬”無招

銀杏科技
2026-06-11 16:09:22
《火遮眼》五大高手戰力排行榜:“瘋狗”第2,第1名毋庸置疑

《火遮眼》五大高手戰力排行榜:“瘋狗”第2,第1名毋庸置疑

電影聚焦
2026-06-12 17:21:22
事實證明馬杜羅政權垮臺之后,委內瑞拉人確實更有盼頭了

事實證明馬杜羅政權垮臺之后,委內瑞拉人確實更有盼頭了

玲兒愛唱歌
2026-06-04 07:05:24
央視再報!"退衣姐"遭刑拘,抓捕現場曝光:女子耍橫,揚言找關系

央視再報!"退衣姐"遭刑拘,抓捕現場曝光:女子耍橫,揚言找關系

奇思妙想草葉君
2026-06-11 15:11:21
2026-06-12 22:48:49
識局Insight
識局Insight
洞察時勢之變,探尋致勝之道!
326文章數 171關注度
往期回顧 全部

體育要聞

歐洲恐韓?肉德維德?

頭條要聞

男子畢業16年后學位證"無法認證" 高校最新通報

頭條要聞

男子畢業16年后學位證"無法認證" 高校最新通報

娛樂要聞

一天4個瓜,肖戰熱巴最意外

財經要聞

萬億美元順差背后,透露這些信號

科技要聞

鴻蒙7發布,余承東:首個完成AI化改造系統

汽車要聞

標配激光雷達/雙動力可選 昊鉑S600限時售17.99萬起

態度原創

親子
教育
時尚
數碼
公開課

親子要聞

給孩子報個幼兒園還要工資流水?難道這就是傳說中的“因財施教”

教育要聞

沖線·為了在一起 | 積分入學報名的最后一天

夏天別總穿一身白或一身黑!試試一半彩色、一半基礎色,高級亮眼

數碼要聞

狼蛛推出有線磁軸鍵盤F68 RX:星閃悅動雙子星方案,299.15元起

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版