无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

Kimi、千問等AI集體押注世界杯??大模型不再比拼聊天,為何集體扮演“懂球佬”?

0
分享至

還有幾個(gè)小時(shí),2026年美加墨世界杯即將打響(北京時(shí)間6月12日凌晨)。而賽場外的AI(人工智能)賽事研判、實(shí)力比拼,早已先行開啟。

6月8日,國產(chǎn)大模型Kimi稱將通過Agent(智能體)集群同時(shí)調(diào)度300個(gè)子Agent,公開預(yù)測104場世界杯賽事,并提出德國隊(duì)或爆冷奪冠。Kimi同時(shí)上線了一場“押注”活動(dòng):1萬億Token(詞元)獎(jiǎng)池,用戶選隊(duì)、球隊(duì)贏了就可以瓜分Token,將體育賽事與AI用戶運(yùn)營深度綁定。

《每日經(jīng)濟(jì)新聞》記者(以下簡稱每經(jīng)記者)注意到,千問也緊隨其后上線了相關(guān)活動(dòng)。每經(jīng)記者實(shí)測發(fā)現(xiàn),豆包、元寶、DeepSeek、文心一言等國產(chǎn)大模型在被問及“2026年世界杯誰會(huì)奪冠”時(shí),多數(shù)預(yù)測答案為“西班牙隊(duì)”,判斷邏輯也高度趨同。

熱鬧之下,Kelly Bench最新數(shù)據(jù)卻顯示,包括GPT等在內(nèi)的頂級(jí)模型在足球賭盤上表現(xiàn)慘淡。

既然AI賭不贏,Kimi、千問等AI大模型為何還要押注世界杯?這背后,實(shí)際上是AI大模型行業(yè)的集體焦慮:當(dāng)寫詩、做題、對話的“內(nèi)卷”走到盡頭,各家廠商急于證明自己能夠理解復(fù)雜、動(dòng)態(tài)、充滿不確定性的現(xiàn)實(shí)世界。


“萬億Token狂歡”:世界杯成AI“用戶拉新戰(zhàn)場”

面對世界杯的巨大流量,一眾品牌早已摩拳擦掌,這一次下場“押注”除了傳統(tǒng)贊助商,還有手握萬億Token的AI大模型們。

6月8日,Kimi發(fā)文稱,將通過Agent集群同時(shí)調(diào)度300個(gè)子Agent,公開預(yù)測104場世界杯賽事,并在每輪賽前公開預(yù)測、賽后復(fù)盤。

Kimi的預(yù)測策略并沒有完全隨大流。它并未否認(rèn)當(dāng)前多數(shù)主流模型將西班牙隊(duì)和法國隊(duì)列為奪冠最大熱門,同樣認(rèn)為兩者的奪冠概率位居前列,但它提出了另一個(gè)關(guān)注點(diǎn):德國隊(duì)的奪冠概率可能被市場低估。


Kimi月之暗面公眾號(hào)

當(dāng)網(wǎng)友們熱議“AI預(yù)測究竟準(zhǔn)不準(zhǔn)”“AI懂不懂球”時(shí),Kimi在文章開頭就坦承“我們的預(yù)測很可能是錯(cuò)的”,并稱希望通過這次嘗試,把分析過程、預(yù)測結(jié)果和賽后復(fù)盤放在同一個(gè)透明框架中。

此外,Kimi還拿出1萬億Token獎(jiǎng)池,用戶預(yù)測冠軍隊(duì)、pick(挑選)的球隊(duì)每次獲勝就可以參與瓜分Token。截至6月11日18時(shí),Kimi App顯示,實(shí)時(shí)排行的隊(duì)伍支持率TOP5分別為阿根廷、法國、西班牙、巴西、葡萄牙,有43.33%的參與用戶選擇了阿根廷。


Kimi“預(yù)測冠軍隊(duì)搶萬億Token”活動(dòng)截圖

那么,Kimi押注世界杯并豪擲萬億Token,究竟是能力展示,還是一次品牌營銷?

長期關(guān)注世界杯等知名賽事的體育咨詢專家、關(guān)鍵之道創(chuàng)始人張慶告訴每經(jīng)記者,Kimi此次活動(dòng)類似于春晚搶紅包、集福瓜分獎(jiǎng)金等互聯(lián)網(wǎng)平臺(tái)常用打法,更像一種營銷活動(dòng)。

“每一屆世界杯都是巨大的流量池,各個(gè)企業(yè)都希望有機(jī)會(huì)參與,獲得更多曝光、引流機(jī)會(huì)。而大模型天然適合做這類數(shù)據(jù)分析和預(yù)測。”張慶向每經(jīng)記者指出,當(dāng)下,大模型競爭激烈,尤其是用戶注意力和使用頻次的競爭,通過世界杯一方面會(huì)加持品牌聲量,另一方面也有利于提升大模型的數(shù)據(jù)用戶積累和活躍度。

深耕人工智能產(chǎn)業(yè)多年的技術(shù)專家王巖(化名)在接受每經(jīng)記者采訪時(shí)坦言,大模型預(yù)測世界杯冠軍,是體育熱點(diǎn)、Token補(bǔ)貼和Agent展示疊加形成的傳播事件。

王巖認(rèn)為,熱點(diǎn)借勢只是入口,真正競爭點(diǎn)在于誰能把抽象模型能力轉(zhuǎn)化為用戶可感知結(jié)果。這意味著,AI大模型企業(yè)在品牌傳播上,不再只發(fā)布參數(shù)、榜單和技術(shù)報(bào)告,轉(zhuǎn)為借高關(guān)注賽事制造用戶體驗(yàn)入口;而在商業(yè)競爭上各家模型爭奪的則是用戶心智、使用頻次、社交傳播和開發(fā)者注意力。

截至目前,多少用戶參與了Kimi“押注”世界杯的活動(dòng)?通過用Agent集群預(yù)測世界杯冠軍,Kimi又將獲得哪些方面的能力提升?Kimi(月之暗面)方面向每經(jīng)記者表示:“暫無回應(yīng)”。

多款國產(chǎn)大模型預(yù)測西班牙隊(duì),精準(zhǔn)共識(shí)還是算法趨同?

不只Kimi,其他AI大模型玩家也試圖“分一杯世界杯的羹”。例如,千問也推出“決戰(zhàn)美加墨,與千問一起預(yù)測,贏萬元現(xiàn)金”的活動(dòng),加入這場AI“秀肌肉”爭奪戰(zhàn)。


千問App截圖

“我前兩天也用DeepSeek、豆包預(yù)測了2026年世界杯冠軍,想對比它們誰分析的有道理,但我看到它們給出的預(yù)測和相關(guān)理由都有明顯局限性。”張慶向每經(jīng)記者分享道。

在國產(chǎn)大模型眼中,誰是“2026年世界杯冠軍隊(duì)伍”?每經(jīng)記者實(shí)測DeepSeek、Kimi、豆包、元寶、千問、文心一言、智譜清言發(fā)現(xiàn):DeepSeek押寶法國隊(duì),Kimi看好阿根廷隊(duì),而千問、豆包、元寶、文心一言、智譜清言5款國產(chǎn)大模型則均預(yù)測支持西班牙隊(duì)。

每款A(yù)I大模型給出的“奪冠隊(duì)伍”理由分析略有不同。值得注意的是,投票西班牙隊(duì)的AI大模型們,其判斷邏輯高度趨同,核心理由之一均為“權(quán)威數(shù)據(jù)模型、機(jī)構(gòu)高度一致看好”。


大模型的預(yù)測到底準(zhǔn)不準(zhǔn)?能否獲得球迷的青睞?

上海財(cái)經(jīng)大學(xué)特聘教授胡延平向每經(jīng)記者表示,AI大模型已經(jīng)初步展露出基于全局動(dòng)態(tài)信息和深度復(fù)雜推理的特定預(yù)測能力,使得各家大模型有基礎(chǔ)、有信心來進(jìn)行預(yù)測,但足球是圓的,預(yù)測的成功率、精準(zhǔn)度方面還有待觀察。

“世界杯預(yù)測無疑是展示模型與智能體水準(zhǔn)的一個(gè)上佳機(jī)會(huì)窗口,不過預(yù)測的效果也是一把雙刃劍。個(gè)人預(yù)期這屆世界杯,水準(zhǔn)最高的預(yù)測模型,成功率能達(dá)到60%~80%左右。”胡延平坦言。

不過,Kelly Bench在2023—2024賽季英格蘭超級(jí)聯(lián)賽的模擬中顯示,其評估的每個(gè)前沿模型在整個(gè)賽季都虧損了,并且許多都經(jīng)歷了破產(chǎn)。其中,Claude Opus 4.7目前以-3.7%的平均投資回報(bào)率領(lǐng)先;有4個(gè)模型避免了所有的破產(chǎn)。


Kelly Bench截圖

“AI更多是一個(gè)輔助工具,基于戰(zhàn)隊(duì)歷史戰(zhàn)績、世界杯排名、賠率、國際足聯(lián)等大量數(shù)據(jù)的多維度預(yù)測,AI大模型呈現(xiàn)了客觀數(shù)據(jù)統(tǒng)計(jì),所以作為參考工具還是有意義的,但不會(huì)完全依賴它的結(jié)果。”一位長期關(guān)注世界杯的資深球迷告訴每經(jīng)記者。

在上述球迷看來,相比大模型的預(yù)測,每個(gè)球迷都更青睞自己喜歡的球隊(duì),喜好也會(huì)占一大部分判斷,而且越到?jīng)Q賽越是球員臨場發(fā)揮和心理上的博弈,不確定性太多了。


不再比誰更會(huì)“聊”,押注世界杯背后AI們集體想拼什么?

當(dāng)Kimi拿出萬億Token、調(diào)動(dòng)300個(gè)子Agent對世界杯賽事進(jìn)行并行預(yù)測,當(dāng)千問、豆包、元寶爭先恐后地給出各自的奪冠熱門隊(duì)伍時(shí),這場看似娛樂化的“AI押注戰(zhàn)”背后,AI大模型廠商究竟想“秀”什么?又在集體“卷”什么?

“本輪大模型預(yù)測世界杯冠軍,是生成式AI從問答工具走向公共事件運(yùn)營的典型樣本。”王巖向每經(jīng)記者指出,公眾看到的是冠軍預(yù)測,企業(yè)展示的則是Agent協(xié)同、長上下文處理、實(shí)時(shí)檢索、概率解釋和高并發(fā)服務(wù)能力,商業(yè)上爭奪的則是用戶時(shí)長、付費(fèi)轉(zhuǎn)化和資本敘事。


Kimi月之暗面公眾號(hào)

當(dāng)下,AI大模型的競爭早已不局限于單純的參數(shù)榜單,而是從“會(huì)聊天”轉(zhuǎn)向“能辦事”,從“比模型”轉(zhuǎn)向“比場景”。然而,《Build for the Future 2025》全球研究顯示,在調(diào)研全球1250多家企業(yè)后,僅5%的公司實(shí)現(xiàn)了AI價(jià)值的規(guī)模化應(yīng)用。Gartner數(shù)據(jù)也顯示,截至2025年底,嵌入真正AI Agent的企業(yè)應(yīng)用占比不足5%。

胡延平觀察到,大模型和智能體正從對話走向任務(wù),從預(yù)訓(xùn)練走向持續(xù)學(xué)習(xí),從數(shù)據(jù)語料走向持續(xù)多維的現(xiàn)實(shí)感知。“預(yù)測世界杯這類探索項(xiàng)目會(huì)加速這個(gè)進(jìn)化過程。未來行動(dòng)智能體所需要的能力體系,也是在走向‘感知-交互-決策-協(xié)同’這個(gè)方向。”

不過,王巖坦言,世界杯預(yù)測可以成為Agent能力的公開壓力測試,但不能自動(dòng)證明Agent能力提升,大模型在這場押注中訓(xùn)練和檢驗(yàn)的是長任務(wù)組織、概率校準(zhǔn)和用戶交互能力。

“Kimi的300個(gè)Agent代表分析覆蓋面增加,不直接代表預(yù)測準(zhǔn)確率提升。相關(guān)Agent任務(wù)Token消耗研究顯示,同一任務(wù)的Token消耗可相差幾十倍,更多Token并不必然帶來更高準(zhǔn)確率。同樣,相關(guān)Prediction Arena研究也顯示,多個(gè)前沿模型在Kalshi真實(shí)預(yù)測市場57天交易測試中最終收益為-16.0%至-30.8%,研究量與結(jié)果沒有相關(guān)性。”王巖向每經(jīng)記者進(jìn)一步分析道。

正如王巖所言:“當(dāng)前Agent的最大缺口,正在從‘能否給出合理計(jì)劃’轉(zhuǎn)向‘能否穩(wěn)定完成長周期真實(shí)任務(wù)’。”這意味著,誰能率先落地“實(shí)戰(zhàn)能力”,誰就將有機(jī)會(huì)在愈發(fā)激烈的爭奪賽中脫穎而出。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
河南有一座“不南不北不東不西”的城市,還是宜居城市天花板?

河南有一座“不南不北不東不西”的城市,還是宜居城市天花板?

劉小順
2026-06-13 13:44:21
薩提亞診所里的驚人發(fā)現(xiàn):孩子從不會(huì)感激你拼命賺錢,也不會(huì)記你帶他見過多大的世面,唯獨(dú)這兩樣?xùn)|西,會(huì)刻進(jìn)骨子里跟著他走完這輩子

薩提亞診所里的驚人發(fā)現(xiàn):孩子從不會(huì)感激你拼命賺錢,也不會(huì)記你帶他見過多大的世面,唯獨(dú)這兩樣?xùn)|西,會(huì)刻進(jìn)骨子里跟著他走完這輩子

心理觀察局
2026-05-17 09:48:12
讓女明星排隊(duì)道歉,是內(nèi)娛的恥辱

讓女明星排隊(duì)道歉,是內(nèi)娛的恥辱

她刊
2026-06-12 20:21:20
越扒越驚心!你根本想象不到釋永信在少林寺的奢靡生活有多離譜?

越扒越驚心!你根本想象不到釋永信在少林寺的奢靡生活有多離譜?

清歡百味
2026-06-13 09:34:33
到手的金飯碗要碎?王毅外長專機(jī)將至,蒙古國終于放下了身段

到手的金飯碗要碎?王毅外長專機(jī)將至,蒙古國終于放下了身段

帶你領(lǐng)略快樂真諦
2026-06-14 00:48:32
河南某大佬現(xiàn)身街頭,800多萬勞斯萊斯配99999,邁巴赫車主也羨慕

河南某大佬現(xiàn)身街頭,800多萬勞斯萊斯配99999,邁巴赫車主也羨慕

總李談車
2026-06-13 13:12:57
世界杯比賽前瞻|卡塔爾0-5瑞士:軍刀起處,駱駝無生路?

世界杯比賽前瞻|卡塔爾0-5瑞士:軍刀起處,駱駝無生路?

體育世界
2026-06-13 16:11:27
一個(gè)家庭最大的災(zāi)難是:夫妻到了六十歲,還處于這3種狀態(tài)

一個(gè)家庭最大的災(zāi)難是:夫妻到了六十歲,還處于這3種狀態(tài)

藝鑒在線
2026-06-14 01:02:46
2909億身家有何用?97歲的李嘉誠無力回天,兩個(gè)60歲兒子已成心病

2909億身家有何用?97歲的李嘉誠無力回天,兩個(gè)60歲兒子已成心病

阿尢說歷史
2026-04-17 04:13:15
預(yù)言:到2035年的中國,很有可能是這樣的,趕緊一起來看看

預(yù)言:到2035年的中國,很有可能是這樣的,趕緊一起來看看

洛川融媒科技
2026-05-31 13:00:31
6月13日起央八湖南衛(wèi)視四劇連播,你最想追哪部?

6月13日起央八湖南衛(wèi)視四劇連播,你最想追哪部?

情感大頭說說
2026-06-13 18:56:47
虎撲熱帖引圍觀:夏天出門穿不穿絲?

虎撲熱帖引圍觀:夏天出門穿不穿絲?

時(shí)光慢旅人
2026-06-14 01:02:39
曝美團(tuán)大裁員:連外賣基本盤都動(dòng)刀 網(wǎng)友:后悔當(dāng)初編壓榨算法嗎?

曝美團(tuán)大裁員:連外賣基本盤都動(dòng)刀 網(wǎng)友:后悔當(dāng)初編壓榨算法嗎?

火鍋局
2026-06-12 11:18:14
悲哀!48歲媽媽因管教12歲女兒發(fā)生爭執(zhí),母女倆同日先后跳樓身亡

悲哀!48歲媽媽因管教12歲女兒發(fā)生爭執(zhí),母女倆同日先后跳樓身亡

青梅侃史啊
2026-06-12 22:00:42
中國“最弱”一線城市?好多城市想超越它,被稱為一線城市守門員

中國“最弱”一線城市?好多城市想超越它,被稱為一線城市守門員

劉小順
2026-06-12 19:38:47
2026美加墨世界杯誕生首個(gè)烏龍,美國隊(duì)小組賽首戰(zhàn)領(lǐng)先巴拉圭

2026美加墨世界杯誕生首個(gè)烏龍,美國隊(duì)小組賽首戰(zhàn)領(lǐng)先巴拉圭

大象新聞
2026-06-13 09:46:01
47歲帕公主離世!生母頌妃近況曝光,母女倆皆是苦命之人

47歲帕公主離世!生母頌妃近況曝光,母女倆皆是苦命之人

書慧我心
2026-06-13 10:29:11
如果中年失業(yè)了,那就別瞎找工作:建議去干能做一輩子的生意

如果中年失業(yè)了,那就別瞎找工作:建議去干能做一輩子的生意

有態(tài)度網(wǎng)友19yLNx
2026-06-12 23:20:43
國際足聯(lián)也急了!原來除了中國,還有這么多國家不給世界杯買單了

國際足聯(lián)也急了!原來除了中國,還有這么多國家不給世界杯買單了

曉帝愛八卦
2026-05-06 14:15:23
再貴也要吃!端午前正大量上市,潤肺排毒還殺菌,錯(cuò)過真可惜了

再貴也要吃!端午前正大量上市,潤肺排毒還殺菌,錯(cuò)過真可惜了

江江食研社
2026-06-11 15:50:13
2026-06-14 04:40:49
每日經(jīng)濟(jì)新聞 incentive-icons
每日經(jīng)濟(jì)新聞
中國主流財(cái)經(jīng)全媒體平臺(tái)。
1591337文章數(shù) 2726565關(guān)注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

頭條要聞

特朗普:美伊協(xié)議計(jì)劃周日簽署 霍爾木茲海峽立即開放

頭條要聞

特朗普:美伊協(xié)議計(jì)劃周日簽署 霍爾木茲海峽立即開放

體育要聞

美國4比1巴拉圭:這統(tǒng)治力真是美國隊(duì)?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋?cè)W(wǎng)!

財(cái)經(jīng)要聞

梁文鋒向左,楊植麟向右

汽車要聞

深藍(lán)S07華為乾崑激光版增程車型上市 限時(shí)15.49萬元起

態(tài)度原創(chuàng)

游戲
時(shí)尚
健康
數(shù)碼
房產(chǎn)

LPL淘汰賽:就差一點(diǎn),今天無奇跡!BLG五局戰(zhàn)勝WE,決賽見

夏天穿衣要杜絕土氣感!試試精致的小香風(fēng),優(yōu)雅與俏皮并存

老人、小孩、孕婦,吃粽子有啥風(fēng)險(xiǎn)

數(shù)碼要聞

綠聯(lián)推出DXP 6800/8800 Ultra NAS:雙萬兆雙雷電4,PCIe擴(kuò)展

房產(chǎn)要聞

海南最賺錢行業(yè)曝光!最快4年半,海口全款買三房!

無障礙瀏覽 進(jìn)入關(guān)懷版