![]()
文 | 闌夕
美加墨世界杯就要打響了,臨開賽前,國產模型Kimi整了個大活兒:
它要一口氣調用包含300個子Agent的集群,從戰術、球員、傷病、賽程、歷史、輿情、天氣、心理、賠率變動、專家觀點等多個維度并行研究104場世界杯比賽,并公開預測結果。基于當前的信息,Kimi預測可能要奪冠的是:
德國。
![]()
聊這個我可就不困了,作為一個戰績可查的資深??中國體彩消費者,我對Kimi敢于立Flag的勇氣,是深感尊重的。
要知道,從盤口來看,德國的賠率(9.5)并不低,在所有球隊里排在第7位,所以Kimi并沒有按照最大概率——也就是最穩妥的方案——去做判斷,是真有自己的想法的。
當然,即便是選奪冠熱門法國、西班牙,賠率(4.5)的風險仍然很高,說白了,早在開幕前就暴論最后的冠軍,本身就是一件吃力不討好的事情。
所以我才要狠夸Kimi的「敞亮」,不光是冠軍,Kimi還要對全部104場比賽全都做出公開預測,包括賽后核驗以及復盤,一場不落。
這就更硬核了,完全不怕打臉吶??(注意,該預測非投注建議、非投資建議、非收益承諾。)
應該無須贅述吧,Kimi這么興師動眾的「Predict In Public」,并非是為了真的去當那個洞悉神諭的預言家,作為一家注重審美和趣味大模型廠商,它是在用一種奇觀的形式,向世界演示AI的能力邊界和局限性。
嚴格來說,Kimi并沒有篤信德國是最有希望奪得這屆世界杯的參賽隊伍,而是認為德國的市場定價在強隊里過于低了。
在使用了8種數學模型——包括SLO評級、Sixon-Coles泊松、XGBoost機器學習、Opta蒙特卡洛模擬等等——對48支球隊逐一分析之后,Kimi得出了這么一個結論:
德國的模型預測概率,和市場賠率存在最高的偏差值,達到+3.6pp。
![]()
什么意思呢?
就是在判斷德國是否有機會捧起大力神杯這件事情上,模型比市場多預測了3.6個百分點,所以認定德國,在理性上是回報確定性最高的選擇。
就很像量化投資的策略,一家公司好不好并不重要,重要的是它有沒有被市場正確定價,一家被高估的好公司,和一家被低估的差公司,顯然后者更有買入潛力。
不同的是,量化機構需要雇傭一大票分析師,以及重金采購商業軟件,而Kimi靠著幾百個Agent晝夜不息的連軸轉,自個兒就把整個項目給做完了。
如果不是親眼所見,我是萬萬不敢相信的。
所有的細節,都填在了Kimi同時發布的預測報告里,完整版PDF超過200頁,量大管飽。
我幫你們看了??好吧,是Kimi K2.6幫我幫你們這份報告的重點整理了出來,非常有啟發性。
報告的作者,是Agent Swarm(集群),這不是一個人名,Kimi把協調多個智能體開會干活的能力,做此稱呼。
以及,多個智能體的意思,是上限可達300個。
![]()
Agent Swarm用來搭建這次預測工程的組織架構,很有意思:
最上層,是戰略組,包括總指揮、質檢員和核驗者,負責最開始的分配資源以及最后的驗收結果;
中間層,是戰術組,這個就比較豐富了,有研究賽程發展的,有歸納歷史規律的,有分開算小組賽和淘汰賽的,有對黑馬球隊留心眼的,整個團隊分工明確;
最下層,是戰場組,主要清洗海量數據,比如球員的傷病、球隊的特點、比賽的天氣、FIFA的排名等等;
甚至連反方的「工位」都被預留了,專門尋找反例和翻車風險,交叉對比各種沖突,直到得出大多數Agent都認可的結論。
是不是很有五臟俱全的味道?
特別嚴謹的是,Kimi還對2010年-2022年的4屆世界杯做了回溯演練,在只使用目標年份之前的數據訓練這個前提下,用這套協作模式進行預測,然后疊加實際賽果,反思自己犯了哪些錯誤。
有句話真不知道當講不當講:硅基生命的態度,可能超過了90%的碳基生物??
話說回來,預測世界杯,本質上是一門玄學,非人力所能及的不確定性太高了,也并不存在某種原理,只要算準了,就一定能夠保證正確。
所以完全不能排除的畫面也包括:一頓操作猛如虎,一看戰績零杠五。
![]()
但俗話說得好,過程好,結果不會差,為結果而忽視過程,結果反而好不起來。
醉翁之意不在酒,在乎山水之間也,而Kimi的山水之間,就是要告訴大家,Vibe Working的時代已經到來了。
根據Gartner的統計口徑,全球大概有10億-13億知識工作者,占到整個勞動力市場的30%左右,在發達國家甚至能夠達到40%以上的占比。
所謂的知識工作,泛指主要通過計算機設備處理各種信息的崗位,包括但不限于寫代碼、做分析、出報告、設計系統等等,其中的寫代碼部分,我們都知道已經被Vibe Coding給穩穩接住了。
但畢竟編程只是其中的一個子集,在整個知識工作的范疇里,AI的滲透受阻可以歸咎于很多原因,比如不夠標準化,或是交付難以驗證,但在基座模型的飛速進步下,困難的保質期都不長。
大力出奇跡,一桿可清臺。
Coding依然很重要,或者說,世界是可被編碼的,這本身就是AI得以成立的底層邏輯。
無論是圖靈堅信思考是一個工程問題、而非哲學家心中的靈魂之類,還是香農在上世紀五十年代就用人類受試者去玩猜字游戲、用以論證智能始于對信息的預測,所有的歷史研究和前沿走向都并軌于同一個共識:
凡事皆可壓縮。
當人類知識的總和被壓縮到了極致,就能制造一個通曉萬物的機器出來,它能通過模擬已經存在過的和還沒有發生的所有過程,去得到每一項任務的最優解。
這聽起來很科幻,也足以引起事關自由意志的思辨,但我們正確切的走在這條路上,大模型的運行原理就是預測下一個詞元,這是眾所周知的,香農的遺憾在于他買不到英偉達的GPU。
所以能夠理解Kimi為什么要預測世界杯了么?
面對這種長鏈路、隨機性、沒有標準答案的復雜目標,如果AI也能完成媲美甚至優于人類表現的任務,那么它在通用性層面的可用,就不再存疑了。
事實上,Kimi已經把同時調度300個Agent分工合作的能力,塞進了客戶端里,在新增的Kimi Work模式下,模型已經實現了把數據源、瀏覽器、本地文件、Excel、PPT、Word 等工作環境串起來,讓那300個Agent住進用戶的電腦里。
![]()
而Kimi Work的內核,還是源自Kimi Code編碼助手的能力,程序員繼續用Coding Agent生成代碼,而更廣義的知識工作者,則可啟用Kimi Work,在桌面上指揮 AI 做調研、分析、自動化和交付物。
2010年的世界杯,數以億計的人類在圍觀一條名叫保羅的章魚,用它黏糊糊的觸手從閉合的箱子里選擇比賽贏家。
16年后,開箱的角色變成了連生物都算不上的AI,從克蘇魯的古神符號,到后現代的賽博朋克,如此交替,本身就充滿了隱喻。
隱喻那種不可言說的混沌,讓渡給了可被測量的科技。
這讓我想起在自己投入了無數個通宵的游戲「文明6」里,解鎖信息時代的科技之后,會出現在屏幕上的那句話外音;
「現在天上有31顆衛星在地球上空環繞,不為別的,就為了告訴你便利店怎么走。」
取之于硅,用之于碳,這才是AI正確的打開方式,對不對?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.