![]()
文|唐辰 圖|網絡資料
多數跟我同齡的球迷,對世界杯的初印象可能都來自2002年。
這一年,世界杯第一次來到亞洲,也是中國男足唯一一次闖入世界杯正賽。同樣,這屆世界杯也是亞洲足球的高光時刻。
我們當時看球,主要靠鄰居家的“黑白”大彩電,跟著他們認球員、認隊服、喊加油。稍微奢侈一點,就是在隔壁大學生帶回來的笨重臺式機上,在撥號上網的聲音中打開百度首頁,點擊導航的“世界杯”入口,感受互聯網帶來的世界杯新奇體驗。
百度也跟球迷們共同見證了伊涅斯塔絕殺、克羅地亞一黑到底、梅西登頂捧杯等無數名場面,也記錄了每一場實時比分、球員生涯數據、各國戰術打法及教練排兵思路,甚至冷門復盤和長期交鋒記錄。
今年,美加墨世界杯的賽場,正在被AI重新改寫。
賽場上,AI技術深度參與賽事運營、裁判視角視頻(VAR)等各個環節;賽場外,陪伴球迷24年的百度,以百度文心的身份再次入場,并在12大主流模型的預測比拼中領跑。
![]()
圖|“世界杯預測人機大戰”戰報
首屆“AI世界杯”開賽,“賽博保羅”登場
每屆世界杯,都會誕生一兩個民間預言家,從“章魚保羅”到“烏賊劉”,場外的“玄學”預測一直是球迷熱議話題。
AI時代的到來,讓“玄學”預測有了“科學”依據。
前兩天,“世界杯預測人機大戰”發布了階段戰報,在前15場比賽預測中,百度文心以46.7%的勝率在國內12款主流模型中排名第一,比足球專家的預測還精準。
尤其是在小組賽科特迪瓦對陣厄瓜多爾的爆冷對局。當DeepSeek、Kimi、智譜清言、MiniMax、商湯小浣熊等7款主流大模型,不約而同地給出了“平局1:1”的預測時,百度文心則給出了非共識但與賽況一致的“1:0”比分,成為唯一精準命中具體比分的模型。
![]()
圖|大模型預測科特迪瓦VS厄瓜多爾比賽結果
需要補充的是,世界杯預測人機大戰,是全球首個由多個AI與全民同場預測的世界杯人機對決。12款主流模型全程跟進104場賽事,全程可追溯、可對比、可核驗,完成一次物理世界大規模實景壓力測試。
當然,階段性領先不等于AI真的成了“預言家”。足球預測的難點,恰恰在于變量復雜、結果不確定。真正值得討論的,是AI能否在動態信息中形成更接近真實比賽的判斷路徑。
也正因此,百度文心的表現有了被拆解的價值。
首先,百度“從小就看世界杯”。回到文章開頭,從2002年的首頁導航出現“世界杯”入口開始,百度就承載全民看球的熱情。當年全網積攢下的海量足球搜索需求,也催生了后續貼吧、知道等球迷交流陣地。
![]()
圖|2002年百度首頁“世界杯”入口
2014年巴西世界杯,百度再度與谷歌、微軟和高盛對世界杯各階段結果進行了預測。從小組賽階段的預測準確率來看,百度以28場正確獲得58.33%的準確率,領先準確率為56.25%的微軟和37.5%的高盛。
而在淘汰賽階段已經進行的12場比賽中,百度和微軟全部預測準確,準確率為100%,而谷歌則預測準確其中的11場,準確率為91.67%。百度通過AI實現了精準的預知,“完勝”微軟、谷歌、高盛。
其次,“百度一下”正在重構AI信任。前段時間“豆包型人格”風靡網絡,這種將AI抽象成某種“糊弄型人格”的解構,實際上是普通用戶對ChatBot式產品投下的不信任票。
其本質是,多數AI工具是“概率性文本生成器”,它們基于海量數據“預測”下一個最可能出現的詞。當它無法給出準確答案時,為了維持對話的流暢性,會自動腦補出一套符合語法邏輯但缺乏事實支撐,或者完全錯誤的內容。
也就是大家常說的,為了滿足用戶的即時情緒,它們會“一本正經的胡說八道”。
這些AI追求極致效率,卻丟掉了最核心的可信度。比如青年演員劉美含在配音工作中,因不確定“坊”字怎么讀,查詢了百度AI、DeepSeek、元寶、豆包、千問5款AI工具,但答案都不一樣。最終,她還是在《新華詞典》中得到確定答案,百度文心給出的fáng(二聲)是正確的。
當能力不再是瓶頸,信任才是AI的天花板。百度從架構和治理上“雙管齊下”,對癥施藥。一方面,百度重塑搜索架構的核心邏輯。它不再讓模型直接“生成”答案,而是在AI API的基礎上疊加了雙層Agent(智能體)。
另外一方面,百度在信源上,通過三道權威性過濾機制——多源比對的全維度身份核驗、先篩再用的多源交叉驗證、以及實時巡檢的自動糾偏兜底,來保障答案的準確性。
這種“左手生成,右手把關”的機制,讓其在低幻覺和數據準確上建立了優勢,讓每一次輸出,都經得起推敲。
第三,文心大模型的硬核實力是底氣。足球的魅力在于不確定性,賽場內外都會有各種突發狀況。球隊實力、球員狀態、戰術打法、天氣環境乃至裁判尺度等,都能左右最終結果。
傳統賽事預測模型、早期AI工具,甚至包括當前不少大模型,大多屬于“靜態計算工具”,僅能依托歷史戰績、球隊排名等固定數據做概率推演,不具備主動拆解問題、動態研判場景的能力。
此次百度文心憑借背后模型文心5.1的強大深度搜索、實時聯網、推理等能力,在世界杯預測場景中,能夠同時覆蓋更多維度的實時信息,如球隊戰術體系、傷病情況、歷史交鋒等動態變化數據,從而預測結果的準確性和穩定性也就越高。
要知道,在LMArena搜索榜中,文心5.1曾以1223分位列全球第四、國內第一。
![]()
圖|文心5.1排名LMArena搜索榜國內第一
“1+1+1>3”,二十多年深耕足壇的海量數據積淀、百度文心與生俱來的可信底色、大模型成熟穩定的推理能力,以及多年數據積累構成的體系化生態能力,讓百度在世界杯預測和低幻覺解答上,有了領先全行業的根基。
AI落地,拼的是長期主義
世界杯是一個很特殊的AI試驗場,既有現實世界的復雜性、隨機性,又具備明確可驗證的結果。預測準不準,不能只靠概念包裝,最終都要回到比賽結果里接受檢驗。
其中最難的地方在于,AI面對的是動態、充滿不確定性的真實世界。考驗的是AI如何通過模型能力、Agent組織調度來完成復雜任務,以及當前AI能力究竟能做到什么、還有哪些邊界。
這個過程就像足球比賽,能不能進球的結果很迷人,但比賽過程一樣能讓人熱血沸騰。
百度文心成為世界杯預測模型榜第一,依托的不只是大模型推理能力,還有百度長期積累下來的搜索能力、數據沉淀和信息校驗機制。
這些能力組合在一起,才讓AI有機會在復雜場景里給出更接近真實比賽的判斷。
從2002年開始承載球迷的信息需求,到后來持續布局搜索、知識體系和AI技術,百度一直在做的是同一件事:把信息組織起來,把復雜問題拆開,再用技術給出更可靠的答案。
比如,和世界杯同期的高考志愿填報,百度文心也走出了差異化、高可信的落地路徑。其中最大的亮點是,百度高考還引入真人專家背書機制,由資深志愿咨詢師對AI生成的報告進行審核認證,這一機制在行業中尚屬首創。
在百度的語境里,AI負責提高效率和覆蓋面,專家經驗則負責兜底和校準,二者在高風險決策場景中形成協同,搭建起完善的信任保障體系。
世界杯預測也好,高考志愿也好,本質上都指向同一個問題:AI怎樣在真實世界里建立信任。
百度文心也讓外界看到:百度AI的硬核實力,不是在追風口,而是深耕行業二十余年,沉淀下來的技術底氣與生態壁壘,并以此來解決真實世界的復雜問題。
我是唐辰同學,關注互聯網科技及AI新經濟。原創內容,未經許可,謝絕轉載。
「唐辰同學」
鈦媒體、36氪、老虎財經熱榜
澎湃新聞2024年最澎湃創作者
老虎財經2024年度優秀專欄
河南日報·頂端新聞2024年度影響力作者
界面新聞優質榜單
老虎財經2024年度優秀專欄
騰訊新聞年度優質熱問答主
2023搜狐新聞年度優質創作者
人人都是產品經理2023年度優秀作者
2023網易新聞年度內容合伙人
界面、36氪、鈦媒體、澎湃、21財經、藍鯨、老虎財經等平臺專欄認證作者
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.