馬斯克宣布一月連發(fā)兩款萬億模型,并直接給狂飆的Grok 5蓋上了AGI的終極印章。
4月底的AI圈,被一條推文炸開了鍋。
馬斯克在X平臺上寫道:“Grok 5就是AGI。”沒有“可能”,沒有“也許”,甚至沒有附上一份技術(shù)報(bào)告。這很馬斯克——用最少的文字,撬動最大的爭論。
![]()
緊隨其后的,是xAI一份讓整個硅谷側(cè)目的路線圖:一個月內(nèi),Grok 4.3 Beta(0.5萬億參數(shù))、Grok 4.4(1萬億參數(shù))、Grok 4.5(1.5萬億參數(shù))將接連登場。而真正的“怪獸”Grok 5,正在孟菲斯的Colossus 2超級計(jì)算集群上以6萬億參數(shù)的規(guī)模訓(xùn)練。
當(dāng)其他AI實(shí)驗(yàn)室還在按季度發(fā)布更新時(shí),馬斯克選擇了按周推進(jìn)。這場豪賭的核心問題很簡單:參數(shù)規(guī)模的指數(shù)級增長,是否足以跨越AGI的門檻?
參數(shù)競賽的極限游戲:從0.5T到6T,xAI按下加速鍵
先梳理一下xAI公布的時(shí)間表。
4月17日,Grok 4.3 Beta版悄然上線。沒有發(fā)布會,沒有官方博客——這款0.5萬億參數(shù)的模型被馬斯克稱為“早期測試版”。它已經(jīng)能將復(fù)雜的神經(jīng)科學(xué)論文自動轉(zhuǎn)化為PPT,Office插件也在開發(fā)中。但馬斯克在第二天特意“澄清”:真正的1萬億參數(shù)完整版還在路上。
5月初,Grok 4.4將登場,參數(shù)量翻倍至1萬億。按照xAI的預(yù)期,編程能力、長上下文處理將迎來躍升。僅僅三周后,Grok 4.5帶著1.5萬億參數(shù)接踵而至。一個月之內(nèi),從0.5T到1.5T,這種參數(shù)密度的提升速度在AI發(fā)展史上尚無先例。
但這只是熱身。
正在訓(xùn)練的Grok 5,參數(shù)量達(dá)到6萬億。支撐它的Colossus 2超算集群,部署了55萬塊NVIDIA GB200/GB300 GPU,總功率高達(dá)2吉瓦——足以供給一座150萬人口的城市。更值得關(guān)注的是,xAI在同一集群中同時(shí)訓(xùn)練7個不同規(guī)模的模型,參數(shù)量覆蓋1T、1.5T、6T乃至10T。這意味著,Grok 5并非孤立的旗艦,而是一整套模型矩陣中的一環(huán)。
在Baron Capital投資大會上,馬斯克曾給出一個具體數(shù)字:他認(rèn)為Grok 5達(dá)到AGI的概率是“10%,并且在持續(xù)上升”。如今他在X上將概率表述直接替換為肯定判斷——“Grok 5就是AGI”。
這種從概率到斷言的轉(zhuǎn)變,究竟是營銷話術(shù),還是內(nèi)部測試中看到了某種質(zhì)變的跡象?xAI沒有提供更多證據(jù)。但有一點(diǎn)可以確定:參數(shù)規(guī)模正在以前所未有的速度膨脹,而AGI的定義本身,也在這場競賽中變得愈加模糊。
AGI的岔路口:參數(shù)堆疊不是萬能鑰匙,xAI卻有三張底牌
并不是所有人都買賬。
前特斯拉AI高級總監(jiān)、OpenAI聯(lián)合創(chuàng)始人Andrej Karpathy近期明確表示,AGI仍然需要十年時(shí)間,遠(yuǎn)非某些行業(yè)領(lǐng)袖宣稱的那樣“近在眼前”。越來越多的研究者指出,從大語言模型到通用智能,參數(shù)堆疊無法逾越的根本性鴻溝在于:理解、推理、規(guī)劃能力并不隨參數(shù)線性增長。
一個直觀的類比:給汽車裝更多輪子,不會讓它飛起來。規(guī)模擴(kuò)展能提升模型的記憶容量和模式匹配能力,但真正的智能需要因果推理、常識抽象、目標(biāo)導(dǎo)向的行為生成——這些能力是否會在某個參數(shù)量級上“涌現(xiàn)”,目前沒有任何理論保證。
但xAI確實(shí)手握幾張其他公司難以復(fù)制的牌。
第一張牌:X平臺的實(shí)時(shí)數(shù)據(jù)流。 每天6800萬條推文,涵蓋全球事件、輿論動態(tài)、專業(yè)知識討論。相比于經(jīng)過清洗和標(biāo)注的靜態(tài)數(shù)據(jù)集,X的實(shí)時(shí)信息流具有天然的多樣性、真實(shí)性和時(shí)效性。對于訓(xùn)練一個需要理解人類實(shí)時(shí)語境的模型而言,這是OpenAI和Anthropic無法獲得的資源。
第二張牌:特斯拉車隊(duì)的物理世界數(shù)據(jù)。數(shù)百萬輛特斯拉汽車每天采集的真實(shí)駕駛場景——路況、天氣、行人行為、交通標(biāo)志——構(gòu)成了一個龐大的物理世界認(rèn)知圖譜。這不僅是訓(xùn)練自動駕駛的基礎(chǔ),更是邁向具身智能的關(guān)鍵跳板。一個只讀過文本的模型,和另一個同時(shí)“看過”數(shù)億公里真實(shí)道路的模型,對物理規(guī)律的理解深度不可同日而語。
第三張牌:SpaceX基因的工程執(zhí)行力。 122天建成一座吉瓦級超算集群——這個速度在硅谷任何其他公司都難以想象。當(dāng)競爭對手還在進(jìn)行跨部門協(xié)調(diào)和預(yù)算審批時(shí),馬斯克的團(tuán)隊(duì)已經(jīng)在施工了。工程速度本身就是一種核心競爭力,尤其是在算力軍備競賽階段。
然而,比參數(shù)擴(kuò)展更值得關(guān)注的,是xAI正在推進(jìn)的多智能體架構(gòu)演進(jìn)。從Grok 4.20的4智能體協(xié)作,到Grok 4.20 Heavy的16智能體系統(tǒng),再到Grok 5預(yù)期的動態(tài)智能體生成和跨領(lǐng)域?qū)I(yè)化——這條技術(shù)路線可能比單純的參數(shù)堆疊更接近AGI的本質(zhì)。一個由“程序員”智能體、“文案”智能體、“分析師”智能體組成的AI團(tuán)隊(duì),通過分工與協(xié)作完成復(fù)雜任務(wù),這已經(jīng)不再是單一模型的“規(guī)模游戲”,而是系統(tǒng)架構(gòu)層面的進(jìn)化。
AI世界大戰(zhàn):四大實(shí)驗(yàn)室競速,AGI門檻何時(shí)被跨過?
xAI并非這場競賽中的唯一玩家。
5月,AI行業(yè)將迎來一場密集的對決。馬斯克的Grok 4.4和4.5接連出爐;OpenAI很可能祭出GPT-5.5作為回?fù)簦籄nthropic的Opus 4.7已經(jīng)在編程賽道(SWE-bench Verified)上跑出93.9%的得分——一個半年前所有人都認(rèn)為不可能的數(shù)字。
開源陣營也在迎頭趕上。GLM-5.1已經(jīng)在某些基準(zhǔn)測試中超越了閉源前沿模型。如果開源模型能夠以更低的成本逼近甚至超過閉源模型,整個行業(yè)的商業(yè)邏輯將被重寫。
這場競賽的本質(zhì),早已不是簡單的參數(shù)比較。真正的衡量標(biāo)準(zhǔn)是:模型能否在未知任務(wù)上表現(xiàn)出人類水平的適應(yīng)性和泛化能力。編程能力的突破(如Claude在SWE-bench上的表現(xiàn))之所以被廣泛關(guān)注,恰恰因?yàn)樗砹艘环N“執(zhí)行復(fù)雜、多步驟、真實(shí)世界任務(wù)”的能力,而非單純的文本生成。
馬斯克將AGI的賭注押在Grok 5上,但行業(yè)對AGI的定義本身就沒有共識。如果AGI意味著“在大多數(shù)經(jīng)濟(jì)價(jià)值工作中超越人類”,那么參數(shù)擴(kuò)展或許真的能在未來一兩年內(nèi)接近這一目標(biāo)。如果AGI意味著“具備人類水平的通用推理和自主學(xué)習(xí)能力”,那么即使6萬億參數(shù)也可能只是起點(diǎn)。
站在2025年4月的時(shí)間節(jié)點(diǎn)上,我們可以清晰地看到兩條并行的敘事線。
一條是馬斯克式的“規(guī)模信仰”:更大的模型、更多的數(shù)據(jù)、更強(qiáng)的算力,終將觸發(fā)智能的質(zhì)變。另一條是批評者們的“結(jié)構(gòu)主義”:現(xiàn)有架構(gòu)存在天花板,參數(shù)堆疊無法帶來真正的理解與推理。
誰對誰錯,只有時(shí)間能給出答案。但有一個事實(shí)無法否認(rèn):我們正處在AI歷史上最瘋狂的實(shí)驗(yàn)周期中。每一天都可能是“之前”和“之后”的分界線。
當(dāng)馬斯克說“Grok 5就是AGI”時(shí),他可能是在放煙霧彈,也可能是在陳述一個即將到來的事實(shí)。但無論結(jié)果如何,這場豪賭已經(jīng)將整個行業(yè)推向了一個前所未有的加速軌道。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.