機(jī)器之心編輯部
自從 xAI 解散、大批創(chuàng)始成員離職之后,大家都在關(guān)心一個(gè)問題:Grok 是不是要涼了?
事實(shí)證明,并沒有。就在昨天,馬斯克對(duì)外透露了 Grok 最新模型的進(jìn)展。據(jù)他介紹,參數(shù)量達(dá) 1.5T 的 Grok 基礎(chǔ)模型 V9-Medium 已經(jīng)完成訓(xùn)練,評(píng)估結(jié)果不錯(cuò)。
![]()
目前,模型正在進(jìn)行微調(diào),幾天后將啟動(dòng)強(qiáng)化學(xué)習(xí)階段。按照計(jì)劃,Grok V9-Medium 預(yù)計(jì)會(huì)在兩到三周內(nèi)公開發(fā)布。
馬斯克表示,這將是一次重大升級(jí)。他此前承認(rèn),現(xiàn)在承載所有 Grok 生產(chǎn)流量的、參數(shù)量?jī)H 0.5T 的 v8-small(外部測(cè)試版本 Grok 4.2)在訓(xùn)練數(shù)據(jù)的質(zhì)量、全面性和比例上存在嚴(yán)重缺陷。新的 Grok V9-Medium 不僅將參數(shù)規(guī)模擴(kuò)大到前代的 3 倍,還針對(duì) Blackwell 架構(gòu) GPU 進(jìn)行了專門優(yōu)化。在各項(xiàng)能力上,新模型都會(huì)有顯著提升,尤其是在處理復(fù)雜編程任務(wù)方面。
他還表示,現(xiàn)有的 0.5T 模型計(jì)劃在本年底前開源,適合開發(fā)者本地運(yùn)行、微調(diào)或構(gòu)建應(yīng)用。
![]()
值得一提的是,在后續(xù)的補(bǔ)充訓(xùn)練中,團(tuán)隊(duì)加入了大量來自 Cursor 的數(shù)據(jù),并且這一數(shù)據(jù)源還會(huì)繼續(xù)擴(kuò)充。
這得益于馬斯克豪擲千金的一場(chǎng)收購(gòu)。今年 4 月份,SpaceX 官方宣布,已獲得在今年晚些時(shí)候以 600 億美元收購(gòu) Cursor 的權(quán)利。當(dāng)時(shí),這一舉動(dòng)還讓外界有點(diǎn)困惑,質(zhì)疑 Cursor 是否真的值那么多錢。
但是,也有人認(rèn)為,Cursor 是開發(fā)者實(shí)際使用的 AI 代碼編輯器,數(shù)據(jù)包含真實(shí)的工作流(寫代碼、調(diào)試、迭代、修復(fù) bug 等),是「人類開發(fā)者如何思考」的映射,其價(jià)值非常獨(dú)特。如果 Grok 新模型能夠有效利用這些數(shù)據(jù),那么它將更懂真實(shí)開發(fā)者的工作方式,而非只是 GitHub 上的公開代碼。
![]()
![]()
![]()
除了新模型,馬斯克近期推出的首款編碼智能體 Grok Build 也是備受關(guān)注。你可以把它理解成馬斯克版「Claude Code」—— 一個(gè)直接跑在你命令行里的 AI 程序員,能讀代碼、做計(jì)劃、改文件、跑測(cè)試。
![]()
它比較明顯的差異化設(shè)計(jì)是 Plan Mode(計(jì)劃模式)。你描述需求后,它不會(huì)直接亂改你的代碼,而是先輸出一份結(jié)構(gòu)化的執(zhí)行計(jì)劃,列明每一步要做什么。你可以審閱、修改甚至重寫整個(gè)計(jì)劃,批準(zhǔn)之后它才開始動(dòng)手,所有改動(dòng)以 diff 形式呈現(xiàn)。
![]()
其他關(guān)鍵功能還包括:并行子智能體(最多支持 8 個(gè)子智能體同時(shí)工作)、Arena Mode(讓多個(gè)候選方案內(nèi)部「打擂臺(tái)」)、原生支持 MCP 和 ACP、 支持無界面運(yùn)行等。
目前,Grok Build 在開發(fā)者群體中已經(jīng)收獲了一些好評(píng)。
![]()
![]()
在 Grok Build 之前,終端原生編程智能體這個(gè)賽道已經(jīng)有三個(gè)主要玩家:Anthropic 的 Claude Code、OpenAI 的 Codex CLI、Google 的 Gemini-powered Antigravity。Grok Build 的加入,把這場(chǎng)競(jìng)賽從三強(qiáng)變成了四強(qiáng)。
有意思的是,馬斯克此前公開承認(rèn)過 xAI 在編程能力上落后,所以 Grok Build 的發(fā)布更像是一次「補(bǔ)課式入場(chǎng)」—— 功能架構(gòu)上快速追平對(duì)手,再用 Arena Mode 這種差異化機(jī)制試圖彎道超車。
不過目前的 Grok Build,底層跑的還是 grok-code-fast-1,具有 256K-token 的上下文窗口,在競(jìng)爭(zhēng)對(duì)手面前顯然不夠看的。對(duì)于大型單一代碼庫和長(zhǎng)時(shí)間運(yùn)行的 Agent 會(huì)話,這樣的上下文長(zhǎng)度顯然會(huì)成為瓶頸。
Grok V9-Medium 的 1.5T 參數(shù)和 Cursor 真實(shí)工作流數(shù)據(jù)的注入,有望讓整個(gè)工具擁有更強(qiáng)大的底層模型。
在未來的 Agent 戰(zhàn)局中,馬斯克的團(tuán)隊(duì)能否占據(jù)一席之地?我們拭目以待。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.