无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

馬斯克說明年Q1,唐杰說用不了那么久,誰在悶頭做中國的Mythos?

0
分享至



機器之心發(fā)布

Mythos 被禁了。



Anthropic 那個讓硅谷集體沉默的模型,美國政府不讓賣給中國。X 平臺上有人直接問馬斯克:中國什么時候能追上?Musk 說九個月。智譜首席科學家唐杰回了一句:用不了那么久。



GLM-5.2 剛發(fā)布,評測全面逼近前沿,基座差距在肉眼可見地收窄。唐杰的底氣大概率來自于此。但我們更關心另一個問題:追上 Mythos,光靠基座迭代夠不夠?

不夠。OpenAI 從 GPT-4 到 o1,核心增量來自后訓練。Anthropic 的 Constitutional AI,本質是后訓練方法論。基座決定上限,后訓練決定你能摸到上限的多少。事實上,GLM 從 5.1 到 5.2 的能力跨越,本身就是后訓練的勝利。

而這恰好引出一個關鍵事實:恰好兩周前,機器之心報道了一家專門做大模型后訓練的團隊:Mind Lab,隸屬于 Mindverse(心洲科技)。從 HuggingFace 的數據來看,他們目前是全球唯一一家完成了 GLM-5.1/5.2 系列后訓練的外部團隊。 他們基于 GLM-5.1 后訓練的模型 Macaron-V1-Preview,評測結果已經超過了基座本身,提分幅度不小。

這意味著什么?如果 GLM 基座能力繼續(xù)往上走,Mind Lab 在后訓練上已經驗證過的提分能力再疊加上去,通過后訓練路線追平 Mythos 級別的智能,Mind Lab 同樣有機會。

但這次看到唐杰那條回帖,我們重新去看了一眼 GLM 的后訓練生態(tài)。發(fā)現(xiàn)的事情挺振奮人心的。

去 HuggingFace 上翻了一圈

從 HuggingFace 上看來,Mind Lab 目前仍然是全球唯一一家,完成了 GLM-5.1/5.2 系列模型后訓練的實驗室。 GLM-5.1 的 finetune 和 adapter 分類下,翻來翻去就是他們一家做完了全流程并公開發(fā)布。



一個有意思的細節(jié):HuggingFace 上 GLM-5.1 后訓練模型下載量排第四的,其實是另一個團隊(inferencerlabs)對 Macaron 做量化后可以直接運行在 Mac 上版本。別人的模型已經在被二次加工和傳播了,生態(tài)影響力在自發(fā)形成。



GLM-5.2 發(fā)布之后我們又去看了,Mind Lab 同樣是第一個宣布支持并啟動后訓練的。值得一提的是,GLM-5.2 引入了一個全新的架構設計 IndexCache,這是該版本區(qū)別于 5.1 的核心技術變化之一。Mind Lab 已經完成了對 IndexCache 的完整適配,并將方案直接開源了出來。新基座剛發(fā)布,核心新架構的訓練支持就已經到位并開源,這個響應速度本身就說明問題。更早之前,他們在技術博客里就披露了對 DSA(動態(tài)稀疏注意力)和 MTP(多 token 預測)這些 700B 以上模型特有架構模塊的適配方案。

從架構適配到訓練框架再到開源發(fā)布,每次 GLM 出新版,Mind Lab 跟進的速度都是按天算的,這不是臨時抱佛腳能做到的事。



后訓練提了多少分

上一輪的成績單已經擺在那里了。

先前基于 GLM-5.1 的后訓練,Mind Lab 的提分幅度相當可觀:PinchBench 從 GLM-5.1 基座的 76.6 分提升到 Macaron-V1-Preview 的 92.5 分,漲了 15.9 分,相對提升約 20.8%;Terminal-Bench 2.0 從 63.5 分提升到 67.4 分,漲了 3.9 分。這個幅度說明一件事:GLM 系列的基座能力遠沒有被充分釋放,后訓練還有很大的提分空間。



現(xiàn)在他們搬到了 GLM-5.2 上。5.2 比 5.1 基座能力有顯著躍升,后訓練能釋放的空間也跟著變大。

GLM5.1 到 5.2 的跨越,本質上就是后訓練的勝利。而 Mind Lab 是目前唯一具備 GLM5.1/5.2 后訓練能力的外部團隊,而且是目前唯一具備 GLM5 系列后訓練能力的外部團隊。智譜的基座能力還在持續(xù)往上走,年底大概率會發(fā)布新一代模型。到那個時候,基座本身的能力跨了一大步,Mind Lab 在后訓練上積累的提分能力再疊加上去,邏輯鏈條是連續(xù)的,Mind Lab 同樣有機會追平 Mythos 同等水平的智能。

而且有一點容易被忽視:做后訓練的團隊,迭代周期天然比做基座的短。基座訓練動輒幾個月,后訓練的周期是按周算的。新基座一出來,后訓練團隊理論上可以比基座團隊自己更快地把能力釋放出來。在「從智譜新基座到 Mythos 級別產品」這段路上,Mind Lab 的節(jié)奏可能比你想象的快,因為他們只押這一件事。

除了智譜自己,只有他們

既然后訓練價值這么大,為什么做的人這么少?

門檻不低。三個能力缺一不可:

對基座架構的深度理解。GLM 使用的 MTP 和 DSA 都是在 700B 以上模型才用到的技術,indexcache 更是支持 GLM5.2 訓練到 1M 上下文的關鍵技術,不是拿開源訓練框架直接跑得通的。

高質量訓練數據的構造能力。后訓練和預訓練用的數據完全不同,不是規(guī)模取勝,而是質量和結構取勝。這部分的 know-how 在行業(yè)里高度不透明。

工程基礎設施。大模型后訓練同樣吃算力,同樣需要精細到每個超參數的訓練策略管理。就在最近,Mind Lab 直接開源了一套支持 GLM-5.1 和 5.2 的 Megatron 訓練框架。 這意味著他們不只是在現(xiàn)有框架上做適配,而是從訓練基礎設施層面把 GLM 系列的后訓練鏈路打通了,而這個工程量本身就是一道很高的門檻。

GLM-5.1 發(fā)布到現(xiàn)在不短了,HuggingFace 上做完后訓練并開源的只有一家。除了智譜自己以外,Mind Lab 是目前唯一展現(xiàn)出有能力在 GLM 最新基座上做后訓練的外部團隊。 這個位置本身就是稀缺的。



九個月夠不夠

Mythos 被禁,中國想用上同等能力只能靠自研。馬斯克說九個月。唐杰說用不了那么久。

唐老師表示,做出中國的 Mythos,需要兩條腿走路,即基座預訓練迭代和后訓練模型的自我迭代。智譜在前者的位置很明確,而后者的位置上,Mind Lab 是目前除智譜以外唯一交出公開成果、并且持續(xù)在 GLM 最新基座上迭代的團隊。

后訓練賽道在國內還沒有得到足夠關注。大部分討論集中在基座之爭:誰的參數多、誰的評測高、誰又發(fā)了新版本。但當基座差距逐漸收窄,后訓練的質量會越來越成為產品體驗的分水嶺。

九個月夠不夠,我們不確定。但有一件事是確定的:在 GLM5.1/5.2 的后訓練路線上,目前唯一看得到路徑、并且已經用成績證明過提分能力的外部團隊,就是 Mind Lab。Mythos 級的智能不是只有預訓練一條路能到,后訓練這條路上,Mind Lab 已經站在了最近的位置。

這件事,振奮人心。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中國女排天降奇兵!僅打兩局拿到全隊第二高得分,球迷:又進步了

中國女排天降奇兵!僅打兩局拿到全隊第二高得分,球迷:又進步了

南海浪花
2026-06-20 05:28:55
麥克風沒關!加拿大總理與特朗普私聊中國電動車,意外對全球公開

麥克風沒關!加拿大總理與特朗普私聊中國電動車,意外對全球公開

福建睿平
2026-06-20 08:27:09
WTT球星賽:女單大爆冷!蒯曼1:3被淘汰,對手排名181,0冠收官

WTT球星賽:女單大爆冷!蒯曼1:3被淘汰,對手排名181,0冠收官

國乒二三事
2026-06-20 17:41:44
米體:46歲的羅納爾迪尼奧將復出,加盟意丙拉文納

米體:46歲的羅納爾迪尼奧將復出,加盟意丙拉文納

懂球帝
2026-06-20 05:06:13
1940年,43歲于鳳至胸前潰爛流膿,一老外卻抱著她親:你終于到了

1940年,43歲于鳳至胸前潰爛流膿,一老外卻抱著她親:你終于到了

青途歷史
2026-06-19 08:59:36
年輕人先沖了:85萬元拿下“老破小”,租金回報超3%

年輕人先沖了:85萬元拿下“老破小”,租金回報超3%

中新經緯
2026-06-20 09:31:23
私生活混亂,從央視主持到勞改犯,如今靠直播打賞討生活

私生活混亂,從央視主持到勞改犯,如今靠直播打賞討生活

素衣讀史
2026-06-11 21:56:30
賈玲“胖回來了”?本人回應:反彈后更放松自在,健康比體重重要

賈玲“胖回來了”?本人回應:反彈后更放松自在,健康比體重重要

馬拉松跑步健身
2026-06-19 21:58:27
CCTV5+直播,中國男籃對陣澳大利亞,楊瀚森缺陣胡金秋挑內線大梁

CCTV5+直播,中國男籃對陣澳大利亞,楊瀚森缺陣胡金秋挑內線大梁

中國籃壇快訊
2026-06-20 14:17:22
中介費12萬、彩禮26萬,河南男子通過網絡婚介與女子相親后閃婚,婚后第29天新娘失蹤,央視披露案情→

中介費12萬、彩禮26萬,河南男子通過網絡婚介與女子相親后閃婚,婚后第29天新娘失蹤,央視披露案情→

大風新聞
2026-06-20 12:22:06
八國聯(lián)軍侵華已過百年,至今沒有一個中國人能笑著走出俄羅斯冬宮

八國聯(lián)軍侵華已過百年,至今沒有一個中國人能笑著走出俄羅斯冬宮

史之銘
2026-06-18 07:04:05
算盤打得精明卻輸了人心,郭斌王楠夫婦,終究是貪心過頭!

算盤打得精明卻輸了人心,郭斌王楠夫婦,終究是貪心過頭!

硯底沉香LIU
2026-06-20 07:19:00
長沙街頭一奧迪車懸掛套牌“潤A88888”,當地交警:已傳喚當事司機

長沙街頭一奧迪車懸掛套牌“潤A88888”,當地交警:已傳喚當事司機

大風新聞
2026-06-20 12:02:05
“小馬云”18歲當爸沖上熱搜!網友怒罵:這次我真的看不下去了

“小馬云”18歲當爸沖上熱搜!網友怒罵:這次我真的看不下去了

雷科技
2026-06-19 21:28:58
普京遭遇恥辱一幕!俄外長提醒全球:歐洲4年后,想玩把大的

普京遭遇恥辱一幕!俄外長提醒全球:歐洲4年后,想玩把大的

共工之錨
2026-06-19 15:27:41
狀態(tài)明顯更好!向鵬3-1溫瑞博晉級盧布爾雅那球星賽八強!

狀態(tài)明顯更好!向鵬3-1溫瑞博晉級盧布爾雅那球星賽八強!

籃球資訊達人
2026-06-20 18:25:06
全網輿論炸鍋!嚴查駐外領館簽證漏洞,不守規(guī)矩外籍人員一律清退

全網輿論炸鍋!嚴查駐外領館簽證漏洞,不守規(guī)矩外籍人員一律清退

古史青云啊
2026-06-19 11:31:56
白宮官邸深夜失控:80歲特朗普與梅拉尼婭決裂分房,后勤被迫翻垃圾救文物

白宮官邸深夜失控:80歲特朗普與梅拉尼婭決裂分房,后勤被迫翻垃圾救文物

時尚的弄潮
2026-06-19 16:06:14
A股:剛剛,大消息傳來,釋放重要信號!下周將迎來新的變盤

A股:剛剛,大消息傳來,釋放重要信號!下周將迎來新的變盤

虎哥閑聊
2026-06-20 00:00:08
烏克蘭無人機一頭撞上吊塔,莫斯科一片火海

烏克蘭無人機一頭撞上吊塔,莫斯科一片火海

烽火觀天下
2026-06-20 11:53:27
2026-06-20 19:59:02
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
13303文章數 142673關注度
往期回顧 全部

科技要聞

DeepSeek上線識圖模式,看誰都像梁文鋒

頭條要聞

歐洲車企高管:要好好學習先進技術 別總想著打贏中國

頭條要聞

歐洲車企高管:要好好學習先進技術 別總想著打贏中國

體育要聞

全隊抱頭痛哭!5億歐土耳其出局 2場轟62腳0進球

娛樂要聞

張凱麗被罵到關評!

財經要聞

金飾克價年內大跌近450元 跌幅最高達26%

汽車要聞

驚出冷汗!重慶實測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

數碼
藝術
親子
旅游
游戲

數碼要聞

聯(lián)想極光GH15頭戴式耳機發(fā)售:40mm動圈,249元

藝術要聞

高300米!重慶曾有“魔方大樓”方案,遺憾沒建成

親子要聞

紙尿褲,到底含不含毒?

旅游要聞

春城夏日限定浪漫!荷花、向日葵、稻田,就在緊鄰市區(qū)的這個半島

笑噴了!玩家網購PS5 收到PS4包裝 打開竟是臺PS3

無障礙瀏覽 進入關懷版