網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

Claude強(qiáng)到不敢發(fā)的Mythos，被質(zhì)疑用了字節(jié)Seed技術(shù)

2026-04-13 13:48:38　來源: 量子位

北京舉報

分享至

夢晨發(fā)自凹非寺
量子位 | 公眾號 QbitAI

Claude最強(qiáng)“神話”模型，可能用到來自字節(jié)的技術(shù)？

這條猜測直接沖上熱搜榜。

這款“強(qiáng)到不敢公開發(fā)布”的Mythos模型，確實刺激了人們對下一代LLM架構(gòu)的想象。

社區(qū)正在熱烈討論它是否采用了循環(huán)語言模型（Looped Language Model）架構(gòu)。

這個概念來自字節(jié)Seed團(tuán)隊與多個高校合作的一篇論文，Yoshua Bengio也參與其中。

關(guān)鍵線索在于Anthropic公布的一組測試數(shù)據(jù)。

字節(jié)論文指出，圖搜索是循環(huán)算法相比標(biāo)準(zhǔn)RLVR具有巨大理論優(yōu)勢的領(lǐng)域之一。

再看Mythos，正是在廣度搜索優(yōu)先的圖搜索測試GraphWalks BFS中，超越對手GPT5.4最多。

80%對21.4%，接近4倍的差距。

在其他類型的任務(wù)上，并沒有出現(xiàn)如此異常的分差。

說明這種進(jìn)步很可能不是來自通用的Scaling Law，而是架構(gòu)創(chuàng)新。

循環(huán)語言模型：同一層”多轉(zhuǎn)幾圈”，小模型碾壓大模型

GraphWalks BFS測試，就是給模型一個復(fù)雜的圖結(jié)構(gòu)，讓它做廣度優(yōu)先搜索，從起點出發(fā)，一層一層地訪問所有相鄰節(jié)點。

標(biāo)準(zhǔn)Transformer處理這類問題只能一次前向傳播，從頭走到尾，輸出結(jié)果，沒有“迭代”這個概念。

Mythos在圖遍歷上拿到了80%的分?jǐn)?shù)，表明它內(nèi)部很可能在“”反復(fù)計算”，對同一組信息來回處理了好幾遍。

那么什么樣的架構(gòu)能實現(xiàn)“反復(fù)計算”？

字節(jié)Seed團(tuán)隊在論文中提出LoopLM循環(huán)語言模型。

簡單總結(jié)LoopLM有三個特點。

1、不寫長文思考，在模型內(nèi)部潛空間迭代，不額外輸出更多token。

2、簡單題少想幾步，難題多想幾步，自動調(diào)節(jié)。

3、預(yù)訓(xùn)練時就學(xué) “怎么在潛空間思考”，而不是只學(xué) “怎么預(yù)測下一個token”。

在實驗中，團(tuán)隊訓(xùn)練了Ouro系列循環(huán)語言模型，內(nèi)置了循環(huán)思考。

測試結(jié)果，1.4B的Ouro模型性能對標(biāo)約4B的傳統(tǒng)模型。2.8B的Ouro模型相當(dāng)于8B–12B的傳統(tǒng)模型。

至于循環(huán)模型的能力提升來自何處，論文詳細(xì)分析了知識存儲vs知識操作的區(qū)別。

知識存儲（Knowledge Storage）的容量是有限的，大約每個參數(shù)2bits，不管用什么架構(gòu)，這個數(shù)字基本不變。

循環(huán)也不會讓你“記住”更多東西。

但知識操作（Knowledge Manipulation）不一樣，把已知事實組合起來做多跳推理、執(zhí)行程序、搜索圖結(jié)構(gòu)，這類能力隨循環(huán)步數(shù)和訓(xùn)練tokens指數(shù)級增長。

換句話說，循環(huán)模型沒有給AI一個更大的知識庫，但它讓AI在知識庫庫里的搜索和組合能力提升了一個量級。

那么Mythos究竟是不是循環(huán)模型架構(gòu)，有人總結(jié)出除了GraphWalks之外的更多線索。

三條線索指向循環(huán)模型架構(gòu)

第一條線索，也就是廣度優(yōu)先圖搜索測試結(jié)果。

Mythos除了分?jǐn)?shù)是GPT5.4的4倍，比上一代Opus提升幅度也異常大。

第二條線索，Anthropic報告Mythos每個任務(wù)使用的token數(shù)量是Opus4.6的1/5，但速度更慢。

（價格也貴5倍！）

這在標(biāo)準(zhǔn)Transformer框架下很難說得通，token少，生成步驟就少，應(yīng)該更快才對。

但循環(huán)模型剛好解釋了這個矛盾：推理不發(fā)生在token層面，而是發(fā)生在潛空間，計算量花在了看不見的地方。

線索三，Mythos在網(wǎng)絡(luò)安全方面非常突出。

Mythos在CyberGym測試上拿到83.1%，Opus4.6是66.6%，領(lǐng)先近17個百分點。

以及找到上千個零日漏洞，主流操作系統(tǒng)和瀏覽器全都沒逃過。

漏洞發(fā)現(xiàn)的本質(zhì)就是對控制流圖做遍歷。找到一條從輸入到危險函數(shù)的路徑，也就是圖的可達(dá)性問題。

又是圖遍歷。又是循環(huán)架構(gòu)的天生強(qiáng)項。

說了這么多，終歸只是大家的猜測，Anthropic沒有公開任何關(guān)于Mythos架構(gòu)的信息，很可能以后也不會公開。

但有一句話值得思考：

Scaling Law改善一切，相對均勻，架構(gòu)創(chuàng)新在匹配其歸納偏置的任務(wù)上創(chuàng)造異常尖峰值。

循環(huán)Transformer的歸納偏置就是迭代圖算法。Mythos的異常尖峰，恰好出現(xiàn)在圖遍歷任務(wù)上。

Anthropic不說，但測試數(shù)據(jù)已經(jīng)替它說了。

字節(jié)論文：
https://arxiv.org/abs/2510.25741

參考鏈接：
[1]
https://x.com/ChrisHayduk/status/2042711699413926262
[2]
https://aiia.ro/blog/claude-mythos-looped-language-model-theory

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

Claude Code把自己的介紹，外包給這家AI公司了

智東西 2026-04-15 17:43:10
0 跟貼 0
AI視頻混戰(zhàn)升級，字節(jié)在模型之外加了道防線

鈦媒體APP 2026-04-16 19:28:13
1 跟貼 1

Claude Code之父，公開Opus 4.7內(nèi)部使用技巧

智東西 2026-04-17 18:50:21
3 跟貼 3

長文問答準(zhǔn)確率大漲 17% 后，Anthropic 把“不亂猜”做成了核心賣點

鈦媒體APP 2026-04-17 11:26:15
0 跟貼 0
中國AI產(chǎn)業(yè)落地的新國企答卷

華商韜略 2026-04-17 22:35:02
0 跟貼 0

Elephant走紅：AI開始為“Token浪費(fèi)”算細(xì)賬

華爾街見聞官方 2026-04-17 16:51:57
0 跟貼 0

Transformer與RNN合體，谷歌打下顯存門檻，解鎖超長上下文

機(jī)器之心Pro 2026-04-17 18:31:53
0 跟貼 0
無錫機(jī)器人交警上路執(zhí)勤當(dāng)?shù)亟还埽涸圏c投入兩臺，身高1.75米，單次充滿電可工作5小時

紅星新聞 2026-04-17 17:07:58
1852 跟貼 1852

字節(jié)Seed用化學(xué)思想搞AI，把DeepSeek-R1的腦回路拆成了分子結(jié)構(gòu)

量子位 2026-02-24 15:21:52
0 跟貼 0
π0.7的泛化能力有多強(qiáng)？零樣本純靠口述就能用空氣炸鍋

DeepTech深科技 2026-04-17 21:34:56
0 跟貼 0
XYZ曲線丈量萬億市場：智元給具身智能的演進(jìn)定了新路徑

雷科技 2026-04-17 21:34:55
0 跟貼 0
百度沈抖自曝：老忘吃藥，用AI做了個小程序

量子位 2026-03-27 11:25:23
0 跟貼 0
美團(tuán)AI健康管家的商業(yè)邏輯拆解：從應(yīng)急購藥到健康管理延伸

華爾街見聞官方 2026-04-17 23:30:46
0 跟貼 0
2026年內(nèi)部協(xié)作工具橫評：誰在真干活誰在混

碼上閑敘 2026-04-15 19:16:45
0 跟貼 0
間諜策反中企員工致項目停工停產(chǎn) 國安機(jī)關(guān)披露詳情

極目新聞 2026-04-17 07:00:50
9807 跟貼 9807
川崎 H2R模型摩托

制造科技 2026-04-16 21:58:46
1 跟貼 1
字節(jié)招博士只干一件事：押注AI終局

硬核玩家2哈 2026-04-17 12:04:26
0 跟貼 0
字節(jié)億元年薪挖DeepSeek天才員工？抖音副總裁：報道不實

雷科技 2026-04-17 09:39:09
2 跟貼 2
張雪機(jī)車增重7公斤仍奪荷蘭站練習(xí)賽第三

北青網(wǎng)-北京青年報 2026-04-17 18:56:24
804 跟貼 804
揭秘年銷10億的爆款宋柚汁：“宋柚”是商標(biāo)，柚含量不到3%，主配料為糖水，品牌號稱全國銷量第一

藍(lán)鯨新聞 2026-04-15 09:44:24
3696 跟貼 3696
你藏bug的樣子，像極了愛情

我是一個粉刷匠2 2026-04-16 18:07:10
0 跟貼 0
廣東“莫氏雞煲大公主”爆火前后反差大，晚上干到凌晨2點才收工，發(fā)文吐槽：這個雞你們是非吃不可嗎

大象新聞 2026-04-15 12:57:04
1774 跟貼 1774
AI，重塑戰(zhàn)爭規(guī)則：美伊對峙下軍事決策，“剎車”，正在消失

徐竦解說 2026-04-17 22:35:50
0 跟貼 0
采用800V架構(gòu)，標(biāo)配寶華韋健，靜態(tài)體驗沃爾沃EX90

苑叔聊車官方賬號 2026-04-15 21:09:17
3 跟貼 3
168初中數(shù)學(xué)常見題，求一個參數(shù)值，使分?jǐn)?shù)表達(dá)式為整數(shù)

我服子佩 2026-04-14 16:40:10
1 跟貼 1
人類正在淪為算法NPC，覺醒才是唯一出路！

桔子嘮生活 2026-04-17 04:17:35
0 跟貼 0
這次日本再也沒法歪曲歷史誤導(dǎo)年輕人了

孝沛與世界 2026-04-18 02:01:03
0 跟貼 0
大哥健身房里猛練2小時結(jié)果出門直接上演“平地摔”

星視頻 2026-04-17 18:41:46
92 跟貼 92
浙江街頭已大量出現(xiàn)！不少人捂鼻吐槽：別靠近，太上頭

環(huán)球網(wǎng)資訊 2026-04-17 14:48:08
22 跟貼 22
梁文鋒，被曝融資20億！

智東西 2026-04-18 00:21:01
0 跟貼 0
2：0！重慶銅梁龍斬獲球隊首個中超三連勝，暫居積分榜首位

上游新聞 2026-04-17 21:38:14
41 跟貼 41
廣州越秀公園驚現(xiàn)“貓蛇大戰(zhàn)”，目擊者：雙方僵持了差不多三分鐘

星視頻 2026-04-17 14:41:00
814 跟貼 814
格力怒斥海信，稱其沒資格用“真銅實料”四字進(jìn)行宣傳，海信高管回懟：又當(dāng)又立

大風(fēng)新聞 2026-04-15 15:07:03
898 跟貼 898
深圳一小區(qū)地樁竟“長”出“金屬倒刺”！居民嚇壞，物業(yè)整改

南方都市報 2026-04-17 12:56:56
452 跟貼 452
本田或?qū)㈥P(guān)停廣州、武漢兩座燃油車工廠

中國能源網(wǎng) 2026-04-17 14:45:03
2399 跟貼 2399
WTI原油期貨跌幅擴(kuò)大至14%，報81.387美元/桶

每日經(jīng)濟(jì)新聞 2026-04-17 22:42:38
28 跟貼 28
組裝V8汽車發(fā)動機(jī)模型

制造科技 2026-04-16 13:26:17
0 跟貼 0
深圳水貝用330克純金打造車標(biāo) 網(wǎng)友：放車上就沒了

極目新聞 2026-04-17 11:05:47
346 跟貼 346
智元高喊千億營收！彭志輝自揭“短板”：不缺錢、缺數(shù)據(jù)

財聯(lián)社 2026-04-17 23:40:07
0 跟貼 0
杭州通報一診所“用一個針頭給多人采血”

新京報 2026-04-17 20:06:12
35 跟貼 35

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

Claude強(qiáng)到不敢發(fā)的Mythos，被質(zhì)疑用了字節(jié)Seed技術(shù)

7家頭部平臺被罰沒35.97億元

知情人：伊朗為霍爾木茲海峽通行設(shè)定三個條件

知情人：伊朗為霍爾木茲海峽通行設(shè)定三個條件

中超-泰山1-1海港 楊希處子球克雷桑任意球扳平

劉德華摯友潘宏彬離世 曾一起租房住

"影子萬科"2.0：管理層如何吸血萬物云？

又快又穩(wěn)的開掛動力！ 阿維塔06T全系搭分布式電驅(qū)

態(tài)度原創(chuàng)

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

法式線條 時光靜淌

你絕對想不到！文森特的色粉作品竟如此驚艷！

PS5完全獨占新作曝光!科樂美為索尼傾力打造

三月三登泰山！蟠桃會+古風(fēng)巡游驚艷出圈

中超-泰山1-1海港楊希處子球克雷桑任意球扳平

劉德華摯友潘宏彬離世曾一起租房住

又快又穩(wěn)的開掛動力！阿維塔06T全系搭分布式電驅(qū)

法式線條時光靜淌