網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

清華2年前預言，正成為全球共識！Meta等三大AI機構已得出同一結論

2026-04-13 17:08:13　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：好困桃子

【新智元導讀】太瘋狂了！Meta和METR剛測出的AI進化數據，與中國團隊兩年前提出的「密度定律」完美重合。硅谷猛然回頭，發現中國研究者在這條路上已領先兩年！

全球三家最嚴肅的AI研究機構，過去一周集體撞車了！

4月3日，美國研究機構METR悄悄更新了一份技術報告，核心結論壓成一句話。

AI能力每88.6天翻倍一次。

5天后，4月8日，Meta超級智能實驗室發布全新模型Muse Spark，公開了一條內部叫做scaling ladder的訓練效率曲線，結論也是一句話。

要追上一年前Llama 4 Maverick的性能，新模型只需要不到十分之一的訓練算力。

一份測任務時長，一份測訓練算力。兩家機構沒有任何往來，研究方法毫無重合。

但當兩條曲線被換算到同一坐標系里，斜率幾乎完全重合。

到這里，事情已經夠離譜了。

更離譜的是，這條曲線，被一個中國團隊兩年前就完整地畫出來過，還登上了Nature子刊。

它叫密度定律。

兩年前，有人提前畫過這條線

這個概念最早出現在一篇叫「Densing Law of LLMs」的論文里。

作者是面壁智能和清華大學的聯合團隊，孫茂松和劉知遠兩位教授領銜，第一作者是博士生肖朝軍。

論文2024年12月掛上arXiv，2025年11月被Nature Machine Intelligence接收。

論文地址：https://arxiv.org/abs/2412.04315

論文地址：https://www.nature.com/articles/s42256-025-01137-0

論文的核心判斷只有一句話。

模型智能密度隨時間呈指數級增強，達到特定智能水平所需的參數量，每3.5個月下降一半。

放在2024年底，這話聽上去有點過激。

那時全行業都在崇拜scaling law。OpenAI在堆模型，Anthropic在堆模型，Meta也在堆模型。

所有人都覺得參數越大智能越強，把GPU燒到極致才是正道。

但研究團隊不這么看。

他們把當時所有有影響力的開源基礎模型，從Llama-1一路到Gemma-2、MiniCPM-3，總共51個模型都放進了同一把尺子里去量。

五大基準跑完，結果是幾乎完美的指數關系，R2達到0.934。

考慮到大模型評測很容易被數據污染干擾，他們又用一個新構建的污染過濾數據集MMLU-CF重測了一次。R2=0.953。

兩次擬合都拿到了接近1的R2。統計學上，這幾乎不可能是巧合。

換句話說就是，這兩年發布的每一個主流開源模型，不管來自哪個團隊、用什么架構，都落在了同一條「每3.5個月翻倍」的指數線上。

到這里，故事還只是「一個中國團隊提出了一個看上去很激進的經驗規律」。

真正讓這件事變成一個「時刻」的，是接下來這小半年發生的事。

三家機構，三種方法，同一個斜率

把面壁、Meta、METR三方的結論攤開看。

面壁的密度定律衡量的是「同樣的智能水平需要多少參數」。結論是參數需求每3.5個月減半。
Meta的scaling ladder衡量的是「同樣的智能水平需要多少訓練算力」。結論是Muse Spark比一年前的Llama 4 Maverick節省了一個數量級。
METR的時間跨度報告衡量的是「同樣的模型能搞定多長任務」。結論是任務時長每88.6天翻倍。

三把尺子。三個學術機構。三種沒有任何重合的研究路徑。

但當所有數字被換算到同一坐標系里看時，它們的曲線斜率幾乎完全重合。

這事最容易被忽略的一點是，密度定律是這三者里最早提出的。比Meta的scaling ladder早了近兩年，比METR的完整建模也早了一年多。

而當Meta在四月初的發布博客里畫出那條scaling ladder時，他們大概自己都沒意識到。這張圖的形狀，和2024年北京一個學術會議PPT上的曲線，幾乎是同一條線。

什么樣的觀察，才配得上「定律」兩個字

在科學界，有一套不成文的標準，來判斷一條經驗觀察是否有資格被叫做「定律」。

不是看數據有多漂亮，是看它能不能在多個獨立的測量系統下同時成立。

摩爾定律之所以是定律，因為半導體行業從光刻精度、晶體管密度、單位算力成本三個完全不同的維度，幾十年來一遍遍驗證過它。

密度定律走的是同一條路。

它最初只是來自單一團隊的一條擬合曲線。到Nature子刊接收時，它已經能在污染過濾后的數據集上重現。到這個月，它在Meta的訓練數據和METR的任務評測里又被兩次獨立驗證。

放在更大的坐標系里看，這一刻像極了1880年代電力剛進入紐約的時候。

那時也是幾個不同的發明家、不同的工程師、不同的城市，各自在搞各自的電網。直到有人把所有項目的發展曲線畫在一張紙上，人們才反應過來。這不是幾個零散的工程進步，這是一個新時代正在悄悄鋪開。

只是這一次，從論文發表到被全球同行驗證，只用了不到一年。

三個推論，每一個都在改寫行業假設

如果密度定律站得住腳，它會同時改寫很多東西。

第一，推理成本會比所有人預期的都崩得更快。

密度定律的一個推論是，達到同樣性能的LLM，推理成本大概每2.6個月減半。

如今，這個降幅已經被現實超過了。

Epoch AI最新追蹤數據顯示，達到Claude 3.5 Sonnet性能水平的LLM，過去一年token價格降了400倍。同檔位性能的最快降幅觸到900倍/年。

2022年底GPT-3.5開價20美元/百萬token那種水平，今天Mistral Nemo只要0.02美元，便宜了1000倍，模型還更強。

回頭來看，論文里的預測還是保守了。

第二，端側智能的爆發點，比所有人預想的都近。

把密度定律和摩爾定律相乘，會得到一個更刺激的數字。

按目前估算，在同價格芯片上能跑的最大有效模型規模，大約每88天翻一倍。

這個數字和METR算出的88.6天幾乎一致。兩家完全不同的推算路徑，在小數點后撞了車。

未來三五年，在一臺普通筆記本甚至一部手機上跑當下頂級GPT級別模型這件事，可能不再是科幻。

第三，大模型行業的最優策略，正在悄悄反轉。

過去三年，行業對scaling law的理解一直停留在「堆參數堆數據」

但密度定律給出了一個反直覺的判斷。在密度持續指數增長的前提下，任何狀態的最強模型都只有幾個月的最優窗口期。

砸全部資源去訓一個更大的模型，然后等三個月被一個體積一半的新模型超越，在經濟賬上是不劃算的。

真正可持續的路，是把資源砸在密度本身的提升上。更好的架構，更高質量的數據，更聰明的訓練算法。

面壁，一直在沿著自己畫的尺子走

值得說一句的是，密度定律不是一篇發完就結束的論文。

提出這套理論的面壁智能，過去兩年一直在用自家的「小鋼炮」MiniCPM系列模型驗證它。

MiniCPM-1-2.4B在2024年2月發布的時候，跑分能打平或超過2023年9月的Mistral-7B。也就是說，四個月時間，35%的參數，達到了同等性能。

這個數字被直接寫進了Nature子刊那篇論文里，作為密度定律的第一個實證案例。

從那之后，小鋼炮系列一路開源，覆蓋10B以下參數的文本、多模態、語音、全模態四大方向。這個開源完整度，在國內除了阿里之外，只有面壁一家做到。

到目前為止，小鋼炮系列在全球的開源下載量已經突破2400萬次。

它不是行業里最大的模型。但它是行業里第一個把「密度優先」當作公司方法論來執行的團隊。

而當Meta和METR在2026年4月這一周用各自的方式驗證密度定律時，這家2024年就開始按這套方法論訓練模型的中國公司，其實已經領先了兩年的工程經驗。

這一次，中國研究者站在了曲線的起點

一個中國研究團隊兩年前提出的理論框架，正在被Meta、METR這些海外最嚴肅的機構，用他們各自的方式，一次次重新發現。

這件事的份量，可能需要一點時間才能完全理解。

它不是一個「我們也行」的故事。它是一個「我們更早一點看見」的故事。

科學史上這樣的瞬間不算多。一個在2024年被懷疑的判斷，在2026年變成了多個獨立證據指向的同一條曲線。

這種跨地域、跨方法、跨機構的「不約而同」，在物理學里發生過幾次，每一次都標志著一個舊范式的終結和一個新范式的開始。

中國AI研究者這一次站在了那個起點上。

而那條曲線，還在以每88天翻一倍的速度往上走。

參考資料：

面壁智能首創的「密度定律」，獲 Meta 等海外頂級機構認可

https://arxiv.org/abs/2412.04315

https://www.nature.com/articles/s42256-025-01137-0

https://metr.org/blog/2026-1-29-time-horizon-1-1/

https://ai.meta.com/blog/introducing-muse-spark-msl/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

谷歌向左、李飛飛往右，阿里世界模型「快樂生蠔」殺出第三條路

機器之心Pro 2026-04-20 10:26:40
0 跟貼 0
楊立昆開噴 Anthropic CEO：別信那個賣 AI 的人

鈦媒體APP 2026-04-20 08:32:19
10 跟貼 10

Monet：賦予多模態大模型如人類一般的抽象視覺思考能力

機器之心Pro 2026-04-20 21:05:03
0 跟貼 0

小扎拆骨Thinking Machines！120億美元AI獨角獸第5位創始人跳槽Meta

新智元 2026-04-19 12:18:27
2 跟貼 2
你的「龍蝦」真記得你嗎？劍橋發布長期個性化記憶基準ATM-Bench

機器之心Pro 2026-04-20 12:44:27
0 跟貼 0

馬斯克坦言智能密度被低估100倍

機器之心Pro 2026-01-07 18:40:30
15 跟貼 15

不同靈巧手，終于可以共用「一套大腦」了

機器之心Pro 2026-03-06 14:40:41
0 跟貼 0
“硅基員工”引爆智能體攻防：從被動響應到自主防御，“AI原生”成必選項

每日經濟新聞 2026-04-21 07:08:05
0 跟貼 0

GEO如何改變品牌？中國人民大學新聞學院教授王菲：被正確理解，才能被持續看見

每日經濟新聞 2026-04-20 20:56:03
0 跟貼 0
「部署態」元年，這家公司就把落地方案卷到了七種

機器之心Pro 2026-04-20 14:20:54
0 跟貼 0
ICLR發了Oral又反悔，理由是查到了制裁名單？

機器之心Pro 2026-04-20 21:03:39
0 跟貼 0
減速機訂單已排到明年！

財聯社 2026-04-21 07:54:05
0 跟貼 0
世界上密度最高的金屬！鋨：比黃金稀有，卻存在于鋼筆中？

心中的麥田 2026-04-16 20:12:32
0 跟貼 0
古墓中的“神秘預言”。竟有此事？說得跟真的似的

文物真有趣 2026-04-16 23:49:53
9 跟貼 9
2026年發布會數量卷上天，有效果的又能有幾個？｜駕仕說

駕仕派 2026-04-19 12:07:00
0 跟貼 0
一間斜坡木屋幫助一人兩狗在深山安全度過了冰天雪地的夜晚

孟遠方行 2026-04-20 10:05:53
1 跟貼 1
六星閃耀：清華北大培養的明星風采

佴沙羽 2026-04-19 08:01:30
0 跟貼 0
清華天才之間的差距比人和狗的差距還大？聽聽清華老師怎么說

拜永元 2026-04-19 05:06:08
1 跟貼 1
斜坡三岔路口窄路掉頭，上演人車合一，看呆10年老司機

道路紅綠燈 2026-04-20 11:18:56
16 跟貼 16
生成式推理再排序，可能會是LLM4RecSys的新突破口嗎？

機器之心Pro 2026-04-08 11:52:53
0 跟貼 0
專利價值管理范式的理論演進與“六標-五級”模型構建

IPRdaily 2026-04-20 10:41:31
0 跟貼 0
斜坡上砌墻頭，技術太牛了！

打野小黃人 2026-04-20 15:23:23
1 跟貼 1
職業車手不肯說的秘密：把自己烤熟一點，功率就漲了？

騎行村 2026-04-16 17:07:10
2 跟貼 2
劉嘉玲的預言，再次成真！

火火小紅帽 2026-04-20 18:59:18
0 跟貼 0
密度的魔法

有趣的美美 2026-04-20 09:05:42
3 跟貼 3
叫板Meta：開云集團聯手谷歌計劃2027年推出Gucci高端智能眼鏡

環球網資訊 2026-04-17 14:15:26
1 跟貼 1
就這五個小斜坡,還能難道我不成,一出腳真人才

穆和 2026-04-19 10:02:23
0 跟貼 0
幼兒園的小朋友自學乘法，這種算法還是第一次見

蓬勃資訊 2026-04-19 10:28:49
85 跟貼 85
清華大學影視傳播研究中心發布訃告：導演葉君去世，享年43歲

澎湃新聞 2026-04-21 04:07:15
0 跟貼 0
賀嬌龍賬號時隔100天更新，90后清華畢業生成為推薦官

澎湃新聞 2026-04-21 04:07:16
0 跟貼 0
賀嬌龍賬號時隔100天更新！“90后”清華畢業生成新任“推薦官”

星視頻 2026-04-20 10:35:14
0 跟貼 0
這短信算是預言嗎

辣妹子剪影 2026-04-20 08:18:07
0 跟貼 0
據說這是清華大學的入門測試題，10人有9個都做不到，太偏門了

一點門道 2026-04-20 10:19:16
0 跟貼 0
60位海外企業人才深圳“研學”：清華SIGS-慕尼黑工大EMBA直擊中國產業創新前沿

清華大學深圳研究生院 2026-04-20 17:52:33
0 跟貼 0
《故宮修文物》天才導演離世，清華文科狀元死因曝光

楓塵余往逝 2026-04-21 07:50:18
0 跟貼 0
袁世凱生前有過預言，直言有3個人能統治中國，他們分別是誰

木木說數碼 2026-04-20 14:52:25
0 跟貼 0
出生寒門撿廢品吃爛菜，十年寒窗苦讀，高考滿分750他考74

小狗不喝咖啡 2026-04-20 10:27:01
0 跟貼 0
老輩人總結的規律，老頭先走，老太太大多長壽！

阿南旅游攻略 2026-04-17 09:36:23
0 跟貼 0
霍爾木茲海峽開了又關 35艘船只駛出又掉頭

界面新聞 2026-04-20 08:43:33
3522 跟貼 3522
媒體：日方有一種陰毒"戰略" 在自衛隊宣揚未來再侵華

新民周刊 2026-04-20 09:08:09
2450 跟貼 2450

普京訪華行程敲定，特朗普已下命令，中國向全球通告，無懼美國

普京訪華行程敲定，特朗普已下命令，中國向全球通告，無懼美國

桑啟紅原

2026-04-20 20:19:05

美專家：美國在伊朗正面臨四個大問題

美專家：美國在伊朗正面臨四個大問題

環球時報國際

2026-04-21 00:16:12

國際奧委會明確表態，對2036年奧運會的申辦情況很是失望

國際奧委會明確表態，對2036年奧運會的申辦情況很是失望

安安說

2026-04-20 11:09:20

哈登16+2！騎士54-48猛龍，看數據：他才是頭號功臣！

哈登16+2！騎士54-48猛龍，看數據：他才是頭號功臣！

運籌帷幄的籃球

2026-04-21 08:12:30

日本將地震震級調整至7.5級

界面新聞

2026-04-20 16:30:33

罰15億！拼多多一員工故意關門，對抗調查，導致執法人員手指骨折

罰15億！拼多多一員工故意關門，對抗調查，導致執法人員手指骨折

魔都姐姐雜談

2026-04-19 08:03:27

中央層面整治形式主義為基層減負專項工作機制辦公室　中央紀委辦公廳公開通報4起整治形式主義為基層減負典型問題

中央層面整治形式主義為基層減負專項工作機制辦公室　中央紀委辦公廳公開通報4起整治形式主義為基層減負典型問題

新華社

2026-04-20 17:44:02

“巴掌遮陽帽”在TikTok刷屏、義烏緊急跟進，利潤翻了近10倍

“巴掌遮陽帽”在TikTok刷屏、義烏緊急跟進，利潤翻了近10倍

去山野間追風

2026-04-21 03:16:20

撤下主力放棄比賽，替補卻反敗為勝！哈登都看傻了

撤下主力放棄比賽，替補卻反敗為勝！哈登都看傻了

林子說事

2026-04-21 02:26:26

“找到一個媳婦算你牛”，農村家長曬7兒1女，被群嘲后看清現實

“找到一個媳婦算你牛”，農村家長曬7兒1女，被群嘲后看清現實

妍妍教育日記

2026-04-20 19:42:54

歐爾班下臺，這個歐洲國家卻可能再次擁抱一位親俄領導人

歐爾班下臺，這個歐洲國家卻可能再次擁抱一位親俄領導人

上觀新聞

2026-04-20 15:58:42

睡一覺5萬沒了！全國多地爆發新型盜刷，睡前必查手機這4處

睡一覺5萬沒了！全國多地爆發新型盜刷，睡前必查手機這4處

洞見小能手

2026-04-20 16:03:26

冠心病去世的越來越多，建議：1不喝、2不碰、3堅持，別大意了

冠心病去世的越來越多，建議：1不喝、2不碰、3堅持，別大意了

芹姐說生活

2026-04-20 16:10:12

中國高校只剩7年窗口期學生數量斷崖式塌方后一半高校都得死

中國高校只剩7年窗口期學生數量斷崖式塌方后一半高校都得死

六子吃涼粉

2026-04-20 19:10:49

高市早苗向靖國神社獻祭品

新華社

2026-04-21 05:59:03

拼多多暴力抗法震驚全網，市值萬億巨頭為何如此囂張

拼多多暴力抗法震驚全網，市值萬億巨頭為何如此囂張

燕梳樓頻道

2026-04-20 21:12:04

普通家庭千萬不要買“小聯排別墅”，看著很高級，住著卻難受！

普通家庭千萬不要買“小聯排別墅”，看著很高級，住著卻難受！

裝修秀

2026-04-20 10:50:03

震驚！網傳深圳中專打工女偽造百億富三代人設，收割尊界S800車主

震驚！網傳深圳中專打工女偽造百億富三代人設，收割尊界S800車主

火山詩話

2026-04-20 13:37:00

欲哭無淚！47歲男子赴深圳求職一個月無果，住低價旅館，一日一餐

欲哭無淚！47歲男子赴深圳求職一個月無果，住低價旅館，一日一餐

火山詩話

2026-04-21 06:36:18

丈夫騎車躲狗摔倒致妻死亡，家屬起訴違停車主124萬，法院判了

丈夫騎車躲狗摔倒致妻死亡，家屬起訴違停車主124萬，法院判了

大魚簡科

2026-04-20 19:38:39

AI產業主平臺領航智能+時代

15021文章數 66791關注度

往期回顧全部

科技要聞

重磅官宣：庫克卸任，特努斯接任蘋果CEO

頭條要聞

特朗普兩天三次反轉伊朗學習特朗普玩起"極限施壓"

頭條要聞

特朗普兩天三次反轉伊朗學習特朗普玩起"極限施壓"

體育要聞

阿森納已拼盡全力，但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經要聞

利潤暴跌7成，字節到底在做什么

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻我腿軟了

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

時尚

手機

教育

公開課

本地新聞

12噸巧克力有難，全網化身超級偵探添亂

春天衣服不用準備太多！這幾大單品提前備好，百搭實用又不過時

手機要聞

蘋果被曝下調 iPhone 18 規格以壓縮成本

教育要聞

加權費馬點模型，一個視頻學明白！

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版