網易首頁 > 網易號 > 正文 申請入駐

清華2年前預言,正成為全球共識!Meta等三大AI機構已得出同一結論

0
分享至


新智元報道

編輯:好困 桃子

【新智元導讀】太瘋狂了!Meta和METR剛測出的AI進化數據,與中國團隊兩年前提出的「密度定律」完美重合。硅谷猛然回頭,發現中國研究者在這條路上已領先兩年!

全球三家最嚴肅的AI研究機構,過去一周集體撞車了!

4月3日,美國研究機構METR悄悄更新了一份技術報告,核心結論壓成一句話。

AI能力每88.6天翻倍一次。


5天后,4月8日,Meta超級智能實驗室發布全新模型Muse Spark,公開了一條內部叫做scaling ladder的訓練效率曲線,結論也是一句話。

要追上一年前Llama 4 Maverick的性能,新模型只需要不到十分之一的訓練算力。


一份測任務時長,一份測訓練算力。兩家機構沒有任何往來,研究方法毫無重合。

但當兩條曲線被換算到同一坐標系里,斜率幾乎完全重合

到這里,事情已經夠離譜了。

更離譜的是,這條曲線,被一個中國團隊兩年前就完整地畫出來過,還登上了Nature子刊。

它叫密度定律



兩年前,有人提前畫過這條線

這個概念最早出現在一篇叫「Densing Law of LLMs」的論文里。

作者是面壁智能和清華大學的聯合團隊,孫茂松和劉知遠兩位教授領銜,第一作者是博士生肖朝軍。

論文2024年12月掛上arXiv,2025年11月被Nature Machine Intelligence接收。


論文地址:https://arxiv.org/abs/2412.04315


論文地址:https://www.nature.com/articles/s42256-025-01137-0

論文的核心判斷只有一句話。

模型智能密度隨時間呈指數級增強,達到特定智能水平所需的參數量,每3.5個月下降一半

放在2024年底,這話聽上去有點過激。

那時全行業都在崇拜scaling law。OpenAI在堆模型,Anthropic在堆模型,Meta也在堆模型。

所有人都覺得參數越大智能越強,把GPU燒到極致才是正道。


但研究團隊不這么看。

他們把當時所有有影響力的開源基礎模型,從Llama-1一路到Gemma-2、MiniCPM-3,總共51個模型都放進了同一把尺子里去量。

五大基準跑完,結果是幾乎完美的指數關系,R2達到0.934。

考慮到大模型評測很容易被數據污染干擾,他們又用一個新構建的污染過濾數據集MMLU-CF重測了一次。R2=0.953。

兩次擬合都拿到了接近1的R2。統計學上,這幾乎不可能是巧合。

換句話說就是,這兩年發布的每一個主流開源模型,不管來自哪個團隊、用什么架構,都落在了同一條「每3.5個月翻倍」的指數線上。


到這里,故事還只是「一個中國團隊提出了一個看上去很激進的經驗規律」。

真正讓這件事變成一個「時刻」的,是接下來這小半年發生的事。

三家機構,三種方法,同一個斜率

把面壁、Meta、METR三方的結論攤開看。

  • 面壁的密度定律衡量的是「同樣的智能水平需要多少參數」。結論是參數需求每3.5個月減半。

  • Meta的scaling ladder衡量的是「同樣的智能水平需要多少訓練算力」。結論是Muse Spark比一年前的Llama 4 Maverick節省了一個數量級。

  • METR的時間跨度報告衡量的是「同樣的模型能搞定多長任務」。結論是任務時長每88.6天翻倍。

三把尺子。三個學術機構。三種沒有任何重合的研究路徑。

但當所有數字被換算到同一坐標系里看時,它們的曲線斜率幾乎完全重合。

這事最容易被忽略的一點是,密度定律是這三者里最早提出的。比Meta的scaling ladder早了近兩年,比METR的完整建模也早了一年多。

而當Meta在四月初的發布博客里畫出那條scaling ladder時,他們大概自己都沒意識到。這張圖的形狀,和2024年北京一個學術會議PPT上的曲線,幾乎是同一條線。

什么樣的觀察,才配得上「定律」兩個字

在科學界,有一套不成文的標準,來判斷一條經驗觀察是否有資格被叫做「定律」。

不是看數據有多漂亮,是看它能不能在多個獨立的測量系統下同時成立。

摩爾定律之所以是定律,因為半導體行業從光刻精度、晶體管密度、單位算力成本三個完全不同的維度,幾十年來一遍遍驗證過它。


密度定律走的是同一條路。

它最初只是來自單一團隊的一條擬合曲線。到Nature子刊接收時,它已經能在污染過濾后的數據集上重現。到這個月,它在Meta的訓練數據和METR的任務評測里又被兩次獨立驗證。

放在更大的坐標系里看,這一刻像極了1880年代電力剛進入紐約的時候。

那時也是幾個不同的發明家、不同的工程師、不同的城市,各自在搞各自的電網。直到有人把所有項目的發展曲線畫在一張紙上,人們才反應過來。這不是幾個零散的工程進步,這是一個新時代正在悄悄鋪開。

只是這一次,從論文發表到被全球同行驗證,只用了不到一年。

三個推論,每一個都在改寫行業假設

如果密度定律站得住腳,它會同時改寫很多東西。

第一,推理成本會比所有人預期的都崩得更快。

密度定律的一個推論是,達到同樣性能的LLM,推理成本大概每2.6個月減半

如今,這個降幅已經被現實超過了。

Epoch AI最新追蹤數據顯示,達到Claude 3.5 Sonnet性能水平的LLM,過去一年token價格降了400倍。同檔位性能的最快降幅觸到900倍/年。

2022年底GPT-3.5開價20美元/百萬token那種水平,今天Mistral Nemo只要0.02美元,便宜了1000倍,模型還更強。

回頭來看,論文里的預測還是保守了。

第二,端側智能的爆發點,比所有人預想的都近。

把密度定律和摩爾定律相乘,會得到一個更刺激的數字。

按目前估算,在同價格芯片上能跑的最大有效模型規模,大約每88天翻一倍

這個數字和METR算出的88.6天幾乎一致。兩家完全不同的推算路徑,在小數點后撞了車。

未來三五年,在一臺普通筆記本甚至一部手機上跑當下頂級GPT級別模型這件事,可能不再是科幻。

第三,大模型行業的最優策略,正在悄悄反轉。

過去三年,行業對scaling law的理解一直停留在「堆參數堆數據」

但密度定律給出了一個反直覺的判斷。在密度持續指數增長的前提下,任何狀態的最強模型都只有幾個月的最優窗口期。

砸全部資源去訓一個更大的模型,然后等三個月被一個體積一半的新模型超越,在經濟賬上是不劃算的。

真正可持續的路,是把資源砸在密度本身的提升上。更好的架構,更高質量的數據,更聰明的訓練算法。

面壁,一直在沿著自己畫的尺子走

值得說一句的是,密度定律不是一篇發完就結束的論文。

提出這套理論的面壁智能,過去兩年一直在用自家的「小鋼炮」MiniCPM系列模型驗證它。

MiniCPM-1-2.4B在2024年2月發布的時候,跑分能打平或超過2023年9月的Mistral-7B。也就是說,四個月時間,35%的參數,達到了同等性能。

這個數字被直接寫進了Nature子刊那篇論文里,作為密度定律的第一個實證案例。

從那之后,小鋼炮系列一路開源,覆蓋10B以下參數的文本、多模態、語音、全模態四大方向。這個開源完整度,在國內除了阿里之外,只有面壁一家做到。

到目前為止,小鋼炮系列在全球的開源下載量已經突破2400萬次。

它不是行業里最大的模型。但它是行業里第一個把「密度優先」當作公司方法論來執行的團隊。

而當Meta和METR在2026年4月這一周用各自的方式驗證密度定律時,這家2024年就開始按這套方法論訓練模型的中國公司,其實已經領先了兩年的工程經驗。

這一次,中國研究者站在了曲線的起點

一個中國研究團隊兩年前提出的理論框架,正在被Meta、METR這些海外最嚴肅的機構,用他們各自的方式,一次次重新發現。

這件事的份量,可能需要一點時間才能完全理解。

它不是一個「我們也行」的故事。它是一個「我們更早一點看見」的故事。

科學史上這樣的瞬間不算多。一個在2024年被懷疑的判斷,在2026年變成了多個獨立證據指向的同一條曲線。

這種跨地域、跨方法、跨機構的「不約而同」,在物理學里發生過幾次,每一次都標志著一個舊范式的終結和一個新范式的開始。

中國AI研究者這一次站在了那個起點上。

而那條曲線,還在以每88天翻一倍的速度往上走。

參考資料:

面壁智能首創的「密度定律」,獲 Meta 等海外頂級機構認可

https://arxiv.org/abs/2412.04315

https://www.nature.com/articles/s42256-025-01137-0

https://metr.org/blog/2026-1-29-time-horizon-1-1/

https://ai.meta.com/blog/introducing-muse-spark-msl/

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
普京訪華行程敲定,特朗普已下命令,中國向全球通告,無懼美國

普京訪華行程敲定,特朗普已下命令,中國向全球通告,無懼美國

桑啟紅原
2026-04-20 20:19:05
美專家:美國在伊朗正面臨四個大問題

美專家:美國在伊朗正面臨四個大問題

環球時報國際
2026-04-21 00:16:12
國際奧委會明確表態,對2036年奧運會的申辦情況很是失望

國際奧委會明確表態,對2036年奧運會的申辦情況很是失望

安安說
2026-04-20 11:09:20
哈登16+2!騎士54-48猛龍,看數據:他才是頭號功臣!

哈登16+2!騎士54-48猛龍,看數據:他才是頭號功臣!

運籌帷幄的籃球
2026-04-21 08:12:30
日本將地震震級調整至7.5級

日本將地震震級調整至7.5級

界面新聞
2026-04-20 16:30:33
罰15億!拼多多一員工故意關門,對抗調查,導致執法人員手指骨折

罰15億!拼多多一員工故意關門,對抗調查,導致執法人員手指骨折

魔都姐姐雜談
2026-04-19 08:03:27
中央層面整治形式主義為基層減負專項工作機制辦公室 中央紀委辦公廳公開通報4起整治形式主義為基層減負典型問題

中央層面整治形式主義為基層減負專項工作機制辦公室 中央紀委辦公廳公開通報4起整治形式主義為基層減負典型問題

新華社
2026-04-20 17:44:02
“巴掌遮陽帽”在TikTok刷屏、義烏緊急跟進,利潤翻了近10倍

“巴掌遮陽帽”在TikTok刷屏、義烏緊急跟進,利潤翻了近10倍

去山野間追風
2026-04-21 03:16:20
撤下主力放棄比賽,替補卻反敗為勝!哈登都看傻了

撤下主力放棄比賽,替補卻反敗為勝!哈登都看傻了

林子說事
2026-04-21 02:26:26
“找到一個媳婦算你牛”,農村家長曬7兒1女,被群嘲后看清現實

“找到一個媳婦算你牛”,農村家長曬7兒1女,被群嘲后看清現實

妍妍教育日記
2026-04-20 19:42:54
歐爾班下臺,這個歐洲國家卻可能再次擁抱一位親俄領導人

歐爾班下臺,這個歐洲國家卻可能再次擁抱一位親俄領導人

上觀新聞
2026-04-20 15:58:42
睡一覺5萬沒了!全國多地爆發新型盜刷,睡前必查手機這4處

睡一覺5萬沒了!全國多地爆發新型盜刷,睡前必查手機這4處

洞見小能手
2026-04-20 16:03:26
冠心病去世的越來越多,建議:1不喝、2不碰、3堅持,別大意了

冠心病去世的越來越多,建議:1不喝、2不碰、3堅持,別大意了

芹姐說生活
2026-04-20 16:10:12
中國高校只剩7年窗口期 學生數量斷崖式塌方后一半高校都得死

中國高校只剩7年窗口期 學生數量斷崖式塌方后一半高校都得死

六子吃涼粉
2026-04-20 19:10:49
高市早苗向靖國神社獻祭品

高市早苗向靖國神社獻祭品

新華社
2026-04-21 05:59:03
拼多多暴力抗法震驚全網,市值萬億巨頭為何如此囂張

拼多多暴力抗法震驚全網,市值萬億巨頭為何如此囂張

燕梳樓頻道
2026-04-20 21:12:04
普通家庭千萬不要買“小聯排別墅”,看著很高級,住著卻難受!

普通家庭千萬不要買“小聯排別墅”,看著很高級,住著卻難受!

裝修秀
2026-04-20 10:50:03
震驚!網傳深圳中專打工女偽造百億富三代人設,收割尊界S800車主

震驚!網傳深圳中專打工女偽造百億富三代人設,收割尊界S800車主

火山詩話
2026-04-20 13:37:00
欲哭無淚!47歲男子赴深圳求職一個月無果,住低價旅館,一日一餐

欲哭無淚!47歲男子赴深圳求職一個月無果,住低價旅館,一日一餐

火山詩話
2026-04-21 06:36:18
丈夫騎車躲狗摔倒致妻死亡,家屬起訴違停車主124萬,法院判了

丈夫騎車躲狗摔倒致妻死亡,家屬起訴違停車主124萬,法院判了

大魚簡科
2026-04-20 19:38:39
2026-04-21 08:23:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15021文章數 66791關注度
往期回顧 全部

科技要聞

重磅官宣:庫克卸任,特努斯接任蘋果CEO

頭條要聞

特朗普兩天三次反轉 伊朗學習特朗普玩起"極限施壓"

頭條要聞

特朗普兩天三次反轉 伊朗學習特朗普玩起"極限施壓"

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經要聞

利潤暴跌7成,字節到底在做什么

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態度原創

本地
時尚
手機
教育
公開課

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

春天衣服不用準備太多!這幾大單品提前備好,百搭實用又不過時

手機要聞

蘋果被曝下調 iPhone 18 規格以壓縮成本

教育要聞

加權費馬點模型,一個視頻學明白!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版