无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

OpenAI塌房！Scaling law原作曝bug，萬億算力全白燒

2026-07-05 12:45:19　來源: 新智元

北京舉報

0

分享至

新智元報道

【新智元導讀】DeepMind研究員深夜爆料：OpenAI的Scaling Law原始論文竟有致命bug！全球AI白白燒掉萬億算力，GPT-3其實嚴重「虛胖」。

OpenAI誤導了整個AI圈好幾年！

過去五年，整個AI行業都被Scaling Law推著往前沖。

奧特曼堅信AGI的底氣就來自這條曲線。

現在，有人站出來說：這條曲線，一開始就錯了。

不是事后諸葛。說這話的，是當年就在OpenAI做大模型優化的研究員Diogo Almeida。

剛剛，他發出一篇博客，標題冷得發指——《Scaling Laws, Honestly》。

開頭一句直接把話說死：最初那版scaling law是錯的，因為存在一個bug。

傳送門：https://www.completeskeptic.com/p/scaling-laws-honestly

DeepMind那位以擴散模型封神的Sander Dieleman，轉頭就在推特上把它頂了上去，說這是一段有意思的LLM往事：

原始scaling law因為一個bug而錯了，大概率害得業界在一堆「體量過大、訓練不足」的模型上，白白燒掉了海量算力。

一個bug，燒掉兩年。

當bug被撕開，我們看到的，不僅是算力的黑洞，更是一條被語言本身重塑的、遠比想象中更深刻的智能邊界。

Scaling Law竟是LLM版「地心說」

2020年，OpenAI給出結論：在固定的算力預算下，你應該優先把模型做大，而不是拿更多數據去喂它。

用公式說，最優參數量正比于算力的0.73次方——參數，是那個更該猛沖的變量。

這句話，直接定義了GPT-3那一代的長相。堆參數。往死里堆。1750億。

它告訴全世界的開發者：別問，問就是堆參數；只要你把模型做得足夠大，神跡就會發生。

兩年后，DeepMind甩出Chinchilla，把這個結論掀了個底朝天：模型和數據，應該差不多同等重要地一起放大，大約每個參數配20個token才劃算。

他們訓了一個700億參數的Chinchilla，喂了1.4萬億token——體量不到GPT-3的一半，數據是它的四倍多。

結果，同樣的算力預算，全面反超2800億參數、卻只喂了3000億token的Gopher。

翻譯成人話：同樣一筆錢，一個把它養成了"虛胖"的壯漢，一個把它練成了精瘦的拳手。

拖更三年，北大校友翁荔深入探討了后續研究中對兩者差異的主流解釋，即差異在于他們計算參數總數的方式。

而這還沒完。就連「正確」的那個Chinchilla，自己也不干凈。

2024年，Besiroglu等人把Chinchilla原文的數據點扒出來重跑，發現它自己那套擬合里也藏著bug:

優化器里的loss尺度設得過高，把Huber損失按樣本求了平均、而不是求和，導致擬合過早終止。

糾正bug的論文，自己帶著另一個bug。

到這兒，那句被無數人掛在嘴邊的「第一性原理」，忽然有點站不住了。

所謂Scaling Law，從來就不是牛頓三定律那種鐵打的物理規律，它只是一條經驗擬合出來的曲線。

當Diogo Almeida認為真相并非如此，不是方法不一樣，「是最初那版scaling law本身有個bug。」

OpenAI三招騙了全球AI同行？

要制造一個讓全球AI集體相信的謊言，只需要三步。

第一步：囚禁數據。

OpenAI論文給所有模型——不管它是還在學習走路的孩子（小模型），還是已經長成巨人的模型，喂了完全相同的「飯量」。大約130B tokens數據。

小模型因此被「喂飽」甚至「撐到」，而真正需要海量數據來填滿其容量的大模型，卻在同一token預算下嚴重營養不良。

Chinchilla論文后來一針見血地指出：他們對所有模型使用了「對所有模型使用了固定的訓練Token數和學習率調度方案。」（fixed number of training tokens and learning rate schedule）。

這就像讓幼兒園小朋友和博士生用同一張試卷、同一時間考試，然后宣稱「成績只與天賦有關」。

第二步：掩耳盜鈴的LR衰減。

他們使用了余弦學習率衰減（Cosine Decay），讓學習率在訓練接近終點時平滑地趨近于零。

訓練快到預設的終點時，學習率被人為地一點點摁到零，模型的進步自然就「平」下來了。

曲線一走平，看上去就像：這模型已經學到頭了，再喂也沒用了。

研究者們于是得出結論：「加數據沒用了，模型已經飽和。」

這不是模型的極限，這是學習率把模型的成長之路人為掐斷。它制造出一種完美的假象：性能已經到達天花板，再加數據也無用。

可我們現在知道，那些大模型根本沒到頭。

第三步：權威的傲慢。

第三步，也是最陰的一步：論文里寫了一句，結果「基本不受學習率曲線影響」（largely independent of learning rate schedule）。

雖然包括當時在OpenAI的Diogo Almeida的不少人都隱約感覺到不對勁，但在固定token上限下，這個結論技術上正確。

可它偏偏不適用于scaling law真正想描述的那個「數據無限」的理想世界。

他們把有限條件下的局部真理，當成了普適的宇宙法則。

三步疊在一起，你就得到了一條既錯、又極難debug的定律。

連Diogo自己都承認：當年他也在OpenAI做優化，也沒看出這個bug——那條學習率曲線看著太像是「精心設定」的了，誰會去懷疑呢。

GPU被白白浪費

算力錯配嚴重

受OpenAI錯誤公式的指引，AI行業進入了「大力出奇跡」的時代。

這意味著在過去的幾年里，全球最聰明的頭腦、最稀缺的算力，都浪費在了無效的規模擴張上。

這不僅僅是錢的問題，這是在通往AGI（通用人工智能）的生死時速中，人類因學習率設置，集體在錯誤的跑道上狂奔了數千公里。

如果說Bug的發現讓人心痛，那么隨后引出的深度反思則讓人不寒而栗。

研究者Adam Zachary Wasserman指出了一個被所有人忽略的盲點：即便公式修正了，目前的Scaling Law也只是「英語Scaling Law」。

他做了一個反直覺的實驗：用同樣的架構、同樣的算力訓練模型。

結果發現，法語模型達到某種語法能力的效率，竟然比英語模型高出50到100倍。

為什么？因為英語是一種「形態貧乏」的語言。

它太依賴分布規律，需要模型在海量數據中去猜詞義；而像法語、中文這種形態豐富或結構嚴密的語言，在詞匯本身就帶有大量明確信息。

這意味著，我們現在所有的算力配比方案，都是基于一種最「吃數據」、最低效的語言制定的。

當你以為你在探索「通用智能」的物理定律時，你其實只是在測量「英語這門語言有多浪費算力」。

這就像是你試圖通過研究一頭豬的胃口來制定全宇宙生物的營養標準——這不僅是偏見，更是認知的局限。

我們本可以用更小的模型、更多的優質數據，實現更強的性能。

我們本可以節省下數以萬計的H100運行時的電力和熱量。

我們本可以提前兩年進入「高效AI」時代。

參考資料：

https://www.completeskeptic.com/p/scaling-laws-honestly

https://lilianweng.github.io/posts/2026-06-24-scaling-laws/

編輯：大衛

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

并購激勵金都不要了？Windsurf核心工程師離開DeepMind

機器之心Pro 2026-05-25 20:37:38
0 跟貼 0
DeepMind之父驚人自白：我造的AI可能滅絕人類，但已無人能停下

新智元 2026-03-30 21:26:17
365 跟貼 365

AI智能體不是越多越強：信息冗余構成了LLM Agent Scaling的瓶頸

機器之心Pro 2026-02-27 14:45:03
1 跟貼 1

安心養蝦！從OpenClaw 看云上AI安全落地路徑

量子位 2026-04-18 19:55:39
0 跟貼 0
給Transformer變個形，LLM竟能變得更聰明

機器之心Pro 2026-06-29 18:39:15
0 跟貼 0

李飛飛、Jim Fan、徐丹飛聯手，給具身智能指了一條新路

鈦媒體APP 2026-07-05 09:29:08
2 跟貼 2

亦莊機器人馬拉松現場名場面合集

量子位 2026-04-20 00:34:54
0 跟貼 0
大神程序員蒸餾自己，用16個skill給AI注入軟件工程之魂

量子位 2026-05-12 03:08:58
0 跟貼 0

LLM數據量大管飽，機器人數據卻連1%的起跑線都沒夠到？

量子位 2026-04-13 20:54:19
0 跟貼 0
AI Agent是科技革命中的一次真正的范式轉移

量子位 2026-04-03 22:52:35
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
Agent輸出到底該用誰？卡帕西轉發：試試讓AI輸出HTML

量子位 2026-05-13 07:19:50
0 跟貼 0
表格建模也能Scaling？樹模型的時代要改變了

機器之心Pro 2026-04-17 11:12:25
0 跟貼 0
王曉野：Working Agent將是下一個爆發點

量子位 2026-05-21 08:05:51
0 跟貼 0
一家BI公司，當下決定轉型

鈦媒體APP 2026-07-05 09:18:14
0 跟貼 0
邱錫鵬：未來我們一定會進入泛情境智能時代

量子位 2026-05-21 08:04:26
0 跟貼 0
“AI領域最被濫用的術語”李飛飛終于把世界模型講明白了

量子位 2026-06-07 04:37:43
0 跟貼 0
Anthropic的AI讀心術，讓人類讀懂大模型在想啥

量子位 2026-05-10 23:00:57
0 跟貼 0
讓你的龍蝦秒變電影《Her》里的Samantha

量子位 2026-03-23 20:37:07
0 跟貼 0
對談樓天城：Harness會成為AI時代最關鍵的能力之一

量子位 2026-05-06 15:41:08
0 跟貼 0
國外人模仿中國舞獅，國人沒勇氣看下去，公式正確答案錯誤

瘋狂星期四笑料館 2026-07-04 15:45:15
1 跟貼 1
23歲4年逆襲，奧特曼連人帶公司全買了！

新智元 2026-07-04 16:33:04
38 跟貼 38
拒絕大力出奇跡，PRISM框架讓dLLM也能高效Test-Time Scaling

機器之心Pro 2026-05-11 14:28:29
0 跟貼 0
馮德萊恩：中歐對話結果必須令人滿意否則將進行報復

澎湃新聞 2026-07-05 07:08:04
11516 跟貼 11516
數學公式解析盛宴：趣味講解，輕松掌握！

只若初見h 2026-07-03 00:48:59
1 跟貼 1
泰山景區回應修建滾筒式刀片刺繩隔離鐵絲網：與正常游覽路線不交叉不重疊

北京日報客戶端 2026-07-02 08:55:17
19463 跟貼 19463
OpenAI提議向美國政府出讓5%股權

新智元 2026-07-04 16:31:19
0 跟貼 0
美劇尺度就是開放

娛樂簡單爆 2026-07-02 07:50:04
1 跟貼 1
船都繞著走，“再不治理遲早出大事”

中國新聞周刊 2026-07-04 19:46:11
5894 跟貼 5894
河南80后男子帶村民養蟬，高峰期一晚上可抓1.2萬只：每晚摸三輪爬叉，抓到4小時內冷凍

環球網資訊 2026-07-05 08:36:34
2573 跟貼 2573
莫德里奇炮轟判罰尺度雙標！無奈苦笑：換我們點球不會判

環太平洋老正太 2026-07-03 20:42:47
1 跟貼 1
金屬大黃蜂拼裝！314零件可動！高端禮品超酷#模型拼裝 #大黃蜂模型

制造科技 2026-06-30 21:37:21
0 跟貼 0
頂級權斗暗藏玄機，終極陰謀浮出水面，電影詮釋真正尺度

菠菜不算愛 2026-06-30 21:18:47
1 跟貼 1
全球最大數據中心建設，終止了

上觀新聞 2026-07-05 06:41:18
32 跟貼 32
楊紫、鄧為、張晚意、周也、郭宇欣、陳妍希、陳曉、移動云AI

笑一個吧 2026-07-05 02:03:01
2 跟貼 2
很多人發明水上戰艦模型，在公園小河中比賽，這是普通人的戰役！

鬧心觀點 2026-07-04 16:08:52
0 跟貼 0
加拿大美女逛中國，感慨空氣香甜科技先進被深圳人工智能驚掉下巴

文客談史 2026-07-02 09:49:36
1 跟貼 1
圖靈獎得主Sutton：用1967年的公式，解決流式強化學習一大缺陷

機器之心Pro 2026-05-11 09:55:21
0 跟貼 0
鈉電池取代鉛酸電池？錯了，真正被逼退的是鋰電池，鉛酸反而穩了

電動車的那些事兒 2026-07-05 07:59:30
3 跟貼 3
超高清鏡頭下，雄鷹海上極限捕撈，強者從不抱怨環境

歡樂笑料站 2026-07-04 11:38:09
1 跟貼 1

淺黃修身長袖+白色微喇褲｜熟女人妻通勤穿搭，面料勾勒飽滿曲線

淺黃修身長袖+白色微喇褲｜熟女人妻通勤穿搭，面料勾勒飽滿曲線

只要高興就好

2026-07-04 09:29:24

外媒中國KJ-500已經超過50架！數量比全球總和還多

外媒中國KJ-500已經超過50架！數量比全球總和還多

矚望云霄

2026-07-02 18:19:06

太離譜！林更新只是來客串綜藝，硬生生把飛行嘉賓玩成主場

太離譜！林更新只是來客串綜藝，硬生生把飛行嘉賓玩成主場

鄉野小珥

2026-07-05 08:52:15

國足天塌了！佛得角足協希望和中國隊打友誼賽，結果會如何？

國足天塌了！佛得角足協希望和中國隊打友誼賽，結果會如何？

文刀貳

2026-07-04 23:15:30

賽后巴拉圭門將想與姆巴佩握手，姆巴佩無視并在他面前開始慶祝

賽后巴拉圭門將想與姆巴佩握手，姆巴佩無視并在他面前開始慶祝

懂球帝

2026-07-05 08:14:18

大戰當前怕違規，墨西哥隊將士退還收到的價值百萬美元的勞力士手表，贈送者為一美國網紅

大戰當前怕違規，墨西哥隊將士退還收到的價值百萬美元的勞力士手表，贈送者為一美國網紅

紅星新聞

2026-07-05 14:16:21

南美第2蹊蹺出局，英格蘭或轟然倒下，球迷：冠軍提前預定了？

南美第2蹊蹺出局，英格蘭或轟然倒下，球迷：冠軍提前預定了？

我就是一個說球的

2026-07-04 16:53:46

姆巴佩：我可以把手伸進屎里！謝爾基：姆總別伸手一頭扎進去

姆巴佩：我可以把手伸進屎里！謝爾基：姆總別伸手一頭扎進去

念洲

2026-07-05 08:46:09

2022年港獨分子逃亡英國，每天一頓飯付不起房租，最終留遺書自盡

2022年港獨分子逃亡英國，每天一頓飯付不起房租，最終留遺書自盡

流史歲月

2026-07-03 14:30:08

“臺獨記者”范琪斐，狂黑大陸幾十年，親赴大陸后下場大快人心

“臺獨記者”范琪斐，狂黑大陸幾十年，親赴大陸后下場大快人心

舊事別提

2026-07-05 10:29:57

文娛榜第一！短劇頂流郭宇欣錄音流出：“我和周也還不一定誰蹭誰呢”

文娛榜第一！短劇頂流郭宇欣錄音流出：“我和周也還不一定誰蹭誰呢”

新腕兒

2026-07-04 16:34:05

知名連鎖餐飲，爆雷？

中國新聞周刊

2026-07-04 13:34:25

重磅！蘇群曝杜鋒下課，新去向出爐，球迷喊話楊鳴接手，能行嗎？

重磅！蘇群曝杜鋒下課，新去向出爐，球迷喊話楊鳴接手，能行嗎？

萌蘭聊個球

2026-07-05 13:30:30

快訊！臺灣官員:大陸又有新動作了！

快訊！臺灣官員:大陸又有新動作了！

故事終將光明磊落

2026-07-05 12:10:21

別硬扛高溫！1.5匹空調開24小時，電費真相讓你大跌眼鏡

別硬扛高溫！1.5匹空調開24小時，電費真相讓你大跌眼鏡

小兔子發現大事情

2026-07-04 16:22:21

特殊規則助力絕境重生！蒯曼4-3佐藤瞳，為師姐復仇約戰張本美和

特殊規則助力絕境重生！蒯曼4-3佐藤瞳，為師姐復仇約戰張本美和

釘釘陌上花開

2026-07-05 12:00:28

360萬元法拉利被4名兒童劃損，最新進展：4名家長均已道歉，共計賠償2萬元，車主表示將不再追究責任

360萬元法拉利被4名兒童劃損，最新進展：4名家長均已道歉，共計賠償2萬元，車主表示將不再追究責任

大風新聞

2026-07-04 09:50:03

伊布：C羅3場禁賽被撤銷！國際足聯總給他和葡萄牙優待萊萬轉發

伊布：C羅3場禁賽被撤銷！國際足聯總給他和葡萄牙優待萊萬轉發

念洲

2026-07-05 10:30:01

第十四屆全國政協委員、國家發展改革委原黨組成員、國家能源局原黨組書記、局長章建華到綠能公司調研

第十四屆全國政協委員、國家發展改革委原黨組成員、國家能源局原黨組書記、局長章建華到綠能公司調研

新浪財經

2026-07-05 03:43:01

韓紅深陷危機！百人援蒙送別現場輿論升級，網友怒斥不容造神作秀

韓紅深陷危機！百人援蒙送別現場輿論升級，網友怒斥不容造神作秀

火山詩話

2026-07-04 09:40:29

AI產業主平臺領航智能+時代

15610文章數 66948關注度

往期回顧全部

科技要聞

華為：邏輯折疊將大幅提升麒麟CPU核心頻率

頭條要聞

日本史上最年輕民選女市長因休16周產假遭全國圍攻

頭條要聞

日本史上最年輕民選女市長因休16周產假遭全國圍攻

體育要聞

姆巴佩點走巴拉圭：巴黎三代左鋒傳承

娛樂要聞

王力宏成都舞臺受傷仍然堅持三小時

財經要聞

揭秘跨境“對敲”換匯黑產

汽車要聞

方程豹鈦9內飾曝光用上了長聯屏設計/下半年上市

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產

教育

藝術

公開課

軍事航空

房產要聞

總裁空缺17個月、現金缺口超1000億：金融局“局外人”入局萬科

教育要聞

暑假想廢掉一個孩子，就讓他長期宅在恒溫26度的家里

藝術要聞

24幅當代畫家靜物油畫

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
布洛芬是怎么給人止痛的？
李彥宏：百度離破產30天

軍事要聞

普京與特朗普通話85分鐘細節公布

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<output id="xhofe"><source id="xhofe"></source></output>