網易首頁 > 網易號 > 正文申請入駐

AGI為什么不會到來？這位研究員把AI的“物理極限”講透了

2025-12-17 19:46:08　來源: 硅基觀察Pro

北京舉報

分享至

AGI 會不會到來？

這是AI 行業里反復被討論、卻一直始終缺乏清晰論證的問題。

最近，西雅圖艾倫人工智能研究所（AI2）的研究員蒂姆·德特默斯（Tim Dettmers）在一篇文章，題目很直接——《為什么 AGI 不會實現？》。

蒂姆·德特默斯

在這篇文章中，他提出了一個被長期忽視、卻至關重要的前提：

計算并不是抽象概念，而是一件徹底受物理規律約束的事情。

這意味著，智能的提升并不是“想象空間”問題，而是繞不開能量、帶寬、存儲、制造和成本的物理限制。

德特默斯認為，當下市場對AGI 的判斷普遍偏樂觀，一個關鍵原因在于：

很多討論只停留在模型、參數和算法層面，卻忽視了支撐這些能力的物理基礎正在逼近極限。

在文章中，德特默斯第一次從物理約束的角度，系統性地解釋了為什么AGI 面臨一系列難以回避的現實。這些判斷，也有助于我們更好地理解當前的AI行業。

他在文章中總結了幾條關鍵判斷：

1）Transformer 的成功并非偶然，而是在當前物理約束下接近最優的工程選擇，繼續通過架構改進獲得的邊際收益正在快速下降。

2）當下大量所謂“創新”，本質仍是既有框架上的漸進改進，很難帶來結構性躍遷。

3）AI 過去的 Scaling Law 很大程度上依賴GPU的性能紅利，而GPU“可壓榨空間”正在接近尾聲。

4）真正的AGI 不只是認知能力問題，還必須具備在現實世界中執行具有經濟意義工作的能力，而這一領域恰恰最受物理與成本約束。

以下內容為蒂姆·德特默斯文章的編譯，略有刪減。

被物理極限“鎖死”的AGI

關于AGI、超級智能、擴展定律的討論，尤其在灣區，有一個長期被忽視的問題：這些討論大多停留在觀念層面，而非物理現實之中。

很多人談論通用人工智能、超級智能，習慣把它們當成純粹的抽象概念，像做哲學思想實驗一樣推演未來：參數還能不能再大？算力還能不能繼續堆？智能會不會指數級自我進化？

但這套思維，本身就建立在一個根本性的誤解之上——計算不是抽象的，它是物理的。

要理解這一點，先看一個最基礎的事實：高效計算，始終在做兩件事的平衡。

一是把分散在各處的信息，搬運到計算發生的地方；

二是把局部計算的結果，再重新匯聚成新的信息。

問題在于，計算本身是便宜的，信息移動是昂貴的。

隨著晶體管尺寸變小，單次計算的成本持續下降。但信息在芯片內部、在不同存儲層級之間移動，其成本卻會隨著距離呈平方級增長。這是一個繞不開的物理規律。

緩存層級就是最直觀的例子。

L1、L2、L3 緩存用的是同樣的工藝，但性能差異巨大：L1 最快、容量最小；L3 最大、卻慢得多。原因并不復雜：離計算核心越遠，訪問成本越高。

因此有兩個結論非常重要：

第一，更大的緩存，必然更慢；

第二，隨著制程進步，芯片上“算力”的成本在下降，但“內存”和“帶寬”的成本反而在上升。

今天的高端芯片設計中，真正用于“計算”的邏輯單元，其實只占很小一部分。絕大多數硅面積，都被用在了存儲、互連和數據通路上。

當然理論上仍然可以設計一顆擁有10 exaflops 算力的芯片，但如果沒有與之匹配的內存系統，這些算力大多只會閑置，變成“無用的浮點運算”。

這一點，在很多關于算力的敘事中被刻意忽略了。

把這個現實放回AI 架構上，就會發現一件事：

Transformer 的成功，并不是算法上的偶然，而是在當前物理約束下接近最優的工程選擇。

它的核心計算模式，恰好對應了當前硬件條件下最“劃算”的兩類操作：

一類是局部計算（MLP）；

另一類是受限形式的全局信息匯聚（注意力機制）。

Transformer當然不是“理論上最優”的智能結構，但在現實硬件條件下，它可能已經非常接近物理意義上的最優解。

這意味著，你可以繼續在Transformer上做改進，但每一步的收益都會越來越小。

類似的限制不止存在于硅基計算里，也同樣發生在我們人類身上。

神經科學早已發現：一個物種能擁有多少神經元，幾乎可以由其長期穩定的能量攝入精確推算。人類通過烹飪，突破了原始能量獲取的限制，但也僅止于此。

我們的智力并非無限擴展的結果，而是剛好卡在能量、代謝和生育之間的平衡點上。

如果人類的大腦再大一些，問題并不在于頭骨或產道，而在于能量供給：

我們將無法在孕期同時維持兩個高能耗大腦的生存。這意味著，人類智能本身就是一道被能量約束鎖死的物理上限。

數字計算也正在走向類似的邊界。

算力還會增長，工程還會優化，但把這些變化解讀為“智能可以無限外推”，本身就是一種脫離物理現實的想象。

低垂果實已摘完了

幾乎所有成熟領域的研究，最終都會收斂到同一個結論：

線性的進步，往往需要指數級的資源投入。

這句話翻譯成白話就是：如果你想讓一個系統持續變得更精確、更高效、更強大，那么每往前走一步，所需要付出的成本都會比上一步高得多。

背后原因并不復雜。在物理世界里，任何有效結果，都依賴資源在時間和空間上的聚集。要產生線性規模的效果，你至少需要線性規模的資源。

但隨著系統規模變大，這些資源會在空間、時間和能量上發生競爭，協同效率不斷下降，最終表現為：投入增長得很快，產出卻增長得越來越慢。

在物理世界如此，在思想世界也一樣。

如果兩個想法彼此完全獨立，它們的疊加效果可能是倍增的；但一旦想法之間存在依賴關系，邊際收益就會迅速下降。

絕大多數“新想法”，并不是從零開始，而是建立在已有框架之上的改進。即便這個改進再聰明，它所能帶來的提升也往往是漸進式的。

當一個領域足夠成熟時，這種現象會變得非常明顯。

即使你看似提出了“完全不同”的方法，它們往往仍然在解決同一個核心問題。

比如，看起來路徑不同的狀態空間模型和 Transformer，本質上都在處理“如何高效建模長程依賴”這個問題。

在這樣的背景下，任何對同一機制的改進，都只能帶來有限收益。

這種約束，在物理學中表現得最為殘酷。一位頂尖理論物理學家曾這樣形容這個處境：

如果一個想法被限制在同一個子領域內，那么幾乎不可能產生真正有意義的突破。因為該想的，早就被想過了；而那些看似天馬行空的創意，往往只是重新排列了既有規則，并沒有觸及根本問題。

實驗物理則從另一個角度揭示了這種邊界。

為了驗證更深層的物理規律，我們不得不建造越來越昂貴、越來越復雜的實驗裝置。大型強子對撞機耗資數十億美元，但帶來的更多是對理論的排除，而不是明確的新答案。

這并不一定意味著我們“不夠聰明”，而更可能意味著：某些問題本身，就被資源和復雜度鎖在了我們目前無法觸及的層級之外。

最終，我們一次又一次回到同一個現實判斷：

當一個系統進入成熟階段后，想要獲得線性的改進，往往必須付出指數級的資源代價。

這既是科學研究的邊界，也是技術、算力和智能擴展所共同面對的硬約束。

GPU已經被“榨干”了

另一個影響極大的誤解是：人們默認硬件會一直線性進步。

過去十多年，AI 的幾次關鍵躍遷，確實都踩在了GPU性能提升的節奏上。

AlexNet 的成功，本質上是CUDA + GPU跑通了卷積網絡的結果。此后，無論是更深的CNN，還是Transformer的規模化訓練，幾乎都依賴兩個變量：單卡性能提升+GPU數量增加。

于是，一個非常自然的敘事形成了：GPU 越來越強，推動AI 越來越強。

但問題恰恰在這里。GPU 并不是在“持續進步”，而是在逐步逼近物理和工程的邊界。

如果回頭看，會發現GPU 真正快速提升的階段，大概在 2018 年左右已經結束。

此后我們看到的“進步”，更多是通過一系列一次性、不可重復的工程紅利換來的：

最早是FP16，然后是 Tensor Core（或等價的矩陣加速單元），再往后是 HBM 高帶寬內存，接著是更激進的數據搬運機制（如 TMA），再然后是 INT8、INT4 甚至更低比特寬度。

這些手段，本質上都在做同一件事：用精度換吞吐，用工程技巧壓榨邊界。

問題在于，這條路是有限的。

從計算物理和信息論角度看，在特定塊大小、訪存模式和調度結構下，最優的數據類型和計算布局是可以算出來的。

這些結論并不神秘，也早已被論文系統性地討論過。現在的硬件廠商，事實上已經把這些“可壓榨的空間”基本用完了。

繼續往前走，不再是“免費性能提升”，而只剩下權衡：

要么犧牲計算效率，換更小的內存占用；

要么犧牲內存效率，換更高的計算吞吐。

無論選哪條路，都不再帶來數量級上的提升。這并不意味著硬件已經“停止進化”，而是意味著：

硬件不再是那個能持續兜底一切問題的變量了。

在這個背景下，很多人的注意力開始轉向機架級、數據中心級的系統優化。

這一步確實重要，比如高效的KV cache 傳輸、節點間通信、內存拓撲設計，都是當前推理成本的關鍵瓶頸。

但這里同樣存在一個現實限制。

從系統工程角度看，真正高效的設計空間其實非常有限。你可以在實現上做得更極致，但在結構上，往往只有一到兩種接近最優的方案。它們難度高、工程量大，但并不神秘，也不存在“顛覆性架構”。

這也是為什么無論是OpenAI，還是其他前沿實驗室，在基礎設施層面更多體現的是執行力和規模，而不是不可復制的系統優勢。

即便通過機架級或數據中心級優化獲得領先，這種優勢也往往是暫時的。

隨著行業跟進，這些改進會迅速擴散、被吸收。可能在2026年，也可能在2027年，這部分紅利就會基本被吃完。

歸根結底，這一切指向同一個結論：

AI 的下一個階段，不能再假設“硬件會繼續把問題解決掉”。

GPU 曾經是推動智能躍遷的核心杠桿，但這個杠桿，正在失去它的長度。

/ 04 /

Gemini3，是一個拐點信號

我最近在推特上討論了一個判斷：Gemini 3，可能標志著這一輪AI 發展正在接近階段性停滯。

不少回復認為我太悲觀了，說一句話概括就是：“規模化不是還在起作用嗎？”

問題在于，這里真正需要討論的，并不是“規模化有沒有用”，而是規模化還能用多久、以什么代價繼續起作用。

真正發生變化的是成本結構。

過去十多年，我們之所以能在模型規模上持續推進，并不是因為擴展本身變得“更高效”，而是因為GPU的指數級性能提升，抵消了擴展所需的指數級資源投入。

換句話說，過去是線性成本，帶來線性回報。現在變成了指數級成本，帶來勉強的線性回報。

這本身并非不可接受，但它清晰地劃定了一個邊界：擴展不再是一個“可以無限外推”的策略，而是一個正在快速逼近物理極限的手段。

在我看來，我們真正剩下的擴展窗口，可能只有一到兩年。

2025 年，單純靠擴展帶來的提升已經非常有限；如果 2026、2027 年沒有新的研究路徑或軟件層面的突破，那么擴展本身在物理上就會變得不可持續。

更微妙的問題在于：

當擴展帶來的邊際收益，開始低于研究和軟件創新帶來的收益時，硬件就會從資產變成負擔。

這并不是一個假設，而是已經開始出現的現實信號。

像MoonshotAI、Z.ai 這樣的公司已經證明：不需要天量算力，也能做到非常接近前沿模型的能力水平。

從個人體驗來看，我甚至更偏好Kimi K2的思考方式，而不是 Sonnet 4.5 在編碼上的“蠻力感”。這本身就說明：能力提升并不完全等同于規模擴張。

如果這些小團隊能在研究或工程上進一步突破規模限制，它們完全有可能在不擁有龐大基礎設施的情況下，做出最有競爭力的模型。

在推理側，它們甚至可以轉向如華為昇騰這樣的替代硬件——這些芯片在推理性能上已經足夠好。

這也引出了擴展基礎設施面臨的另一個系統性風險。

目前，大模型推理效率高度依賴“規模本身”：只有當GPU數量足夠多、用戶請求足夠密集時，計算、網絡通信和 KV cache 才能充分重疊，從而實現接近理論最優的利用率。

這意味著，只有擁有巨大用戶規模的公司，才能真正“用好”這些昂貴的前沿模型。

這也是為什么，開放權重模型目前并沒有在推理成本上徹底改寫格局——不是模型不行，而是部署成本要求一個同樣龐大的用戶池來攤薄。

但這里的關鍵在于：這是一個軟件問題，而不是物理問題。

vLLM、SGLang 等推理框架，主要針對的是前沿實驗室那種“超大規模部署”場景；在中小規模部署時，它們并不能提供同等級別的效率。

一旦出現更適合中等規模的推理棧，情況就會完全不同。

如果有人能讓一個3000億參數級別的模型，在較小規模下，也能接近 OpenAI 或 Anthropic 的推理效率，那么前沿實驗室在基礎設施上的護城河，可能會在極短時間內消失。

更何況，還有兩個變量在同時逼近：

一是小模型能力持續提升（比如GLM 4.6 這類趨勢）；

二是AI 應用越來越垂直、越來越專業化，對“通用前沿模型”的依賴正在下降。

在這種情況下，部署復雜度下降、開源推理棧成熟、硬件選擇多樣化，會讓整個系統迅速逼近物理最優解。

而一旦接近物理最優，規模優勢的溢價就會快速蒸發。

如果擴展速度放緩，那么下面三件事中的任何一件，都可能在短時間內顯著削弱AI 基礎設施的價值：

研究或軟件層面的突破

成熟、強大的開放權重推理棧

向其他硬件平臺遷移

從這個角度看，當前的趨勢對前沿實驗室并不友好。因為真正的競爭，很可能即將回到：研究深度、工程效率，以及對物理現實的敬畏。

/ 04 /

沒有身體的AGI，是一個偽命題

我注意到一個頻繁出現的現象：

當你問灣區的人“AGI 什么時候到來”，他們往往會給出一個相對樂觀的時間表——幾年之內、影響巨大、范式顛覆；

但當你追問“AGI 究竟是什么”，他們的定義幾乎總是停留在認知層面，既不包含體力勞動，也很少討論資源投入與物理約束。

這是一個關鍵缺失。

如果我們嚴格定義“通用人工智能”為能夠完成幾乎所有人類任務的系統，那么它就不可能只存在于文本框或服務器里。

真正的AGI，必然需要具備在現實世界中執行具有經濟意義工作的能力——也就是體力勞動。

而恰恰是這一部分，構成了人類經濟活動中規模最大、最復雜、也是最受物理約束的領域。

從現實來看，機器人技術并未走向“通用化”，而是高度分化。

在受控環境中，例如工廠，專用自動化系統已經極其成熟。中國的“工廠”已經證明：

在明確流程、固定場景下，專用機器人在效率、精度和成本上遠遠優于任何通用方案。這類系統并不需要“通用智能”，它們靠的是工程優化和流程確定性。

而在非受控環境中，許多看似“智能”的機器人任務，往往在經濟上并不成立。

例如給T 恤縫袖子、在復雜環境中疊衣服，這些任務在技術上困難、數據采集成本極高，但在現實中人類完成它們所需的時間和成本極低。

即便機器人在幾年后能夠完成這些動作，其產出質量、成本結構和維護復雜度，也很難構成真正的經濟優勢。

換句話說，機器人領域的問題并不主要是“能不能做”，而是“值不值得做”。

更重要的是，機器人學習的擴展規律，與大語言模型高度相似，卻面臨更嚴苛的現實約束。物理世界的數據采集昂貴、反饋稀疏、狀態空間巨大，這決定了其擴展速度遠慢于純數字環境。

結果是，自動化在工廠里高度成功，而在大多數日常體力勞動中，經濟回報極其有限。

這也引出了“超級智能”敘事的根本問題。

超級智能的核心假設是：一旦系統在智能水平上超過人類，就能夠不斷自我改進，最終形成失控式躍遷。

這一觀點源于牛津哲學傳統，并在灣區被進一步放大。但它忽略了一個基本事實——智能不是抽象存在，而是嵌入在物理系統中的能力。

任何系統的改進都需要資源。即便一個系統能更高效地利用資源，它依然無法逃脫規模定律的約束：

線性改進，往往需要指數級投入。通過引入一次性優化（例如新的數據類型、特殊硬件單元）確實可以暫時繞開收益遞減，但這些路徑本身也會很快耗盡。

因此，更合理的理解是：所謂“超級智能”并不會無限拓展能力邊界，而只是填補現有能力空白。這種填補是有價值的，但它帶來的是漸進改進，而非指數失控。

類似的誤判也出現在對硬件進步的預期上。

很多人假設，如果智能足夠強，它就能加速GPU、內存和系統架構的進化。

但現實是，GPU 的核心性能提升已經接近尾聲。未來的改進更多來自封裝、互連、HBM 演進和機架級工程優化，而這些都是高度資本密集、周期漫長的制造問題，并不存在“靠更聰明就能解決”的捷徑。

Transformer 架構本身也已經接近物理最優。大規模推理部署，更多是成熟工程問題，而非需要突破性創造力的研究領域。超級智能無法顯著重寫這些基本約束。

從這個角度看，超級智能或許能幫助AI 更快普及，但它并不是普及的決定性因素。真正限制 AI 經濟價值釋放的，從來不是能力上限，而是落地、部署與應用結構。

因此，任何將“超級智能”作為核心目標的組織，都可能在現實中遭遇持續的摩擦：高成本、低回報、難以轉化。相反，那些專注于降低部署門檻、推動經濟普及、嵌入真實流程的參與者，更可能在長期勝出。

歸根結底，人們常設想的AGI 并不會以神話般的方式降臨。它忽視了計算的物理約束、規模進步的真實成本，以及我們已經觸及的工程極限。

超級智能之所以被反復討論，并非因為它理論上穩固，而是因為它在回音室中構建了一種極具吸引力的敘事。

而AI 的真實未來，將由經濟可行性、實際應用與在物理限制下的持續改進共同塑造。越早接受這一現實，我們就越能把注意力從幻想，轉向真正能提高生產力與人類福祉的系統。

文/林白

PS：如果你對AI大模型領域有獨特的看法，歡迎掃碼加入我們的大模型交流群。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

2027年起小中高學制，將由633調整為532？多地教委明確回應了！

今朝牛馬

2026-06-12 17:30:23

悲哀！48歲媽媽因管教12歲女兒發生爭執，母女倆同日先后跳樓身亡

墨蘭史書

2026-06-12 20:40:04

雷軍犯天條了，竟然遭到整個中國家電行業集體圍剿。

流蘇晚晴

2026-06-12 13:02:17

世界杯才踢兩天，冠軍已經能看出來了，不是阿根廷也不是法國

童叔不飆車

2026-06-13 01:58:22

咖位再高沒用！張藝謀請不動的天后王菲獻唱，卻讓配角打動了

霽寒飄雪

2026-06-13 07:41:48

中小學入學迎來大調整，教育部門下發通知，2026年9月1日起實行

笑熬漿糊111

2026-06-12 00:05:41

16GB+512GB不到2000元，目前618值得撿漏的3款手機，公認低價高配

科技阿維

2026-06-13 22:31:37

英格蘭隊遭竊，物資整車被盜只剩一個球，此前曾傳其駐地安保頂級堪比“軍事堡壘”，防狙擊防無人機

極目新聞

2026-06-13 16:51:15

毫無底線具俊曄再撕大S隱私，20年前韓國小屋全程鏡頭拍攝引眾怒

瘋狂的豆芽

2026-06-13 13:36:36

股市里能賺錢的人，都完成了一次關鍵的認知躍遷

薛洪言

2026-06-11 08:04:18

萬噸大艦震懾菲律賓，連夜制裁菲防長，中國后招已為菲律賓安排了

聽風行江湖

2026-06-14 04:41:21

蒙古國外長給王毅發邀請，稀土外運日本一事，想聽聽中方想法

風笛悠揚聲

2026-06-13 11:58:07

保姆給中風父親洗澡，每次都要兩小時，我打開監控一看，果斷報警

千秋文化

2026-05-27 20:02:00

來中國避暑！還白吃白喝，印度身份不是擋箭牌

李云飛Afey

2026-06-12 23:25:24

百草枯發明者李德軍現狀：女兒喝百草枯喪命，70歲仍不斷救人贖罪

王姐懶人家常菜

2026-06-14 02:56:54

里程碑之戰破門，維尼修斯打入巴西國家隊生涯第10球

懂球帝

2026-06-14 06:48:08

官宣！廣州BRT不拆了！老廣們的通勤救星保住了！

小蜜情感說

2026-06-14 00:41:58

銀行工作人員提醒，60歲以上大額存款的老人，注意5件事

別人都叫我阿腈

2026-06-09 18:55:04

搬起石頭砸自己的腳！以為能搞垮董路，結果自己反被扒光底細

原夢叁生

2026-06-14 02:00:44

俄羅斯最大的弊病就是舍不得放下遠東！一旦放下，甚至能滿血復活

抽象派大師

2026-05-25 16:41:16

硅基觀察Pro

人工智能新時代的商業智庫和價值燈塔

917文章數 65關注度

往期回顧全部

科技要聞

SpaceX上市首日破2萬億美元，馬斯克再封神

頭條要聞

寶媽考編排名第一卻被低分者遞補維權后崗位直接取消

頭條要聞

寶媽考編排名第一卻被低分者遞補維權后崗位直接取消

體育要聞

美國4比1巴拉圭：這統治力真是美國隊？！

娛樂要聞

鄧超曬孫儷親手織的帽子，笑瘋全網！

財經要聞

梁文鋒向左，楊植麟向右

汽車要聞

深藍S07華為乾崑激光版增程車型上市限時15.49萬元起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

本地

時尚

公開課

軍事航空

LPL淘汰賽：就差一點，今天無奇跡！BLG五局戰勝WE，決賽見

本地新聞

AK劉彰邂逅河北南大港濕地

夏天穿衣要杜絕土氣感！試試精致的小香風，優雅與俏皮并存

公開課

手機 / 數碼

房產 / 家居

AGI為什么不會到來？這位研究員把AI的“物理極限”講透了

SpaceX上市首日破2萬億美元，馬斯克再封神

寶媽考編排名第一卻被低分者遞補 維權后崗位直接取消

寶媽考編排名第一卻被低分者遞補 維權后崗位直接取消

美國4比1巴拉圭：這統治力真是美國隊？！

鄧超曬孫儷親手織的帽子，笑瘋全網！

梁文鋒向左，楊植麟向右

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

LPL淘汰賽：就差一點，今天無奇跡！BLG五局戰勝WE，決賽見

AK劉彰邂逅河北南大港濕地

夏天穿衣要杜絕土氣感！試試精致的小香風，優雅與俏皮并存

伊外長披露伊美諒解備忘錄草案部分內容

寶媽考編排名第一卻被低分者遞補維權后崗位直接取消

寶媽考編排名第一卻被低分者遞補維權后崗位直接取消

深藍S07華為乾崑激光版增程車型上市限時15.49萬元起