![]()
AGI 會不會到來?
這是AI 行業里反復被討論、卻一直始終缺乏清晰論證的問題。
最近,西雅圖艾倫人工智能研究所(AI2)的研究員蒂姆·德特默斯(Tim Dettmers)在一篇文章,題目很直接——《為什么 AGI 不會實現?》。
![]()
蒂姆·德特默斯
在這篇文章中,他提出了一個被長期忽視、卻至關重要的前提:
計算并不是抽象概念,而是一件徹底受物理規律約束的事情。
這意味著,智能的提升并不是“想象空間”問題,而是繞不開能量、帶寬、存儲、制造和成本的物理限制。
德特默斯認為,當下市場對AGI 的判斷普遍偏樂觀,一個關鍵原因在于:
很多討論只停留在模型、參數和算法層面,卻忽視了支撐這些能力的物理基礎正在逼近極限。
在文章中,德特默斯第一次從物理約束的角度,系統性地解釋了為什么AGI 面臨一系列難以回避的現實。這些判斷,也有助于我們更好地理解當前的AI行業。
他在文章中總結了幾條關鍵判斷:
1)Transformer 的成功并非偶然,而是在當前物理約束下接近最優的工程選擇,繼續通過架構改進獲得的邊際收益正在快速下降。
2)當下大量所謂“創新”,本質仍是既有框架上的漸進改進,很難帶來結構性躍遷。
3)AI 過去的 Scaling Law 很大程度上依賴GPU的性能紅利,而GPU“可壓榨空間”正在接近尾聲。
4)真正的AGI 不只是認知能力問題,還必須具備在現實世界中執行具有經濟意義工作的能力,而這一領域恰恰最受物理與成本約束。
以下內容為蒂姆·德特默斯文章的編譯,略有刪減。
被物理極限“鎖死”的AGI
關于AGI、超級智能、擴展定律的討論,尤其在灣區,有一個長期被忽視的問題:這些討論大多停留在觀念層面,而非物理現實之中。
很多人談論通用人工智能、超級智能,習慣把它們當成純粹的抽象概念,像做哲學思想實驗一樣推演未來:參數還能不能再大?算力還能不能繼續堆?智能會不會指數級自我進化?
但這套思維,本身就建立在一個根本性的誤解之上——計算不是抽象的,它是物理的。
要理解這一點,先看一個最基礎的事實:高效計算,始終在做兩件事的平衡。
一是把分散在各處的信息,搬運到計算發生的地方;
二是把局部計算的結果,再重新匯聚成新的信息。
問題在于,計算本身是便宜的,信息移動是昂貴的。
隨著晶體管尺寸變小,單次計算的成本持續下降。但信息在芯片內部、在不同存儲層級之間移動,其成本卻會隨著距離呈平方級增長。這是一個繞不開的物理規律。
緩存層級就是最直觀的例子。
L1、L2、L3 緩存用的是同樣的工藝,但性能差異巨大:L1 最快、容量最小;L3 最大、卻慢得多。原因并不復雜:離計算核心越遠,訪問成本越高。
因此有兩個結論非常重要:
第一,更大的緩存,必然更慢;
第二,隨著制程進步,芯片上“算力”的成本在下降,但“內存”和“帶寬”的成本反而在上升。
今天的高端芯片設計中,真正用于“計算”的邏輯單元,其實只占很小一部分。絕大多數硅面積,都被用在了存儲、互連和數據通路上。
當然理論上仍然可以設計一顆擁有10 exaflops 算力的芯片,但如果沒有與之匹配的內存系統,這些算力大多只會閑置,變成“無用的浮點運算”。
這一點,在很多關于算力的敘事中被刻意忽略了。
把這個現實放回AI 架構上,就會發現一件事:
Transformer 的成功,并不是算法上的偶然,而是在當前物理約束下接近最優的工程選擇。
它的核心計算模式,恰好對應了當前硬件條件下最“劃算”的兩類操作:
一類是局部計算(MLP);
另一類是受限形式的全局信息匯聚(注意力機制)。
Transformer當然不是“理論上最優”的智能結構,但在現實硬件條件下,它可能已經非常接近物理意義上的最優解。
這意味著,你可以繼續在Transformer上做改進,但每一步的收益都會越來越小。
類似的限制不止存在于硅基計算里,也同樣發生在我們人類身上。
神經科學早已發現:一個物種能擁有多少神經元,幾乎可以由其長期穩定的能量攝入精確推算。人類通過烹飪,突破了原始能量獲取的限制,但也僅止于此。
我們的智力并非無限擴展的結果,而是剛好卡在能量、代謝和生育之間的平衡點上。
如果人類的大腦再大一些,問題并不在于頭骨或產道,而在于能量供給:
我們將無法在孕期同時維持兩個高能耗大腦的生存。這意味著,人類智能本身就是一道被能量約束鎖死的物理上限。
數字計算也正在走向類似的邊界。
算力還會增長,工程還會優化,但把這些變化解讀為“智能可以無限外推”,本身就是一種脫離物理現實的想象。
低垂果實已摘完了
幾乎所有成熟領域的研究,最終都會收斂到同一個結論:
線性的進步,往往需要指數級的資源投入。
這句話翻譯成白話就是:如果你想讓一個系統持續變得更精確、更高效、更強大,那么每往前走一步,所需要付出的成本都會比上一步高得多。
背后原因并不復雜。在物理世界里,任何有效結果,都依賴資源在時間和空間上的聚集。要產生線性規模的效果,你至少需要線性規模的資源。
但隨著系統規模變大,這些資源會在空間、時間和能量上發生競爭,協同效率不斷下降,最終表現為:投入增長得很快,產出卻增長得越來越慢。
在物理世界如此,在思想世界也一樣。
如果兩個想法彼此完全獨立,它們的疊加效果可能是倍增的;但一旦想法之間存在依賴關系,邊際收益就會迅速下降。
絕大多數“新想法”,并不是從零開始,而是建立在已有框架之上的改進。即便這個改進再聰明,它所能帶來的提升也往往是漸進式的。
當一個領域足夠成熟時,這種現象會變得非常明顯。
即使你看似提出了“完全不同”的方法,它們往往仍然在解決同一個核心問題。
比如,看起來路徑不同的狀態空間模型和 Transformer,本質上都在處理“如何高效建模長程依賴”這個問題。
在這樣的背景下,任何對同一機制的改進,都只能帶來有限收益。
這種約束,在物理學中表現得最為殘酷。一位頂尖理論物理學家曾這樣形容這個處境:
如果一個想法被限制在同一個子領域內,那么幾乎不可能產生真正有意義的突破。因為該想的,早就被想過了;而那些看似天馬行空的創意,往往只是重新排列了既有規則,并沒有觸及根本問題。
實驗物理則從另一個角度揭示了這種邊界。
為了驗證更深層的物理規律,我們不得不建造越來越昂貴、越來越復雜的實驗裝置。大型強子對撞機耗資數十億美元,但帶來的更多是對理論的排除,而不是明確的新答案。
這并不一定意味著我們“不夠聰明”,而更可能意味著:某些問題本身,就被資源和復雜度鎖在了我們目前無法觸及的層級之外。
最終,我們一次又一次回到同一個現實判斷:
當一個系統進入成熟階段后,想要獲得線性的改進,往往必須付出指數級的資源代價。
這既是科學研究的邊界,也是技術、算力和智能擴展所共同面對的硬約束。
GPU已經被“榨干”了
另一個影響極大的誤解是:人們默認硬件會一直線性進步。
過去十多年,AI 的幾次關鍵躍遷,確實都踩在了GPU性能提升的節奏上。
AlexNet 的成功,本質上是CUDA + GPU跑通了卷積網絡的結果。此后,無論是更深的CNN,還是Transformer的規模化訓練,幾乎都依賴兩個變量:單卡性能提升+GPU數量增加。
于是,一個非常自然的敘事形成了:GPU 越來越強,推動AI 越來越強。
但問題恰恰在這里。GPU 并不是在“持續進步”,而是在逐步逼近物理和工程的邊界。
如果回頭看,會發現GPU 真正快速提升的階段,大概在 2018 年左右已經結束。
此后我們看到的“進步”,更多是通過一系列一次性、不可重復的工程紅利換來的:
最早是FP16,然后是 Tensor Core(或等價的矩陣加速單元),再往后是 HBM 高帶寬內存,接著是更激進的數據搬運機制(如 TMA),再然后是 INT8、INT4 甚至更低比特寬度。
這些手段,本質上都在做同一件事:用精度換吞吐,用工程技巧壓榨邊界。
問題在于,這條路是有限的。
從計算物理和信息論角度看,在特定塊大小、訪存模式和調度結構下,最優的數據類型和計算布局是可以算出來的。
這些結論并不神秘,也早已被論文系統性地討論過。現在的硬件廠商,事實上已經把這些“可壓榨的空間”基本用完了。
繼續往前走,不再是“免費性能提升”,而只剩下權衡:
要么犧牲計算效率,換更小的內存占用;
要么犧牲內存效率,換更高的計算吞吐。
無論選哪條路,都不再帶來數量級上的提升。這并不意味著硬件已經“停止進化”,而是意味著:
硬件不再是那個能持續兜底一切問題的變量了。
在這個背景下,很多人的注意力開始轉向機架級、數據中心級的系統優化。
這一步確實重要,比如高效的KV cache 傳輸、節點間通信、內存拓撲設計,都是當前推理成本的關鍵瓶頸。
但這里同樣存在一個現實限制。
從系統工程角度看,真正高效的設計空間其實非常有限。你可以在實現上做得更極致,但在結構上,往往只有一到兩種接近最優的方案。它們難度高、工程量大,但并不神秘,也不存在“顛覆性架構”。
這也是為什么無論是OpenAI,還是其他前沿實驗室,在基礎設施層面更多體現的是執行力和規模,而不是不可復制的系統優勢。
即便通過機架級或數據中心級優化獲得領先,這種優勢也往往是暫時的。
隨著行業跟進,這些改進會迅速擴散、被吸收。可能在2026年,也可能在2027年,這部分紅利就會基本被吃完。
歸根結底,這一切指向同一個結論:
AI 的下一個階段,不能再假設“硬件會繼續把問題解決掉”。
GPU 曾經是推動智能躍遷的核心杠桿,但這個杠桿,正在失去它的長度。
/ 04 /
Gemini3,是一個拐點信號
我最近在推特上討論了一個判斷:Gemini 3,可能標志著這一輪AI 發展正在接近階段性停滯。
不少回復認為我太悲觀了,說一句話概括就是:“規模化不是還在起作用嗎?”
問題在于,這里真正需要討論的,并不是“規模化有沒有用”,而是規模化還能用多久、以什么代價繼續起作用。
真正發生變化的是成本結構。
過去十多年,我們之所以能在模型規模上持續推進,并不是因為擴展本身變得“更高效”,而是因為GPU的指數級性能提升,抵消了擴展所需的指數級資源投入。
換句話說,過去是線性成本,帶來線性回報。現在變成了指數級成本,帶來勉強的線性回報。
這本身并非不可接受,但它清晰地劃定了一個邊界:擴展不再是一個“可以無限外推”的策略,而是一個正在快速逼近物理極限的手段。
在我看來,我們真正剩下的擴展窗口,可能只有一到兩年。
2025 年,單純靠擴展帶來的提升已經非常有限;如果 2026、2027 年沒有新的研究路徑或軟件層面的突破,那么擴展本身在物理上就會變得不可持續。
更微妙的問題在于:
當擴展帶來的邊際收益,開始低于研究和軟件創新帶來的收益時,硬件就會從資產變成負擔。
這并不是一個假設,而是已經開始出現的現實信號。
像MoonshotAI、Z.ai 這樣的公司已經證明:不需要天量算力,也能做到非常接近前沿模型的能力水平。
從個人體驗來看,我甚至更偏好Kimi K2的思考方式,而不是 Sonnet 4.5 在編碼上的“蠻力感”。這本身就說明:能力提升并不完全等同于規模擴張。
如果這些小團隊能在研究或工程上進一步突破規模限制,它們完全有可能在不擁有龐大基礎設施的情況下,做出最有競爭力的模型。
在推理側,它們甚至可以轉向如華為昇騰這樣的替代硬件——這些芯片在推理性能上已經足夠好。
這也引出了擴展基礎設施面臨的另一個系統性風險。
目前,大模型推理效率高度依賴“規模本身”:只有當GPU數量足夠多、用戶請求足夠密集時,計算、網絡通信和 KV cache 才能充分重疊,從而實現接近理論最優的利用率。
這意味著,只有擁有巨大用戶規模的公司,才能真正“用好”這些昂貴的前沿模型。
這也是為什么,開放權重模型目前并沒有在推理成本上徹底改寫格局——不是模型不行,而是部署成本要求一個同樣龐大的用戶池來攤薄。
但這里的關鍵在于:這是一個軟件問題,而不是物理問題。
vLLM、SGLang 等推理框架,主要針對的是前沿實驗室那種“超大規模部署”場景;在中小規模部署時,它們并不能提供同等級別的效率。
一旦出現更適合中等規模的推理棧,情況就會完全不同。
如果有人能讓一個3000億參數級別的模型,在較小規模下,也能接近 OpenAI 或 Anthropic 的推理效率,那么前沿實驗室在基礎設施上的護城河,可能會在極短時間內消失。
更何況,還有兩個變量在同時逼近:
一是小模型能力持續提升(比如GLM 4.6 這類趨勢);
二是AI 應用越來越垂直、越來越專業化,對“通用前沿模型”的依賴正在下降。
在這種情況下,部署復雜度下降、開源推理棧成熟、硬件選擇多樣化,會讓整個系統迅速逼近物理最優解。
而一旦接近物理最優,規模優勢的溢價就會快速蒸發。
如果擴展速度放緩,那么下面三件事中的任何一件,都可能在短時間內顯著削弱AI 基礎設施的價值:
研究或軟件層面的突破
成熟、強大的開放權重推理棧
向其他硬件平臺遷移
從這個角度看,當前的趨勢對前沿實驗室并不友好。因為真正的競爭,很可能即將回到:研究深度、工程效率,以及對物理現實的敬畏。
/ 04 /
沒有身體的AGI,是一個偽命題
我注意到一個頻繁出現的現象:
當你問灣區的人“AGI 什么時候到來”,他們往往會給出一個相對樂觀的時間表——幾年之內、影響巨大、范式顛覆;
但當你追問“AGI 究竟是什么”,他們的定義幾乎總是停留在認知層面,既不包含體力勞動,也很少討論資源投入與物理約束。
這是一個關鍵缺失。
如果我們嚴格定義“通用人工智能”為能夠完成幾乎所有人類任務的系統,那么它就不可能只存在于文本框或服務器里。
真正的AGI,必然需要具備在現實世界中執行具有經濟意義工作的能力——也就是體力勞動。
而恰恰是這一部分,構成了人類經濟活動中規模最大、最復雜、也是最受物理約束的領域。
從現實來看,機器人技術并未走向“通用化”,而是高度分化。
在受控環境中,例如工廠,專用自動化系統已經極其成熟。中國的“工廠”已經證明:
在明確流程、固定場景下,專用機器人在效率、精度和成本上遠遠優于任何通用方案。這類系統并不需要“通用智能”,它們靠的是工程優化和流程確定性。
而在非受控環境中,許多看似“智能”的機器人任務,往往在經濟上并不成立。
例如給T 恤縫袖子、在復雜環境中疊衣服,這些任務在技術上困難、數據采集成本極高,但在現實中人類完成它們所需的時間和成本極低。
即便機器人在幾年后能夠完成這些動作,其產出質量、成本結構和維護復雜度,也很難構成真正的經濟優勢。
換句話說,機器人領域的問題并不主要是“能不能做”,而是“值不值得做”。
更重要的是,機器人學習的擴展規律,與大語言模型高度相似,卻面臨更嚴苛的現實約束。物理世界的數據采集昂貴、反饋稀疏、狀態空間巨大,這決定了其擴展速度遠慢于純數字環境。
結果是,自動化在工廠里高度成功,而在大多數日常體力勞動中,經濟回報極其有限。
這也引出了“超級智能”敘事的根本問題。
超級智能的核心假設是:一旦系統在智能水平上超過人類,就能夠不斷自我改進,最終形成失控式躍遷。
這一觀點源于牛津哲學傳統,并在灣區被進一步放大。但它忽略了一個基本事實——智能不是抽象存在,而是嵌入在物理系統中的能力。
任何系統的改進都需要資源。即便一個系統能更高效地利用資源,它依然無法逃脫規模定律的約束:
線性改進,往往需要指數級投入。通過引入一次性優化(例如新的數據類型、特殊硬件單元)確實可以暫時繞開收益遞減,但這些路徑本身也會很快耗盡。
因此,更合理的理解是:所謂“超級智能”并不會無限拓展能力邊界,而只是填補現有能力空白。這種填補是有價值的,但它帶來的是漸進改進,而非指數失控。
類似的誤判也出現在對硬件進步的預期上。
很多人假設,如果智能足夠強,它就能加速GPU、內存和系統架構的進化。
但現實是,GPU 的核心性能提升已經接近尾聲。未來的改進更多來自封裝、互連、HBM 演進和機架級工程優化,而這些都是高度資本密集、周期漫長的制造問題,并不存在“靠更聰明就能解決”的捷徑。
Transformer 架構本身也已經接近物理最優。大規模推理部署,更多是成熟工程問題,而非需要突破性創造力的研究領域。超級智能無法顯著重寫這些基本約束。
從這個角度看,超級智能或許能幫助AI 更快普及,但它并不是普及的決定性因素。真正限制 AI 經濟價值釋放的,從來不是能力上限,而是落地、部署與應用結構。
因此,任何將“超級智能”作為核心目標的組織,都可能在現實中遭遇持續的摩擦:高成本、低回報、難以轉化。相反,那些專注于降低部署門檻、推動經濟普及、嵌入真實流程的參與者,更可能在長期勝出。
歸根結底,人們常設想的AGI 并不會以神話般的方式降臨。它忽視了計算的物理約束、規模進步的真實成本,以及我們已經觸及的工程極限。
超級智能之所以被反復討論,并非因為它理論上穩固,而是因為它在回音室中構建了一種極具吸引力的敘事。
而AI 的真實未來,將由經濟可行性、實際應用與在物理限制下的持續改進共同塑造。越早接受這一現實,我們就越能把注意力從幻想,轉向真正能提高生產力與人類福祉的系統。
文/林白
PS:如果你對AI大模型領域有獨特的看法,歡迎掃碼加入我們的大模型交流群。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.