網易首頁 > 網易號 > 正文 申請入駐

大模型競爭的下半場開啟了?

0
分享至



文 | 智能相對論

作者 | 陳泊丞

今年整個AI圈最熱鬧的事件莫過于全民“養龍蝦”——OpenClaw的走紅,讓大家終于看到了AGI落地的具象化可能。

然而,當業界為Agent“手腳”的日益靈活而歡呼時,一個更根本的問題卻被暫時掩蓋了——真正決定OpenClaw行動價值的“大腦”,也就是它背后的大模型底座,似乎正走在一條不可持續的道路上。

過去兩年,大模型行業奉行的是典型的“暴力美學”,即參數越多代表智能越高,思維鏈越長代表推理越深。萬億參數模型接連登場,長思維鏈成為技術先進性的標配。但在這股狂熱之下,一個尷尬的事實逐漸浮出水面——大量參數只是“吃算力”的擺設,超過70%的Token消耗發生在模型“已經答對、仍在反思”的無效階段。



推理Token消耗分布示意

因此,當OpenClaw這樣的執行端已經準備好進入工廠、倉庫、辦公室,我們才發現,驅動它的“大腦”要么昂貴到企業用不起,要么為了省錢而被迫“降智”。這或許是2026年AI產業化最核心的悖論——手腳已經就位,大腦卻還在“算力通脹”的泥潭中掙扎。

這一困局如何打破?就在前不久,YuanLab.ai團隊開源了Yuan 3.0 Ultra萬億參數模型,以一套截然不同的、更務實的技術路線,也在試圖解答當前行業的這一根本性問題:當模型規模的擴張已觸及收益遞減的臨界點,大模型的下一場競賽,究竟應該比什么?



Yuan3.0 Ultra在面向企業應用的表現

如果OpenClaw的大腦困于“昂貴”與“降智”的兩難,那么,整個行業就必須重新審視那個曾被奉為圭臬的增長邏輯。

算力通脹時代,市場渴望一場“價值回歸”

過去兩年,行業經歷了一場深刻的認知撕裂。

撕裂的一邊是技術供給側的狂歡。萬億參數模型接連登場,推理模型追逐越來越長的思維鏈,仿佛“想得越多”就等于“想得越對”。在國際AI頂會上,論文的核心賣點往往是“我們的模型又大了多少億”“我們的思維鏈又長了多少步”。

撕裂的另一邊是企業需求側的清醒。當技術營銷的喧囂褪去,企業客戶在采購時開始用最樸素也最殘酷的ROI邏輯發問:每一次API調用支付的Token費用,究竟有多少轉化為真正的業務價值?

事實上,研究顯示,在復雜推理任務中,模型超過70%的Token消耗發生在“已經答對”后的自我驗證階段。這意味著,企業每為模型智能支付10元錢,有7元是在為它的“過度思考”買單。

與此同時,更隱蔽的浪費還藏在模型結構本身。MoE(混合專家)架構在預訓練中會自發形成專家分化,負載最高的專家與最低的專家差距可達500倍。這意味著,大量長期閑置的“僵尸專家”成了模型參數虛高的主要推手——它們幾乎不干活,卻依然在每一次推理中被加載、被維護、被計費。



MoE模型訓練過程中存在專家訓練不均衡問題

由此,“算力通脹”問題就不得不重視起來。參數規模在膨脹,推理鏈條在拉長,但單位算力產出的真實智能卻在稀釋。當OpenClaw這樣的執行端開始規模化部署,這種“通脹”帶來的成本壓力被成倍放大——每一次物理動作背后,都是大量的Token在燃燒。

今天,YuanLab.ai團隊已經敏銳地捕捉到這一趨勢的不可持續性。在此前發布的Yuan 3.0 Flash中,他們就首次驗證了“反過度思考”的技術可行性,通過RIRM(Reflection Inhibition Reward Mechanism,反思抑制獎勵)機制讓模型學會在恰當的時候停下來。直到Yuan 3.0 Ultra的開源,這一理念進一步從“效率優化”升維為“范式定義”——當行業還在比拼誰能堆出更大模型時,真正的競爭已悄然轉向誰能用更少的算力提煉出更有效的智能。



是時候對“萬億參數”祛魅了

客觀而言,Yuan 3.0 Ultra的突破性,不在于它邁入了萬億俱樂部,而在于它對“萬億參數”這一概念本身完成了一次徹底的“祛魅”。

其一,對“參數規模”的祛魅:LAEP算法讓模型學會“精簡”。

行業長期存在一個思維定式:參數越多,模型越強。這一認知如此根深蒂固,以至于每當有廠商發布更大參數的模型,資本市場都會給出積極反饋。

Yuan 3.0 Ultra用自適應專家裁剪算法(Layer-Adaptive Expert Pruning,LAEP)戳破了這一神話。研究團隊發現,MoE模型在預訓練中會自然形成專家功能分化,但分化不等于優化——大量低貢獻專家長期閑置,卻依然消耗著寶貴的算力資源。LAEP算法的精妙之處,就在于它像一位清醒的“組織優化顧問”,在訓練過程中動態識別冗余專家并予以裁剪,將初始1515B參數優化至1010B,參數規模減小33.3%,預訓練算力效率反而提升49%。



Yuan3.0 Ultra采用LAEP顯著提升預訓練效率

對于企業而言,這意味著可以用更低的硬件門檻、更少的GPU租賃開支,獲得與1515B參數模型同等的旗艦級智能支撐。那么,當別人還在為參數規模競賽買單時,Yuan 3.0 Ultra的用戶就已經在享受“減重”后的成本紅利了。

二、對“思維鏈長度”的祛魅:RIRM機制讓模型懂得“停”的智慧。

當全行業沉迷于“讓模型想得更久”,一個根本性問題卻被忽略了:什么時候該停下來?——這不僅是效率問題,更是安全問題。

試想一下,一個由OpenClaw驅動的工業機器人,如果它的“大腦”在識別到安全隱患后還要反復思考、再三確認,哪怕只是幾秒鐘的延遲,都可能釀成事故。在真實世界中,“想太多”和“想錯”一樣危險。

對此,Yuan 3.0 Ultra引入的反思抑制獎勵機制(RIRM),恰恰是對“長思維鏈崇拜”的一次精準糾偏。它不是簡單粗暴地截斷輸出,而是通過強化學習訓練,讓模型學會區分兩種狀態:什么時候需要繼續推理,什么時候已經可以停止。研究團隊將最大可接受反思步數設為3,理想狀態下鼓勵直接響應,復雜問題允許適度反思,但一旦超過閾值,獎勵機制就會啟動抑制。



RIRM工作流程示意

由此,訓練準確率提升16.33%,同時平均響應長度縮短14.38%。在MATH-500基準上,反思階段的Token消耗顯著降低。這種“該停就停”的能力,在企業高頻調用場景中產生的價值,遠大于在單一benchmark上刷出0.1%的提升。當每一次API調用都在為企業省錢,而不是為模型的“內心戲”買單,規模化應用才真正成為可能。



RIRM訓練前后Token消耗對比

三、對“多模態”的祛魅:LFA機制讓模型專注“有效關聯”。

多模態是AI行業長期以來的另一大熱詞。但多模態不是簡單的圖文拼接,更不是把圖片和文字扔進同一個模型就萬事大吉。企業在真實業務場景中的多模態,往往是財報里圖文混排的復雜表格,是合同中穿插的掃描件和手寫批注,是技術文檔里跨頁面關聯的圖表和數據。因此,處理這些信息,需要的不是“什么都能看”的泛泛能力,而是“能看懂重點”的精準穿透力。

Yuan 3.0 Ultra引入的局部過濾注意力機制(Localized Filtering-based Attention,LFA),正是為此而生。它通過強化對核心語義的聚焦,精準過濾無效注意力干擾,使模型在處理復雜文檔時,不再被噪聲信息誤導。這種對“有效信息”的聚焦能力,讓OpenClaw這樣的Agent在執行具體任務時,能夠真正理解“該看什么”“該忽略什么”,從而實現“眼睛”與“大腦”的協同進化。

總的來說,這三重“祛魅”共同指向的,正是Yuan 3.0 Ultra的核心主張:有效智能。站在企業的視角,“有效智能”不是一句口號,而是可以量化的ROI,接下來可以用更低的成本投入來獲取更好的AI智能服務。這意味著,企業不再需要為“聽起來很牛”的參數買單,而是為“用得上”的智能付費。

大模型競爭的下半場已經開啟了

隨著市場對“有效智能”的聚焦,就意味著大模型競爭的下半場已經拉開序幕。那么,當頭部廠商紛紛收緊模型權限、構建封閉生態時,YuanLab.ai團隊卻選擇以開放姿態貢獻出萬億級核心模型,其背后的本質則是在參與定義大模型競爭的下半場。

回顧上半場,核心是“參數競賽”——誰先達到千億、萬億,誰就是技術領先者。誰在榜單上刷出更高分數,誰就能獲得資本和市場的追捧。

這一階段的邏輯簡單直接,但也迅速觸及天花板——參數堆砌的邊際收益遞減,而邊際成本(算力、能耗、部署難度)卻在指數級上升。2025年底開始,越來越多的從業者意識到,單純比拼參數規模,已經難以為繼。

展望下半場,核心則是“效率競賽”——誰能用更少的算力實現同等的智能,誰能用更可控的成本支撐復雜的Agent任務,誰才是真正的產業賦能者。這場競賽不再有簡單的量化指標,而是考驗對模型架構的深刻理解、對算法效率的系統優化、對企業場景的精準適配。



Yuan 3.0整體架構和基于MoE的語言主干

在下半場,智能的純度,遠比參數的個數更重要;思考的效率,遠比思考的長度更值錢。由此,Yuan 3.0 Ultra通過LAEP、RIRM、LFA等創新,系統性地解答了“智能的效率”這一核心命題,為行業樹立了有效智能的新標桿。

更深層看,Yuan 3.0 Ultra開源的戰略價值還在于,為中小企業、研究機構和行業開發者提供了一個旗艦級、可定制、不鎖死的模型底座選擇。現如今,開發者們已經可以在github項目開源地址https://github.com/Yuan-lab-LLM/Yuan3.0獲取相應的能力。

當OpenClaw這樣的Agent框架日益成熟,企業最需要的恰恰是一個能夠深度適配自身業務且成本可控的“大腦”。Yuan 3.0 Ultra的開源,本質上是在為下一波Agent應用大爆發鋪設基礎設施——讓所有想要“養龍蝦”的企業甚至是個人,都能負擔得起一個聰明的大腦。

結語

2026年,當“養龍蝦”成為全民話題,當Agent開始真正進入千行百業,我們比任何時候都更需要回答那個根本問題:什么樣的智能,才是值得企業付費的智能?

答案是,有效的智能。當行業終于意識到,真正的智能,不是無限燃燒算力的能力,而是善用算力的智慧——這時候,大模型的下半場就算真正開始了。新的增長邏輯,正在被重新定義,并主導下半場的競爭。

*本文圖片均來源于網絡

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
哈蘭德和加布頂牛時沒選擇倒地?基恩:如果是他爹肯定就倒的

哈蘭德和加布頂牛時沒選擇倒地?基恩:如果是他爹肯定就倒的

懂球帝
2026-04-24 08:55:07
東風導彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

東風導彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

番外行
2026-03-31 08:28:28
中國中鐵工程局黨委書記、董事長,總經理、黨委副書記調整,均由其他單位調任!

中國中鐵工程局黨委書記、董事長,總經理、黨委副書記調整,均由其他單位調任!

新浪財經
2026-04-24 01:08:56
遼寧莊河回應“8歲男童爬山發現金礦線索”:當地已圈定200多處礦化點,事發地也有成金礦可能

遼寧莊河回應“8歲男童爬山發現金礦線索”:當地已圈定200多處礦化點,事發地也有成金礦可能

極目新聞
2026-04-23 10:00:21
當年劉愷威楊冪兩個確實是生理性喜歡

當年劉愷威楊冪兩個確實是生理性喜歡

科學發掘
2026-04-24 06:45:03
美海軍上將:美國正進行二戰結束以來最大規模潛艇建造,“馬薩諸塞”號新型攻擊核潛艇上月已正式入列

美海軍上將:美國正進行二戰結束以來最大規模潛艇建造,“馬薩諸塞”號新型攻擊核潛艇上月已正式入列

極目新聞
2026-04-23 10:57:06
老球王戴維斯:我不想貶低丁俊暉,但誰都知道趙心童是更好的球員

老球王戴維斯:我不想貶低丁俊暉,但誰都知道趙心童是更好的球員

楊華評論
2026-04-24 03:04:33
沒有這種食物,你的肌肉將消失!醫生:60歲后恢復肌力的7種食物

沒有這種食物,你的肌肉將消失!醫生:60歲后恢復肌力的7種食物

健康之光
2026-01-04 09:31:45
其實蔣介石有3員大將,毛主席:但凡重用一個,都不會輸這么慘

其實蔣介石有3員大將,毛主席:但凡重用一個,都不會輸這么慘

幽州校尉
2026-04-24 07:57:33
1979年打越南,高層其實吵翻了天?葉劍英粟裕為何反對出兵?

1979年打越南,高層其實吵翻了天?葉劍英粟裕為何反對出兵?

勇哥讀史
2026-04-21 07:52:13
水冷漏水損毀頂級RTX 5090:廠商按購買價賠償遭拒 用戶堅決要現價

水冷漏水損毀頂級RTX 5090:廠商按購買價賠償遭拒 用戶堅決要現價

快科技
2026-04-21 11:35:06
張敬軒被抵制原因被扒!“反骨”言論僅冰山一角,謝霆鋒也被牽連

張敬軒被抵制原因被扒!“反骨”言論僅冰山一角,謝霆鋒也被牽連

以茶帶書
2026-04-23 14:11:56
湖人薪資情況:詹姆斯5260萬合同到期,今夏將擁有9000萬空間

湖人薪資情況:詹姆斯5260萬合同到期,今夏將擁有9000萬空間

懂球帝
2026-04-23 11:14:06
紅綠燈倒計時取消!全國推行新規,以后過路口記住這1句話

紅綠燈倒計時取消!全國推行新規,以后過路口記住這1句話

阿振觀點
2026-04-22 06:00:49
中美聯合國激烈交鋒,美逼中國買單,中方拒絕接受,對美反將一軍

中美聯合國激烈交鋒,美逼中國買單,中方拒絕接受,對美反將一軍

健身狂人
2026-04-22 20:37:47
通用技術集團派駐二級公司專職董事林偉芳接受審查調查

通用技術集團派駐二級公司專職董事林偉芳接受審查調查

界面新聞
2026-04-24 10:05:45
54歲俞飛鴻身材真豐腴!穿緊身露肩裙差點“撐爆”,高級性感迷人

54歲俞飛鴻身材真豐腴!穿緊身露肩裙差點“撐爆”,高級性感迷人

蓓小西
2026-04-24 09:50:42
網紅“迅猛龍特蕾莎”開會員專屬直播引爭議,本人回應:平臺規定的每月一次會員直播,因操作失誤被設置為“可試看”

網紅“迅猛龍特蕾莎”開會員專屬直播引爭議,本人回應:平臺規定的每月一次會員直播,因操作失誤被設置為“可試看”

揚子晚報
2026-04-22 12:20:20
“五一”前后,上海徐匯部分路段將進行交通管制→

“五一”前后,上海徐匯部分路段將進行交通管制→

縱相新聞
2026-04-24 09:00:15
4月25日24時起,廣東這條高速免費通行!

4月25日24時起,廣東這條高速免費通行!

廣東建設報圍城
2026-04-24 09:03:20
2026-04-24 10:47:00
智能相對論 incentive-icons
智能相對論
智能和車,邊評邊測;未來和家,且品且鑒
2509文章數 2412關注度
往期回顧 全部

科技要聞

凌晨突發!GPT-5.5正式上線:跑分更猛

頭條要聞

受AI沖擊"霸總"回家種地:比拍戲難 今年基本回不了本

頭條要聞

受AI沖擊"霸總"回家種地:比拍戲難 今年基本回不了本

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王思聰被綠!戀愛期間女友被金主包養

財經要聞

19家企業要"鋁代銅",格力偏不

汽車要聞

全景iDrive 續航近800km 新款寶馬7系/i7亮相

態度原創

手機
數碼
旅游
本地
軍事航空

手機要聞

蘋果更新推出Invites 1.8,支持iMessage直接分享邀請函

數碼要聞

曝英特爾下代Z970芯片組將承接當前B860大部分市場定位

旅游要聞

在拉薩,除了布達拉,你還想看到什么?|鋒評

本地新聞

SAGA GIRLS 2026女團選秀

軍事要聞

美伊陷入互相封鎖僵局

無障礙瀏覽 進入關懷版