網易首頁 > 網易號 > 正文 申請入駐

養“蝦”要用“腦”:萬億參數之后,行業終于開始關心“參數含金量”

0
分享至


撰文 | 懂懂

編輯 | 秦言

來源:懂懂筆記

「 用更少的算力開銷,產生更大的智能價值,已成為破解AI落地成本困局的核心密碼。」

2026年開年,整個AI圈最熱的話題莫過于“養蝦”。

這里說的“蝦”,是因其Logo酷似龍蝦鉗而戲稱的OpenClaw——一個現象級的開源AI智能體框架。


在短短數月內,其GitHub星標數突破28萬,超越React、Linux等老牌項目登頂全球第一,被業界視為AI從聊天走向干活的范式轉移標志。

這股熱潮不僅席卷了個人開發者和極客社區,更實實在在地點燃了企業用戶的熱情。從科技巨頭到傳統企業,無數團隊摩拳擦掌,希望利用OpenClaw打造自己的數字員工,自動化處理繁瑣工作,開啟效率革命。

然而,許多興致勃勃開養的企業發現,自己的“蝦”(這里泛指智能體)經常翻車:處理一份稍復雜的財報就直接宕機,任務鏈條超過五步大腦就斷片兒,更別說在長文檔分析、跨系統查詢等真實業務場景中穩定輸出了。

熱鬧是真熱鬧,但真用起來也是很崩潰。這背后揭示了一個核心命題:當AI的手腳(智能體)已經備好,我們究竟需要一個什么樣的大腦(大模型),才能讓它真正在企業中穩定、高效地跑起來?

熱潮與痛點:當AI落地遭遇不可能三角

2025年,已被廣泛視為企業智能體(Agent)元年。企業對AI的期待,從對話、生文等單一功能,全面轉向能夠自主執行復雜工作流的數字員工。

今年OpenClaw的引爆,將這一期待推向了前所未有的高潮。在YuanLab.ai團隊看來,OpenClaw作為一個現象級產品,對于AI落地推動的意義在于兩方面:

一方面,OpenClaw讓智能體的價值變得具象化,每個人都有可能快速搭建一個能上網、能操作軟件、能處理文件的AI助手。

另一方面,其開源和共創模式,吸引了全球開發者涌入,在社區中分享插件、交流經驗,形成了強大的生態合力,加速了整個智能體能力的進化。“以前是煙囪形式升級,沒有產生合力,而未來大家可以在社區里分享,就能更快、更好地幫助企業解決大模型落地難的問題。”YuanLab ai團隊的Allen博士說。


企業對AI的熱情因OpenClaw再添一把火。然而,當熱情照進現實,落地之路卻荊棘密布,企業普遍面臨幾個揮之不去的核心痛點:

首先,是精準的困境。

許多智能體在處理企業核心業務,如財報分析、合同審閱、技術文檔解析時,輸出的內容夾雜幻覺,數據不準確,邏輯經不起推敲,企業根本“不敢放心用”。在YuanLab ai團隊看來, AI落地的第一大痛點就是模型的準確性。


其次,是高效的挑戰。

智能體的任務往往是多步驟、長鏈路的。當前許多模型存在嚴重的“過度思考(Overthinking)”問題,在得到答案后仍會進行大量無效的反思和驗證。在長任務鏈中,單步的冗余會被指數級放大,導致響應慢、成本高,最終可能因延遲累積而任務失敗。

第三,是成本的焦慮。

想要高智能,似乎就必須承擔更高算力開銷(Token消耗)。這使得企業陷入兩難:用能力強的大模型,成本高不可攀;為控制成本選用小模型,復雜任務又根本無法勝任。

以上痛點恰恰構成了當前企業AI落地的一個“不可能三角”:精準、高效、低成本,難以兼得。

要破解這個三角,必須認清一個根本關系:在“大模型是大腦,Agent是手腳”的范式中,智能體框架(如OpenClaw)決定了AI能做什么,而底層大模型才決定了AI能做成什么樣。手腳再靈活,如果大腦不夠聰明、不夠穩定,一切皆是空談。

因此,解決AI落地痛點的關鍵,不僅在于擁有好用的智能體框架,更在于底層大模型的持續進化與務實優化。也就是說,要想把蝦養好,關鍵是要有好的大腦。

破解之道:用智能密度擊穿“不可能三角”

要想AI更精準,大模型的參數也就要更大。伴隨大模型參數越來越大而來的,就是行業陷入了“規模與效率”的悖論之中。YuanLab.ai團隊最近發布的Yuan 3.0 Ultra,提供了一條不同的思路。


「 開源地址 」

GitHub項目

https://github.com/Yuan-lab-LLM/Yuan3.0-Ultra

「 論文鏈接 」

https://arxiv.org/abs/2601.14327

作為全球三個萬億級開源多模態大模型之一,其所有技術創新都指向一個目標——提升智能密度,即用更少的算力開銷,產生更大、更確定的智能價值,“這么多年我們團隊一直在干一件事,就是如何用更少算力去產生更多的智能。“Allen表示,在這個思路下,團隊很早就提出了模算效率的概念,現在這已經被行業普遍認同。隨著對大模型落地的認知加深,智能密度的概念逐漸浮出水面,而這恰恰是針對“不可能三角”的精準破局。

總結Yuan 3.0 Ultra的創新邏輯,可以分為三個維度:

首先,訓練端團隊優化,裁掉“摸魚”的專家,拒絕參數虛高。

Yuan3.0 Ultra采用主流的高效架構——混合專家模型(MoE),這好比組建一個百人專家團隊。但研發團隊發現,在訓練穩定后,這個百人團隊嚴重不均衡:少數幾個專家干了絕大部分的活,而大量專家長期低負載、幾乎不產生價值。實測中,負載最高與最低的專家工作量相差近500倍。企業卻要為所有專家支付算力工資,這是巨大的浪費。

為此,YuanLab.ai團隊發明了LAEP(自適應專家裁剪算法)。它就像一個聰明的人力資源優化系統,在訓練過程中動態監測,精準識別并裁掉那些長期“摸魚”、貢獻極低的冗余專家,并對剩下的高效專家進行重組,讓他們協同更流暢。


(MoE模型訓練過程中存在專家訓練不均衡問題)

效果是驚人的:模型參數從1515B(1.515萬億)優化至1010B(1.010萬億),裁剪掉33.3%的冗余參數,整體預訓練算力效率反而提升49%。最終,用戶用一個1010B參數的模型,單次推理僅激活68.8B參數,就能享受到萬億級模型的智能。這直接破解了成本焦慮,讓企業用得起旗艦模型。


(Yuan3.0 Ultra采用LAEP顯著提升預訓練效率)

其次,在推理端高效思考,抑制過度反思,讓AI想對就停。

模型越大,容易患上強迫癥,在已經得出正確答案后,還會反復糾結、自我驗證,生成大量無效內容。這在單輪對話中只是多花點錢,但在智能體的長任務鏈中,每一步的冗余都會疊加,導致成本爆炸和延遲激增。

Yuan3.0 Ultra引入了RIRM(反思抑制獎勵機制)。這就像在模型訓練時設立一套新的獎勵規則:不僅獎勵“答對”,更獎勵“在答對后及時停止無效思考”。通過強化學習,模型學會了在復雜任務中進行深度推理,在簡單任務中快速響應,在獲得可靠答案后主動收斂。


(RIRM優化下的推理效率提升與 Token 消耗對比)

實測數據表明,改進后的RIRM讓模型在相關任務上訓練精度提升16.33%的同時,輸出Token長度降低了14.38%。這意味著更準、且更快。在長鏈條的企業Agent任務中,這種效率提升會被層層放大,根本性緩解“高效”挑戰。

第三,在理解端精準聚焦,過濾無效信息,讓AI看得更準。

成本降了、速度快了,但如果模型看不懂企業復雜的業務文檔,一切仍是空談。現實中的技術方案、財報、合同往往是圖文混排的長文檔,信息分散、結構復雜,傳統模型容易迷失在大量細節中,抓不住重點。

Yuan3.0 Ultra 引入了LFA(局域過濾注意力機制),強化長上下文語義關聯能力。可以把它理解為給模型的注意力加裝了一個智能濾鏡。在閱讀長文檔時,這個機制能幫助模型自動過濾掉無關的、干擾性的信息,將注意力精準聚焦在關鍵語義和邏輯關聯上。

這就像一位經驗豐富的分析師,能快速掠過文檔中格式化的套話和冗余描述,一眼鎖定核心數據、結論以及跨頁面的因果聯系。得益于LFA機制,模型對長上下文、復雜語義關系的建模能力得到顯著增強,在處理企業級圖文混排文檔、進行跨頁信息檢索與推理時,準確性大幅提升。這直接攻克了“精準”難題,讓AI產出的結果更可靠、更可用,真正“用得好”。

總結來看,LAEP決定了模型用多少有效參數去學,從源頭削減成本;RIRM決定了模型推理到何時該停,在過程中提升效率;LFA決定了模型如何精準捕捉信息,在結果上保障精準。三者協同,從訓練、推理到理解,構成了破解“不可能三角”的完整技術閉環。

產業之變:從參數競賽到價值深耕

Yuan3.0 Ultra的技術路徑,背后是YuanLab.ai團隊一以貫之的“有效智能”核心理念,“我們的目標是死磕有效智能,解決企業客戶在落地中真金白銀的成本和效率問題。”Allen表示。

Yuan3.0 Ultra的創新邏輯,也映射出中國大模型產業正在發生的深刻轉向:從早期的參數規模競賽,進入務實的智能密度競爭與產業價值深耕階段。


早期,行業追逐更大參數、更長上下文、更高Benchmark分數。但當技術走向產業深水區,企業客戶關心的是解決實際業務問題、控制真金白銀的成本、獲得可驗證且穩定的輸出。

單純的規模堆砌,使得邊際效益加速遞減。智能密度概念的提出恰逢其時,智能不是追求模型無限變大,而是追求單位算力所能產生的有效智能最大化。這要求模型在架構(如MoE優化)、訓練(如LAEP)、推理(如RIRM)全鏈條上進行精細化的效率革命。

所以,企業在選擇AI大腦時,不應再被單純的參數規模或評測分數迷惑,而應重點考察:它是否針對我的業務場景(如文檔、表格、數據庫)做了深度優化?它的訓練和推理效率如何,總擁有成本(TCO)是否可控?它能否提供穩定、可審計、可解釋的輸出結果?

在今年兩會期間,全國人大代表、華中科技大學副校長馮丹在接受媒體采訪時也提到了這一概念:“當前,全球人工智能競爭已進入以大模型為核心的智能密度比拼階段。加快大模型推理能力應用落地,是搶占產業智能化制高點的戰略需求。”

OpenClaw的火熱與大模型的效率革命,正推動大模型與智能體(Agent)進入一個協同演進、互相定義的新階段。當底層大模型的基礎能力越來越強、且越來越高效,上層的智能體框架就能從繁重的任務拆解中解放出來,更專注于多智能體協同、業務流程編排和結果校驗,進化成企業內部的AI操作系統。對于企業而言,這意味著AI真正成為更高效的生產力。

“我感覺AI真的要落地了。以前大家都當作一個玩具,一個陪伴,現在各個層面的能力都實現了躍遷,我感覺離AGI真的不遠了。”Allen很興奮,因為AI不再停留于表面的熱鬧,而是正在真正轉化生產力,為各行各業的提質增效。

(更多詳盡信息請瀏覽yuanlab.ai 視頻號內容)

冷眼旁觀 麻辣點評 深入分析


個人觀點,僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
龍珠,日本男子花160萬還原布爾瑪19,簡直太絕了!

龍珠,日本男子花160萬還原布爾瑪19,簡直太絕了!

動漫心世界
2026-04-21 17:33:31
馬克龍:霍爾木茲海峽再被封,美伊雙方都有責任

馬克龍:霍爾木茲海峽再被封,美伊雙方都有責任

看看新聞Knews
2026-04-21 10:52:33
爆!張天愛被指當小三卷入富豪婚變,社媒淪陷,仍分享日常!

爆!張天愛被指當小三卷入富豪婚變,社媒淪陷,仍分享日常!

可樂談情感
2026-04-20 19:57:35
海軍四川艦赴南海開展試驗訓練

海軍四川艦赴南海開展試驗訓練

界面新聞
2026-04-21 23:23:46
恒大集團許家印牽連的12個女人

恒大集團許家印牽連的12個女人

地產微資訊
2026-04-21 17:02:14
萬達女子墜樓!滿頭是血當場死亡,網友曝更多,或不止墜樓那簡單

萬達女子墜樓!滿頭是血當場死亡,網友曝更多,或不止墜樓那簡單

呼呼歷史論
2026-04-22 00:54:47
被中方反制打痛了?捷克拒絕議長竄臺,高呼永遠堅定一個中國原則

被中方反制打痛了?捷克拒絕議長竄臺,高呼永遠堅定一個中國原則

近史博覽
2026-04-22 04:03:26
86年我在工廠值夜班,半夜撞見廠長媳婦從倉庫出來,她讓我別聲張

86年我在工廠值夜班,半夜撞見廠長媳婦從倉庫出來,她讓我別聲張

千秋文化
2026-04-21 20:11:53
比賴清德還狂的人出現了,如果她當選臺灣領導人,解放軍必定收臺

比賴清德還狂的人出現了,如果她當選臺灣領導人,解放軍必定收臺

芳芳歷史燴
2026-03-29 21:09:31
深圳一行業巨頭跌停,市值一夜蒸發超118億

深圳一行業巨頭跌停,市值一夜蒸發超118億

南方都市報
2026-04-21 19:49:48
一夜被吞!四川27家銀行集體解散,釋放啥信號?

一夜被吞!四川27家銀行集體解散,釋放啥信號?

夜深愛雜談
2026-04-21 07:47:30
1960年閻錫山去世,臨終前留下奇怪遺言:我死后你們不要放聲大哭

1960年閻錫山去世,臨終前留下奇怪遺言:我死后你們不要放聲大哭

云霄紀史觀
2026-04-22 01:31:13
美國、以色列最新表態

美國、以色列最新表態

魯中晨報
2026-04-21 21:44:03
克洛普若執教皇馬,第一刀砍向歐冠功勛!26歲王牌遭清洗

克洛普若執教皇馬,第一刀砍向歐冠功勛!26歲王牌遭清洗

瀾歸序
2026-04-22 01:12:12
羽毛球女神淪為“生育工具”!韓景楓官宣二胎,距離1胎僅隔5個月

羽毛球女神淪為“生育工具”!韓景楓官宣二胎,距離1胎僅隔5個月

翰飛觀事
2026-04-20 19:43:28
劉少奇位次何以反超周恩來?長征殘兵營里死守一張底牌

劉少奇位次何以反超周恩來?長征殘兵營里死守一張底牌

人生錄
2026-04-21 20:24:11
美記:科爾身邊的人告訴我,他幾周前就知道自己要離開勇士了

美記:科爾身邊的人告訴我,他幾周前就知道自己要離開勇士了

懂球帝
2026-04-21 15:19:11
我的蛋糕沒了...

我的蛋糕沒了...

果粉之家
2026-04-21 12:36:56
韋德:得知杜蘭特G1不打的時候,我就知道詹姆斯會徹底掌控比賽

韋德:得知杜蘭特G1不打的時候,我就知道詹姆斯會徹底掌控比賽

懂球帝
2026-04-21 12:07:09
女兒用父親公司賬戶1700萬元打賞主播、拆卡,已前往當地派出所自首 能否以“職務侵占”立案仍需調查

女兒用父親公司賬戶1700萬元打賞主播、拆卡,已前往當地派出所自首 能否以“職務侵占”立案仍需調查

紅星新聞
2026-04-21 12:54:20
2026-04-22 04:43:00
懂懂筆記 incentive-icons
懂懂筆記
TMT深度分析
3642文章數 11694關注度
往期回顧 全部

科技要聞

創造4萬億帝國、訪華20次,庫克留下了什么

頭條要聞

三國取消飛航許可 賴清德無法竄訪斯威士蘭

頭條要聞

三國取消飛航許可 賴清德無法竄訪斯威士蘭

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

宋承炫曬寶寶B超照,宣布老婆懷孕

財經要聞

現實是最大的荒誕:千億平臺的沖突始末

汽車要聞

全新坦克700正式上市 售價42.8萬-50.8萬元

態度原創

時尚
數碼
本地
藝術
親子

頂流復工,已判若兩人

數碼要聞

大疆DJI Mic Mini 2發布:329元起 可更換麥克風磁吸前蓋

本地新聞

春色滿城關不住|白鵑梅浪漫盛放,吳山藏了一片四月雪

藝術要聞

任伯年寫竹,真帶勁

親子要聞

為什么幼兒園里,很多小朋友會做不好的事?

無障礙瀏覽 進入關懷版