![]()
![]()
每次國產AI模型發布之時,人們總是說,國模即將崛起,追趕Anthropic指日可待。然而現實總是在反復打臉,模型之間的差距不僅越來越大,若是翻開GitHub上各種排行榜,有一個橙色頭像的作者已經幾乎隨處可見。
![]()
然而,主動使用也好,不得不用也罷,隨著AI開始擺脫實驗室走向企業級生產環境,一種深刻的商業現實已經顯現:最聰明的模型,一定是最貴的模型。Fable和GPT固然好,但每天24小時無間斷使用,誰也用不起。值此之際,人們似乎又看到了國產模型的一線生機。
要想真正利用AI發揮生產力,并使其產出的產品具備可落地的商業價值,單一的前沿旗艦模型正面臨嚴峻的ROI拷問。
與此同時,能力略遜一籌但具備價格優勢的國產模型,急需撕掉“玩具”的刻板標簽。
而更深層次的沖突在于:大模型廠商正試圖構建封閉的智能體生態建立壟斷,而企業用戶和中立第三方則在拼命尋求生態的開放與解耦。
因此,本文將從多模型動態路由(Fusion)和智能體元框架(Omnigent)這兩種全新的工程范式來解析這個技術與商業交織的復雜圖景,將AI產業正在經歷的一場從“算力霸權”向“架構分權”的歷史性演進公之于眾。
01
算力成本陷阱與真偽需求
在討論國際模型與國產模型到底該怎么用之前,人們首先應該理解一個核心的AI經濟學前提:token是一種智能決定價值的計算資源。
此前出現的桌面端AI代理,通過接管用戶電腦來執行任務,雖然結果令人失望,但仍然揭示了一個現象:許多個人和企業用戶,都處于“不知道如何規模化消耗token產生價值”的困境。
通過不完善的底層結構進行低效的任務窮舉來消耗token,創造出來的必然是偽需求。這一點,三個月來各種代理的默默無聞已經足以驗證。想讓企業愿意用真金白銀買單,就絕對不能為了消耗算力而消耗算力,必須用最小的算力成本撬動最大的任務閉環。
這就是擺在所有人面前、當前單一前沿模型面臨的算力成本陷阱。
像是深度行業研究、數萬行代碼的重構,任何一項復雜的商業任務,其難度都呈現出典型的長尾分布。
其中,可能只有很少的環節需要Fable 5這種極致智商的模型出馬,而剩下的大部分環節,只需要極其基礎的邏輯能力。像是網頁內容抓取、基礎代碼翻譯、格式化JSON輸出、后期檢查校對,殺雞焉用牛刀。
如果用御三家的旗艦模型去包攬所有任務流程,無異于大炮打蚊子,而高昂的成本也會讓任何試圖商業化的SaaS產品在經濟模型上面臨破產。
這種性能與成本之間的巨大撕裂,正是當前AI應用難以跨越試用期到“深水區”的根本原因之一。要解決這個矛盾,只靠等待前沿模型打價格戰恐怕已經是無稽之談。因此,必須采用一種全新的系統工程思路:按難度與需求進行任務分配。
02
Fusion機制與國模的“非對稱競爭”
國產模型的出路在哪?
這個問題,無論是AI的圈內還是圈外人士都有所關注。
針對這個尖銳的問題,傳統的回答往往是在特定垂直領域用私有數據微調,但效果并不顯著,因為它并未觸及系統架構的本質。當下更直接的解法,是用極致的性價比來搶占“國產替代”的定位,這也是OpenRouter推出Fusion技術作為破局之道的本質。
Fusion技術,即多模型動態路由與合成,核心邏輯非常簡單但有效:將一個復雜問題并行分發給多個不同的模型,然后由一個評判模型將各方結果進行融合。
用一個程序員圈子里的使用方法舉例:讓GPT-5.5和Opus 4.8寫程序架構,讓DeepSeek V4 Pro寫具體代碼。
太過簡單的思路反而讓人有些懷疑,就憑借這種“小伎倆”就能給國產模型帶來出路嗎?
在DRACO深度研究基準測試中,一個令人信服的數據打消了懷疑:由Gemini 3 Flash、Kimi K2.6和DeepSeek V4 Pro組成的“預算型模型組”,不僅擊敗了單一的GPT-5.5,得分還逼近了頂級的前沿模型組合,而成本僅為其50%。
![]()
![]()
組合里三個模型中,有兩個性能與GPT-5.5存在明顯差距的國產模型。然而,它們卻給出了國產模型最現實也最具有商業價值的破局路徑:成為強大異構系統中最具性價比的“四肢”和“感官”。
與各式各樣的桌面端代理創造出來的偽需求相反,在真金白銀的商業考量面前,Anthropic和OpenAI的定價使得“智能分配”成為了絕大部分用戶和企業的剛需。
我們已經知道,多Agent協作是AI的必然趨勢,而在企業級Agent架構中,也不應該是一個強大的模型單打獨斗,這就是所謂的“混合智能體架構(MoA)”,由兩部分組成:
一是調度與評判的“大腦”:占據不到一半的token份額,由Anthropic和OpenAI的旗艦模型擔任,負責最終的共識提取、矛盾分析和復雜推理。
二是執行與干活的“主力”:占用超過一半的token份額,由DeepSeek、GLM、Kimi等國產或開源模型擔任,負責海量文檔閱讀、大規模網頁并行搜索和基礎代碼編寫。
這只是理想情況,具體的token分配還是因任務難度而異。但重要的是,通過這種“高低搭配”,國產模型就不需要在所有維度上硬剛御三家,尤其是極限推理這種受硬件算力影響極為嚴重的領域。
只要能在長文本處理、基礎代碼生成或特定語言理解等領域達到及格線以上,并維持極具競爭力的API或訂閱服務定價,就能在這套多模型路由系統中占據不可或缺的地位,進而獲得更為龐大的訂閱量。
如此一來,國產模型的定位就會有所變化:從前沿模型的“國產替代”,轉變為前沿模型的“算力杠桿”。
融入這種多模型協作的生態,國產模型也就正式告別了單一測試集上的跑分游戲,并作為基礎設施的底層齒輪,真正進入全球企業的生產流轉之中。
03
主場優勢與生態封閉
Fusion這種按需分配的架構是企業用戶和個人用戶都夢寐以求的,但對于提供大模型的科技巨頭來說,這無疑是在削弱其利潤和控制力。
這就引出了當前行業的另一個明顯趨勢:智能體時代的“主場優勢”構建。
觀察近期的產品發布:國外,Anthropic與OpenAI分庭抗禮,Claude Code與Codex針鋒相對;國內,前有小米MiMo Code加強對MiMo的綁定,后有智譜更新ZCode 3.0專情于GLM。
這種模型與調用環境(IDE/CLI)的強綁定,不僅是出于商業排他性的本能,背后也有著深刻的工程邏輯與戰略企圖。
從工程邏輯的角度來看,這是在用環境掩蓋模型缺陷。
模型與智能體環境的關系,正如編程語言與IDE的關系。任何一個通用大模型都有其獨特的失效模式(Failure Modes)。
當Anthropic構建Claude Code時,除了開發一個命令行工具,還要在底層硬編碼海量專門針對Claude優化的隱藏系統提示詞、錯誤重試邏輯以及特定的工具調用格式。
若是在一個外部通用的智能體框架中,Anthropic的模型可能會因為輸出格式不標準等意外錯誤而導致任務失敗;但回到其專屬的主場,IDE或CLI就能在后臺靜默糾正這些錯誤。這種主場優勢,能讓模型在指定環境中表現得異常順滑,從而給用戶一種“模型絕對領先”的錯覺。
從戰略企圖的角度來看,這是要建立難以掙脫的供應商“鎖定”。
從Prompt,到Skills,再到Harness,都充分說明了記憶和環境的重要性。一旦用戶習慣了在特定的智能體框架中工作,大量積累的上下文、自定義配置和工作流都會讓他們無法輕易離開底層的模型。
單純的API價格戰只能解決一時的問題,而極致打磨過的封閉智能體環境意味著能將模型能力升級為產品體驗。
這就是Anthropic的成功秘訣:當企業中程序員的核心業務流被固化在某個專屬的智能體中,哪怕OpenAI推出了新的一款讓Altman“看到原子彈、癱倒在地”的模型,亦或是DeepSeek和小米推出了便宜十倍甚至百倍的模型,企業也無法做到一鍵切換,因為工作流是不兼容的。
這種封閉的孤島策略,就是巨頭們抵御Fusion這種多模型路由技術和開源平替沖擊的最強護城河。
04
元框架的崛起與第三方的反擊
應對開源技術,巨頭們尚有余力,但多Agent協作的潮流終歸不可抵擋。當企業發現自己被迫在好幾個互不兼容的智能體孤島之間復制粘貼,并且因為無法切換底層模型而不得不承擔高昂成本時,基礎設施層的革命就不可避免地爆發了。
這就是Databricks開源Omnigent的歷史背景。Databricks給Omnigent定位為“元框架(Meta-Harness)”,一個比單一智能體更高維度的抽象層。
回顧計算機科學史,最大的躍遷往往來自于新的抽象層。當工程師們苦于同時管理數十個不同的服務器時,Google開發的Kubernetes橫空出世,將底層硬件抽象為統一的資源池。而如今的AI行業正處于完全相同的節點,各個智能體及其框架(Harness),就是那些難以完全兼容的服務器。
![]()
Omnigent的核心價值,就在于剝奪巨頭們的主場優勢,將控制權交還給用戶。它通過構建統一的API,實現了三種顛覆性的功能:
首先是類似“一鍵熱插拔”的組合性。
用戶可以在一個統一的工作流中,用僅僅一行代碼將負責邏輯的節點從Claude切換為其他自定義模型,或是在一個項目中同時調用Codex和多個自建智能體,直接瓦解了巨頭們的供應商鎖定(Vendor Lock-in)策略。
然后是兼顧安全與成本的絕對策略控制。
在封閉的生態中,模型能不能用、能怎么用、能用多久完全由巨頭們的黑箱定義。但在元框架中,用戶可以自由設置硬性上限,例如當某個會話的token消耗達到100美元時立刻凍結并請求人工確認,而無需去每個AI供應商那里查詢消耗量。
由于控制層上浮到了元框架,即使底層使用不同的模型,企業用戶最重視的安全審查和成本策略也能得到統一執行。
最后是消除上下文的孤島。
會話狀態不再留存于某一家廠商的服務器上,而是由中立的元框架接管。無論是人機協作還是多Agent協作,都會擁有一個統一的工作臺。
也因此,無論是Fusion技術還是Omnigent框架,這些工具都必須也只能出自第三方。
正如前面所說,Anthropic、OpenAI以及一眾國產AI廠商都存在嚴重的資本導向偏向性。只要不是自家模型實在拿不出手,它們就絕對不可能推出一個框架來允許企業和個人用戶將任務無縫分發給競爭對手以節省成本。
Fusion誕生于OpenRouter,一個中立的模型聚合API平臺;Omnigent誕生于Databricks,一家以“數據多云中立”為核心戰略的底層基礎設施供應商。只有與特定模型徹底解綁的第三方,才有動力去打造這種打破壁壘的工具。
這就代表了廣大企業開發者最核心的利益:AI應該是一種可商品化、可替代的計算資源,而不是一種被巨頭裹挾的特權。
05
重塑AI智能體的價值鏈
過去的三年,全球的人們都處于“模型中心主義”階段,所有人都在尋找那個能解決一切問題的全知全能的神。
但現實已經告訴我們,Fable 5做不到,GPT-5.5做不到,DeepSeek V4 Pro也做不到,我們只能進入“架構中心主義”階段。
在這個新的階段中,單一模型或單一智能體的封閉玩法注定會被邊緣化。而未來的企業級AI生產力系統,必將呈現出高度分化的層級結構:
在最底層,即算力執行層,國產模型將憑借極致的性價比承接下大量的基礎“搬磚”工作,徹底擺脫玩具的命運,成為不可或缺的基石。
在中間層,即認知評判層,御三家的旗艦模型將退居二線,不再處理瑣碎的細節,而是作為高高在上、總攬全局的工程師,在Fusion這樣的動態路由機制下,負責那些難度最大的核心收斂工作。
在最上層,即管控交互層,依托于Omnigent這樣的元框架,各大廠商的主場封閉也會被逐漸打破,實現跨模型、跨框架的無縫協作、成本預算管控以及企業級安全隔離。
真正的智能,不僅存在于深度學習的神經網絡內部,更存在于鏈接這些網絡的宏觀架構之中。
當算力、智力、成本與中立的基礎設施實現完美的系統化匹配時,AI才算真正完成了從“科技盲盒”到工業流水線的跨越。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.