網易首頁 > 網易號 > 正文 申請入駐

定價權VS消耗戰:大模型下半場的續命法則

0
分享至



作者丨鳳梨編輯丨九黎

當下的AI圈,正陷入一場深刻的算力焦慮。

面對中美AI競賽和龍蝦帶來的指數級膨脹大模型推理需求,算力荒成了懸在所有玩家頭頂的達摩克利斯之劍。然而,面對同一道難題,行業卻在走向兩個截然不同的解題方向。

一邊是以智譜、Kimi以及海外芯片新貴Taalas為首的“降價派”,他們揮舞著資本與硬件創新的大旗,試圖將Token的價格徹底擊穿,用極致的廉價換取生態規模;另一邊,則是以小米等端側巨頭為代表的“降耗派”,他們拋出反共識的論調:出路不是更便宜的Token,而是更省Token的底層框架。

這不僅僅是技術路徑的切磋,更是一場關乎AI時代話語權、商業模式乃至算力流向的路線之爭。

01

降價派的暴力美學

在大模型的牌桌上,降價派無疑是目前聲量最大、動作最猛的陣營,他們的核心訴求非常純粹:既然算力昂貴阻礙了AI的普及,那就通過商業補貼或底層硬件的顛覆式重構,強行把Token的價格打下來,讓AI像自來水一樣廉價且隨處可得。這一陣營中,既有試圖用互聯網經典打法做大蛋糕的AI新貴,也有從芯片物理層發起革命的硬核極客。

首先是軟件與API層的商業降維打擊。以智譜、Kimi、MiniMax等為代表的AI六小龍,在過去幾個月內掀起了一場慘烈的價格戰,部分基礎模型的API調用價格甚至無限趨近于免費。

這種打法,互聯網人再熟悉不過,典型的以虧損換規模。他們深知,大模型時代的護城河在于應用生態與數據飛輪。只有前端的Token足夠便宜,B端開發者才敢放手去構建原生應用,C端用戶才愿意毫無心理負擔地將其作為高頻工具。

這群AI新貴們正在用未來的預期市場份額,來攤薄眼下的算力成本。他們賭的是規模效應:當調用量呈幾何級數爆炸時,數據中心的邊際成本會隨之驟降;同時,海量的高質量交互數據反哺模型,形成贏家通吃的壟斷壁壘。在這個邏輯下,降價不是無奈之舉,而是搶占AI時代操作系統入口的核武器。

其次是硅片層的物理級降價革命。降價派不僅有軟件層面的商業補貼,更涌現出了如Taalas這樣的硬件破局者。這家由Tenstorrent前CEO LjubisaBajic創立的AI芯片新星,其野心比單純的API降價狂妄得多。Taalas的路線是:既然通用GPU運行大模型存在極大的資源冗余和能耗浪費,那不如直接將特定的大模型,比如千億參數模型直接硬編碼進硅片中,打造專用AI芯片(ASIC)。

Taalas試圖通過直接在芯片上實現模型的計算邏輯,從而繞過傳統的內存讀取瓶頸,實現相比傳統GPU成百上千倍的效率提升和成本下降。如果說國內的AI六小龍是通過商業模式在前端把Token價格打下來,那么Taalas就是試圖通過硬件重構在后端把Token的生產成本徹底打穿。

無論是補貼戰還是造芯戰,降價派的終極信仰都是摩爾定律的延續,他們堅信算力的絕對價格終將不可逆轉地走向低廉,而誰能在這個過程中率先提供最便宜的算力,誰就能成為AI時代的AWS或基礎設施霸主。

02

降耗派的效率革命

就在降價派在云端算力場廝殺得難解難分之時,以小米為代表的降耗派卻在另一條路上逆向而行。小米MiMo團隊負責人羅福莉的一番話,精準概括了這一陣營的技術哲學:當下AI的算力荒,出路不是更便宜的Token,而是更省Token的框架和更高效的模型共同進化。

如果說降價派是在尋找更便宜的水源,那么降耗派則是在研發更抗旱的作物。

這一路線的崛起,本質上是由硬件廠商的基因和端側落地的剛需所決定的,對于小米這樣的科技制造巨頭而言,未來的主戰場不在遠在天邊的數據中心,而在于手機、汽車、AIoT等數以億計的端側設備。在云端,你可以通過無限堆疊GPU來大力出奇跡;但在端側,手機的電池容量是有物理極限的,內存帶寬是極其金貴的,芯片的散熱空間是寸土寸金的。

在這些苛刻的物理約束下,端側設備根本無法承受海量無節制的Token消耗,即便云端的Token降到零元,只要依然依賴云端運算,就會面臨網絡延遲、隱私泄露以及設備本身聯網功耗的問題。因此,降耗派必須從根源上解決問題:讓模型在產生同等甚至更高質量回答的同時,極大減少對計算資源的消耗。

具體到技術落地,這是一場極其硬核的架構瘦身戰。降耗派的做法不是簡單的模型壓縮或蒸餾,而是對AI運轉框架的底層重構。例如,通過改進注意力機制,引入如Mamba等線性復雜度的狀態空間模型,或者優化鍵值緩存的管理策略,使得模型在處理長文本時不再呈指數級消耗內存。更高效的Tokenizer設計,也能讓模型用更少的Token表達更多的信息密度。

對于小米等硬件大廠而言,把Token的消耗打下來,直接關系到其核心商業模式的成敗。一部搭載端側大模型的AI手機,如果模型運行極其耗電,或者占用過多運存導致系統卡頓,那將是災難性的用戶體驗。因此,降耗派的終極目標,是將大模型變成一種低功耗、高效率的基礎組件,無縫熔鑄進操作系統的底層。他們不在乎云端調用一次收多少錢,他們在乎的是,如何讓每一次AI推理的電量消耗降到最低,讓哪怕是中低端硬件也能流暢運行強大的智能。這是一種典型的產品經理嫁接硬件工程師思維,用極致的工程優化去對抗算力黑洞。

03

殊途同歸的商業局

當降價派和降耗派在各自的賽道上狂奔時,我們必須看清:這并不是一場非此即彼的零和博弈,而是AI產業鏈走向成熟過程中的必然分工與商業錯位。這兩條路線的交鋒,本質上是兩種截然不同的商業模式在AI時代的碰撞。

降價派代表的是水電煤邏輯,無論是不斷探底API價格的AI六小龍,還是試圖通過顛覆性芯片重塑算力成本的Taalas,他們都在致力于將AI算力變成社會的基礎設施。在他們的藍圖中,算力應該像電力一樣,用戶無需關心發電機是如何工作的,只需要插上插座、按需付費。這種邏輯的護城河在于網絡效應和極高轉換成本。一旦海量的企業級應用和消費級App建立在他們廉價且高效的API之上,龐大的生態慣性將使得后來者極難顛覆。但其面臨的風險也同樣巨大:在真正形成寡頭壟斷之前,長期的失血和價格戰可能拖垮任何一家資金鏈稍顯脆弱的明星公司。

降耗派代表的則是消費電子與體驗邏輯,以小米為首的端側巨頭,他們不需要通過賣API來賺錢。他們賺錢的方式,是賣出更多搭載了極佳AI體驗的手機、汽車和智能家居。在他們的商業閉環里,優秀的、低消耗的AI模型,是硬件產品的高級附屬價值。降耗派的護城河在于軟硬一體的閉環體驗和離用戶更近的場景占有。當算力被高效壓縮在設備本地時,他們掌握了用戶最隱私的數據、最直接的交互入口,這種壁壘是云端大模型無法輕易穿透的。

推演終局,這兩條路線大概率將走向云端協同的融合,未來的AI應用場景中,需要重度計算、海量知識檢索的通用復雜任務,將交由降價派構建的廉價云端超算中心來完成,大吃大嚼著廉價的Token;而涉及個人隱私、需要極低延遲響應、結合環境感知的個性化任務,則將由降耗派優化到極致的端側低功耗模型來處理。

然而,在融合到來之前的這段窗口期,路線之爭依然會非常激烈,因為資源的分配是有限的,資本的目光是挑剔的。是押注那些能夠通過瘋狂降價燒出個未來的超級平臺,還是看好那些穩扎穩打、通過技術降耗提升硬件毛利的生態巨頭?這不僅是投資人的考題,更是所有AI從業者必須面對的戰略抉擇。

歷史總是驚人地相似。如今大模型領域的這條分水嶺,像極了當年PC時代的云端服務器與本地芯片效率之戰,又仿佛智能手機初期的流量補貼與硬件體驗之爭。

有人以虧損換取明天,用降價的利刃劈開市場;有人以技術打磨基石,用降耗的內功構筑壁壘。“把Token價格打下來”和“把Token消耗打下來”,終極目標都是為了讓AI真正走向普羅大眾。

但商業世界是殘酷的。當資本退潮,當大模型的算力紅利被吃透,你認為誰的路線能構筑起更深、更堅固的護城河?是做大蛋糕的降價派,還是做精架構的降耗派?

參考資料:

羅福莉X,11:13 Apr5 2026

鈦媒體APP,《“邪修”AI芯片的Taalas,成色如何?》

21世紀經濟報道,《2025年,“大模型價格戰”不怕虧錢了?》

每日經濟新聞,《豆包引流抖音,Kimi連通京淘:大模型“帶貨”烽煙起引爆智能入口爭奪戰》

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
一天一個價!多款電腦集體漲價,店員透露:27日以后會大幅漲價

一天一個價!多款電腦集體漲價,店員透露:27日以后會大幅漲價

極目新聞
2026-04-24 18:58:46
騰訊發布了 7 個座艙智能體,汽車的意義從「空間位移」走向了「時間價值」

騰訊發布了 7 個座艙智能體,汽車的意義從「空間位移」走向了「時間價值」

愛范兒
2026-04-24 17:22:23
2026年5月起!若不出意外,中國房價、樓市可能迎來“四大轉變”

2026年5月起!若不出意外,中國房價、樓市可能迎來“四大轉變”

云鵬敘事
2026-04-23 20:32:38
廣東3消息!胡明軒正式發聲,徐昕回應直面杜鋒,徐杰獲MVP候選

廣東3消息!胡明軒正式發聲,徐昕回應直面杜鋒,徐杰獲MVP候選

多特體育說
2026-04-25 11:24:28
又遇苦主!鄭欽文第5次挑戰世界第2 交手1-3落后 2月前遭3盤逆轉

又遇苦主!鄭欽文第5次挑戰世界第2 交手1-3落后 2月前遭3盤逆轉

我愛英超
2026-04-24 22:13:09
58歲江珊露面,150斤穿西裝腚大腰圓,但臉顯年輕幾乎沒皺紋

58歲江珊露面,150斤穿西裝腚大腰圓,但臉顯年輕幾乎沒皺紋

墨印齋
2026-04-24 16:43:38
黃一鳴回應:沒結婚一天找8個男的也沒關系 承認跟40歲大叔交往過

黃一鳴回應:沒結婚一天找8個男的也沒關系 承認跟40歲大叔交往過

奇思妙想草葉君
2026-04-24 22:03:45
賀子珍離開延安去蘇聯前,徐海東請她吃飯:大姐,我只承認你

賀子珍離開延安去蘇聯前,徐海東請她吃飯:大姐,我只承認你

大運河時空
2026-04-24 17:15:03
炸鍋!全國充電樁集體漲價!每度電狂漲,電車省錢神話徹底破滅?

炸鍋!全國充電樁集體漲價!每度電狂漲,電車省錢神話徹底破滅?

藍色海邊
2026-04-24 08:08:58
美國在國民黨豢養的鷹犬終于出動了!不僅賣臺還攻擊大陸發展落后

美國在國民黨豢養的鷹犬終于出動了!不僅賣臺還攻擊大陸發展落后

顧秋韻
2026-04-25 09:54:52
取消戶籍限制!教育部突發新規!9月1日起執行:家長再也不用焦慮

取消戶籍限制!教育部突發新規!9月1日起執行:家長再也不用焦慮

芳姐侃社會
2026-04-24 22:52:50
華晨宇哭了!傳砸46億買地「打造演唱會樂園」 開唱前9天喊卡崩潰

華晨宇哭了!傳砸46億買地「打造演唱會樂園」 開唱前9天喊卡崩潰

ETtoday星光云
2026-04-24 12:28:06
盧特尼克暴怒:中國一塊芯片也沒買,美國的技術封鎖終于迎來反噬

盧特尼克暴怒:中國一塊芯片也沒買,美國的技術封鎖終于迎來反噬

忠誠TALK
2026-04-24 23:06:00
最新發布:2026年第一季度全國31省GDP排名!

最新發布:2026年第一季度全國31省GDP排名!

葉初七
2026-04-25 11:51:04
北京一男子夜晚爬樹摘香椿掉落被卡,次日清晨才被發現,肢體受壓、倒掛懸空達7個多小時……

北京一男子夜晚爬樹摘香椿掉落被卡,次日清晨才被發現,肢體受壓、倒掛懸空達7個多小時……

環球網資訊
2026-04-25 12:28:19
慈禧嘴里那顆8億的夜明珠,下落已經查明:原來是她拿來干那種事

慈禧嘴里那顆8億的夜明珠,下落已經查明:原來是她拿來干那種事

近史談
2026-04-14 18:51:51
北京大學教授喬曉春言論惹爭議,我們應該上綱上線嗎?

北京大學教授喬曉春言論惹爭議,我們應該上綱上線嗎?

總在茶余后
2026-04-22 21:14:14
好消息!全國免費電視正式落地,不用裝寬帶不交年費5分鐘就能看

好消息!全國免費電視正式落地,不用裝寬帶不交年費5分鐘就能看

小柱解說游戲
2026-04-25 01:26:48
黃宗澤牙齦萎縮影響顏值,再帥的港圈男神,也扛不住一口牙毀所有

黃宗澤牙齦萎縮影響顏值,再帥的港圈男神,也扛不住一口牙毀所有

觀魚聽雨
2026-04-24 23:08:32
寒武紀Day 0適配DeepSeek V4意味著什么

寒武紀Day 0適配DeepSeek V4意味著什么

經濟觀察報
2026-04-24 20:58:03
2026-04-25 19:47:00
科技新知 incentive-icons
科技新知
洞察技術變化背后的產業變遷。
2729文章數 13124關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

現場視頻:殲-15掛彈起飛硬剛外軍航母編隊滋擾

頭條要聞

現場視頻:殲-15掛彈起飛硬剛外軍航母編隊滋擾

體育要聞

火箭0-3觸發百分百出局定律:本季加時賽9戰8敗

娛樂要聞

鄧超最大的幸運,就是遇見孫儷

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

藝術
游戲
數碼
時尚
健康

藝術要聞

安德烈·皮安科夫斯基:當代俄羅斯畫家

索尼新規落地!所有數字版游戲都要強制30天聯網驗權

數碼要聞

雷達感應自動開關燈,Yeelight新品來了

上新|| 入夏第一件短袖,買它!

干細胞如何讓燒燙傷皮膚"再生"?

無障礙瀏覽 進入關懷版