美國公司被AI賬單壓得喘不過氣,中國大模型卻悄悄在美國B端市場殺瘋了!
優(yōu)步(Uber)在今年前四個月,就用完了全年的AI對話“Token預(yù)算”。Salesforce今年將要向模型公司支付約3億美元。
這還沒完。根據(jù)美國軟件智能平臺Jellyfish的估算,員工如果重度使用AI,合并一次拉取請求的成本就可能從0.28美元,瞬間飆到89.32美元。公司管理層更是叫苦不迭,84%的企業(yè)表示,AI支出已經(jīng)將公司毛利率拉低了6個百分點以上。
就在這幫美國老板為AI燒錢失眠時,一個叫DeepSeek的中國公司,宣布將API價格永久下調(diào)75%。輸入(緩存命中)價格,低至每百萬Tokens 0.025元。好家伙,這個價格差不多跌到了“白送”的水平。
另一家中國公司MiniMax更是直接把模型使用成本壓到了新低。
一時間,“性價比”三個字,成了中國大模型進(jìn)軍全球B2B市場最鋒利的武器。曾經(jīng)對自研AI充滿執(zhí)念的美國企業(yè),竟然開始刮起了“棄用美國模型,擁抱中國模型”的旋風(fēng)。
一個靈魂拷問隨之而來:同樣都是搞大模型,怎么中國公司的成本就能低這么多?美國公司的錢,到底花在哪了?
![]()
01. “開源節(jié)流”的技術(shù)陽謀:中國企業(yè)把每一分算力都榨干了
要搞清楚這個問題,得先把大模型運行的“燒錢”環(huán)節(jié)拆開看看。
一個AI大模型從無到有,再到為你提供服務(wù),主要分兩步:第一步,是“訓(xùn)練”,相當(dāng)于讓一個天才讀幾千萬本書;第二步,是“推理”,相當(dāng)于讓這個受過高等教育的人,回答你每天問的問題。
目前中美大模型的底子,尤其在推理環(huán)節(jié),成本差異已經(jīng)非常顯著了。其中最根本的原因,就是——技術(shù)路徑不同。
簡單來說,美國許多主流大模型,走的是“力大磚飛”的路線。它們在推理時,不管你的問題多簡單,都會調(diào)動幾乎整個“大腦”的神經(jīng)元來處理。這就是“稠密模型”。這種方式顯然非常“吃配置”,不僅速度慢,成本也高。
而中國企業(yè),普遍走的是MoE(混合專家模型) 路線。中國頭部模型,像DeepSeek、通義千問,都廣泛采用了這種架構(gòu)。它的做法是:先把一個“頂級大腦”分成無數(shù)個“金牌專家”(比如法律專家、醫(yī)學(xué)專家、數(shù)學(xué)專家),當(dāng)你提問時,系統(tǒng)只激活最相關(guān)的幾個專家來處理。
以DeepSeek-R1為例,6710億的總參數(shù),每次推理只激活370億,相當(dāng)于只用了不到6%的“腦力”來解決問題。這一下,計算量就降下來了,不僅能效提升,推理成本自然也就斷崖式下跌。
這還只是第一層。中國工程師們還在把“摳門”精神發(fā)揚到極致。比如模型壓縮、KVCache、投機(jī)采樣等各種工程優(yōu)化技巧,都能在不犧牲性能的前提下,顯著降低成本。比如,通過緩存你的問題,避免讓模型總做“重復(fù)計算”,這就能極大提升推理的吞吐效率。
說到底,中國企業(yè)因為資源有限,不得不挖空心思通過工程創(chuàng)新和架構(gòu)改良來“節(jié)流”,沒想到竟然憋出了對美國的“降維打擊”大招。
![]()
02. “降本增效”的硬件陽謀:不用英偉達(dá),我們的AI照樣跑得歡
如果說完美的技術(shù)架構(gòu)是“靈魂”,那支撐它的算力芯片,就是“肉體”。
在這一點上,中國大模型公司更是把“成本控制”玩到了極致。
眾所周知,美國企業(yè)搞AI,普遍使用英偉達(dá)昂貴的GPU芯片,因為它們已經(jīng)形成了龐大的CUDA生態(tài)護(hù)城河。而中國企業(yè),尤其是華為昇騰系列的國產(chǎn)AI芯片,正在成為一股不可忽視的“中國力量”。
性能方面,國產(chǎn)芯片不僅能夠“替上來”,而且在性價比上實現(xiàn)了反超。DeepSeek-V4發(fā)布首日,就完成了對華為昇騰等八大國產(chǎn)芯片的適配。據(jù)稱,其推理性能達(dá)到了英偉達(dá)對華特供版的2.87倍,而成本僅為后者的四分之一!華為昇騰新一代推理芯片950PR低配版單價僅約5萬元,差不多是英偉達(dá)H100的一半,但推理性能卻優(yōu)于H100。
這些優(yōu)勢還在快速放大。國產(chǎn)芯片不需要像英偉達(dá)那樣考慮“全球通用型”,而是可以在“算力、功耗、成本”的黃金三角中,找到針對特定工作負(fù)載的最佳平衡點,從而在推理環(huán)節(jié)構(gòu)建起獨特的成本壁壘。
隨著國產(chǎn)大模型MoE架構(gòu)的普及和工程優(yōu)化的深入,其對稀缺算力的“消耗”也大大降低。DeepSeek-V4的緩存命中輸入價格能壓到0.025元/百萬token,正是結(jié)合華為昇騰國產(chǎn)算力進(jìn)行優(yōu)化匹配的結(jié)果。
說到底,這套“國產(chǎn)芯片+國產(chǎn)模型”的黃金組合,不僅徹底打破了CUDA生態(tài)的壟斷,更是從源頭拉低了AI的準(zhǔn)入門檻,讓“中國成本”在全球B2B市場具備了碾壓式的競爭力。
![]()
03. 中美截然不同的“底牌”和“牌局”
拋開技術(shù)和硬件,中美兩國AI產(chǎn)業(yè)的差異,其實源于更深層的行業(yè)邏輯和商業(yè)模式之爭。
市場策略:卷價格 vs. 卷性能
中國大模型廠商掀起了一場史無前例的“價格戰(zhàn)”。但這場價格戰(zhàn)并非簡單的“燒錢換市場”。進(jìn)入2026年,主流廠商的降價,已經(jīng)從早期的“資源補(bǔ)貼”,轉(zhuǎn)向了依靠技術(shù)優(yōu)化帶來的成本降低。
這一轉(zhuǎn)變意義重大,因為它讓低價的根基變得非常穩(wěn)固。反觀美國,尤其是OpenAI、Anthropic等少數(shù)頭部玩家,采取了高舉高打的策略。他們寧愿投入巨額資金燒出一個可能顛覆世界的“超級智能”(AGI),也不屑于在B端市場與中國企業(yè)打價格戰(zhàn)。他們的邏輯是:只要我的模型能力最強(qiáng),用戶就算再貴也得買。
這種思維的差異,給了中國企業(yè)一個絕佳的超車窗口。當(dāng)DeepSeek憑高性價比在美國企業(yè)軟件采購榜單登頂時,市場已經(jīng)給出了明確信號。性價比正在成為中國大模型全球擴(kuò)張的關(guān)鍵“王牌”。
人才成本:工程師紅利是永恒的底牌
這一點尤其關(guān)鍵。根據(jù)智聯(lián)招聘數(shù)據(jù),2026年中國算法工程師的平均月薪約為20035元人民幣(約2900美元),年薪不到3.5萬美元。而在硅谷,一個優(yōu)秀的AI工程師年薪輕輕松松就能達(dá)到數(shù)十萬美元。
一個美國AI團(tuán)隊的人力成本,在中國至少可以養(yǎng)活一個十倍于其規(guī)模的開發(fā)團(tuán)隊。這種近乎極致的人才投入產(chǎn)出比,使得中國企業(yè)能夠以低成本、高速度進(jìn)行試錯、迭代和創(chuàng)新,成為技術(shù)降本的最強(qiáng)后盾。
所以,答案已經(jīng)非常清晰了。中國企業(yè)通過架構(gòu)設(shè)計的巧思、工程優(yōu)化的“摳門”、國產(chǎn)硬件的護(hù)城河以及壓倒性的人才成本優(yōu)勢,打造了一套難以復(fù)制的“低成本高效率”AI生產(chǎn)體系。
![]()
當(dāng)美國企業(yè)還在為高昂的AI賬單輾轉(zhuǎn)反側(cè)時,中國大模型已經(jīng)憑借極致的性價比,在美國B2B市場攻城略地。這場關(guān)于AI成本的戰(zhàn)爭,中國公司已經(jīng)占據(jù)了先機(jī)。而屬于中國AI的黃金時代,或許才剛剛拉開序幕。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.