網易首頁 > 網易號 > 正文 申請入駐

大模型創業公司,為什么越來越多在往“小”做?

0
分享至


題圖來自:AI生成

把一臺主流安卓手機切到飛行模式,然后問屏幕上的AI:“幫我總結一下昨天的會議,挑三個待辦事項?!?/p>

它會答出來。答得不算驚艷,但靠譜。

從2022年11月OpenAI正式發布ChatGPT以來,幾乎所有人對AI 的認知都建立在一個樸素的邏輯上:你提的問題,會跑去一個遙遠的數據中心,由幾萬張GPU 算出答案,再傳回你的屏幕。這個過程貴、慢、依賴網絡,但所有人都默認那就是 AI 應該有的樣子。

然而僅僅三年時間,這種印象被一臺斷網的手機輕飄飄地推翻了。

特別是最近半年,和大模型行業的人聊天時,會發現一個詞的頻率越來越高——端側。

云端之上,并沒有“錢”

大模型上半場的邏輯非常清晰:參數大就是好。

GPT-4 出來之后那一年,國內拿到融資的公司,PPT 第一頁幾乎都在堆數據——多少 B 參數、多少萬億 token、多少張 H100。投資人也吃這一套。先把規模拉滿,故事就成立了。

但資金燒到當下,賬就逐漸算清楚了。

2025年OpenAI的估值雖然推到了五千億美元量級,但預計稅前虧損也達到了驚人的212億美元。Anthropic的情況看上去好一些:毛利率從2024年的 -94%改善到2025年的40%出頭,但同期 EBITDA(息稅折舊及攤銷前利潤)虧損仍有52億美元。Cohere和Mistral則反復傳出尋求被收購的消息。

這一行業里所有靠賣API 調用為生的公司,最后都站在同一條曲線的不同位置上,營收在漲,虧損也在漲,用戶越多,虧得越多。毛利率好轉的速度趕不上算力消耗擴張的速度。

這是反互聯網常識的。過去二十年,規模意味著壁壘,規模也意味著利潤。但大模型這門生意,規模意味著持續的算力消耗,因為每一次用戶和AI 的對話,背后都是真實的電費和GPU折舊。

更尷尬的是,這條曲線沒有明顯的下行點。模型再大、能力再強,單次推理的邊際成本依然擺在那里。


云端之外,暗流已動

把視線移到云端之外。

2023 年,在手機發布會上聽到“NPU”這個詞,多半會覺得有點尷尬。芯片廠商講了好幾年,但市面上幾乎沒有什么模型真的用得上,它像一個反復被寫進 PPT 又被現實辜負的未來能力。

到了2025年,這種能力開始兌現。

芯片廠商開始主動找模型公司談適配,因為客戶在問。手機用戶也開始問:為什么我的 AI 助手離線就用不了?為什么我換個網絡環境,它的反應慢了一截?這些問題意味著AI 已經被人當成水電一樣的存在了。它需要隨時可用,不能挑網絡。

模型這一側也終于跟上了。

過去幾年,量化、蒸餾、稀疏注意力這些工程方法被一批團隊反復打磨,一個幾B 參數的模型,經過精心設計,在多模態、長文本、OCR 這些原本被認為只有大模型才能干的活上,已經能做到讓人挑不出毛病的水平。

最直接的體現,是它真的能裝進設備里。手機芯片那點顯存,蘋果 A 系列大概八九 GB,驍龍旗艦差不多。以前看是天花板,現在反過來成了一種剛剛夠用的約束,逼著模型公司把每一層結構都摳到極致。

由此可見,端側AI 這兩年的真正拐點不是某一項技術突然成熟,而是模型、芯片、終端三方在同一個時間窗口里,互相找到了對方。


誰在押這條路

把端側作為主線在押的玩家,已經分成了幾撥。

第一撥是終端廠商,自己下場做模型。

蘋果的Apple Intelligence是其中最有代表性的——大約30億參數級別,主打“端側優先、云端兜底”。它的存在意味著蘋果決定不再把AI能力外包給OpenAI,即使前者聲稱是“合作”。Google 走得更激進,把Gemma Nano直接預裝到Pixel 系列,并且在Android 14之后開始向手機廠商開放底層API。

終端廠商下場的邏輯很清楚,AI 一旦成為系統級功能,它就不該是別人收過路費的地方。

第二撥是大公司開源出來的小模型。

微軟的Phi系列是這條路上的標志性產品。Phi-3用3.8B參數做出了能對標 70B模型的部分能力,證明了“小模型+ 精選數據”路線的可行性。Meta的Llama 3.2在2024年下半年推出1B / 3B版本,明確標注“為端側設計”。Google的Gemma系列走類似路線,開源出來供整個生態用。

這一撥的共同特點是:它們沒指望靠這些小模型直接掙錢。它們是在為生態鋪路。路鋪好了,再回頭收硬件、云端、其他業務的錢。

第三撥是真的把“小尺寸”當成核心戰略的創業公司。

Mistral是其中最早的。7B起家,在歐洲拿下了一批政企客戶。但因為太依賴單一開源故事,2024年微軟入股之后處境變得復雜。

國內這邊,阿里的Qwen 系列推出了從 0.5B 到 7B 的小尺寸版本,覆蓋端側多個段位,但因為同時還在做大尺寸 API 業務,端側不是主線。智譜 GLM 也有端側版本,但商業重心仍在云端。把端側當成絕對主線在做的,國內最有代表性的是面壁智能,MiniCPM 系列做到了GPT-4o同級水平。這種說法一年前幾乎所有人都覺得是夸口,但它發生了。

把這幾撥玩家放在一起看,端側AI 已經不是“小公司的避風港”,它正在成為整個行業重新組織自己的方式。


端側不是免費午餐

寫到這里,也得說句實話。端側AI前景雖然無限,但不是完美故事。

把模型塞進設備這件事,工程上的麻煩比想象中碎。安卓機型上千種,芯片各家API 不一樣,系統定制層每個廠商各有講究。一個端側模型想在這片土壤里跑順,光適配就夠小公司喝一壺——這件事沒有捷徑,只有一行行的代碼、一臺臺機器的實測,一次次跑通之后被下一代芯片打破,再重新跑通。這種活算法工程師不愛干,但端側這條路就是由這些不性感的活鋪出來的。

模型公司還得面對一個更隱性的處境:手機廠、芯片廠、車廠本身就是產業鏈里強勢的一方。被預裝、被集成看上去是“贏了”,但同時也意味著隨時要面對被替換、被壓價、被邊緣化。Mistral 這兩年在歐洲的處境多少能說明問題——它既要滿足法國政府對“主權AI”的期待,又要應付微軟入股之后被主導話語權的尷尬,左右都難做。

端側換來了商業化更扎實的路徑,但也意味著融入合作生態,成為產業鏈里若干環節中的一環。

大模型上半場比的是誰能把山攀得最高。下半場比的,是誰愿意走下山,走進具體的設備里、具體的場景里、具體的人面前。

去年那臺跑在飛行模式下的安卓手機,今年我又見過一次。

在朋友的車上,離線導航和語音都跑在本地。

云在很遠的地方。

但AI 已經到了。

本內容由作者授權發布,觀點僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯系 tougao@huxiu.com。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4854778.html?f=wyxwapp

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
湖人G5輸球雷迪克要負全責!摒棄最擅長的打法,保守死板葬送好局

湖人G5輸球雷迪克要負全責!摒棄最擅長的打法,保守死板葬送好局

夜白侃球
2026-04-30 16:33:41
莫將“躺平”簡化為“思想問題”

莫將“躺平”簡化為“思想問題”

老蕭雜說
2026-04-30 19:57:14
全面評估候選人,電訊報:曼聯認為伊勞拉符合球隊發展方向

全面評估候選人,電訊報:曼聯認為伊勞拉符合球隊發展方向

懂球帝
2026-04-30 22:00:09
馬斯克完成15歲癌逝少女遺愿!《你的名字》成他最愛的動漫

馬斯克完成15歲癌逝少女遺愿!《你的名字》成他最愛的動漫

國創漫話
2026-04-28 15:22:59
她拒唱國歌否認是中國籍,還將倆兒子戶口落到國外,她現狀如何?

她拒唱國歌否認是中國籍,還將倆兒子戶口落到國外,她現狀如何?

混沌錄
2026-04-28 22:29:08
中國海軍核動力官宣,004航母將至或命名臺灣艦

中國海軍核動力官宣,004航母將至或命名臺灣艦

暮雨咋歇著
2026-04-26 19:07:08
廣州一段不到2公里的道路停了幾百臺車,不少都是僵尸車,有些輪胎已經氣癟了,附近街坊:抄完牌他們仍繼續停;當地:將會開展整治

廣州一段不到2公里的道路停了幾百臺車,不少都是僵尸車,有些輪胎已經氣癟了,附近街坊:抄完牌他們仍繼續停;當地:將會開展整治

瀟湘晨報
2026-04-30 11:55:09
偷稅漏稅風波后!網紅白冰首現身,開千萬跑車違停,慘被交警處罰

偷稅漏稅風波后!網紅白冰首現身,開千萬跑車違停,慘被交警處罰

裕豐娛間說
2026-04-30 08:26:09
活塞險勝魔術追到2-3:坎寧安45分單節20分 班凱羅45+9+7

活塞險勝魔術追到2-3:坎寧安45分單節20分 班凱羅45+9+7

醉臥浮生
2026-04-30 09:44:47
470億遺產,家族“零內斗”,前女首富陳麗華留給“唐僧”遲重瑞的東西終于揭曉!

470億遺產,家族“零內斗”,前女首富陳麗華留給“唐僧”遲重瑞的東西終于揭曉!

家族辦公室雜志
2026-04-30 14:51:56
延遲滿足是偽命題!斯坦福棉花糖實驗被推翻:所謂品格測試,測的其實是階級

延遲滿足是偽命題!斯坦福棉花糖實驗被推翻:所謂品格測試,測的其實是階級

齊天候
2026-04-30 13:43:48
他是著名演員,從發病到去世僅20分鐘,主持人兒子比他更有名

他是著名演員,從發病到去世僅20分鐘,主持人兒子比他更有名

削桐作琴
2026-03-21 15:03:45
以色列海軍攔截“全球堅韌船隊”,扣押約175名活動人士

以色列海軍攔截“全球堅韌船隊”,扣押約175名活動人士

界面新聞
2026-04-30 16:02:32
大學“倒閉潮”倒計時?7年后你的文憑,或許還不如一張電工證

大學“倒閉潮”倒計時?7年后你的文憑,或許還不如一張電工證

小談食刻美食
2026-04-25 09:37:54
余承東在華為權力排名

余承東在華為權力排名

生活新鮮市
2026-04-27 18:30:53
百萬男網紅被曝是海王!同時交往6人,見面就開房,睡覺不愛戴套

百萬男網紅被曝是海王!同時交往6人,見面就開房,睡覺不愛戴套

葉公子
2026-04-29 14:25:13
“開除韓國瑜”風暴升級,季麟連被逼道歉辭職,鄭麗文被圍攻逼宮

“開除韓國瑜”風暴升級,季麟連被逼道歉辭職,鄭麗文被圍攻逼宮

共工之錨
2026-04-30 13:27:18
廣州小升初巨變!重點班消失,家長的內卷不會停,但學區房天塌了

廣州小升初巨變!重點班消失,家長的內卷不會停,但學區房天塌了

狐貍先森講升學規劃
2026-04-30 07:35:03
五分鐘的完美騙局:朝鮮黑客如何用假視頻攻陷幣圈高管

五分鐘的完美騙局:朝鮮黑客如何用假視頻攻陷幣圈高管

報錯免疫體
2026-04-29 17:09:59
全球首家AI妓院,革了成人行業的命

全球首家AI妓院,革了成人行業的命

廣告案例精選
2026-04-02 14:49:22
2026-05-01 00:48:49
虎嗅APP incentive-icons
虎嗅APP
個性化商業資訊與觀點交流平臺
26232文章數 687703關注度
往期回顧 全部

財經要聞

易會滿被“雙開”!

頭條要聞

英國國王給特朗普送了口鐘 還貼臉開大"有需要盡管敲"

頭條要聞

英國國王給特朗普送了口鐘 還貼臉開大"有需要盡管敲"

體育要聞

季后賽場均5.4分,他憑啥在騎士打首發?

娛樂要聞

孫楊博士學歷有問題?官方含糊其辭

科技要聞

9000億美元估值,Anthropic即將反超OpenAI

汽車要聞

專訪捷途汪如生:捷途雙線作戰 全球化全面落地

態度原創

手機
健康
房產
本地
公開課

手機要聞

華為Pura 90 Pro Max體驗:AI拍片,比2億長焦還狠

干細胞治燒燙傷面臨這些“瓶頸”

房產要聞

熬了6年,漲了2億,三亞核心區這塊地再次上架

本地新聞

用青花瓷的方式,打開西溪濕地

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版