![]()
出品 | 虎嗅科技組
作者 | 梁卡爾
編輯 | 苗正卿
頭圖 | 云天暢想
這是虎嗅WAIC“追蹤Token商業新范式”系列文章第【07】期。
云天暢想這輪融資,不能只看成一家邊緣智算公司的補血。
6月17日,云天暢想宣布完成超過10億元人民幣E輪融資,由中國互聯網投資基金領投,中金資本等機構跟投。截至2026年6月,該公司累計融資超過30億元人民幣。伴隨融資公布的,還有一個新戰略宣布,公司定位從“邊緣智算服務商”,拓展為面向AGI時代的“實時智算織網”。
可是,當普通大模型Token正在被大廠打成價格戰,低時延、靠近終端的“實時Token”為什么還能賣出溢價?這是這輪融資背后的核心賭局。也就是說,云天暢想的客戶是否會愿意為了“更快”持續多付錢。
過去兩年,AI基礎設施的主角是超大規模數據中心。科技巨頭堆疊數萬張GPU,訓練更大的模型,爭奪誰的模型更聰明的話語權。但當大模型開始進入應用階段,行業矛盾正在變化。
更大的背景是,在這個轉變過程中,Agent、Physical AI(物理AI)、智能座艙、AIPC、智能硬件等新場景,對響應速度、并發穩定性和服務覆蓋能力提出了更高要求,也推動算力基礎設施從中心化部署走向分布式網絡化布局。
“過去大家只關心大模型的質量,但當AI走向規模化應用時,大家更關注成本、延時和交互的用戶體驗。”云天暢想首席科學家張霖濤告訴虎嗅。
但問題是,從訓練轉向推理是算力需求結構變了,這不意味著邊緣的崛起。推理市場同樣會被大廠壓價,云天暢想要做的就是,找出一個不按照普通Token價格競爭的市場。
張霖濤用了一個商業比喻來解釋這種變化,那些位于偏遠地區、規模宏大的中央算力中心,本質上是AI時代的“煉油廠”,負責把原始數據“提煉”成高智商的模型;而云天暢想構建的分布式邊緣智算網絡,是密布在用戶身邊的“加油站”。當用戶的“汽車”(智能終端)需要能量時,它不可能開到數千公里外的“煉油廠”,它需要在最近的“加油站”進行即時加注。
這個比喻能解釋邊緣算力的必要性,但解釋不了商業性。加油站賺錢的邏輯是高頻次、穩定的毛利和明確的單位經濟模型,而不僅僅是便利性。放在AI推理里,就是低延遲能不能形成溢價,邊緣節點能不能賺到錢,云天暢想能不能定義價格。
對云天暢想來說,其客戶采購這類服務時,并不只看每百萬Token價格,排序更靠前的是能否在不同地區落地服務,以及服務穩定性和質量。其客戶通常有真實落地場景,對服務質量的要求高于單純的價格敏感度。
云天暢想后續可能會考慮Token計價的產品,但至少在現階段,價格并不是其客戶采購時的第一權重。
低延遲不是護城河
實時Token是一個具有技術張力的核心賭注。
今天,賣云、賣算力、賣Token,本質上正在變成同一場生意,誰的成本更低,誰的供應更穩定,誰就能在價格戰里多活一輪。
普通Token的價格正在快速下探。文本問答、摘要翻譯這類推理需求,標準化程度高、對延遲不極端敏感,天然適合被大廠、公有云和模型公司卷成規模化商品。
云天暢想并不想進入這個最擁擠的戰場。云天暢想聯合創始人、首席戰略官徐公美的判斷是,要賣技術含金量高的實時Token。
所謂實時Token, 不是一個單純的技術概念,也不是一個成熟的標準計價單位,而是一類商業場景,如實時語音交互、AI PC、智能座艙、游戲AI等現有的應用,以及未來的具身智能和物理AI。這些場景的共同點是,用戶不能等,這也是云天暢想找到的差異市場。
云天暢想面對的并不是單一類型客戶,使用中心云、公有云模型API、自建推理集群的客戶都有,但更高頻的共同訴求是低時延。原因有兩層:一是時延直接影響用戶體驗,體驗下降會帶來用戶流失;二是低時延會創造新的交互場景,比如智能耳機、智能陪伴等需要實時反饋的終端應用。
不過,對于哪些任務最容易打出ROI,云天暢想并未給出明確排序,只強調“低時延是核心場景”。究竟哪一類場景最容易打出ROI,仍需要更多客戶案例驗證。
一個聊天機器人慢兩秒,用戶可能還能接受,但游戲里的AI NPC反應慢半拍,沉浸感會被破壞,智能座艙和機器人更極端,很多交互和決策需要在毫秒級完成,不能把所有計算鏈路都拉到遠端中心云。
張霖濤舉了自動駕駛的例子,當車在路上行駛,留給障礙物識別并作出決策的時間通常只有數毫秒時間,這時候數據通過幾千公里外的中央機房去計算。“算完了再傳回來,車可能直接就撞上了。所以這種必須在最近的邊緣端搞定。”
嚴格來說,自動駕駛是一個容易被誤用,但能說明方向的例子。安全閉環必須在車端完成,不能依賴遠端云,邊緣節點更可能承擔協同感知、地圖更新、仿真訓練、內容與交互等任務。這個邊界說明,越靠近物理世界,計算鏈路越需要分層。
這種影響在物理AI與具身智能領域體現的將更為明顯。當一個具身智能機器人在復雜的物理環境中行走、抓取物體,其背后每秒鐘產生的Token調用量和圖形渲染需求,遠超傳統聊天機器人,且對延遲敏感,不能完全依賴遠端中心云。這種剛性需求讓大型數據中心遇到難以解決的物理困境。
云天暢想的方案是,未來的算力基礎設施不再是堆砌孤立的機房,而是一種分布式網絡化布局。該公司正在通過構建覆蓋全球300多個城市的邊緣智算網絡,將算力節點直接推到距離用戶“最后一公里”的數字邊緣,從而有機會完成實時Token的商業布局,但短期內難以成為商業模型的主要支撐。
![]()
圖片來源:云天暢想
從被誤解的“云游戲”到“GPU原生”
根據過往業務,云天暢想經常被貼上“云游戲”的標簽。這既是它的起點,也一度限制了外界對它的估值想象。云游戲行業曾經熱過,也冷過,市場對這個賽道的商業化耐心并不算高。但從另一面看,云游戲恰恰是最早驗證邊緣GPU能力的高壓場景。
云游戲業務本質上是一套實時計算工程,對圖形計算和算力壓榨極為嚴苛、殘酷,它要求在移動端實現超高畫質的圖形渲染,同時必須將端到端的流媒體傳輸延遲控制在毫秒級,否則玩家就會感到明顯的卡頓。這類場景對GPU調度、低時延網絡、異構硬件適配、峰谷負載管理等維度要求很高。
徐公美告訴虎嗅,云游戲公司是一種誤解,云游戲是技術服務率先爆發的落地場景,但從底層架構和技術積累看,云天暢想并不認為自己只是一家游戲服務商。
張霖濤進一步解釋,“云天暢想從成立第一天起,本質上就是一個GPU原生和邊緣原生的分布式異構算力調度平臺,所有的軟件架構和網絡傳輸,都是為了最大化釋放GPU的能力而設計的”。國家企業信用信息公示系統顯示,當前公司實體深圳云天暢想信息科技有限公司成立于2020年8月,實際業務探索始于2016年。
云游戲和AI推理表面上,一個算圖形,一個算Token,但底層都需要GPU資源,都要求低延遲,都要處理高并發,都要在不同終端上保持穩定體驗。“從算圖形變成算AI(Token),對我們的底層架構來說,是一個自然而然、水到渠成的基因演進”,張霖濤告訴虎嗅。
這是云天暢想試圖重估自己的邏輯,它已經進入AI推理市場。張霖濤說,“當頭部客戶提出高性價比、低延遲的AI推理需求時,云天暢想能夠快速轉化商業落地,在邊緣端實現大規模的實時智算服務”。
但問題也在這里,云游戲能力能不能遷移到AI推理,不是靠一句“基因演進”就能證明的,更何況這背后還有商業的訴求。
真正的賬,是怎么榨干GPU每一秒
當前AI基礎設施賽道的投資泡沫已有所體現。一些獨立算力服務商為了爭奪大模型訓練的訂單,甚至盲目舉債采購昂貴的芯片,導致毛利率為負,又或者單純依賴持續燒錢來維持運轉,其商業模型的健康度受到質疑。
云天暢想這門生意能不能跑通,維持毛利率,核心在于同一批GPU能不能在更多時間里賺錢。
云天暢想給出的解法是“算力復用”。按照其設想,邊緣節點并不只服務單一場景。白天,服務器可以承接互聯網平臺的視頻處理、大模型推理、智能座艙交互、企業AI任務;到了中午、傍晚或深夜等閑暇時段,算力又可以被調度到云游戲、實時渲染等場景。
如果這些負載能夠錯峰互補,GPU利用率就會被抬高,單個硬件的投資回報周期也會縮短。但這仍然是一個需要驗證的商業假設。
更細的成本拆解目前云天暢想并未完全披露。這意味著,外界目前還很難判斷其成本優勢究竟來自哪里。對一家邊緣智算公司來說,低時延是前臺賣點,但后臺真正決定利潤率的,仍然是GPU利用率和單位算力成本。
云天暢想目前公開披露了覆蓋全球300多個城市的邊緣智算網絡,也強調與運營商、內容平臺、云服務商協同。但不同業務的負載是否真的能夠錯峰?邊緣節點的平均利潤率是否達標?這些如果不能持續兌現,“實時Token”就仍然只是一個好聽的概念。
云天暢想另一個能力是國產芯片適配。
訓練階段,英偉達憑借CUDA生態、單卡性能和開發者體系,優勢仍然明顯。但推理階段的邏輯有所不同。很多推理任務未必需要最頂級的單卡峰值算力,客戶更關心性價比、功耗、穩定性和綜合成本。
張霖濤認為,AI進入推理階段后,國產芯片迎來了新的市場空間。“因為推理是面向具體業務場景的。一些大廠或者政府項目客戶對底層的國產化率是有要求的。這時候,國產芯片如果能在某些特定場景下做好適配,把功耗降下來,性價比做上去,它就能很好地滿足需求。”
他說,云天暢想要做的,就是幫國產芯片做好底層異構調度和調優。徐公美也透露,云天暢想在底層已與約90%的國產芯片廠商建立合作。多廠商、多架構芯片的異構調度與調優,確實可能成為云天暢想在特定市場中的競爭壁壘。
但國產芯片適配不是萬能鑰匙,英偉達的優勢仍然明顯,對云天暢想來說,國產芯片適配是苦活累活。換句話說,這個過程中的成本不容忽視。
在E輪的投資節點上,云天暢想提出“實時智算織網”的戰略,押注在AI推理會在邊緣端需求更多。但問題是,實時Token是否真有足夠溢價,還要靠客戶付費驗證。很多客戶最終可能會在端側、本地私有云和中心云之間做成本權衡,而不是簡單選擇邊緣節點。
不僅如此,物理AI仍是遠期的商業藍圖,不是短期的現金流。機器人、自動駕駛和具身智能固然有更復雜的實時算力需求,但大規模商業化節奏并不明確。因此,融資背后是,在Token價格戰之下,低延遲是否能拉起價格。
只有客戶愿意持續付費買單,云天暢想才會抬高估值。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4871559.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.