聲網這份財報,有點像一家公司重新找座位。
![]()
過去大家看聲網,關鍵詞很簡單:實時音視頻、RTC、低延遲、通信PaaS。說白了,它是做“連線”的公司。直播、社交、在線教育、語音房、視頻通話,只要你需要穩定、低延遲的實時互動,聲網就在后面做底座。
但到了2026年一季度,聲網給市場講了一個新故事:它不只是RTC公司了,它要切進語音Agent基礎設施
這個變化不是一句口號。
一季度,聲網收入3770萬美元,同比增長13.5%;活躍客戶3946個,同比增長3.8%;DBNER回到99%;GAAP凈利潤110萬美元,連續第六個季度實現GAAP盈利。更重要的是,公司二季度收入指引達到3900萬至4000萬美元,對應同比增長13.7%到16.6%,增速還在往上走。
表面看,這是一份小而穩的財報。
但財報里真正有價值的地方,是聲網把自己定位成了“Conversational AI和實時互動技術平臺”,還重點推了Agent Studio。這個產品可以讓企業用無代碼方式創建、部署和規模化語音AI Agent,內置客服、外呼營銷等模板。
換句話說,聲網想做的不是一個會聊天的機器人。
它想做的是:讓AI開口說話,并且說得穩、說得快、說得像一個真正能干活的系統。
這事聽起來沒有大模型參數那么性感,但更接近商業落地。
語音Agent不是玩具,它需要一套“不會掉線”的底層系統
很多人一聽語音Agent,第一反應是:這不就是AI客服嗎?
不完全是。
普通聊天機器人可以慢一點。你問一句,它想兩秒,問題不大。
語音Agent不行。
你打電話給客服,對面AI卡住三秒,你會立刻覺得它像壞了。它聽不清、插不上話、打斷不自然、延遲太高,體驗都會崩。
所以語音Agent真正難的不是“會不會說話”,而是能不能在真實對話里跑起來。
它要處理語音識別、降噪、語義理解、大模型推理、語音合成、多語言、打斷、情緒、業務流程,還要保證網絡穩定。你在客服中心、汽車銷售、在線教育、金融催收、IoT陪伴設備里用,要求還都不一樣。
這就是聲網的機會。
聲網原來的核心能力,是實時音視頻和低延遲網絡。以前它幫人和人連起來,現在它想幫人和AI連起來。
這個遷移很自然。
從視頻會議到語音Agent,底層都是實時互動。區別在于,過去對面是人,現在對面是AI。過去拼的是通話質量,現在拼的是“通話質量+AI理解+行業流程”。
聲網的Agent Studio,就是要把這些東西打包起來。企業不需要自己從零接ASR、大模型、TTS、降噪、實時網絡和對話流程,而是在一個平臺里搭出自己的語音Agent。
所以我覺得,聲網的AI業務不能簡單理解成一個工具。
它更像一個平臺型產品。
不是“給企業加一個AI按鈕”,而是把實時互動、大模型調用和語音工作流揉在一起,變成一套可以部署的系統。
這也是它和OpenAI、Anthropic這些公司的差別。聲網不做最強大腦,它做“讓大腦開口說話的通道”。
這個位置不在聚光燈最中間,但很實用。
尤其到了Agent時代,AI不能只在文本框里回答問題。它要打電話、接電話、陪練、推銷、提醒、復盤、處理任務。AI從屏幕走向聲音,聲網就有了重新被看見的理由。
AI帶來了新增長,也先把毛利率壓了一下
不過,這份財報不能只寫興奮點。
聲網的AI故事,已經進入了成本端。
一季度,公司收入成本同比增長29.9%,原因包括帶寬、服務器成本上升,以及Conversational AI產品相關成本增加。毛利率從去年同期的68.0%降到63.4%。
這個變化很關鍵。
很多公司講AI,都喜歡說“AI帶來效率提升”。但聲網這份財報告訴我們,AI也會先帶來成本。
尤其是語音Agent這種產品。客戶前期要測試、試點、接入、調流程,很多項目還在POC階段,收入貢獻不大,但服務器、帶寬、工程投入已經開始發生。
這就有點像開一家新店。
門店裝修、設備、試營業、人員培訓都要先花錢,至于客流什么時候穩定,還得等一段時間。
聲網現在就是這個狀態。
管理層也講得比較直接:Conversational AI目前還處在sub-scale階段,很多POC客戶和實驗性項目會產生成本,但收入還不夠多。公司預計到夏季前后,AI相關業務能達到約5%的收入貢獻。長期看,如果客戶從測試轉向部署,毛利率有機會轉正,并接近甚至高于原來的RTE業務。
這個說法很重要。
因為它把聲網的AI戰略拆成了兩個階段:
第一階段,AI壓毛利。
第二階段,AI拉客單價。
現在聲網還在第一階段和第二階段之間。
如果AI業務只是試點很多、收入很少、成本不斷上升,那市場會很快失去耐心。小公司最怕這個:故事不錯,但利潤表先被打穿。
但如果接下來POC客戶開始轉化為正式部署,尤其是在呼叫中心、外呼營銷、IoT陪伴設備這些場景里跑出穩定收入,聲網的估值框架就會變。
它不再只是一個低成長RTC公司,而是語音Agent時代的底層連接層。
這就是這份財報最值得盯的地方。
不是收入增長13.5%本身,也不是GAAP盈利本身,而是AI到底能不能從成本項,變成收入項。
說得更直白一點:
聲網現在的問題不是有沒有AI,而是AI什么時候開始賺錢。
聲網能不能被重新估值,關鍵看它是不是“語音Agent的底層網絡”
資本市場怎么重新看聲網?
如果還按傳統RTC看,它的估值空間不大。
RTC是成熟市場。客戶增長不會無限快,價格也有競爭壓力。直播、社交娛樂、在線互動這些場景,已經不像前幾年那么容易講高增長故事。
但如果按語音Agent基礎設施看,聲網就有新的想象空間。
因為語音Agent不是一個單一應用,而是一類新交互方式。
客服要用。
銷售要用。
教育陪練要用。
車載助手要用。
IoT陪伴設備也要用。
以后我們和AI交互,不可能永遠只打字。尤其在車里、家里、門店、客服中心,語音會是最自然的入口。
這里有一個很現實的體驗判斷:
如果一個AI能寫得很好,但說話卡頓、聽不清、反應慢,它在真實世界里就很難用。
所以語音Agent的底層能力,不只是“有沒有模型”,還包括實時網絡、音頻處理、低延遲交互、多語言、業務流程編排。
這正是聲網擅長的部分。
當然,聲網也不是沒有對手。
美國有Twilio這樣的通信平臺,有LiveKit這類實時音視頻基礎設施公司,還有一堆語音Agent創業公司。大模型公司自己也在往語音交互走。這個賽道不會便宜。
聲網的差異點在于,它不是從模型出發,也不是從單一應用出發,而是從實時互動基礎設施出發。它更像中間層:上接大模型,下接企業和用戶。
這個位置好不好?
好處是,不需要和OpenAI拼模型。
壞處是,必須證明企業真的愿意為這層能力付費。
所以未來兩個季度,投資者真正該看的,不是聲網又發布了多少AI功能,而是幾個硬指標。
第一,Conversational AI收入占比能不能接近管理層說的5%。
第二,POC客戶能不能轉成正式付費部署。
第三,毛利率能不能止跌。
第四,DBNER能不能從99%繼續回升。
第五,AI客戶有沒有更清晰的行業案例,比如客服中心、車載、IoT、教育陪練。
第六,收入指引能不能持續上修,而不是只靠一兩個季度恢復。
如果這些指標兌現,聲網有機會從“RTC恢復股”切到“語音Agent基礎設施股”。
這個估值切換很重要。
前者看的是通話量和客戶數量。
后者看的是AI Agent使用量、行業滲透、部署轉化率和單位經濟模型。
差別不小。
結語:聲網不是AI利潤故事,但已經不是普通RTC故事了
聲網這份財報,我覺得最有意思的地方,是它沒有把AI講得特別宏大。
它沒有說自己要做通用大模型,也沒有說自己要顛覆所有行業。
它講的是一件更具體的事:讓企業更容易部署語音AI Agent。
這個方向不華麗,但商業味很濃。
AI客服、AI銷售、AI陪練、AI車載助手、AI玩具,這些場景都不一定需要最強模型,但都需要穩定、低延遲、能說會聽的交互能力。
聲網正好在這里有老本行。
所以,我對聲網的判斷是:
它的AI戰略已經進入財務兌現早期,但還沒有完成估值重構。
不是純故事。因為AI已經進了產品、客戶需求、成本結構和收入預期。
也不是成熟利潤故事。因為AI收入占比還低,毛利率還在承壓,POC轉化還需要驗證。
它現在更像一個左側資產。
左側的意思是:邏輯已經開始變,但財報還沒完全證明。
如果接下來語音Agent收入開始放量,毛利率止跌,客戶從試點走向規模化部署,聲網就有機會重新被市場定價。它不再只是那個做RTC的公司,而是AI和真實用戶之間的實時連接層。
但如果AI業務遲遲不能轉化,成本繼續上來,毛利率繼續下去,那市場也會很快翻臉。
AI時代不缺故事。
缺的是能把故事跑進收入表、毛利率和現金流的公司。
聲網現在站在門口。
一只腳已經邁進語音Agent,另一只腳還踩在RTC時代。
接下來兩個季度,才是真正的驗證期。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.