![]()
文:李浩
編輯:經(jīng)緯
5 年后,百度數(shù)字人終于要來了自己在集團(tuán)內(nèi)的“名份”。
6 月 6 日晚間,百度移動(dòng)生態(tài)事業(yè)群組宣布新一輪組織架構(gòu)調(diào)整,數(shù)字人創(chuàng)新業(yè)務(wù)部升級(jí)為獨(dú)立部門,向集團(tuán)副總裁平曉黎匯報(bào)。而原商業(yè)部與電商事業(yè)部合并成立大商業(yè)事業(yè)部,繼續(xù)由平曉黎負(fù)責(zé)。
獲得獨(dú)立 BU 地位,這意味著數(shù)字人業(yè)務(wù)在百度集團(tuán)內(nèi)部地位的進(jìn)一步提升。
數(shù)字人的前景,也對(duì)得起百度的心血。
弗若斯特沙利文 5 月發(fā)布研究報(bào)告指出,自 2021 至 2025 年,國(guó)內(nèi) AI 數(shù)字人市場(chǎng)規(guī)模由 10.2 億元增至 54.4 億元,年復(fù)合增長(zhǎng)率達(dá) 52.0%。AI 數(shù)字人行業(yè)預(yù)計(jì) 2030 年將達(dá) 153.4 億元規(guī)模。
至少在戰(zhàn)略眼光上,你永遠(yuǎn)可以相信 Robin。
百度正站在AI商業(yè)化加速的十字路口。今年一季度,百度核心 AI 驅(qū)動(dòng)業(yè)務(wù)收入達(dá)到136 億元人民幣,首次占到百度一般性業(yè)務(wù)收入的52%,超越傳統(tǒng)業(yè)務(wù)成為主力。
在這樣的背景下,百度數(shù)字人正式獨(dú)立,固然有內(nèi)部效率優(yōu)化的考量,但這也是百度全面轉(zhuǎn)向 AI 戰(zhàn)略的重要體現(xiàn)。
隨著昆侖芯、百度智能云等板塊均保持強(qiáng)勁勢(shì)頭,市場(chǎng)也終將發(fā)現(xiàn):
百度在造一家新的百度。
數(shù)字人,正式“上桌吃飯”
數(shù)字人能“上桌吃飯”,并不是李彥宏的一時(shí)興起,數(shù)字人在百度戰(zhàn)略版圖中的“射程”越來越長(zhǎng)。
在 5 月 13 日 Create 2026 百度 AI 開發(fā)者大會(huì)開幕式上,李彥宏正式宣布將百度慧播星升級(jí)為“百度一鏡”。升級(jí)前,原業(yè)務(wù)較為聚焦電商直播,數(shù)字人僅作為代替人工主播的工具。但在升級(jí)后,數(shù)字人在定位上發(fā)生了根本性的變化。
對(duì)于數(shù)字人的未來,李彥宏在 Create 2026 上表示:“數(shù)字人就是看得見的智能體”。
從業(yè)務(wù)基因上看,數(shù)字人最貼合的行業(yè)就是電商直播。但隨著技術(shù)水平的進(jìn)步,數(shù)字人的應(yīng)用范圍也跨越至品牌營(yíng)銷、內(nèi)容創(chuàng)作、政務(wù)媒體等方面。
![]()
![]()
![]()
![]()
(數(shù)字人在金融、醫(yī)藥、教育,政務(wù)領(lǐng)域的應(yīng)用,圖源:百度 數(shù)字員工產(chǎn)品開發(fā)文檔 )
也因此新的“百度一鏡”,從單一直播場(chǎng)景升級(jí)為全場(chǎng)景、多智能體數(shù)字人平臺(tái),覆蓋數(shù)字人直播、數(shù)字人視頻、實(shí)時(shí)互動(dòng)數(shù)字人三大形態(tài)。
在未來,依托底層模型的 Agent 能力,數(shù)字人甚至可以成為通用交互界面。Siri 有了身體,科塔娜走出了《光環(huán)》,智子關(guān)進(jìn)了屏幕,又一個(gè)只存在科幻作品中的場(chǎng)景即將實(shí)現(xiàn)。
當(dāng)然,事要一步步做。至少目前,對(duì)于百度來說這次的架構(gòu)調(diào)整無疑賦予了數(shù)字人業(yè)務(wù)更高自主權(quán)和資源優(yōu)先級(jí)。
但即使此前不是“滿血版”的數(shù)字人,也已然向百度證明了自己的價(jià)值。
2025 年 6 月,以羅永浩數(shù)字人為代表高說服力數(shù)字人首秀,一開播便創(chuàng)下 GMV 紀(jì)錄。7 月,新一代 NOVA 技術(shù)發(fā)布并計(jì)劃 10 月向全行業(yè)開放。簡(jiǎn)單來說該技術(shù)大幅增強(qiáng)了數(shù)字人的“復(fù)制”能力,數(shù)字人可以無壓力實(shí)現(xiàn)語言、表情與動(dòng)作的多模態(tài)同步。
11 月 13 日?,羅永浩數(shù)字人在百度世界 2025 上效果亮眼,征服了眾多現(xiàn)場(chǎng)來賓。同時(shí),百度官宣慧播星數(shù)字人技術(shù)向全球開放,明確進(jìn)入規(guī)模化商業(yè)應(yīng)用階段。
獨(dú)立部門意味著獨(dú)立預(yù)算,尤其是明星部門。新成立的數(shù)字人部門完全可以擺脫此前電商部門在預(yù)算上可能存在的束縛,以研究而非提供直播工具的功利姿態(tài)加大對(duì)高擬真,多智能體,實(shí)時(shí)互動(dòng)技術(shù)研發(fā)。
高擬真實(shí)時(shí)交互上,當(dāng)前百度數(shù)字人響應(yīng)時(shí)間已小于 2 秒,如果下一步 能 對(duì)復(fù)雜情緒理解、長(zhǎng)時(shí)記憶一致性、多智能體協(xié)同效率、跨場(chǎng)景泛化能力上有所突破,數(shù)字人完全可以成為百度未來的明星產(chǎn)品。
數(shù)字人,已經(jīng)成為百度手上的“明牌”,將和智能云、蘿卜快跑、昆侖芯外的又一大占位性戰(zhàn)略布局。
百度,希望被怎么記住
所謂占位性布局,可以理解為是企業(yè)在 AI 的哪些方面埋伏了“奇兵”。
有千文、豆包這種流量怪獸、DeepSeek、Kimi 這樣的新興勢(shì)力、ChatGPT、Claude 這樣的外國(guó)大能,通用聊天大模型的競(jìng)爭(zhēng)已經(jīng)進(jìn)入紅海。
孫子兵法有云:“凡戰(zhàn)者,以正合,以奇勝”。
李彥宏早在 2024 年就提出卷模型不如卷應(yīng)用,百度的布局也的確知行合一。業(yè)內(nèi)很少有廠商直接或半直接同時(shí)在 L4 級(jí)別無人駕駛、芯片制造、AI 眼鏡、數(shù)字人等方面發(fā)力。百度幾乎AI 應(yīng)用的全光譜布局。甚至在具身智能上,4 月 21 日百度聯(lián)合多家業(yè)內(nèi)重量級(jí)企業(yè)推出具身智能數(shù)據(jù)超市。
需要注意的是,這并不意味著百度在基礎(chǔ)模型層面的有所放松。
![]()
(圖源:LLM Arena)
根據(jù) LLM Arena 數(shù)據(jù)顯示,百度文心 5.1 文字能力上排名第 24,雖低于智譜 5.1 、千文 3.7 Max,但模型得分差距不大。文心的整體實(shí)力依然處在國(guó)產(chǎn)大模型靠前位置。
相比一家 AI 公司,百度更希望被記住的是“一家讓 AI 干活的公司”。
李彥宏在百度Create 2026上提出日活智能體數(shù),作為 AI 時(shí)代新的度量衡,強(qiáng)調(diào)要關(guān)注有多少智能體在真正給人類干活,并交付結(jié)果。數(shù)字人正逐漸成為百度這一主線的又一詮釋。
艾媒咨詢《2025 年中國(guó)數(shù)字人產(chǎn)業(yè)發(fā)展報(bào)告》數(shù)據(jù)顯示,2025 年中國(guó)數(shù)字人核心市場(chǎng)規(guī)模達(dá) 480.6 億元,2026 年預(yù)計(jì)增長(zhǎng)至 572.9 億元。
![]()
(圖源:弗若斯特沙利文,《中國(guó) AI 數(shù)字人產(chǎn)業(yè)發(fā)展報(bào)告(2025 年)》)
弗若斯特沙利文 5 月發(fā)布的《中國(guó) AI 數(shù)字人產(chǎn)業(yè)發(fā)展報(bào)告(2025 年)》報(bào)告顯示,AI 數(shù)字人正從內(nèi)容生產(chǎn)工具演進(jìn)為智能化業(yè)務(wù)入口,百度一鏡市場(chǎng)份額為 8.1%,位列行業(yè)第一,且行業(yè)的頭部效應(yīng)正在顯現(xiàn)。
市場(chǎng)份額越發(fā)集中,意味著行業(yè)進(jìn)入淘汰賽時(shí),頭部企業(yè)反而會(huì)享受業(yè)務(wù)優(yōu)勢(shì)帶來的馬太效應(yīng)。
這對(duì)百度來說是個(gè)好消息。正如蘿卜快跑讓百度在 L4 級(jí)別無人駕駛上有了自己的陣地,昆侖芯讓百度擁有了芯片制造方面的底層能力,百度也要在數(shù)字人上鎖定決賽席位。
平曉黎曾透露,2025 年百度數(shù)字人為百度創(chuàng)收“幾十億元”。
根據(jù)百度 2025 年財(cái)報(bào)顯示,去年全年總營(yíng)收為 1291 億元;其中 AI 相關(guān)業(yè)務(wù)收入為 400 億元。若“幾十億元”取下限 20 億元,數(shù)字人創(chuàng)造了百度去年 AI 營(yíng)收的 5%;若取上限 99 億元計(jì)算,數(shù)字人掙出了百度 AI 四分之一的收入。
但即使是 5%,也依然能證明數(shù)字人的前景。
原因很簡(jiǎn)單,百度在數(shù)字人方面大舉發(fā)力、推向市場(chǎng),已經(jīng)是去年下半年的事了。
2025 年雙十一在 10 月 15 日開啟,11 月 11 日結(jié)束。10 月份開放的高說服力數(shù)字人想要在雙十一期間用上,這段時(shí)間對(duì)于 To B 生意來說還是太短了。
所以說,如果假以時(shí)日,百度的數(shù)字人或許能交出更漂亮的成績(jī)。
前景與道路
老話常說:前景是光明的,道路是曲折的。
基本可以確定的是,百度絕不會(huì)在數(shù)字人行業(yè)競(jìng)爭(zhēng)中贏得輕松。
國(guó)內(nèi)諸多大廠都在積極布局?jǐn)?shù)字人技術(shù)。字節(jié)的 OmniHuman 系列于去年 2 月推出,去年 8 月升級(jí)至主力版本 OmniHuman-1.5。阿里基于千問大模型的數(shù)字人 Live Avatar 在去年 6 月完成了分鐘級(jí)視頻產(chǎn)出,去年 12 月實(shí)現(xiàn)了140 億參數(shù)大模型+實(shí)時(shí) 20FPS 生成+10000 秒無漂移無限時(shí)長(zhǎng)生成,并在今年年初向社區(qū)開源。
商湯數(shù)字人如影 SenseAvatar 開發(fā)時(shí)間并不比百度晚,目前已經(jīng)完成多輪功能迭代,并在多行業(yè)落地。此外,如騰訊等其他企業(yè),也在數(shù)字人上動(dòng)作頻頻。
但整體來看,在數(shù)字人領(lǐng)域,目前含金量最高的企業(yè)依然是百度。
以字節(jié)數(shù)字人為例,OmniHuman 基于 Diffusion Transformer(DiT)架構(gòu),采用 Omni-Conditions Training 混合多模態(tài)訓(xùn)練策略。DiT 路線本質(zhì)上是生成側(cè)的底層架構(gòu)創(chuàng)新,是將 Transformer 結(jié)構(gòu)引入擴(kuò)散模型的骨干網(wǎng)絡(luò),在處理復(fù)雜時(shí)空序列、運(yùn)動(dòng)一致性和細(xì)節(jié)表現(xiàn)力上具有顯著優(yōu)勢(shì),特別適合高品質(zhì)視頻生成。
在實(shí)際操作上,字節(jié)的數(shù)字人通過模型看海量的抖音小視頻,來學(xué)習(xí)動(dòng)作生成。阿里和業(yè)內(nèi)多家其他企業(yè),使用的正是與此相似的技術(shù)路線。
這與百度當(dāng)下的技術(shù)路線完全不同。百度采取的是真人動(dòng)作捕捉與數(shù)據(jù)遷移、大模型直接生成或預(yù)測(cè)動(dòng)作和表情、再進(jìn)行實(shí)時(shí)姿態(tài)和情緒控制。
簡(jiǎn)單來說,字節(jié)、阿里和其他技術(shù)相似企業(yè)的數(shù)字人是用視頻喂出來的超級(jí)畫師,百度的則是用大模型和Agent系統(tǒng)培養(yǎng)的智能演員。
在“用戶友好度”層面,百度則更有優(yōu)勢(shì)。
百度的數(shù)字人并不止于數(shù)字人,配套的劇本生成 Agent、視頻生成 Agent、剪輯 Agent 等實(shí)用工具和百度最擅長(zhǎng)的多 Agent 之間的協(xié)同,讓用戶可以僅用一句話就生成帶貨視頻。
筆者在 Create 2026 上曾親身體驗(yàn)過百度的數(shù)字人。生成的英語帶貨視頻人物擬真度不輸業(yè)內(nèi)同類產(chǎn)品,語音語氣語法上流暢無語病。數(shù)字人主播方面,除了仍能感到些許頓挫感、過于“有求必應(yīng)”,以及在“活人微死”的當(dāng)下,主播情緒略顯高昂外完全可以勝任絕大多數(shù)直播場(chǎng)景。
當(dāng)然,與百度諸多這個(gè)時(shí)代面臨的問題一樣,數(shù)字人上百度并未形成閉環(huán)。
![]()
(圖源:QuestMobile)
雖然月活超 7 億,百度 App 上流量的“忠誠(chéng)度”需要打一個(gè)問號(hào)。只要電商還是三巨頭、短視頻平臺(tái)格局未變,百度 App 上的流量能變出來多少現(xiàn),這個(gè)在整個(gè)移動(dòng)互聯(lián)網(wǎng)時(shí)代都沒有解決的問題,在短時(shí)間內(nèi)似乎并沒有好的解決辦法。
正因此,需要外部流量,成為了百度數(shù)字人業(yè)務(wù)水桶上最短的那塊板。
字節(jié)有抖音以及從抖音擴(kuò)展出的其他生態(tài),雄厚的財(cái)力加上火山引擎的技術(shù)積累,競(jìng)爭(zhēng)潛力絕不可小覷。阿里有著電商天然的使用場(chǎng)景,千問的技術(shù)能力更是在國(guó)內(nèi)大模型上處在拔尖地位,同時(shí)開源路線和海外大模型社區(qū)的持續(xù)運(yùn)營(yíng),也讓阿里埋下了出海的引子。
不僅“大而泛”的流量要依靠外界,“小而美”的固定需求也需要百度自己拓展。
相比之下,騰訊有游戲/游戲制作者社區(qū)的需求;商湯有此前的政企積累。2026 年 4 月,如影獲得首個(gè)國(guó)標(biāo)合規(guī)認(rèn)證,商湯希望借此進(jìn)一步拓展國(guó)企、政府方面的合作。
這對(duì)百度來說并不是好消息。
2026 年一季度百度核心 AI 新業(yè)務(wù)收入,占百度一般性業(yè)務(wù)收入的比例首次過半。但是,凡涉及百分比,必須看正反兩面——慶祝 AI 高歌猛進(jìn)的同時(shí),傳統(tǒng)在線營(yíng)銷業(yè)務(wù)也在完成著最后的歷史使命,給予著集團(tuán)最后的轉(zhuǎn)型支持。
雖然 All in AI 在 2016 年就成為既定路線,但梭哈的反面是沒有退路。
![]()
(海外股票分析師對(duì)百度股票的觀點(diǎn),圖源:華爾街日?qǐng)?bào))
然而沒有退路并不意味著不能“開分礦”。平曉黎此前曾透露,2026 年百度數(shù)字人出海將重點(diǎn)深耕東南亞、拉美、北美、歐洲四大區(qū)域。
有錢老外消費(fèi)能力夠強(qiáng),沒錢的地方雇主播帶貨、拍視頻性價(jià)比不一定高,加上市場(chǎng)尚屬藍(lán)海,天然的適配數(shù)字人的落地。
此前百度一鏡就推出過海外版,支持 12 種主流語言、母語級(jí)口型匹配、本土化 Agent 智能創(chuàng)作,覆蓋 TikTok、Shopee、Lazada、阿里國(guó)際站等全球主流平臺(tái)。
但問題又來了,拼多多可以不計(jì)成本的補(bǔ)貼,可以為了拉人頭可以消費(fèi)返利加直接給錢,可以一擲千金超級(jí)碗上做廣告。Temu 爆火是要拜拼多多百億甚至千億營(yíng)銷費(fèi)用所賜的。
反觀百度,優(yōu)先將資源投入何處、哪些業(yè)態(tài)更能利用有限資源盤活、誰能形成不斷自我強(qiáng)化的“業(yè)務(wù)飛輪”,是百度管理層這個(gè)階段需要考慮的問題。
所以,數(shù)字人業(yè)務(wù)的獨(dú)立,也向市場(chǎng)傳達(dá)了百度高層的想法。
成年不代表使命的終結(jié),反而是責(zé)任的開始。
新的數(shù)字人業(yè)務(wù)也是,新的百度也是。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.