亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

視頻生成技術(shù):多視角展現(xiàn)真實(shí)身份與光照的新突破

0
分享至



第一作者徐源誠(chéng)是 Netflix Eyeline 的研究科學(xué)家,專注于基礎(chǔ) AI 模型的研究與開發(fā),涵蓋多模態(tài)理解、推理、交互與生成,重點(diǎn)方向包括可控視頻生成及其在影視制作中的應(yīng)用。他于 2025 年獲得美國(guó)馬里蘭大學(xué)帕克分校博士學(xué)位。

最后作者于寧是 Netflix Eyeline 資深研究科學(xué)家,帶領(lǐng)視頻生成 AI 在影視制作中的研發(fā)。他曾就職于 Salesforce、NVIDIA 及 Adobe,獲馬里蘭大學(xué)與馬普所聯(lián)合博士學(xué)位。他多次入圍高通獎(jiǎng)學(xué)金、CSAW 歐洲最佳論文,并獲亞馬遜 Twitch 獎(jiǎng)學(xué)金、微軟小學(xué)者獎(jiǎng)學(xué)金,以及 SPIE 最佳學(xué)生論文。他擔(dān)任 CVPR、ICCV、ECCV、NeurIPS、ICML、ICLR 等頂會(huì)的領(lǐng)域主席,以及 TMLR 的執(zhí)行編輯。

在電影與虛擬制作中,「看清一個(gè)人」從來不是看清某一幀。導(dǎo)演通過鏡頭運(yùn)動(dòng)與光線變化,讓觀眾在不同視角、不同光照條件下逐步建立對(duì)一個(gè)角色的完整認(rèn)知。然而,在當(dāng)前大量 customizing video generation model 的研究中,這個(gè)最基本的事實(shí),卻往往被忽視。



  • 論文地址: https://arxiv.org/pdf/2510.14179
  • 項(xiàng)目主頁: https://eyeline-labs.github.io/Virtually-Being/

被忽視的核心問題:Multi-view Identity Preservation



多視角身份一致、鏡頭環(huán)繞與多人物示例

近年來,視頻生成領(lǐng)域中關(guān)于人物定制(customization)的研究迅速發(fā)展。絕大多數(shù)方法遵循一種相似范式:給定一張或少量人物圖像 → 生成包含該人物的視頻。這種范式隱含了一個(gè)關(guān)鍵假設(shè):只要人物在某個(gè)視角下看起來像,就等價(jià)于「身份被保留」。但在真實(shí)的視頻與電影語境中,這個(gè)假設(shè)并不成立。

為什么單視角身份是不夠的?

  • 身份是強(qiáng)烈依賴視角的(view-dependent)

面部輪廓、五官比例、體態(tài)與衣物形態(tài),都會(huì)隨觀察角度發(fā)生系統(tǒng)性變化。

  • 相機(jī)運(yùn)動(dòng)會(huì)持續(xù)暴露未見過的外觀區(qū)域

單張或少量圖像無法覆蓋側(cè)臉、背面以及連續(xù)視角變化過程中的外觀一致性。

  • 多人場(chǎng)景會(huì)放大任何身份錯(cuò)誤

當(dāng)多個(gè)角色同框時(shí),哪怕輕微的身份漂移都會(huì)變得非常明顯。

因此,在具有真實(shí) 3D 相機(jī)運(yùn)動(dòng)的視頻中,「identity preservation」本質(zhì)上是一個(gè) multi-view consistency 問題,而不是單幀相似度問題。

然而,令人遺憾的是,顯式關(guān)注 multi-view identity preservation,在當(dāng)前的視頻定制化生成研究中仍然幾乎沒有被系統(tǒng)性地解決。

核心立場(chǎng):學(xué)習(xí)一個(gè)人的身份,必須學(xué)習(xí)他在多視角與多光照下的樣子


Virtually Being 的核心論點(diǎn)非常明確:如果希望模型真正「學(xué)會(huì)一個(gè)人的身份」,那么它必須看到這個(gè)人在不同視角(multi-view)和不同光照(various lighting)下的穩(wěn)定外觀。

換句話說,看清一個(gè)人,不是看清一張臉,而是理解這個(gè)人在空間中如何被觀察,在光線變化下如何呈現(xiàn)。身份不是一個(gè)靜態(tài)的 2D 屬性,而是一個(gè) 4D(空間 + 時(shí)間)一致的概念,這正是 Virtually Being 所要系統(tǒng)性解決的問題。

方法概覽:用 4D 重建構(gòu)建真正的多視角身份監(jiān)督


為了解決 multi-view identity 被長(zhǎng)期忽視的問題,我們從數(shù)據(jù)層面重新設(shè)計(jì)了人物定制流程。

多視角表演采集,而非單視角參考

  • 使用專業(yè)體積捕捉系統(tǒng)采集真實(shí)人物表演:75 相機(jī)面部捕捉陣列、160 相機(jī)全身捕捉陣列;
  • 捕捉人物在受控條件下的動(dòng)態(tài)表演,為高質(zhì)量重建提供輸入。

4D Gaussian Splatting 作為數(shù)據(jù)生成器

  • 對(duì)捕捉到的表演進(jìn)行 4D Gaussian Splatting (4DGS) 重建;
  • 在重建結(jié)果上渲染大量視頻:覆蓋連續(xù)變化的相機(jī)軌跡、具備精確的 3D 相機(jī)參數(shù)標(biāo)注、保證同一人物在不同視角下的身份一致性。

通過這一過程,視頻生成模型在訓(xùn)練階段不再依賴零散的圖像線索,而是反復(fù)觀察同一個(gè)人在多視角、連續(xù)鏡頭運(yùn)動(dòng)下應(yīng)當(dāng)如何保持外觀一致。

兩階段訓(xùn)練:先理解鏡頭,再理解「這個(gè)人」


為了在身份定制的同時(shí)保持穩(wěn)定的鏡頭控制能力,我們采用了一個(gè)清晰解耦的兩階段訓(xùn)練策略。

階段一:相機(jī)感知預(yù)訓(xùn)練(Camera-aware Pretraining)

基于 ControlNet 架構(gòu),引入完整 3D 相機(jī)參數(shù)(Plücker 表示),在大規(guī)模公開視頻數(shù)據(jù)上訓(xùn)練模型,使其學(xué)會(huì)相機(jī)運(yùn)動(dòng)如何影響視角變化與時(shí)間結(jié)構(gòu)。這一階段的目標(biāo),是讓模型牢固掌握電影級(jí)的鏡頭語言。

階段二:多視角身份定制(Multi-view Customization)

在預(yù)訓(xùn)練模型基礎(chǔ)上進(jìn)行微調(diào),使用 4DGS 渲染的多視角視頻作為定制數(shù)據(jù),為每個(gè)身份引入專屬 token,將身份與多視角外觀顯式綁定,最終模型在推理時(shí)能夠精確遵循輸入的 3D 相機(jī)軌跡,在未見過的視角下仍然穩(wěn)定呈現(xiàn)同一個(gè)人。



光照真實(shí)感:身份感知不可分割的一部分


除了視角,光照同樣是「看清一個(gè)人」的關(guān)鍵維度。

在真實(shí)電影中,人物身份并不是在單一光照條件下被認(rèn)知的,而是在不同室內(nèi)外環(huán)境,側(cè)光、逆光、柔光等變化,不同光比與色溫條件下逐步被觀眾確認(rèn)。

在 Virtually Being 中,我們通過引入基于 HDR 的視頻重打光數(shù)據(jù),顯著增強(qiáng)了生成視頻中的光照真實(shí)感。在 4DGS 渲染基礎(chǔ)上,對(duì)同一人物生成多種自然光照條件,覆蓋真實(shí)拍攝中常見的照明變化范圍,使模型學(xué)會(huì)在光照變化下,人物身份仍應(yīng)保持穩(wěn)定。

實(shí)驗(yàn)結(jié)果顯示,引入重光照數(shù)據(jù)后,生成視頻在用戶研究中 83.9% 被認(rèn)為光照更自然、更符合真實(shí)拍攝效果,缺乏該數(shù)據(jù)時(shí),人物往往呈現(xiàn)平坦、缺乏層次的合成感。

多人物生成:multi-view identity 才能支撐真實(shí)互動(dòng)


在多人物視頻生成中,multi-view identity preservation 的重要性進(jìn)一步被放大。

只有當(dāng)模型對(duì)每個(gè)角色在不同視角與光照條件下的身份都有穩(wěn)定建模時(shí),人物才能自然同框,空間關(guān)系才能保持一致,互動(dòng)才不會(huì)顯得拼接或混亂。

Virtually Being 支持兩種多人物生成方式:

  • 聯(lián)合訓(xùn)練(Joint Training):通過少量同框數(shù)據(jù)增強(qiáng)互動(dòng)真實(shí)性;
  • 推理階段組合(Noise Blending):在無需重新訓(xùn)練的情況下靈活組合多個(gè)身份。




實(shí)驗(yàn)結(jié)論:multi-view + relighting 是身份一致性的關(guān)鍵因素


系統(tǒng)性實(shí)驗(yàn)表明,使用 multi-view 數(shù)據(jù)訓(xùn)練的模型,在 AdaFace 等身份指標(biāo)上顯著優(yōu)于僅使用 frontal-view 數(shù)據(jù)的模型以及其他 video customization 的方法。缺失 multi-view 或 relighting 數(shù)據(jù),都會(huì)導(dǎo)致身份一致性與真實(shí)感明顯下降。用戶研究結(jié)果同樣明確偏好具備 multi-view 身份穩(wěn)定性的生成結(jié)果。





總結(jié):重新定義視頻生成中的「身份」


Virtually Being 并不僅僅提出了一個(gè)新框架,而是明確提出并驗(yàn)證了一個(gè)長(zhǎng)期被忽視的觀點(diǎn):在視頻生成中,身份不是一張圖像,而是一個(gè)人在多視角與多光照條件下保持穩(wěn)定的 4D 表現(xiàn)。通過系統(tǒng)性地引入 multi-view 表演數(shù)據(jù)與真實(shí)光照變化,我們?yōu)?customizing video generation model 提供了一條更貼近電影制作實(shí)際需求的解決路徑。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
梁家輝5封金像獎(jiǎng)最佳男主角,臺(tái)上流淚感謝妻子,臺(tái)下嘴硬“那是演的”

梁家輝5封金像獎(jiǎng)最佳男主角,臺(tái)上流淚感謝妻子,臺(tái)下嘴硬“那是演的”

紅星新聞
2026-04-20 13:16:57
首場(chǎng)下克上!魔術(shù)滅活塞總分1-0 坎寧安39+5+4班凱羅23+9

首場(chǎng)下克上!魔術(shù)滅活塞總分1-0 坎寧安39+5+4班凱羅23+9

醉臥浮生
2026-04-20 09:08:16
這張照片絕對(duì)是李宇春最想刪掉的照片!

這張照片絕對(duì)是李宇春最想刪掉的照片!

可樂談情感
2026-04-20 03:34:03
寧波男子收到陌生賬號(hào)轉(zhuǎn)賬8萬余元,三天后奢侈品牌商家找來:?jiǎn)T工誤將其收款碼給客戶

寧波男子收到陌生賬號(hào)轉(zhuǎn)賬8萬余元,三天后奢侈品牌商家找來:?jiǎn)T工誤將其收款碼給客戶

齊魯壹點(diǎn)
2026-04-20 07:19:18
國(guó)際油價(jià)飆漲7%,黃金白銀、美股期指全線下挫,加密貨幣16萬人爆倉,美軍向伊朗商船開火

國(guó)際油價(jià)飆漲7%,黃金白銀、美股期指全線下挫,加密貨幣16萬人爆倉,美軍向伊朗商船開火

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-04-20 06:46:08
小學(xué)生拒絕“借”車 遭9人圍毆、死亡威脅、搜家 警方:8人未滿14歲不處罰

小學(xué)生拒絕“借”車 遭9人圍毆、死亡威脅、搜家 警方:8人未滿14歲不處罰

閃電新聞
2026-04-20 09:33:05
蔡磊老婆悲痛發(fā)文:我是個(gè)混蛋,明知沒機(jī)會(huì)!偏要賭他會(huì)等我回來

蔡磊老婆悲痛發(fā)文:我是個(gè)混蛋,明知沒機(jī)會(huì)!偏要賭他會(huì)等我回來

娛樂團(tuán)長(zhǎng)
2026-04-19 20:24:59
日本軍艦闖入臺(tái)灣海峽后,日媒發(fā)現(xiàn)不妙,中國(guó)在東海劃5處警戒區(qū)

日本軍艦闖入臺(tái)灣海峽后,日媒發(fā)現(xiàn)不妙,中國(guó)在東海劃5處警戒區(qū)

章荳解說體育
2026-04-18 14:35:49
老板娘問我她屁股翹不翹?我該怎么回答?

老板娘問我她屁股翹不翹?我該怎么回答?

太急張三瘋
2026-04-20 10:26:26
92歲老中醫(yī)仍出診!他的“5不”養(yǎng)生經(jīng),簡(jiǎn)單到人人都能抄作業(yè)

92歲老中醫(yī)仍出診!他的“5不”養(yǎng)生經(jīng),簡(jiǎn)單到人人都能抄作業(yè)

人民日?qǐng)?bào)健康客戶端
2026-04-19 15:34:17
貴州茅臺(tái)股價(jià)盤中反超源杰科技,重新成為A股市場(chǎng)股價(jià)“一哥”

貴州茅臺(tái)股價(jià)盤中反超源杰科技,重新成為A股市場(chǎng)股價(jià)“一哥”

界面新聞
2026-04-20 10:52:14
“浩浩媽”新作被捆綁!表情嬌羞 身材太難頂

“浩浩媽”新作被捆綁!表情嬌羞 身材太難頂

游民星空
2026-04-19 11:03:24
美國(guó)妹子崩潰大哭:借9.6萬美元上大學(xué),已還16.5萬,還欠22萬

美國(guó)妹子崩潰大哭:借9.6萬美元上大學(xué),已還16.5萬,還欠22萬

賤議你讀史
2026-04-19 04:30:07
突發(fā)!朝鮮向日本方向猛烈發(fā)射導(dǎo)彈:日本太狼狽,反華嘴臉被打!

突發(fā)!朝鮮向日本方向猛烈發(fā)射導(dǎo)彈:日本太狼狽,反華嘴臉被打!

清歡百味
2026-04-20 05:24:03
中介曬出通話記錄,4年前業(yè)主沒110萬不賣,如今房子只值56萬

中介曬出通話記錄,4年前業(yè)主沒110萬不賣,如今房子只值56萬

映射生活的身影
2026-04-19 23:05:55
廣東一醫(yī)院發(fā)生一級(jí)甲等醫(yī)療事故,家屬申請(qǐng)刑事立案監(jiān)督

廣東一醫(yī)院發(fā)生一級(jí)甲等醫(yī)療事故,家屬申請(qǐng)刑事立案監(jiān)督

醫(yī)脈圈
2026-04-20 12:04:46
太扎心了!上海男子年薪百萬失業(yè)引不滿,新婚3個(gè)月女子就想離婚

太扎心了!上海男子年薪百萬失業(yè)引不滿,新婚3個(gè)月女子就想離婚

火山詩話
2026-04-20 06:12:18
章子怡這張照片真的有點(diǎn)嚇到我了!就是后面那些墻壁

章子怡這張照片真的有點(diǎn)嚇到我了!就是后面那些墻壁

動(dòng)物奇奇怪怪
2026-04-20 03:22:27
西班牙首相:將要求歐盟終止和以色列的聯(lián)系國(guó)協(xié)定

西班牙首相:將要求歐盟終止和以色列的聯(lián)系國(guó)協(xié)定

財(cái)聯(lián)社
2026-04-19 19:49:05
1983年,陳云親自批示:立即槍斃廣東縣委書記王仲,原因?yàn)楹危?>
    </a>
        <h3>
      <a href=莫地方
2026-04-20 09:30:18
2026-04-20 14:23:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12807文章數(shù) 142632關(guān)注度
往期回顧 全部

科技要聞

藍(lán)色起源一級(jí)火箭完美回收 客戶衛(wèi)星未入軌

頭條要聞

媒體:伊朗剛說不談 美國(guó)立即開打

頭條要聞

媒體:伊朗剛說不談 美國(guó)立即開打

體育要聞

七大獎(jiǎng)項(xiàng)候選官宣!文班或全票DPOY

娛樂要聞

鹿晗生日上熱搜,被關(guān)曉彤撕下體面

財(cái)經(jīng)要聞

月之暗面IPO迷局

汽車要聞

把天門山搬進(jìn)廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

數(shù)碼
親子
教育
本地
健康

數(shù)碼要聞

EPOMAKER推出全配列磁軸鍵盤HE108,10000mAh電池續(xù)航500hr

親子要聞

懷二胎的日子里,被五哈治愈的每一個(gè)笑點(diǎn)

教育要聞

都說慣子如殺子,這3種隱形溺愛,希望你一件都沒做過……

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

無障礙瀏覽 進(jìn)入關(guān)懷版