无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

視頻生成技術:多視角展現真實身份與光照的新突破

0
分享至



第一作者徐源誠是 Netflix Eyeline 的研究科學家,專注于基礎 AI 模型的研究與開發,涵蓋多模態理解、推理、交互與生成,重點方向包括可控視頻生成及其在影視制作中的應用。他于 2025 年獲得美國馬里蘭大學帕克分校博士學位。

最后作者于寧是 Netflix Eyeline 資深研究科學家,帶領視頻生成 AI 在影視制作中的研發。他曾就職于 Salesforce、NVIDIA 及 Adobe,獲馬里蘭大學與馬普所聯合博士學位。他多次入圍高通獎學金、CSAW 歐洲最佳論文,并獲亞馬遜 Twitch 獎學金、微軟小學者獎學金,以及 SPIE 最佳學生論文。他擔任 CVPR、ICCV、ECCV、NeurIPS、ICML、ICLR 等頂會的領域主席,以及 TMLR 的執行編輯。

在電影與虛擬制作中,「看清一個人」從來不是看清某一幀。導演通過鏡頭運動與光線變化,讓觀眾在不同視角、不同光照條件下逐步建立對一個角色的完整認知。然而,在當前大量 customizing video generation model 的研究中,這個最基本的事實,卻往往被忽視。



  • 論文地址: https://arxiv.org/pdf/2510.14179
  • 項目主頁: https://eyeline-labs.github.io/Virtually-Being/

被忽視的核心問題:Multi-view Identity Preservation



多視角身份一致、鏡頭環繞與多人物示例

近年來,視頻生成領域中關于人物定制(customization)的研究迅速發展。絕大多數方法遵循一種相似范式:給定一張或少量人物圖像 → 生成包含該人物的視頻。這種范式隱含了一個關鍵假設:只要人物在某個視角下看起來像,就等價于「身份被保留」。但在真實的視頻與電影語境中,這個假設并不成立。

為什么單視角身份是不夠的?

  • 身份是強烈依賴視角的(view-dependent)

面部輪廓、五官比例、體態與衣物形態,都會隨觀察角度發生系統性變化。

  • 相機運動會持續暴露未見過的外觀區域

單張或少量圖像無法覆蓋側臉、背面以及連續視角變化過程中的外觀一致性。

  • 多人場景會放大任何身份錯誤

當多個角色同框時,哪怕輕微的身份漂移都會變得非常明顯。

因此,在具有真實 3D 相機運動的視頻中,「identity preservation」本質上是一個 multi-view consistency 問題,而不是單幀相似度問題。

然而,令人遺憾的是,顯式關注 multi-view identity preservation,在當前的視頻定制化生成研究中仍然幾乎沒有被系統性地解決。

核心立場:學習一個人的身份,必須學習他在多視角與多光照下的樣子


Virtually Being 的核心論點非常明確:如果希望模型真正「學會一個人的身份」,那么它必須看到這個人在不同視角(multi-view)和不同光照(various lighting)下的穩定外觀。

換句話說,看清一個人,不是看清一張臉,而是理解這個人在空間中如何被觀察,在光線變化下如何呈現。身份不是一個靜態的 2D 屬性,而是一個 4D(空間 + 時間)一致的概念,這正是 Virtually Being 所要系統性解決的問題。

方法概覽:用 4D 重建構建真正的多視角身份監督


為了解決 multi-view identity 被長期忽視的問題,我們從數據層面重新設計了人物定制流程。

多視角表演采集,而非單視角參考

  • 使用專業體積捕捉系統采集真實人物表演:75 相機面部捕捉陣列、160 相機全身捕捉陣列;
  • 捕捉人物在受控條件下的動態表演,為高質量重建提供輸入。

4D Gaussian Splatting 作為數據生成器

  • 對捕捉到的表演進行 4D Gaussian Splatting (4DGS) 重建;
  • 在重建結果上渲染大量視頻:覆蓋連續變化的相機軌跡、具備精確的 3D 相機參數標注、保證同一人物在不同視角下的身份一致性。

通過這一過程,視頻生成模型在訓練階段不再依賴零散的圖像線索,而是反復觀察同一個人在多視角、連續鏡頭運動下應當如何保持外觀一致。

兩階段訓練:先理解鏡頭,再理解「這個人」


為了在身份定制的同時保持穩定的鏡頭控制能力,我們采用了一個清晰解耦的兩階段訓練策略。

階段一:相機感知預訓練(Camera-aware Pretraining)

基于 ControlNet 架構,引入完整 3D 相機參數(Plücker 表示),在大規模公開視頻數據上訓練模型,使其學會相機運動如何影響視角變化與時間結構。這一階段的目標,是讓模型牢固掌握電影級的鏡頭語言。

階段二:多視角身份定制(Multi-view Customization)

在預訓練模型基礎上進行微調,使用 4DGS 渲染的多視角視頻作為定制數據,為每個身份引入專屬 token,將身份與多視角外觀顯式綁定,最終模型在推理時能夠精確遵循輸入的 3D 相機軌跡,在未見過的視角下仍然穩定呈現同一個人。



光照真實感:身份感知不可分割的一部分


除了視角,光照同樣是「看清一個人」的關鍵維度。

在真實電影中,人物身份并不是在單一光照條件下被認知的,而是在不同室內外環境,側光、逆光、柔光等變化,不同光比與色溫條件下逐步被觀眾確認。

在 Virtually Being 中,我們通過引入基于 HDR 的視頻重打光數據,顯著增強了生成視頻中的光照真實感。在 4DGS 渲染基礎上,對同一人物生成多種自然光照條件,覆蓋真實拍攝中常見的照明變化范圍,使模型學會在光照變化下,人物身份仍應保持穩定。

實驗結果顯示,引入重光照數據后,生成視頻在用戶研究中 83.9% 被認為光照更自然、更符合真實拍攝效果,缺乏該數據時,人物往往呈現平坦、缺乏層次的合成感。

多人物生成:multi-view identity 才能支撐真實互動


在多人物視頻生成中,multi-view identity preservation 的重要性進一步被放大。

只有當模型對每個角色在不同視角與光照條件下的身份都有穩定建模時,人物才能自然同框,空間關系才能保持一致,互動才不會顯得拼接或混亂。

Virtually Being 支持兩種多人物生成方式:

  • 聯合訓練(Joint Training):通過少量同框數據增強互動真實性;
  • 推理階段組合(Noise Blending):在無需重新訓練的情況下靈活組合多個身份。




實驗結論:multi-view + relighting 是身份一致性的關鍵因素


系統性實驗表明,使用 multi-view 數據訓練的模型,在 AdaFace 等身份指標上顯著優于僅使用 frontal-view 數據的模型以及其他 video customization 的方法。缺失 multi-view 或 relighting 數據,都會導致身份一致性與真實感明顯下降。用戶研究結果同樣明確偏好具備 multi-view 身份穩定性的生成結果。





總結:重新定義視頻生成中的「身份」


Virtually Being 并不僅僅提出了一個新框架,而是明確提出并驗證了一個長期被忽視的觀點:在視頻生成中,身份不是一張圖像,而是一個人在多視角與多光照條件下保持穩定的 4D 表現。通過系統性地引入 multi-view 表演數據與真實光照變化,我們為 customizing video generation model 提供了一條更貼近電影制作實際需求的解決路徑。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
虎撲網友曬女友吐槽“球打多了無感”引圍觀

虎撲網友曬女友吐槽“球打多了無感”引圍觀

娛圈觀察員
2026-06-12 00:44:42
網傳武漢大學7000多退休職工,月均領10000,每年需9億社保供應…

網傳武漢大學7000多退休職工,月均領10000,每年需9億社保供應…

慧翔百科
2026-06-09 12:21:35
賽后采訪孟新藝,問他指著外國球員說了什么,他的回答讓全場沸騰

賽后采訪孟新藝,問他指著外國球員說了什么,他的回答讓全場沸騰

童叔不飆車
2026-06-13 00:43:03
“明亮紅色球體”、“等離子體狀球體”懸浮空中……美國防部公布第三批涉UFO檔案

“明亮紅色球體”、“等離子體狀球體”懸浮空中……美國防部公布第三批涉UFO檔案

環球網資訊
2026-06-12 22:38:17
比電子布還猛?PCB核心材料—PPO樹脂缺口70%  6大產能龍量價齊升

比電子布還猛?PCB核心材料—PPO樹脂缺口70% 6大產能龍量價齊升

元芳說投資
2026-06-13 06:30:21
連續43小時沒合眼,上海30歲骨干教師溺亡前細節曝光

連續43小時沒合眼,上海30歲骨干教師溺亡前細節曝光

大廠編外實習生
2026-06-12 19:37:31
上海一幼兒園教師離世,室友稱事發三天前其還在做海南旅行攻略;教育局:深感痛心和惋惜,相關情況還在調查

上海一幼兒園教師離世,室友稱事發三天前其還在做海南旅行攻略;教育局:深感痛心和惋惜,相關情況還在調查

大風新聞
2026-06-12 12:22:12
成都這一夜,阿嬌“水桶腰、大象腿”是對畸形審美的反擊

成都這一夜,阿嬌“水桶腰、大象腿”是對畸形審美的反擊

健身迷
2026-05-07 12:11:32
實錘!那個為找學位證真相舉報自己的人,證書實為違規取得

實錘!那個為找學位證真相舉報自己的人,證書實為違規取得

聽心堂
2026-06-12 21:26:57
財務造假!10家A股公司退市,超25萬股東踩雷

財務造假!10家A股公司退市,超25萬股東踩雷

21世紀經濟報道
2026-06-12 18:59:56
一個“活著真可怕”的社會是怎樣煉成的?

一個“活著真可怕”的社會是怎樣煉成的?

通往遠方的路
2026-06-10 09:08:29
小法求購皇馬三名球員

小法求購皇馬三名球員

體壇周報
2026-06-12 19:01:04
人類史上最大IPO,開盤暴漲!美股太空股跳水;閃迪漲超5%,再創歷史新高;金銀、油價下跌|美股開盤

人類史上最大IPO,開盤暴漲!美股太空股跳水;閃迪漲超5%,再創歷史新高;金銀、油價下跌|美股開盤

每日經濟新聞
2026-06-12 23:04:05
韓國妻子孕晚期意外發現溫柔丈夫聊天對話:"她簡直像頭豬""借口懷孕只知道吃!"情緒徹底崩潰...

韓國妻子孕晚期意外發現溫柔丈夫聊天對話:"她簡直像頭豬""借口懷孕只知道吃!"情緒徹底崩潰...

英國那些事兒
2026-06-11 23:03:25
中國U23,4-0大勝香港U23,拜合拉木破門向余望點射

中國U23,4-0大勝香港U23,拜合拉木破門向余望點射

五姑娘臺球
2026-06-12 20:12:16
中超唯一世界杯參賽球員,浙江外援樸鎮燮首戰替補待命

中超唯一世界杯參賽球員,浙江外援樸鎮燮首戰替補待命

懂球帝
2026-06-12 09:01:06
唐嫣訴訟三月后首談女兒秘事,與羅晉關系早已走向大結局

唐嫣訴訟三月后首談女兒秘事,與羅晉關系早已走向大結局

夢醉為紅顏一笑
2026-06-13 00:51:08
茅臺首款光瓶酒面世!定價156元,強勢發力2000億光瓶酒賽道

茅臺首款光瓶酒面世!定價156元,強勢發力2000億光瓶酒賽道

三農老歷
2026-06-13 03:22:03
阿奴諾比升FMVP榜首!或復刻伊戈達拉模式 皮爾斯:直接給他頒獎

阿奴諾比升FMVP榜首!或復刻伊戈達拉模式 皮爾斯:直接給他頒獎

醉臥浮生
2026-06-13 06:20:14
從500億“東方迪士尼”到網紅深坑公園!長沙國資2.83億抄底!

從500億“東方迪士尼”到網紅深坑公園!長沙國資2.83億抄底!

湘江生活
2026-06-11 17:11:08
2026-06-13 07:07:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
13246文章數 142668關注度
往期回顧 全部

科技要聞

剛剛,人類歷史上首位萬億美元富豪誕生!

頭條要聞

伊美諒解備忘錄草案部分內容披露 涉及撤軍、戰爭賠償等

頭條要聞

伊美諒解備忘錄草案部分內容披露 涉及撤軍、戰爭賠償等

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

一天4個瓜,肖戰熱巴最意外

財經要聞

萬億美元順差背后,透露這些信號

汽車要聞

標配激光雷達/雙動力可選 昊鉑S600限時售17.99萬起

態度原創

數碼
房產
本地
旅游
軍事航空

數碼要聞

英國監管機構警告:亞馬遜、eBay仍在售可能致命的假冒手機充電器

房產要聞

海南最賺錢行業曝光!最快4年半,海口全款買三房!

本地新聞

AK劉彰邂逅河北南大港濕地

旅游要聞

印度有錢人真多酷暑辦理旅游簽證!不是有錢任性,是熱到活不下去

軍事要聞

伊朗媒體:已故最高領袖葬禮推遲舉行

無障礙瀏覽 進入關懷版