4月初,Netflix在Hugging Face上發布了其首個開源AI模型——VOID(全稱Video Object and Interaction Deletion,視頻物件與互動刪除),以Apache 2.0許可證發布,意味著任何人都可以免費使用,甚至用于商業用途。
正如Ben Affleck在其創立的InterPositive被Netflix收購時所說,這“不是關于文字提示或從無到有地生成什么”,而是基于已拍攝的素材,讓電影人擁有更多后期控制力。VOID延續的正是同一邏輯,或將改寫后期制作的經濟模型。
在內部盲測中,一項涵蓋25名參與者、橫跨多種場景的調查顯示,VOID以64.8%的偏好率勝出,遙遙領先于排名第二的Runway(僅18.4%)。這標志著Netflix正式在AI視頻賽道上亮牌。
![]()
VOID是什么?
后期制作的經濟模型正在被改寫
傳統視頻后期有一個公開的秘密:從畫面中移除一個物體很容易,但讓整個場景看起來好像那個東西從來就不存在——這件事難到令人發指。把一個抱著吉他的人移走,你會得到一把懸浮在半空中、違背重力的吉他。好萊塢視效團隊為修復這類問題,往往要花上好幾周。
VOID要解決的正是這個痛點。與現有視頻修補工具僅修正陰影和反射等視覺偽影不同,VOID能理解物理因果關系——如果你移除一個抱著物件的人,那個物件會在輸出視頻中自然落地。
這種“理解物理”的能力,源于VOID的核心創新——Quadmask(四值掩碼)系統。它摒棄了傳統的“移除/保留”二元掩碼,改用一個四層級掩碼,將畫面區域劃分為移除區、過渡區、受影響區和保留區。
通俗地說,Quadmask不僅告訴AI“擦什么”,還告訴它“擦完之后,剩下的東西該怎么動”——為擴散模型提供了模擬物理因果關系所需的深層情境意識。
![]()
此外,VOID采用兩階段推理流程來解決視頻擴散模型的一個已知弱點——物體變形偽影。
第一階段可處理大多數視頻;
第二階段專門利用第一階段輸出的光流翹曲潛變量作為初始化,進行二次擴散運算來修復殘留瑕疵。
在兩車對撞的視頻中,VOID可以移除其中一輛車,生成剩余車輛繼續沿公路行駛的畫面,碰撞后的碎片、煙霧和火焰全部被替換為干凈的路面;移除一個跳入泳池的人后,輸出的視頻里泳池水面波瀾不驚。
氣球在持有者被移除后會自然上升,積木在不相關積木被移除后仍保持穩定。通常情況下,人的觸碰一旦消失,物體就會發生變形,而VOID正是為解決這一問題而生。
![]()
理解VOID的價值,需要先了解一個成本現實:一場戲拍完后發現畫面里有不該出現的物件——穿幫、道具失誤、臨時改劇情,傳統方案要么是昂貴的重拍,要么是耗時數周的手工VFX修復。
VOID提供了第三條路:在后期直接移除物體,并讓AI自動重建符合物理規律的場景。對中等預算項目而言,這意味著數周的VFX工時和六位數的重拍成本可以被大幅壓縮。
VOID的底層視頻擴散模型構建于阿里巴巴PAI出品的CogVideoX-Fun-V1.5-5b-InP之上,這是一個50億參數的3D Transformer視頻生成模型;Google的Gemini負責分析場景以識別受刪除操作影響的區域;Meta的SAM2負責分割要移除的物體。
訓練采用來自Adobe Research的HUMOTO(人-物體交互)數據集和Google Kubric的合成反事實數據,在8塊A100 80GB GPU上使用DeepSpeed ZeRO Stage 2完成。
該項目由Netflix和保加利亞索菲亞大學INSAIT的研究人員聯合發布。值得注意的是,VOID以Apache 2.0許可證在Hugging Face上托管,可用于商業用途,但運行模型需要40GB以上顯存的GPU。
這意味著它暫時還不是一個“人人可用”的消費級工具,但對于專業影視制作機構和獨立VFX工作室而言,獲取好萊塢級別后期能力的門檻已經大幅降低——這一模式類似于2022年Stable Diffusion對圖像編輯領域的成本顛覆。對制作公司、廣告機構和企業視頻領域來說,后期制作的經濟模型正在被改寫。
VOID為何開源?
參與定義未來影視產業AI工具的技術標準
一個值得深思的問題是:Netflix為什么選擇以Apache 2.0許可對全世界開放?這一策略與Netflix近期對InterPositive采取的完全收購形成鮮明對比。
開源VOID,更像是Netflix仿效Meta等科技巨頭的戰略——通過釋出強大的基礎研究工具,在學術和開發者社群中建立聲譽和影響力,實質上參與定義未來影視產業AI工具的技術標準。
![]()
VOID作為一篇學術論文和開源項目的對象(值得注意的是,該論文尚未經過同行評審,目前仍是預印本),使其天然成為行業討論和技術迭代的基準點。
Netflix目前尚未宣布將該模型整合到現有產品或制作流程中的計劃。此前InterPositive的電影人專屬工具、Eyeline的虛擬制作流水線——則被Netflix牢牢握在自己手中。
這套“開源基礎研究、鎖死核心工具”的雙軌策略,折射出Netflix對AI工具生態的深思熟慮:用VOID爭奪行業標準話語權,用InterPositive和Eyeline構建不可替代的競爭壁壘。
Netflix首席產品和技術官Elizabeth Stone在宣布收購InterPositive時說得直白:“InterPositive團隊加入Netflix,是因為我們共同相信創新應該賦能故事講述者,而不是取代他們。”
回望Netflix的AI應用軌跡,從一個幫你挑DVD的Cinematch算法,到一款可以重寫視頻物理定律的開源模型,這條線勾勒出的不僅是一家流媒體公司的技術進化,更是整個好萊塢權力格局重構的縮影。
對影視公司而言,VOID意味著更少的重拍成本、更快的制作周期和更大的創作靈活性。對好萊塢之外的創作者而言,高質量視覺敘事的門檻將大幅降低。
流媒體AI競賽加速,奈飛的AI布局節奏
多年來,機器學習和人工智能一直在為Netflix的內容推薦以及制作和推廣技術提供支持。
Netflix的生成式AI應用在2025年迎來里程碑。阿根廷科幻劇集《永恒者》(El Eternauta)是第一部將AI生成的"最終像素"畫面整合到高預算制作中的重大作品。利用一系列自研和第三方AI工具,制作團隊實現了復雜視覺特效生產時間的十倍縮減。
![]()
2025年10月,Netflix將旗下Scanline VFX和Eyeline Studios統一為Eyeline品牌,下設三個核心部門——Visual Effects(視覺特效)、Studios(虛擬制作)和Labs(前沿研究)。
今年3月,Netflix買下了Ben Affleck創立的AI電影制作工具初創公司InterPositive。據報道,知名導演大衛·芬奇已經在一部布萊德·皮特主演的即將上映的項目中使用了InterPositive的工具——
該片幾乎可以確認就是Netflix簽約發行的《克里夫·布斯繼續冒險》,由芬奇執導,皮特重新扮演《好萊塢往事》中的克里夫·布斯,已于2026年1月15日殺青。
![]()
隨著流媒體競爭的加劇,各大公司都在加大技術投入,以控制成本、支持全球增長并實現服務差異化。Netflix大力發展人工智能相關應用和本地化工具,正契合了這一背景,并將技術與其核心內容引擎更緊密地結合起來。
對Netflix而言,此前收購AI制作公司和InterPositive,似乎是為了將更多內容制作環節收歸己有,并將其與AI驅動的工具直接連接起來。這一點至關重要,因為Netflix已經在字幕、推薦和廣告創意方面依賴AI,而這些收購將這種邏輯擴展到劇本開發、后期制作、視覺特效等領域。
理論上,對這些工具更嚴格的控制可以使Netflix在不同地區擁有更一致的工作流程,加快劇集和電影的制作周期,并更好地將資源用于直播活動、體育賽事和特許經營等項目上。
Netflix VOID的開源釋放了一個明確信號:AI視頻已進入“物理級”后期時代。當好萊塢開始用AIGC重新定義后期成本,國內開發者與創作者也必須進化出與之匹配的實戰能力。
針對這一行業巨變,「益起映創·沉浸式AIGC終極挑戰拉練營」將核心目標鎖定在以下兩個實戰維度:
全流程實戰落地。VOID的價值在于解決“重拍貴、修復難”的落地痛點。本次拉練營同樣拒絕空談理論,側重“全流程實戰”。從鏡頭語言的AI重塑到復雜場景的最終交付,帶你跑通一套真正能“落地”的影視工業級AIGC制作流程。
頂尖導師的技術與審美雙修。正如VOID是技術與視效審美的結合,本次拉練營匯聚了北京電影學院、中國傳媒大學等背景的導師陣容。不僅教你如何駕馭前沿AI工具,更教你如何在技術迭代中保持專業的影視審美,實現“最終像素”的高質量表達。
北電導師領銜監制
由北京電影學院文學系副教授楊蕊擔任總監制,聯合跨越字節、愛奇藝等大廠的資深視效專家與獲獎導演組成導師團。課程將傳統影視工業的底層邏輯與前沿AI技術深度融合,確保學員站在專業視聽藝術的高度進行創作,而非簡單的技術堆砌。
實戰全流程+高成片率
訓練營拒絕紙上談兵,以“帶走一個完整作品”為畢業標準,前兩期畢業率超過98%。訓練營涵蓋從前置劇本直播課、沉浸拉練到路演的全流程。學員將經歷從創意、分鏡到成片沖刺的閉環實操,真正打通從藝術創意到商業交付的最后一步。
導師全程1v1指導
在核心的捏片環節,導師團隊提供全程陪同與一對一指導。針對提示詞精進、工作流搭建、溶圖技法、AI配音及后期混音等具體環節實時賦能。高頻互動的“私教式”教學,有效解決創作中的個性化卡點,助力創作者打破技術自嗨,實現職業級的視聽表達。
作品直面平臺與產業公司
連接無限機遇
結營的短片展映環節,是一場面向全行業的“人才路演”。來自視頻平臺、頭部影視制作公司、MCN機構等平臺與產業公司的代表們親臨現場,坐在臺下的他們,正是來挖掘下一個AIGC創作新星的“伯樂”。作品版權100%歸你所有,可直接用于接單、變現、作品集展示。
獎金激勵與行業認證
雙證加持:可同步獲得國家廣電總局研修學院頒發的官方培訓證書;同時,結業可申請AIGC導演職業認證(高級)證書,提升行業背書。
訓練營會最終評選最佳影片、最佳視覺、最佳音樂、最佳表演、最受觀眾青睞等獎項及最高6000元現金獎勵。
從0到1,做出屬于自己的AI短片從興趣到變現,開啟AI導演之路。
感興趣的朋友,趕緊添加小助手微信咨詢報名吧!
![]()
![]()
![]()
![]()
塑三文化創意園區由北京塑三文化創意有限公司自主運營,前身為北京市塑料三廠,總占地面積44369平方米,建筑面積30236平方米。2013年,園區依托舊工業廠房資源,篩選駐園企業類型,推動存量空間盤活利用與功能轉型,啟動從工業園區到文化園區的升級。2016年,園區遵循北京市“四個中心”城市戰略定位,引導一般制造業企業拆除騰退、轉移外遷,推行“騰籠換鳥”“退低引高”策略,引進符合首都功能的高精尖產業,推動園區從傳統制造向高端化、綠色化、創新化轉型,實現“瓦片經濟”向“服務經濟”的蛻變。自2018年起,園區投入逾千萬元,改造升級基礎設施、公共文化空間和公共服務設施,打造綜合性文化空間,向更專業、更具影響力和核心競爭力的文化創意產業園區發展。
目前,園區以“影視+設計”“科技+藝術”“產學研+配套服務”的"三位一體"為特色發展模式,構建功能協同、特色鮮明的整體規劃布局,助力區域文化產業升級與民生品質提升。2023年,園區獲評朝陽區第二批文化事業產業融合發展示范園區;2023年至2024年,已連續兩年獲評"北京市級文化產業園區";2025年園區獲評朝陽區文化產業(影視)特色園區。
益起映創是立足國內、面向全球的新銳影視品牌,始終堅持“共創共生”的理念,關注影人的成長歷程。我們致力于為影人職業發展及終生成長提供服務和支持。
丨合作伙伴丨
影視工業網是華語區最大影視制作者從業社群,為從業者提供資訊、設備購買、影視教育、招聘對接等全鏈條服務,打造“一錄同行”等行業旗艦活動。WEB+APP+MCN一體化垂直媒體矩陣,擁有超500萬注冊用戶與3萬+機構用戶,覆蓋全產業鏈從業者,提供知識、人脈、機會、購惠服務,是影視行業核心資源平臺。
丨戰略合作媒體丨
![]()
2026益起映創用戶調研
填問卷贈影視線上課
YIQIYINGCHUANG
馬上掃碼參與
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.