網易首頁 > 網易號 > 正文 申請入駐

別只關注馬斯克的Grok了,Sora復刻版Open-Sora直接開源!

0
分享至

開源項目地址:https://github.com/hpcaitech/Open-Sora

中文文檔:https://github.com/hpcaitech/Open-Sora/blob/main/docs/README_zh.md

不久前,OpenAI的Sora憑借其令人贊嘆的視頻生成效果迅速走紅,成為眾多文字到視頻模型中的佼佼者,引起了全球的關注。緊接著,Colossal-AI團隊推出了一項新的開源方案“Open-Sora 1.0”,該方案全面覆蓋了訓練過程,包括數據處理、所有訓練細節以及模型檢查點,旨在與全球AI愛好者攜手共進,開創視頻創作的新紀元。現在,就讓我們先來看一看“Open-Sora 1.0”模型生成的美景視頻。

海浪拍打在海灘和懸崖:

漫天繁星流轉:

午夜的繁華街頭:

在海中遨游的海龜:

Open-Sora技術只是冰山一角。Colossal-AI團隊已經全面開源了模型架構、訓練模型檢查點、所有訓練與數據準備過程的細節、視頻演示和教程,供所有對文字到視頻模型感興趣的人在GitHub上自由學習和使用。

Open-Sora的復現計劃

Open-Sora的復現計劃借鑒了Stable Video Diffusion(SVD)工作,分為三個階段:

1. 大規模圖像預訓練:第一階段通過大規模圖像預訓練,利用成熟的文字到圖像模型幫助降低視頻預訓練的成本。借助互聯網上豐富的大規模圖像數據和先進的文字到圖像技術,能夠訓練出高質量的文字到圖像模型,作為視頻預訓練下一階段的初始化權重。同時,由于缺乏高質量的時空VAE,Open-Sora使用Stable Diffusion模型預訓練空間VAE。這種策略不僅確保了初始模型的優越性能,也顯著降低了視頻預訓練的總體成本。

2. 大規模視頻預訓練:第二階段通過大規模視頻預訓練,增強模型的泛化能力,有效掌握視頻的時間序列關聯。這一階段需要使用大量的視頻數據訓練,以確保視頻主題的多樣性,從而提高模型的泛化能力。

3. 高質量視頻數據微調訓練:第三階段通過對高質量視頻數據的微調,顯著提高了生成視頻的質量。第三階段使用的視頻數據量比第二階段少一個數量級,但視頻的持續時間、分辨率和質量都更高。通過這種方式的微調,實現了視頻生成從短到長、從低分辨率到高分辨率、從低保真度到高保真度的高效擴展。每個階段的訓練都是在前一階段的權重基礎上繼續進行。與從零開始的單階段訓練相比,多階段訓練通過逐步擴大數據規模,更高效地實現了高質量視頻生成的目標。在復現過程中,Colossal-AI團隊使用了64個H800 GPU進行訓練。第二階段的訓練量共計2808 GPU小時,約等于7000美元;第三階段的訓練量為1920 GPU小時,約等于4500美元,最后成功地將Open-Sora復現過程的成本控制在約10000美元。

數據預處理

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
建國后外逃級別最高的貪官!至今未落網,23年來逃跑方式仍是謎

建國后外逃級別最高的貪官!至今未落網,23年來逃跑方式仍是謎

鐵血江湖人
2026-04-23 22:21:26
嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

阿訊說天下
2026-04-25 11:15:04
阿森納贊助商TCL稱自家電視銷量全球前二,球迷:這很搭呀

阿森納贊助商TCL稱自家電視銷量全球前二,球迷:這很搭呀

懂球帝
2026-04-26 12:03:09
臺媒:毛里求斯表態戳破臺當局謊言

臺媒:毛里求斯表態戳破臺當局謊言

參考消息
2026-04-25 19:55:46
楊威雙胞胎女兒太爭氣,9歲同臺拿下全國冠軍+季軍,體操最強二代

楊威雙胞胎女兒太爭氣,9歲同臺拿下全國冠軍+季軍,體操最強二代

觀魚聽雨
2026-04-25 23:23:30
華誼:靠周星馳狂賺12.48億!卻耍賴8600萬,換來十一年因果報應

華誼:靠周星馳狂賺12.48億!卻耍賴8600萬,換來十一年因果報應

一盅情懷
2026-04-25 16:23:35
止步7強!車手昏迷張雪離場,網友質疑有黑幕,官方回應盡顯格局

止步7強!車手昏迷張雪離場,網友質疑有黑幕,官方回應盡顯格局

南宗歷史
2026-04-26 10:47:38
寶視達回應“鏡片裝反孩子近視暴漲到900度”:出廠交付時不存在鏡片裝反情況,愿退還配鏡費用贈送1000元眼鏡及感謝金

寶視達回應“鏡片裝反孩子近視暴漲到900度”:出廠交付時不存在鏡片裝反情況,愿退還配鏡費用贈送1000元眼鏡及感謝金

極目新聞
2026-04-26 09:13:09
接到陌生電話先問這3個字!騙子聽到馬上掛斷,記得轉告身邊人

接到陌生電話先問這3個字!騙子聽到馬上掛斷,記得轉告身邊人

小談食刻美食
2026-04-25 09:47:09
一張“初三女孩體測”照片,讓家長被數萬網友指責:太不用心了!

一張“初三女孩體測”照片,讓家長被數萬網友指責:太不用心了!

川渝視覺
2026-04-25 20:19:24
北京車展30臺車被搶光,老外排隊求中國造,一臺車蓋要工程師簽名

北京車展30臺車被搶光,老外排隊求中國造,一臺車蓋要工程師簽名

音樂時光的娛樂
2026-04-26 15:12:14
1973年江青私闖毛主席住處,毛主席怒斥:隨便闖,再闖,就抓起來

1973年江青私闖毛主席住處,毛主席怒斥:隨便闖,再闖,就抓起來

南鈦
2026-04-26 09:20:22
性感陰濕男,正在統治內娛

性感陰濕男,正在統治內娛

最人物
2026-04-25 14:56:19
曝克洛普同意入主皇馬!要求清洗 6 大主力,鎖定 3 大王牌

曝克洛普同意入主皇馬!要求清洗 6 大主力,鎖定 3 大王牌

奶蓋熊本熊
2026-04-26 01:07:27
恒大集團與特朗普合作往事

恒大集團與特朗普合作往事

地產微資訊
2026-04-24 18:09:33
猛降14℃!暴雨大暴雨、冰雹、雷暴大風馬上到湖北

猛降14℃!暴雨大暴雨、冰雹、雷暴大風馬上到湖北

極目新聞
2026-04-26 08:40:20
顏寧微博發文:我本人曾經至少兩篇CNS論文被審稿人偷信息搶發

顏寧微博發文:我本人曾經至少兩篇CNS論文被審稿人偷信息搶發

澎湃新聞
2026-04-26 11:18:27
荒唐的斯威士蘭:集中10萬少女貢獻國王選妃,國民平均壽命35歲

荒唐的斯威士蘭:集中10萬少女貢獻國王選妃,國民平均壽命35歲

春秋硯
2026-04-25 17:15:06
南京一通信公司高管組織40多名員工上班時間干私活,研發競品長達9年,被按法定上限判賠580萬元

南京一通信公司高管組織40多名員工上班時間干私活,研發競品長達9年,被按法定上限判賠580萬元

環球網資訊
2026-04-26 16:19:07
全市領導干部會議召開,宣布省委關于景德鎮市委主要負責同志調整的決定

全市領導干部會議召開,宣布省委關于景德鎮市委主要負責同志調整的決定

景德鎮瓷局
2026-04-26 09:16:19
2026-04-26 17:43:00
北茗的AI茶館 incentive-icons
北茗的AI茶館
探討AI領域內容,展望人機共生的美好未來!
71文章數 14關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

美國網民質疑:為什么先救萬斯

頭條要聞

美國網民質疑:為什么先救萬斯

體育要聞

森林狼3比1掘金:逆境中殺出了多孫穆?!

娛樂要聞

僅次《指環王》的美劇,有第二季

財經要聞

中辦、國辦:加強新就業群體服務管理

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

健康
教育
旅游
時尚
家居

干細胞如何讓燒燙傷皮膚"再生"?

教育要聞

四年級數學:簡便計算,難住不少數學老師

旅游要聞

游客在山頂打架,景區又能怎么辦

IU的臉,真的有自己的時間線

家居要聞

自然肌理 溫潤美學

無障礙瀏覽 進入關懷版