允中 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
咱就是說啊,這年頭做一個(gè)小短劇,真的不要太簡單。
因?yàn)椋F(xiàn)在手搓一集國漫小短劇,真的是幾張圖就能搞定!
話不多說,直接來看效果:
![]()
視頻地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
不論是打斗的特效還是背景音效、人物的旁白,都是一鍋出的那種!
這就是生數(shù)科技Vidu Q3正式發(fā)布的參考生視頻,主打的就是一個(gè)為劇而生,萬物可參,聲畫同出。
(早在Vidu Q3在今年1月發(fā)布的時(shí)候,它就登頂了國際權(quán)威AI基準(zhǔn)測試機(jī)構(gòu)Artificial Analysis榜單。并且在全球首個(gè)參考生榜單,SuperClue榜單中,Vidu Q3斷層登頂,一舉拿下多圖/單圖參考任務(wù)雙榜第一!)
![]()
視頻地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
剛才的國漫小片段,所需要的素材,僅僅就是一個(gè)人物主體、一張背景圖,再搭配一段Prompt即可:
![]()
甚至你只需要一張參考圖,Prompt描述到位,也可以解鎖類似柳神的國漫效果:
![]()
![]()
視頻地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
不只是準(zhǔn)備工作需要得少,這次Vidu Q3的參考生視頻,感覺就像把一個(gè)完整劇組擺到了你面前:
- 6大特效:粒子、流體、動(dòng)力學(xué)、運(yùn)鏡、轉(zhuǎn)場、光影,通過自然語言就能控制
- 5大音效:環(huán)境、動(dòng)態(tài)、氛圍、擬音、情緒,聽覺也有了敘事連續(xù)性
- 4大場景:短劇、漫劇、影視劇、廣告核心場景提升了能力,可作為商用的內(nèi)容單元
嗯,不難看出,Vidu Q3是沖著劇而來的。
![]()
視頻地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
萬物皆可參考,人人都有一個(gè)影視庫
那么Vidu Q3到底能把劇做到什么程度,我們接下來就從特效、音效和場景三大角度來一波實(shí)測。
六大特效,把想象力給“畫”出來
首先是特效方面,我們實(shí)測的是一段未來科幻賽博風(fēng)的視頻,先來準(zhǔn)備三張圖:
![]()
然后我們再給Vidu Q3輸入一段Prompt:
豎屏9比6,高清科幻質(zhì)感,電影級(jí)動(dòng)態(tài)運(yùn)鏡;機(jī)甲戰(zhàn)士激活核心,藍(lán)紫霓虹粒子束噴涌而出,流體能量光帶環(huán)繞周身,金屬機(jī)甲動(dòng)力學(xué)形變自然絲滑;抬手釋放等離子護(hù)盾,光影體積光穿透煙霧,鏡頭極速推進(jìn)+360°環(huán)繞轉(zhuǎn)場,建筑破碎、碎片飛濺遵循真實(shí)物理碰撞;全程無對白,僅保留高能科幻特效轟鳴,10秒無崩壞,成片級(jí)未來科技視覺沖擊力拉滿。
在稍等片刻之后,特效拉滿的視頻片段就誕生了:
![]()
視頻地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
可以看到,視頻中的特效內(nèi)容、運(yùn)鏡等等,都和Prompt中的要求做到了一致。
區(qū)別于其他模型單一特效疊加的生硬感,Vidu Q3參考生視頻的特效高度服務(wù)于劇情節(jié)奏,光影明暗呼應(yīng)情緒起伏,運(yùn)鏡轉(zhuǎn)場貼合敘事邏輯。
而且是幾張參考圖和一段Prompt就能解鎖影視級(jí)特效的那種。
更宏觀、更細(xì)節(jié)、更天馬行空的特效,現(xiàn)在拿著Vidu Q3也是手拿把掐:
鎖定參考圖@圖2星云主體+@圖1星環(huán)場景,全程無人物,純宏觀宇宙視覺,6秒無縫連貫,無崩壞;粒子/流體/光影/運(yùn)鏡四大特效拉滿,低頻宇宙轟鳴音效,史詩級(jí)沉浸感0-2s 上帝視角俯沖推進(jìn),深空暗藍(lán)基底,鎏金星塵粒子呈漩渦狀流體涌動(dòng),體積光穿透星云,光暈彌散2-4s 鏡頭360°環(huán)繞拉升,巨型星環(huán)緩緩自轉(zhuǎn),碎星剛體動(dòng)力學(xué)漂浮碰撞,藍(lán)紫能量光帶環(huán)繞星環(huán)流轉(zhuǎn)4-6s 中心超新星微光爆發(fā),金白粒子射線輻射全域,光影明暗極致對比,定格浩瀚宇宙史詩畫面,音效低頻震顫收尾。
![]()
視頻地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
像下面這個(gè)火焰特效,是直接可以在電影中使用的程度:
![]()
視頻地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
動(dòng)漫中的華麗特效亦是如此:
![]()
視頻地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
五大音效,聽聲音就很有感覺
接下來,我們繼續(xù)實(shí)測一下音效方面的能力。
同樣是先丟兩張圖進(jìn)來,但這次設(shè)計(jì)的Prompt將更加聚焦于聲音:
圖1一條茂密的雨林小徑,兩側(cè)高聳松樹形成天然走廊。中景霧氣緩緩飄移,降低能見度。背景樹木逐漸隱入灰白雨幕。雨滴持續(xù)穿過樹冠,落在潮濕的樹葉和地面水洼上。景深大,鏡頭沿小徑緩慢前移,沉浸寧靜氛圍,寫實(shí)風(fēng)格,平滑運(yùn)動(dòng),自然雨動(dòng)態(tài)。圖2在圖一的中間走著。不要音樂,只要環(huán)境音
![]()
在沒有任何背景音樂的情況下,雨中漫步的感覺就通過音效傳遞出來了:
![]()
視頻地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
以及像影視片段里經(jīng)常看到女主在舞臺(tái)演唱,Vidu Q3也能把唱歌這事給hold住:
0-2s 慢推近景,女生指尖撥動(dòng)吉他琴弦,發(fā)絲隨動(dòng)作輕揚(yáng),舞臺(tái)暖光柔焦閃爍,吉他弦震動(dòng)擬音清晰自然2-4s 固定中景,女生開口彈唱“星光為我加冕,歌聲奔赴山海”,口型精準(zhǔn)匹配歌詞,音色清甜元?dú)猓h(huán)境音適配舞臺(tái)混響,光影隨旋律明暗律動(dòng)音效配置:吉他彈奏原聲、舞臺(tái)空間混響、輕柔氛圍音,聽覺層次飽滿,人聲與伴奏融合自然
![]()
視頻地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
四大場景,總有一個(gè)是你需要的
除了上面提到的動(dòng)漫、電影,再來看下一個(gè)快節(jié)奏短劇的實(shí)測:
![]()
視頻地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
有一說一,這個(gè)質(zhì)感,乍一看真還以為是真人出演的短劇了。
最后,我們再來看下Vidu Q3參考生視頻做廣告視頻的能力,Prompt如下:
豎屏9比16,輕奢廣告大片質(zhì)感,特寫+中景無縫切換;柔光冷調(diào)光影,模特指尖輕捏唇釉,瓶身鎏金光澤細(xì)膩,特寫鏡頭展示唇釉絲絨質(zhì)地,上唇絲滑無卡紋;無多余臺(tái)詞,僅高端畫外音:“一抹鎏金,定義高級(jí)質(zhì)感”;音效極簡高級(jí)(瓶身碰撞輕響、膏體絲滑摩擦音),背景無雜音,人物妝容精致統(tǒng)一,鏡頭高級(jí)不浮夸,適配美妝廣告批量生成、多版本迭代。
![]()
視頻地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
同樣依舊是穩(wěn)穩(wěn)實(shí)現(xiàn)了Prompt中的各種細(xì)節(jié)要求,有了Vidu Q3參考生,現(xiàn)在做個(gè)廣告也是圖片+自然語言就能搞定的事了。
參考生優(yōu)等生,不斷自己超越自己
在整體實(shí)測過后,最大的感受或許就是——
曾經(jīng)AI視頻圈子里比拼的一致性等問題,到了Vidu Q3參考生視頻這里已經(jīng)是個(gè)基本項(xiàng),它追求的是一種全新的內(nèi)容生產(chǎn)范式。
萬物可參,是Vidu Q3最核心的突破。角色形象、場景布景、服化道細(xì)節(jié)、核心視覺元素全部支持可復(fù)用建模,創(chuàng)作者無需再依賴一次性隨機(jī)生成,而是像搭建專業(yè)影視素材庫一般,自由組合、反復(fù)調(diào)用、靈活迭代,每一次生成都能穩(wěn)定輸出專業(yè)級(jí)、影視級(jí)的標(biāo)準(zhǔn)化內(nèi)容,解決了AI視頻創(chuàng)作中風(fēng)格割裂、形象崩壞、細(xì)節(jié)失控的行業(yè)痛點(diǎn),讓低成本、高質(zhì)量的批量內(nèi)容生產(chǎn)成為現(xiàn)實(shí)。
![]()
回顧Vidu清晰的模型演進(jìn)路線,我們能完整窺見AI影視創(chuàng)作從0到1、從能用至好用的全進(jìn)化軌跡。
Q1版本重新定義敘事邏輯,夯實(shí)了AI視頻基礎(chǔ)生成能力;Q2版本解鎖AI演技,賦予虛擬角色靈動(dòng)的微表情與肢體表現(xiàn)力,打破虛擬人物僵硬感;而全新的Q3版本,正式宣告AI視頻工具邁入工業(yè)化內(nèi)容生產(chǎn)階段,以“為劇而生”為核心定位,徹底轉(zhuǎn)型為可落地、可商用的專業(yè)影視創(chuàng)作生產(chǎn)力工具。
更值得一提的,是Vidu Q3打造的參考生全家桶全鏈路生態(tài)。模型層面,完整覆蓋文生視頻、圖生視頻、參考生視頻三大核心能力,形成無死角創(chuàng)作矩陣;服務(wù)層面,以Q3模型為核心底座,Vidu SaaS(Vidu Agent、Vidu Claw)、Vidu MaaS(Vidu AI開放平臺(tái)、Vidu.API)全面接入核心能力,構(gòu)建起創(chuàng)作、生產(chǎn)、交付一體化的閉環(huán)服務(wù)體系。
同時(shí),Vidu Q3兼顧了專業(yè)性與普惠性:0門檻快速上手,價(jià)格僅為行業(yè)平均水平的1/3,生成速度快、鏡頭切鏡自然流暢,即便在使用高峰期也能保持穩(wěn)定輸出,還支持定制化提示詞調(diào)優(yōu)、全流程工作流適配。無論是個(gè)人獨(dú)立創(chuàng)作者、短視頻工作室,還是影視制作公司、品牌廣告團(tuán)隊(duì),都能低成本接入,快速將創(chuàng)意轉(zhuǎn)化為可直接交付的成片內(nèi)容。
從技術(shù)突破到生態(tài)落地,從創(chuàng)意生成到商用交付,Vidu Q3用一次次自我迭代,重新定義了AI視頻的行業(yè)標(biāo)準(zhǔn)。一句“Action”、幾張參考圖、一段文字指令,人人都能化身專業(yè)導(dǎo)演,一鍵開拍影視級(jí)大片,這便是Vidu獻(xiàn)給整個(gè)內(nèi)容行業(yè)的全新答案。
最后,送上一波福利:
輸入專屬邀請碼:JQZXN3,登陸Vidu.cn。注冊即送500積分。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.