6月22日,阿里巴巴發(fā)布視頻生成模型HappyHorse 1.1,較1.0版本,在動(dòng)態(tài)表現(xiàn)力、主體一致性、指令遵循、視覺質(zhì)感和音頻能力等維度系統(tǒng)性升級。
![]()
動(dòng)態(tài)表現(xiàn)力是當(dāng)前視頻生成模型的共同難點(diǎn)。針對1.0版本部分畫面動(dòng)作遲緩、節(jié)奏不足的問題,1.1版本優(yōu)化了運(yùn)動(dòng)建模與時(shí)序一致性能力,提升了動(dòng)作的連貫性和力量感。
![]()
![]()
對于內(nèi)容生產(chǎn)者而言,保持主體一致性可大大減少抽卡率。1.1版本支持9張角色參考圖同時(shí)輸入,保持商品細(xì)節(jié)、品牌元素、角色與場景的靈活組合和穩(wěn)定性,多分鏡與 N 宮格參考理解增強(qiáng)。這意味著在多角色短劇、直播帶貨、多人物廣告等場景中,角色“變臉”情況可控。
在指令遵循方面,無論是簡短描述還是復(fù)雜敘事輸入,1.1版本對提示詞的理解能力都有所增強(qiáng)。比如對于打斗等高強(qiáng)度動(dòng)態(tài)場景,簡潔的提示詞便可理解。對于復(fù)雜提示詞,鏡頭編排穩(wěn)定性增強(qiáng),可高質(zhì)量完成多場景、多角色的連貫演繹。
![]()
1.1版本還在視覺質(zhì)感和音頻上做了專項(xiàng)優(yōu)化。此前用戶反饋集中的“油光感”“過度銳化”等問題得到顯著緩解,保留了痘印、法令紋、毛孔等細(xì)節(jié)的真實(shí)感,可滿足短劇、廣告等對畫面質(zhì)感要求高的場景。臺詞表達(dá)更加自然,語速、停頓、語氣能夠根據(jù)場景與情緒變化動(dòng)態(tài)調(diào)整。用戶亦可在提示詞中描述背景、環(huán)境音效等。
在技術(shù)規(guī)格上,HappyHorse 1.1與1.0版本一致,單次生成時(shí)長3到15秒,支持720p和1080p分辨率和自由寬高比。自發(fā)布以來,該模型已服務(wù)覆蓋短劇制作、電商廣告、品牌營銷、游戲CG等內(nèi)容生產(chǎn)場景,模型能力仍在不斷迭代升級。HappyHorse官網(wǎng)(https://www.happyhorse.cn/)、阿里云百煉(https://bailian.console.aliyun.com/)和千問云(https://www.qianwenai.com/)已接入最新版本。
即日起,HappyHorse聯(lián)合虎鯨文娛集團(tuán)舉辦“Horsepower”AI影像大賽,優(yōu)勝者將獲百萬商單合作,由著名導(dǎo)演、制片人張紀(jì)中等擔(dān)任評委,誠邀海內(nèi)外AIGC創(chuàng)作者加入,用戶可在HappyHorse官網(wǎng)報(bào)名。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.