【CNMO科技消息】4月15日,權(quán)威AI模型評(píng)測(cè)平臺(tái)LM Arena公布最新Video Edit(視頻編輯)方向排行榜。阿里巴巴ATH事業(yè)群旗下模型HappyHorse-1.0以1299分的Elo評(píng)分位列榜首,超越xAI的Grok Imagine Video(1257分),成為該榜單該方向首個(gè)由中國(guó)團(tuán)隊(duì)獲得的第一。
![]()
阿里巴巴
LM Arena是全球AI社區(qū)公認(rèn)的權(quán)威盲測(cè)評(píng)估平臺(tái),采用匿名對(duì)比投票機(jī)制,由用戶在不知道模型歸屬的前提下進(jìn)行偏好投票,并通過(guò)Elo評(píng)分體系生成排名。此次上榜的HappyHorse-1.0隸屬阿里巴巴ATH(Alibaba Token Hub)事業(yè)群,組織代號(hào)為Alibaba-ATH。
![]()
HappyHorse
據(jù)悉,HappyHorse-1.0采用150億參數(shù)的40層單流自注意力Transformer架構(gòu),實(shí)現(xiàn)了原生音視頻同步生成。與主流視頻生成模型“先出無(wú)聲視頻、后配樂(lè)對(duì)口型”的多工序流程不同,該模型將視頻和音頻的生成合并進(jìn)一個(gè)流程,一次前向推理直接輸出帶聲音的成片,無(wú)需任何后期拼接。同時(shí),模型原生支持英語(yǔ)、普通話、粵語(yǔ)、日語(yǔ)、韓語(yǔ)、德語(yǔ)和法語(yǔ)七種語(yǔ)言的唇形同步。
CNMO注意到,這并非HappyHorse首次在權(quán)威盲測(cè)中登頂。此前,HappyHorse系列模型已在Artificial Analysis的Video Arena榜單中以匿名身份登頂文生視頻和圖生視頻雙賽道,超越字節(jié)跳動(dòng)Seedance 2.0、快手可靈3.0、Google Veo 3 Fast等國(guó)內(nèi)外頭部模型。在該平臺(tái)的文本轉(zhuǎn)視頻(無(wú)音頻)賽道中,HappyHorse跑出1409分的高分,刷新該榜歷史紀(jì)錄,領(lǐng)先第二名字節(jié)跳動(dòng)Seedance 2.0約110分;在圖像轉(zhuǎn)視頻(無(wú)音頻)賽道中,領(lǐng)先第二名48分。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.