![]()
文章轉(zhuǎn)載于字母AI
4月以來,視頻模型重新成為AI行業(yè)里最擁擠的賽道之一。
先是月初,阿里的HappyHorse-1.0登頂Artificial Analysis視頻競(jìng)技場(chǎng)榜單,在無音頻文生視頻榜單中拿到1368的Elo分,力壓Seedance 2.0和可靈3.0。
隨后,總部位于美國(guó)的fal.AI上線HappyHorse-1.0官方API。fal主要為開發(fā)者和企業(yè)提供圖像、視頻、語(yǔ)音等生成模型的API調(diào)用和推理服務(wù),此前已接入可靈、海螺等視頻模型。
![]()
同一時(shí)間,視頻模型創(chuàng)業(yè)公司開始密集釋放資本信號(hào)。生數(shù)科技和愛詩(shī)科技在斬獲兩筆融資后,先后傳出考慮赴港上市的消息。
而隨著阿里正式入場(chǎng),巨頭廠商間的競(jìng)爭(zhēng)格局愈發(fā)激烈。
快手的可靈,是業(yè)內(nèi)最早跑出規(guī)模商業(yè)化的樣本,可靈2025年12月單月收入超過2000萬(wàn)美元;另一邊,字節(jié)年初憑借Seedance 2.0的驚艷表現(xiàn)不斷做大聲量。
國(guó)產(chǎn)視頻模型風(fēng)生水起的幾個(gè)月中,OpenAI則選擇了在本月關(guān)停旗下視頻模型產(chǎn)品 Sora,宣告了視頻模型的上一個(gè)周期結(jié)束,也迎來了國(guó)產(chǎn)視頻模型的加速周期,相關(guān)統(tǒng)計(jì)顯示,今年以來,中國(guó)AI視頻賽道已經(jīng)發(fā)布約10個(gè)模型。
只是,Sora退場(chǎng)也更像一個(gè)提醒:視頻模型最容易制造驚艷,也最容易消耗驚艷。蜂擁而至的國(guó)產(chǎn)廠商們,都將面臨一個(gè)共性問題:技術(shù)層面的差距在毫厘之間,而商業(yè)化層面的競(jìng)爭(zhēng)已經(jīng)進(jìn)入深水區(qū)。
1
巨頭三強(qiáng):有人搶聲量,有人沖榜單
參考Artificial Analysis榜單,國(guó)產(chǎn)視頻模型的頭部由三大巨頭組成:快手可靈、字節(jié)Seedance以及阿里HappyHorse。不過,在榜單上的你追我趕背后,三家公司面對(duì)的是完全不同的考題。
可靈的關(guān)鍵詞是商業(yè)化,在技術(shù)指標(biāo)的打榜之外,可靈最早拿出了相對(duì)清晰的收入賬單。公開報(bào)道顯示,可靈在2025年12月單月收入超過2000萬(wàn)美元,相比2025年3月披露的1億美元年化收入有明顯增長(zhǎng)。
快手方面在此前的財(cái)報(bào)電話會(huì)中透露,截至2026年1月,可靈AI年化收入運(yùn)行率(ARR)已超過3億美元,并透露出今年將實(shí)現(xiàn)收入同比翻倍以上增長(zhǎng)的信心。
在國(guó)產(chǎn)視頻模型已公開的營(yíng)收數(shù)據(jù)中,這一數(shù)據(jù)處于絕對(duì)領(lǐng)跑的地位。同期,可靈服務(wù)超過6000萬(wàn)創(chuàng)作者,累計(jì)生成超過6億條視頻,并與超過3萬(wàn)家企業(yè)用戶建立合作。
可靈在模型側(cè)發(fā)力得很早,自2024年6月開放后,它一直是國(guó)產(chǎn)視頻模型追趕Sora的代表。但進(jìn)入2026年后,兩大競(jìng)爭(zhēng)對(duì)手先后在視頻基模領(lǐng)域給可靈“上強(qiáng)度”。
Artificial Analysis最新榜單顯示,在無音頻文生視頻榜單中,Kling 3.0 1080p Pro排在第三,前面是阿里和字節(jié)的HappyHorse 1.0和Seedance 2.0。
值得注意的是,主導(dǎo)HappyHorse的核心人物張迪,此前正是可靈的技術(shù)負(fù)責(zé)人。
不過,只看榜單跑分,Seedance 2.0、HappyHorse和可靈3.0的差距并不大,真正的差距體現(xiàn)在,阿里和字節(jié)不約而同地下場(chǎng)開始爭(zhēng)搶用戶聲量。
Seedance 2.0的關(guān)鍵詞就是“出圈”。
該模型發(fā)布后不久,一段由愛爾蘭導(dǎo)演Ruairi Robinson用Seedance 2.0生成的“湯姆·克魯斯與布拉德·皮特”視頻在社交平臺(tái)傳播,其中一條播放量超過140萬(wàn),另一條超過300萬(wàn)。
甚至馬斯克都曾在X上評(píng)論Seedance 2.0視頻:“這一切發(fā)生得太快了。”
Seedance 2.0在國(guó)內(nèi)的出圈,也被“雪山救狐貍”帶起。這條由貴州一家醬板鴨品牌四人團(tuán)隊(duì)制作的AI短片,耗時(shí)約5小時(shí)、花費(fèi)40元,全網(wǎng)傳播量突破50億。
相關(guān)報(bào)道顯示,主創(chuàng)先用豆包拆腳本,再用小云雀和即夢(mèng)生成畫面,即夢(mèng)的Seedance系列就是主要模型之一。
與此同時(shí),字節(jié)也在主動(dòng)推動(dòng)Seedance 2.0的行業(yè)心智:賈樟柯?lián)伪O(jiān)制的春節(jié)賀歲短片《賈科長(zhǎng)Dance》由Seedance 2.0生成,火山引擎總裁譚待還透露,Seedance 2.0在正式推出前已參與央視春晚多個(gè)節(jié)目的視覺制作,春晚是它的第一個(gè)客戶。
![]()
顯然,視頻領(lǐng)域的優(yōu)勢(shì)不只是模型本身。字節(jié)在視頻生產(chǎn)鏈路上擁有其他公司很難復(fù)制的入口:即夢(mèng)面向創(chuàng)作者,剪映承接剪輯需求,還有抖音這樣的巨量?jī)?nèi)容池,企業(yè)側(cè)由火山引擎承接企業(yè)調(diào)用。
所以,一旦Seedance開始收割用戶聲量,依托字節(jié)的資源可能比可靈更快收割C端創(chuàng)作者心智。
不過,用戶聲量的擴(kuò)張,并不完全能代表商業(yè)層面的勝利。一方面,字節(jié)目前沒有披露類似可靈那樣清晰的ARR口徑。在專業(yè)級(jí)用戶的市場(chǎng)中,究竟與可靈的市場(chǎng)份額占比如何,仍是未知。
其次,Seedance 2.0的出圈,直接在正面撞上版權(quán)和肖像問題。美國(guó)電影協(xié)會(huì)、演員工會(huì)等好萊塢組織批評(píng)Seedance 2.0涉嫌大規(guī)模未經(jīng)授權(quán)使用版權(quán)作品和演員肖像,隨后,字節(jié)方面因好萊塢版權(quán)爭(zhēng)議暫停了Seedance 2.0的全球發(fā)布。
而當(dāng)Seedance還在和版權(quán)問題作斗爭(zhēng)的時(shí)候,阿里帶著HappyHorse搶走了它榜單第一的位置。
事實(shí)上,HappyHorse-1.0是在無音頻文生視頻榜單中排第一,Elo分達(dá)到1368;而在圖生視頻有音頻榜單中,Seedance 2.0 720p仍然排第一,HappyHorse-1.0排第二。
這個(gè)原本屬于淘天旗下的多模態(tài)團(tuán)隊(duì),迅速成為了阿里在多模態(tài)領(lǐng)域的金字招牌。
不過,HappyHorse目前證明的是理論上的技術(shù)沖擊力,而兩大競(jìng)爭(zhēng)對(duì)手可靈和Seedance/即夢(mèng),都已經(jīng)形成了真實(shí)用戶體量的護(hù)城河。
事實(shí)上,Artificial Analysis的榜單會(huì)每日動(dòng)態(tài)更新,盲測(cè)偏好一定程度上能反映輸出質(zhì)量,但不能替代具體業(yè)務(wù)場(chǎng)景里的成本、速度、穩(wěn)定性和合規(guī)測(cè)試。
騰訊云開發(fā)者社區(qū)中,有行業(yè)人士橫評(píng)了這三大模型:HappyHorse-1.0在多鏡頭測(cè)試?yán)铮?1個(gè)視覺錨點(diǎn)中保持了9個(gè),人物連續(xù)性強(qiáng)于Seedance 2.0;音畫同步測(cè)試?yán)铮暜嬔舆t控制在80毫秒內(nèi),優(yōu)于可靈3.0的120毫秒。
然而,是物理擬真和復(fù)雜規(guī)律成為了HappyHorse的短板。水杯碎裂測(cè)試要求模型在5秒內(nèi)模擬碰撞、流體、玻璃裂紋等6種物理現(xiàn)象,HappyHorse出現(xiàn)網(wǎng)球未接觸杯體、杯子已反向傾倒,水體穿模、裂紋擴(kuò)散生硬等問題。
價(jià)格比對(duì)中,它的720P折后價(jià)約0.44元/秒,低于Seedance 2.0的1元/秒和可靈3.0的0.48—0.96元/秒。
再往后看,阿里與快手、字節(jié)的差異也很明顯。快手有短視頻社區(qū),字節(jié)有全球化視頻工具和分發(fā)平臺(tái),而阿里沒有天然的內(nèi)容社區(qū)。
HappyHorse更可能進(jìn)入的是阿里云百煉、千問、電商營(yíng)銷、商家素材、品牌廣告和企業(yè)內(nèi)容生產(chǎn),短時(shí)間內(nèi)還不會(huì)和即夢(mèng)、可靈正面廝殺。
而在一線AI大廠中,百度和騰訊今年以來都沒有更新視頻模型品類。兩家公司最近一次較明確的視頻模型版本發(fā)布,仍停留在去年10月至11月。
顯然,在視頻模型第一梯隊(duì)中,至少在整個(gè)2026上半年,都將是阿里、字節(jié)、快手的三強(qiáng)格局。
1
第二梯隊(duì):上市、融資和路線分化
巨頭之外,第二梯隊(duì)正在分化,首先來關(guān)注瞄準(zhǔn)了IPO的兩家創(chuàng)業(yè)公司,生數(shù)科技和愛詩(shī)科技。
4月,生數(shù)科技完成20億元人民幣B輪融資,由阿里云領(lǐng)投。
產(chǎn)品上,Vidu仍是生數(shù)最重要的抓手。Vidu Q2曾重點(diǎn)推出Reference-to-Video能力,允許用戶上傳最多7張參考圖,用人物、物體、場(chǎng)景或道具作為約束,生成更一致的視頻。
生數(shù)另一張牌是“世界模型”。它的路線更接近視頻基座世界模型——通過海量視頻學(xué)習(xí)時(shí)間、空間、運(yùn)動(dòng)與因果規(guī)律,再延展到機(jī)器人動(dòng)作模型,而不是純3D空間重建路線。
另一邊,愛詩(shī)科技PixVerse是一家面向全球創(chuàng)作者的視頻生成平臺(tái),目前也傳出考慮最快今年赴港上市,并已與中金、摩根大通等投行合作。最新融資信息顯示,愛詩(shī)今年完成3億美元C輪融資,估值超過10億美元。
營(yíng)收方面,愛詩(shī)科技ARR約4000萬(wàn)美元,生數(shù)科技公開可查口徑約2000萬(wàn)美元,距離支撐十億至二十億美元級(jí)估值,仍需要更強(qiáng)的收入增長(zhǎng)、成本控制和企業(yè)級(jí)復(fù)購(gòu)證明。
如果進(jìn)一步比較,愛詩(shī)更像是“C端規(guī)模先跑出來”的公司,靠PixVerse和拍我AI獲得用戶與訂閱收入;生數(shù)更像是“技術(shù)與模型敘事更強(qiáng)”的公司,背靠清華團(tuán)隊(duì)、U-ViT架構(gòu)和Vidu的行業(yè)能力。
但兩者共同的問題是,AI視頻生成尚未進(jìn)入穩(wěn)定盈利期,巨頭競(jìng)爭(zhēng)、算力成本、版權(quán)合規(guī)和用戶留存,都可能成為IPO審核和二級(jí)市場(chǎng)定價(jià)時(shí)的核心阻礙。
兩家創(chuàng)業(yè)公司之外,另一家值得關(guān)注的視頻模型廠商,是曾經(jīng)“六小龍”中的代表人物MiniMax。
MiniMax旗下的海螺曾經(jīng)是上一輪國(guó)產(chǎn)視頻模型熱潮里的代表產(chǎn)品,而MiniMax也是六小龍中少數(shù)堅(jiān)持視頻模型產(chǎn)品線代表。
但到了2026年,海螺的行業(yè)存在感明顯不如去年。海螺的上一次模型更新,還是發(fā)布于2025年10月的Hailuo 2.3和2.3 Fast,主要提升身體動(dòng)作、面部表情、物理真實(shí)感和提示詞遵循。
走全球化路線的海螺,同樣面臨著版權(quán)問題。此前有報(bào)道稱,迪士尼、環(huán)球、華納兄弟探索在美國(guó)起訴MiniMax,指控其Hailuo AI使用被盜知識(shí)產(chǎn)權(quán),并能生成《星球大戰(zhàn)》達(dá)斯·維達(dá)、小黃人、神奇女俠等版權(quán)角色。
另一匹“黑馬”來自昆侖萬(wàn)維。3月發(fā)布的SkyReels V4沖進(jìn)Artificial Analysis無音頻文生視頻榜單前列,一度排到第四。昆侖萬(wàn)維方面此前披露,SkyReels V4目前已全面開放API。
但它的差異在于,昆侖本身有短劇和海外內(nèi)容業(yè)務(wù),SkyReels仍是優(yōu)先進(jìn)入自家短劇、廣告、游戲等生產(chǎn)鏈路,承擔(dān)降本工具角色。這是這部分內(nèi)部效率,能否折算成有效的商業(yè)化收入仍是未知。
第二梯隊(duì)的共同處境正在變得清楚:每家公司都有出口,但每個(gè)出口都不寬。
視頻模型領(lǐng)域和AI Coding不同,缺少平臺(tái)優(yōu)勢(shì)的廠商,只講基座模型的故事是不夠的。生數(shù)擁抱世界模型概念,愛詩(shī)講全球化創(chuàng)作工具,MiniMax專注于在Agentic模型上賺錢,而昆侖萬(wàn)維優(yōu)先賦能自家的短劇業(yè)務(wù)。
顯然,對(duì)于創(chuàng)業(yè)/腰部公司而言,視頻模型的問題不只在于技術(shù)領(lǐng)先程度,更在于ROI的困境。
1
Sora退場(chǎng)后,視頻模型的ROI困境
Sora退場(chǎng),是今年視頻模型行業(yè)最重要的警示。
OpenAI方面在幾天前,正式關(guān)停了Sora,而Sora API將于9月24日停止服務(wù)。
這一舉措十分突然,有報(bào)道披露,OpenAI的動(dòng)作讓迪士尼等合作方感到意外,也意味著雙方一項(xiàng)擬議中的10億美元合作告吹;報(bào)道還提到,OpenAI正把重點(diǎn)轉(zhuǎn)向更有盈利潛力的編碼工具和企業(yè)解決方案。
這件事直接揭露的當(dāng)下的視頻模型困境,技術(shù)突飛猛進(jìn),但是商業(yè)化難題一直在臺(tái)面上。
首先面臨的第一道坎就是成本。
視頻生成不是“一句提示詞換一段成片”。它背后是多幀生成、時(shí)序一致性、高分辨率、音畫同步、失敗重試和后期篩選。用戶最后看到的是一條8秒、10秒、15秒的片段,平臺(tái)承擔(dān)的是大量候選結(jié)果和算力消耗。
AI應(yīng)用開發(fā)平臺(tái)MindStudio,在一篇行業(yè)博客中把Sora的失敗歸結(jié)為“推理墻”:文章稱,Sora關(guān)閉前每天推理成本約1500萬(wàn)美元,而生命周期收入約210萬(wàn)美元。
這對(duì)國(guó)產(chǎn)模型同樣成立,盡管國(guó)內(nèi)市場(chǎng)的版權(quán)壓力相對(duì)較小,但定價(jià)和營(yíng)收始終是一門玄學(xué)。
以Seedance為例,Sora退場(chǎng)后,Seedance 2.0一度被視為中國(guó)視頻模型市場(chǎng)最強(qiáng)的挑戰(zhàn)者,但字節(jié)隨后在一個(gè)月內(nèi)多次上調(diào)即夢(mèng)價(jià)格:高級(jí)版年費(fèi)從2599元漲到3099元,不同套餐的月度額度被削減三分之一到一半以上。
這意味著,一段2分鐘AI漫劇的素材生成成本,從7元漲到約80元。
![]()
漲價(jià)背后是算力賬。文章稱,一個(gè)15秒視頻大約消耗30萬(wàn)token;按照火山引擎3月公布的Seedance API價(jià)格,視頻輸入模式為每百萬(wàn)token 28元,無視頻輸入模式為每百萬(wàn)token 46元,折算下來,一段15秒視頻約15元,約合1元/秒。
巨額的算力消耗背后,是模型廠商難以平衡營(yíng)收和服務(wù)質(zhì)量的現(xiàn)狀。
有針對(duì)即夢(mèng)的相關(guān)分析顯示,即使是高級(jí)會(huì)員用戶,排隊(duì)時(shí)間仍然超過3小時(shí)。普通用戶有時(shí)需要排在8萬(wàn)人后面等待。只有簽訂合作協(xié)議的大型制作公司才能使用Seedance的完整功能,無需排隊(duì)。
根據(jù)界面等媒體報(bào)道,想要使用Seedance 2.0的逼真人類視頻模式,則需要單獨(dú)簽訂企業(yè)協(xié)議,且最低消費(fèi)額為500萬(wàn)元人民幣。
另一方面,版權(quán)問題仍是視頻模型領(lǐng)域的攔路虎,甚至不止在好萊塢,國(guó)內(nèi)市場(chǎng)也是如此。
幾天前,愛奇藝在世界大會(huì)上稱,已有100多名深度合作藝人同意入駐納逗Pro藝人庫(kù),引發(fā)輿論爭(zhēng)議;隨后于和偉、張若昀、王楚然等多位藝人或團(tuán)隊(duì)否認(rèn)簽署AI相關(guān)授權(quán)文件。
愛奇藝回應(yīng)稱,入駐藝人庫(kù)只代表有接洽AI影視項(xiàng)目的意愿,是否參加具體項(xiàng)目、出演具體角色,仍需單獨(dú)商談和授權(quán)。
這件事更能說明視頻模型商業(yè)化的麻煩:不是平臺(tái)給了授權(quán),問題就解決了。
證券時(shí)報(bào)在后續(xù)報(bào)道提到,愛奇藝、Seedance和即夢(mèng)等平臺(tái)都在探索明星人臉授權(quán)模式,但有法律界人士表示了擔(dān)憂,平臺(tái)服務(wù)協(xié)議和創(chuàng)作者協(xié)議疊加后,可能讓藝人難以控制自己的AI形象后續(xù)被用到哪里。
人臉既是商業(yè)素材,也是生物識(shí)別信息;一旦進(jìn)入短劇、廣告、互動(dòng)視頻和虛擬直播,授權(quán)邊界、使用次數(shù)、二次創(chuàng)作、收益分配和撤回機(jī)制都會(huì)變成新問題。
這些問題總結(jié)下來,還是回歸到老生常談的ROI問題。
麥肯錫在2026年關(guān)于影視制作和AI的報(bào)告中提到,AI可能改變內(nèi)容生產(chǎn)方式和行業(yè)價(jià)值鏈,但它帶來的結(jié)果不只是一種:可能壓低成本、擴(kuò)大內(nèi)容供給,也可能重塑價(jià)值分配。
德勤在2026年TMT預(yù)測(cè)中也提醒,AI的承諾和現(xiàn)實(shí)價(jià)值之間仍存在差距,真正的規(guī)模化來自推理計(jì)算、智能體編排和運(yùn)營(yíng)收益等后臺(tái)能力的持續(xù)改善。
這句話放到視頻模型上尤其現(xiàn)實(shí)。尤其在Sora退場(chǎng)之后,視頻模型行業(yè)的標(biāo)準(zhǔn)變了。
最會(huì)做演示的模型,不一定活得最好;最會(huì)沖榜的模型,也不一定最能賺錢。
真正能穿越周期的公司,必須把生成能力接進(jìn)生產(chǎn)鏈路,壓低真實(shí)交付成本,處理版權(quán)合規(guī),并讓客戶算清ROI。
視頻模型當(dāng)然還會(huì)繼續(xù)進(jìn)步。它的上限仍然很高,尤其是在廣告、電商、短劇、游戲、影視預(yù)演和社交內(nèi)容生產(chǎn)里。但2026年的問題已經(jīng)不再是“誰(shuí)能生成一段更像電影的視頻”,而是“如何給客戶提供能持續(xù)產(chǎn)生營(yíng)收的服務(wù)”。
經(jīng)歷了轟轟烈烈的跑分競(jìng)賽之后,視頻模型正在跑進(jìn)深水區(qū)。
點(diǎn)個(gè)“愛心”,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.