![]()
「狂開歷史倒車」
很多人沒聽過HeyGen。一句話概括:HeyGen公司是平行時空的Manus(視頻Agent版)。
因為HeyGen倆創(chuàng)始人也是華人,也開啟了一場員工大遷徙,不過HeyGen的全球化迄今為止還比較成功,它和中國互聯(lián)網唯一的關系基本只剩下泰勒·斯威夫特說中文的AI病毒視頻。
現(xiàn)在看來可能平平無奇,但在2023年,各個AI視頻產品生成出來的玩意堪比夢話的年代,這條動作流暢口型也對得上的視頻確實把大伙都嚇暈了。
所以后來他們也專注Deepfake賽道,點進他們網站看到清一色全是數(shù)字人產品,除了數(shù)字人基本也不做別的。
現(xiàn)在靠這個業(yè)務,HeyGen的ARR已經超1億美元了。很恐怖。
我試著用了一下,做了一個俄羅斯美女到中國不要彩禮的視頻,交互體驗和成品都還可以。
感覺HeyGen在園區(qū)那邊應該很流行,江西很多老鄉(xiāng)肯定被這軟件害過。
不過今天寫它倒不是因為突然對數(shù)字人心血來潮,是因為HeyGen最近聲稱自己研究出來一個所謂靠寫代碼就能做出視頻的開源視頻產品——HyperFrames。
我尋思寫代碼不是比剪視頻難嗎,要用一個更難的事去完成一個相對簡單的事到底是基于什么思考?
![]()
該產品強調自己是給AI agent用的,即不是給人用的
后來搜了一下,HyperFrames這個“寫代碼做視頻”,是這兩個月新炒作出來的一個概念,叫Vibe Motion。
炒作Vibe Motion的邏輯是:
AI做視頻要靠Diffusion,摸著石頭過河,不僅隨機性大得抽卡,還耗算力;
但是AI是天然會寫前端的,前端又能實現(xiàn)很多動效,所以直接讓AI通過寫Html代碼的方式做動效做視頻;
而且Html代碼和動效的關系是確定性的,改起來非常方便,不用天天在那抽卡了。
很美好的愿景。
其實早在2021年就有一個叫Remotion的開源項目是做這個的,只不過HyperFrames主要是寫Html,Remotion是基于React框架,但這概念是早就有了。
這倆月把這概念翻炒一遍,估計是因為美國著名AI視頻獨角獸Higgsfield(可以理解為美國的TapNow)推了一個叫Higgsfield Vibe Motion的新產品,把人家開源社區(qū)老哥們造福社會的活給商業(yè)化了,看得HeyGen也饞壞了,趕緊跟上了。
![]()
于是我用這些Vibe Motion產品(主要是HyperFrames)做了幾條視頻測了一下。最后發(fā)現(xiàn)他們對自己定位很清晰,確實不是給人用的。
首先,想要使用HyperFrames,你必須有一個現(xiàn)成的AI agent,比如Codex或者Claude Code。(我用的是Claude Code。)
然后按照官網的指示,輸入一系列指令讓你的AI agent自行裝備上HyperFrames的Skill。
![]()
安裝好了之后就可以開始生成視頻了。我試了一下常規(guī)節(jié)目,讓它給豆包生成一個宣傳片。
結果給我嚇一跳。
其實字體、動效和配色還都可以,但是這TTS配音堪比古神低語。
我以為豆包被孫笑川附體了在這倒放說話呢。
問了一下,說是Bug,雖然這個Bug的原因我也沒看懂。
![]()
暫不清楚不能正常使用中文配音是不是HeyGen全球化的另一努力
為了測一下它宣傳的準確性,我批量給它一些指令,發(fā)在Claude Code的對話框里,讓HyperFrames對每個鏡頭都進行了修改。
![]()
并把配音改成了英語。成品如下:
該說不說,確實都是按照要求改的。雖然加的音效都有種應付了事的感覺。
除了和AI agent對話修改視頻之外,HyperFrames還提供了一種修改方式:他們提供了一個Studio,讓你能在上面通過選框的方式修改元素的字體、顏色、大小和動效。
![]()
Studio里還內置了一個Ask agent的功能,可以把視頻中元素的詳細信息打包成一個Prompt,這樣你和AI Agent說需求的時候就更方便。
Studio左側直接就是前端頁面,你要是懂代碼也可以直接上手改。
看起來很美好。但實際上這個Studio極其不穩(wěn)定,改幾下之后就黑屏或報錯,而且都是一些我看不懂的代碼問題。
![]()
我想說的是,我要是能看懂這些,能用你這產品從事生成AI視頻的工作嗎。
后來我又把同樣的需求發(fā)給Remotion和Higgsfield Vibe Motion。
Remotion成品:
Higgsfield Vibe Motion成品:
Remotion的審美好一點,Higgsfield Vibe Motion的操作界面友好一點。但成品都大差不差,根據(jù)我淺薄的前端知識,它們能實現(xiàn)的動效效果也都是互通的。
然后我又想測試一下生成動態(tài)圖表的效果,之前做這種視頻都得去盜版網站下AE模板素材。
于是我讓HyperFrames做一個視頻講解北京房價走勢。
成品如下:
語音和畫面都對得上,統(tǒng)計圖表也動得很順。
不過也不具備任何觀賞價值,就是一個動態(tài)PPT的感覺。
但看著這個視頻我突然理解為什么HeyGen要做Vibe Motion了:
一是因為從0做一個正經的視頻模型成本太高了,做Vibe Motion本質上就是寫一個Skill,也不用訓練,還能填補產品空缺;
二是HeyGen本身就做數(shù)字人業(yè)務,數(shù)字人做口播視頻的時候,無論是講知識科普還是事件分析,背景放個動態(tài)PPT那確實是挺合理的。
于是我把之前的文章《AI圈炒作圣經震撼首發(fā)》發(fā)給Claude,生成出腳本之后用HeyGen生成數(shù)字人,然后再用HyperFrames生成視頻做背景。
聲明:這個視頻右下角我的視頻,動作、語音都是由HeyGen直接生成的,還模擬了我的音色。
感覺這產品很適合俞浩,有了這玩意以后他首頁就不用全是一模一樣的那張臉當封面了。
但其實也不是很適合俞浩,我開的Claude Plus計劃,基本每5小時的算力只夠生成2~3個視頻。5小時夠俞浩開攝像頭錄500個視頻了。
后來我又想,既然是寫html,那理論上講就能畫矢量圖,理論上講就能做簡單的動畫。
于是我用Claude寫了一個詳細的腳本,讓HyperFrames生成一個南方公園風格的山姆狀元故事。主要劇情是:山東開了個山姆,有人搶著當?shù)谝粋€進門的“山姆狀元”,結果發(fā)現(xiàn)其他人都在當天考公去了,這人崩潰了。
![]()
取材于最近發(fā)生的真實事件
成品如下:
其實作為一個純靠Html寫出的視頻,效果已經很好了。
但我們不得不承認的是,當我們把它放到「視頻」這個大類里進行評判,得出的結論就是:這是一坨。
包括之前生成的廣告宣傳片、數(shù)據(jù)新聞短片,他們作為Html動效都是相當合格的,但作為視頻都是沒法上桌的。
其實歸根結底就是,Vibe Motion這一波的各種產品,根本不是市場所需要的視頻Agent產品。
Vibe Motion的開發(fā)者說,我們用AI讓文字動起來了,根據(jù)定義,動起來的影像就是視頻嗎,所以我們是AI視頻。
這不純自嗨嗎?
說到底你去刷刷抖音或者TikTok,有幾個爆火視頻跟你們生成的這玩意有任何相似之處?
換個角度講,誰刷短視頻是為了看你這個html生成的動態(tài)網頁錄屏?
對吧,就像你不能滿世界宣傳自己拍了個電影,最后說其實是拍了段《火車進站》。這是一個道理。
做產品要跟上時代,否則就是開歷史倒車,影響特別壞。
再者,發(fā)明Vibe Motion的邏輯本身就有問題:
由于AI適合寫html,所以我們就用AI通過寫html來做視頻——這根本就不是從用戶需求出發(fā)的,這是從開發(fā)者視角出發(fā)的,屬于純純倒反天罡。
根據(jù)方便而不是好用來選擇開發(fā)路徑,對于產品經理來講實在太輕易了。
按照你們這么思考問題,還不如說因為大語言模型很擅長用文字回答問題,我們應該開發(fā)一個錄制Chatbot對話框的產品。然后由于這其中也有AI成分,所以這也是AI視頻Agent。
很幽默。
最后,作為一個人類,我用各種Vibe Motion產品,尤其是HyperFrames的時候,確實覺得這不是給人類用的。
先不論層出不窮的Bug。在下載軟件、導出視頻等多個場景,我都被要求打開Mac系統(tǒng)的終端輸入代碼來執(zhí)行任務。
然后他還經常用六國語言對我進行代碼知識的科普。
![]()
你們懂技術的人可能司空見慣,但這對我來說真的是心理恐怖般的折磨,讓我回憶起那個跟著網上的攻略部署龍蝦最后導致電腦黑屏死機只能去蘋果店維修的夜晚
HyperFrames就很雞賊,提前說咱們這個產品是給Agent用的,官網也放了一堆代碼,文檔里也全是看不懂的話,感覺中心思想就是小白趕緊滾粗克,我們這里只歡迎底特律變人和極客。
真的,包括HyperFrames在內,現(xiàn)在很多AI產品有點像在Cosplay日本壽司師傅,通過讓學徒入行十年只洗碗蒸飯的方式,把整個用餐體系神秘化,咱們食客也看不懂。問了就顯得我們是土炮,還會被那些懂行的嘲笑。里外里都是我們的錯。
說真的作為AI產品的消費者,我們不應該承受這么多。你們開發(fā)者要是做不出來3歲小孩都能看懂的產品就趕緊把Github賬號注銷回老家種地吧。謝謝??
順便可以訂閱一下是個人就能看懂的葬AI的 funeralai.substack.com
(本文封面由ChatGPT 生成,純人工寫作)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.