![]()
「建議出 480P」
從來沒聊過可靈。
可靈給我的感覺,就像是老家那個縣城刀槍炮同學。你對他只有個模糊的印象,知道他在特定場合很有能量,但平時辦事也想不起來找他。
Be like:對的,我不像即夢一樣做社交,我不像xx一樣刷榜單,我只是專注服務專業創作者做專業視頻的三專視頻大模型一枚呀。你們普通用戶對我沒印象也正常的。
先前他們宣傳的就是物理模擬、電影質感、長視頻,反正就是暗示你,用別人家模型玩玩還行,真想做個正經片子還得找可靈。最近他們又上線了原生4K功能,可以說是繼續朝著壟斷商業化AI視頻制作的方向顯化中。
最近可靈又小火了一把,說是老外天天沉迷用它做什么韓女球場觀賽視頻,逼真程度又趕超英美了。
去他們首頁看了一眼 ,哦,原來是上了個模板。
![]()
無論如何,我們決定測一下,看看哥們到底是自信還是自嗨。
說到快手,眾網友的一大遺憾就是:早年間那些被稱為殘酷底層物語的瘋狂狠活,由于誕生在高清手機和5G技術都沒普及的年代,所以實在是分辨率過低沒法細看。
480p的鞭炮炸襠只能聽個響,高糊褪色的老八吃翔也難辨真假。說實話,誰不想身臨其境這些狠活發生的現場,親自感受殘酷底層物語的力量?
所以我決定配合可靈新出的4K直出功能,把之前刀哥虎哥之流在快手上發布的經典作品進行1:1還原復刻,帶大家重返那段放蕩不羈的日子。
首先是經典中的經典,猛虎過江。
具體指:只露出一個頭的虎哥被包在麻袋里,身邊的徒弟狠狠踹一腳,虎哥就縱身入江,不見蹤影。據傳后來是被下游洗菜的大姨救起來的。
我上傳了虎哥的一段視頻和音頻,建立了虎哥的主體形象,克隆了他的音色,并根據原視頻輸入了提示詞。
![]()
哦對,為了致敬當年刀哥虎哥只知道要小心心、一分錢沒掙到的創舉,我特地把場景設計為快手直播間里,讓數字人觀眾送禮物彌補他們原生職場的缺憾。
成品如下:
一開始徒弟打包虎哥的時候,手上動作有點太多,像是抖音小姐姐附體開始跳手勢舞了。
后來走路的時候,也略顯僵硬,總覺得是小鵬機器人外面套了個人皮。
至于麻袋下水的時候,整個物理效果還是不錯的,包括水波、水聲和漣漪,都達到了預期水平。
但最嚴重的問題是,我不是說這是快手直播間嗎?咋把原視頻發給我了?
于是我又用即夢試了試,看看沒法生成直播間的殼子是否是通病。
結果人家能生成出來。不過生成的這些字基本也是亂碼。
除此之外,在上傳同樣一段音頻的前提下,即夢對音色的模擬就是比可靈強。
缺點是即夢老喜歡根據自己的獨立思考加一些音效,比如這個屁聲,完全不知道為什么會出現。
再測第二條,唐老鴨上吊。
顧名思義,虎哥把新收的徒弟唐老鴨吊橋上,然后一腳踹開凳子,唐老鴨開始掙扎,虎哥大喊「雙擊!」
成品如下:
這一輪虎哥說話的節奏更好一點。抽出椅子的動作和唐老鴨腿部晃動的動作也都干凈利落自然。
但是手勢舞問題依然存在:唐老鴨那個手都抖成一團了,我想數數到底有幾根指頭都費勁。
手抖太快了,可能這就是快手。
而且,依舊沒有理會我「在快手直播間里有人刷禮物」的指令。
再用即夢試試:
即夢依舊是成功給這個視頻套上了快手直播間的殼,但也依舊是亂碼橫飛甲骨文遍地。
動作流暢度方面倒是和可靈差不多,優點是沒有手勢舞問題。
但即夢最神的是,發揮了自己的主體性,給虎哥加了個符合人設的臺詞,喊了句什么「殺馬特團長」,然后又說了幾句聽不懂的古神低語。
咋說呢,雖然是挺有意思的,但你作為一個視頻大模型能不能他媽的按照提示詞生成啊?視頻你給我生成好的啊!#嘎子摔杯.jpg
再測最后一個,這次我特意挑了個執行起來非常費勁的狠活,場景和動作上也相對復雜。
我做了一些精簡,把提示詞發給了可靈。
![]()
非全部提示詞
成品如下:
令人驚喜的是,這次終于有點快手直播間的樣子了。
但生成的觀眾評論如黑客帝國里的數字代碼一樣若隱若現,非常后現代。
而且先不論這個鞭炮放得咋樣了,崩完之后直接無痕跡了,地上也沒垃圾虎哥臉也沒黑,這也太環保了。誰發明的進步主義鞭炮?
同樣用即夢做了一版:
不知為何,即夢生成的虎哥和鞭炮都有點像p到背景上的。
而且負責點鞭炮那小子,他手里的煙是從哪變出來的?粗看動作挺行云流水,細看全是魔術。
但這個鞭炮炸完還是有痕跡的,略勝一籌。
后來我又想,是不是可靈已經與這種低端vibe完全切割,所以上面幾條視頻才都讓人心生遺憾?
于是我專門挑了個高端場景高端活動:在金碧輝煌的禮堂里,外資企業家馬斯克舉著手機湊到虎哥身邊求合影。
成品如下:
不知大家有沒有發現,這個視頻里,除了虎哥之外,所有人無論男女都長著馬斯克的臉。
而且左一那位女馬斯克伸出的手,根本看著就不是人類的手啊,看著有點像蜥蜴人的手,非常恐怖。
為表公平,我也嘗試用即夢做了一版,但他們識別出馬斯克之后直接拒絕生成了
![]()
啥意思,馬斯克是人虎哥不是人唄。
我又順勢用可靈和即夢分別做了「東北好果汁」的茅臺風格廣告,并要求廣告中的手做了東北大花布風格的美甲。
成品如下:
見仁見智吧。
測完這五組,我感覺可靈最近最得意的原生4K功能,可能正是它給自己挖的一個大坑。
可靈說得很好聽:
別人家都是先生成1080P再轉4K,算法優化的過程會有誤差會有變化;
我們是全球首個原生4K生成,這視頻在娘胎里的時候每一幀就都是4K的了,所以看起來更高清更保真。
但這一切的前提是你這個視頻模型的生成能力本身沒問題。
如果你本來的水平就是超寫實主義的1:1精品畫作,那換了更精細的筆刷之后,的確會讓人感覺每一個毛孔都在呼吸。
但如果你之前生成出來的就是油畫質感的皮膚、時而四根時而六根的手指和對不上口型的嘴,那畫面更清晰之后,只會讓觀眾覺得更礙眼。
4K其實就是個放大鏡,優點會放大缺點也會放大。
就像下面這兩張圖,要不是4K直出,我都不知道可靈生成的視頻里的背景這么難繃。
![]()
![]()
都快達到世界模型水平了
我甚至建議可靈著手研究480p大模型,直接用快手得天獨厚的站內狠活資源訓練,然后教育一下用戶審美,宣稱在這個聒噪的時代,低信息量的視頻才是好視頻,模糊的AI才是偉大的AI。
這樣就沒人能發現現存的諸多問題了。
不過說到底,可靈畢竟是縣城刀槍炮,確實是有人家無法替代的地方。
我讓馬斯克和虎哥分別出演了某電車和愛馬仕的廣告,看看可靈在電影質感、物理模擬上表現如何。
首先是某電車的:
雖然車輪動起來之后是一團漿糊,車的尾氣也不像現實世界場景。
但是馬斯克行走過程中,車身上光照和反射的變化都很真實。
馬斯克坐進車里時,座位、方向盤、車門的運動也都很自然。
還可以吧。
然后是愛馬仕的:
這條還是正經可以的。雖然口型沒對上,但運鏡很絲滑,衣物的擺動很符合物理,Birkin上的細微紋理也都很清晰,五金扣上也有流暢的光影變化。
而且雖然是虎哥出演,在他開口說臺詞之前,還是有一些高級感。建議愛馬仕后臺聯系購入這條片子作為產品宣發廣告。
你看,通過這兩條片子也能看出,在涉及靜物的場景可靈的4K是個加分項。
但只要畫面里有人或其他運動物體,就有點完了。
或許這就是可靈之后的路線吧,高清生成4K生成,但就專注生成一些動不了的東西。
畢竟之前在整活上吃過虧了,以后就只整死的。
(本文封面由可靈生成,純人工寫作)
最后,還有誰沒有報名我們的網吧黑客松嗎!
目前的獎池已經開到了一臺Switch、兩臺索尼1000XM6、價值一萬塊的Kimi會員,現場更有吃不完的康師傅泡面。不來血虧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.