![]()
機(jī)器之心編輯部
先給大家看個(gè)視頻,你能分辨出哪個(gè)是 AI 生成的嗎?
視頻來(lái)源:tiktok 博主 @tkp..1001
「真人拍攝還是 AI 生成」,如果擱一年前,這個(gè)問(wèn)題還很容易回答,因?yàn)榧?xì)節(jié)處總有一眼 AI 的破綻,但現(xiàn)在,真與假的界限已變得愈發(fā)模糊。
越來(lái)越多「真實(shí)」的視頻,評(píng)論區(qū)里都在爭(zhēng)論「這是 AI 吧?」而那些真正由 AI 生成的內(nèi)容,反倒被當(dāng)成真實(shí)拍攝。
![]()
AI 視頻生成技術(shù)的進(jìn)化速度快到飛起,并正滲透進(jìn)我們生活的方方面面。隨之而來(lái)的問(wèn)題是:我們究竟要如何與這些技術(shù)共處?
破解這一難題的鑰匙或許就藏在人類的想象力中。技術(shù)的超越不該只在于對(duì)現(xiàn)實(shí)的復(fù)刻,更應(yīng)在創(chuàng)新應(yīng)用中想象更美好的未來(lái)。
站在這個(gè)視角,阿里云給出了一個(gè)頗具想象力的答案:2026 年米蘭冬奧會(huì)。
就在冬奧會(huì)倒計(jì)時(shí) 30 天之際,作為官方云服務(wù)合作伙伴的阿里云,拉著國(guó)際奧委會(huì)以及?蘭冬奧組委會(huì)搞了波大的,共同發(fā)起一場(chǎng)全球 AIGC ?賽
![]()
![]()
![]()
大賽 Slogan 為「YOUR EPIC VIBE」,正好與本屆冬奧口號(hào)「IT's Your Vibe」(意展你風(fēng)采)遙相呼應(yīng)。
大賽規(guī)則簡(jiǎn)單粗暴:只需用阿里云的「萬(wàn)相大模型」,在花樣滑冰、短道速滑、高山滑雪、單板滑雪經(jīng)典項(xiàng)目中選一個(gè),生成一段冬奧視頻,就能參賽。
除了萬(wàn)相大模型本身,阿里巴巴的 AI 產(chǎn)品生態(tài)同樣為本次大賽提供了全棧式支持,包括開源開放的開發(fā)者社區(qū) Modelscope、AI 創(chuàng)作工具通義萬(wàn)相、堆友,為不同類型、不同渠道的參賽者「保駕護(hù)航」。
國(guó)際奧委會(huì)還直接放話,他們將從這四個(gè)項(xiàng)目中各選 25 個(gè)最佳作品,納入奧林匹克博物館收藏,并組合成奧運(yùn)史上首個(gè) AIGC 數(shù)字藝術(shù)影像作品集《YOUR EPIC VIBE》。
這意味著,自 1896 年現(xiàn)代奧運(yùn)首次舉辦以來(lái),AI 第一次以這種方式被寫進(jìn)奧運(yùn)歷史。
更刺激的是,Top 100 中將評(píng)選出 10 位在敘事創(chuàng)意、情感深度和美學(xué)構(gòu)圖上表現(xiàn)最好的獲獎(jiǎng)?wù)撸麄冞€能直接拿到米蘭冬奧會(huì)現(xiàn)場(chǎng)門票。
大賽官網(wǎng):https://summit.aliyun.com/aigcchampionship
AI 視頻生成技術(shù)卷到現(xiàn)在,終于不只是在社交媒體上刷存在感了。它正以一種誰(shuí)也沒(méi)想到的方式,成為奧運(yùn)歷史的一部分。
而要達(dá)成這一成就,萬(wàn)相 Wan2.6 憑借其強(qiáng)悍的視頻生成能力,化作了參賽者手中最強(qiáng)的那把利器。
用 AI 創(chuàng)造冰雪世界,為何獨(dú)獨(dú)選擇了阿里云?
在去年 12 月 AI 視頻生成大模型又一波涌現(xiàn)的大潮中,阿里云的 Wan2.6 登場(chǎng)。
![]()
Wan2.6 面向?qū)I(yè)級(jí)影視制作和圖像創(chuàng)作場(chǎng)景,進(jìn)一步提升了畫質(zhì)、音效、指令遵循能力,并新支持多鏡頭敘事及最長(zhǎng) 15 秒生成。此外在國(guó)內(nèi)首次支持角色扮演(Reference-to-video,R2V)功能,本人可以入鏡,并用自己的聲音出演 AI 視頻。
![]()
體驗(yàn)地址:https://tongyi.aliyun.com/wan/
對(duì)于此次冬奧賽場(chǎng)上的四大經(jīng)典冰雪項(xiàng)目,Wan2.6 表現(xiàn)出了極高的可玩性。
我們上手測(cè)試的結(jié)果說(shuō)明了這一點(diǎn)。
只見(jiàn)一只可愛(ài)的雪人從高山之巔快速下滑,身后拉出一條清晰而綿長(zhǎng)的雪線,紅色帽子在疾馳中隨風(fēng)搖擺,看起來(lái)十分的童趣。如果我不告訴你這是 AI 生成的,可能你還以為這是哪部動(dòng)畫片中的場(chǎng)景呢!
![]()
毛茸茸的怪獸在高山之巔飛速直下,雙腳踩著雪板完成流暢的滑雪動(dòng)作,身體隨著地形起伏自然擺動(dòng)。
![]()
小王子也來(lái)雪山之巔滑雪了,身披圍巾、腳踏雪板,仿佛開啟了一段屬于自己的冰雪冒險(xiǎn),純真而浪漫。
![]()
穿越千年的兵馬俑也獻(xiàn)上一段花滑表演:
![]()
除了文生視頻、圖生視頻,現(xiàn)在你也可以指定角色來(lái)生成了。Wan2.6 的角色扮演功能,可以將你輸入的參考視頻進(jìn)行二次創(chuàng)作,甚至是你親自上場(chǎng)。
我們先來(lái)「呼叫奧特曼」上場(chǎng)速滑。只見(jiàn)他起滑、加速、入彎一氣呵成,動(dòng)作那叫一個(gè)專業(yè),完全不像是第一次跨界。專業(yè)程度甚至讓人懷疑他是不是偷偷報(bào)過(guò)集訓(xùn)班。
![]()
然后再讓馬斯克來(lái)段花樣滑冰,看起來(lái)也是有模有樣:
![]()
與此同時(shí),Wan2.6 在動(dòng)態(tài)表現(xiàn)和視覺(jué)沖擊力上同樣可圈可點(diǎn)。在這一示例中,鏡頭貼近雪面,緊跟雪板高速前行,低機(jī)位帶來(lái)的速度感與沖擊力被充分放大。
![]()
以前在滑雪場(chǎng),常能看到有人踩著滑板、扛著相機(jī)一路跟拍,冒著不小的風(fēng)險(xiǎn),才能換來(lái)幾個(gè)漂亮鏡頭。現(xiàn)在,這種高難度的跟拍視角已經(jīng)不再依賴人工完成,Wan2.6 可以直接在生成過(guò)程中自動(dòng)實(shí)現(xiàn)穩(wěn)定、貼近動(dòng)作的動(dòng)態(tài)運(yùn)鏡:
![]()
慢鏡頭同樣穩(wěn)得住。高速下滑被自然放慢的那一刻,雪板切雪的力道、雪屑被甩起又在空中翻滾的軌跡一一展開,原本一閃而過(guò)的速度感被拆解成清晰可見(jiàn)的細(xì)節(jié)。這感覺(jué)就像在滑雪場(chǎng)里按下了電影級(jí)慢放鍵。
![]()
就算是高難度的多人場(chǎng)面,Wan2.6 依然能夠穩(wěn)穩(wěn)駕馭。多名滑雪者同時(shí)出現(xiàn)在畫面中,彼此之間的相對(duì)位置、運(yùn)動(dòng)方向與節(jié)奏保持清晰,沒(méi)有出現(xiàn)人物混疊或動(dòng)作錯(cuò)亂。
![]()
通過(guò)上述示例可以看出,Wan2.6 的優(yōu)勢(shì)并不在于某一個(gè)「炸點(diǎn)」,而是在冰雪運(yùn)動(dòng)中「力與美」的呈現(xiàn)上已經(jīng)達(dá)到了相對(duì)成熟的水準(zhǔn)。
在高速運(yùn)動(dòng)、多人互動(dòng)以及音畫同步等關(guān)鍵場(chǎng)景下,Wan2.6 展現(xiàn)出超高的性能。無(wú)論是虛構(gòu)角色還是真人形象,都能夠被自然地融入運(yùn)動(dòng)場(chǎng)景之中,完成連貫而完整的表演,體現(xiàn)出對(duì)運(yùn)動(dòng)節(jié)奏與視覺(jué)敘事的成熟把控。
進(jìn)一步看,這種穩(wěn)定性也體現(xiàn)在鏡頭層面:生成過(guò)程中,鏡頭并非被動(dòng)記錄動(dòng)作,而是會(huì)隨著運(yùn)動(dòng)推進(jìn)自動(dòng)調(diào)整視角,在關(guān)鍵節(jié)點(diǎn)完成切換,使畫面具備基本的分鏡邏輯與節(jié)奏變化,可以說(shuō)是深諳運(yùn)動(dòng)力學(xué)與視覺(jué)美學(xué)的「數(shù)字導(dǎo)演」。
視頻生成的多面手,Wan2.6 背后藏著這些「殺手锏」
長(zhǎng)期以來(lái),視頻生成被認(rèn)為是 AI 領(lǐng)域最難攻克的堡壘之一。不過(guò)從 OpenAI Sora 開啟視頻「暴力美學(xué)」開始,這個(gè)領(lǐng)域在各個(gè)環(huán)節(jié)進(jìn)入到了進(jìn)化的快車道。
一開始大家追求的目標(biāo)很簡(jiǎn)單,讓畫面動(dòng)起來(lái);后來(lái)一步步加碼,提出了更多更高的要求,比如對(duì)復(fù)雜物理規(guī)律的極致模擬、影視級(jí)高清畫質(zhì)、原生音畫同步、畫面連貫與邏輯統(tǒng)一,最終目標(biāo)是無(wú)限接近真實(shí)視頻。
如今,升級(jí)到 2.6 版本的萬(wàn)相大模型已修煉得「爐火純青」。
首先做到了超真實(shí)還原。實(shí)現(xiàn)這一點(diǎn)需要解決幾個(gè)深層次的技術(shù)挑戰(zhàn),包括物理規(guī)律的準(zhǔn)確模擬、時(shí)序一致性、細(xì)節(jié)高度還原、原生音視頻的邏輯一致等。
Wan2.6 提供了音畫?體的多模態(tài)參考?成能?,通過(guò)對(duì)輸?參考視頻進(jìn)?多模態(tài)聯(lián)合建模與學(xué)習(xí),最終實(shí)現(xiàn)從畫面到聲音的全感官一致性保持與遷移。這種「鏡像級(jí)人物重建」可以精準(zhǔn)捕捉并重建你的形象,就連每個(gè)微表情都生動(dòng)至極。
其次能輸出銜接連貫的多鏡頭。視頻生成中精準(zhǔn)的分鏡控制,要求 AI 不僅要生成連貫的畫面,還要像人類導(dǎo)演一樣理解空間調(diào)度、鏡頭切換和敘事連續(xù)性。
Wan2.6 可以一鍵完成單人、多人、人與物合拍的視頻,還能自動(dòng)實(shí)現(xiàn)多鏡頭切換。這意味著,視頻生成不再是碎片拼湊,并且不管怎么切鏡頭,視頻里的主體都能保持像素級(jí)的統(tǒng)一,幾乎不會(huì)出現(xiàn)鏡頭一換、主角換臉的尷尬情況。
最后保證敘事完整不偏離主題。生成一段完整的敘事視頻,遠(yuǎn)比幾個(gè)孤立的炫酷鏡頭困難得多,其核心挑戰(zhàn)在于如何讓 AI 具備時(shí)間記憶和邏輯常識(shí)。
Wan2.6 很好地解決了這些挑戰(zhàn),最長(zhǎng)支持 15 秒 1080P 視頻生成,并能輕松搞定完整敘事的 Vlog 視頻。這使得該模型在短劇制作等專業(yè)場(chǎng)景具有廣闊的應(yīng)用前景,只要提示詞寫得好,輸出的視頻可直接拿來(lái)用,省力又省錢。
一系列底層能力的突破,讓 Wan2.6 打破視覺(jué)、聽覺(jué)與物理規(guī)律之間的藩籬,為創(chuàng)作者提供了一個(gè)生產(chǎn)力級(jí)別的視覺(jué)生成引擎。
AI for all,在奧運(yùn)這塊陣地「登陸」
去年 7 月,即將成為 OpenAI 史上首位應(yīng)用 CEO 的 Fidji Simo 發(fā)表了一篇文章,主題為《AI:賦能所有人的終極源泉》(AI as the greatest source of empowerment for all)。這篇刷屏的就職檄文再一次讓「AI 全民可用」成為熱議的焦點(diǎn)。
![]()
文中寫到,「我相信 AI 將為更多人帶來(lái)比歷史上任何其他技術(shù)都多的機(jī)遇。如果我們能做好這一點(diǎn),AI 將給予每個(gè)人前所未有的力量。」但同時(shí),這些機(jī)遇并不會(huì)憑空出現(xiàn),不僅要求 AI 達(dá)到較高的水準(zhǔn),還要有像阿里云這樣勇于創(chuàng)新的 AI 玩家。
現(xiàn)在看來(lái),這場(chǎng)全球 AIGC 大賽成為了「AI for all」的實(shí)踐陣地。
以往,參與奧運(yùn)的方式要么花很多錢去現(xiàn)場(chǎng)觀賽吶喊,要么在電視機(jī)或電腦前守候。如今,AI 終于賦予了每一個(gè)普通人更沉浸的奧運(yùn)體驗(yàn)。
在高山滑道、花滑冰場(chǎng)或單板 U 型場(chǎng),你我同樣可以成為萬(wàn)眾矚目的主角。這正是奧運(yùn)級(jí) AI 科技首次大規(guī)模應(yīng)用于粉絲互動(dòng)所產(chǎn)生的魅力。
正如 Fidji Simo 所強(qiáng)調(diào)的,「如果我們能夠讓智能技術(shù)無(wú)處不在、人人可及,就能驅(qū)動(dòng)人類歷史上最大的機(jī)遇引擎,并幫助更多人過(guò)讓更好的生活」。阿里云掀起的這場(chǎng)以萬(wàn)相大模型為主導(dǎo)的交互范式變革,正以自己的方式一步步將這樣的愿景落地。
文中視頻鏈接:https://mp.weixin.qq.com/s/_iaiwdraikWZGd49O4zocQ
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.