亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

卸任米哈游董事長(zhǎng)后,蔡浩宇在新加坡造“活人”

0
分享至

文|硅基星芒

在AI視頻生成領(lǐng)域,Seedance 2.0帶領(lǐng)著全行業(yè)瘋狂內(nèi)卷。

在短短的15秒之內(nèi),只有能給觀眾帶來(lái)電影級(jí)別視覺享受的模型,才有可能在這場(chǎng)行業(yè)競(jìng)爭(zhēng)中脫穎而出。

然而,一位靈魂大法師卻另辟蹊徑,在另一個(gè)維度上研發(fā)出了新的"殺器"。

這個(gè)看起來(lái)十分中二的稱號(hào),其實(shí)屬于米哈游的前任董事長(zhǎng)蔡浩宇。

這位目前仍為米哈游第一大股東的法師,自卸任董事長(zhǎng)職務(wù)后,悄悄在新加坡開辟了一片全新的戰(zhàn)場(chǎng),創(chuàng)立了新的AGI公司Anuttacon。

如今,LPM 1.0這款鉆研許久的最新模型發(fā)布,讓AI視頻成功從離線剪輯跨越到了實(shí)時(shí)的生命體。

更重要的是,這款模型一改往日視頻生成領(lǐng)域只關(guān)注畫面是否好看的習(xí)慣,轉(zhuǎn)而讓虛擬角色在數(shù)個(gè)小時(shí)的交互中真正擁有靈魂。

而技術(shù)的突破,背后往往隱藏著算力、數(shù)據(jù)和商業(yè)壁壘的深層博弈。

AI角色開始呼吸

Seedance 2.0全球稱霸、Sora被OpenAI無(wú)情關(guān)停,這些重磅消息發(fā)出后,AI視頻生成對(duì)于大眾來(lái)說早已不再陌生。

雖然AI生成的視頻已經(jīng)足夠逼真,令人難以分辨,但一個(gè)長(zhǎng)期存在于計(jì)算機(jī)圖形學(xué)和AI視覺領(lǐng)域的困境仍未得到解決:

表現(xiàn)質(zhì)量(像不像)、實(shí)時(shí)推理(能不能秒回)和長(zhǎng)程穩(wěn)定性(時(shí)間長(zhǎng)了會(huì)不會(huì)崩潰)不可兼得,也被稱為"表演三難困境(Performance Trilemma)"。

因此,當(dāng)用戶打開即夢(mèng)、可靈、Sora和Veo時(shí),最先看到的是它們?cè)诙桃曨l領(lǐng)域上堪稱無(wú)敵的表現(xiàn),但之后一旦涉及長(zhǎng)時(shí)間、實(shí)時(shí)等現(xiàn)實(shí)中確切存在的需求,這些模型的弱點(diǎn)瞬間暴露無(wú)遺。

簡(jiǎn)單來(lái)說,它們已經(jīng)是非常優(yōu)秀的攝影師,但還不是合格的表演者。

目前,AI視頻生成的時(shí)間上限通常不超過30秒,主要的原因就在于自回歸漂移。

只要生成時(shí)間被拉長(zhǎng),微小的誤差就會(huì)以遠(yuǎn)超線性的速度累積,最終導(dǎo)致常見的角色臉部特征驟變、身份不一致或動(dòng)作不合理等現(xiàn)象。

但LPM 1.0卻實(shí)現(xiàn)了一個(gè)驚人的突破:它實(shí)現(xiàn)了真正意義上的"無(wú)限時(shí)長(zhǎng)"視頻生成。

在官網(wǎng)上,demo演示了夸張的45分鐘視頻。


這種跨越在技術(shù)層面上堪稱離譜,畢竟單純堆砌算力是無(wú)法從根本上解決這個(gè)問題的。

LPM模型的訣竅,在于引入了在線流式生成架構(gòu)(Online LPM)。

通過一種名為分布匹配蒸餾的四階段訓(xùn)練方式,LPM模型將一個(gè)170億參數(shù)的大型擴(kuò)散模型直接壓縮成了一個(gè)"主干-精煉器"結(jié)構(gòu)。

其中,主干網(wǎng)絡(luò)負(fù)責(zé)穩(wěn)定視頻的粗略軌跡,而精煉器負(fù)責(zé)還原高保真的表情細(xì)節(jié)。

這種設(shè)計(jì)讓模型在內(nèi)存占用恒定的情況下,能夠維持近乎永恒的身份一致性。


當(dāng)然,在人類看來(lái),真正的表演不可能只有"說話",還要在合適的時(shí)機(jī)做出合適的反應(yīng)。

LPM 1.0首次實(shí)現(xiàn)了全雙工的音視頻對(duì)話,能夠同時(shí)處理兩路音頻流。

其中一路是AI自己在說的話,用于驅(qū)動(dòng)口型同步;另一路則是用戶在說的話,用于驅(qū)動(dòng)實(shí)時(shí)反應(yīng)。

如此一來(lái),AI就能根據(jù)用戶的語(yǔ)氣和停頓,像人類一樣產(chǎn)生點(diǎn)頭、挑眉等微表情。

盡管受限于技術(shù)取舍,LPM模型存在畫面不夠真實(shí)、清晰等問題,但這種長(zhǎng)時(shí)間實(shí)時(shí)交互的能力,足以讓虛擬角色從復(fù)讀機(jī)進(jìn)化為數(shù)字化的生命。

"米哈游基因"也是一種大數(shù)據(jù)

說起視頻生成,就不得不提到Seedance 2.0這個(gè)行業(yè)榜樣。

字節(jié)跳動(dòng)TikTok海量短視頻數(shù)據(jù)的喂養(yǎng),正是它成功的關(guān)鍵。

但掌握米哈游41%股權(quán)、身為最大股東的蔡浩宇,能為Anuttacon這家新AGI公司帶來(lái)什么?

米哈游這家知名游戲公司積累的數(shù)據(jù),又能給AI領(lǐng)域提供什么便利?

答案就在于,精度勝過維度,工業(yè)標(biāo)準(zhǔn)勝過原始規(guī)模。

這并非意味著LPM 1.0優(yōu)于Seedance 2.0,更準(zhǔn)確的說法應(yīng)當(dāng)是兩家企業(yè)各自走出了多模態(tài)領(lǐng)域通往精細(xì)化的技術(shù)路線。

相比于字節(jié)擁有充足的高質(zhì)量泛娛樂化、非結(jié)構(gòu)化數(shù)據(jù),米哈游的核心壁壘是將"人類表演學(xué)"進(jìn)行了數(shù)字工業(yè)化的解構(gòu)。

在LPM 1.0的技術(shù)報(bào)告中,被詳細(xì)論述的"身份感知參考圖像管線"完美地體現(xiàn)了米哈游的獨(dú)特基因:

這款模型不僅需要一張照片,還需要全局外觀、多視角圖像甚至是8類預(yù)定義的表情范例。


相比于從海量無(wú)標(biāo)注視頻中提取特征,Anuttacon已經(jīng)能夠提供高度結(jié)構(gòu)化的"表演邏輯"數(shù)據(jù),例如78種精細(xì)情感和超過5000個(gè)動(dòng)作描述符。

這種對(duì)美感和角色塑造的經(jīng)驗(yàn)積累和極高品控標(biāo)準(zhǔn),是坐擁海量數(shù)據(jù)的通用短視頻平臺(tái)反而難以實(shí)現(xiàn)的。

由此看來(lái),蔡浩宇在領(lǐng)英上給自己起的稱號(hào)"靈魂大法師(AI Soulcaster)"并非浪得虛名,其產(chǎn)品開發(fā)邏輯正是要讓AI模擬人類表演中的下意識(shí)反應(yīng)。

LPM在訓(xùn)練階段對(duì)傾聽行為多達(dá)350萬(wàn)次的精細(xì)標(biāo)注,準(zhǔn)確命中了目前AI虛擬角色設(shè)計(jì)的痛點(diǎn):大多數(shù)AI虛擬角色"能說但不會(huì)聽"。

這也是米哈游十幾年的游戲開發(fā)經(jīng)驗(yàn)帶來(lái)的紅利,Anuttacon擁有一套完整的人類交互評(píng)價(jià)體系,能夠讓模型學(xué)會(huì)只有人類才會(huì)的對(duì)話間隙的呼吸、猶豫和停頓。

這種"工業(yè)審美"與"流量數(shù)據(jù)"是完全不同的技術(shù)路線,因此模型表現(xiàn)出來(lái)的結(jié)果也截然不同:

相比于Seedance 2.0栩栩如生的畫面,LPM 1.0在角色表現(xiàn)力方面實(shí)現(xiàn)了電影級(jí)的質(zhì)感,而這種質(zhì)感,同樣是實(shí)現(xiàn)"去AI味"和虛擬世界沉浸感的護(hù)城河。

不開源的商業(yè)必然

在官網(wǎng)的最后,Anuttacon明確表示這款模型不打算開源模型權(quán)重和源代碼,也不會(huì)以API和產(chǎn)品服務(wù)等形式進(jìn)行商業(yè)化盈利。

作為一個(gè)性能足以投入工業(yè)級(jí)生產(chǎn)、甚至足以驅(qū)動(dòng)NPC實(shí)時(shí)交互的模型,LPM 1.0選擇完全不開源是符合商業(yè)理性的必然選擇。

原因也很簡(jiǎn)單,在AI視頻生成的虛擬角色這個(gè)細(xì)分領(lǐng)域,它不僅是一套算法和一個(gè)模型,更是一套完整的視覺引擎。

在當(dāng)前AI的競(jìng)爭(zhēng)格局中,擁有穩(wěn)定、實(shí)時(shí)、長(zhǎng)效生成可交互數(shù)字化角色的能力,無(wú)異于掌握了虛擬世界的唯一門票。

話雖如此,擺在眼前的商業(yè)成本仍然是一個(gè)繞不過去的難題:

實(shí)時(shí)生成480P甚至720P的視頻,對(duì)算力的消耗極其驚人。

LPM雖然經(jīng)過了極致的優(yōu)化能讓單GPU約0.35秒處理1秒的視頻,但在大規(guī)模并發(fā)的實(shí)際應(yīng)用場(chǎng)景下,硬件成本和運(yùn)維壓力巨大。


從C端游戲產(chǎn)品來(lái)看,以高價(jià)值產(chǎn)品支撐高算力支出這一策略的可靠性存疑。

Anuttacon上一款游戲《星之低語(yǔ)》采用買斷制上架steam平臺(tái),這款以AI實(shí)時(shí)交互為核心的創(chuàng)新概念游戲試圖帶給用戶前所未有的情感體驗(yàn)。

不過,根據(jù)反饋,該游戲的對(duì)話仍存在上下文承接問題,市場(chǎng)廣泛認(rèn)為該游戲仍處于AI技術(shù)驗(yàn)證階段,33.99元的低定價(jià)雖然獲得了一定的市場(chǎng)認(rèn)可,但顯然無(wú)法與算力成本比較。

C端驗(yàn)證雖然受到阻礙,但LPM的底層能力恰好能平移到對(duì)穩(wěn)定性要求更加嚴(yán)苛的B端場(chǎng)景,也就是說,Anuttacon可以走Agent已經(jīng)走過的路。

官網(wǎng)提到的虛擬主播、AI導(dǎo)師、客服等常見場(chǎng)景對(duì)長(zhǎng)時(shí)間穩(wěn)定性都有剛需,相比雇傭人類,LPM驅(qū)動(dòng)的AI角色顯然更適合7天24小時(shí)的運(yùn)行模式,再加上能節(jié)省昂貴的動(dòng)捕設(shè)備成本,最終的綜合成本極具競(jìng)爭(zhēng)力。

長(zhǎng)遠(yuǎn)來(lái)看,若是把LPM作為構(gòu)建UGC平臺(tái)的基礎(chǔ)設(shè)施,就能打破傳統(tǒng)UGC在建模和動(dòng)畫等方面面臨的門檻限制。

LPM的核心邏輯就在于用戶只需提供一張照片和一段話,AI即可完成所有的表演。

當(dāng)內(nèi)容創(chuàng)作的專業(yè)門檻進(jìn)一步降低,離全新的互動(dòng)媒體形式誕生也就不遠(yuǎn)了。

結(jié)語(yǔ)

綜上所述,LPM 1.0并不是一個(gè)試圖在畫質(zhì)上硬剛Seedance 2.0的模型,而是選擇了表演實(shí)時(shí)化和生命數(shù)字化的垂直路徑。

在行業(yè)普遍追求更高質(zhì)量的像素時(shí),LPM追求的是更久的一致性。

或許,這也是蔡浩宇作為米哈游聯(lián)合創(chuàng)始人對(duì)"體驗(yàn)"這個(gè)詞的深刻理解。

在游戲里,角色設(shè)定只要"崩壞"一次,沉浸感就會(huì)永遠(yuǎn)消失。

而在AI領(lǐng)域,LPM的目標(biāo)就是杜絕現(xiàn)有AI因缺乏情感共鳴帶來(lái)的恐怖谷效應(yīng)。

實(shí)時(shí)生成的呼吸感和微表情,宣布了虛擬角色在線交互時(shí)代的開啟。

即使算力成本高昂,只要能在高端互動(dòng)敘事等特定領(lǐng)域形成不可替代性,同樣可以掌握定價(jià)權(quán)。

從實(shí)時(shí)驅(qū)動(dòng)對(duì)話的AI游戲,到能說能聽的多模態(tài)模型,Anuttacon已經(jīng)在這場(chǎng)無(wú)限時(shí)長(zhǎng)的博弈中搶占了制高點(diǎn)。

而蔡浩宇的商業(yè)野心,也絕不止于米哈游。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
深圳一員工拿到月薪4.5萬(wàn)元工作后,因前公司不肯開離職證明錯(cuò)過機(jī)會(huì),法院:前司賠1.4萬(wàn)元

深圳一員工拿到月薪4.5萬(wàn)元工作后,因前公司不肯開離職證明錯(cuò)過機(jī)會(huì),法院:前司賠1.4萬(wàn)元

環(huán)球網(wǎng)資訊
2026-04-17 19:00:07
WSBK荷蘭站兩個(gè)中國(guó)品牌同場(chǎng)競(jìng)速,張雪廠隊(duì)53號(hào)獲排位賽第二,張雪:希望正賽再奪冠,但要理性看待

WSBK荷蘭站兩個(gè)中國(guó)品牌同場(chǎng)競(jìng)速,張雪廠隊(duì)53號(hào)獲排位賽第二,張雪:希望正賽再奪冠,但要理性看待

極目新聞
2026-04-17 23:38:43
許家印家族奢靡無(wú)度堪比帝王

許家印家族奢靡無(wú)度堪比帝王

超先聲
2026-04-16 16:36:35
西雙版納潑水節(jié)電車被潑冒煙后續(xù)!剛買才3個(gè)月,車?yán)锢先吮粷餐?>
    </a>
        <h3>
      <a href=派大星紀(jì)錄片
2026-04-17 16:17:37
140年來(lái)最強(qiáng)厄爾尼諾正在醞釀?地球或今年沖擊高溫極限?國(guó)家氣候中心回應(yīng)

140年來(lái)最強(qiáng)厄爾尼諾正在醞釀?地球或今年沖擊高溫極限?國(guó)家氣候中心回應(yīng)

澎湃新聞
2026-04-18 11:03:07
男子因噪音過敏住5年隔音艙:自己設(shè)計(jì),已接上百個(gè)訂單,幫噪音受困者找回睡眠

男子因噪音過敏住5年隔音艙:自己設(shè)計(jì),已接上百個(gè)訂單,幫噪音受困者找回睡眠

半島官網(wǎng)
2026-04-16 11:20:50
許家印不是在宴請(qǐng)何小鵬,他是在演示什么叫權(quán)力

許家印不是在宴請(qǐng)何小鵬,他是在演示什么叫權(quán)力

超先聲
2026-04-18 09:48:51
鋁企突發(fā)爆炸事故!已致19死17傷!

鋁企突發(fā)爆炸事故!已致19死17傷!

新浪財(cái)經(jīng)
2026-04-18 13:52:44
英法德“反骨”暴露無(wú)遺,把邀請(qǐng)函發(fā)給中國(guó),卻將美國(guó)排除在外

英法德“反骨”暴露無(wú)遺,把邀請(qǐng)函發(fā)給中國(guó),卻將美國(guó)排除在外

忠于法紀(jì)
2026-04-18 11:39:40
朱迅抗癌20年首曝真相:7次手術(shù),每天只吃七分飽,堅(jiān)決不碰燙食

朱迅抗癌20年首曝真相:7次手術(shù),每天只吃七分飽,堅(jiān)決不碰燙食

觀魚聽雨
2026-04-17 22:29:40
美媒:以總理對(duì)特朗普“禁止”轟炸黎巴嫩帖文感震驚

美媒:以總理對(duì)特朗普“禁止”轟炸黎巴嫩帖文感震驚

新華社
2026-04-18 11:53:02
印度虧慘了!花80 億買全套中國(guó)設(shè)備,運(yùn)回國(guó)內(nèi)后直接落灰開不了

印度虧慘了!花80 億買全套中國(guó)設(shè)備,運(yùn)回國(guó)內(nèi)后直接落灰開不了

杰絲聊古今
2026-04-18 11:39:25
四川雅安一商戶在公廁沖洗冷凍肉?官方通報(bào):情況屬實(shí),涉事商戶停業(yè)整頓

四川雅安一商戶在公廁沖洗冷凍肉?官方通報(bào):情況屬實(shí),涉事商戶停業(yè)整頓

界面新聞
2026-04-18 14:06:56
太陽(yáng)最強(qiáng)大腿!杰倫格林兩戰(zhàn)轟71分創(chuàng)神跡:一數(shù)據(jù)歷史第一

太陽(yáng)最強(qiáng)大腿!杰倫格林兩戰(zhàn)轟71分創(chuàng)神跡:一數(shù)據(jù)歷史第一

Emily說個(gè)球
2026-04-18 13:03:06
剛剛,誕生一項(xiàng)新吉尼斯紀(jì)錄!13315.04㎡,世界最大零食店在長(zhǎng)沙!

剛剛,誕生一項(xiàng)新吉尼斯紀(jì)錄!13315.04㎡,世界最大零食店在長(zhǎng)沙!

瀟湘晨報(bào)
2026-04-17 13:55:31
連休8天!浙江最新放假通知

連休8天!浙江最新放假通知

新浪財(cái)經(jīng)
2026-04-18 13:06:36
生涯第七次無(wú)緣季后賽!庫(kù)里場(chǎng)下不停搖頭顯沮喪 膝傷反復(fù)僅17分

生涯第七次無(wú)緣季后賽!庫(kù)里場(chǎng)下不停搖頭顯沮喪 膝傷反復(fù)僅17分

顏小白的籃球夢(mèng)
2026-04-18 12:56:46
華誼虧損超82億,不放棄事業(yè)不整容的羅海瓊,才是最清醒的老板娘

華誼虧損超82億,不放棄事業(yè)不整容的羅海瓊,才是最清醒的老板娘

一盅情懷
2026-04-18 08:08:54
悲哀!幾個(gè)女同事想郊游沒人愿去,吐槽現(xiàn)在男生太精,不好拿捏了

悲哀!幾個(gè)女同事想郊游沒人愿去,吐槽現(xiàn)在男生太精,不好拿捏了

火山詩(shī)話
2026-04-18 07:26:36
湖人棄將19+6斷登全美熱搜!多次生斷庫(kù)里致湖媒后悔 年薪僅234萬(wàn)

湖人棄將19+6斷登全美熱搜!多次生斷庫(kù)里致湖媒后悔 年薪僅234萬(wàn)

顏小白的籃球夢(mèng)
2026-04-18 13:23:57
2026-04-18 15:32:49
藍(lán)鯨新聞 incentive-icons
藍(lán)鯨新聞
財(cái)經(jīng)信息服務(wù)平臺(tái)
130674文章數(shù) 193829關(guān)注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

牛彈琴:特朗普迎來(lái)最興奮的一天 三個(gè)細(xì)節(jié)信息量很大

頭條要聞

牛彈琴:特朗普迎來(lái)最興奮的一天 三個(gè)細(xì)節(jié)信息量很大

體育要聞

時(shí)隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

《穿普拉達(dá)的女王2》疑似辱華?

財(cái)經(jīng)要聞

"影子萬(wàn)科"2.0:管理層如何吸血萬(wàn)物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價(jià)14.48萬(wàn)元起

態(tài)度原創(chuàng)

藝術(shù)
健康
時(shí)尚
手機(jī)
數(shù)碼

藝術(shù)要聞

何多苓油畫新作(2026-2025)

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

有些衣服,是穿給自己看的

手機(jī)要聞

最新手機(jī)榜出爐!華為第一蘋果第二,榮耀掉到第六!

數(shù)碼要聞

消息稱AMD贏得Anthropic大單,MI450 GPU部署應(yīng)對(duì)AI算力短缺

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版