无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

實測被吹爆的PixVerse R1,聊聊我們需要什么樣的世界模型

0
分享至


作者 | Kino

編輯 | 張潔

注意看,這個男人正躺在沙發上呼呼大睡,屏幕下方的輸入框里有一行字:“What would you like to happen next?”(你希望接下來發生什么?)。


你可以輸入任何天馬行空的指令把男人弄醒,比如讓壁爐的火蔓延到房間,引發濃煙把他嗆醒;或是讓窗外突然雷雨交加,把他吵醒;甚至憑空變出一個外星人把他劫走。

在輸入文字/語音指令后,AI會在幾秒內生成相應的視頻內容。但可能是因為初始設定,這個男人最終總會回到沙發上,繼續呼呼大睡。


看起來像是一個AI惡作劇游戲,但這其實是PixVerse最新發布的通用實時世界模型——PixVerse R1帶來的真實體驗。

PixVerse于上周發布了全球首個支持1080P分辨率通用實時世界模型PixVerse R1,在AI視頻圈迎來了一個小高潮。

簡單來說,以前我們用AI生成視頻,需要先輸入提示詞,然后等待生成,最后得到一條視頻。但PixVerse R1主打的是一種實時生成和交互的無限流體驗

在PixVerse R1的官方演示視頻中,畫面左下角不斷出現實時的指令輸入,例如“一架黑色烏鴉飛過”“士兵拼命逃跑”“桌子翻倒”等。這些指令輸入后,視頻中的畫面立即隨之改變,且畫面是連續不斷演進的。

理論上,只要你不斷輸入指令,視頻就可以永遠生成下去,像一場沒有盡頭的電影。過程中,我們能隨時通過提示詞改變畫面走向,隨意操控視頻中的世界,這種體驗類似于玩一款言出法隨的游戲。

就像上文那條視頻的演示,人人都可以體驗當上帝《楚門的世界》導演了。

對于PixVerse R1的上線,社交媒體上充滿了溢美之詞,仿佛視頻生成的終極形態已經到來。我們也第一時間拿到了R1的試用資格。

雖然,如果以當前主流AI視頻生成工具的質量標準來衡量,R1的表現很難稱得上驚艷,提示詞遵循度、畫面的精細度和穩定性都有待提高。

但我們需要意識到,目前的PixVerse R1,本質上還處于早期內測階段,而并非一個成熟的商業化產品。就像以往很多大模型一樣,世界模型更接近一次基礎設施層面的重塑,需要各行各業的進一步探索和落地。

在AI生成視頻技術已經如此成熟的今天,世界模型的革命性到底在哪里?為什么世界模型是下一個技術前沿?以及為什么現階段的它看起來并不是那么完美?

今天,我們決定從PixVerse R1切入,聊聊世界模型究竟是什么,并盤點那些爆火的世界模型,嘗試探討一下世界模型將如何重塑游戲、影視、內容創作等行業。



實測PixVerse,

一場無限流交互體驗

在PixVerse R1的官網首頁(https://realtime.pixverse.ai/),有一個名為“探索交互世界”的廣場,這里預設了多個風格迥異的可交互虛擬世界。

你可以潛入深海探索、登上月球漫步,也可以穿越回二戰戰場體驗,或是進入《塞爾達傳說》中的海拉魯大陸冒險。



其中最能體現交互式趣味的,莫過于我們在開頭提到的《Can You Wake Him Up? 》。

當然,如果你不想玩預設好的劇本,PixVerse R1也提供了從零開始的創造模式。只需要確定好視頻畫幅比例,選擇一種視覺風格(如第一人稱視角的POV、氛圍感或戲劇性),最后輸入你構想的世界觀。設定完成后,一個屬于你的、可供探索的實時生成世界就誕生了。


接下來展示幾個我們的測試結果。

我先是選擇了一個名為“Cybergens”的主題場景,畫面主體是一個充滿金屬質感的旋轉機械骷髏頭。

我輸入“戴上一頂西部牛仔帽”的指令,我的預期是在保持機械骷髏主體不變的前提下,頭頂憑空生成一頂帽子。實際上卻是機械骷髏瞬間變成了一個戴著牛仔帽、眼鏡和留著胡子的真人男性,但還是挺酷炫的。

然后我又嘗試了另一個指令“頭部被小丑撲克牌環繞”,很顯然生成的不是小丑撲克牌,但原本的骷髏頭變成了一個。我恍然大悟,好像是這么個邏輯:我說西部牛仔帽,它理解成西部牛仔;我說小丑撲克牌,它理解成小丑。

進入這個塞爾達風格的世界后,一個酷似林克的卡通角色正在曠野上奔跑。我輸入指令“長出一對白色翅膀在天空飛翔”。

我的預期是角色應該像《原神》中使用風之翼那樣,自然地展開翅膀升空、滑翔,保持動作的流暢性。結果卻是原本正在向前奔跑的角色突然停下,然后莫名其妙地轉過身來正對鏡頭,背后長出一對白色羽翼,原地撲騰了幾下。

在這個名為月球漫步的世界中,我先后輸入指令“一艘UFO降落在地表”和“幾個外星人從UFO下來”,結果UFO是有了,但從UFO上下來的卻不是外星人,而是幾個宇航員。

在經歷了前幾次指令翻車后,我意識到目前的PixVerse R1在理解因果邏輯時存在短板。于是我決定放棄人為干預,看看如果不輸入任何指令,模型靠自己的想象力會如何發展。

這次我選擇了容錯率最高的“賽博朋克城市”主題,因為賽博朋克本身是個超現實題材,離奇和崩壞也就沒那么不合理了。

出乎意料的是,這竟然是效果最好的一次,讓人仿佛置身于動畫《賽博朋克:邊緣行者》的場景中。

視頻開始于一段第一人稱視角的城市漫游,巨大的全息金魚在街道上空游動,街邊的拉面攤冒著熱氣,無人機在一座巨大的發光時鐘旁穿梭……

伴隨模型PixVerse R1發布的,還有一份技術報告,PixVerse R1由三個模塊支撐:Omni、Memory和IRE。

Omni原生多模態基座是端到端的多模態模型,文本、圖像、視頻、音頻被統一編碼成連續token流。在保證實時性的同時,PixVerse R1維持了1080P的高分辨率,依靠Omni多模態底座,將文本、圖像、音頻和視頻統一處理,實現了視聽同步,還是很有技術挑戰性的。


盤點那些爆火的世界模型

如果我們把視線從PixVerse R1身上移開,環顧整個世界模型賽道,會發現這里早已硝煙彌漫。在這個賽場,還有幾位不得不提的重量級玩家。

據“AI新榜”觀察,目前世界模型的底層架構主要分為三大流派,且呈現出相互融合的趨勢。一派是以PixVerse R1和Odyssey-2為代表的“視頻派”,以生成視頻為核心;另一派是以Marble為代表的“3D/空間智能派”,這一路徑往往可以生成可交互、可導航、可編輯的三維環境;還有以NVIDIA Cosmos為代表的“物理派”,目標是構建極其精確、仿真的數字孿生世界,用來訓練機器人和自動駕駛。

Genie 3

https://deepmind.google/blog/genie-3-a-new-frontier-for-world-models/


Genie 3是谷歌DeepMind于2025年8月推出的最新一代世界模型,它能根據簡單的文字提示實時創造可交互、可探索的虛擬世界環境。這個虛擬世界像游戲那樣可以自由移動、互動,而且在短時間內保持物理及視覺一致性,讓用戶(或者訓練中的智能體)像進入一個真正的世界一樣探索和操作。

跟傳統的文本生成視頻模型不同,Genie 3要同時理解世界的邏輯、物理與持久性,它能在720P分辨率、每秒24幀的條件下保持數分鐘內世界的連貫性。這意味著你在一個場景里改變了某個對象的位置、天氣等等,它能夠記住這些場景狀態。當用戶控制角色離開某個場景再返回時,場景內的物體布局等狀態保持不變。

從官方介紹看,谷歌也把Genie 3定義為第一款支持實時交互的世界模型。相比Genie 2,Genie 3在交互性和畫質上實現了質的飛躍:用戶不僅能控制角色移動,還能通過文本指令實時修改環境規則,比如“把白天變成黑夜”、“讓重力失效”。這種能力證明了模型對物理語義的深度理解。

Odyssey-2

https://odyssey.ml/the-dawn-of-a-world-simulator


Odyssey-2是Odyssey(AI創業公司)2025年推出的實時互動式AI視頻世界模型,和PixVerse R1十分相似,同樣主打實時生成和可交互,能以約20幀每秒的速度實時生成視頻幀。

據我們的測試,Odyssey-2生成的視頻畫質和流暢度不如PixVerse R1,但可以點擊畫面元素觸發推薦提示詞,更有交互感

Marble

https://marble.worldlabs.ai/


Marble是由李飛飛創業公司World Labs于2025年11月推出的多模態世界模型與3D世界生成平臺。

Marble的核心能力在于它可以根據一句文字描述、一張圖片、一段視頻,甚至是粗略的3D布局,生成3D世界。生成后的3D世界可以進行交互式編輯、擴展,并導出為高斯潑濺、三角網格、視頻等多種格式,可無縫導入主流游戲引擎如Unreal、Unity、Blender等。

李飛飛團隊認為,真正的智能必須具備空間感,其創立的World Labs就致力于構建具有空間智能的大型世界模型。

傳統3D內容創作通常需要龐大的建模團隊和復雜工具,而Marble能在幾分鐘內根據簡單描述生成完整的環境,大幅降低創作門檻。同時,它也為機器人學、建筑可視化、互動娛樂等需要精細空間理解的領域提供了新的工具。

Oasis

https://oasis.decart.ai/introduction


Oasis是由Decart AI于2024年10月推出的實時交互式AI世界模型/游戲生成系統。它標榜自己為世界上第一個能夠實時生成并讓用戶互動的開放世界AI模型。

區別于傳統的游戲引擎,Oasis能夠根據玩家的輸入,利用大規模預訓練得到的模式理解和概率預測,在沒有底層游戲邏輯和代碼的情況下實時生成整個游戲世界。可以理解為Oasis是一個完全由AI生成的、可玩的Minecraft克隆版。

目前,Oasis在世界持續性、高精度交互細節、分辨率與畫面穩定性等方面仍有限制。

NVIDIA Cosmos

https://www.nvidia.com/en-us/ai/cosmos/


NVIDIA Cosmos是英偉達于2025年1月推出的面向“物理AI”開發的世界基礎模型平臺,專注于讓機器人、自動駕駛汽車等具備理解現實世界、預測物理狀態、生成合成訓練數據的能力。

在實際應用層面,Cosmos能顯著改進以下方面:用自動生成的數據訓練機器人和自動駕駛系統,減少對真實采集數據的依賴;模擬復雜環境(如城市交通等)用于AI認知和策略學習;與NVIDIA的Omniverse等仿真平臺協同,為物理AI系統提供更逼真的環境和更高效的開發流程。


那么,世界模型究竟會如何重塑行業呢?

在多個潛在應用方向中,游戲和互動娛樂行業可能是最先被世界模型改變的領域之一

過去,游戲世界是由策劃和美術提前設計完成,玩家只能在有限規則、關卡內探索。而世界模型引入了一種新的范式,玩家不再只是沿著游戲設計者預設的規則行動,而是能夠實時生成游戲世界,并進行探索和交互,這種變化將重塑游戲的開發流程。未來的游戲可能是由一個訓練好的大模型實時生成,這將帶來無限的開放世界和動態劇情。

影視與內容創作行業同樣會受到深遠影響。

想象一下,以互動影視為代表的互動敘事作品中,觀眾不再只是被動觀看,而是可以在觀看過程中持續影響劇情走向。這種以參與和反饋為核心的創作形態,也天然適配劇情向內容賬號、互動直播欄目等,需要用戶介入和實時反應驅動的內容形態。

而且隨著可導航、可編輯的虛擬世界逐漸成熟,創作者可以在一個完整的虛擬環境中“取景”和“拍攝”,場景、光照和鏡頭調度都可以在這個空間中完成。這種轉變尤其適用于虛擬拍攝、視效制作和動畫工業。

相比創意產業,在機器人和自動駕駛等領域,世界模型的意義更加偏向工程和基礎設施層面。這類行業高度依賴大量真實世界數據,但真實數據的采集成本高、周期長,而且在許多極端或危險場景中幾乎不可行。世界模型通過構建具有物理一致性的模擬環境,為智能系統提供了一個可以反復試錯和訓練的“替代現實”。在這樣的環境中,模型不僅可以學習感知,還可以學習決策和長期規劃。

可以確定的是,我們正站在一個清晰的臨界點上,當AI逐漸成為構建和模擬真實世界的引擎,不僅將重塑影視、游戲、具身智能等行業的內容形態和交互體驗,也被普遍視為通向通用人工智能過程中不可或缺的一步。

但世界模型的真正價值,仍有賴于各行各業的開發者和創作者在此基礎上,進行持續探索、應用落地和再創造。

「AI新榜交流群」進群方式:添加微信“banggebangmei”并備注姓名+職業/公司+進群,歡迎玩家們來群里交流,一起探索見證AI的進化。

歡迎分享、點贊、推薦

一起研究AI

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“這真不是AI?”中南大學高考祝福視頻火了,出鏡男生太帥被質疑

“這真不是AI?”中南大學高考祝福視頻火了,出鏡男生太帥被質疑

妍妍教育日記
2026-05-14 09:56:16
突發!南京又一機構跑路!

突發!南京又一機構跑路!

南京擇校
2026-05-14 20:12:40
狼來了?外資將殺入電信業,三大運營商瑟瑟發抖?資費要降價了!

狼來了?外資將殺入電信業,三大運營商瑟瑟發抖?資費要降價了!

Thurman在昆明
2026-05-13 11:39:22
宋佳調侃張嘉益:為何不推薦我試鏡《主角》? 張嘉益回復全場笑翻

宋佳調侃張嘉益:為何不推薦我試鏡《主角》? 張嘉益回復全場笑翻

娛最資訊
2026-05-14 09:47:07
2小時起效的中藥奇跡!成都中醫藥大學胡鏡清等揭示梔子豉湯通過前額葉PACAP/VIP通路實現快速抗抑郁

2小時起效的中藥奇跡!成都中醫藥大學胡鏡清等揭示梔子豉湯通過前額葉PACAP/VIP通路實現快速抗抑郁

腦聲常談
2026-05-12 08:13:41
高配SSD也翻車?實錘Win11內耗元兇,關閉立馬滿血復活

高配SSD也翻車?實錘Win11內耗元兇,關閉立馬滿血復活

輝哥說動漫
2026-05-14 18:22:44
星鏈可以當GPS用?馬斯克:居然被你們發現了,5月20日就關掉!

星鏈可以當GPS用?馬斯克:居然被你們發現了,5月20日就關掉!

徐德文科學頻道
2026-05-13 20:29:16
美國訪華費用預算多少?這個費用誰來承擔?

美國訪華費用預算多少?這個費用誰來承擔?

健身狂人
2026-05-14 19:13:13
尷尬啊!家委會發布高考結束,舉行謝師宴,全班50人只有31人報名

尷尬啊!家委會發布高考結束,舉行謝師宴,全班50人只有31人報名

火山詩話
2026-05-14 17:54:05
英偉達股價連漲7日續刷記錄新高 總市值達5.63萬億美元

英偉達股價連漲7日續刷記錄新高 總市值達5.63萬億美元

財聯社
2026-05-14 21:46:05
殺豬盤玩脫了,印度GDP直接跌回老六。

殺豬盤玩脫了,印度GDP直接跌回老六。

流蘇晚晴
2026-05-14 20:14:04
A股:尾盤加速下跌,釋放了兩個信號,明天,周五或要這樣走!

A股:尾盤加速下跌,釋放了兩個信號,明天,周五或要這樣走!

明心
2026-05-14 16:32:37
李連杰面相驟變,換血換心傳聞背后原因曝光太令人心酸

李連杰面相驟變,換血換心傳聞背后原因曝光太令人心酸

夢在深巷qw
2026-05-14 16:05:44
老了才明白 一個家最大的災難 是父母五六十歲了 還隨意泄露家庭隱私

老了才明白 一個家最大的災難 是父母五六十歲了 還隨意泄露家庭隱私

楓紅染山徑
2026-05-14 18:39:37
爽快!中美會晤提出的第一個要求,中方開場白定調,太高明了

爽快!中美會晤提出的第一個要求,中方開場白定調,太高明了

愛看劇的阿峰
2026-05-14 18:59:00
印度,第一個被AI撕碎的國家?

印度,第一個被AI撕碎的國家?

美第奇效應
2026-05-14 00:02:54
隨著中國女足2-4落敗,女足亞洲杯決賽對陣浮出水面

隨著中國女足2-4落敗,女足亞洲杯決賽對陣浮出水面

俯身沖頂
2026-05-14 21:23:03
1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,FBI顏面盡失

1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,FBI顏面盡失

文史達觀
2026-05-13 11:29:24
小米SU7全車攝像頭突然集體失靈!4S店:外力滲液,不保修!車主蒙了:我沒撞沒泡水啊

小米SU7全車攝像頭突然集體失靈!4S店:外力滲液,不保修!車主蒙了:我沒撞沒泡水啊

魯中晨報
2026-05-14 17:14:03
5月,遇到這水果別手軟,一次買20斤,曬干后美味翻倍,營養解饞

5月,遇到這水果別手軟,一次買20斤,曬干后美味翻倍,營養解饞

阿龍美食記
2026-05-13 14:06:46
2026-05-14 23:00:49
頭號AI玩家 incentive-icons
頭號AI玩家
做內容從業者關心的AI研究
437文章數 23關注度
往期回顧 全部

科技要聞

馬斯克說會談很順利 黃仁勛點贊 庫克比耶

頭條要聞

女子稱關閉支付寶支付功能被扣款捐贈184萬 多方回應

頭條要聞

女子稱關閉支付寶支付功能被扣款捐贈184萬 多方回應

體育要聞

爭議抽象天王山,和季后賽最穩定中鋒

娛樂要聞

何九華官宣當爸!全程不提孩子媽

財經要聞

李強會見美國工商界代表

汽車要聞

雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

態度原創

游戲
旅游
藝術
公開課
軍事航空

內容多到爆!《極限競速地平線6》游戲時長曝光

旅游要聞

519中國旅游日|2026年“5·19中國旅游日”倒計時5天

藝術要聞

竣工!無錫奧體一期驚艷亮相,全城沸騰!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美以伊戰爭期間以總理密訪阿聯酋

無障礙瀏覽 進入關懷版