![]()
新智元報道
![]()
【新智元導讀】今天,阿里重磅上線HappyOyster 1.0世界模型,一句話直接生成可實時探索、物理交互的開放世界!
「快樂生蠔」,真的來了!
今天,阿里正式放出了HappyOyster 1.0——這是一款可實時構建和交互的開放式世界模型產品。
一句話,即可生成一個完整、可演繹、可探索、可互動的數字世界。
2個月前,阿里曾把「快樂生蠔」放進了公眾視野,如今這只生蠔終于長成了1.0。
一句話,一個世界,這次是真的實現了。
世界模型,AI下一個戰場
過去兩年,文生視頻已經相當成熟。
輸入一句話,等上幾十秒,就能拿到一段成片,它把「文本變成畫面」這件事,做得很好。
只不過,成片有它天然的邊界:畫面生成完,這段視頻就定稿了,你能做的是「看」,而不是「參與」。
而世界模型想做的,是另一件事:讓你不只是看一段視頻,而是走進一個能實時互動、隨時改變走向的世界。
這無關誰取代誰,文生視頻交付的是「一段結果」,世界模型為你創造的是「一段體驗」——
你給一張圖、一段話,它生成的那一刻,體驗才剛開始。
那它具體是怎么做到的?
它把視頻,當成一個需要被持續推演的世界狀態,學習世界如何隨時間演化的規律——
空間怎么連續、物體怎么守恒、動作之后會引發什么反饋。
它要做的,不再只是「把內容生成出來」,而是「把一個世界持續推演下去」。
![]()
放眼全世界,硅谷大廠、AI大佬創業公司,紛紛押注「世界模型」這一賽道。
這其中,不僅有谷歌DeepMind的Genie,也有李飛飛團隊傾力打造的Marble。
在這場角逐中,阿里HappyOyster強勢入局,路線非常明確:主動式、實時——
你說話的同時,世界就在回應你。
HappyOyster命名的靈感,來源沙翁的名言——The world is your oyster(世界是你的牡蠣 ,撬開它)
如今,阿里把將這句箴言刻印在「世界模型」上,態度很直白:世界,由你來撬開。
快樂生蠔,一手實測
這一次,HappyOyster 1.0核心版本升級,主打兩大功能——
世界探索(Adventure):你就是世界里角色的一部分,一句話、一張圖,即可開啟任意世界的探索。
實時導演(Directing):你就成了那個站在世界之上的人,去導演一整個故事。
![]()
百聞不如一見,接下來,我們將開啟一場全面的硬核實測。
世界探索:你就是世界里的「主角」
一句話或一張圖,你就進入一個可漫游、可戰斗、可互動的開放世界。
第一人稱、第三人稱隨你切,還支持1分鐘以上的實時位移與鏡頭控制。
「世界探索」新增了一整套豐富的交互動作:前沖 / 加速、下蹲、攻擊、跳躍,還支持更復雜的環境交互——乘坐駕駛載具、使用各類武器戰斗。
它真正把「看一個世界」變成了「在一個世界里活動」。
下面這個測試中,我們讓HappyOyster 1.0生成了兩個壯漢在地下拳館格斗的場景。
這一場格斗里,攻擊、跳躍、閃避這些動作,都是實時操控出來的——出拳、反擊、再追打,節奏完全跟著指令走。
關鍵是,一拳打出去,命中之后對手會觸發「踉蹌倒退」的受擊反應。
HappyOyster憑借著對客觀世界的理解能力,根據場景實時演化對應的物理交互,讓各種復雜動作實時發生。
除了戰斗場景外,HappyOyster 1.0還可以絲滑處理各類連貫交互動作。
下面這個地牢測試中,人物竟可以主動使用道具——火把。而且,場景的光照狀態完成了合理的切換。
再比如這臺復古老爺車,你可以指揮人物開門、上車,再操控他把車開出去。
從「看一輛車」到「上車把它開走」,中間差的就是能不能實時操控這一步。
世界會不會對動作做出實時反饋,雪地是個很好的試金石。
比如下面這個視頻中,一名探險者深一腳淺一腳走過厚雪覆蓋的山脊,每步留下腳印、踩塌的雪揚起雪粉。
更關鍵的是,不管世界換成什么畫風,任何人都能一樣地走進去、實時下指令。
如下視頻中,是一個黏土風格的微觀廚房,可以指揮角色在這個小世界里走動、探索,想去哪、做什么,都是實時演化說了算。
實時導演:站在世界之上,一邊演一邊改
Directing模式能直接讓你當導演。流式生成、即說即演,隨時注入指令改走向。
它的三大特性,每一條都是一種全新的交互體驗:
暫停:任意時刻凍結世界,想好了再繼續;
回溯:演到一半折回任意節點重新來過,原版本保留不丟;
劇情分支:從同一個節點分叉出完全不同的走向。
加上首發的多模態參考(用@圖片鎖定角色外觀,3分鐘長程一致),試錯成本被壓到了極低。
通過HappyOyster,便可以第一視角沉浸式體驗和數字人的交互,包括捏臉、說話全部都是實時的。
亦或是,化身為漫劇導演,親自執導一場霸總大戲。
劇情的走向、角色的命運,一切全都由你的想象力來主宰。只需在對話框中,輸入指令,AI便會按著劇本來演了。
創作過程中,可以隨時喊停,等創意想好了還能繼續。
![]()
![]()
再來一部「后宮甄貓傳」,一個人就能導演一部戲。
再來看下面這個demo,二次元老婆換裝,想要哪種風格的,一句話直接搞定。
核心技術拆解
HappyOyster 1.0 和我們熟悉的文生視頻模型,不是同一類東西。
差別不在畫面,而在兩者學習的目標。
文生視頻學的是「文本→視頻」的單向映射——給一段描述,產出一段對應的成片,生成完,這件事就結束了。
世界模型則不同,它學的是:當前狀態+你的動作 → 下一個狀態的轉移規律。
模型必須先理解當前的場景結構、實體屬性、物理關系,還要在你隨時丟過來指令的情況下,準確預測并渲染世界的下一個狀態。
用戶不再是被動的觀察者,而是可以在「世界」里持續交互——體驗的核心是中途互動本身。
那么問題來了,HappyOyster 1.0 是怎么把這件事做成的?
它的技術優勢可以概括為四點,層層遞進。
第一,世界狀態建模——世界能持續跑下去的基礎。
HappyOyster 把世界的當前狀態壓縮成一份緊湊的隱狀態摘要(Latent State),每生成一段內容就更新摘要,再把更新后的摘要遞歸傳給下一段。
這就像是一場接力賽跑,上一棒把「關于現在世界的一切」寫成一張小紙條遞給下一棒。
紙條在手,世界的因果就一直接得上——幾分鐘跑下來,世界不會亂、因果關系不會斷。
更關鍵的是,正因為狀態摘要可序列化、可存檔,HappyOyster 1.0 才得以支持暫停、回溯和劇情分支這些進階功能。
第二,內生一致性——世界「不崩」的保障。
HappyOyster 以持久的參考表征參與全程注意力。
簡單理解就是,進入世界時給每個人物、每件關鍵道具發一張「身份卡」,模型全程帶著這張卡生成。
這樣,當角色轉個身、被擋住,甚至走出畫面過幾分鐘再出現時,長相、衣著、物品都不會變樣、不會變形。
一致性不靠運氣,而是從架構層面就是內生的。
第三,開放因果動作空間——世界「能玩」的核心。
世界生成穩了,接下來的關鍵是怎么和它交互。
HappyOyster 的做法是讓動作指令和自然語言共享同一套語義接口,不需要預定義動作集。
比如,用戶按下「攻擊」鍵,HappyOyster不只是播一個「揮劍」的動畫,它能自主推演出整條因果鏈——
出手→命中→NPC 受擊倒地→地面揚塵→旁邊的酒杯被震落。
這些因果不是開發者一個一個寫好的腳本,而是模型通過大規模因果訓練自己學會的。
正因如此,它能自然遷移到從未見過的場景,并根據用戶指令推理出新的因果關系。
這是世界模型區別于靠腳本與邏輯拼接的「游戲引擎」的最本質之處。
第四,長時序音視頻協同——世界「活著」的質感。
最后一層是感官的完整性。
HappyOyster 的音畫是在同一世界狀態下聯合解碼生成的——世界狀態展開的同時,聲音和畫面一起長出來。
腳踩碎石有碎石聲,引擎加速有轟鳴,風穿過峽谷有呼嘯聲——聲音不是后期配的,是世界本身的一部分。
這四個點合在一起,HappyOyster 就成為了一個可持續推演的世界模擬器——跑得久、不會崩、可控制、有聲音。
從「技術玩具」到「生產力」
誰會最先用起來
HappyOyster 1.0的想象空間,遠不止「玩」。
把它放進各行各業,會看到一條共同的主線:每個場景的價值都不在畫面本身,而在「實時互動」。
用戶能在生成過程中隨時介入、即時改變世界的走向。
對不同落地場景來說,這正是世界模型這個新品類最有想象力的地方。
交互式游戲是最直接的落地場景。
傳統的開放世界原型驗證需要幾個月建資產庫、搭物理引擎、調NPC行為樹。
現在一句話,就能生成帶實時物理反饋的開放世界原型。
從FPS戰區到國風武俠對決,策劃用它驗證關卡、測試NPC交互邏輯、感受戰斗節奏,而玩家的每一次操作都在實時驅動事件走向。
速度從以周計縮到以小時計。
實時虛擬陪伴,是「世界探索」與「實時導演」都能托起的方向。
它能實時生成一個隨時可交互的虛擬角色:能聽能說、長時間相處還保持一致,用戶可以隨時指揮它的動作。
虛擬伙伴、數字人IP、品牌虛擬形象,都能借此從「播一段片」升級為「實時陪著你」。
在互動短劇上,HappyOyster 1.0的暫停、回溯、分支三件套,等于把「分支敘事」的能力直接交給了創作者。
一個開頭分叉出十條故事線,觀眾能在關鍵節點注入自己的指令、實時改寫走向——
名場面重寫結局、POV戀愛互動,制作方式也從「預先拍好多條線、每條都花錢」變成了「實時生成任意一條線」。
還有直播,是「實時」屬性最天然的落點。
場景與角色都是實時生成的,主播或觀眾的一句指令就能即時改變畫面走向。
無論是虛擬主播,還是實時互動直播,觀眾都不再只是「看」,而是能直接參與到畫面的演化里。
文旅與虛擬體驗則把「去哪、看什么」實時交給用戶,同時利用世界模型在「無真實數據場景」中的模擬能力。
月球表面、海底宮殿、高魔幻境——這些現實中拍不到的地方,HappyOyster能在像素空間里持續模擬出來。
HappyOyster 1.0版本把「一句話造世界」從概念變成了今天就能用的產品。
而據官方透露,API預計7月初開放——屆時,開發者和B端的生態想象力還會進一步打開。
國內站 www.happyoyster.cn 已上線,手機號即可注冊,每天登錄送免費創作積分。
剩下的,就交給你的創造力了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.