无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

阿里又放大招!一句話,造一個能走進去的世界

0
分享至


新智元報道


【新智元導讀】今天,阿里重磅上線HappyOyster 1.0世界模型,一句話直接生成可實時探索、物理交互的開放世界!

「快樂生蠔」,真的來了!

今天,阿里正式放出了HappyOyster 1.0——這是一款可實時構建和交互的開放式世界模型產品。

一句話,即可生成一個完整、可演繹、可探索、可互動的數字世界。

2個月前,阿里曾把「快樂生蠔」放進了公眾視野,如今這只生蠔終于長成了1.0。

一句話,一個世界,這次是真的實現了。

世界模型,AI下一個戰場

過去兩年,文生視頻已經相當成熟。

輸入一句話,等上幾十秒,就能拿到一段成片,它把「文本變成畫面」這件事,做得很好。

只不過,成片有它天然的邊界:畫面生成完,這段視頻就定稿了,你能做的是「看」,而不是「參與」。

而世界模型想做的,是另一件事:讓你不只是看一段視頻,而是走進一個能實時互動、隨時改變走向的世界。

這無關誰取代誰,文生視頻交付的是「一段結果」,世界模型為你創造的是「一段體驗」——

你給一張圖、一段話,它生成的那一刻,體驗才剛開始。

那它具體是怎么做到的?

它把視頻,當成一個需要被持續推演的世界狀態,學習世界如何隨時間演化的規律——

空間怎么連續、物體怎么守恒、動作之后會引發什么反饋。

它要做的,不再只是「把內容生成出來」,而是「把一個世界持續推演下去」。


放眼全世界,硅谷大廠、AI大佬創業公司,紛紛押注「世界模型」這一賽道。

這其中,不僅有谷歌DeepMind的Genie,也有李飛飛團隊傾力打造的Marble。

在這場角逐中,阿里HappyOyster強勢入局,路線非常明確:主動式、實時——

你說話的同時,世界就在回應你。

HappyOyster命名的靈感,來源沙翁的名言——The world is your oyster(世界是你的牡蠣 ,撬開它)

如今,阿里把將這句箴言刻印在「世界模型」上,態度很直白:世界,由你來撬開。

快樂生蠔,一手實測

這一次,HappyOyster 1.0核心版本升級,主打兩大功能——

  • 世界探索(Adventure):你就是世界里角色的一部分,一句話、一張圖,即可開啟任意世界的探索。

  • 實時導演(Directing):你就成了那個站在世界之上的人,去導演一整個故事。


百聞不如一見,接下來,我們將開啟一場全面的硬核實測。

世界探索:你就是世界里的「主角」

一句話或一張圖,你就進入一個可漫游、可戰斗、可互動的開放世界。

第一人稱、第三人稱隨你切,還支持1分鐘以上的實時位移與鏡頭控制。

「世界探索」新增了一整套豐富的交互動作:前沖 / 加速、下蹲、攻擊、跳躍,還支持更復雜的環境交互——乘坐駕駛載具、使用各類武器戰斗。

它真正把「看一個世界」變成了「在一個世界里活動」。

下面這個測試中,我們讓HappyOyster 1.0生成了兩個壯漢在地下拳館格斗的場景。

這一場格斗里,攻擊、跳躍、閃避這些動作,都是實時操控出來的——出拳、反擊、再追打,節奏完全跟著指令走。

關鍵是,一拳打出去,命中之后對手會觸發「踉蹌倒退」的受擊反應。

HappyOyster憑借著對客觀世界的理解能力,根據場景實時演化對應的物理交互,讓各種復雜動作實時發生。

除了戰斗場景外,HappyOyster 1.0還可以絲滑處理各類連貫交互動作。

下面這個地牢測試中,人物竟可以主動使用道具——火把。而且,場景的光照狀態完成了合理的切換。

再比如這臺復古老爺車,你可以指揮人物開門、上車,再操控他把車開出去。

從「看一輛車」到「上車把它開走」,中間差的就是能不能實時操控這一步。

世界會不會對動作做出實時反饋,雪地是個很好的試金石。

比如下面這個視頻中,一名探險者深一腳淺一腳走過厚雪覆蓋的山脊,每步留下腳印、踩塌的雪揚起雪粉。

更關鍵的是,不管世界換成什么畫風,任何人都能一樣地走進去、實時下指令。

如下視頻中,是一個黏土風格的微觀廚房,可以指揮角色在這個小世界里走動、探索,想去哪、做什么,都是實時演化說了算。

實時導演:站在世界之上,一邊演一邊改

Directing模式能直接讓你當導演。流式生成、即說即演,隨時注入指令改走向。

它的三大特性,每一條都是一種全新的交互體驗:

暫停:任意時刻凍結世界,想好了再繼續;

回溯:演到一半折回任意節點重新來過,原版本保留不丟;

劇情分支:從同一個節點分叉出完全不同的走向。

加上首發的多模態參考(用@圖片鎖定角色外觀,3分鐘長程一致),試錯成本被壓到了極低。

通過HappyOyster,便可以第一視角沉浸式體驗和數字人的交互,包括捏臉、說話全部都是實時的。

亦或是,化身為漫劇導演,親自執導一場霸總大戲。

劇情的走向、角色的命運,一切全都由你的想象力來主宰。只需在對話框中,輸入指令,AI便會按著劇本來演了。

創作過程中,可以隨時喊停,等創意想好了還能繼續。



再來一部「后宮甄貓傳」,一個人就能導演一部戲。

再來看下面這個demo,二次元老婆換裝,想要哪種風格的,一句話直接搞定。

核心技術拆解

HappyOyster 1.0 和我們熟悉的文生視頻模型,不是同一類東西。

差別不在畫面,而在兩者學習的目標。

文生視頻學的是「文本→視頻」的單向映射——給一段描述,產出一段對應的成片,生成完,這件事就結束了。

世界模型則不同,它學的是:當前狀態+你的動作 → 下一個狀態的轉移規律。

模型必須先理解當前的場景結構、實體屬性、物理關系,還要在你隨時丟過來指令的情況下,準確預測并渲染世界的下一個狀態。

用戶不再是被動的觀察者,而是可以在「世界」里持續交互——體驗的核心是中途互動本身。

那么問題來了,HappyOyster 1.0 是怎么把這件事做成的?

它的技術優勢可以概括為四點,層層遞進。

第一,世界狀態建模——世界能持續跑下去的基礎。

HappyOyster 把世界的當前狀態壓縮成一份緊湊的隱狀態摘要(Latent State),每生成一段內容就更新摘要,再把更新后的摘要遞歸傳給下一段。

這就像是一場接力賽跑,上一棒把「關于現在世界的一切」寫成一張小紙條遞給下一棒。

紙條在手,世界的因果就一直接得上——幾分鐘跑下來,世界不會亂、因果關系不會斷。

更關鍵的是,正因為狀態摘要可序列化、可存檔,HappyOyster 1.0 才得以支持暫停、回溯和劇情分支這些進階功能。

第二,內生一致性——世界「不崩」的保障。

HappyOyster 以持久的參考表征參與全程注意力。

簡單理解就是,進入世界時給每個人物、每件關鍵道具發一張「身份卡」,模型全程帶著這張卡生成。

這樣,當角色轉個身、被擋住,甚至走出畫面過幾分鐘再出現時,長相、衣著、物品都不會變樣、不會變形。

一致性不靠運氣,而是從架構層面就是內生的。

第三,開放因果動作空間——世界「能玩」的核心。

世界生成穩了,接下來的關鍵是怎么和它交互。

HappyOyster 的做法是讓動作指令和自然語言共享同一套語義接口,不需要預定義動作集。

比如,用戶按下「攻擊」鍵,HappyOyster不只是播一個「揮劍」的動畫,它能自主推演出整條因果鏈——

出手→命中→NPC 受擊倒地→地面揚塵→旁邊的酒杯被震落。

這些因果不是開發者一個一個寫好的腳本,而是模型通過大規模因果訓練自己學會的。

正因如此,它能自然遷移到從未見過的場景,并根據用戶指令推理出新的因果關系。

這是世界模型區別于靠腳本與邏輯拼接的「游戲引擎」的最本質之處。

第四,長時序音視頻協同——世界「活著」的質感。

最后一層是感官的完整性。

HappyOyster 的音畫是在同一世界狀態下聯合解碼生成的——世界狀態展開的同時,聲音和畫面一起長出來。

腳踩碎石有碎石聲,引擎加速有轟鳴,風穿過峽谷有呼嘯聲——聲音不是后期配的,是世界本身的一部分。

這四個點合在一起,HappyOyster 就成為了一個可持續推演的世界模擬器——跑得久、不會崩、可控制、有聲音。

從「技術玩具」到「生產力」

誰會最先用起來

HappyOyster 1.0的想象空間,遠不止「玩」。

把它放進各行各業,會看到一條共同的主線:每個場景的價值都不在畫面本身,而在「實時互動」。

用戶能在生成過程中隨時介入、即時改變世界的走向。

對不同落地場景來說,這正是世界模型這個新品類最有想象力的地方。

交互式游戲是最直接的落地場景。

傳統的開放世界原型驗證需要幾個月建資產庫、搭物理引擎、調NPC行為樹。

現在一句話,就能生成帶實時物理反饋的開放世界原型。

從FPS戰區到國風武俠對決,策劃用它驗證關卡、測試NPC交互邏輯、感受戰斗節奏,而玩家的每一次操作都在實時驅動事件走向。

速度從以周計縮到以小時計。

實時虛擬陪伴,是「世界探索」與「實時導演」都能托起的方向。

它能實時生成一個隨時可交互的虛擬角色:能聽能說、長時間相處還保持一致,用戶可以隨時指揮它的動作。

虛擬伙伴、數字人IP、品牌虛擬形象,都能借此從「播一段片」升級為「實時陪著你」。

互動短劇上,HappyOyster 1.0的暫停、回溯、分支三件套,等于把「分支敘事」的能力直接交給了創作者。

一個開頭分叉出十條故事線,觀眾能在關鍵節點注入自己的指令、實時改寫走向——

名場面重寫結局、POV戀愛互動,制作方式也從「預先拍好多條線、每條都花錢」變成了「實時生成任意一條線」。

還有直播,是「實時」屬性最天然的落點。

場景與角色都是實時生成的,主播或觀眾的一句指令就能即時改變畫面走向。

無論是虛擬主播,還是實時互動直播,觀眾都不再只是「看」,而是能直接參與到畫面的演化里。

文旅與虛擬體驗則把「去哪、看什么」實時交給用戶,同時利用世界模型在「無真實數據場景」中的模擬能力。

月球表面、海底宮殿、高魔幻境——這些現實中拍不到的地方,HappyOyster能在像素空間里持續模擬出來。

HappyOyster 1.0版本把「一句話造世界」從概念變成了今天就能用的產品。

而據官方透露,API預計7月初開放——屆時,開發者和B端的生態想象力還會進一步打開。

國內站 www.happyoyster.cn 已上線,手機號即可注冊,每天登錄送免費創作積分。

剩下的,就交給你的創造力了。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
美國與伊朗的諒解備忘錄全文公布,這場戰爭誰贏了?

美國與伊朗的諒解備忘錄全文公布,這場戰爭誰贏了?

山河路口
2026-06-17 09:47:14
5年1.25億!最菜首發分衛!掘金準備大清洗交易

5年1.25億!最菜首發分衛!掘金準備大清洗交易

籃球實戰寶典
2026-06-17 23:43:34
演員朱一龍被指在長城敲日本太鼓,品牌lululemon發聲明致歉:未能在前期充分識別潛在爭議,向公眾及朱一龍道歉,相關內容已全部下架

演員朱一龍被指在長城敲日本太鼓,品牌lululemon發聲明致歉:未能在前期充分識別潛在爭議,向公眾及朱一龍道歉,相關內容已全部下架

極目新聞
2026-06-16 14:03:11
73歲大佬將迎娶好友90后女兒,相差41歲,婚禮定于10月

73歲大佬將迎娶好友90后女兒,相差41歲,婚禮定于10月

孤芳自賞的小李
2026-06-04 18:22:06
3歲男童已找到:救援隊透露,父親精神已崩潰,聲吶拍下最后影像

3歲男童已找到:救援隊透露,父親精神已崩潰,聲吶拍下最后影像

奇思妙想草葉君
2026-06-16 17:41:48
爾冬升早看過《給阿嬤的情書》劇本,覺得不會火,如今回應6個字

爾冬升早看過《給阿嬤的情書》劇本,覺得不會火,如今回應6個字

冷紫葉
2026-06-17 16:20:50
大羅:世界是時候停止掩飾,接受梅西是史上最佳球員的事實了

大羅:世界是時候停止掩飾,接受梅西是史上最佳球員的事實了

懂球帝
2026-06-17 18:26:23
霍啟山終于要結婚了?43歲豪門二公子,被小14歲“妲己”拿下了

霍啟山終于要結婚了?43歲豪門二公子,被小14歲“妲己”拿下了

鄉野小珥
2026-06-17 21:58:53
北京現代艾尼氪V到店,神似“蘭博基尼”,長4米9,最高650km續航

北京現代艾尼氪V到店,神似“蘭博基尼”,長4米9,最高650km續航

聞車品百魅
2026-06-17 11:32:02
6月17日俄烏最新:川普與歐洲的交易

6月17日俄烏最新:川普與歐洲的交易

西樓飲月
2026-06-17 21:14:18
為什么網上那么多罵郭沫若的人,看網友講述真是見識短了。

為什么網上那么多罵郭沫若的人,看網友講述真是見識短了。

侃神評故事
2026-06-17 15:27:28
A股:全體股民做好心理準備了,明天周四6.18,A股或將再次歷史重演!

A股:全體股民做好心理準備了,明天周四6.18,A股或將再次歷史重演!

趨勢清風俠
2026-06-17 18:25:54
暗戰已打響?中方砸10萬億救市,馬斯克轉移工廠,伯恩斯話應驗?

暗戰已打響?中方砸10萬億救市,馬斯克轉移工廠,伯恩斯話應驗?

傲傲講歷史
2026-06-17 06:52:50
無視虧損警告?章盟主攜“無限子彈”,近一月狂買沃格光電近10億

無視虧損警告?章盟主攜“無限子彈”,近一月狂買沃格光電近10億

財聞
2026-06-17 18:44:43
80歲老人住院次日失蹤,一個月后被發現死在醫院廢棄房

80歲老人住院次日失蹤,一個月后被發現死在醫院廢棄房

現代快報
2026-06-17 19:33:09
廣東中山一3歲男童被小區大堂大理石桌砸中身亡,多方回應:事故原因正在調查中

廣東中山一3歲男童被小區大堂大理石桌砸中身亡,多方回應:事故原因正在調查中

瀟湘晨報
2026-06-16 17:21:55
A股:今晚2.5億股民,要興奮到睡不著覺了,你知道為什么嗎?

A股:今晚2.5億股民,要興奮到睡不著覺了,你知道為什么嗎?

夜深愛雜談
2026-06-17 20:59:38
0-3完敗!齊達內愛子世界杯首秀失誤:2次撲救脫手,目送梅西戴帽

0-3完敗!齊達內愛子世界杯首秀失誤:2次撲救脫手,目送梅西戴帽

球場沒跑道
2026-06-17 11:41:21
山姆采購“換帥”!9年老將卸任,“品質派”外籍采購官回歸,狂飆的山姆要從采購開始“糾偏”?

山姆采購“換帥”!9年老將卸任,“品質派”外籍采購官回歸,狂飆的山姆要從采購開始“糾偏”?

食品內參
2026-06-17 18:19:29
他27歲還買不起一部iPhone,四十一歲卻能日賺2.8億。

他27歲還買不起一部iPhone,四十一歲卻能日賺2.8億。

流蘇晚晴
2026-06-12 13:04:31
2026-06-18 00:27:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15493文章數 66925關注度
往期回顧 全部

科技要聞

馬斯克好友長文:他最可怕的,是這套方法論

頭條要聞

美媒:馬克龍想借中國在G7制衡美國 跟特朗普討價還價

頭條要聞

美媒:馬克龍想借中國在G7制衡美國 跟特朗普討價還價

體育要聞

梅西帽子戲法:紀錄厚重,球王輕盈

娛樂要聞

陳紅一反常態保持沉默

財經要聞

拉加德警告:AI可能引爆下一場金融危機

汽車要聞

23.99萬起 比亞迪大唐帶2+2+3大七座掀桌子 這才是中國大家庭夢中情車!

態度原創

旅游
數碼
游戲
手機
親子

旅游要聞

盧浮宮館長稱該博物館已“不堪重負”

數碼要聞

AMD顯卡HDMI 2.1 FRL初步支持已被合并到Linux 7.2內核

任天堂硬剛黑客!被勒索200萬美元拒絕支付

手機要聞

蘋果20周年版iPhone:四曲屏無邊框+雙尺寸!

親子要聞

有孩子后,上班掙錢重要還是在家陪伴孩子重要?寶媽應該怎么選?

無障礙瀏覽 進入關懷版