“世界”真能裝進手機了?
4月15日,李飛飛旗下空間智能公司World Labs發布并開源Spark 2.0渲染引擎。這是其“世界模型”戰略的最新落地成果,讓AI生成的3D世界,能在任何設備的瀏覽器里跑起來。
所謂“世界模型”,是李飛飛一直推動的AI方向:讓機器理解并模擬真實的三維物理世界,而非僅僅處理文字和圖像。Spark 2.0正是這個世界模型拼圖中的“交付層”。解決AI生成的大尺度3D內容“怎么讓人看到”的問題。
3D高斯潑濺技術通過數百萬個半透明彩色橢球體還原真實場景,無需傳統建模。但一個高質量掃描場景動輒4000萬個點云,手機通常只能處理100萬到500萬個。Spark 2.0用三項技術解決了這對矛盾:連續LoD細節層級讓設備只渲染“夠用”的點云數量;新.RAD格式實現漸進式流加載,打開網頁先見輪廓再逐步細化;GPU虛擬內存讓多個場景共享顯存池。
這個引擎前身是World Labs內部工具。團隊發現市面渲染器要么只支持單對象,要么依賴尚未普及的WebGPU,于是決定自己造一個。去年Spark 1.0解決了多對象共存問題,2.0則攻克了手機跑不動大場景的硬骨頭。
目前已有落地案例。Webby獎得主James C. Kane用Spark 2.0開發了太空射擊游戲Starspeed,整個場景由超1億個點云構成,瀏覽器直接運行。藝術項目《Dormant Memories》將真實地點3D掃描與虛構空間并置。
值得注意的是,Spark 2.0與World Labs的AI創作平臺Marble深度綁定。用戶可在Marble中用文字或圖片生成3D世界,再用Spark渲染成可分享的網頁鏈接。這意味著從“AI生成世界”到“普通人交付世界”的閉環已經跑通。
有網友評論:“李飛飛這是要把‘世界’做成一個文件格式啊,以后分享旅行不是發照片,是發一個.RAD鏈接,朋友點進去就能在你站過的地方散步。”“一個鏈接就是一座城市,這才是世界模型該有的樣子。”也有開發者調侃:“上次她說空間智能是AI的下一個前沿,我以為是畫餅。現在手機都能跑億級粒子了,這餅是真烙出來了。”
李飛飛在社交平臺表示:“能為基于網頁的3D高斯潑濺渲染開源生態貢獻力量,我深感自豪。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.