IT之家 11 月 23 日消息,Meta 本周推出了 WorldGen,這是一種端到端系統(tǒng),可僅憑單條文本提示詞,自動生成可交互、可導(dǎo)航的三維世界,不僅具備高度沉浸感,更支持用戶真正步入其中、自由探索。

據(jù)IT之家了解,WorldGen 融合了程序化邏輯推理、基于擴(kuò)散模型的三維生成技術(shù)以及面向?qū)ο蟮膱鼍胺纸夥椒?,最終輸出幾何結(jié)構(gòu)嚴(yán)謹(jǐn)、視覺表現(xiàn)豐富、渲染效率優(yōu)異的三維場景,適用于游戲開發(fā)、模擬仿真及沉浸式社交環(huán)境等多元應(yīng)用。
近年來,生成式 AI 在依據(jù)文本或圖像生成高質(zhì)量三維資產(chǎn)方面已取得顯著進(jìn)展。WorldGen 在此基礎(chǔ)上整合并創(chuàng)新了多項現(xiàn)有二維與三維生成技術(shù),當(dāng)前其他方法大多基于單一指定視角,從該視角向外延展構(gòu)建三維世界,而非以全局參考圖像或完整布局作為條件約束。這類方法雖能在中心視角附近生成高質(zhì)量幾何與紋理,但一旦移動 3–5 米,模型質(zhì)量便迅速下降。相較之下,WorldGen 可生成 50 米 ×50 米尺度的全紋理三維場景,并確保整體在風(fēng)格與幾何結(jié)構(gòu)上的高度一致性。未來,Meta 還將進(jìn)一步拓展可生成世界的空間規(guī)模。
需要說明的是,當(dāng)前 WorldGen 仍處于研究階段,暫未向開發(fā)者開放使用;但其所生成的內(nèi)容可直接兼容 Unity、Unreal 等主流游戲引擎,無需額外轉(zhuǎn)換或定制渲染管線。
盡管 WorldGen 已在生成多樣化、可交互、可導(dǎo)航三維世界的研究方向上邁出關(guān)鍵一步,當(dāng)前版本仍存在一定局限。例如,Meta 正致力于拓展未來版本的空間生成范圍,并進(jìn)一步降低生成延遲。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。