在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

騰訊混元 Voyager3D 世界模型發(fā)布,可生成長距離、世界一致的漫游場景

2025/9/2 16:31:04 來源:IT之家 作者:遠洋 責(zé)編:遠洋

IT之家 9 月 2 日消息,今天,騰訊混元 3D 世界模型系列最新成員 ——HunyuanWorld-Voyager(簡稱混元 Voyager)正式發(fā)布,這也是業(yè)界首個支持原生 3D 重建的超長漫游世界模型。

官方稱,該模型聚焦于 AI 在空間智能領(lǐng)域的應(yīng)用擴展,將為虛擬現(xiàn)實、物理仿真、游戲開發(fā)等領(lǐng)域提供高保真的 3D 場景漫游能力。

混元 Voyager 突破了傳統(tǒng)視頻生成在空間一致性和探索范圍上的局限,能夠生成長距離、世界一致的漫游場景,支持將視頻直接導(dǎo)出為 3D 格式。

據(jù)IT之家了解,混元 Voyager 3D 輸入-3D 輸出的特性,與此前已開源的混元世界模型 1.0 高度適配,可進一步擴展 1.0 模型漫游范圍,提升復(fù)雜場景的生成質(zhì)量,并可對生成的場景做風(fēng)格化控制和編輯。

不僅如此,混元 Voyager 還可支持視頻場景重建、3D 物體紋理生成、視頻風(fēng)格定制化生成、視頻深度估計等多種 3D 理解與生成應(yīng)用,展現(xiàn)出空間智能的潛力。

當(dāng)前,可交互的視頻模型已經(jīng)展現(xiàn)出在世界模型生成上的潛力。然而,實際應(yīng)用中(如虛擬現(xiàn)實、物理仿真等)通常需要能夠建模的顯式 3D 場景,純視頻的生成內(nèi)容很難為用戶提供更加真實的交互形式。另一方面,直接生成 3D 形式的世界場景,雖具備更好的空間結(jié)構(gòu)的一致性和交互應(yīng)用的拓展性,卻受限于 3D 訓(xùn)練數(shù)據(jù)稀缺與 3D 表征內(nèi)存效率低下等問題,無法泛化到更多的類別和更大場景中?;煸?Voyager 框架創(chuàng)新性地將場景深度預(yù)測引入視頻生成過程,融合了視頻生成與 3D 建模優(yōu)勢,基于相機可控的視頻生成技術(shù),從初始場景視圖和用戶指定相機軌跡中,合成可自由控制視角、空間連貫的 RGB-D 視頻(包含 RGB 圖像和深度信息的點云視頻)。

用戶可通過鍵盤或者搖桿控制生成對應(yīng)的視頻畫面,并通過 3D 空間記憶保持畫面的高度一致性,實現(xiàn)與可交互視頻模型如 Genie3 等相同的功能。同時,Voyager 還支持將生成視頻無損導(dǎo)出 3D 點云,無需依賴 COLMAP 等額外重建工具。

混元 Voyager 首次通過空間與特征結(jié)合的方式,支持原生的 3D 記憶和場景重建,避免了傳統(tǒng)后處理帶來的延遲和精度損失。同時,在輸入端加入 3D 條件保證畫面視角精準(zhǔn),輸出端直接生成 3D 點云,適配多種應(yīng)用場景。額外的深度信息還能支持視頻場景重建、3D 物體紋理生成、風(fēng)格化編輯和深度估計等功能。

Voyager 還引入了可擴展的世界緩存機制,基于 1.0 模型生成的初始 3D 點云緩存,將其投影到目標(biāo)相機視圖,為擴散模型提供指導(dǎo)。此外,生成的視頻幀還會實時更新緩存,形成閉環(huán)系統(tǒng),支持任意相機軌跡,同時維持幾何一致性。這不僅擴展了漫游范圍,還為 1.0 模型補充新視角內(nèi)容,提升整體生成質(zhì)量。

該模型在斯坦福大學(xué)李飛飛團隊發(fā)布的世界模型基準(zhǔn)測試 WorldScore 上位居綜合能力首位,超越現(xiàn)有開源方法,在視頻生成和 3D 重建任務(wù)中均表現(xiàn)出色。在視頻生成和視頻 3D 重建兩個任務(wù)上,Voyager 也均取得更好的結(jié)果。

Voyager 在世界模型排行榜 WorldScore 上,取得了綜合能力第一名的成績 https://huggingface.co/spaces/Howieeeee/WorldScore_Leaderboard

圖生視頻指標(biāo)

視頻重建指標(biāo)

和現(xiàn)有開源方法比較,HunyuanWorld-Voyager 可重建出更加精確的 3DGS 場景

騰訊混元世界模型系列開源正不斷加速。7 月,混元 3D 世界模型 1.0 發(fā)布并開源,成為業(yè)界首個兼容傳統(tǒng) CG 管線的可漫游世界生成模型。8 月,推出 1.0 Lite 版,降低顯存需求,支持消費級顯卡部署。僅兩周后,針對遮擋視圖和探索范圍限制,混元團隊進一步優(yōu)化,推出超長漫游世界模型 Voyager。

此前,混元已陸續(xù)開源業(yè)界領(lǐng)先的文生圖、視頻生成和 3D 生成能力,提供接近商業(yè)模型性能的開源模型,混元 3D 系列開源模型下載量位居開源社區(qū)榜首。

在基礎(chǔ)模型方面,混元開源了 MoE 架構(gòu)的代表性模型混元 large、混合推理模型 Hunyuan-A13B,以及多個面向端側(cè)場景的小尺寸模型,最小僅 0.5B 參數(shù)。最新開源的翻譯模型 Hunyuan-MT-7B,在國際翻譯比賽中斬獲 31 個語種中的 30 項冠軍。

HunyuanWorld-Voyager 現(xiàn)已正式上線,相關(guān)技術(shù)報告已公開,源代碼在 GitHub 和 Hugging Face 上免費開放。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:騰訊混元,世界模型,Voyager3D

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知