在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

無需 3D 模型 / 物理引擎:谷歌 DeepMind 聯(lián)合開發(fā)力提示技術(shù),AI 生成視頻可模擬真實(shí)運(yùn)動

2025/6/4 8:30:08 來源:IT之家 作者:故淵 責(zé)編:故淵

IT之家 6 月 4 日消息,科技媒體 The Decoder 昨日(6 月 3 日)發(fā)布博文,報(bào)道稱谷歌 DeepMind 團(tuán)隊(duì)攜手布朗大學(xué),為視頻生成模型開發(fā)“力提示”(force prompting)技術(shù),可以在無需 3D 模型或物理引擎的情況下,生成逼真的運(yùn)動效果。

用戶只需指定力的方向和強(qiáng)度,就能操控 AI 生成的視頻內(nèi)容,該技術(shù)支持全局力(如風(fēng)吹過整個(gè)畫面)和局部力(如特定點(diǎn)的敲擊)兩種力量。這些力以矢量場形式輸入系統(tǒng),隨后被轉(zhuǎn)化為自然流暢的運(yùn)動。

Deepmind's

研究團(tuán)隊(duì)基于 CogVideoX-5B-I2V 視頻模型,加入 ControlNet 模塊處理物理控制數(shù)據(jù),信號通過 Transformer 架構(gòu)生成視頻,每段視頻包含 49 幀,僅用 4 臺 Nvidia A100 GPU 訓(xùn)練一天完成。

訓(xùn)練數(shù)據(jù)完全為合成:全局力數(shù)據(jù)包括 1.5 萬段不同風(fēng)力下旗幟飄動的視頻;局部力數(shù)據(jù)則有 1.2 萬段滾動球體和 1.1 萬段花朵受沖擊反應(yīng)的視頻。

在生成過程中,文本描述中在加入“風(fēng)”或“氣泡”等物理術(shù)語后,模型會自動建立正確的力與運(yùn)動關(guān)系。訓(xùn)練樣本結(jié)合文本提示、起始圖像和物理力(全局力為完整矢量場,局部力為方向、位置和強(qiáng)度的動態(tài)信號),并通過隨機(jī)化背景、光線和視角增加多樣性。

盡管訓(xùn)練數(shù)據(jù)有限,模型展現(xiàn)出強(qiáng)大的泛化能力,能適應(yīng)新物體、材質(zhì)和場景,甚至掌握簡單物理規(guī)則,如相同力下,輕物移動距離比重物遠(yuǎn)。

用戶測試中,“力提示”技術(shù)在運(yùn)動匹配度和真實(shí)感上優(yōu)于純文本或運(yùn)動路徑控制的基準(zhǔn)模型,甚至超越依賴真實(shí)物理模擬的 PhysDreamer(僅在圖像質(zhì)量上稍遜)。然而,復(fù)雜場景中仍存缺陷,例如煙霧有時(shí)無視風(fēng)力,人體手臂偶爾像布料般移動。

DeepMind 首席執(zhí)行官 Demis Hassabis 近期表示,新一代 AI 視頻模型(如 Veo 3)正逐步理解物理規(guī)則,不再局限于文本或圖像處理,而是開始表征世界的物理結(jié)構(gòu)。他認(rèn)為這是通向更通用 AI 的關(guān)鍵一步,未來 AI 可能不再僅僅依賴數(shù)據(jù),而是能在模擬環(huán)境中通過經(jīng)驗(yàn)學(xué)習(xí)。

IT之家附上參考地址

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:DeepMind,AI

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知