無需 3D 模型 / 物理引擎：谷歌 DeepMind 聯(lián)合開發(fā)力提示技術(shù)，AI 生成視頻可模擬真實(shí)運(yùn)動

2025/6/4 8:30:08 來源：IT之家作者：故淵責(zé)編：故淵

評論：

IT之家 6 月 4 日消息，科技媒體 The Decoder 昨日（6 月 3 日）發(fā)布博文，報(bào)道稱谷歌 DeepMind 團(tuán)隊(duì)攜手布朗大學(xué)，為視頻生成模型開發(fā)“力提示”（force prompting）技術(shù)，可以在無需 3D 模型或物理引擎的情況下，生成逼真的運(yùn)動效果。

用戶只需指定力的方向和強(qiáng)度，就能操控 AI 生成的視頻內(nèi)容，該技術(shù)支持全局力（如風(fēng)吹過整個(gè)畫面）和局部力（如特定點(diǎn)的敲擊）兩種力量。這些力以矢量場形式輸入系統(tǒng)，隨后被轉(zhuǎn)化為自然流暢的運(yùn)動。

Deepmind's

研究團(tuán)隊(duì)基于 CogVideoX-5B-I2V 視頻模型，加入 ControlNet 模塊處理物理控制數(shù)據(jù)，信號通過 Transformer 架構(gòu)生成視頻，每段視頻包含 49 幀，僅用 4 臺 Nvidia A100 GPU 訓(xùn)練一天完成。

無需 3D 模型 / 物理引擎：谷歌 DeepMind 聯(lián)合開發(fā)力提示技術(shù)，AI 生成視頻可模擬真實(shí)運(yùn)動

訓(xùn)練數(shù)據(jù)完全為合成：全局力數(shù)據(jù)包括 1.5 萬段不同風(fēng)力下旗幟飄動的視頻；局部力數(shù)據(jù)則有 1.2 萬段滾動球體和 1.1 萬段花朵受沖擊反應(yīng)的視頻。

無需 3D 模型 / 物理引擎：谷歌 DeepMind 聯(lián)合開發(fā)力提示技術(shù)，AI 生成視頻可模擬真實(shí)運(yùn)動

在生成過程中，文本描述中在加入“風(fēng)”或“氣泡”等物理術(shù)語后，模型會自動建立正確的力與運(yùn)動關(guān)系。訓(xùn)練樣本結(jié)合文本提示、起始圖像和物理力（全局力為完整矢量場，局部力為方向、位置和強(qiáng)度的動態(tài)信號），并通過隨機(jī)化背景、光線和視角增加多樣性。

盡管訓(xùn)練數(shù)據(jù)有限，模型展現(xiàn)出強(qiáng)大的泛化能力，能適應(yīng)新物體、材質(zhì)和場景，甚至掌握簡單物理規(guī)則，如相同力下，輕物移動距離比重物遠(yuǎn)。

無需 3D 模型 / 物理引擎：谷歌 DeepMind 聯(lián)合開發(fā)力提示技術(shù)，AI 生成視頻可模擬真實(shí)運(yùn)動

用戶測試中，“力提示”技術(shù)在運(yùn)動匹配度和真實(shí)感上優(yōu)于純文本或運(yùn)動路徑控制的基準(zhǔn)模型，甚至超越依賴真實(shí)物理模擬的 PhysDreamer（僅在圖像質(zhì)量上稍遜）。然而，復(fù)雜場景中仍存缺陷，例如煙霧有時(shí)無視風(fēng)力，人體手臂偶爾像布料般移動。

DeepMind 首席執(zhí)行官 Demis Hassabis 近期表示，新一代 AI 視頻模型（如 Veo 3）正逐步理解物理規(guī)則，不再局限于文本或圖像處理，而是開始表征世界的物理結(jié)構(gòu)。他認(rèn)為這是通向更通用 AI 的關(guān)鍵一步，未來 AI 可能不再僅僅依賴數(shù)據(jù)，而是能在模擬環(huán)境中通過經(jīng)驗(yàn)學(xué)習(xí)。

IT之家附上參考地址

Force Prompting: Video Generation Models Can Learn and Generalize Physics-based Control Signals 論文
Force Prompting: Video Generation Models Can Learn and Generalize Physics-based Control Signals GitHub 頁面

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

無需 3D 模型 / 物理引擎：谷歌 DeepMind 聯(lián)合開發(fā)力提示技術(shù)，AI 生成視頻可模擬真實(shí)運(yùn)動

相關(guān)文章

在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

無需 3D 模型 / 物理引擎：谷歌 DeepMind 聯(lián)合開發(fā)力提示技術(shù)，AI 生成視頻可模擬真實(shí)運(yùn)動

相關(guān)文章

無需 3D 模型 / 物理引擎：谷歌 DeepMind 聯(lián)合開發(fā)力提示技術(shù)，AI 生成視頻可模擬真實(shí)運(yùn)動