在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

美團發(fā)布開源 LongCat-Video 視頻生成模型,可穩(wěn)定輸出 5 分鐘級內(nèi)容

2025/10/27 10:50:44 來源:IT之家 作者:清源 責編:清源

IT之家 10 月 27 日消息,今天上午,美團 LongCat 團隊發(fā)布并開源 LongCat-Video 視頻生成模型。根據(jù)官方介紹,其以統(tǒng)一模型在文生、圖生視頻基礎(chǔ)任務(wù)上達到開源 SOTA(最先進水平),并依托原生視頻續(xù)寫任務(wù)預訓練,實現(xiàn)分鐘級長視頻連貫生成,保障跨幀時序一致性與物理運動合理性,在長視頻生成領(lǐng)域具備顯著優(yōu)勢。

圖片

根據(jù)介紹,近年來,“世界模型”(World Model)可讓人工智能真正理解、預測甚至重構(gòu)真實世界,從而被視作通往下一代智能的核心引擎。作為能夠建模物理規(guī)律、時空演化與場景邏輯的智能系統(tǒng),“世界模型”賦予人工智能“看見”世界運行本質(zhì)的能力。而視頻生成模型有望成為構(gòu)建世界模型的關(guān)鍵路徑:通過視頻生成任務(wù)壓縮幾何、語義、物理等多種形式的知識,人工智能得以在數(shù)字空間中模擬、推演乃至預演真實世界的運行。

作為基于 Diffusion Transformer(DiT)架構(gòu)的多功能統(tǒng)一視頻生成基座,LongCat-Video 創(chuàng)新通過“條件幀數(shù)量”實現(xiàn)任務(wù)區(qū)分 —— 文生視頻無需條件幀、圖生視頻輸入 1 幀參考圖、視頻續(xù)寫依托多幀前序內(nèi)容,原生支持三大核心任務(wù)且無需額外模型適配,形成“文生 / 圖生 / 視頻續(xù)寫”完整任務(wù)閉環(huán)。

  • 文生視頻:可生成 720p、30fps 高清視頻,能精準解析文本中物體、人物、場景、風格等細節(jié)指令,語義理解與視覺呈現(xiàn)能力達開源 SOTA 級別。

  • 圖生視頻:嚴格保留參考圖像的主體屬性、背景關(guān)系與整體風格,動態(tài)過程符合物理規(guī)律,支持詳細指令、簡潔描述、空指令等多類型輸入,內(nèi)容一致性與動態(tài)自然度表現(xiàn)優(yōu)異。

  • 視頻續(xù)寫:視頻續(xù)寫是 LongCat Video 的核心差異化能力,可基于多幀條件幀續(xù)接視頻內(nèi)容,為長視頻生成提供原生技術(shù)支撐。

依托視頻續(xù)寫任務(wù)預訓練、Block-Causual Attention 機制和 GRPO 后訓練,LongCat-Video 可穩(wěn)定輸出 5 分鐘級別的長視頻,且無質(zhì)量損失,號稱達到行業(yè)“頂尖”水平。

IT之家附有關(guān)鏈接如下:

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:美團,人工智能,LongCat

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知