在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

美團(tuán)開源虛擬人視頻生成模型 LongCat-Video-Avatar:號稱“不說話”時都像人

2025/12/18 17:57:08 來源:IT之家 作者:清源 責(zé)編:清源
感謝IT之家網(wǎng)友 斯文當(dāng)不了飯吃Diixx 的線索投遞!

IT之家 12 月 18 日消息,據(jù)“龍貓 LongCat”公眾號今晚的推文,美團(tuán) LongCat 團(tuán)隊(duì)正式發(fā)布并開源 SOTA 級虛擬人視頻生成模型 ——LongCat-Video-Avatar。

該模型基于 LongCat-Video 基座打造,延續(xù)“一個模型支持多任務(wù)”的核心設(shè)計,原生支持 Audio-Text-to-Video、Audio-Text-Image-to-Video 及視頻續(xù)寫等核心功能,同時在底層架構(gòu)上全面升級,實(shí)現(xiàn)動作擬真度、長視頻穩(wěn)定性與身份一致性三大維度的突破。

圖片

據(jù)官方介紹,該模型具備如下技術(shù)亮點(diǎn)。

“告別僵硬,迎接鮮活”:不僅能指揮嘴型,還能同步指揮眼神、表情和肢體動作,實(shí)現(xiàn)豐富飽滿的情感表達(dá)。

連“不說話”的時候,都很像人:美團(tuán)通過 Disentangled Unconditional Guidance(解耦無條件引導(dǎo))訓(xùn)練方法,讓模型明白了“靜音”不等于“死機(jī)”。在說話的間歇,虛擬人也會如同人類一般自然地眨眼、調(diào)整坐姿、放松肩膀

據(jù)介紹,LongCat-Video-Avatar 因此成為首個同時支持文字、圖片、視頻三種生成模式的“全能選手”,虛擬人從此有了“真正的生命力”。

在 HDTF、CelebV-HQ 、EMTD 和 EvalTalker 等權(quán)威公開數(shù)據(jù)集上的定量評測表明,LongCat-Video-Avatar 在多項(xiàng)核心指標(biāo)上達(dá)到 SOTA 領(lǐng)先水平。

圖片

IT之家附項(xiàng)目地址:

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:美團(tuán),數(shù)字人,虛擬人,人工智能

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知