IT之家 4 月 23 日消息,Character.AI 公司今天(4 月 23 日)在 X 平臺發(fā)布推文,宣布推出 AvatarFX 模型,能夠讓靜態(tài)圖片中的人物“開口說話”。
用戶只需上傳一張圖片并挑選一個聲音,平臺即可生成會說話、會移動的形象。這些形象還能展現(xiàn)情感,呈現(xiàn)出令人驚嘆的真實感和流暢度。

公司表示,這得益于一種名為“SOTA DiT-based diffusion video generation model”的先進 AI 模型。該模型經過精心訓練,結合音頻條件優(yōu)化技術,能高效生成高質量視頻。IT之家附上演示視頻如下:
AvatarFX 的技術亮點在于其“高保真、時間一致性”的視頻生成能力。即便面對多角色、長序列或多輪對話的復雜場景,它也能保持驚人的速度和穩(wěn)定性。與 OpenAI 的 Sora 和 Google 的 Veo 等競爭對手相比,AvatarFX 并非從零開始或基于文本生成視頻,而是專注于將特定圖片動畫化。
這種獨特的工作流程為用戶提供了新穎體驗,但也帶來了潛在風險。用戶可能上傳名人或熟人照片,制作看似真實的虛假視頻,引發(fā)隱私和倫理爭議。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。