IT之家 11 月 7 日消息,繼快手、商湯、Minimax 等公司后,字節(jié)跳動正式殺入 AI 視頻生成領域。
《科創(chuàng)板日報》稱,字節(jié)跳動旗下大模型 AI 助手豆包正式推出視頻生成內(nèi)測,支持圖片文字一鍵成片、動態(tài)運鏡和多鏡頭一致性、風格比例隨意挑選。
據(jù)火山引擎總裁譚待介紹,豆包視頻生成大模型支持多風格多比例的一致性多鏡頭生成,可應用在電商營銷、動畫教育、城市文旅、微劇本等領域。他表示,無論是語義理解能力,多個主體運動的復雜交互畫面,還是多鏡頭切換的內(nèi)容一致性,豆包視頻生成大模型均達到業(yè)界先進水平。
此前視頻生成模型大多只能完成簡單指令,豆包視頻生成模型則能實現(xiàn)自然連貫的多拍動作與多主體復雜交互。有創(chuàng)作者在搶鮮體驗豆包視頻生成模型時發(fā)現(xiàn),其生成的視頻不僅能夠遵循復雜指令,讓不同人物完成多個動作指令的互動,人物樣貌、服裝細節(jié)甚至頭飾在不同運鏡下也保持一致,接近實拍效果。
據(jù)火山引擎介紹,豆包視頻生成模型基于 DiT 架構(gòu),通過高效的 DiT 融合計算單元,讓視頻在大動態(tài)與運鏡中自由切換,擁有變焦、環(huán)繞、平搖、縮放、目標跟隨等多鏡頭語言能力。豆包視頻生成模型具備專業(yè)級光影布局和色彩調(diào)和,畫面視覺極具美感和真實感。
深度優(yōu)化的 Transformer 結(jié)構(gòu),則大幅提升了豆包視頻生成的泛化能力,支持 3D 動畫、2D 動畫、國畫、黑白、厚涂等多種風格,適配電影、電視、電腦、手機等各種設備的比例,不僅適用于電商營銷、動畫教育、城市文旅、微劇本等企業(yè)場景,也能為專業(yè)創(chuàng)作者和藝術家們提供創(chuàng)作輔助。
目前豆包視頻生成模型 Pixeldance 和 Seaweed 已在火山引擎開啟邀測,企業(yè)可通過火山引擎官網(wǎng)邀測報名入口提交測試申請。IT之家注意到,即夢 AI 已經(jīng)接入了豆包視頻生成模型,正在進行小范圍內(nèi)測。
相關閱讀:
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。