在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

阿里萬相視頻生成大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora

2025/2/25 22:49:15 來源:IT之家 作者:汪淼 責(zé)編:汪淼

IT之家 2 月 25 日消息,阿里云今日宣布旗下視覺生成基座模型萬相 2.1(Wan)開源。

此次開源采用最寬松的 Apache2.0 協(xié)議,14B 和 1.3B 兩個參數(shù)規(guī)格的全部推理代碼和權(quán)重全部開源,同時支持文生視頻和圖生視頻任務(wù),全球開發(fā)者可在 Github、HuggingFace 和魔搭社區(qū)下載體驗。

據(jù)介紹,14B 萬相模型在指令遵循、復(fù)雜運動生成、物理建模、文字視頻生成等方面表現(xiàn)突出,在評測集 VBench 中,萬相 2.1 以總分 86.22% 的成績超越 Sora、Luma、Pika 等國內(nèi)外模型,位列榜首。1.3B 版本測試結(jié)果不僅超過了更大尺寸的開源模型,甚至還接近部分閉源模型,同時能在消費級顯卡運行,號稱“僅需 8.2GB 顯存就可以生成 480P 視頻”,適用于二次模型開發(fā)和學(xué)術(shù)研究。

萬相視頻模型架構(gòu)圖

萬相視頻模型架構(gòu)圖

在算法設(shè)計上,萬相基于主流 DiT 架構(gòu)和線性噪聲軌跡 Flow Matching 范式,研發(fā)了高效的因果 3D VAE、可擴(kuò)展的預(yù)訓(xùn)練策略等。以 3D VAE 為例,為了高效支持任意長度視頻的編碼和解碼,萬相在 3D VAE 的因果卷積模塊中實現(xiàn)了特征緩存機(jī)制,從而代替直接對長視頻端到端的編解碼過程,實現(xiàn)了無限長 1080P 視頻的高效編解碼。此外,通過將空間降采樣壓縮提前,在不損失性能的情況下進(jìn)一步減少了 29% 的推理時內(nèi)存占用。

圖片

萬相團(tuán)隊的實驗結(jié)果顯示,在運動質(zhì)量、視覺質(zhì)量、風(fēng)格和多目標(biāo)等 14 個主要維度和 26 個子維度測試中,萬相均達(dá)到了業(yè)界領(lǐng)先表現(xiàn),并且斬獲 5 項第一。

圖片

IT之家附開源地址:

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:阿里萬相,阿里AI,阿里模型,阿里開源,開源模型

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知