在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

阿里通義千問 2.5-Omni-3B AI 全模態(tài)登場:7B 版 90% 性能,顯存占用減少 53%

2025/5/1 10:30:28 來源:IT之家 作者:故淵 責(zé)編:故淵
感謝IT之家網(wǎng)友 小星_14 的線索投遞!

IT之家 5 月 1 日消息,阿里巴巴持續(xù)發(fā)力 AI 領(lǐng)域,其 Qwen 團隊于 3 月發(fā)布 Qwen2.5-Omni-7B 模型后,昨日(4 月 30 日)再次發(fā)布 Qwen2.5-Omni-3B,目前可以在 Hugging Face 上開放下載。

IT之家注:這款 3B 參數(shù)模型是其 7B 旗艦多模態(tài)模型的輕量版本,專為消費級硬件設(shè)計,覆蓋文本、音頻、圖像和視頻等多種輸入功能。

團隊表示,盡管參數(shù)規(guī)??s小,3B 版本在多模態(tài)性能上仍保持了 7B 模型的 90% 以上,尤其在實時文本生成和自然語音輸出方面表現(xiàn)亮眼。

基準測試顯示,其在視頻理解(VideoBench: 68.8)和語音生成(Seed-tts-eval test-hard: 92.1)等任務(wù)中接近 7B 模型水平。

Qwen2.5-Omni-3B 在內(nèi)存使用上的改進尤為突出。團隊報告稱,處理 25,000 token 的長上下文輸入時,該模型 VRAM 占用減少 53%,從 7B 模型的 60.2 GB 降至 28.2 GB。

這意味著該模型可在 24GB GPU 上運行,無需企業(yè)級 GPU 集群支持,可以在高端臺式機和筆記本電腦上運行。

其架構(gòu)創(chuàng)新,如 Thinker-Talker 設(shè)計和定制位置嵌入方法 TMRoPE,確保了視頻與音頻輸入的同步理解。此外,模型支持 FlashAttention 2 和 BF16 精度優(yōu)化,進一步提升速度并降低內(nèi)存消耗。

Qwen2.5-Omni-3B 的使用受到嚴格限制。根據(jù)許可條款,該模型僅限研究用途,企業(yè)若想開發(fā)商業(yè)產(chǎn)品,必須先從阿里巴巴 Qwen 團隊獲取單獨許可,意味著該模型非直接生產(chǎn)部署,定位更偏向于測試和原型開發(fā)。

參考

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Qwen,阿里,AI

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知