IT之家 10 月 5 日消息,“華為計(jì)算”公眾號昨日(10 月 4 日)宣布,昇騰 0day 支持 Qwen3-VL-30B-A3B 模型適配。
昨日,阿里云通義千問 Qwen3 系列模型發(fā)布并開源其新一代多模態(tài)模型:Qwen3-VL-30B-A3B-Thinking 和 Qwen3-VL-30B-A3B-Instruct。Qwen3-VL 是一個(gè)多模態(tài)視覺語言模型系列,基于其前代產(chǎn)品,Qwen3-VL 在視覺理解方面實(shí)現(xiàn)了顯著提升,同時(shí)保持了強(qiáng)大的純文本處理能力。

主要增強(qiáng)功能:
視覺代理:操作 PC / 移動端圖形用戶界面 — 識別元素、理解功能、調(diào)用工具、完成任務(wù)。
視覺編碼增強(qiáng):從圖像 / 視頻生成 Draw.io/ HTML / CSS / JS。
高級空間感知:判斷對象位置、視角和遮擋;提供更強(qiáng)的 2D 基礎(chǔ),并為空間推理和具身人工智能實(shí)現(xiàn) 3D 基礎(chǔ)。
長上下文與視頻理解:原生 256K 上下文,可擴(kuò)展至 1M;能夠處理書籍和數(shù)小時(shí)長的視頻,具有完整回憶和秒級索引功能。
增強(qiáng)的多模態(tài)推理:在 STEM / 數(shù)學(xué)領(lǐng)域表現(xiàn)出色 —— 能夠進(jìn)行因果分析和提供基于邏輯與證據(jù)的答案。
升級的視覺識別:通過更廣泛、更高質(zhì)量的預(yù)訓(xùn)練,能夠 " 識別一切 "—— 名人、動漫、產(chǎn)品、地標(biāo)、動植物等。
擴(kuò)展的 OCR 功能:支持 32 種語言(此前為 19 種);在低光、模糊和傾斜情況下表現(xiàn)穩(wěn)健;更好地處理罕見 / 古文字和專業(yè)術(shù)語;改進(jìn)了長文檔結(jié)構(gòu)解析。
與純 LLMs 相當(dāng)?shù)奈谋纠斫饽芰Γ簾o縫的文本-視覺融合,實(shí)現(xiàn)無損、統(tǒng)一的理解。
IT之家注意到,此前昇騰一直同步支持 Qwen 系列模型,此次 Qwen3-VL-30B-A3B-Thinking 和 Qwen3-VL-30B-A3B-Instruct 模型一經(jīng)發(fā)布開源,即在 LLaMA Factory 和 vLLM 中開箱即用,實(shí)現(xiàn)模型的 0Day 適配。
值得一提的是,DeepSeek-V3.2-Exp 于 9 月 29 日發(fā)布并開源,引入稀疏 Attention 架構(gòu)。華為當(dāng)晚便宣布昇騰已快速基于 vLLM/SGLang 等推理框架完成適配部署,實(shí)現(xiàn) DeepSeek-V3.2-Exp 0day 支持,并面向開發(fā)者開源所有推理代碼和算子實(shí)現(xiàn)。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。