在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

阿里云通義千問 Qwen 3 旗艦版模型宣布更新:性能全面提升,超越 Kimi、DeepSeek 等行業(yè)頂尖水平

2025/7/22 6:34:44 來源:IT之家 作者:問舟 責(zé)編:問舟
感謝IT之家網(wǎng)友 HuTao29、天天潛水 的線索投遞!

IT之家 7 月 22 日消息,阿里云今天更新了旗艦版 Qwen3 模型,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名為 Qwen3-235B-A22B-Instruct-2507-FP8。

阿里云表示,在經(jīng)過與社區(qū)溝通和深思熟慮后,決定停止使用混合思考模式,轉(zhuǎn)為分別訓(xùn)練 Instruct 和 Thinking 模型,以獲得最佳質(zhì)量。

據(jù)介紹,新的 Qwen3 模型通用能力顯著提升,包括指令遵循、邏輯推理、文本理解、數(shù)學(xué)、科學(xué)、編程及工具使用等方面,在 GQPA(知識)、AIME25(數(shù)學(xué))、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)、BFCL(Agent 能力)等眾多測評中表現(xiàn)出色,超過 Kimi-K2、DeepSeek-V3 等頂級開源模型以及 Claude-Opus4-Non-thinking 等領(lǐng)先閉源模型。

模型概述

FP8 版本的 Qwen3-235B-A22B-Instruct-2507 具有以下功能特點(diǎn):

  • 類型:因果語言模型 / 自回歸語言模型

  • 訓(xùn)練階段:預(yù)訓(xùn)練與后訓(xùn)練

  • 參數(shù)量:總共 235B,激活 22B

  • 參數(shù)量(非嵌入):234B

  • 層數(shù):94

  • 注意頭數(shù)(GQA): Q 為 64,KV 為 4

  • 專家數(shù):128

  • 激活專家數(shù):8

  • 上下文長度:原生支持 262,144。

阿里云表示,本次更新的 Qwen3 模型,還增強(qiáng)了以下關(guān)鍵性能:

  • 在多語言的長尾知識覆蓋方面,模型取得顯著進(jìn)步。

  • 在主觀及開放性任務(wù)中,模型顯著增強(qiáng)了對用戶偏好的契合能力,能夠提供更有用的回復(fù),生成更高質(zhì)量的文本。

  • 長文本提升到 256K,上下文理解能力進(jìn)一步增強(qiáng)。

目前,Qwen3 新模型已在魔搭社區(qū)和 HuggingFace 上開源更新,IT之家附官方地址:

  • 官網(wǎng)地址:https://chat.qwen.ai/

  • HuggingFace:https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8

  • 魔塔社區(qū):https://modelscope.cn/models/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Qwen3 模型,阿里云

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知