在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

浪潮源 Yuan 3.0 Flash 多模態(tài)基礎(chǔ)大模型開(kāi)源發(fā)布:40B 參數(shù)規(guī)模,單次推理僅激活約 3.7B

2025/12/31 17:28:55 來(lái)源:IT之家 作者:汪淼 責(zé)編:汪淼

IT之家 12 月 31 日消息,浪潮旗下 YuanLab.ai 團(tuán)隊(duì) 12 月 30 日開(kāi)源發(fā)布源 Yuan 3.0 Flash 多模態(tài)基礎(chǔ)大模型

Yuan 3.0 Flash 是一款 40B 參數(shù)規(guī)模的多模態(tài)基礎(chǔ)大模型,采用稀疏混合專家(MoE)架構(gòu),單次推理僅激活約 3.7B 參數(shù)。

Yuan 3.0 Flash 提出和采用了強(qiáng)化學(xué)習(xí)訓(xùn)練方法(RAPO),通過(guò)反思抑制獎(jiǎng)勵(lì)機(jī)制(RIRM),從訓(xùn)練層面引導(dǎo)模型減少無(wú)效反思,在提升推理準(zhǔn)確性的同時(shí),大幅壓縮了推理過(guò)程的 token 消耗,降低算力成本。

Yuan 3.0 Flash 由視覺(jué)編碼器、語(yǔ)言主干網(wǎng)絡(luò)以及多模態(tài)對(duì)齊模塊組成

  • 語(yǔ)言主干網(wǎng)絡(luò)采用局部過(guò)濾增強(qiáng)的 Attention 結(jié)構(gòu)(LFA)和混合專家(MoE)結(jié)構(gòu),在提升注意力精度的同時(shí),降低訓(xùn)練與推理的算力開(kāi)銷;

  • 多模態(tài)方面,采用視覺(jué)編碼器,將視覺(jué)信號(hào)轉(zhuǎn)化為 token,與語(yǔ)言 token 一起輸入到語(yǔ)言主干網(wǎng)絡(luò),通過(guò)多模態(tài)對(duì)齊模塊實(shí)現(xiàn)高效、穩(wěn)定的跨模態(tài)特征對(duì)齊;

  • 同時(shí),引入自適應(yīng)圖像分割機(jī)制,在支持高分辨率圖像理解的同時(shí),降低顯存需求及算力開(kāi)銷。

圖片

在企業(yè)場(chǎng)景的 RAG(ChatRAG)、多模態(tài)檢索(Docmatix)、多模態(tài)表格理解(MMTab)、摘要生成(SummEval)等任務(wù)中,Yuan 3.0 Flash 的表現(xiàn)已優(yōu)于 GPT-5.1。

在多模態(tài)推理與語(yǔ)言推理評(píng)測(cè)中,Yuan 3.0 Flash(40B)精度接近 Qwen3-VL235B-A22B(235B)與 DeepSeek-R1-0528(671B),但 token 消耗僅約為其 1/4 ~ 1/2,降低了企業(yè)大模型應(yīng)用成本。

圖片

Yuan 3.0 Flash 全面開(kāi)源,全系列模型參數(shù)和代碼均可免費(fèi)下載使用,IT之家附開(kāi)源地址如下:

https://github.com/Yuan-lab-LLM/Yuan3.0

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:開(kāi)源模型,Yuan 3.0 Flash

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知