在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

Meta 開源 MobileLLM-R1 系列小語(yǔ)言 AI 模型:參數(shù)量不到 10 億、專攻數(shù)學(xué)編程科學(xué)問(wèn)題

2025/9/22 20:04:50 來(lái)源:IT之家 作者:漾仔 責(zé)編:漾仔

IT之家 9 月 22 日消息,Meta 現(xiàn)已公布了 MobileLLM-R1 系列小語(yǔ)言模型,分別提供 1.4 億、3.6 億和 9.5 億不同參數(shù)版本,強(qiáng)調(diào)能夠在本地移動(dòng)平臺(tái)等輕量級(jí)設(shè)備上運(yùn)行。

Meta 表示,MobileLLM-R1 并不是面向聊天機(jī)器人的通用模型,而是經(jīng)過(guò)監(jiān)督式微調(diào)(SFT)專門訓(xùn)練,主要用于解決數(shù)學(xué)、編程(如 Python、C++)和科學(xué)類問(wèn)題,以最大規(guī)模的 MobileLLM-R1 950M 為例,其預(yù)訓(xùn)練數(shù)據(jù)僅使用了約 2TB 高質(zhì)量 token,總訓(xùn)練數(shù)據(jù)量也不到 5TB,但表現(xiàn)依然出色。在 MATH、GSM8K、MMLU、LiveCodeBench 等多項(xiàng)基準(zhǔn)測(cè)試中,成績(jī)超過(guò)了使用 36TB token 數(shù)據(jù)訓(xùn)練的 Qwen 3-0.6B。

在對(duì)比現(xiàn)有開源小模型時(shí),MobileLLM-R1 950M 在 MATH 測(cè)試中的準(zhǔn)確率是 Olmo 1.24B 的 5 倍,也是 SmolLM 1.7B 的 2 倍。在編程任務(wù)中,其表現(xiàn)同樣優(yōu)于 Olmo 1.24B 和 SmolLM 1.7B。

目前,開發(fā)者可以通過(guò) vLLM 推理引擎運(yùn)行 MobileLLM-R1,只需在 ModelRegistry 中登記模型架構(gòu) Llama4ForCausalLM 即可。該系列模型已以 Apache 2.0 協(xié)議開源,并發(fā)布在 Hugging Face 平臺(tái)(點(diǎn)此訪問(wèn))。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:MetaAI 模型

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知