Meta 開源 MobileLLM-R1 系列小語(yǔ)言 AI 模型：參數(shù)量不到 10 億、專攻數(shù)學(xué)編程科學(xué)問(wèn)題

2025/9/22 20:04:50 來(lái)源：IT之家作者：漾仔責(zé)編：漾仔

評(píng)論：

IT之家 9 月 22 日消息，Meta 現(xiàn)已公布了 MobileLLM-R1 系列小語(yǔ)言模型，分別提供 1.4 億、3.6 億和 9.5 億不同參數(shù)版本，強(qiáng)調(diào)能夠在本地移動(dòng)平臺(tái)等輕量級(jí)設(shè)備上運(yùn)行。

Meta 表示，MobileLLM-R1 并不是面向聊天機(jī)器人的通用模型，而是經(jīng)過(guò)監(jiān)督式微調(diào)（SFT）專門訓(xùn)練，主要用于解決數(shù)學(xué)、編程（如 Python、C++）和科學(xué)類問(wèn)題，以最大規(guī)模的 MobileLLM-R1 950M 為例，其預(yù)訓(xùn)練數(shù)據(jù)僅使用了約 2TB 高質(zhì)量 token，總訓(xùn)練數(shù)據(jù)量也不到 5TB，但表現(xiàn)依然出色。在 MATH、GSM8K、MMLU、LiveCodeBench 等多項(xiàng)基準(zhǔn)測(cè)試中，成績(jī)超過(guò)了使用 36TB token 數(shù)據(jù)訓(xùn)練的 Qwen 3-0.6B。

在對(duì)比現(xiàn)有開源小模型時(shí)，MobileLLM-R1 950M 在 MATH 測(cè)試中的準(zhǔn)確率是 Olmo 1.24B 的 5 倍，也是 SmolLM 1.7B 的 2 倍。在編程任務(wù)中，其表現(xiàn)同樣優(yōu)于 Olmo 1.24B 和 SmolLM 1.7B。

目前，開發(fā)者可以通過(guò) vLLM 推理引擎運(yùn)行 MobileLLM-R1，只需在 ModelRegistry 中登記模型架構(gòu) Llama4ForCausalLM 即可。該系列模型已以 Apache 2.0 協(xié)議開源，并發(fā)布在 Hugging Face 平臺(tái)（點(diǎn)此訪問(wèn)）。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

Meta 開源 MobileLLM-R1 系列小語(yǔ)言 AI 模型：參數(shù)量不到 10 億、專攻數(shù)學(xué)編程科學(xué)問(wèn)題

相關(guān)文章

在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

Meta 開源 MobileLLM-R1 系列小語(yǔ)言 AI 模型：參數(shù)量不到 10 億、專攻數(shù)學(xué)編程科學(xué)問(wèn)題

相關(guān)文章

Meta 開源 MobileLLM-R1 系列小語(yǔ)言 AI 模型：參數(shù)量不到 10 億、專攻數(shù)學(xué)編程科學(xué)問(wèn)題