新浪微博發(fā)布其首個開源大模型 VibeThinker-1.5B，小模型挑戰(zhàn)巨量參數對手

2025/11/13 19:47:40 來源：IT之家作者：遠洋責編：遠洋

評論：

感謝IT之家網友軟媒用戶389454 的線索投遞！

IT之家 11 月 13 日消息，今日新浪微博發(fā)布了其首個開源大模型 VibeThinker-1.5B，號稱“小模型也可以有大智慧”。

IT之家附官方介紹如下：

目前業(yè)界最強大模型參數量大都超過了 1T，甚至出現了 2T 規(guī)模的模型，是否只有巨量參數模型才有高度的智能？是否只有少量科技巨頭才有能力做大模型？

VibeThinker-1.5B，正是微博 AI 對此問題給出的否定答案，它證明了小模型也可以有高智商。這意味著做最強大模型不再像傳統(tǒng)觀念以為的那樣主要依賴推高參數量，也可以通過巧妙的算法設計來做到這一點。

這款模型僅有 1.5B (15 億) 參數，經過微博 AI 研發(fā)人員提出的創(chuàng)新“頻譜到信號原理”（SSP）方法訓練后，其效果堪稱顛覆：VibeThinker 在 AIME24、AIME25 以及 HMMT25 三個高難度數學測試集上的表現，超越了參數量超其 400 倍的模型 DeepSeek-R1-0120 版本（模型大小 671B），與規(guī)模為 456B 的 MiniMax-M1 效果接近或相當；在 LiveCodeBench v6（編程算法題測試集）中的成績，成功追平參數量數超其數十倍的模型，比如歐洲領先 AI 企業(yè) Minstral.AI 的深度思考模型 Magistral-Medium-2506 版本。

新浪微博發(fā)布其首個開源大模型 VibeThinker-1.5B，小模型挑戰(zhàn)巨量參數對手

VibeThinker 能力強大不靠堆參數，而是源于微博研發(fā)人員提出的 SSP 訓練理念，即在學習階段先鼓勵模型發(fā)散探索所有可能的解題路徑，而非一味關注正確率；隨后，通過強化學習進行高效策略優(yōu)化，精準鎖定正確路徑，將模型性能提升至極致。

模型的單次“后訓練”（Post-Training）成本不足 8000 美元，與此對應，DeepSeek-R1 和 MiniMax-M1 的后訓練成本分別是 29 萬及 53 萬美元，降低了幾十倍。

VibeThinker-1.5B 的開源，旨在為全球計算資源有限的中型企業(yè)及高校研究團隊，提供一條高性價比的研發(fā)新路徑，使得人人都可以訓練最前沿的大模型，而不是像之前一樣被排斥在外，這對于業(yè)界技術進步至關重要。

Github：https://github.com/WeiboAI/VibeThinker

HuggingFace：https://huggingface.co/WeiboAI/VibeThinker-1.5B

Arxiv：https://arxiv.org/pdf/2511.06221

ModelScope：https://www.modelscope.cn/models/WeiboAI/VibeThinker-1.5B

廣告聲明：文內含有的對外跳轉鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

關鍵詞：開源，大模型，微博

新浪微博發(fā)布其首個開源大模型 VibeThinker-1.5B，小模型挑戰(zhàn)巨量參數對手

相關文章

新浪微博發(fā)布其首個開源大模型 VibeThinker-1.5B，小模型挑戰(zhàn)巨量參數對手