在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

新浪微博發(fā)布其首個開源大模型 VibeThinker-1.5B,小模型挑戰(zhàn)巨量參數(shù)對手

2025/11/13 19:47:40 來源:IT之家 作者:遠(yuǎn)洋 責(zé)編:遠(yuǎn)洋
感謝IT之家網(wǎng)友 軟媒用戶389454 的線索投遞!

IT之家 11 月 13 日消息,今日新浪微博發(fā)布了其首個開源大模型 VibeThinker-1.5B,號稱“小模型也可以有大智慧”。

IT之家附官方介紹如下:

目前業(yè)界最強(qiáng)大模型參數(shù)量大都超過了 1T,甚至出現(xiàn)了 2T 規(guī)模的模型,是否只有巨量參數(shù)模型才有高度的智能?是否只有少量科技巨頭才有能力做大模型?

VibeThinker-1.5B,正是微博 AI 對此問題給出的否定答案,它證明了小模型也可以有高智商。這意味著做最強(qiáng)大模型不再像傳統(tǒng)觀念以為的那樣主要依賴推高參數(shù)量,也可以通過巧妙的算法設(shè)計來做到這一點。

這款模型僅有 1.5B (15 億) 參數(shù),經(jīng)過微博 AI 研發(fā)人員提出的創(chuàng)新“頻譜到信號原理”(SSP)方法訓(xùn)練后,其效果堪稱顛覆:VibeThinker 在 AIME24、AIME25 以及 HMMT25 三個高難度數(shù)學(xué)測試集上的表現(xiàn),超越了參數(shù)量超其 400 倍的模型 DeepSeek-R1-0120 版本(模型大小 671B),與規(guī)模為 456B 的 MiniMax-M1 效果接近或相當(dāng);在 LiveCodeBench v6(編程算法題測試集)中的成績,成功追平參數(shù)量數(shù)超其數(shù)十倍的模型,比如歐洲領(lǐng)先 AI 企業(yè) Minstral.AI 的深度思考模型 Magistral-Medium-2506 版本。

VibeThinker 能力強(qiáng)大不靠堆參數(shù),而是源于微博研發(fā)人員提出的 SSP 訓(xùn)練理念,即在學(xué)習(xí)階段先鼓勵模型發(fā)散探索所有可能的解題路徑,而非一味關(guān)注正確率;隨后,通過強(qiáng)化學(xué)習(xí)進(jìn)行高效策略優(yōu)化,精準(zhǔn)鎖定正確路徑,將模型性能提升至極致。

模型的單次“后訓(xùn)練”(Post-Training)成本不足 8000 美元,與此對應(yīng),DeepSeek-R1 和 MiniMax-M1 的后訓(xùn)練成本分別是 29 萬及 53 萬美元,降低了幾十倍。

VibeThinker-1.5B 的開源,旨在為全球計算資源有限的中型企業(yè)及高校研究團(tuán)隊,提供一條高性價比的研發(fā)新路徑,使得人人都可以訓(xùn)練最前沿的大模型,而不是像之前一樣被排斥在外,這對于業(yè)界技術(shù)進(jìn)步至關(guān)重要。

Github:https://github.com/WeiboAI/VibeThinker

HuggingFace:https://huggingface.co/WeiboAI/VibeThinker-1.5B

Arxiv:https://arxiv.org/pdf/2511.06221

ModelScope:https://www.modelscope.cn/models/WeiboAI/VibeThinker-1.5B

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:開源,大模型,微博

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知