IT之家 2 月 15 日消息,稀宇科技 2 月 13 日正式發(fā)布并開(kāi)源新一代旗艦?zāi)P?MiniMax M2.5。該模型在編程開(kāi)發(fā)、工具調(diào)用及辦公生產(chǎn)力場(chǎng)景實(shí)現(xiàn)技術(shù)突破。
華為官方昨晚宣布,昇騰團(tuán)隊(duì)通過(guò) AI 基礎(chǔ)軟硬件與 AI Agent 技術(shù),在 MiniMax M2.5 模型開(kāi)源數(shù)小時(shí)內(nèi)即實(shí)現(xiàn)昇騰 Atlas 800 A2/A3 全系列硬件的適配部署,并在多個(gè)現(xiàn)網(wǎng)局點(diǎn)試用,為 MiniMax M2.5 的規(guī)模化落地提供全流程算力支撐。
據(jù)介紹,華為昇騰采用 TP+EP 混合并行策略,原生支持 192K 上下文長(zhǎng)度,無(wú)需截?cái)嗵幚泶a倉(cāng)庫(kù)級(jí)分析等復(fù)雜場(chǎng)景。通過(guò) ACLGraph 加速、Expert Parallel 調(diào)度及 FlashComm1 通信優(yōu)化,顯著提升多卡并行效率。同時(shí)實(shí)現(xiàn) FP8 權(quán)重原生加載功能,用戶(hù)可直接部署官方模型權(quán)重。

據(jù)華為介紹,MiniMax M2.5 在金融建模、文檔處理等場(chǎng)景的平均任務(wù)勝率達(dá) 59.0%。
MiniMax M2.5 具備架構(gòu)師級(jí)別的編程思維,可在寫(xiě)代碼前主動(dòng)拆解功能、設(shè)計(jì)結(jié)構(gòu)與 UI,完成全流程前期規(guī)劃。支持 GO、C++、Python 等超 10 種編程語(yǔ)言,能勝任復(fù)雜系統(tǒng)從 0-1 設(shè)計(jì)、1-10 開(kāi)發(fā)、90-100 測(cè)試的全流程開(kāi)發(fā),覆蓋 Web、Android、iOS 等多平臺(tái)全棧項(xiàng)目。
在工具調(diào)用與搜索能力上,MiniMax M2.5 模型優(yōu)化了決策邏輯,以更精簡(jiǎn)的搜索輪次和更高的 token 效率解決問(wèn)題,在真實(shí)專(zhuān)家級(jí)搜索任務(wù) RISE 評(píng)測(cè)中表現(xiàn)卓越。例如,在 BrowseComp、Wide Search 和 RISE 等多項(xiàng)任務(wù)中,M2.5 以更低的輪次消耗取得了更優(yōu)的效果,相較于 M2.1 節(jié)省了大約 20% 的輪次消耗。這表明模型不再只是“做對(duì)”題目,而是能以更精簡(jiǎn)的路徑逼近結(jié)果。
在辦公場(chǎng)景中,MiniMax M2.5 模型可直接交付專(zhuān)業(yè)級(jí)產(chǎn)出,在金融建模、文檔排版、數(shù)據(jù)分析等高階場(chǎng)景實(shí)現(xiàn) 59.0% 的平均勝率。
IT之家附官網(wǎng)部署步驟與啟動(dòng)參數(shù)參考資料:
https://ai.gitcode.com/Ascend-SACT/MiniMax-M2.5
相關(guān)閱讀:
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。