在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

智譜公開最新一代大模型 GLM-5 技術(shù)細(xì)節(jié),性能顯著提升

2026/2/22 18:33:27 來源:IT之家 作者:問舟 責(zé)編:問舟

IT之家 2 月 22 日消息,智譜今日正式公開了其新一代大模型 GLM-5 的技術(shù)細(xì)節(jié)。

▲ GLM-5、DeepSeek-V3.2、Claude Opus 4.5、Gemini 3 Pro 和 GPT-5.2 對比

據(jù)介紹,該模型在智能體(Agent)、推理與編程(ARC)能力上實現(xiàn)突破,通過四大核心技術(shù)革新顯著提升性能與效率:

  • 稀疏注意力架構(gòu)(DSA):動態(tài)篩選關(guān)鍵信息,將長序列(200K 上下文)的注意力計算成本降低 1.5-2 倍,支持 7440 億參數(shù)規(guī)模下高效推理;

  • 異步強化學(xué)習(xí)框架:解耦訓(xùn)練與推理過程,利用新型基礎(chǔ)設(shè)施提升 GPU 利用率,加速智能體軌跡探索;

  • 異步 Agent 強化學(xué)習(xí)算法:優(yōu)化長周期任務(wù)中的自主規(guī)劃與糾錯能力,適應(yīng)復(fù)雜軟件工程場景;

  • 國產(chǎn)芯片全棧適配:深度優(yōu)化華為昇騰、摩爾線程等七大國產(chǎn)平臺,單節(jié)點性能媲美雙 GPU 集群,長序列處理成本降低 50%。

▲ Artificial Analysis Intelligence Index v4.0 涵蓋 10 項評估

在公開測試中,GLM-5 于 ArtificialAnalysis.ai、LMArena 等榜單達到開源模型最高水平:

    • Artificial Analysis Intelligence Index v4.0 評分 50 分,刷新開源記錄;

    • LMArena 文本 / 代碼競技場位列開放模型第一,整體表現(xiàn)接近 Claude Opus 4.5;

    • 商業(yè)模擬測試 Vending-Bench 2 中,以 4432 美元余額展現(xiàn)長期規(guī)劃能力;

    • 真實編程任務(wù)測試 CC-Bench-V2 顯示,其前端、后端及長程任務(wù)完成度超越前代 GLM-4.7。

▲ GLM-5 與開源 / 閉源模型的對比。

為驗證工程實用性,團隊構(gòu)建自動化評估體系:

    • 前端開發(fā):通過 GUI 智能體交互驗證,構(gòu)建成功率達 98%;

    • 后端修改:85 項多語言任務(wù)嚴(yán)格依賴單元測試,通過率與 Claude Opus 4.5 相當(dāng);

    • 長程開發(fā)鏈:在萬級代碼庫探索任務(wù)中表現(xiàn)優(yōu)于閉源模型,但多步增量開發(fā)仍有提升空間。

▲ SWE-rebench 上的性能表現(xiàn),2026 年 1 月。

IT之家附技術(shù)報告鏈接:
https://arxiv.org/pdf/2602.15763

相關(guān)閱讀:

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:智譜,GLM5,華為昇騰

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知