在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

智譜 GLM-4.6V 系列多模態(tài) AI 大模型發(fā)布并開源,API 降價 50%

2025/12/8 19:50:06 來源:IT之家 作者:汪淼 責(zé)編:汪淼

IT之家 12 月 8 日消息,智譜 AI 今日官宣發(fā)布并開源 GLM-4.6V 系列多模態(tài)大模型,包括:

  • GLM-4.6V(106B-A12B):面向云端與高性能集群場景的基礎(chǔ)版;

  • GLM-4.6V-Flash(9B):面向本地部署與低延遲應(yīng)用的輕量版。

圖片

作為 GLM 系列在多模態(tài)方向上的一次重要迭代,GLM-4.6V 將訓(xùn)練時上下文窗口提升到 128k tokens,在視覺理解精度上達到同參數(shù)規(guī)模 SOTA,并首次在模型架構(gòu)中將 Function Call(工具調(diào)用)能力原生融入視覺模型,打通從「視覺感知」到「可執(zhí)行行動(Action)」的鏈路,為真實業(yè)務(wù)場景中的多模態(tài) Agent 提供統(tǒng)一的技術(shù)底座。

在性能優(yōu)化之外,GLM-4.6V 系列相較于 GLM-4.5V 降價 50%,API 調(diào)用價格低至輸入 1 元 / 百萬 tokens,輸出 3 元 / 百萬 tokens。

同時,GLM-4.6V-Flash 免費開放使用。

GLM-4.6V 即日起融入 GLM Coding Plan,針對用戶 8 大類場景定向開發(fā)了專用 MCP 工具,模型可自主調(diào)用最匹配的接口。

圖片

智譜 AI 介紹稱,傳統(tǒng)工具調(diào)用大多基于純文本,在面對圖像、視頻、復(fù)雜文檔等多模態(tài)內(nèi)容時,需要多次中間轉(zhuǎn)換,帶來信息損失和工程復(fù)雜度。GLM-4.6V 從設(shè)計之初就圍繞「圖像即參數(shù),結(jié)果即上下文」,構(gòu)建了原生多模態(tài)工具調(diào)用能力:

  • 輸入多模態(tài):圖像、截圖、文檔頁面等可以直接作為工具參數(shù),無需先轉(zhuǎn)為文字描述再解析,減少鏈路損耗。

  • 輸出多模態(tài):對于工具返回的統(tǒng)計圖表、渲染后網(wǎng)頁截圖、檢索到的商品圖片等結(jié)果,模型能夠再次進行視覺理解,將其納入后續(xù)推理鏈路。

模型原生支持基于視覺輸入的工具調(diào)用,完整打通從感知到理解到執(zhí)行的閉環(huán)。這使得 GLM-4.6V 能夠應(yīng)對圖文混排輸出、商品識別與好價推薦、以及輔助型 Agent 場景等更復(fù)雜的視覺任務(wù)。

GLM-4.6V 在 MMBench、MathVista、OCRBench 等 30+ 主流多模態(tài)評測基準上進行了驗證,較上一代模型取得顯著提升。在同等參數(shù)規(guī)模下,模型在多模態(tài)交互、邏輯推理和長上下文等關(guān)鍵能力上取得 SOTA 表現(xiàn)。其中,9B 版本的 GLM-4.6V-Flash 整體表現(xiàn)超過 Qwen3-VL-8B,106B 參數(shù) 12B 激活的 GLM-4.6V 表現(xiàn)比肩 2 倍參數(shù)量的 Qwen3-VL-235B。

圖片

智譜 AI 開放了 GLM-4.6V 的模型權(quán)重、推理代碼與示例工程,IT之家附開源地址如下:

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:智譜,GLM4.6V,多模態(tài)大模型

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知