在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

Nano Banana Pro 新對手,智譜聯(lián)合華為開源首個國產(chǎn)芯片訓(xùn)練的多模態(tài) SOTA 模型 GLM-Image

2026/1/14 9:11:22 來源:IT之家 作者:汪淼 責(zé)編:汪淼
感謝IT之家網(wǎng)友 三元不二、Kazuto 的線索投遞!

IT之家 1 月 14 日消息,智譜今日宣布聯(lián)合華為開源新一代圖像生成模型 GLM-Image,模型基于昇騰 Atlas 800T A2 設(shè)備和昇思 MindSpore AI 框架完成從數(shù)據(jù)到訓(xùn)練的全流程,是首個在國產(chǎn)芯片上完成全程訓(xùn)練的 SOTA 多模態(tài)模型。

GLM-Image 采用自主創(chuàng)新的“自回歸 + 擴散解碼器”混合架構(gòu),實現(xiàn)了圖像生成與語言模型的聯(lián)合。

IT之家附 GLM-Image 核心亮點如下:

  • 架構(gòu)革新,面向“認知型生成”的技術(shù)探索:采用“自回歸 + 擴散編碼器”混合架構(gòu),兼顧全局指令理解與局部細節(jié)刻畫,克服了海報、PPT、科普圖等知識密集型場景生成難題,向探索以 Nano Banana Pro 為代表的新一代“知識 + 推理”的認知型生成模型邁出一步。

  • 首個在國產(chǎn)芯片完成全程訓(xùn)練的 SOTA 模型:模型自回歸結(jié)構(gòu)基座基于昇騰 Atlas 800T A2 設(shè)備與昇思 MindSpore AI 框架,完成了從數(shù)據(jù)預(yù)處理到大規(guī)模訓(xùn)練的全流程構(gòu)建,驗證了在國產(chǎn)全棧算力底座上訓(xùn)練前沿模型的可行性。

  • 文字渲染開源 SOTA:在 CVTG-2K(復(fù)雜視覺文本生成)和 LongText-Bench(長文本渲染)榜單獲得開源第一,尤其擅長漢字生成任務(wù)。

  • 性價比與速度優(yōu)化:API 調(diào)用模式下,生成一張圖片花費 0.1 元,速度優(yōu)化版本即將更新。

圖片

據(jù)智譜官方介紹,通過改進 Tokenizer 策略,GLM-Image 能夠自適應(yīng)處理多種分辨率,原生支持從 1024x1024 到 2048×2048 尺寸的任意比例圖像的生成任務(wù),無需重新訓(xùn)練。

GLM-Image 在文字渲染的權(quán)威榜單中達到開源 SOTA 水平。

圖片

GLM-Image 在實際的復(fù)雜圖文任務(wù)中測試表現(xiàn)如下:

場景一:科普插畫

GLM-Image 更擅長繪制包含復(fù)雜邏輯流程與文字說明的科普插畫及原理示意圖。

Image

圖片

場景二:多格圖畫

在生成電商圖、漫畫等多格圖畫時,GLM-Image 能夠保持風(fēng)格和主體的一致性,并保障多處文字生成的準確率。

圖片

場景三:社交媒體圖文封面

GLM-Image 適用于制作社交媒體封面及內(nèi)容等排版復(fù)雜的圖片,讓您的創(chuàng)作更自由豐富。

Image

圖片

圖片

場景四:商業(yè)海報

GLM-Image 能夠生成構(gòu)圖富有設(shè)計感、文字嵌入準確的節(jié)日海報與商業(yè)宣傳圖。

Image

Image

Image

場景五:寫實攝影

在文字渲染以外,GLM-Image 也同樣擅長生成各種景別和尺寸的人像、寵物、風(fēng)景、靜物。

圖片

IT之家附 GLM-Image 體驗和開源地址如下:

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:智譜,多模態(tài)模型,GLMImage

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知