在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

智譜發(fā)布新一代旗艦 AI 模型 GLM-4.7:編程 SOTA,上線即開源

量子位 2025/12/23 8:53:45 責編:汪淼
感謝IT之家網(wǎng)友 freshairh、斯文當不了飯吃 的線索投遞!

2025 倒計時,新 SOTA 模型涌現(xiàn)沒有放緩跡象。

一夜之間,編程 SOTA 模型易主,而且上線即開源,依然來自中國大模型公司 —— 智譜 AI,GLM-4.7。

這波更新,技術(shù)報告里滿眼都是 CodingCoding,還是 Coding。

而能力的提升,帶來的最直觀效果是:

  • AIME 25 和人類最后考試(HLE)等基準中,GLM-4.7 分數(shù)超 GPT-5.1;

  • SWE-Bench 分數(shù)達(73.8%,+5.8%),創(chuàng)開源新高。

官方 Demo 顯示,寫個植物大戰(zhàn)僵尸不費勁:

總而言之,模型這么一發(fā),雙旦的節(jié)慶氛圍一下到位了(doge)。

官網(wǎng) Chatbot 和 API 均已就位,現(xiàn)在就能在線開玩。

Demo 來吧,展示

在前端生成質(zhì)量上,GLM-4.7 展現(xiàn)出明顯升級:頁面結(jié)構(gòu)更干凈、組件層級更清晰。

相比 GLM-4.6,更像是現(xiàn)代的 Web UI,網(wǎng)頁元素中更加美觀。

在 PPT 與視覺物料生成方面,GLM-4.7 標題層級明確、元素尺寸更合理。

在復雜幾何結(jié)構(gòu)與空間關(guān)系的表達上,GLM-4.7 模型能夠保持較好的結(jié)構(gòu)一致性與細節(jié)穩(wěn)定性。

3D 資產(chǎn)的生成質(zhì)量也有顯著提升。

刷新開源 SOTA

這次最新的模型主打編程,相較前代 GLM-4.6,GLM-4.7 在編碼能力、交互體驗與復雜推理等多個維度實現(xiàn)了系統(tǒng)性升級。

  • 復雜推理能力(Reasoning):全面提升,HLE(含工具)42.8(+12.4 vs GLM-4.6),MMUL-Pro 84.3,GPQA-Diamond 85.7,數(shù)學與推理能力更穩(wěn)更強。

  • 核心編碼能力(Code Agent):多語言與終端任務顯著增強,SWE-bench Verified 73.8(+5.8)、SWE-bench Multilingual 66.7(+12.9)、Terminal Bench 2.0 41.0(+16.5),支持“先思考、再行動”模式。

  • 工具使用能力(General Agent):工具調(diào)用更高效,BrowseComp 52.0(+6.9)、BrowseComp w/ Context Management 67.5(+10.0)、τ2-Bench 87.4(+12.2),網(wǎng)頁瀏覽與工具鏈管理表現(xiàn)更優(yōu)。

此外,GLM-4.7 在對話、創(chuàng)意寫作、角色扮演等場景中同樣有提升,系統(tǒng)性增強了編碼、推理與工具使用能力。

交錯式思考和保留式思考

技術(shù)方面,GLM-4.7 強化了自 GLM-4.5 起引入的交錯式思考(Interleaved Thinking),并進一步引入了保留式思考(Preserved thinking)和輪級思考(Turn-level Thinking)。

交錯式思考

GLM 在工具調(diào)用之間、收到工具結(jié)果之后繼續(xù)思考。

這讓模型能夠進行更復雜的分布推理,提升了指令遵從和生成質(zhì)量:

在決定下一步行動前先解讀每次的工具輸出,把多次工具調(diào)用和推理步驟串聯(lián)起來,并根據(jù)中間結(jié)果做出更細粒度的決策。

保留式思考

在編碼場景中,GLM-4.7 引入了一種新的思考模式:

模型會自動在多回合對話中保留所有思考塊,復用已有推理而不是從頭重新推理。這減少了信息丟失和不一致性,使得模型更適用于長程、復雜任務。還能在真實任務中節(jié)省更多 tokens。

輪級思考

輪級思考是一種按輪控制推理計算的能力,即在同一個會話中,每一輪請求都可以獨立選擇開啟 / 關(guān)閉思考。

這使得 GLM-4.7 具備以下優(yōu)勢:

  • 更靈活的成本 / 時延控制:對“問個事實 / 改個措辭”等輕量輪次可關(guān)閉思考,追求快速響應;對“復雜規(guī)劃 / 多約束推理 / 代碼調(diào)試”等重任務輪次可開啟思考,提升正確率與穩(wěn)定性。

  • 更順滑的多輪體驗:思考開關(guān)在會話內(nèi)可隨時切換,模型能在不同輪次間保持對話連貫與輸出風格一致,讓用戶感覺“聰明時更聰明、簡單時更快”。

  • 更適合 Agent / 工具調(diào)用場景:在需要快速執(zhí)行的工具輪次可降低推理開銷,在需要綜合工具結(jié)果做決策的輪次再開啟深度思考,實現(xiàn)效率與質(zhì)量的動態(tài)平衡。

更多技術(shù)詳情,智譜官方也附上了詳細技術(shù)報告。

BTW,智譜這個月還真上了“節(jié)日限定優(yōu)惠”。

每月最低 20 元即可暢享 GLM-4.7,用上 Claude Pro 套餐 3 倍用量。

又是一位好價格屠夫呀。

而且 GLM-4.7 的深夜炸場,也算是已經(jīng)沖刺 IPO 上市的智譜,帶來的最新技術(shù)證明。

目前智譜已經(jīng)通過了港交所上市聆訊,IPO 敲鐘僅剩下最后 100 米。

而 GLM-4.7 可能也是智譜上市之前,最重要的模型更新了…… 吧?

本文來自微信公眾號:量子位(ID:QbitAI),作者:魚羊 henry,原標題《智譜 IPO 敲鐘前,連夜把開源編程大模型 SOTA 了》

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:智譜GLM4.7

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知