在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

為 Agent 而生,階躍星辰發(fā)布開源基座模型 Step 3.5 Flash

2026/2/2 10:26:00 來源:IT之家 作者:遠(yuǎn)洋 責(zé)編:遠(yuǎn)洋
感謝IT之家網(wǎng)友 若怡斯文當(dāng)不了飯吃 的線索投遞!

IT之家 2 月 2 日消息,階躍星辰發(fā)布了旗下最新、最強(qiáng)開源基座模型 Step 3.5 Flash,官方稱其具備強(qiáng)大的推理能力與 Agent 智能,為 Agent 而生。

圖片

性能 vs 模型尺寸

IT之家附官方介紹如下:

核心亮點(diǎn)如下:

  • 更快:推理速度最高 350 TPS(單請(qǐng)求代碼類任務(wù))

  • 更強(qiáng):在 Agent 場(chǎng)景和數(shù)學(xué)任務(wù)上媲美閉源模型

  • 更穩(wěn):勝任復(fù)雜、長(zhǎng)鏈條任務(wù)

圖片

陰影柱狀圖為 Step 3.5 Flash 開啟 Parallel Thinking 后的增強(qiáng)性能。左側(cè)開源模型按總參數(shù)量排序,右側(cè)為閉源模型。XBench-DeepSearch 數(shù)據(jù)源自官方發(fā)布。

我們不僅需要“更聰明”的模型,更需要“值得信任”、“響應(yīng)迅速”、“成本可控”的模型。Step 3.5 Flash 正是為此而來,我們采用:

  • 稀疏 MoE 架構(gòu):每個(gè) token 僅激活約 110 億個(gè)參數(shù)(總計(jì) 1960 億參數(shù))

  • MTP-3:模型一次預(yù)測(cè) 3 個(gè) Token,效率翻倍

  • 3:1 滑動(dòng)窗口與全局注意力混合架構(gòu)(SWA + Full Attention):長(zhǎng)文本中只看“重點(diǎn)”,顯著降低計(jì)算開銷,高效處理 256K 上下文

Step 3.5 Flash 現(xiàn)已全量上線,官方還稱已啟動(dòng) Step 4 模型的訓(xùn)練,并邀請(qǐng)大家深度參與共創(chuàng)。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:階躍星辰,開源基座模型,Step 3.5 Flash

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知