IT之家 1 月 15 日消息,據(jù)階躍星辰官方微信公眾號消息,階躍星辰開源模型 Step-Audio-R1.1,拿下全球第一。

階躍星辰稱,全球知名權(quán)威大模型評測榜單 Artificial Analysis Speech Reasoning 更新,階躍星辰原生語音推理模型 Step-Audio-R1.1 登頂榜首。該榜單是目前業(yè)界評估“原生語音模型”(Native Audio Models)最權(quán)威的第三方基準之一。核心考量模型直接處理音頻并進行復(fù)雜邏輯推理的能力,主要考察維度包括準確率、首包延遲等。
階躍星辰表示,和大語言模型同理,語音模型同樣需要具備強大推理能力,才能提供更高階智能、更自然交互。Step-Audio-R1.1 以 96.4% 準確率,超越 Grok、Gemini、GPT-Realtime 等主流一線模型,刷新歷史最好成績。在性能與速度的綜合權(quán)衡上,Step-Audio-R1.1 全面碾壓同類語音模型。

據(jù)IT之家了解,Step-Audio-R1 是由階躍星辰發(fā)布的全球首個開源原生語音推理模型。它可以在不增加額外時延的情況下,端到端理解語音內(nèi)容,“像人類一樣聽到對話即可思考”。
核心能力包括:
深度語音推理
實時響應(yīng)能力
音頻領(lǐng)域的可擴展 CoT
Step-Audio-R1.1 是最新升級版本,兼顧更強實時對話和復(fù)雜語音推理能力。完整的實時語音 API 將在 2 月上線,目前開放的 chat 模式已搭載 R1.1 核心,支持邊想邊說的流式推理。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。