IT之家 3 月 17 日消息,今天(3 月 17 日)在美國(guó)加州圣何塞舉行的 2026 年 GTC 大會(huì)上,英偉達(dá)針對(duì)智能體 AI(Agentic AI)的長(zhǎng)上下文推理,發(fā)布 BlueField-4 STX 模塊化存儲(chǔ)參考架構(gòu)。
IT之家援引博文介紹,傳統(tǒng)數(shù)據(jù)中心提供大容量通用存儲(chǔ),但缺乏快速響應(yīng)能力,無(wú)法支持 AI 智能體跨步驟、跨工具的無(wú)縫交互。隨著上下文信息的增加,傳統(tǒng)存儲(chǔ)路徑會(huì)嚴(yán)重拖慢 AI 推理速度,并導(dǎo)致 GPU 利用率大幅降低。
STX 架構(gòu)為解決這一痛點(diǎn),讓存儲(chǔ)節(jié)點(diǎn)更靠近計(jì)算資源并實(shí)現(xiàn)規(guī)模化訪問,促使智能體 AI 工廠在推理、訓(xùn)練和分析環(huán)節(jié)實(shí)現(xiàn)更高的吞吐量與響應(yīng)速度。
其首個(gè)機(jī)架級(jí)部署方案集成了全新的 NVIDIA CMX 上下文內(nèi)存存儲(chǔ)平臺(tái)。該平臺(tái)通過(guò)高性能上下文層擴(kuò)展了 GPU 內(nèi)存,與傳統(tǒng)通用存儲(chǔ)設(shè)備相比,其每秒處理的 Token 數(shù)量提升了高達(dá) 5 倍。

STX 架構(gòu)基于英偉達(dá) Vera Rubin 平臺(tái)打造,其核心搭載了專為存儲(chǔ)優(yōu)化的 BlueField-4 處理器(內(nèi)部集成 Vera CPU 與 ConnectX-9 超級(jí)網(wǎng)卡),并協(xié)同 Spectrum-X 以太網(wǎng)、DOCA 及 AI Enterprise 軟件運(yùn)行。
在實(shí)際性能表現(xiàn)上,該架構(gòu)的能效比傳統(tǒng) CPU 架構(gòu)高出 4 倍,并且在處理企業(yè)級(jí) AI 數(shù)據(jù)時(shí),數(shù)據(jù)攝取速度(每秒頁(yè)面處理量)直接翻倍。
英偉達(dá)創(chuàng)始人兼 CEO 黃仁勛強(qiáng)調(diào),為重塑計(jì)算基礎(chǔ)設(shè)施以匹配智能體 AI 的進(jìn)化速度,AI 系統(tǒng)需要全新的存儲(chǔ)形態(tài),來(lái)處理海量上下文并具備持續(xù)學(xué)習(xí)能力。
戴爾、HPE、IBM 等眾多頂級(jí)存儲(chǔ)供應(yīng)商目前正基于 STX 聯(lián)合設(shè)計(jì)下一代 AI 基礎(chǔ)設(shè)施。此外,甲骨文云(OCI)、Mistral AI 等領(lǐng)先云服務(wù)商計(jì)劃率先采用該技術(shù),相關(guān)合作伙伴將于今年下半年正式向市場(chǎng)交付基于 STX 平臺(tái)的系統(tǒng)。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。