在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

英偉達(dá) Blackwell GPU 刷新 AI 推理速度世界紀(jì)錄,實(shí)現(xiàn) 1000 TPS / User 里程碑

2025/5/24 12:29:52 來(lái)源:IT之家 作者:問(wèn)舟 責(zé)編:問(wèn)舟

IT之家 5 月 24 日消息,當(dāng)?shù)貢r(shí)間周四,英偉達(dá)宣布其 Blackwell GPU 在 4000 億參數(shù)的 Meta Llama 4 Maverick 模型上成功打破了 LLM 推理速度世界紀(jì)錄。

據(jù)介紹,AI 基準(zhǔn)測(cè)試機(jī)構(gòu) Artificial Analysis 通過(guò)配置 8 塊 Blackwell GPU 的 DGX B200 節(jié)點(diǎn),首次實(shí)現(xiàn)每用戶每秒生成 1000 個(gè) token(TPS)的性能里程碑。

英偉達(dá)表示,技術(shù)團(tuán)隊(duì)通過(guò) TensorRT-LLM 軟件棧實(shí)施深度優(yōu)化,并采用 EAGLE-3 技術(shù)訓(xùn)練推測(cè)解碼草稿模型,使其性能較優(yōu)化前基準(zhǔn)提升 4 倍。整套服務(wù)器系統(tǒng)在峰值吞吐配置下可達(dá)每秒 72,000 token。

英偉達(dá)解釋稱:“推測(cè)解碼是通過(guò)小型快速草稿模型預(yù)測(cè) token 序列,再由大型目標(biāo) LLM 并行驗(yàn)證的加速技術(shù)。其優(yōu)勢(shì)在于單次迭代可能生成多個(gè) token,代價(jià)是額外的草稿模型計(jì)算開(kāi)銷(xiāo)。”

為實(shí)現(xiàn)該突破,工程師團(tuán)隊(duì)采用基于 EAGLE3 的軟件架構(gòu)。該架構(gòu)專為大型語(yǔ)言模型推理加速設(shè)計(jì),與 GPU 硬件架構(gòu)形成協(xié)同效應(yīng)。IT之家注意到,測(cè)試結(jié)果顯示 Blackwell 架構(gòu)已完全適配 Llama 4 Maverick 級(jí)別的超大規(guī)模語(yǔ)言模型。

英偉達(dá)還表示,他們?cè)诒3猪憫?yīng)準(zhǔn)確性的同時(shí)大幅提高了性能。在許多指標(biāo)上,使用 FP8 數(shù)據(jù)格式的準(zhǔn)確性與人工分析 BF16 相當(dāng)。

參考資料:

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:英偉達(dá),Meta Llama 4

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知