在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

美團(tuán)開源首發(fā) INT8 無損滿血版 DeepSeek R1,部署 A100 實(shí)現(xiàn) 50% 吞吐提升

2025/3/7 18:00:41 來源:IT之家 作者:汪淼 責(zé)編:汪淼
感謝IT之家網(wǎng)友 HH_KK、天擎 的線索投遞!

IT之家 3 月 7 日消息,美團(tuán)搜推機(jī)器學(xué)習(xí)團(tuán)隊(duì) 3 月 4 日公布最新首發(fā)開源成果,實(shí)現(xiàn)對 DeepSeek R1 模型基本無損的 INT8 精度量化。

DeepSeek R1 原生版本的模型權(quán)重為 FP8 數(shù)據(jù)格式,對 GPU 芯片類型有嚴(yán)格限制,僅能被英偉達(dá)新型 GPU 支持(如 Ada、Hopper 架構(gòu)芯片),其他型號 GPU(如 A100)無法直接部署。

目前,量化代碼已經(jīng)合入到了開源 LLM 推理框架 SGLang,量化模型已經(jīng)發(fā)布到了 Hugging Face 社區(qū),方便用戶使用。官方測試,滿血版 DeepSeek R1 部署 A100,基于 INT8 量化,相比 BF16 實(shí)現(xiàn) 50% 吞吐提升。

IT之家附開源地址:

https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:DeepSeek,美團(tuán)開源開源AI

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知