IT之家 8 月 21 日消息,深度求索官方今日正式對外發(fā)布 DeepSeek-V3.1,官方提到 DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的參數(shù)精度。
在 DeepSeek 官方公眾號文章頁面,DeepSeek 進一步解釋稱,UE8M0 FP8 是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計。

IT之家注:FP 英文全稱為 Floating Point,是 IEEE 定義的標準浮點數(shù)類型。UE8M0 FP8 在 AI 模型領(lǐng)域代表一種模型精度。
DeepSeek V3.1 的 Base 模型在 V3 的基礎(chǔ)上重新做了外擴訓練,一共增加訓練了 840B tokens。Base 模型與后訓練模型均已在 Huggingface 與魔搭開源。IT之家附開源地址:
Base 模型:
Hugging Face:
魔搭:
后訓練模型:
Hugging Face:
魔搭:
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。