初探 Deepseek R1-0528 開源模型：AI 編程能力躍升，媲美 OpenAI o3 和 o4-mini

2025/5/29 9:16:36 來源：IT之家作者：故淵責(zé)編：故淵

評論：

IT之家 5 月 29 日消息，深度求索（Deepseek）昨日通過官方交流群，邀請用戶測試 DeepSeek-R1-0528 模型小版本，初步測試結(jié)果表明，R1-0528 在編程能力、審美設(shè)計和代碼補(bǔ)全等方面表現(xiàn)出色，尤其在復(fù)雜指令處理和前端頁面生成上展現(xiàn)了高精度和高效能。

DeepSeek-R1-0528 模型在多個方面實現(xiàn)了性能提升，其中最為亮眼的就是編程能力，能根據(jù)用戶輸入的簡單提示詞，快速生成高質(zhì)量代碼。

代碼測試平臺 Live CodeBench 中顯示，其性能可以媲美 OpenAI 最新的 o3 模型（High）。

初探 Deepseek R1-0528 開源模型：AI 編程能力躍升，媲美 OpenAI o3 和 o4-mini

在 Extended NYT Connections 跑分中，DeepSeek-R1-0528 模型跑分為 49.8 分，而初代 Deepseek R1 模型為 38.6 分。

初探 Deepseek R1-0528 開源模型：AI 編程能力躍升，媲美 OpenAI o3 和 o4-mini

IT之家注：Extended NYT Connections 是一個用于評估大型語言模型（LLM）性能的基準(zhǔn)測試，基于《紐約時報》的 Connections 謎題游戲。

這個基準(zhǔn)測試包含了 651 個 NYT Connections 謎題，并且增加了額外的詞匯以提高難度，旨在更全面地測試模型的語言理解和推理能力。

R1-0528 具有 OpenAI o3 和谷歌 Gemini 2.5 Pro 專業(yè)風(fēng)格的響應(yīng)。箭頭 / 星號的使用與 o3 風(fēng)格非常一致，結(jié)尾處“why it works”的表述更具說服力。

初探 Deepseek R1-0528 開源模型：AI 編程能力躍升，媲美 OpenAI o3 和 o4-mini

此外，在審美設(shè)計和代碼補(bǔ)全（code completion）方面，R1-0528 同樣表現(xiàn)卓越。測試中，該模型輕松應(yīng)對多樣化任務(wù)，輸出結(jié)果精準(zhǔn)且實用。

在生成復(fù)雜前端頁面和動態(tài)動畫方面，R1-0528 也展現(xiàn)了強(qiáng)大的能力，能準(zhǔn)確理解復(fù)雜指令。更重要的是，相比較 OpenAI 的 o3 和 o4-mini 模型，R1-0528 大幅縮短了推理時長，提供了更加流暢和高效的使用體驗。

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

初探 Deepseek R1-0528 開源模型：AI 編程能力躍升，媲美 OpenAI o3 和 o4-mini

相關(guān)文章