截胡 OpenAI：谷歌率先公測“奧數(shù)金牌級”推理 AI 模型 Gemini 3 Deep Think

2025/12/5 13:50:28 來源：IT之家作者：故淵責編：故淵

評論：

感謝IT之家網(wǎng)友斯文當不了飯吃、Snailwang、GreatMOLA、補藥吖的線索投遞！

IT之家 12 月 5 日消息，科技媒體 NeoWin 今天（12 月 5 日）發(fā)布博文，報道稱谷歌面向 Gemini Ultra 訂閱（月費 249.99 美元）用戶，推出了 Gemini 3 Deep Think（深度思考）模式。

相比較標準版 Gemini 3 Pro 模型，Deep Think 模式調(diào)用了更多計算資源，并采用了全新技術(shù)架構(gòu)。該功能目前已完全集成至 Gemini App 中，Google AI Ultra 訂閱用戶即日起可通過在提示欄中選擇“Deep Think”與 Gemini 3 Pro 模型搭配使用。

截胡 OpenAI：谷歌率先公測“奧數(shù)金牌級”推理 AI 模型 Gemini 3 Deep Think

谷歌官方數(shù)據(jù)顯示，Deep Think 模式在處理復雜數(shù)學、科學及邏輯問題時的推理能力實現(xiàn)了顯著飛躍。IT之家援引博文介紹，在被譽為“業(yè)內(nèi)最難 AI 基準測試之一”的 Humanity’s Last Exam 中，該模式取得了 41% 的高分，確立了新的行業(yè)標桿。

同時，在 GPQA Diamond 科學知識測試中，其得分高達 93.8%；在包含代碼執(zhí)行的 ARC-AGI-2 嚴苛測試中，也拿下了 45.1% 的成績，均展現(xiàn)出業(yè)內(nèi)頂尖（State-of-the-art）的性能水平。

截胡 OpenAI：谷歌率先公測“奧數(shù)金牌級”推理 AI 模型 Gemini 3 Deep Think

Deep Think 模式之所以能取得如此突破，核心在于運用了先進的并行推理技術(shù)（Advanced Parallel Reasoning），讓模型能夠同時探索多種假設路徑以尋找最優(yōu)解。

值得注意的是，該模型的變體此前已在國際數(shù)學奧林匹克競賽（IMO）和國際大學生程序設計競賽（ICPC）世界總決賽中達到了“金牌標準”。特別是在 IMO 場景下，模型需在無法訪問互聯(lián)網(wǎng)或工具的情況下，于兩個 4.5 小時的考試時段內(nèi)完成解題并撰寫自然語言證明。

谷歌此次公測被視為對競爭對手的有力回擊。OpenAI 曾在今年 7 月聲稱其實驗性推理大模型達到了數(shù)學奧賽金牌水平，但截至目前該模型仍未向公眾開放。

隨著谷歌率先將達到 IMO 金牌標準的模型推向大眾市場，行業(yè)普遍預測，這一舉動或?qū)⑵仁?OpenAI 加快同類產(chǎn)品的發(fā)布節(jié)奏，大模型領(lǐng)域的“推理能力之戰(zhàn)”將進一步升級。

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

截胡 OpenAI：谷歌率先公測“奧數(shù)金牌級”推理 AI 模型 Gemini 3 Deep Think

相關(guān)文章