IT之家 12 月 5 日消息,科技媒體 NeoWin 今天(12 月 5 日)發(fā)布博文,報道稱谷歌面向 Gemini Ultra 訂閱(月費 249.99 美元)用戶,推出了 Gemini 3 Deep Think(深度思考)模式。
相比較標準版 Gemini 3 Pro 模型,Deep Think 模式調(diào)用了更多計算資源,并采用了全新技術(shù)架構(gòu)。該功能目前已完全集成至 Gemini App 中,Google AI Ultra 訂閱用戶即日起可通過在提示欄中選擇“Deep Think”與 Gemini 3 Pro 模型搭配使用。

谷歌官方數(shù)據(jù)顯示,Deep Think 模式在處理復雜數(shù)學、科學及邏輯問題時的推理能力實現(xiàn)了顯著飛躍。IT之家援引博文介紹,在被譽為“業(yè)內(nèi)最難 AI 基準測試之一”的 Humanity’s Last Exam 中,該模式取得了 41% 的高分,確立了新的行業(yè)標桿。
同時,在 GPQA Diamond 科學知識測試中,其得分高達 93.8%;在包含代碼執(zhí)行的 ARC-AGI-2 嚴苛測試中,也拿下了 45.1% 的成績,均展現(xiàn)出業(yè)內(nèi)頂尖(State-of-the-art)的性能水平。

Deep Think 模式之所以能取得如此突破,核心在于運用了先進的并行推理技術(shù)(Advanced Parallel Reasoning),讓模型能夠同時探索多種假設路徑以尋找最優(yōu)解。
值得注意的是,該模型的變體此前已在國際數(shù)學奧林匹克競賽(IMO)和國際大學生程序設計競賽(ICPC)世界總決賽中達到了“金牌標準”。特別是在 IMO 場景下,模型需在無法訪問互聯(lián)網(wǎng)或工具的情況下,于兩個 4.5 小時的考試時段內(nèi)完成解題并撰寫自然語言證明。
谷歌此次公測被視為對競爭對手的有力回擊。OpenAI 曾在今年 7 月聲稱其實驗性推理大模型達到了數(shù)學奧賽金牌水平,但截至目前該模型仍未向公眾開放。
隨著谷歌率先將達到 IMO 金牌標準的模型推向大眾市場,行業(yè)普遍預測,這一舉動或?qū)⑵仁?OpenAI 加快同類產(chǎn)品的發(fā)布節(jié)奏,大模型領(lǐng)域的“推理能力之戰(zhàn)”將進一步升級。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。