在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

對抗 OpenAI GPT-5.2:谷歌祭出 Gemini Deep Research 深度研究智能體并首次向開發(fā)者開放,DeepSearchQA 因果鏈測試基準(zhǔn)重磅開源

2025/12/12 8:40:03 來源:IT之家 作者:問舟 責(zé)編:問舟

IT之家 12 月 12 日消息,在 OpenAI 發(fā)布 GPT-5.2 之后,谷歌緊接著就推出了更強(qiáng)大的 Gemini Deep Research 深度研究智能體,同時(shí)推出全新交互 API(Interactions API)并藉此首次面向開發(fā)者開放。

此外,谷歌還開源了全新的深度搜索評估基準(zhǔn) DeepSearchQA,用于衡量多步驟復(fù)雜檢索任務(wù)中的研究全面性。此次升級(jí)標(biāo)志著 AI 自主研究能力正式進(jìn)入工業(yè)化應(yīng)用階段。

Gemini Deep Research 基于 Gemini 3 Pro 構(gòu)建,專為長周期的內(nèi)容收集與綜合任務(wù)優(yōu)化,幻覺率降低 40%,是谷歌迄今“最具事實(shí)性”的模型,并可通過專項(xiàng)訓(xùn)練提升復(fù)雜任務(wù)中的報(bào)告質(zhì)量。谷歌表示,通過擴(kuò)展面向搜索的多步驟強(qiáng)化學(xué)習(xí),該智能體能夠在復(fù)雜信息環(huán)境中以更高精度自主導(dǎo)航。

谷歌 DeepMind 產(chǎn)品經(jīng)理路卡斯?哈斯(Lukas Haas)在 X 上透露,Gemini Deep Research 已經(jīng)實(shí)現(xiàn) SOTA,在谷歌新基準(zhǔn)測試上得分 46.4%,在 BrowseComp 上與 GPT-5 Pro 相當(dāng),但價(jià)格只有其 1/10 左右。

Deep Research 會(huì)反復(fù)規(guī)劃研究路徑,包括形成搜索查詢、閱讀結(jié)果、識(shí)別缺口并再次搜索。本次升級(jí)帶來顯著增強(qiáng)的網(wǎng)頁搜索能力,使其能深入網(wǎng)站獲取具體數(shù)據(jù)。

據(jù)介紹,該智能體在 Humanity's Last Exam (HLE 人類終極考試)、DeepSearchQA 及 BrowseComp 中取得最新最優(yōu)成績,并可在顯著更低成本下生成深入研究報(bào)告。谷歌稱,這項(xiàng)能力未來將應(yīng)用到 Google Search、NotebookLM、Google Finance 及 Gemini App 之中。

DeepSearchQA:面向復(fù)雜研究智能體的全新評測基準(zhǔn)

由于現(xiàn)有評測難以體現(xiàn)真實(shí)世界的多步驟研究復(fù)雜性,谷歌同步宣布開放 DeepSearchQA 數(shù)據(jù)集與工具。該基準(zhǔn)包含跨 17 個(gè)領(lǐng)域、900 個(gè)“因果鏈”任務(wù),每一步均依賴前序分析,要求智能體生成詳盡答案集,從而衡量其研究精度與檢索全面性。

谷歌表示,DeepSearchQA 還能作為“思考時(shí)間”效益的診斷工具。內(nèi)部測試顯示,讓智能體執(zhí)行更多搜索與推理步驟可顯著提升表現(xiàn),這部分將在未來版本中繼續(xù)探索。

開發(fā)者可訪問數(shù)據(jù)集、排行榜與 Colab 示例,并閱讀數(shù)據(jù)集技術(shù)報(bào)告。

Deep Research 在實(shí)際領(lǐng)域的早期應(yīng)用

谷歌稱,Gemini Deep Research 已在需要高精度和上下文理解的多個(gè)行業(yè)中展現(xiàn)出顯著效果,包括金融服務(wù)、生物技術(shù)和市場研究。

  • 在金融行業(yè),企業(yè)利用 Deep Research 自動(dòng)化盡調(diào)中的早期信息收集環(huán)節(jié),如整合市場信號(hào)、競爭格局與合規(guī)風(fēng)險(xiǎn),從而提升研究效率。

  • 在科研領(lǐng)域,Axiom Bio 使用該智能體處理藥物毒性預(yù)測相關(guān)的文獻(xiàn)分析,獲得更高的研究深度與顆粒度,加速藥物開發(fā)流程。

開發(fā)者能力:文件解析、結(jié)構(gòu)化輸出、引用管理

通過 Interactions API,開發(fā)者可調(diào)用 Gemini Deep Research 構(gòu)建下一代自動(dòng)化研究工具,主要特性包括:

  • 統(tǒng)一信息綜合:整合上傳文件(PDF、CSV 等)和公共網(wǎng)頁數(shù)據(jù),并能處理大上下文量。

  • 可控報(bào)告結(jié)構(gòu):可通過提示詞定義輸出結(jié)構(gòu)、標(biāo)題、表格格式等。

  • 精細(xì)引用:為報(bào)告中各項(xiàng)事實(shí)提供細(xì)粒度來源。

  • 結(jié)構(gòu)化輸出:支持 JSON schema 以便下游處理。

Interactions API

開發(fā)者可通過 Google AI Studio 的 Gemini API Key 使用 Interactions API 構(gòu)建應(yīng)用。

谷歌表示,未來更新將加入原生圖表輸出、擴(kuò)展 Model Context Protocol(MCP)支持以接入更多自定義數(shù)據(jù)源,并在企業(yè)服務(wù)平臺(tái) Vertex AI 上提供 Deep Research。

參考資料:

  • https://blog.google/technology/developers/deep-research-agent-gemini-api/

  • https://blog.google/technology/developers/interactions-api/

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:谷歌Gemini Deep Research,OpenAI GPT5.2

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知