OpenAI 科學家 Jason Wei 預測,未來一年內(nèi),AI 重點將從推廣大眾需求轉(zhuǎn)為促進科學發(fā)展,無獨有偶,DeepMind 剛剛發(fā)布的 36 頁報告也揭示出:全球?qū)嶒炇?AI 使用正在指數(shù)級增長,AI for Science 真正的黃金時代即將來臨。
過去兩年,AI 主打用戶增長,成功實現(xiàn)了大眾化普及。畢竟,拉新才是商業(yè)王道。
然而,如今 AI 日常的應用已經(jīng)快卷到天花板了。對于世界上絕大多數(shù)人的普通查詢,許多 LLM 都能給出相當不錯的回答。
速度、流暢性已經(jīng)足夠滿足絕大多數(shù)用戶的需求。即便再優(yōu)化,提升空間也有限 —— 畢竟這類問題的技術(shù)難度不高。
或許,未來真正值得關(guān)注的是科學和工程領(lǐng)域。
OpenAI 科學家 Jason Wei 最近發(fā)帖預測:在接下來的一年內(nèi),AI 的關(guān)注重點可能會從日常使用轉(zhuǎn)向科學領(lǐng)域。

他認為,未來五年,AI 關(guān)注的重點將轉(zhuǎn)向硬核領(lǐng)域 —— 用 AI 加速科學和工程。因為這才是真正推動技術(shù)進步的引擎。
普通用戶的簡單問題,改進空間已經(jīng)不大了。
但每個科學前沿領(lǐng)域都有巨大的改進空間,而 AI 正好可以發(fā)力,去致力于解決那些能推動科技飛躍的「1% 的頂尖問題」。
AI 不僅有回答這些問題的潛力,還能激發(fā)人們?nèi)ニ伎几蟮奶魬?zhàn)。
而且,AI 的進展還能加速 AI 本身的研究,幫助自己變得更強。AI 的進步是復利的,可謂是正反饋之王。
說白了,未來五年就是「AI 科學家」、「AI 工程師」的時代。
DeepMind 最近發(fā)的一篇論文也暗示了這一趨勢:全球各地的實驗室里,科學家們對 AI 的使用正以指數(shù)級增長。

報告地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Assets/Docs/a-new-golden-age-of-discovery_nov-2024.pdf
AI 加速科學創(chuàng)新發(fā)現(xiàn)的黃金時代
如今,每三位博士后研究員中就有一位使用大語言模型來協(xié)助完成文獻綜述、編程和文章撰寫等工作。
今年的諾貝爾化學獎也出乎了所有人的意料,頒發(fā)給了 AlphaFold 2 的發(fā)明人 Demis Hassabis 和 John Jumper。同時,這也啟發(fā)了大量科學家將 AI 應用到自己的科學領(lǐng)域中,以求得更多的創(chuàng)新性發(fā)現(xiàn)。

過去半世紀,科學家人數(shù)猛增,僅美國就翻了七倍多,但科技帶來的社會進步卻放緩了。
原因之一是,現(xiàn)代科學家面臨的規(guī)模和復雜性挑戰(zhàn)越來越棘手。
不過,深度學習擅長搞定這種復雜局面,還能大幅壓縮科學發(fā)現(xiàn)的時間成本。
比如,傳統(tǒng) X 射線晶體學花幾年、燒 10 萬美元搞定一個蛋白質(zhì)結(jié)構(gòu),而 AlphaFold 直接免費給你 2 億種預測,秒殺傳統(tǒng)方法。
五大機遇
對于在不同科學研究階段難以突破研究瓶頸的科學家們來講,把握住使用 AI 的關(guān)鍵機遇,或許就能促進誕生強有力的新發(fā)現(xiàn)。

五個能夠利用 AI 來促進科研的機遇
1. 知識 —— 改變科學家獲取和傳遞知識的方式
科學家要想推動新發(fā)現(xiàn),必須掌握一套日益專業(yè)化且指數(shù)增長的知識體系。
這種「知識負擔」讓顛覆性發(fā)現(xiàn)越來越倚重年長科學家和頂尖大學的跨學科團隊,同時也導致小團隊獨立撰寫論文的比例持續(xù)下滑。
而且,大多數(shù)科學成果仍以晦澀難懂、英語為主的論文形式分享,限制了政策制定者、企業(yè)和公眾的關(guān)注與興趣。
如今,科學家和公眾都能借助 LLM 破局。
例如,有團隊用谷歌 Gemini 一天內(nèi)從 20 萬篇論文中提煉出相關(guān)見解;普通人也可用 LLM 輕松摘要和問答,獲取專業(yè)學術(shù)知識,瞬間拉近與前沿科學的距離。
2. 數(shù)據(jù) —— 生成、提取和標注大型科學數(shù)據(jù)集
盡管我們處于數(shù)據(jù)爆炸時代,許多自然和社會領(lǐng)域中,科學數(shù)據(jù)卻嚴重匱乏,如土壤、深海、大氣層和非正式經(jīng)濟。
AI 正助力改變這一現(xiàn)狀。它能減少在 DNA 測序、檢測樣本中具體細胞類型或捕捉動物聲音時可能發(fā)生的噪聲和錯誤。
科學家們還可以利用 LLM 越來越強的多模態(tài)能力,從科學出版物、檔案文件以及視頻圖像等資源中提取非結(jié)構(gòu)化的科學數(shù)據(jù),并將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)集,以做后續(xù)研究。
AI 還可以幫助為科學數(shù)據(jù)添加科學家所需的輔助信息。例如,至少三分之一的微生物蛋白質(zhì)在執(zhí)行功能中的細節(jié)未能被可靠地注釋。
經(jīng)過可靠性評估驗證的 AI 模型也可以作為新的合成科學數(shù)據(jù)的來源。例如,AlphaProteo 蛋白質(zhì)設計模型是在 AlphaFold 2 中超過 1 億個 AI 生成的蛋白質(zhì)結(jié)構(gòu)以及蛋白質(zhì)數(shù)據(jù)庫中的實驗結(jié)構(gòu)上進行訓練的。
3. 實驗 —— 模擬、加速并指導復雜實驗
科學實驗常因成本高昂、復雜且耗時難以執(zhí)行。還有一些實驗因為研究人員無法獲得所需的設施、人力或?qū)嶒灢牧隙鵁o法進行。
核聚變就是一個典型例子。它有望提供一種幾乎無限、無排放的能源來源,并可能支持諸如海水淡化等高能耗的創(chuàng)新性大規(guī)模應用。但控制等離子體所需的托卡馬克反應堆復雜昂貴。ITER 原型從 2013 年建造,預計 2030 年代中期才開始實驗。
AI 可通過模擬加速實驗進程。
一種方法是利用強化學習智能體來對物理系統(tǒng)進行模擬。例如,研究者與洛桑聯(lián)邦理工合作,用強化學習控制托卡馬克等離子體形狀,這一方法還可用于粒子加速器、望遠鏡等設施。
在不同學科中,利用 AI 模擬實驗的方式可能各不相同,但一個共同點是,這些模擬通常用于指導和優(yōu)化現(xiàn)實實驗,而非完全替代它們。
以基因研究為例,普通人平均有 9000 多個錯義變異,大多無害,但少數(shù)會致病?,F(xiàn)實中,僅能逐個測試蛋白質(zhì)的影響。而 AlphaMissense 能快速分類 7100 萬潛在變異中的 89%,幫助科學家聚焦高風險變異,加速疾病研究。

AlphaMissense 對所有可能的 7100 萬個錯義變體的致病性的預測
4. 模型 —— 建模復雜系統(tǒng)及其組件之間的相互作用
1960 年,諾貝爾獎得主物理學家 Eugene Wigner 感嘆數(shù)學方程在模擬自然現(xiàn)象(如行星運動)中「出乎意料的有效性」。

但面對生物學、經(jīng)濟學、天氣等復雜系統(tǒng),傳統(tǒng)方程模型漸顯乏力,因為這些系統(tǒng)充滿動態(tài)性、隨機性,還常伴涌現(xiàn)和混沌,難以預測和控制。這些方程能提供非常有用但并不完美的近似,且運行這些方法也需要高昂的計算成本。
AI 卻能從復雜數(shù)據(jù)中挖掘規(guī)律。例如,谷歌的深度學習系統(tǒng)能快速預測未來 10 天天氣,速度與準確性雙殺傳統(tǒng)數(shù)值模型。

同時,AI 還能幫減緩氣候問題,如用 AI 預測潮濕區(qū)域的出現(xiàn)時間和位置,幫助飛行員避開會加劇全球變暖的凝結(jié)尾跡。
即便 AI 十分強大,它更多是豐富而非取代傳統(tǒng)的復雜系統(tǒng)建模。
例如,基于智能體的建模通過模擬個體行為者(如企業(yè)和消費者)之間的交互,來理解這些交互如何影響更大、更復雜的系統(tǒng)(如社會經(jīng)濟)。
在傳統(tǒng)方法中,科學家需要事先規(guī)定這些智能體的行為方式。
如今,科學家可以利用大語言模型創(chuàng)建更靈活的生成式智能體,這些智能體能夠進行溝通和行動,例如搜索信息或購買,同時還能對這些行動進行推理和記憶。
科學家還可以利用強化學習研究這些智能體如何在更動態(tài)的模擬中學習和調(diào)整其行為,例如對于新的能源價格或疫情響應政策的反應。
5. 解決方案 —— 為大規(guī)模搜索空間問題提出解決方案
很多重要的科學問題都伴隨著許多幾乎無法理解的潛在解決方案。
比如,生物學家和化學家需要確定分子(如蛋白質(zhì))的結(jié)構(gòu)、特性和功能,才能設計出用作抗體藥物、降解塑料的酶或新型材料的一些新分子。
然而,要設計一種小分子藥物,科學家需要面對超過 10^60 種潛在選擇;要設計一種由 400 種標準氨基酸組成的蛋白質(zhì),則需要面對 20^400 種選擇。
這種大規(guī)模搜索空間不僅限于分子,還廣泛存在于許多科學問題中,比如尋找數(shù)學問題的最佳證明、計算機芯片的最佳設計架構(gòu)等。
傳統(tǒng)上,科學家依賴直覺、試錯法、迭代或暴力計算的某種組合來尋找最佳分子、證明或算法。然而,這些方法難以充分遍歷龐大的搜索空間,從而無法發(fā)現(xiàn)更優(yōu)的解決方案。
如今,AI 能夠更好地探索這些龐大的搜索空間,同時更快地聚焦于最有可能可行且有效的解決方案。
今年 7 月,AlphaProof 和 AlphaGeometry2 成功解決了國際數(shù)學奧林匹克競賽中六道題目中的四道。它們利用 Gemini 大語言模型架構(gòu),為給定的數(shù)學問題生成大量潛在解決方案,并結(jié)合基于數(shù)學邏輯的系統(tǒng),迭代地實現(xiàn)接近最可能正確的候選解決方案。
AI 科學家還是 AI 賦能的科學家?
即便 AI 系統(tǒng)的能力在不斷提升,其最大的邊際效益依舊會源于將其應用在能夠突顯其相對優(yōu)勢的場景之中。
比如快速從海量數(shù)據(jù)集中快速提取信息的能力,以及幫助解決科學進步中的真正瓶頸問題;而非企圖讓人類科學家已擅長的任務實現(xiàn)自動化。
隨著 AI 推動科學變得更經(jīng)濟高效,社會對于科學和科學家的需求也會隨之增加。
和其他行業(yè)不同,科學的需求幾乎是無限的,而科技也并不會降低對科學家的需求。新的進展總會在科學的版圖上開拓出全新的、難以預測的領(lǐng)域,AI 亦是如此。
正如司馬賀所設想的那樣,AI 系統(tǒng)自身也是科學研究的對象,科學家會在評估和闡釋其科學能力以及開發(fā)新型人類-AI 科學系統(tǒng)方面起到主導作用。
關(guān)鍵要素
這一部分,文章深入探討了實現(xiàn)「AI for Science」的幾個關(guān)鍵因素,并將其歸納為一個「AI for Science 生產(chǎn)函數(shù)」的模型。
模型展示了如何利用 AI 推動科學研究和創(chuàng)新的不同階段以及需要關(guān)注的核心內(nèi)容。
從科學研究的問題選擇(Problem selection)、模型評估(Evaluations)開始,通過計算資源(Compute)和數(shù)據(jù)(Data)這些基礎設施的支持,在開展研究過程中注重組織模式設計(Organizational design)和跨學科(Interdisciplinarity),形成成果,并最終通過采納(Adoption)將研究成果轉(zhuǎn)化為實際影響。底部的合作(Partnerships)、安全與責任(Safety & responsibility)貫穿始終,確保整個流程高效且符合道德規(guī)范。

雖然很多要素看起來直觀,但 DeepMind 的論文揭示了一些在實踐中重要的經(jīng)驗教訓。
1. 問題選擇
科學進步的關(guān)鍵是找到真正值得解決的問題。
在 DeepMind,科學團隊通常會先評估一個研究問題是否足夠重要,是否值得投入大量時間和資源。
DeepMind 的 CEO Demis Hassabis 提出過一個思維模型:將整個科學視為一棵知識之樹。
那么,最重要的是找到樹的根 —— 像蛋白質(zhì)結(jié)構(gòu)預測、量子化學這些基礎性的「根源問題」,它們一旦得到解決,就能開枝散葉,解鎖全新的研究和應用。
而在這些問題當中,要判斷 AI 是否能帶來增益,我們需要尋找具備特定特征的問題,例如巨大的組合搜索空間、大量數(shù)據(jù),以及可用于衡量性能的明確目標函數(shù)。
許多最近的突破,就來自于重要科學問題和成熟 AI 方法的碰撞。
例如,DeepMind 在核聚變研究的進展就得益于新發(fā)布的強化學習算法 —— 最大后驗策略優(yōu)化(maximum a posteriori policy optimization)。
選對問題很重要,但問題的難度也得剛好。一個適合 AI 的問題,通常是能夠產(chǎn)生中間結(jié)果的問題。
如果問題太難,就沒法產(chǎn)生足夠的反饋推動進展。要做到這一點,需要靠需要直覺與實驗的結(jié)合。
2. 模型評估
科學 AI 研究中,模型的評估方法也很重要。
科學家常常通過基準測試、指標和競賽等評估方法來評估 AI 模型的科學能力。
如果設計得當,這些評估方法不僅可以用來跟蹤進展,還能激發(fā)方法創(chuàng)新,激活研究人員對科學問題的興趣。
不同的情況需要不同的評估方法。
比如,DeepMind 的天氣預測團隊最初用基于幾個關(guān)鍵變量(如地表溫度)的「進展指標」來提升模型表現(xiàn)。
當模型達到一定性能水平時,他們采用了一個更全面的評估方法,其中包括 1300 多個指標。這些指標的設計受歐洲中期天氣預報中心(ECMWF)評價評分卡啟發(fā)。
團隊也發(fā)現(xiàn) AI 模型有時會在某些指標上「作弊」,比如「雙重懲罰」問題 ——「模糊」預測(如預測降雨在較大地理區(qū)域內(nèi)發(fā)生)比「精準」預測(如預測暴風雨的位置略微偏離實際位置)受到的懲罰更少。
為進一步驗證,團隊還評估了模型在下游任務中的實用性,例如預測氣旋路徑的能力,以及表征可能導致洪水的「大氣河流」(集中濕氣的狹窄帶)的強度。
最具影響力的科學 AI 評估方法通常是社區(qū)主導的,比如蛋白質(zhì)結(jié)構(gòu)預測競賽(CASP)。
該競賽自 1994 年由 John Moult 教授和 Krzysztof Fidelis 教授發(fā)起,每兩年舉行一次。CASP 的目標是通過測試各參賽團隊的蛋白質(zhì)結(jié)構(gòu)預測方法的準確性,推動相關(guān)領(lǐng)域的技術(shù)創(chuàng)新,并加深對蛋白質(zhì)折疊和結(jié)構(gòu)的理解。
不過,這也帶來了基準可能「泄露」到 AI 模型訓練數(shù)據(jù)中的風險,讓模型「作弊」,從而降低基準用于跟蹤模型進展的效用。
「作弊」問題暫時沒有完美的解決方案,但至少需要定期更新基準,鼓勵更開放的第三方評估和競賽。
3. 計算資源
計算資源是 AI 和科學發(fā)展的核心引擎,但也是節(jié)能減排的焦點之一。
AI 實驗室和政策制定者需要從長遠視角平衡模型需求與效率提升。
比如,蛋白質(zhì)設計模型小巧高效,而大語言模型訓練時計算密集,但微調(diào)和推理時所需計算量則比較少;通過優(yōu)化數(shù)據(jù)或?qū)⒋竽P汀刚麴s」成小模型,也可以進一步降低計算成本。
同時,也需要對比 AI 與其他科學方法的資源消耗。
例如,AI 驅(qū)動的天氣預測模型盡管訓練耗費資源,但整體效率可能優(yōu)于傳統(tǒng)方法。實證數(shù)據(jù)的持續(xù)跟蹤可以幫助明確這些趨勢,并為未來計算需求的規(guī)劃提供依據(jù)。
此外,計算戰(zhàn)略不應僅關(guān)注芯片供應的充足性,更需優(yōu)先建設關(guān)鍵基礎設施和提升工程技能,以保障資源訪問和系統(tǒng)可靠性。然而,學術(shù)界和公共研究機構(gòu)在這些方面往往資源不足,需要更多支持。
4. 數(shù)據(jù)
像計算資源一樣,數(shù)據(jù)是科學 AI 發(fā)展的基礎設施,需要持續(xù)開發(fā)、維護和更新。
人們常著眼于政策制定者推動的新數(shù)據(jù)集創(chuàng)建。
例如,2012 年美國政府啟動的材料項目繪制了無機晶體圖譜,為 DeepMind 最近的 GNoME 項目預測 220 萬種新材料提供了數(shù)據(jù)支持。
但許多科學 AI 突破往往來自更有機的數(shù)據(jù)涌現(xiàn),這些數(shù)據(jù)得益于有遠見的個人或小團隊的努力。
像當時 Broad 研究所的 Daniel MacArthur 領(lǐng)導開發(fā)的 gnomAD 遺傳變異數(shù)據(jù)集,為 DeepMind 的 AlphaMissense 項目提供了基礎。
還有,數(shù)學工具 Lean 最初由 Leonardo de Moura 開發(fā),如今已成 AI 數(shù)學模型(如 AlphaProof)的重要訓練資源。
這些案例說明,除了自上而下的戰(zhàn)略規(guī)劃,還需要激勵研究者在數(shù)據(jù)收集、整理和共享中扮演更積極的角色。
當前,許多濕實驗室的實驗數(shù)據(jù)因缺乏資金支持而被丟棄;而蛋白質(zhì)數(shù)據(jù)銀行(PDB)的高質(zhì)量數(shù)據(jù)則受益于期刊要求和專業(yè)數(shù)據(jù)整理員制定的統(tǒng)一標準。相比之下,基因組數(shù)據(jù)的整理因標準不一,則常需額外整合和清洗。
此外,還有許多高質(zhì)量數(shù)據(jù)集完全未被利用,比如因許可限制無法公開的生物多樣性數(shù)據(jù),或幾十年核聚變實驗的歷史數(shù)據(jù)。這些瓶頸無論是由于缺乏資源、時間,還是由于數(shù)據(jù)禁運期,都會阻礙 AI 在科學領(lǐng)域的潛力釋放。
5. 組織模式設計
學術(shù)界偏自下而上,工業(yè)界偏自上而下,但頂尖實驗室往往能找到二者間的平衡。
像貝爾實驗室和施樂帕洛阿爾托研究中心的黃金年代,就以自由探索的研究模式著稱。這也為 DeepMind 的創(chuàng)立提供了靈感。
最近,一批新興科學機構(gòu)試圖從這些例子中汲取經(jīng)驗,復刻這種研究模式。它們希望推動更多高風險、高回報的研究,削減官僚主義,為科學家提供更好的激勵。
這些機構(gòu)致力于解決一些科學中規(guī)模過大、學術(shù)界無法承擔,但在工業(yè)界又不夠盈利的問題,例如擴展 Lean 證明助手,這一工具對 AI 數(shù)學研究至關(guān)重要。
這些機構(gòu)的核心目標在于,將自上而下的協(xié)調(diào)與對科學家自下而上的賦能相結(jié)合。既不能完全依賴科學家自由發(fā)揮(可能導致效率低下或研究方向分散),也不能強行控制每一步(會扼殺創(chuàng)造力)。
理想狀態(tài)下,機構(gòu)為科學家提供清晰的目標、資源和支持,但具體的研究方法和過程由科學家自己主導。
找到這種平衡不僅能吸引頂尖研究領(lǐng)導者,也是成功的關(guān)鍵。Demis Hassabis 稱之為協(xié)調(diào)尖端研究的核心秘訣。
這種平衡同樣適用于具體項目。比如在 DeepMind,研究常在「探索」狀態(tài)(團隊尋找新想法)和「利用」狀態(tài)(團隊專注于工程和性能擴展)兩種模式間切換。
掌握模式切換時機和調(diào)整團隊節(jié)奏,是一門藝術(shù)。
6. 跨學科
跨學科合作是破解科學難題的鑰匙,卻常被學科壁壘卡住。
科學 AI 的研究往往需要多學科起步,但真正的突破來自跨學科的深度融合。這不僅是把人湊在一起,而是讓團隊共同開發(fā)共享的方法和思想。
比如,DeepMind 的 Ithaca 項目用 AI 修復受損的古希臘銘文。為了成功,AI 研究負責人要鉆研銘文學,而銘文學家也需要理解 AI 模型,因為直覺對這一工作至關(guān)重要。
培養(yǎng)這種團隊動態(tài)需要正確的激勵機制。團隊能做到這一點,靠的是專注于解決問題,而不是搶論文署名 —— 這也是 AlphaFold 2 成功的關(guān)鍵。
這種專注在工業(yè)實驗室更易實現(xiàn),也凸顯了長期公共研究資金的重要性 —— 它需要擺脫對發(fā)表壓力的過度依賴。
為了實現(xiàn)真正的跨學科合作,組織還需要為能夠幫助融合學科的人創(chuàng)造角色和職業(yè)路徑。
在 DeepMind,研究工程師推動研究與工程的良性循環(huán),項目經(jīng)理加強團隊協(xié)作并連接不同項目。DeepMind 還優(yōu)先招募擅長發(fā)現(xiàn)學科交叉的人,并鼓勵科學家和工程師定期更換項目。
關(guān)鍵是打造一種文化 —— 好奇心驅(qū)動、尊重差異、敢于爭論。經(jīng)濟歷史學家 Joel Mokyr 稱這種文化為「爭議性」(contestability):不同背景的研究者能公開探討,彼此批評又共同進步。
這種文化的實踐可以通過定期舉辦跨學科研討會、開放討論平臺以及鼓勵團隊內(nèi)外互動來實現(xiàn)。

這段修復的銘文(IG I3 4B)記錄了一項與雅典衛(wèi)城相關(guān)的法令,時間可追溯至公元前 485 年至 484 年
7. 采用
科學 AI 工具如 AlphaFold 既專業(yè)化又通用:它們專注少量任務,卻服務廣泛科學界,從研究疾病到改進漁業(yè)。
然而,科學進展轉(zhuǎn)化為實際應用并不簡單。例如,疾病的病原理論(germ-theory)從提出到被廣泛接受經(jīng)歷了漫長的時間,而科學突破所催生的下游產(chǎn)品(如新型抗生素)也常常由于缺乏合適的市場激勵而未能得到充分開發(fā)。
為了促進模型的落地應用,我們在科學家采用與商業(yè)目標、安全風險等因素之間尋找平衡,并設立了一個專門的影響力加速器(Impact Accelerator),以推動研究的落地應用,并鼓勵社會公益方向的合作。
要讓科學家更容易用上新工具,集成流程必須簡單。
在 AlphaFold 2 開發(fā)中,我們不僅開源代碼,還聯(lián)合 EMBL-EBI 創(chuàng)建數(shù)據(jù)庫,供計算資源有限的科學家輕松查詢 2 億種蛋白質(zhì)結(jié)構(gòu)。
AlphaFold 3 進一步擴展了功能,但預測需求激增。為此,我們推出 AlphaFold Server,科學家可按需生成結(jié)構(gòu)。
同時,科學界還自發(fā)開發(fā)工具如 ColabFold,顯示對多樣化需求的重視及培養(yǎng)科學界計算能力的重要性。

迄今為止,來自全球 190 多個國家的超過 200 萬用戶已訪問 AlphaFold 蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫,瀏覽了 700 多萬個結(jié)構(gòu)
科學家信任 AI 模型,才會用它。推廣關(guān)鍵在于明確模型的用途和局限。
比如,在 AlphaFold 開發(fā)中,我們設計了不確定性指標,通過直觀可視化展示模型對預測的信心,并與 EMBL-EBI 合作推出培訓模塊,指導如何解讀置信度并用實際案例強化信任。
類似地,Med-Gemini 系統(tǒng)在健康問答上表現(xiàn)優(yōu)異。它通過生成多條推理鏈評估答案分歧計算不確定性。當不確定性高時,自動調(diào)用網(wǎng)絡搜索整合最新信息。
這種方法既提升了可靠性,也讓科學家對決策過程一目了然,信任倍增。

Med-Gemini-3D 能夠為 CT 掃描生成報告,這比標準 X 光成像復雜得多。在此示例中,Med-Gemini-3D 的報告正確地包含了原始放射科醫(yī)生報告中遺漏的一處病變(用綠色標出)
8. 合作
科學 AI 離不開多領(lǐng)域協(xié)作,公共和私營部門的合作尤為關(guān)鍵。
從數(shù)據(jù)集創(chuàng)建到成果共享,這種合作貫穿項目全程。
比如,AI 模型設計的新材料是否可行,需要資深材料科學家的評估;DeepMind 設計的抗 SARS-CoV-2 蛋白質(zhì),能否如預期結(jié)合目標,也需與克里克研究所合作進行濕實驗驗證。甚至在數(shù)學領(lǐng)域,F(xiàn)unSearch 解決 Cap Set 問題,也得益于數(shù)學家 Jordan Ellenberg 的專業(yè)指導。
鑒于工業(yè)實驗室在推動 AI 發(fā)展中的核心作用,以及對豐富領(lǐng)域知識的需求,公共與私營部門的合作在推動科學 AI 前沿發(fā)展方面的重要性將日益凸顯。為此,必須加大對公私合作的支持,比如為大學和研究機構(gòu)與企業(yè)的聯(lián)合團隊提供更多資金。
但合作不簡單。各方需盡早就目標和關(guān)鍵問題達成一致:研究成果歸屬、是否發(fā)表論文、數(shù)據(jù)和模型是否開源、適用的許可協(xié)議等,都可能引發(fā)爭議。這些分歧通常反映了雙方不同的激勵,但成功合作往往建立在清晰的價值互換之上。
比如,AlphaFold 蛋白質(zhì)數(shù)據(jù)庫能覆蓋 200 萬用戶,正是因為結(jié)合了我們的 AI 模型與 EMBL-EBI 的生物數(shù)據(jù)管理專長。這種優(yōu)勢互補式合作,不僅高效,還能讓 AI 潛力最大化。
參考資料:
https://deepmind.google/public-policy/ai-for-science/
https://x.com/_jasonwei/status/1861496796314493376
本文來自微信公眾號:微信公眾號(ID:null),作者:新智元
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。