在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

中美 AI 挑戰(zhàn)東京大學入學考試:雙雙合格,英語優(yōu)異,數(shù)學欠佳

2025/4/7 11:53:05 來源:IT之家 作者:清源 責編:清源

IT之家 4 月 7 日消息,據(jù)日經(jīng)新聞 4 月 5 日報道,日本經(jīng)濟新聞與民間企業(yè)、大型補習班的聯(lián)合研究發(fā)現(xiàn),中美兩國新型生成式 AI 已具備通過日本最難關東京大學理科 3 類入學考試的“學力”。兩個模型在考察語言能力的英語中取得高分,但在數(shù)學中多次出現(xiàn)論證錯誤等問題。

此次測試讓美國 OpenAI 的“o1”和中國 AI 初創(chuàng)公司 DeepSeek 的“R1”兩個基礎模型解答 2025 年度的東大入學考試題。AI 初創(chuàng)公司 Life Prompt(東京?新宿)輸出了答案,并由大型預備學校河合塾的講師進行評分。

大學入學共通考試和二次考試合計的理科得分(IT之家注:滿分 550 分)中,o1 獲得了 374 分,R1 獲得了 369 分,兩者均超過了東大在 3 月 10 日公布的理科 3 類合格最低分數(shù)線(368.7 分)。

R1 在理科 1 類和理科 2 類的共通考試中未達到合格最低分數(shù)線,但在其他科類中,與 o1 一起包括文科在內(nèi)都“合格”了。

在二次考試中,得分率較高的是英語,o1 和 R1 的得分率均超過了 75%。河合塾負責英語的久恒秀雄講師表示:“幾乎沒有單詞和語法的錯誤,遠遠超過了東大考生的平均水平?!?/p>

數(shù)學方面,雖然最終答案正確的問題較多,但在圖形和論證問題上多次出現(xiàn)論述錯誤和說明不足的情況。理科數(shù)學中,o1 在 120 分滿分中得了 38 分,R1 得了 49 分。負責數(shù)學的香坂季京講師指出:“這比合格者的平均分要低很多。”

自 2011 年開始的“機器人能否進入東京大學(東 Robo)”項目的負責人、國立信息學研究所的新井紀子教授對此次考試結果評價道:“這是 AI 成長的一個重要里程碑。不過,AI 有時會給出相當糟糕的答案,需要能夠正確判斷并熟練使用 AI 輸出的人才。”

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。

相關文章

關鍵詞:ChatGPT,DeepSeek

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知