IT之家 4 月 10 日消息,據(jù)外媒 ASCII 今日?qǐng)?bào)道,美國(guó)得克薩斯大學(xué)奧斯汀分校的 Yuke Zhu 助理教授及其團(tuán)隊(duì)于 4 月 10 日發(fā)布了一款能夠像人類一樣進(jìn)行寶可夢(mèng)對(duì)戰(zhàn)的 AI 智能體“Metamon”。
IT之家附項(xiàng)目地址:點(diǎn)此前往
我們暫時(shí)從機(jī)器人技術(shù)中抽身,構(gòu)建了一個(gè)能夠像人類一樣進(jìn)行競(jìng)技寶可夢(mèng)對(duì)戰(zhàn)的 AI 智能體。部分可觀測(cè)。隨機(jī)性。長(zhǎng)期規(guī)劃?,F(xiàn)在通過(guò)離線強(qiáng)化學(xué)習(xí) + Transformer 模型掌握了。我們的智能體在超過(guò) 47.5 萬(wàn)場(chǎng)人類對(duì)戰(zhàn)中訓(xùn)練,進(jìn)入了 Pokémon Showdown 排行榜的前 10%。

在 Metamon 的開(kāi)發(fā)過(guò)程中,利用了超過(guò) 47.5 萬(wàn)次人類之間的寶可夢(mèng)對(duì)戰(zhàn)數(shù)據(jù)。此外,還使用了大語(yǔ)言模型智能體等非人類對(duì)手,總共訓(xùn)練了 20 個(gè)智能體。
此外,作為實(shí)戰(zhàn)性能檢查,該智能體還參加了模擬各世代寶可夢(mèng)的網(wǎng)站“Pokémon Showdown”的排名戰(zhàn),與人類玩家對(duì)戰(zhàn)。IT之家從結(jié)果中獲悉,部分 Metamon 智能體取得了進(jìn)入活躍用戶前 10% 的好成績(jī)。
該小組計(jì)劃未來(lái)構(gòu)建一個(gè)研究專用的 Showdown 服務(wù)器,以便在不干擾人類玩家的情況下跟蹤進(jìn)展。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。