作者 wearytolove (奪真書生A.W.)
標題 [閒聊] 用兩億個參數訓練AI打Pokemon對戰
時間 Tue Apr 22 07:58:10 2025



https://arxiv.org/abs/2504.04395
[2504.04395] Human-Level Competitive Pokémon via Scalable Offline Reinforcement Learning with Transformers Abstract page for arXiv paper 2504.04395: Human-Level Competitive Pokémon via Scalable Offline Reinforcement Learning with Transformers ...

 

UT Austin資工系一群研究人員

使用線上對戰遊戲Competitive Pokémon Singles (CPS)

過去15年的真人6v6 pokemon對戰歷史資料共95萬場比賽

以強化學習的方式學習遊戲技巧


(何時攻擊、用啥攻擊、換怪、換啥怪、場地天候因素、考量對手攻擊集氣等,最

多到兩億的參數),

最後把訓練的模型匿名偷偷拿去真人對戰爬積分,

成功爬到前10%的ranking

https://imgur.com/DqrgjKj.png
[圖]


這代表AI也開始進攻Pokemon對戰遊戲了

不過才爬到前10%,代表還有10%的人可以打贏AI

不過這遊戲在台灣好像現在討論不多就是了

----

另外  期刊作者順序  作者說是比賽Pokemon決定的....



--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 108.31.73.137 (美國)
※ 作者: wearytolove 2025-04-22 07:58:10
※ 文章代碼(AID): #1e1jkMmF (C_Chat)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1745279894.A.C0F.html
※ 編輯: wearytolove (108.31.73.137 美國), 04/22/2025 07:58:34
Wardyal: 2億以模型來說算很多嗎1F 04/22 08:03
aaaaooo: GPT-1 1.1億 GPT-2 15億 GPT-4 5000億+ 2億是迷你模型2F 04/22 08:04
qss05: 可是每代的戰術多少有差,太久的也不能參考吧,這要能打到1%應該很難,雖然好像部分版本的情況比較單一,不用判斷那麼多3F 04/22 08:13
none049: AI會摸去化石嗎?6F 04/22 08:13
aaaaooo: 他用強化學習的只要換代時花點時間再訓練就好 只要設備夠好很快又能爬上去7F 04/22 08:15
ClawRage: 反正大多數時間猜守住跟丟硬幣並沒有區別
打大師績分完全OK
只要沒涉及養怪戰術都沒啥研究難度9F 04/22 08:22
BusterPosey: 所以有得出現在規則哪個神最強嗎?12F 04/22 08:33
chocoball: 10%也滿強了  至少多數玩家贏不了ai13F 04/22 08:48
teddy: 2億不大 有顯卡就能跑14F 04/22 08:50
CYHyen: 10%蠻爛的吧 在認真玩家眼裡可能都有很多明顯的錯誤15F 04/22 08:59
louie0909: 2億是0.2B?那超迷你模型欸 搞不好手機都能跑16F 04/22 09:04
whitekyubi: 有包含編隊跟配招嗎?17F 04/22 09:13
OldYuanshen: 前10%不就是pr90的意思嗎 還是天梯只有前10%才競爭底下很多只是玩自己喜歡的隊伍18F 04/22 09:14
kramasdia: 圍棋ai都能打世界冠軍了 寶可夢ai只能10%相比之下難免讓人覺得不足20F 04/22 09:23
xga00mex: 感覺應該要進3%左右才算強吧 10%感覺就一般熱衷玩家22F 04/22 09:26
weiman0702: 這還會牽涉對戰環境
某種隊伍太強勢就會有很多人開始針對
如果勝率保持在70%甚至80%以上就非常強了23F 04/22 09:27
xga00mex: 不過也要看打的場次跟勝率就是了26F 04/22 09:28

--
作者 wearytolove 的最新發文:
點此顯示更多發文記錄