作者 wearytolove (奪真書生A.W.)標題 [閒聊] 用兩億個參數訓練AI打Pokemon對戰時間 Tue Apr 22 07:58:10 2025
https://arxiv.org/abs/2504.04395
UT Austin資工系一群研究人員
使用線上對戰遊戲Competitive Pokémon Singles (CPS)
過去15年的真人6v6 pokemon對戰歷史資料共95萬場比賽
以強化學習的方式學習遊戲技巧
(何時攻擊、用啥攻擊、換怪、換啥怪、場地天候因素、考量對手攻擊集氣等,最
多到兩億的參數),
最後把訓練的模型匿名偷偷拿去真人對戰爬積分,
成功爬到前10%的ranking
https://imgur.com/DqrgjKj.png
這代表AI也開始進攻Pokemon對戰遊戲了
不過才爬到前10%,代表還有10%的人可以打贏AI
不過這遊戲在台灣好像現在討論不多就是了
----
另外 期刊作者順序 作者說是比賽Pokemon決定的....
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 108.31.73.137 (美國)
※ 作者: wearytolove 2025-04-22 07:58:10
※ 文章代碼(AID): #1e1jkMmF (C_Chat)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1745279894.A.C0F.html
※ 編輯: wearytolove (108.31.73.137 美國), 04/22/2025 07:58:34
推 Wardyal: 2億以模型來說算很多嗎1F 04/22 08:03
推 aaaaooo: GPT-1 1.1億 GPT-2 15億 GPT-4 5000億+ 2億是迷你模型2F 04/22 08:04
→ qss05: 可是每代的戰術多少有差,太久的也不能參考吧,這要能打到1%應該很難,雖然好像部分版本的情況比較單一,不用判斷那麼多3F 04/22 08:13
→ aaaaooo: 他用強化學習的只要換代時花點時間再訓練就好 只要設備夠好很快又能爬上去7F 04/22 08:15
推 ClawRage: 反正大多數時間猜守住跟丟硬幣並沒有區別
打大師績分完全OK
只要沒涉及養怪戰術都沒啥研究難度9F 04/22 08:22
推 chocoball: 10%也滿強了 至少多數玩家贏不了ai13F 04/22 08:48
→ teddy: 2億不大 有顯卡就能跑14F 04/22 08:50
推 CYHyen: 10%蠻爛的吧 在認真玩家眼裡可能都有很多明顯的錯誤15F 04/22 08:59
推 louie0909: 2億是0.2B?那超迷你模型欸 搞不好手機都能跑16F 04/22 09:04
→ OldYuanshen: 前10%不就是pr90的意思嗎 還是天梯只有前10%才競爭底下很多只是玩自己喜歡的隊伍18F 04/22 09:14
推 kramasdia: 圍棋ai都能打世界冠軍了 寶可夢ai只能10%相比之下難免讓人覺得不足20F 04/22 09:23
→ xga00mex: 感覺應該要進3%左右才算強吧 10%感覺就一般熱衷玩家22F 04/22 09:26
→ weiman0702: 這還會牽涉對戰環境
某種隊伍太強勢就會有很多人開始針對
如果勝率保持在70%甚至80%以上就非常強了23F 04/22 09:27
→ xga00mex: 不過也要看打的場次跟勝率就是了26F 04/22 09:28
--