看板 C_Chat作者 kira925 (1 2 3 4 疾風炭)標題 Fw: [新聞] 人工智能開始玩星海爭霸 2,它玩的如何?時間 Mon Aug 14 11:49:20 2017
※ [本文轉錄自 StarCraft 看板 #1Pa7S_4S ]
看板 StarCraft作者 H45 (!H45)標題 Re: [新聞] 人工智能開始玩星海爭霸 2,它玩的如何?時間 Sun Aug 13 23:58:50 2017
論文:
https://deepmind.com/documents/110/sc2le.pdf
如果AI以點擊為輸入介面的話,星海每個動作估計有10^8個可能性,相較之下,19路圍棋
每步棋最多只有19x19種可能性。
戰爭迷霧有特殊的圖形介面讓AI知道戰爭迷霧在哪裡(見論文圖2)。
APM設定成180,換算一下就是AI一秒最多只能下三道指令。
關於學習的部分,首先DM讓AI自己跟自己左右互搏,一場最多打30分鐘,超時算平手,學
到最後和內建最簡單的電腦1v1測試,AI一場也沒贏過,只有平手或輸掉兩種結果(見論文
圖5)。
之後DM讓AI去看800K個replay,這800K個replay從最低端到職業玩家都有,AI從這些
replay學習局面判斷能力。遊戲剛開始的時候,因為輸贏機率一樣,所以AI預測準確率為
50%。遊戲進行到愈後面AI準確率愈高,在遊戲時間15分鐘的時候AI有65%機率猜對最後結
果(見論文圖8)。
然後DM讓AI模仿replay裡面玩家的行為,論文最後只提到AI會去生產一些軍事單位(見論
文圖9),沒提到能不能打贏最簡單的電腦......
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.166.177.51
※ 文章代碼(AID): #1Pa7S_4S (StarCraft)
※ 文章網址: https://www.ptt.cc/bbs/StarCraft/M.1502639935.A.11C.html
推 aCCQ: 很期待神功大成上場時 跟圍棋一樣吸引大家的關注 去瞭解RTS1F 08/14 00:05
推 realestate: 所以這個AI連基本的兵種特性都不知道就下去打了? 這不就等於教一歲的小朋友玩星海一樣2F 08/14 00:20
推 win4104: 重點就是這個從什麼不知道學會的學習過程4F 08/14 00:23
推 homelife: 之前Deepmind它們訓練AI玩其他小遊戲的時候,都是沒跟AI說規則,只跟AI說要讓分數儘量高,接著就把遊戲放著讓AI自己玩一整晚6F 08/14 00:51
→ Anidream: 想 ai 贏還不容易.... bot 有的是啊9F 08/14 01:01
→ virnux: 現在的BOT都是照腳本跑吧 離人工智慧還差的遠10F 08/14 01:07
推 Anidream: 所以啊. 重點是 AI 學習的過程12F 08/14 03:03
推 Adonisy: 我也想和自己左右互博啊...但是一天頂多10場...13F 08/14 10:29
→ H45: 請自由轉貼15F 08/14 11:44
※ 發信站: 批踢踢實業坊(ptt.cc)
※ 轉錄者: kira925 (115.176.80.121), 08/14/2017 11:49:20
→ kira925: DeepMind網站上有些影片 然後就會發現AI根本不知道在幹嘛2F 08/14 12:13
推 clfish: 住手啊,天網要出來啦3F 08/14 12:18
推 shintz: 看twitch AI打bot還是笨笨的4F 08/14 12:19
推 Dsakura: 想看twitch聊天室玩星海 VS 現在的AI 像twitch plays pokemon那樣5F 08/14 12:51
推 win4104: 他們有用小型任務讓他學習過 像是 目標採到多少礦
或是產幾隻槍兵8F 08/14 12:59
→ kira925: @Dsakura 控制不來10F 08/14 13:34
推 gowaa: 一開始ai下圍棋也是笨笨的啊11F 08/14 13:41
推 art1: 玩家學習兵種相剋很少是透過兩個兵種pk才學到的
要讓AI學會兵種相剋,應該是讓AI透過設定好的任務去訓練
學會兵種相剋之後,再安排學習資源分配(也就是流程)
之後的記錄檔訓練才會比較有意義12F 08/14 17:50
--