Re: [新聞] AlphaGo下一步在哪傳將挑戰《星海爭霸》 - Gossiping板

看板 Gossiping
作者 Verola (sometimes I love you)
標題 Re: [新聞] AlphaGo下一步在哪傳將挑戰《星海爭霸》
時間 Sun Mar 13 03:37:36 2016

※ 引述《pkyosx (Insomnia)》之銘言：
: : 老實說我覺得也可能是 SC2 沒打算把AI做得太強而已。
Alpha的強弱不是人類幫他設定的是他自己去學去領悟出來的
現在要測試的就是人工智慧的學習能力跟悟性
所以一開始什麼都不會教他看他能不能學會怎麼玩Game
: DeepMind 要做的可不是遊戲內建的 AI 系統
: 他要做的是 general purpose AI 也就是作為一個跟你我一樣起點的玩家
: 他們之前做的都是相對簡單的遊戲小蜜蜂打磚塊
: 他們架了攝影機對著電腦銀幕當做 AI 的眼睛
: 然後只給 AI 一個目標就是得高分
: https://youtu.be/0X-NdPtFKq0?t=1219

Public Lecture with Google DeepMind's Demis Hassabis - YouTube Watch the founder of Google DeepMind's Demis Hassabis' lecture about the future and capabilities of artificial intelligence. This video was filmed by IET TV....

https://youtu.be/V1eYniJ0Rnk 這個版本比較快

Google DeepMind's Deep Q-learning playing Atari Breakout - YouTube Google DeepMind created an artificial intelligence program using deep reinforcement learning that plays Atari games and improves itself to a superhuman level...

看這影片可以更理解AlphaGo是什麼跟DeepMind想要測試什麼
還有另一個影片是打超級馬利歐的

一開始Alpha什麼都不知道只知道他可以操作畫面目標是得高分

第一階段

他觀察回饋學會螢幕上的bar可以被他移動他的bar可以反彈球(光點)
學會那顆球會反彈回去打破磚塊學會如何不要game over

第二階段他觀察到打磚塊跟分數的關係搞懂這遊戲如何拿分數

第三階段他觀察到如何拿高分可以打很久都不會死

第四階段他找到秘技(在這遊戲不算bug)
把球打到磚塊背面去輕鬆拿高分

在這遊戲的例子中他進化到第四階段只花了4小時

: 如果他真的可以做到讓 AI 也是看著他的電腦銀幕然後操作鍵盤滑鼠
: (鍵盤滑鼠可能就直接打訊號了)
: 基本上等於又完成一個很重大的里程碑了
: 代表他不只可以應付簡單的環境連複雜的策略應對能力都有了

然後現在要把這個學習過程搬到星海上
超級瑪莉跟其他不少他已經破關過
圍棋他也算某種程度破關了(?)

推 signm: 終於有篇正解了，電腦ai做到的事不代表alpha知道03/13 01:23

星海AI是人寫的教AI怎麼作 Alpha一無所知要測的就是他如何去學習的過程

→ signm: 這跟微操沒關係，重點是要讓電腦思考，這有點難解釋03/13 01:25

用上面四階段套大概就是搞懂星海這遊戲怎玩怎麼贏怎麼變得很厲害

推 arnold3: 人類光是懂得開密技就不可能輸給ai了
再不然去網站找破解黨總有辦法對付03/13 01:29

你確定人類找秘技的速度會比Alpha快嗎
人類的優勢是數量多思考的人多以及可以透過網路傳遞知識經驗跟秘技

推 tetani: 要怎麼讓電腦知道目標? 萬一誤認成得低分呢?03/13 01:30

他都可以理解圍棋怎樣叫贏了

推 tetani: youtube裡面AI玩小遊戲練習到最後那已經不像人類了03/13 01:32

推 a2156700: 感覺只是時間的問題...03/13 01:34

推 wnglon: https://dotblogs.com.tw/allanyiin/2016/03/12/22221503/13 01:37

淺談Alpha Go所涉及的深度學習技術 | 尹相志Allan's blog - 點部落

介紹AlphaGo的技術原理，以及背後涉及到的類神經網路以及深度學習技術。 ...

推 signm: 到目前alpha玩的還是這種規則簡單遊戲要讓它學習更複雜所以才有這新聞
之前的討論是用電腦角度去看當然覺得穩贏03/13 01:39

推 sadmonkey: 說實在把圍棋用圖形化理解是簡化問題，把玩遊戲用圖形化理解只是複雜化問題，只是對工程師出考題對解決人類無法解決的問題沒有甚麼幫助03/13 02:13

--
標題 Re: [問卦] 過年要如何叫不熟的親戚閉嘴? 看板《Gossiping》 (#1KurUyPF)
「怎麼這麼久沒回來阿？」「我這不是來了嗎？」
「要常常回來給我們看阿」「我不知道你要見我阿，你這不是見到了嗎？」
「趕快生小孩阿！人家阿花都已經生了一個了！」「那他生了一個，有沒有要生第二個？」
「有錢沒錢，結婚好過年嘛！」「你們的婚姻能維持這麼久，真不簡單！」
「ㄟ，你怎麼這樣說話？對長輩真沒禮貌！」「我把你們當人看，要教育你們！」

--

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.230.18.167
※ 文章代碼(AID): #1Mv704Pg (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1457811460.A.66A.html

推 kimifort: 還好AlphaGo桌面沒安裝PCMan 不然就讓他學會發一堆廢文1F 03/13 03:39

推 owenkuo: 那一天，人類想起了AlphaGo當年開始打敗人類的起點....2F 03/13 03:40

推 milkBK: 先看rp讓他知道採礦能造兵，造兵能打贏，
然後慢慢去模擬，最後發現最強其實是6d3F 03/13 03:41

推 GalLe5566: 領悟(X) 計算(O) 他只是單純算怎麼做勝率高5F 03/13 03:42

→ wnglon: https://dotblogs.com.tw/allanyiin/2016/03/12/2222156F 03/13 03:42

淺談Alpha Go所涉及的深度學習技術 | 尹相志Allan's blog - 點部落

介紹AlphaGo的技術原理，以及背後涉及到的類神經網路以及深度學習技術。 ...

→ wnglon: 阿發狗的原型別再誤導大眾了7F 03/13 03:43

推 dans: 那阿發狗能從八卦版計算出怎樣發廢文可以得最多噓嗎
我在廢文之道上已感力不從心希望藉由與阿發狗一戰得到靈感8F 03/13 03:43

→ wnglon: 你要用幾顆CPU去計算星海的最佳微操瘋了嗎你10F 03/13 03:44

推 hibbb: 其實應該是要讓阿法狗和電腦正常對戰個1000場再挑戰人類
然後由人類方狂放快攻戰術看看阿發狗到底會怎麼應對11F 03/13 03:45

→ leon80148: 如果只跟一般AI打，最後電腦應該只會每場都放大招吧13F 03/13 03:46

→ hibbb: 很明顯打正規無論是資源或微操阿發狗都強太多了14F 03/13 03:46

→ wnglon: 阿發狗是在對戰時跟自己對奕去找出機率較大的贏法
請問星海要怎樣算出最佳演算法?
麻煩看一下連結15F 03/13 03:46

推 godsparticle: 打一場星海要多久? 他可能學很慢18F 03/13 03:48

→ wnglon: 星海不是回合制沒辦法及時喔可能要計算個一分鐘
才能找到最佳解
鄉民臉腫了哈哈19F 03/13 03:49

→ leon80148: 理論上是可以的至於演算法要怎麼寫一般人怎會知道22F 03/13 03:51

→ wnglon: 繼續嘴砲沒關係23F 03/13 03:51

推 dans: 邊走邊算不就好了若要算出最佳解才能移動圍棋也不用玩了24F 03/13 03:52

→ wnglon: 起碼阿發狗概念目前絕對不能運用25F 03/13 03:52

→ DarkerDuck: alphago找出來的本來就不是最佳解，根本不用找最佳解26F 03/13 03:52

→ wnglon: 他是用2000多顆去計算的星海要幾顆?27F 03/13 03:52

→ DarkerDuck: alphago的架構是為圍棋特化的弱AI28F 03/13 03:53

→ leon80148: 在跟李40比賽之前也一堆人覺得阿發狗會被玩封阿...29F 03/13 03:53

→ wnglon: 口誤不好意思30F 03/13 03:53

→ dans: 邊走邊算不就好了？開局固定起手勢不就那幾個？31F 03/13 03:53

→ Enrollee: 我比較好奇為什麼有人會覺得阿發狗不會玩星海? XD32F 03/13 03:53

→ dans: 戰略遊戲的"定石"還比圍棋少開局多的是時間可以算33F 03/13 03:54

→ wnglon: 連結不就有解說了34F 03/13 03:54

→ Enrollee: 星海很難嗎? 坦白講連圍棋都能贏了，星海很難嗎?35F 03/13 03:54

→ leon80148: 圍棋複雜度也不低但阿髮狗證明他就是有辦法學起來36F 03/13 03:54

→ wnglon: 不是用學的怎麼有人還搞不懂37F 03/13 03:54

→ leon80148: 更何況在微操跟計算資源這方面電腦根本大勝好嗎38F 03/13 03:54

→ dans: 圍棋就是邊走邊算只是Google沒告訴你讀秒是內建限制的
根本不是算不出答案才搞到讀秒，而是永遠在規範時間內求解39F 03/13 03:54

→ wnglon: 圍棋是一瞬間算大量的走法才會用到2000顆CPU
這過程起碼也要一分鐘以上有看棋嗎41F 03/13 03:56

推 dans: 你確定是算答案花一分鐘，還是工程師告訴他每一步都有一分鐘拿那時間來說計算過程要多久會不會太天真了，機器不會自己決43F 03/13 03:58

推 henry1234562: 這個機制就是學習實際上這alphago就會玩小遊戲45F 03/13 03:58

→ dans: 定計算時間，而是別人告訴他什麼時候可以用多少時間46F 03/13 03:58

推 wnglon: 你去看今天比賽電腦有哪一步是即時下的47F 03/13 03:59

→ leon80148: 最好電腦在算的過程就完全不會動按著S讓你A假的。48F 03/13 03:59

→ dans: 說不定阿發狗20秒就算完答案還上網跟初音聊了40秒的天49F 03/13 03:59

→ henry1234562: 電腦不需要即時下他有時間為啥要即時下50F 03/13 04:00

→ dans: 只因為主辦單位跟他說比賽前段要一分鐘才能落子，後段要30秒51F 03/13 04:00

→ henry1234562: 且實際上昨天alphago進讀秒時他就固定30秒一子52F 03/13 04:00

→ wnglon: 你去GO版看有推文已經完整解釋其演算法53F 03/13 04:00

→ henry1234562: 一秒都沒多用他早就計算完你也不知道54F 03/13 04:00

→ leon80148: 搞不好電腦發現在幾秒鐘下的時後贏的機率最高zzz55F 03/13 04:01

→ willy61615 …

→ dans: 有演算法有什麼用？會告訴我們Google給阿發狗設定幾秒落子嗎58F 03/13 04:01

推 grandwar: 說開作弊會贏的，你以為工程師不會預測你開作弊嗎？XD59F 03/13 04:02

→ wnglon: 你去看連結好嗎別再跟我辯這個看完再說這套理念能不能用在星海60F 03/13 04:02

→ Enrollee: 基本上星海這種軍備競賽遊戲對阿發狗來說實在是簡單啦62F 03/13 04:02

→ Justisaac …

→ leon80148: 奇怪捏一直提連結作啥，我看了連結還是覺得很厲害阿64F 03/13 04:03

→ Justisaac …

→ Enrollee: 推文就有鄉民說了連爆雪都辦得到何況是阿發狗66F 03/13 04:03

→ Justisaac …

推 henry1234562: 當然可以用在星海..你搞錯了一些東西
alphago 可不是每一場都從0開始重新計算68F 03/13 04:04

推 jinmin88: 訓練的核心應該都是同一套只是agent要特製化...70F 03/13 04:04

→ henry1234562: 是訓練了很久才到現在這程度這就是學71F 03/13 04:04

→ Justisaac …

→ leon80148: 應該沒這麼複雜啦星海自己都有內建AI了73F 03/13 04:05

→ henry1234562: 能夠學打磚塊能學小蜜蜂當然能學星海74F 03/13 04:05

推 wnglon: 重點阿發狗根本是自對奕來計算勝率沒有所謂的學習75F 03/13 04:05

→ henry1234562: alphago 的勝率計算法包含過去對奕過的所有經驗76F 03/13 04:06

→ Justisaac …

→ henry1234562: 而不是只從當下這局去算分支78F 03/13 04:06

→ leon80148: 即時戰略就是在比控兵,計算資源,偵查及部分博奕成分79F 03/13 04:06

→ Justisaac …

→ henry1234562: 會利用過去經驗就是學習81F 03/13 04:06

→ leon80148: 沒理由圍棋作的到星海作不到82F 03/13 04:07

推 grandwar: 你看完那篇怎麼會有他沒有學習的誤會？XD 只是他的學習83F 03/13 04:07

→ Enrollee: 圍棋阿法狗需要思考沒錯因為可以變動的變項太多84F 03/13 04:07

→ Justisaac …

→ grandwar: 還在很初階的階段而已啊86F 03/13 04:07

→ henry1234562: 是電子遊戲就能加速且也能從錄像學習87F 03/13 04:07

→ Justisaac …

→ leon80148: 星海一場通常不到20分鐘就打完了好嗎。這幾場圍棋都用小時來算的89F 03/13 04:07

→ henry1234562: 當然以現在的程度要學多久不知道91F 03/13 04:07

→ Enrollee: 星海只要拼速度殺暴對方就好了人是快得過電腦的速度逆92F 03/13 04:08

→ Justisaac …

推 Cocochia: 經驗累積其實不就是學習嗎？94F 03/13 04:08

→ henry1234562: 我覺得只是沒有花時間去加速遊戲而已95F 03/13 04:08

推 jinmin88: 星海的學習難度應該比方塊阿馬力歐的難度多很多96F 03/13 04:09

→ grandwar: 電腦光用電子訊號控兵，你的速度絕對跟不上他啦97F 03/13 04:09

→ henry1234562: 畢竟重點是在驗證這個方式能不能有學習效果98F 03/13 04:09

→ Justisaac …

推 SHIU0315: @@314F 03/13 12:09

推 AbbeyJien: 推315F 03/13 12:10

推 AMAGICIAN: 李40:生而為人，我很抱歉316F 03/13 12:29

推 Windcws9Z: 完了完了要變天網了317F 03/13 12:37

噓 gncn: 推文一堆裝懂的腦殘..... 台灣的民眾素質阿....318F 03/13 13:48

→
tty1

台灣 03-13 14:33
沒上過AI的不要裝模作樣出來人笑了啦
→
b7118405

台灣 03-13 17:01
以前是遇到狀況人類教電腦怎麼處理，現在是人類給電腦規則，電腦去處理，以後會不會是讓電腦去發現環境，然後製造規則，再去處理。
→
APPA

台灣 03-13 17:22
人類跟機器比? 比啥洨? 完全無俚頭!
機器是人類設計的邏輯處理與經驗選擇系統
就像下棋, 人類無法對付龐大棋譜的記憶,與邏輯系統對決!

棋譜都是人類設計的經驗與邏輯累積,累積了幾萬個選擇與對策
下棋只是全部侷限在一個棋格子框架下,這是最簡易的範圍
沒有複雜的參數,
機器就是機器,只是對你的抉擇反應下個步驟,是對付你錯誤的選擇罷了!
人類單然無法跟這款的比賽比!

但是機器能夠打戰, 指揮人類武器對抗,生死戰嗎?
機器做的決定,也無法打贏人類,因為機器指揮人類作戰
就算是機器人,也是全身都是致命的弱點
無法計算出人類的各種參數,還包括無可預測的人類意志力

對藝術創作,請問Google 能夠發明藝術AI?
機器可以跟人類比賽藝術創作嗎? 呸! 也是無俚頭!
→
zoo

美國 03-14 02:27
我只擔心AI學會把妹後把全世界的妹;都把走,人類就滅亡了.
→
aspeed

台灣 03-14 09:15
還需要比嗎光不用按鍵盤滑鼠就穩贏了好嗎你一秒能按幾個兵種生產

(Verola.): Re: [新聞] AlphaGo下一步在哪傳將挑戰《星海爭霸》 - Gossiping板