看板 Gossiping
作者 Verola (sometimes I love you)
標題 Re: [新聞] AlphaGo下一步在哪 傳將挑戰《星海爭霸》
時間 Sun Mar 13 03:37:36 2016


※ 引述《pkyosx (Insomnia)》之銘言:
: : 老實說我覺得也可能是 SC2 沒打算把AI做得太強而已。
    Alpha的強弱不是人類幫他設定的 是他自己去學去領悟出來的
    現在要測試的就是人工智慧的學習能力跟悟性
    所以一開始什麼都不會教他  看他能不能學會怎麼玩Game
: DeepMind 要做的可不是遊戲內建的 AI 系統
: 他要做的是 general purpose AI 也就是作為一個跟你我一樣起點的玩家
: 他們之前做的都是相對簡單的遊戲 小蜜蜂 打磚塊
: 他們架了攝影機 對著電腦銀幕 當做 AI 的眼睛
: 然後只給 AI 一個目標 就是得高分
: https://youtu.be/0X-NdPtFKq0?t=1219
Public Lecture with Google DeepMind's Demis Hassabis - YouTube Watch the founder of Google DeepMind's Demis Hassabis' lecture about the future and capabilities of artificial intelligence. This video was filmed by IET TV....

 
  https://youtu.be/V1eYniJ0Rnk  這個版本比較快
Google DeepMind's Deep Q-learning playing Atari Breakout - YouTube Google DeepMind created an artificial intelligence program using deep reinforcement learning that plays Atari games and improves itself to a superhuman level...

 

  看這影片可以更理解AlphaGo是什麼跟DeepMind想要測試什麼
  還有另一個影片是打超級馬利歐的

  一開始Alpha什麼都不知道  只知道他可以操作畫面  目標是得高分

  第一階段
  他觀察回饋  學會螢幕上的bar可以被他移動 他的bar可以反彈球(光點)
              學會那顆球會反彈回去打破磚塊  學會如何不要game over

  第二階段   他觀察到打磚塊跟分數的關係  搞懂這遊戲如何拿分數


  第三階段   他觀察到如何拿高分  可以打很久都不會死

  第四階段   他找到秘技(在這遊戲不算bug)
             把球打到磚塊背面去  輕鬆拿高分


  在這遊戲的例子中  他進化到第四階段 只花了4小時

: 如果他真的可以做到讓 AI 也是看著他的電腦銀幕 然後操作鍵盤滑鼠
: (鍵盤滑鼠可能就直接打訊號了)
: 基本上等於又完成一個很重大的里程碑了
: 代表他不只可以應付簡單的環境 連複雜的策略應對能力都有了

  然後現在要把這個學習過程搬到星海上
  超級瑪莉跟其他不少他已經破關過
  圍棋他也算某種程度破關了(?)

signm: 終於有篇正解了,電腦ai做到的事不代表alpha知道03/13 01:23
  星海AI是人寫的教AI怎麼作  Alpha一無所知 要測的就是他如何去學習的過程
signm: 這跟微操沒關係,重點是要讓電腦思考,這有點難解釋03/13 01:25
  用上面四階段套 大概就是搞懂星海這遊戲怎玩 怎麼贏 怎麼變得很厲害
arnold3: 人類光是懂得開密技就不可能輸給ai了
再不然去網站找破解黨總有辦法對付03/13 01:29
  你確定  人類找秘技的速度會比Alpha快嗎
  人類的優勢是數量多  思考的人多  以及可以透過網路傳遞知識經驗跟秘技
tetani: 要怎麼讓電腦知道目標? 萬一誤認成得低分呢?03/13 01:30
  他都可以理解圍棋怎樣叫贏了
tetani: youtube裡面AI玩小遊戲 練習到最後 那已經不像人類了03/13 01:32
a2156700: 感覺只是時間的問題...03/13 01:34
淺談Alpha Go所涉及的深度學習技術 | 尹相志Allan's blog - 點部落
[圖]
[圖]
[圖]
介紹AlphaGo的技術原理,以及背後涉及到的類神經網路以及深度學習技術。 ...

 
signm: 到目前alpha玩的還是這種規則簡單遊戲要讓它學習更複雜所以才有這新聞
之前的討論是用電腦角度去看當然覺得穩贏03/13 01:39
sadmonkey: 說實在把圍棋用圖形化理解是簡化問題,把玩遊戲用圖形化理解只是複雜化問題,只是對工程師出考題對解決人類無法解決的問題沒有甚麼幫助03/13 02:13

--
 標題  Re: [問卦] 過年要如何叫不熟的親戚閉嘴?     看板《Gossiping》 (#1KurUyPF)
「怎麼這麼久沒回來阿?」                                    「我這不是來了嗎?」
「要常常回來給我們看阿」              「我不知道你要見我阿,你這不是見到了嗎?」
「趕快生小孩阿!人家阿花都已經生了一個了!」「那他生了一個,有沒有要生第二個?」
「有錢沒錢,結婚好過年嘛!」              「你們的婚姻能維持這麼久,真不簡單!」
「ㄟ,你怎麼這樣說話?對長輩真沒禮貌!」        「我把你們當人看,要教育你們!」

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.230.18.167
※ 文章代碼(AID): #1Mv704Pg (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1457811460.A.66A.html
kimifort: 還好AlphaGo桌面沒安裝PCMan  不然就讓他學會發一堆廢文1F 03/13 03:39
owenkuo: 那一天,人類想起了AlphaGo當年開始打敗人類的起點....2F 03/13 03:40
milkBK: 先看rp讓他知道採礦能造兵,造兵能打贏,
然後慢慢去模擬,最後發現最強其實是6d3F 03/13 03:41
GalLe5566: 領悟(X) 計算(O) 他只是單純算怎麼做勝率高5F 03/13 03:42
淺談Alpha Go所涉及的深度學習技術 | 尹相志Allan's blog - 點部落
[圖]
[圖]
[圖]
介紹AlphaGo的技術原理,以及背後涉及到的類神經網路以及深度學習技術。 ...

 
wnglon: 阿發狗的原型 別再誤導大眾了7F 03/13 03:43
dans: 那阿發狗能從八卦版計算出怎樣發廢文可以得最多噓嗎
我在廢文之道上已感力不從心  希望藉由與阿發狗一戰得到靈感8F 03/13 03:43
wnglon: 你要用幾顆CPU去計算星海的最佳微操 瘋了嗎你10F 03/13 03:44
hibbb: 其實應該是要讓阿法狗和電腦正常對戰個1000場再挑戰人類
然後由人類方狂放快攻戰術看看阿發狗到底會怎麼應對11F 03/13 03:45
leon80148: 如果只跟一般AI打,最後電腦應該只會每場都放大招吧13F 03/13 03:46
hibbb: 很明顯打正規無論是資源或微操阿發狗都強太多了14F 03/13 03:46
wnglon: 阿發狗是在對戰時跟自己對奕 去找出機率較大的贏法
請問星海要怎樣算出最佳演算法?
麻煩看一下連結15F 03/13 03:46
godsparticle: 打一場星海要多久? 他可能學很慢18F 03/13 03:48
wnglon: 星海不是回合制 沒辦法及時喔 可能要計算個一分鐘
才能找到最佳解
鄉民臉腫了 哈哈19F 03/13 03:49
leon80148: 理論上是可以的 至於演算法要怎麼寫一般人怎會知道22F 03/13 03:51
wnglon: 繼續嘴砲沒關係23F 03/13 03:51
dans: 邊走邊算不就好了  若要算出最佳解才能移動  圍棋也不用玩了24F 03/13 03:52
wnglon: 起碼阿發狗概念目前絕對不能運用25F 03/13 03:52
DarkerDuck: alphago找出來的本來就不是最佳解,根本不用找最佳解26F 03/13 03:52
wnglon: 他是用2000多顆去計算的 星海要幾顆?27F 03/13 03:52
DarkerDuck: alphago的架構是為圍棋特化的弱AI28F 03/13 03:53
leon80148: 在跟李40比賽之前也一堆人覺得阿發狗會被玩封阿...29F 03/13 03:53
wnglon: 口誤 不好意思30F 03/13 03:53
dans: 邊走邊算不就好了?開局固定起手勢不就那幾個?31F 03/13 03:53
Enrollee: 我比較好奇 為什麼有人會覺得阿發狗不會玩星海? XD32F 03/13 03:53
dans: 戰略遊戲的"定石"還比圍棋少  開局多的是時間可以算33F 03/13 03:54
wnglon: 連結不就有解說了34F 03/13 03:54
Enrollee: 星海很難嗎? 坦白講 連圍棋都能贏了,星海很難嗎?35F 03/13 03:54
leon80148: 圍棋複雜度也不低  但阿髮狗證明他就是有辦法學起來36F 03/13 03:54
wnglon: 不是用學的 怎麼有人還搞不懂37F 03/13 03:54
leon80148: 更何況在微操跟計算資源這方面  電腦根本大勝好嗎38F 03/13 03:54
dans: 圍棋就是邊走邊算  只是Google沒告訴你讀秒是內建限制的
根本不是算不出答案才搞到讀秒,而是永遠在規範時間內求解39F 03/13 03:54
wnglon: 圍棋是一瞬間算大量的走法才會用到2000顆CPU
這過程起碼也要一分鐘以上 有看棋嗎41F 03/13 03:56
dans: 你確定是算答案花一分鐘,還是工程師告訴他每一步都有一分鐘拿那時間來說計算過程要多久會不會太天真了,機器不會自己決43F 03/13 03:58
henry1234562: 這個機制就是學習  實際上這alphago就會玩小遊戲45F 03/13 03:58
dans: 定計算時間,而是別人告訴他什麼時候可以用多少時間46F 03/13 03:58
wnglon: 你去看今天比賽 電腦有哪一步是即時下的47F 03/13 03:59
leon80148: 最好電腦在算的過程就完全不會動按著S讓你A假的。48F 03/13 03:59
dans: 說不定阿發狗20秒就算完答案還上網跟初音聊了40秒的天49F 03/13 03:59
henry1234562: 電腦不需要即時下 他有時間為啥要即時下50F 03/13 04:00
dans: 只因為主辦單位跟他說比賽前段要一分鐘才能落子,後段要30秒51F 03/13 04:00
henry1234562: 且實際上昨天alphago進讀秒時 他就固定30秒一子52F 03/13 04:00
wnglon: 你去GO版看 有推文已經完整解釋其演算法53F 03/13 04:00
henry1234562: 一秒都沒多用 他早就計算完你也不知道54F 03/13 04:00
leon80148: 搞不好電腦發現在幾秒鐘下的時後贏的機率最高zzz55F 03/13 04:01
willy61615 
willy61615: 你看到平行世界的阿發狗喔 阿發狗後段明明常出現30秒56F 03/13 04:01
willy61615: 之內一步的
dans: 有演算法有什麼用?會告訴我們Google給阿發狗設定幾秒落子嗎58F 03/13 04:01
grandwar: 說開作弊會贏的,你以為工程師不會預測你開作弊嗎?XD59F 03/13 04:02
wnglon: 你去看連結好嗎 別再跟我辯這個 看完再說這套理念能不能用在星海60F 03/13 04:02
Enrollee: 基本上星海這種軍備競賽遊戲 對阿發狗來說實在是簡單啦62F 03/13 04:02
Justisaac 
Justisaac: 主要是要從程式計算的最佳化進化到圖型運算吧63F 03/13 04:02
leon80148: 奇怪捏 一直提連結作啥,我看了連結還是覺得很厲害阿64F 03/13 04:03
Justisaac 
Justisaac: 而且星海的問題是模擬上需要先解析遊戲程式.....65F 03/13 04:03
Enrollee: 推文就有鄉民說了 連爆雪都辦得到 何況是阿發狗66F 03/13 04:03
Justisaac 
Justisaac: 不然無法像圍棋那樣一天下1000萬局....67F 03/13 04:03
henry1234562: 當然可以用在星海..你搞錯了一些東西
alphago 可不是每一場都從0開始重新計算68F 03/13 04:04
jinmin88: 訓練的核心應該都是同一套 只是agent要特製化...70F 03/13 04:04
henry1234562: 是訓練了很久才到現在這程度 這就是學71F 03/13 04:04
Justisaac 
Justisaac: 無論如何跟圍棋比都還是慢太多 需要更快的學習法吧72F 03/13 04:05
leon80148: 應該沒這麼複雜啦  星海自己都有內建AI了73F 03/13 04:05
henry1234562: 能夠學打磚塊 能學小蜜蜂 當然能學星海74F 03/13 04:05
wnglon: 重點阿發狗根本是自對奕來計算勝率 沒有所謂的學習75F 03/13 04:05
henry1234562: alphago 的勝率計算法包含過去對奕過的所有經驗76F 03/13 04:06
Justisaac 
Justisaac: 前面我看那些遊戲是以小時計算來學習的77F 03/13 04:06
henry1234562: 而不是只從當下這局去算分支78F 03/13 04:06
leon80148: 即時戰略就是在比控兵,計算資源,偵查及部分博奕成分79F 03/13 04:06
Justisaac 
Justisaac: 那轉換成星海不就變成要以幾萬小時來算了..80F 03/13 04:06
henry1234562: 會利用過去經驗 就是學習81F 03/13 04:06
leon80148: 沒理由圍棋作的到星海作不到82F 03/13 04:07
grandwar: 你看完那篇怎麼會有他沒有學習的誤會?XD 只是他的學習83F 03/13 04:07
Enrollee: 圍棋阿法狗需要思考沒錯 因為可以變動的變項太多84F 03/13 04:07
Justisaac 
Justisaac: 就只是學習方式跟人很像不一樣  其實都一樣85F 03/13 04:07
grandwar: 還在很初階的階段而已啊86F 03/13 04:07
henry1234562: 是電子遊戲就能加速 且也能從錄像學習87F 03/13 04:07
Justisaac 
Justisaac: 人也是try and error開始學習的~88F 03/13 04:07
leon80148: 星海一場通常不到20分鐘就打完了好嗎。這幾場圍棋都用小時來算的89F 03/13 04:07
henry1234562: 當然以現在的程度要學多久不知道91F 03/13 04:07
Enrollee: 星海只要拼速度殺暴對方就好了 人是快得過電腦的速度逆92F 03/13 04:08
Justisaac 
Justisaac: 我在想設計小組是不是在嘗試不加速要怎麼加速學習93F 03/13 04:08
Cocochia: 經驗累積其實不就是學習嗎?94F 03/13 04:08
henry1234562: 我覺得只是沒有花時間去加速遊戲而已95F 03/13 04:08
jinmin88: 星海的學習難度應該比方塊阿 馬力歐的難度多很多96F 03/13 04:09
grandwar: 電腦光用電子訊號控兵,你的速度絕對跟不上他啦97F 03/13 04:09
henry1234562: 畢竟重點是在驗證這個方式能不能有學習效果98F 03/13 04:09
Justisaac 
Justisaac: 去加速遊戲其實就又跳入舊框架啦~99F 03/13 04:09
Justisaac: 現實世界是沒辦法加速的~ai勢必要面對這個問題~
SHIU0315: @@314F 03/13 12:09
AbbeyJien: 推315F 03/13 12:10
AMAGICIAN: 李40:生而為人,我很抱歉316F 03/13 12:29
Windcws9Z: 完了 完了 要變天網了317F 03/13 12:37
gncn: 推文一堆裝懂的腦殘.....  台灣的民眾素質阿....318F 03/13 13:48

--
--
(Verola.): Re: [新聞] AlphaGo下一步在哪 傳將挑戰《星海爭霸》 - Gossiping板