看板 GO作者 ykes60513 (いちご)標題 [問題] 為什麼現在AlphaGO開始會"讓"呢?時間 Tue May 23 16:08:21 2017
其實不是讓 它還是追求勝率
只是如果有勝率90%賺2目 80%賺5目兩種選擇
它會選前者 以人類的角度看起來就像在讓
可是
應該也有勝率90%賺5目 80%賺2目這種可能不是嗎??
而且應該比前面那種出現的機率要大得多吧?
搞不好10步裡有7步是屬於後者 可能還更多
我覺得目數跟勝率之間還是有相關性的
感覺去年的AlphaGO 這樣的傾向還沒有那麼明顯
之後的Master很明顯就有這種情況
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.25.100
※ 文章代碼(AID): #1P8-u4vF (GO)
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1495526916.A.E4F.html
→ HeterCompute: 去年alphago明明就也很多讓很多空...,另外AlphaGo2F 05/23 16:10
→ pkmu8426: 因為他平常訓練的對象 讓他的習慣需要步步為營3F 05/23 16:11
→ HeterCompute: 目數概念跟人類相比很薄弱,他每一步看起來是勝率一個數字,這個數字是由過往下的棋譜決定的。4F 05/23 16:11
推 ulycess: 因為他的對手是ALPHAGO,一個不小心會翻盤的阿6F 05/23 16:13
我沒說去年的AlphaGO沒有讓 但從Master開始就很明顯
當時就有人開玩笑說 當Master開始下緩手 就表示可以抬下去了XDD
※ 編輯: ykes60513 (140.112.25.100), 05/23/2017 16:14:33
推 jrshiun: 記者會說,只有一個條件.就是贏,每一步都是追求最高勝率..8F 05/23 16:16
推 hdjj: 追求的是勝利,而不是目數10F 05/23 16:17
→ ykes60513: 是 追求的是勝率 我一開始就這樣講了12F 05/23 16:18
→ adampolo: 前者機率比較大,步步為營比步步進逼勝率高13F 05/23 16:18
前者的機率比較大嗎?! 好像也有道理 可是有點違反直覺XD
推 ulycess: 去年一、二、五盤都讓得明顯,可能是前兩盤大贏讓你感覺沒讓很誇張14F 05/23 16:19
推 jacky7987: 如果當初寫的回饋函數是追求最大目數,那他就會有不同的樣貌16F 05/23 16:20
※ 編輯: ykes60513 (140.112.25.100), 05/23/2017 16:22:57
推 notmuchmoney: 人機配對賽也許可看出些端倪 到底人直覺跟alphaGO對目數19F 05/23 16:23
→ HeterCompute: 2種是不會損目的,這種情況下你會有很大的機率選到那n-2種,所以看起來一直在損,但在alphago來看下哪都行23F 05/23 16:24
推 bxxl: 可能到最後勝率都一樣穩贏了吧,就隨機挑一種26F 05/23 16:31
推 king12272: 因為你還停留在 下一步贏幾目 他想的是大局雖然這裡虧但是整體勝率可以提高27F 05/23 16:40
推 ckWade: 下小損失的位置,但人類會跟著下消耗掉手數,讓整體結果收斂,因此可以提高勝率29F 05/23 16:46
推 halfjustice: 因為已經有一位the 不讓 只好開始讓 >\\\\\\\<31F 05/23 16:47
推 oops66: the 不讓 XD32F 05/23 17:19
推 thomaspig: 好幾點都穩贏 所以隨意挑一點下
Master收官時常下一些明顯虧損的棋34F 05/23 17:41
推 changmada: 可以99%贏的落點選擇太多了 只好隨便挑一個點36F 05/23 17:47
推 duvw: 一日圍棋大師、ai大師很多。39F 05/23 18:26
推 cool34: 怎麼這邊也出現姆斯的梗42F 05/23 19:23
--