顯示廣告
隱藏 ✕
※ 本文轉寄自 ptt.cc 更新時間: 2025-11-27 14:27:06
看板 LoL
作者 york159 (解癮了)
標題 Re: [閒聊] 伊隆馬AI應該會屌打T1
時間 Wed Nov 26 18:14:22 2025



問個問題,
ai要怎麼訓練指向技的「施放」?

以樓下建議整理了可能訓練方法,
單單講施放指向技,不討論躲避技能、團戰勝利或遊戲勝利。
>大量自我對戰累積資料,不需學習人類習慣
>一直選擇期望值最高的位置抽獎,長期來看,下限也是打平人類操作。
>假動作可能有效,也可能沒有。

下面討論了一些其實是更複雜的團戰或整體遊戲勝利,對照資料後+跳過中間一萬步。結論是 ai 有能力打贏遊戲,但要戰勝「職業隊伍」,還有段路要走。


https://www.youtube.com/live/6tSl5p9soLw?t=17538s
T1 打 DK,機器人抓小火龍那波。
假設ai操作機器人,在這個場景有三個選擇
1.不Q、2.Q目前位置、3.Q預測閃現位置

根據訓練內容,職業等級不可能不按閃。
但事實上小火龍就是沒有按出閃現。
所以就沒辦法完成這個play。
也就沒有後續的逆轉。

以前到現在,
也看過超多次,閃現捏到死都沒按的。
那我要怎麼訓練 ai 選擇指向技位置?
到底是要 90% 會閃現的位置,
還是賭 10% 他不會按閃。

甚至閃現也不是只有一個位置,
可能左邊、可能右邊、可能後面。
這種隨機性,
是跟圍棋或西洋棋這種有最佳解的遊戲最大的不同吧
ai 是有辦法應付的嗎?



-----
Sent from JPTT on my Asus ASUS_AI2202.

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.9.203.251 (臺灣)
※ 作者: york159 2025-11-26 18:14:22
※ 文章代碼(AID): #1f9jC0x1 (LoL)
※ 文章網址: https://www.ptt.cc/bbs/LoL/M.1764152064.A.EC1.html
sawalee0811 : AI哪用賭的 他會每次都抓最有機率的位置1F 11/26 18:17
sawalee0811 : AI下棋也是下勝率最高的位置 哪有什麼正確位置
roger2623900: 用過往訓練的資料計算最佳解吧3F 11/26 18:17
但指向技真的有最佳解嗎?
SYUAN0301   : 給ai算夠久他會知道哪個方向是最佳解,到底多少人4F 11/26 18:17
SYUAN0301   : 覺得跟外掛一樣而已==
roger2623900: 他有幾十萬筆甚至更多資料能判斷哪個勝率高6F 11/26 18:18
lck一年才多少比賽,能分析的樣本數沒有那麼多。
sawalee0811 : 當然詳情一定更複雜 但理論上就是把所有伺服器高端7F 11/26 18:22
sawalee0811 : 的資料丟下去train 如果一個動作做了(比如出門買
sawalee0811 : 多蘭劍)會提高勝率 那AI就會這樣做
Benkkk      : 指向技當然有最佳解 就是系統判斷成功率最高的方式10F 11/26 18:23
SYUAN0301   : 你人類能判斷Ai就能判斷==11F 11/26 18:23
ChikanDesu  : 下棋的變化哪有即時戰鬥多==12F 11/26 18:23
Benkkk      : 另外,AI 下圍棋都是沒必勝下法 就是勝率最高而已13F 11/26 18:23
sony0223098 : 你都能預判 ai當然也行阿14F 11/26 18:24
ChikanDesu  : 很多Gank都是把你弄到將死 躲不掉的 只是會躲有屁用15F 11/26 18:24
aikotoba    : 就算是不完全資訊的遊戲 給夠多樣本訓練 總會找到期16F 11/26 18:24
aikotoba    : 望值較佳的做法 況且機器沒有感情 人類反而因為會上
ChikanDesu  : 人類是可以邊預判邊取消預判的18F 11/26 18:24
人類還可以試探,做微調
aikotoba    : 頭而產生失望19F 11/26 18:24
cstease64   : 分析你的走位 掌握你的習慣 當然有最佳解20F 11/26 18:24
aikotoba    : 誤*21F 11/26 18:24
ChikanDesu  : 混沌的狀況你要訓練成功根本就還好久 先搞定FSD再說22F 11/26 18:25
ChikanDesu  : ==
DonnyDon    : 一定有最佳解啊 離越近反應時間越短 那原位跟預判的24F 11/26 18:25
DonnyDon    : 機率就會不一樣 貼臉被閃掉那就沒辦法了
Benkkk      : 比方說 阿水EZ 都只會向前E 這個經驗就是變成 機器26F 11/26 18:25
hasroten    : AI搞不好能分析對面的操作習慣27F 11/26 18:25
Benkkk      : 人抓EZ 向前E的位置28F 11/26 18:25
bghtherock  : 類似數據LOL吧 某選手習慣80%往左閃29F 11/26 18:26
ChikanDesu  : 問題是 每一場給你分析的時間哪夠阿 每一場的習慣又30F 11/26 18:26
ChikanDesu  : 未必一樣
bghtherock  : 或是判斷目的是要逼閃 或是 直接抓到人32F 11/26 18:26
laladiladi  : 以前暴雪英霸ai 很強的時候 打人是真的準33F 11/26 18:27
ChikanDesu  : 又或者 看到你AI抓我習慣 我馬上改掉34F 11/26 18:27
jackylin1999: AI甚至能一直計算極限距離 勾子應該很可怕35F 11/26 18:27
sony0223098 : 給ai操作上限高的角色就不公平啦36F 11/26 18:28
A00610lol   : 問就是AI進步很快37F 11/26 18:28
gn01110728  : 這有啥難的,從出手位置跟角度有幾何學跟機率統計38F 11/26 18:29
gn01110728  : 來抓機率最高或是走位到機率最高位置阿
hasroten    : 都說習慣了要改掉哪這麼簡單40F 11/26 18:29
asd810733   : 外掛十年前都能屌閃所有技能了41F 11/26 18:32
asd810733   : 現在只是人類要限制AI多少而已
閃招跟出招邏輯不一樣
gn01110728  : AI最恐怖就是隨時隨地能用數學算計你,人類哪能= =43F 11/26 18:32
asd810733   : 不然無敵是肯定的 一個閃過所有招 尾兵44F 11/26 18:32
diefish5566 : 出手最高機率的點啊 絕對比你人類判斷的機率高45F 11/26 18:32
你說的對,每次都選期望值高的,長期來看確實勝率也會較高。
asd810733   : 技能全中 不會失誤的機器人 五個Chovy也打不贏46F 11/26 18:32
diefish5566 : 你說選手會改習慣應對AI 啊對面是真人你就不改習慣?47F 11/26 18:33
NCCUexpert  : 你怎麼覺得不行?48F 11/26 18:33
隨機性隨機性隨機性
softflame   : 圍棋有最佳解?49F 11/26 18:34
沒有的話他要怎麼決定下哪裡= =
secret0409  : 它每次Q cd好就選2,你能用幾次閃現50F 11/26 18:35
softflame   : 要預設ai有多笨才會覺得這些是問題……51F 11/26 18:36
等你跟我說啊,我知道的話幹嘛問
c871111116  : 怎麼今天一堆人腦都能處理的東西覺得AI不能學會?52F 11/26 18:37
oo2751394   : 其他遊戲都有案例了 不信就是不信==53F 11/26 18:39
你相信你來解釋啊?還是你相信一個你無法解釋的東西?
c871111116  : 笑死 AI也是會試探微調啊54F 11/26 18:42
怎麼做?
moebear     : 博弈到最後都是機率 固定抓閃現位置就永遠不閃55F 11/26 18:45
clarkyoona  : 有說只從過往比賽訓練?56F 11/26 18:46
不然你要從哪裡抓資料?叫riot開給你?憑什麼?
moebear     : 最後就會變成10%抓閃現位置 90%抓原本位置57F 11/26 18:46
violegrace  : 你管它怎麼做幹嘛? 是你要去寫CODE的嗎?58F 11/26 18:46
我好奇新科技啊
c871111116  : 什麼都不懂還能發一篇大談 厲害了59F 11/26 18:46
qwe04687    : 還可以根據選手ID去特調咧 這小意思啦60F 11/26 18:47
沒有那麼多資料給你訓練啊
moebear     : 所有行為都會變成由機率組成的 才不會被打弱點61F 11/26 18:47
※ 編輯: york159 (101.9.203.251 臺灣), 11/26/2025 18:47:46
※ 編輯: york159 (101.9.203.251 臺灣), 11/26/2025 18:49:34
bxxl        : 你隨便問一個AI 他會告訴你人家是怎麼處理的62F 11/26 18:49
naya7415963 : 假如你的前提正確,那當然選90%的位置阿63F 11/26 18:51
naya7415963 : 長久下來勝率肯定比較高
naya7415963 : 然後人類判斷很容易有慣性,很可能會有個最多人選
naya7415963 : 擇的閃現方向
bxxl        : 人家是靠自我對戰啦,不用看人類比賽資料67F 11/26 18:52
hsiehhsing  : 翻譯白話給你聽  AI只懂數據 只懂0168F 11/26 18:52
egg87346    : 怎麼可能從比賽訓練 根本不跟人訓練都行好嗎69F 11/26 18:55
wheatsake   : 嗯,當年圍棋圈也是像你一樣70F 11/26 18:56
我不知道圍棋可以按閃現欸
LPCbaimlly  : 先去讀什麼叫RL71F 11/26 18:58
m06800825   : Reward function設定好 RL硬train一波72F 11/26 18:59
好的,我來看一下。感謝~
wheatsake   : 隨機性這種外行話就別說出來給人笑了73F 11/26 18:59
m06800825   : 就隨便虐了 真的74F 11/26 18:59
evmeiowrgj  : 你先去看看兩篇論文再來討論==75F 11/26 18:59
樓上就會給關鍵字,顯示他們是真的懂。不像你只會說看論文,不肯承認其實你不知道答案
howdo1793   : AI的東西不拿去問AI是在幹嘛...76F 11/26 18:59
那你怎麼不去問ai為什麼我要發文
keel90135   : 完全不懂又一直槓不想好好討論 那只能給2了77F 11/26 19:01
partingglass: 廢到笑78F 11/26 19:01
a11111a4210 : ai並非固定動作的 而是目標是能像人腦一樣判斷 而79F 11/26 19:01
a11111a4210 : 每次判斷不見得一樣
wheatsake   : 好歹你也去看AlphaGo 紀錄片吧~81F 11/26 19:03
jjchicken   : 只有O神能讓AI猜不到82F 11/26 19:03
a11111a4210 : 你問ai一樣的問題 他每次回答都不一樣 但要是好的83F 11/26 19:05
a11111a4210 : 就回饋給他
forgr202    : 《登入次數》879 次85F 11/26 19:05
howdo1793   : 有人拿槍逼你發文了?86F 11/26 19:06
這是ai的回應嗎?看起來ai也會出錯嘛
Mubing      : 齊勒斯外掛不就示範給你看了87F 11/26 19:06
齊勒斯外掛是ai喔?
evmeiowrgj  : 真的廢到笑,星海就已經屠殺人類給你看了==現在就只88F 11/26 19:06
evmeiowrgj  : 是看是一個Ai五隻還是五個Ai各自控,甚至製作機器手
m06800825   : 給個關鍵字:李宏毅 增強式學習90F 11/26 19:06
ok感謝
a11111a4210 : 就跟人類學東西一樣91F 11/26 19:06
evmeiowrgj  : 臂更貼近人體反應,你只是來槓而已92F 11/26 19:06
evmeiowrgj  : 一個Ai控5隻,那就只是縮小版的星海,增強式學習後
qt359101    : 遇到槓精轉世了==94F 11/26 19:08
你怎麼留言我就怎麼回覆啊,留垃圾還要我稱讚你?
evmeiowrgj  : ,人類沒有任何機會95F 11/26 19:08
pjy1234     : ai有辦法算到oner開場30秒掛網中路草叢看技能表嗎96F 11/26 19:08
m06800825   : AI哪管你有沒有躲草看技能 總之敢上線就打爛你97F 11/26 19:11
koker       : 推,一堆只會噓也不會回答98F 11/26 19:12
m06800825   : 招全躲 指向技全中 就問你要玩個毛線99F 11/26 19:12
但這也不是他的目標啦,他只是選擇機率最大的
看上面討論,其實ai做不到招全中
aspwell520  : AI只要學好規則 他可以在虛擬世界開啟無數個對局…100F 11/26 19:17
a22222a4210 : 換個角度來說 飛可玩遊戲的所有指令向滑鼠哪時點了101F 11/26 19:19
a22222a4210 : 並用鍵盤按了甚麼鍵的給AI訓練 然後AI想辦法組合出
mnxzq       : AI會牢記CD 不會學許秀把E看成鉤子騙隊友送頭103F 11/26 19:20
a22222a4210 : 能夠贏的指令組合 然後把所以能贏的指令組合優化104F 11/26 19:20
這像複雜版的猜拳?
yan960521   : 我是T1我就全選指定技跟平A角 潘森 菲艾  汎 蓋倫105F 11/26 19:21
yan960521   : 賈克斯 我看你AI怎麼扭
a22222a4210 : 後 AI比賽就是照這模式依飛可行為回饋下指令而已107F 11/26 19:21
qt359101    : 你選這陣容有怎樣嗎 AI會配個康爆你的陣容阿108F 11/26 19:22
我相信ai一定可以做很好的bp,至少他們就不會忘記ban魔鬥
leafgg      : 你去GOOGLE OpenAI Five 他根本不需要你給資料109F 11/26 19:22
ok感謝
ken32293355 : 賽局理論有nash equilibrium110F 11/26 19:23
ok感謝
leafgg      : 自己對戰一天就可以訓練相當於人類練習180年的量111F 11/26 19:23
a22222a4210 : 選指定技 就跟你玩換血精算 你算不贏的啦112F 11/26 19:23
leafgg      : 練得夠多 AI的判斷能力比人類強大太多了113F 11/26 19:25
RIVERWIND   : 阿法狗zero告訴你 給他圍棋棋譜還不如讓他自己練 人114F 11/26 19:27
RIVERWIND   : 類的思考只是誤導他的學習
leafgg      : 隨機性不會是罩門的 德州撲克AI都能擊敗人類了116F 11/26 19:27
我能理解期望值,卡住的是他能處理到多複雜、多少環境(剛剛看RL看到的)變數。
qwe8982     : AI就是去計算隨機性啊117F 11/26 19:37
a22222a4210 : 能多複雜 那是算力的問題 算力夠就不是問題118F 11/26 19:38
a22222a4210 : 而不是做不做得到的問題
zagioo59598 : 光打野就是個問題 魔力控制也是問題 他們能判別這隻120F 11/26 20:04
zagioo59598 : 兵或野怪該用技能還是普攻嗎? 如果他在對線用關鍵
他們可以做到延遲獎賞,也就是判斷最合適的技能使用時機。
zagioo59598 : 技能吃冰 就會被暴打122F 11/26 20:04
horse2819   : 搞不好直接分析這個選手走位習慣 直接抓最有機會的123F 11/26 20:08
horse2819   : 位置
qwe8982     : 所以才有機器學習這種東西125F 11/26 20:09
qwe8982     : 你餵給他一隻英雄 自己跑幾十萬場  就知道怎麼玩了
max366629   : 這種應該是會有習慣的吧 可以大數據分析?127F 11/26 20:16
zagioo59598 : 版本也是問題 選手要適應版本變動 ai剛改版去哪學習128F 11/26 20:16
airiguodala : 職業比賽資料練完就無限AI對練啊==129F 11/26 20:17
a524528     : 我猜會選擇閃現130F 11/26 20:25
a524528     : 如果他看到機器人時候判斷無法閃避的話
un94su3     : 文組132F 11/26 20:40
wang111283  : 最佳解就是把閃、位移技打掉啊133F 11/26 21:09
Ycowmo      : 不要侮辱文組134F 11/26 21:30
今天一定過得很不順吧?沒事,留這種情緒用詞可以讓你開心,那也是功德一件
traitor0621 : 這個嘛 就算要用lck的局去訓練也頂多是一開始135F 11/26 21:32
traitor0621 : 圍棋的ai自己跟自己練就好
traitor0621 : 後來發現人類的數據就是來污染數據庫的
你說的對,他們自己練更有效率
makyan      : AI圍棋難道全是抓人類的棋譜來分析嗎?138F 11/26 21:35
makyan      : 最後都AI跟AI自己模擬了,誰還需要猴子的棋譜
前面其他人就講過了,你又何必講一樣的話,還一副很了不起的樣子。
overpolo    : 天真 看選手點最後一下的瞬間勾就好了140F 11/26 22:03
※ 編輯: york159 (101.9.203.251 臺灣), 11/26/2025 22:37:28
NankanAvenge: 有走位腳本跟指向技腳本那麼粗暴的方法幹嘛管這些141F 11/26 22:39
NankanAvenge: 閃現預判就當送他 江湖規矩交閃不殺
patricktu   : 指向技不就跟走位一樣 每個方向甚至每一格pixel(例143F 11/26 22:41
patricktu   : 如閃現)都做為選項之一就可以train了
patricktu   : 競技AI現在拿現實資料在train的大概都三流AI
Frozn       : 你如果要跟上現在的知識的話可以看一下llm146F 11/26 23:11
Frozn       : 你說的指向技的施放我覺得反而是比較末端的問題了
bill603     : 他會知道 這個時間被抓到會輸 他就不會被抓148F 11/26 23:23
sunboyboy1  : 其實真的滿有意思的 AI一定能算出獲勝機率最高的位149F 11/27 00:11
sunboyboy1  : 置 只是人類能不能解讀理由又是另一回事
ke1vin      : OpenAI早打贏過DOTA2了, 這也不算是新領域了151F 11/27 03:35
ke1vin      : 問題是通用模型想打贏, 沒什麼道理可能隨便說說而已
AAA891216   : 有逼到閃就賺了 如果ai有搞懂遊戲 後面打法也會不153F 11/27 05:12
AAA891216   : 一樣 所以這90 10沒很重要 而且八成對線轉線就贏了
l1234568790 : 去韓服抓幾百場高端的對戰跟比賽讓AI學就好155F 11/27 06:31
jjjj222     : 訓練一定是reinforcement learning...156F 11/27 06:44
jjjj222     : 有興趣自己去唸書..
wugi        : AI跟人然後 AIAI 訓練一下子就會了158F 11/27 07:04
stevenbelem : 跟圍棋一樣,人類會被打爛159F 11/27 12:40
ko330       : 圍棋也不是最佳解 是下勝率最高的位置= =160F 11/27 13:59

--
※ 看板: LoL 文章推薦值: 0 目前人氣: 0 累積人氣: 12 
分享網址: 複製 已複製
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇