看板 LoL作者 york159 (解癮了)標題 Re: [閒聊] 伊隆馬AI應該會屌打T1時間 Wed Nov 26 18:14:22 2025
問個問題,
ai要怎麼訓練指向技的「施放」?
以樓下建議整理了可能訓練方法,
單單講施放指向技,不討論躲避技能、團戰勝利或遊戲勝利。
>大量自我對戰累積資料,不需學習人類習慣
>一直選擇期望值最高的位置抽獎,長期來看,下限也是打平人類操作。
>假動作可能有效,也可能沒有。
下面討論了一些其實是更複雜的團戰或整體遊戲勝利,對照資料後+跳過中間一萬步。結論是 ai 有能力打贏遊戲,但要戰勝「職業隊伍」,還有段路要走。
https://www.youtube.com/live/6tSl5p9soLw?t=17538s
T1 打 DK,機器人抓小火龍那波。
假設ai操作機器人,在這個場景有三個選擇
1.不Q、2.Q目前位置、3.Q預測閃現位置
根據訓練內容,職業等級不可能不按閃。
但事實上小火龍就是沒有按出閃現。
所以就沒辦法完成這個play。
也就沒有後續的逆轉。
以前到現在,
也看過超多次,閃現捏到死都沒按的。
那我要怎麼訓練 ai 選擇指向技位置?
到底是要 90% 會閃現的位置,
還是賭 10% 他不會按閃。
甚至閃現也不是只有一個位置,
可能左邊、可能右邊、可能後面。
這種隨機性,
是跟圍棋或西洋棋這種有最佳解的遊戲最大的不同吧
ai 是有辦法應付的嗎?
-----
Sent from JPTT on my Asus ASUS_AI2202.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.9.203.251 (臺灣)
※ 作者: york159 2025-11-26 18:14:22
※ 文章代碼(AID): #1f9jC0x1 (LoL)
※ 文章網址: https://www.ptt.cc/bbs/LoL/M.1764152064.A.EC1.html
※ 同主題文章:
Re: [閒聊] 伊隆馬AI應該會屌打T1
11-26 18:14 york159
→ sawalee0811: AI哪用賭的 他會每次都抓最有機率的位置
AI下棋也是下勝率最高的位置 哪有什麼正確位置1F 11/26 18:17
但指向技真的有最佳解嗎?
推 SYUAN0301: 給ai算夠久他會知道哪個方向是最佳解,到底多少人覺得跟外掛一樣而已==4F 11/26 18:17
lck一年才多少比賽,能分析的樣本數沒有那麼多。
→ sawalee0811: 當然詳情一定更複雜 但理論上就是把所有伺服器高端的資料丟下去train 如果一個動作做了(比如出門買多蘭劍)會提高勝率 那AI就會這樣做7F 11/26 18:22
推 Benkkk: 指向技當然有最佳解 就是系統判斷成功率最高的方式10F 11/26 18:23
→ Benkkk: 另外,AI 下圍棋都是沒必勝下法 就是勝率最高而已13F 11/26 18:23
→ ChikanDesu: 很多Gank都是把你弄到將死 躲不掉的 只是會躲有屁用15F 11/26 18:24
推 aikotoba: 就算是不完全資訊的遊戲 給夠多樣本訓練 總會找到期望值較佳的做法 況且機器沒有感情 人類反而因為會上16F 11/26 18:24
人類還可以試探,做微調
推 cstease64: 分析你的走位 掌握你的習慣 當然有最佳解20F 11/26 18:24
→ ChikanDesu: 混沌的狀況你要訓練成功根本就還好久 先搞定FSD再說==22F 11/26 18:25
推 DonnyDon: 一定有最佳解啊 離越近反應時間越短 那原位跟預判的機率就會不一樣 貼臉被閃掉那就沒辦法了24F 11/26 18:25
→ Benkkk: 比方說 阿水EZ 都只會向前E 這個經驗就是變成 機器26F 11/26 18:25
推 hasroten: AI搞不好能分析對面的操作習慣27F 11/26 18:25
→ Benkkk: 人抓EZ 向前E的位置28F 11/26 18:25
→ ChikanDesu: 問題是 每一場給你分析的時間哪夠阿 每一場的習慣又未必一樣30F 11/26 18:26
→ laladiladi: 以前暴雪英霸ai 很強的時候 打人是真的準33F 11/26 18:27
推 gn01110728: 這有啥難的,從出手位置跟角度有幾何學跟機率統計來抓機率最高或是走位到機率最高位置阿38F 11/26 18:29
推 hasroten: 都說習慣了要改掉哪這麼簡單40F 11/26 18:29
→ asd810733: 外掛十年前都能屌閃所有技能了
現在只是人類要限制AI多少而已41F 11/26 18:32
閃招跟出招邏輯不一樣
推 gn01110728: AI最恐怖就是隨時隨地能用數學算計你,人類哪能= =43F 11/26 18:32
→ asd810733: 不然無敵是肯定的 一個閃過所有招 尾兵44F 11/26 18:32
你說的對,每次都選期望值高的,長期來看確實勝率也會較高。
→ asd810733: 技能全中 不會失誤的機器人 五個Chovy也打不贏46F 11/26 18:32
→ diefish5566: 你說選手會改習慣應對AI 啊對面是真人你就不改習慣?47F 11/26 18:33
隨機性隨機性隨機性
沒有的話他要怎麼決定下哪裡= =
噓 softflame: 要預設ai有多笨才會覺得這些是問題……51F 11/26 18:36
等你跟我說啊,我知道的話幹嘛問
推 c871111116: 怎麼今天一堆人腦都能處理的東西覺得AI不能學會?52F 11/26 18:37
→ oo2751394: 其他遊戲都有案例了 不信就是不信==53F 11/26 18:39
你相信你來解釋啊?還是你相信一個你無法解釋的東西?
怎麼做?
推 moebear: 博弈到最後都是機率 固定抓閃現位置就永遠不閃55F 11/26 18:45
不然你要從哪裡抓資料?叫riot開給你?憑什麼?
→ moebear: 最後就會變成10%抓閃現位置 90%抓原本位置57F 11/26 18:46
噓 violegrace: 你管它怎麼做幹嘛? 是你要去寫CODE的嗎?58F 11/26 18:46
我好奇新科技啊
推 qwe04687: 還可以根據選手ID去特調咧 這小意思啦60F 11/26 18:47
沒有那麼多資料給你訓練啊
→ moebear: 所有行為都會變成由機率組成的 才不會被打弱點61F 11/26 18:47
※ 編輯: york159 (101.9.203.251 臺灣), 11/26/2025 18:47:46
※ 編輯: york159 (101.9.203.251 臺灣), 11/26/2025 18:49:34
推 bxxl: 你隨便問一個AI 他會告訴你人家是怎麼處理的62F 11/26 18:49
推 naya7415963: 假如你的前提正確,那當然選90%的位置阿
長久下來勝率肯定比較高
然後人類判斷很容易有慣性,很可能會有個最多人選擇的閃現方向63F 11/26 18:51
推 bxxl: 人家是靠自我對戰啦,不用看人類比賽資料67F 11/26 18:52
→ egg87346: 怎麼可能從比賽訓練 根本不跟人訓練都行好嗎69F 11/26 18:55
我不知道圍棋可以按閃現欸
推 m06800825: Reward function設定好 RL硬train一波72F 11/26 18:59
好的,我來看一下。感謝~
噓 wheatsake: 隨機性這種外行話就別說出來給人笑了73F 11/26 18:59
樓上就會給關鍵字,顯示他們是真的懂。不像你只會說看論文,不肯承認其實你不知道答案
噓 howdo1793: AI的東西不拿去問AI是在幹嘛...76F 11/26 18:59
那你怎麼不去問ai為什麼我要發文
噓 keel90135: 完全不懂又一直槓不想好好討論 那只能給2了77F 11/26 19:01
推 a11111a4210: ai並非固定動作的 而是目標是能像人腦一樣判斷 而每次判斷不見得一樣79F 11/26 19:01
噓 wheatsake: 好歹你也去看AlphaGo 紀錄片吧~81F 11/26 19:03
→ a11111a4210: 你問ai一樣的問題 他每次回答都不一樣 但要是好的就回饋給他83F 11/26 19:05
這是ai的回應嗎?看起來ai也會出錯嘛
噓 Mubing: 齊勒斯外掛不就示範給你看了87F 11/26 19:06
齊勒斯外掛是ai喔?
噓 evmeiowrgj: 真的廢到笑,星海就已經屠殺人類給你看了==現在就只是看是一個Ai五隻還是五個Ai各自控,甚至製作機器手88F 11/26 19:06
ok感謝
→ evmeiowrgj: 臂更貼近人體反應,你只是來槓而已
一個Ai控5隻,那就只是縮小版的星海,增強式學習後92F 11/26 19:06
你怎麼留言我就怎麼回覆啊,留垃圾還要我稱讚你?
推 pjy1234: ai有辦法算到oner開場30秒掛網中路草叢看技能表嗎96F 11/26 19:08
推 m06800825: AI哪管你有沒有躲草看技能 總之敢上線就打爛你97F 11/26 19:11
推 koker: 推,一堆只會噓也不會回答98F 11/26 19:12
→ m06800825: 招全躲 指向技全中 就問你要玩個毛線99F 11/26 19:12
但這也不是他的目標啦,他只是選擇機率最大的
看上面討論,其實ai做不到招全中
推 aspwell520: AI只要學好規則 他可以在虛擬世界開啟無數個對局…100F 11/26 19:17
推 a22222a4210: 換個角度來說 飛可玩遊戲的所有指令向滑鼠哪時點了並用鍵盤按了甚麼鍵的給AI訓練 然後AI想辦法組合出101F 11/26 19:19
推 mnxzq: AI會牢記CD 不會學許秀把E看成鉤子騙隊友送頭103F 11/26 19:20
這像複雜版的猜拳?
推 yan960521: 我是T1我就全選指定技跟平A角 潘森 菲艾 汎 蓋倫賈克斯 我看你AI怎麼扭105F 11/26 19:21
→ a22222a4210: 後 AI比賽就是照這模式依飛可行為回饋下指令而已107F 11/26 19:21
→ qt359101: 你選這陣容有怎樣嗎 AI會配個康爆你的陣容阿108F 11/26 19:22
我相信ai一定可以做很好的bp,至少他們就不會忘記ban魔鬥
噓 leafgg: 你去GOOGLE OpenAI Five 他根本不需要你給資料109F 11/26 19:22
ok感謝
ok感謝
→ leafgg: 自己對戰一天就可以訓練相當於人類練習180年的量111F 11/26 19:23
推 leafgg: 練得夠多 AI的判斷能力比人類強大太多了113F 11/26 19:25
推 RIVERWIND: 阿法狗zero告訴你 給他圍棋棋譜還不如讓他自己練 人類的思考只是誤導他的學習114F 11/26 19:27
→ leafgg: 隨機性不會是罩門的 德州撲克AI都能擊敗人類了116F 11/26 19:27
我能理解期望值,卡住的是他能處理到多複雜、多少環境(剛剛看RL看到的)變數。
噓 qwe8982: AI就是去計算隨機性啊117F 11/26 19:37
推 a22222a4210: 能多複雜 那是算力的問題 算力夠就不是問題
而不是做不做得到的問題118F 11/26 19:38
推 zagioo59598: 光打野就是個問題 魔力控制也是問題 他們能判別這隻兵或野怪該用技能還是普攻嗎? 如果他在對線用關鍵120F 11/26 20:04
他們可以做到延遲獎賞,也就是判斷最合適的技能使用時機。
推 horse2819: 搞不好直接分析這個選手走位習慣 直接抓最有機會的位置123F 11/26 20:08
推 qwe8982: 所以才有機器學習這種東西
你餵給他一隻英雄 自己跑幾十萬場 就知道怎麼玩了125F 11/26 20:09
推 max366629: 這種應該是會有習慣的吧 可以大數據分析?127F 11/26 20:16
推 zagioo59598: 版本也是問題 選手要適應版本變動 ai剛改版去哪學習128F 11/26 20:16
推 a524528: 我猜會選擇閃現
如果他看到機器人時候判斷無法閃避的話130F 11/26 20:25
噓 Ycowmo: 不要侮辱文組134F 11/26 21:30
今天一定過得很不順吧?沒事,留這種情緒用詞可以讓你開心,那也是功德一件
推 traitor0621: 這個嘛 就算要用lck的局去訓練也頂多是一開始
圍棋的ai自己跟自己練就好
後來發現人類的數據就是來污染數據庫的135F 11/26 21:32
你說的對,他們自己練更有效率
噓 makyan: AI圍棋難道全是抓人類的棋譜來分析嗎?
最後都AI跟AI自己模擬了,誰還需要猴子的棋譜138F 11/26 21:35
前面其他人就講過了,你又何必講一樣的話,還一副很了不起的樣子。
推 overpolo: 天真 看選手點最後一下的瞬間勾就好了140F 11/26 22:03
※ 編輯: york159 (101.9.203.251 臺灣), 11/26/2025 22:37:28
→ NankanAvenge: 有走位腳本跟指向技腳本那麼粗暴的方法幹嘛管這些閃現預判就當送他 江湖規矩交閃不殺141F 11/26 22:39
推 patricktu: 指向技不就跟走位一樣 每個方向甚至每一格pixel(例如閃現)都做為選項之一就可以train了
競技AI現在拿現實資料在train的大概都三流AI143F 11/26 22:41
推 Frozn: 你如果要跟上現在的知識的話可以看一下llm
你說的指向技的施放我覺得反而是比較末端的問題了146F 11/26 23:11
推 bill603: 他會知道 這個時間被抓到會輸 他就不會被抓148F 11/26 23:23
推 sunboyboy1: 其實真的滿有意思的 AI一定能算出獲勝機率最高的位置 只是人類能不能解讀理由又是另一回事149F 11/27 00:11
噓 ke1vin: OpenAI早打贏過DOTA2了, 這也不算是新領域了
問題是通用模型想打贏, 沒什麼道理可能隨便說說而已151F 11/27 03:35
推 AAA891216: 有逼到閃就賺了 如果ai有搞懂遊戲 後面打法也會不一樣 所以這90 10沒很重要 而且八成對線轉線就贏了153F 11/27 05:12
→ jjjj222: 訓練一定是reinforcement learning...
有興趣自己去唸書..156F 11/27 06:44
→ wugi: AI跟人然後 AIAI 訓練一下子就會了158F 11/27 07:04
噓 ko330: 圍棋也不是最佳解 是下勝率最高的位置= =160F 11/27 13:59
--