作者 sxy67230 (charlesgg)
標題 Re: [新聞] 搶太妍門票僅須4秒!警破獲首宗AI搶票黃牛 逮30歲台大畢
時間 Fri Sep  8 07:46:38 2023


阿肥外商碼農阿肥啦!

其實就是使用langchain加上類GPT 3.5-4(當前很多開源的,一張4090就可以運行起來),
透過模型輔助加上langchain可以直接接上Google等搜索引擎或特定網站解鎖語言模型讀
取最新資訊的能力,這樣就可以規避掉官方要識別人類(粉絲?)的特殊問題。


然後圖片驗證識別這個目前就被玩爛開源Acc都可以到99%以上了,基本上你想用CNN或swi
n transformer來做效果都非常好。

至於自動爬蟲程式,阿肥最近也再跟公司的爬蟲同事一起研究有打算搜集一些人類點擊速
度跟滑動速度的資訊讓模型學習一些策略做反防爬蟲,這個我印象中也是有幾篇論文在研
究只是不多,主要是搜集人類瀏覽軌跡的資料比較困難,而且要搜集這東西要做也只能暗
著做。


差不多4醬

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.90.41 (臺灣)
※ 作者: sxy67230 2023-09-08 07:46:38
※ 文章代碼(AID): #1a-c3WT9 (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1694130400.A.749.html
※ 同主題文章:
Re: [新聞] 搶太妍門票僅須4秒!警破獲首宗AI搶票黃牛 逮30歲台大畢
09-08 07:46 sxy67230
SRNOB: 可是他五年前就開始了耶1F 122.121.69.131 台灣 09/08 07:49
五年前圖片驗證技術就很成熟了,中間也可能優化他的爬蟲程式啊
snider: 問題是賣黃牛有罪....2F 114.26.65.36 台灣 09/08 07:49
※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 07:51:36
Eunha9903: 那如果用程式自己搶會有罪嗎3F 49.216.164.143 台灣 09/08 07:50
SRNOB: 不是你搞這個能賺嗎 拿去弄量化模型不是比較好?
量化交易4F 122.121.69.131 台灣 09/08 07:51
搶票這個我不知道,不過反防爬蟲公司一直有這個需求啊,反反防爬蟲也是一個剛需。
※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 07:55:11
xm3u4vmp6: 反爬蟲又能兼顧使用者體驗搞 爆賺吧7F 61.224.20.144 台灣 09/08 07:56
SRNOB: 這個窪地網站最擅長了 各種奇葩反爬蟲8F 122.121.69.131 台灣 09/08 07:58
xm3u4vmp6: 不過我猜都會搞到使用者不爽9F 61.224.20.144 台灣 09/08 07:59
SRNOB: 以前google打一大串文字最不爽 現在好多了10F 122.121.69.131 台灣 09/08 08:00
zombiechen: Selenium 就行了。為什麼要用到AI?11F 67.180.127.11 美國 09/08 08:02
主要是Selenium的點擊模式很好識別啊,就算是你設定一個亂數隨機也很好抓,抓到就直
接band掉ip,又不是每個人都有幾萬組IP可以使用的。
※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 08:08:11
reihane: 好奇圖形驗證碼需求單純用CNN現成package能不能做到 還是需要自己蒐集圖形資料貼標籤train12F 49.216.191.51 台灣 09/08 08:07
cka: 自己搶沒問題 加價賣有罪15F 36.230.111.120 台灣 09/08 08:13

--
作者 sxy67230 的最新發文:
點此顯示更多發文記錄