看板 Gossiping作者 hancel (hancel)標題 [爆卦] i'Analyseur 的重大問題時間 Sat Oct 20 06:41:37 2018
現在有很多鄉民/黨工喜歡用i'Analyseur,
來分析/抓出 五毛/黨工....
i'Analyzeur的設計策略基本上是對的,
就是利用ip/登入時間/文章列表來抓出不尋常/異常的行為.
但是裡面的ip紀錄的擷取方法,很明顯是有bug的,
或者是說,有不盡完善的地方.
因為這個bug,大家所看到的ip交叉分析是有對有錯.
可是有對有錯,代表如果大家直接用這個結果來分析,
很容易推導出錯誤的結論.
首先,先拿八卦版版主的ip紀錄來看好了
https://www.ianalyseur.org/user/RandyMarsh/
https://www.ianalyseur.org/user/IbakaBlock/
https://www.ianalyseur.org/user/jacklyl/
https://www.ianalyseur.org/user/girl55665566/
https://www.ianalyseur.org/user/PPTplayer/
https://www.ianalyseur.org/user/RS5566/
靠,這幾個人是分身大王啊?
IP遍佈各地,甚至到國外去了.
如果你有這個結論,那你就已經被i'Analyseur的bug給愚弄了.
i'Analyseur的ip紀錄,應該有根據發表文章上的ip/時間,
做為上線ip以及時間的紀錄之一.
但是這個parsing(懶得解釋了)一定是有bug的.
會把一篇文當中引用其他人的文的ip/時間也算進發表人.
"請問要引用原文嗎(Y/N/All/Repost)?[Y] r"
裡面一般的Y引用可能是沒問題的(因為只留文章,且加":"),
但是Repost引用(沒有前置":")會導致,
被引用跟引用者兩人身分的混淆.
這就導致喜歡引用它人發文/發文常常被引用的人,
有機會會混在一起分不出來.
本篇文章中的諸位分身大王,
就是因為常常要開水桶藥單,
必須引用許多文章最為裁決證明,
導致錯誤結果.
結論:
在i'Analyseur的ip紀錄的parsing bug解決,
並將整個資料庫重新更新之前,
最好不要"直接"用它做重大指控,
參考可以,但是下結論之前,
自己最好多動手觀察/紀錄,
確認之後在說吧.
畢竟搞出烏龍被告被酸的時候,
i'Analyseur它也不會幫你扛的.
另外,bug未修之前,有心人想要故意搞亂這個資料庫也是沒問題的.
例如,把我下面那三行前面":"去除,
放到你的文章當中,
你可能就會多了三個有來頭登錄ip了.
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.130.192.150
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.8.116
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 73.92.207.178--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.6.102.107
※ 文章代碼(AID): #1RobscDT (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1539988902.A.35D.html
※ 同主題文章:
[爆卦] i'Analyseur 的重大問題
10-20 06:41 hancel.
推 koreawargod: 沒差啦..說你網軍就網軍啊...都說了查我自己id..還出來一堆不認識的笑死2F 223.140.48.208 台灣 10/20 06:42
→ firemothra: 浮動ip阿4F 36.239.18.149 台灣 10/20 06:43
推 rrr518: 數據給你你要自己判讀啊 2樓就是看不懂的人XD5F 101.13.6.241 台灣 10/20 06:44
→ meredith001: 創世神認證的阿 黨工很怕吼7F 1.163.119.45 台灣 10/20 06:45
推 s033507799: 不認識很正常好嗎,你會知道誰跟你用同ip喔8F 180.204.10.57 台灣 10/20 06:46
推 JCS15: 放心 寫這系統的防火牆都堵好了 人家拿來亂搞與他無關10F 36.228.142.210 台灣 10/20 06:46
推 OK8066889: 很怕喔 禮拜六早上特地發一篇12F 36.236.105.97 台灣 10/20 06:47
→ Pujols5: 沒差吧 我看不管是說廠工還是說柯粉
都沒有人在附證明的啊13F 72.201.192.249 美國 10/20 06:47
推 newwu: 還好啦 也只有板主有這狀況15F 128.146.189.92 美國 10/20 06:48
喜歡無":"引用別人發文,
跟常常被人無":"引用發文的人,
通通都會中鏢的.
這還不包括故意要搞破壞的人.
推 howard0730: 查出用過相同IP->點IP->看時間分析16F 114.37.162.204 台灣 10/20 06:49
總之,就是很有參考價值,
不過最好還是得親自好好檢查,
多觀察一下再下結論.
→ howard0730: 時間差很遠當然不懷疑, 時間很相近
小於1天, 那就很有可能是分身囉17F 114.37.162.204 台灣 10/20 06:50
→ rrr518: 所以說你不會看數據啊19F 101.13.6.241 台灣 10/20 06:51
推 newwu: 誰會有那種奇怪的習慣啦...20F 128.146.189.92 美國 10/20 06:52
→ koster: 你拿到統計數據就直接用嗎? 不修正連丁丁的民調都會破五成21F 64.85.235.108 美國 10/20 06:59
噓 ppnow: 那你做一個更好的啊,做不出來就閉嘴24F 36.237.141.216 台灣 10/20 07:02
你玻璃心啊? 我不是說很有參考價值,
但是要做重大決定之前,
請自己小心一點,多做複查動作.
其實這個Bug不好解決的,如果你有一點CS背景的話就知道.
推 cerberi: 原來如此25F 42.71.141.211 台灣 10/20 07:08
推 zanns: 慘惹 現在領500還要學數據分析 我姆咪QQ26F 122.254.41.209 台灣 10/20 07:13
拜託,整個團隊中有一個人可以就好了,
其他人找出問題,然後由那一個比較懂得的人,
去做最後的查驗就好啊....
推 fakon: CS 不好解決,那你一定是選錯地圖了!27F 123.194.133.150 台灣 10/20 07:20
推 Richun: 這個bug要修的話 文章網址前一行跟之後的28F 123.193.39.67 台灣 10/20 07:20
推 GGononder: 三小心態啊 臭嘴29F 223.137.139.17 台灣 10/20 07:20
→ Richun: 才算是作者IP應該能解決吧30F 123.193.39.67 台灣 10/20 07:20
這防不了有心搞破壞的人...
因為這是文字檔,發表以後可以任意修改的.
更不用說,發表前的內容就可以製造兩難了.
→ Richun: 只是對會刪網址又會亂引的又是個新的問題31F 123.193.39.67 台灣 10/20 07:22
推 JCS15: 從文章底部往回抓 不過遇到修文補充的也會破功32F 36.228.142.210 台灣 10/20 07:25
就說這其實是一個很難修的問題啊..╮(﹋﹏﹌)╭..
推 donkilu: IP parsing有心要去弄的話真的無解
但我覺得這種人應該不多就是了34F 172.58.109.54 美國 10/20 07:31
牽扯到重大利害關係的時候,
就很有可能會出現有心人.
殺人都有可能了,更何況只是簡單的蓄意誤導?
因為要騙的對象是程式,不是人.
推 Richun: 一般的parsing加上把不合常規的修文抓出來多少能避免有人去規避掉IP吧
只是這樣還是不能解決直接修發表IP的問題36F 123.193.39.67 台灣 10/20 07:34
※ 編輯: hancel (24.6.102.107), 10/20/2018 07:48:44
推 chx64: 我光是非常確定是XDDDDDDDDDD的分身ID為
j0958322080都抓不出來了 就知道超沒用
而且資料庫好一陣子沒更新了的樣子39F 112.104.113.45 台灣 10/20 07:59
推 autoupdate: 如果是這樣,真的是嚴重bug42F 36.239.87.121 台灣 10/20 08:08
推 hcwang1126: bug修就好了 沒什麽43F 1.164.146.106 台灣 10/20 08:27
推 gay7788: 反正說人黨工又不用證據,沒差44F 61.219.191.4 台灣 10/20 08:29
推 kinki999: 反正那作者也是做出來,貼圖講別人黨工45F 220.134.101.115 台灣 10/20 08:36
噓 greedystar1: 昨天才有人爆料候選人的多重影分身今天就一篇這個網站有重大瑕疵46F 42.77.207.111 台灣 10/20 08:42
推 chrome: 推48F 223.139.49.213 台灣 10/20 08:52
推 z4525881: 可是這個瑕疵真的超大啊,如果黨工蓄意要回避的話還真的無法可管49F 111.82.95.18 台灣 10/20 08:54
推 London2006: 這個網站只是參考用的工具,最主要還是要學會自我判斷51F 61.223.2.223 台灣 10/20 09:18
推 wawawakou: 原來如此。53F 223.137.224.203 台灣 10/20 09:44
→ Skydier: 還一堆腦殘文組狂甲拿這個沾沾自喜
真是不忍唏噓55F 223.140.76.130 台灣 10/20 09:48
推 sharb: 誰屌你啊 網軍啾4網軍57F 1.171.154.242 台灣 10/20 10:08
--