看板 Gossiping作者 olctw (k.olc.tw)標題 Re: [新聞] 《巴拿馬文件》資料庫上線 20萬家離岸公時間 Sat May 14 20:49:55 2016
※ 引述《aznchat100 (aznchat100)》之銘言:
: 大家好
: 因為巴拿馬文件是「英譯地址」
: 裡面總共一萬多筆資料
: google map 目前只能定位到300多筆
: 所以我想在這裡請各位熱血鄉民幫幫我
: 假如你有空的話請幫忙翻譯巴拿馬文件的「地址」:
: https://drive.google.com/file/d/0Bwve3BEJbfpUZmV2cEhYbDlILW8/view
: 請以「檔案內的英文地址+中文翻譯過的地址」的方式呈現
: 請以「檔案內的英文地址+中文翻譯過的地址」的方式呈現
: 例如,熱心的鄉民gyamwoo已經幫我翻完屏東地區的所有地址了
: (請見PINGTUNG分頁):
: https://drive.google.com/file/d/0B_VuqIynHecxTEE0dWtCQkNxLUE/view
: 假如你想要翻譯或是翻譯好了可以推文或是通知我讓大家知道以免重複
: 請用站內信寄google drive的excel檔案連結給我
: 我會盡快更新在我的地圖上:
: http://billcccheng.github.io/pages/subpages/panama_taiwan.html
住址的部份就麻煩了,我是從姓名去找,不過姓名碰撞的機率很高,所以只能當作參考
得到的結果:
https://github.com/kiang/Panama_Papers_Taiwan/blob/master/match.csv
背景說明:
* 這是把 2012, 2014, 2016 三個年度選舉時出現過的候選人姓名取出查詢
* 透過外交部的護照外文姓名拼音參考工具找出可能的翻譯
* 直接將翻譯與所有 ICIJ 釋出的人名進行比對得到上述結果
* 符合的項目如果有多個候選人資料會分別列出(同名同姓,或是音譯相同)
欄位說明:
* 公職: 參選公職名稱
* 中文姓名: 使用中文姓名
* 英文姓名: 配對成功的音譯
* node_id: ICIJ 的 ID , [Panama Papers]是這次釋出的資料,其他像是
[Offshore Leaks] 則是早期就存在的資料,後面接著的數字,假設是
12215704 ,那麼只要自己在數字前面加上網址就可以看到 ICIJ 資料
https://offshoreleaks.icij.org/nodes/12215704
* 選舉黃頁網址: 該次公職在選舉黃頁的資訊
需要再次強調,這是很粗糙的比對方式,而且有很多中文字其實外交部工具也翻譯不出來
,只是希望縮小範圍讓大家去找看看是不是有關聯性存在,更精準的就有賴強者發揮了
然後也不排除程式寫的太爛導致配對錯誤百出,有興趣的可以自己調整規則踹踹
https://github.com/kiang/Panama_Papers_Taiwan/blob/master/match.php
--
kiang
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.45.116.233
※ 文章代碼(AID): #1NDnxxay (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1463230203.A.93C.html
※ 同主題文章:
Re: [新聞] 《巴拿馬文件》資料庫上線 20萬家離岸公
05-14 20:49 olctw.
加進去了 ;)
推 mquare: 不少企業家都是雙重黨籍的11F 05/14 20:57
推 AGODC: 推!!13F 05/14 21:10
→ teras …
推 teras: 推34F 05/14 22:22
推 RevanKai: 幹!!真的是貪汙大國XDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDD太多了啦 破五百個= =39F 05/14 22:43
推 s0022: 推推53F 05/14 23:26
推 ahouo: 推74F 05/15 01:52
推 u770114: 懷疑這是黨團團報吧XDD78F 05/15 03:10
推 zx97009: 可以分類閩南外省客家人嗎88F 05/15 07:04
如果你可以提供對照表
※ 編輯: olctw (223.137.183.90), 05/15/2016 07:55:23
--