看板 Gossiping
作者 tonyhsie (一筆揮毫天下定)
標題 Re: [新聞] 資訊龐大 簡訊實聯制疫調無用
時間 Tue Jun 29 07:01:18 2021


認真討論一下數據


https://i.imgur.com/UPdfsrx.png
[圖]

這是 NCC FB 的圖,左右相減可得知

現在系統裡有 494,747,875 也就是約 5 億則簡訊


要從這 5 億則簡訊裡

撈出全台灣每天 < 100 名確診者 28 天內的所有足跡

並通知同時間同地點的可能接觸者

大概有多少資料量?


假設 1 個人 1 天平均到 10 個地點(=10封簡訊),每個地點接觸 10 個人

那就是

        100名確診者 * 28天 * 10封簡訊 * 接觸者10人 = 28 萬封簡訊 (每天)


這種估計當然誤差很大


不過大概可以知道

    後端的工作,就是每天從 5 億則簡訊裡撈出幾十萬則相關簡訊、挑出相關人士

        但這些都是用電腦來跑 在操作上不需要太多人力


這部分如果好好做,各縣市政府的疫調人員大概可以輕鬆一半以上吧?

也不用整天吵哪個縣市要負責疫調了....

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.129.204.24 (臺灣)
※ 文章代碼(AID): #1WsbJ0JD (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1624921280.A.4CD.html
kiddingsa: 外包給google 算了1F 111.71.20.18 台灣 06/29 07:03
STi2011: 這是民眾的認知 但新聞怎麼會寫沒用?2F 42.76.168.145 台灣 06/29 07:04

政府應該要出來解釋一下

kiddingsa: google map google analysis 一起上3F 111.71.20.18 台灣 06/29 07:04
WTF1111: 這撈資料大學生就能做了,老害廢到暴4F 223.136.174.80 台灣 06/29 07:04
aribaba0814: 大家本來都是這樣想的 但實際上?
而且店家代碼是不是一般民眾查不到?5F 111.249.242.194 台灣 06/29 07:04

google 地圖查自己的足跡 再比對簡訊 理論上可以知道自己去過的店家的代碼

firelin: 中央沒能力...
一堆老人治國7F 49.217.132.211 台灣 06/29 07:06
now99: 也要看電信端收到簡訊後存放哪裡啊9F 111.240.239.248 台灣 06/29 07:07
kuma0326: 問題在於唐鳳只做資料庫,沒做應用資料庫的工具,偏偏該用資料庫的公務員絕大部份不懂怎麼應用10F 111.255.59.242 台灣 06/29 07:08
WTF1111: 這種資料庫本來就是統一由中央撈資料發送13F 223.136.174.80 台灣 06/29 07:08

理論上應該是中央得知確診結果 -> 中央調實聯制查詢結果 -> 直接發送給地方資料

ftvs: 你要40以上的公務員撈資料!高手在民間。公務員感覺多數是文組14F 111.82.6.140 台灣 06/29 07:09
knives: 公務員只會ctrl f16F 223.141.169.183 台灣 06/29 07:09
aribaba0814: 我不如比對發票好了XD 通常會有消費17F 111.249.242.194 台灣 06/29 07:09
WTF1111: 資料庫裡只有時間、電話、地點三個欄位不抓時間間格的話發送簡訊會浮濫18F 223.136.174.80 台灣 06/29 07:09

實聯制的確沒間隔 這也沒辦法

taikonkimo: 這塊唐鳳絕對有後續責任吧20F 101.12.24.104 台灣 06/29 07:10
now99: 多維度資料,時間、區域範圍,資料沒正規清洗要怎麼應用?21F 111.240.239.248 台灣 06/29 07:10
rufugy: 實名制  最好有落實啦  本身就是個笑話23F 1.200.16.151 台灣 06/29 07:10
WTF1111: 公務員在怎麼廢,中華電信也有人吧24F 223.136.174.80 台灣 06/29 07:10
ksk0516: 就不要天才大臣又出來拯救大家25F 61.228.221.76 台灣 06/29 07:11
knives: 天才唐鳳:錢還沒到位不能做,再拿個八億(26F 223.141.169.183 台灣 06/29 07:11
taikonkimo: 電信業者該每天上傳資料 資料該有資料庫檢索分類 這不是基本嗎 然後該有提供各地縣市政府方便搜尋的介面啊28F 101.12.24.104 台灣 06/29 07:11
WTF1111: 從進去一個點往後抓個三小時發簡訊就好31F 223.136.174.80 台灣 06/29 07:14
knives: 問題在於你認為基本的,他未必會做,實務上也是這樣,不要去做太多餘的工作,不夠再補預算,慢慢完善系統就好32F 223.141.169.183 台灣 06/29 07:14

現在問題是 他只做了前端 然後被媒體跟高層吹得像救世系統一樣

如果後端沒做 那這樣根本就是搞笑而已 花八億換無意義

xiemark: 前端JavaScript寫一下35F 36.226.71.183 台灣 06/29 07:14
knives: 做太好,老百姓會感謝你嗎36F 223.141.169.183 台灣 06/29 07:15
grasslee: 那直接臉書打卡好了37F 59.115.197.230 台灣 06/29 07:16
Kobelephants 
Kobelephants: 老百姓不感謝你,就乾脆擺爛?38F 220.142.60.34 台灣 06/29 07:16
knives: 你看這下又有追加預算的藉口,根本雙贏39F 223.141.169.183 台灣 06/29 07:16
WTF1111: 灶神都造了,現在被爆出來沒法用
下次新功能又能發一次新聞40F 223.136.174.80 台灣 06/29 07:17
Inier: 該給人賺的就要掏,不然就自己用腦想辦法42F 118.171.160.125 台灣 06/29 07:18
mirac1e: 想都不用想 政府說有用的 87%都沒用43F 1.200.241.250 台灣 06/29 07:20
marktak: 很少 你腦漿的問題44F 36.230.118.75 台灣 06/29 07:21
jimtung: google 比這個還準,沒有實聯制
的地方,也能找得到記錄45F 42.75.106.106 台灣 06/29 07:27
shihyiliu: 不是什麼都跟唐鳳有關,這種簡單數據分析不是因為不能做而是抓出來該怎麼辦,事實上原po的講法就太樂觀,十個點十個人然後都沒家屬?都剛好去過的地方都只有一個人接觸?光一個店員就不可能只算一個,算五十個還少了!然後龐大數據抓出來要怎麼辦?公告?隔離?追蹤?事情不是這樣簡單說說的47F 101.136.58.137 台灣 06/29 07:30

這東西本來就是要用來做疫調用途的

怎麼感覺你還沒進入狀況?

after1: 資料庫沒寫好就會跑到死,不過畢竟是唐風做的,總不至於不知道資料庫設計的重要性55F 114.137.31.7 台灣 06/29 07:32
superbatman: 上億筆數據 應該要超級電腦來跑了58F 110.30.80.17 台灣 06/29 07:33
inCraft: https://i.imgur.com/R0svXr5.jpg
所以這個案例怎麼來的?59F 27.52.69.251 台灣 06/29 07:37
[圖]

不知道

基隆 6/24 的新聞

林右昌說,衛生局已經跟CDC請求全聯和烘焙材料行實聯制相關資料,未來下載之後,會
發簡訊告知同時間出現的消費者,另外也會通知相關店員和其他接觸者接受篩檢。


如果基隆跟CDC調資料也要三五天,那也是很謎了

看CDC怎麼說了

s87269x: 電子化還撈不出來,我該說中央廢還是老人不會用?61F 49.217.111.250 台灣 06/29 07:40
steven24205: 推63F 185.189.160.105 台灣 06/29 07:45
※ 編輯: tonyhsie (220.129.204.24 臺灣), 06/29/2021 07:46:50
Palaclin: 國考有資訊處理的 那些人去哪了?64F 223.139.218.69 台灣 06/29 07:46
js52666: 反過勞 不要什麼事都要基層做65F 122.118.237.236 台灣 06/29 07:52
yusanhu: 我覺得真的有把簡訊整理成database嗎66F 110.30.9.151 台灣 06/29 07:52
dovepacket: 疑 我們怕病毒感染所以接觸者自當隔離 規則本來就是這樣吧
怎麼會有怕資訊太多隔離者太多?67F 49.217.3.11 台灣 06/29 07:52
Brian23: 做IOT的資料量和這差不多吧70F 110.28.64.215 台灣 06/29 07:53
dovepacket: 既然不升四級  所以靠科技減少大規模隔離  而採相對少數隔離71F 49.217.3.11 台灣 06/29 07:54
diamond0326: 無能中央真的廢到不行……幫台灣QQ73F 223.136.201.151 台灣 06/29 08:01
lin210: 韓粉表示:不管啦!侵犯人權!綠共獨裁!74F 42.75.101.102 台灣 06/29 08:01
sunbreak0723: DBA在幹嘛?75F 36.231.39.54 台灣 06/29 08:03
feichai5566: 我也有開定位可是google的時間軸有時候不準呀76F 223.136.130.146 台灣 06/29 08:04
babyMclaren: 一定是系統被柯DDOS攻擊78F 223.137.213.50 台灣 06/29 08:04
pitaya13: 笑死人 一天到晚大數據 有大數據規模的資料進來沒人會做?79F 39.10.69.134 台灣 06/29 08:04
grayplace: 台灣就是一堆腦殘老人,不學E化每次都在用過去那老套方式81F 39.13.69.52 台灣 06/29 08:05
pitaya13: 用時間和場所代碼篩選再寄發通知 哪裡有資料清洗的問題83F 39.10.69.134 台灣 06/29 08:07
beergap: 他們是公務員,懂?85F 123.192.181.41 台灣 06/29 08:07
menshuei: 對啊,而且我看大部分的確診足跡都不超過10間,有的才三間而已,根本不用大數據分析吧86F 1.161.86.47 台灣 06/29 08:08
yuinami: 中央只會造神啊XD89F 223.138.188.28 台灣 06/29 08:09
chocopie: 國考資訊處理不會考你 SQL 跟 No-SQL的差別,更不用說實務上如何建置資料平台90F 27.246.158.32 台灣 06/29 08:13
beavis77: 有地點代碼 有時間 有簡訊所屬門號
資料庫有三個條件 怎麼可能無法疫調?93F 220.128.116.82 台灣 06/29 08:15
chocopie: 至於是否大數據並不是重點,而是雞生蛋蛋生雞的問題。
資料倉儲要先做好,後面作完ETL,資料才95F 27.246.158.32 台灣 06/29 08:16
beavis77: 除非三個缺一個 需要人工補齊 這太扯了98F 220.128.116.82 台灣 06/29 08:16
chocopie: 能更精準抓到想要的範圍,而不是大海撈針。99F 27.246.158.32 台灣 06/29 08:16
jialin6666: 新聞寫五月份,感覺是一開始,有點誤101F 223.137.56.180 台灣 06/29 08:25
Sazip: 地方沒養相關資工人啊103F 223.138.18.186 台灣 06/29 08:38
busstops: 10個有點多,我大概都0-3,平均算2就好,應該不難吧(?)104F 42.72.120.54 台灣 06/29 08:45
k258610: 問題有很多,包含資料格式可能不正確(有些人可能不會掃qr code ,沒有相機相機壞掉等,所以用手打的,手打容易出錯),所以很多地方還是需要人工校閱106F 114.137.245.134 台灣 06/29 08:47
jjcmonster: dpp無能110F 27.52.64.255 台灣 06/29 08:51
johngy: 公務員只會複製貼上111F 223.136.232.3 台灣 06/29 08:53
umum29: 還不如直接和電信業者要資料112F 67.188.233.67 美國 06/29 08:56
vespar: 掃半天結果是沒做後端的雞肋功能...?113F 49.216.24.209 台灣 06/29 09:12
chanceiam: 檔案用錯?沒開資料庫?根本沒整合?114F 220.136.225.35 台灣 06/29 09:16
jzxc56788: 說不會太誇張了 不是地方太爛就是不想115F 42.72.126.179 台灣 06/29 09:21
x94fujo6: 公務猿: 資料庫? 黑系蝦小?117F 114.33.176.49 台灣 06/29 09:24
PONANZA: 沒正規化 前端沒應用 只是空做出個存資料的倉儲根本沒用
準備做得好 語法下去一般電腦也能順利撈資料
五億筆普通啦 但如果只有一張表的話就....ㄎㄎ118F 1.75.230.119 日本 06/29 09:25
GiPaPa: DB切一下partition就不會有五億了124F 114.36.96.135 台灣 06/29 09:28
h321123aa: 不會吧,前端那麼簡單利索,這後端就算沒做也只是撈出來自己分類跑,這要做應該青菜找人都找得到125F 223.137.4.190 台灣 06/29 09:36
shangclock: 所以48樓意思不就這系統只是做做樣子?要求大家到哪都寄簡訊然後就沒有然後了,現在許多店家還會要求要看到才給結帳取餐128F 114.137.188.132 台灣 06/29 09:37
BREAKFAST204: 4%阻礙啦 哪次不是4%柯粉害得132F 27.242.128.199 台灣 06/29 09:47
oidkk: 高調133F 111.250.102.168 台灣 06/29 10:10
seatan: 地點時間套用下去不就有了,程式跑累哪?只做表面嗎?134F 119.14.162.117 台灣 06/29 10:14
guenhwyvar: 真是覺得太荒謬了,實聯制到現在多久了,基本的應該要做吧136F 42.77.201.42 台灣 06/29 10:39
bbbing: 理論能力有這麼強,實際發揮的百分比..138F 36.228.76.152 台灣 06/29 10:59
best0811: 做表面不是政府常做的事嗎139F 61.223.6.167 台灣 06/29 11:16
king22649: 沒有即時性 難度不高才對140F 223.137.64.65 台灣 06/29 11:26
sopdet: 直接拿確診者ID去撈資料是多難 還是你要一個個比對電話號碼 智障系統141F 111.82.50.245 台灣 06/29 11:38
eldar: 用商家代碼和手機門號歸類的話,這連大數據都算不上143F 140.112.235.23 台灣 06/29 11:39
leecoco: 這個SELECT之後JOIN起來非常可怕
SQL下的不好 SERVER馬上死給你看
看他當初DB怎麼設計的 沒設計好真的就死照理說應該是連篩選系統都要做好145F 111.83.218.147 台灣 06/29 11:49
amgn997: 維穩宣傳用的,認真什麼149F 1.172.114.252 台灣 06/29 11:54
audy: 我覺得是地方政府廢啦!找資訊單位合作很難
維穏?中國人滾啦!150F 118.166.126.39 台灣 06/29 12:14
f222051618: 整天只會大內宣的垃圾政府153F 116.241.165.65 台灣 06/29 12:24
PatlaborGao: 其實每次到的地方存手機 晚上12:00再固定連網路或簡訊傳送一天份就好了每刷一次發一次簡訊 根本蠢爆了154F 36.227.9.1 台灣 06/29 12:26
gmoz: 重點是你不同電信商的資料是否有整併
若是發文去各電信商這樣要資料 就搞笑了157F 114.34.7.113 台灣 06/29 13:07
junglecity: 不論資料量或效率 應該要做好分類檢索159F 123.192.177.169 台灣 06/29 15:06
Csy065: 認真回 撈資料切小塊搜尋比較快161F 150.116.232.85 台灣 06/29 22:41
aasslleepp: 連sql資料庫怎麼建跟怎麼撈都不會就不要出來丟人現眼了   才幾億筆有這麼難撈?162F 42.72.169.168 台灣 06/29 23:37

--
--
作者 tonyhsie 的最新發文:
點此顯示更多發文記錄
(tonyhsie.): Re: [新聞] 資訊龐大 簡訊實聯制疫調無用 - Gossiping板