顯示廣告
隱藏 ✕
※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2021-06-30 02:58:27
看板 Gossiping
作者 tonyhsie (一筆揮毫天下定)
標題 Re: [新聞] 資訊龐大 簡訊實聯制疫調無用
時間 Tue Jun 29 07:01:18 2021


認真討論一下數據


https://i.imgur.com/UPdfsrx.png
[圖]

這是 NCC FB 的圖,左右相減可得知

現在系統裡有 494,747,875 也就是約 5 億則簡訊


要從這 5 億則簡訊裡

撈出全台灣每天 < 100 名確診者 28 天內的所有足跡

並通知同時間同地點的可能接觸者

大概有多少資料量?


假設 1 個人 1 天平均到 10 個地點(=10封簡訊),每個地點接觸 10 個人

那就是

        100名確診者 * 28天 * 10封簡訊 * 接觸者10人 = 28 萬封簡訊 (每天)


這種估計當然誤差很大


不過大概可以知道

    後端的工作,就是每天從 5 億則簡訊裡撈出幾十萬則相關簡訊、挑出相關人士

        但這些都是用電腦來跑 在操作上不需要太多人力


這部分如果好好做,各縣市政府的疫調人員大概可以輕鬆一半以上吧?

也不用整天吵哪個縣市要負責疫調了....

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.129.204.24 (臺灣)
※ 文章代碼(AID): #1WsbJ0JD (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1624921280.A.4CD.html
kiddingsa: 外包給google 算了1F 111.71.20.18 台灣 06/29 07:03
STi2011: 這是民眾的認知 但新聞怎麼會寫沒用?2F 42.76.168.145 台灣 06/29 07:04

政府應該要出來解釋一下

kiddingsa: google map google analysis 一起上3F 111.71.20.18 台灣 06/29 07:04
WTF1111: 這撈資料大學生就能做了,老害廢到暴4F 223.136.174.80 台灣 06/29 07:04
aribaba0814: 大家本來都是這樣想的 但實際上?5F 111.249.242.194 台灣 06/29 07:04
aribaba0814: 而且店家代碼是不是一般民眾查不到?

google 地圖查自己的足跡 再比對簡訊 理論上可以知道自己去過的店家的代碼

firelin: 中央沒能力...7F 49.217.132.211 台灣 06/29 07:06
firelin: 一堆老人治國
now99: 也要看電信端收到簡訊後存放哪裡啊9F 111.240.239.248 台灣 06/29 07:07
kuma0326: 問題在於唐鳳只做資料庫,沒做應用資料10F 111.255.59.242 台灣 06/29 07:08
kuma0326: 庫的工具,偏偏該用資料庫的公務員絕大
kuma0326: 部份不懂怎麼應用
WTF1111: 這種資料庫本來就是統一由中央撈資料發送13F 223.136.174.80 台灣 06/29 07:08

理論上應該是中央得知確診結果 -> 中央調實聯制查詢結果 -> 直接發送給地方資料

ftvs: 你要40以上的公務員撈資料!高手在民間。公14F 111.82.6.140 台灣 06/29 07:09
ftvs: 務員感覺多數是文組
knives: 公務員只會ctrl f16F 223.141.169.183 台灣 06/29 07:09
aribaba0814: 我不如比對發票好了XD 通常會有消費17F 111.249.242.194 台灣 06/29 07:09
WTF1111: 資料庫裡只有時間、電話、地點三個欄位18F 223.136.174.80 台灣 06/29 07:09
WTF1111: 不抓時間間格的話發送簡訊會浮濫

實聯制的確沒間隔 這也沒辦法

taikonkimo: 這塊唐鳳絕對有後續責任吧20F 101.12.24.104 台灣 06/29 07:10
now99: 多維度資料,時間、區域範圍,資料沒正規清21F 111.240.239.248 台灣 06/29 07:10
now99: 洗要怎麼應用?
rufugy: 實名制  最好有落實啦  本身就是個笑話23F 1.200.16.151 台灣 06/29 07:10
WTF1111: 公務員在怎麼廢,中華電信也有人吧24F 223.136.174.80 台灣 06/29 07:10
ksk0516: 就不要天才大臣又出來拯救大家25F 61.228.221.76 台灣 06/29 07:11
knives: 天才唐鳳:錢還沒到位不能做,再拿個八億(26F 223.141.169.183 台灣 06/29 07:11
knives: 誤
taikonkimo: 電信業者該每天上傳資料 資料該有資28F 101.12.24.104 台灣 06/29 07:11
taikonkimo: 料庫檢索分類 這不是基本嗎 然後該有
taikonkimo: 提供各地縣市政府方便搜尋的介面啊
WTF1111: 從進去一個點往後抓個三小時發簡訊就好31F 223.136.174.80 台灣 06/29 07:14
knives: 問題在於你認為基本的,他未必會做,實務32F 223.141.169.183 台灣 06/29 07:14
knives: 上也是這樣,不要去做太多餘的工作,不夠
knives: 再補預算,慢慢完善系統就好

現在問題是 他只做了前端 然後被媒體跟高層吹得像救世系統一樣

如果後端沒做 那這樣根本就是搞笑而已 花八億換無意義

xiemark: 前端JavaScript寫一下35F 36.226.71.183 台灣 06/29 07:14
knives: 做太好,老百姓會感謝你嗎36F 223.141.169.183 台灣 06/29 07:15
grasslee: 那直接臉書打卡好了37F 59.115.197.230 台灣 06/29 07:16
Kobelephants 
Kobelephants: 老百姓不感謝你,就乾脆擺爛?38F 220.142.60.34 台灣 06/29 07:16
knives: 你看這下又有追加預算的藉口,根本雙贏39F 223.141.169.183 台灣 06/29 07:16
WTF1111: 灶神都造了,現在被爆出來沒法用40F 223.136.174.80 台灣 06/29 07:17
WTF1111: 下次新功能又能發一次新聞
Inier: 該給人賺的就要掏,不然就自己用腦想辦法42F 118.171.160.125 台灣 06/29 07:18
mirac1e: 想都不用想 政府說有用的 87%都沒用43F 1.200.241.250 台灣 06/29 07:20
marktak: 很少 你腦漿的問題44F 36.230.118.75 台灣 06/29 07:21
jimtung: google 比這個還準,沒有實聯制45F 42.75.106.106 台灣 06/29 07:27
jimtung: 的地方,也能找得到記錄
shihyiliu: 不是什麼都跟唐鳳有關,這種簡單數據分47F 101.136.58.137 台灣 06/29 07:30
shihyiliu: 析不是因為不能做而是抓出來該怎麼辦,
shihyiliu: 事實上原po的講法就太樂觀,十個點十個
shihyiliu: 人然後都沒家屬?都剛好去過的地方都只
shihyiliu: 有一個人接觸?光一個店員就不可能只算
shihyiliu: 一個,算五十個還少了!然後龐大數據抓
shihyiliu: 出來要怎麼辦?公告?隔離?追蹤?事情
shihyiliu: 不是這樣簡單說說的

這東西本來就是要用來做疫調用途的

怎麼感覺你還沒進入狀況?

after1: 資料庫沒寫好就會跑到死,不過畢竟是唐風55F 114.137.31.7 台灣 06/29 07:32
after1: 做的,總不至於不知道資料庫設計的重要性
after1: 吧
superbatman: 上億筆數據 應該要超級電腦來跑了58F 110.30.80.17 台灣 06/29 07:33
inCraft: https://i.imgur.com/R0svXr5.jpg59F 27.52.69.251 台灣 06/29 07:37
inCraft: 所以這個案例怎麼來的?
[圖]

不知道

基隆 6/24 的新聞

林右昌說,衛生局已經跟CDC請求全聯和烘焙材料行實聯制相關資料,未來下載之後,會
發簡訊告知同時間出現的消費者,另外也會通知相關店員和其他接觸者接受篩檢。


如果基隆跟CDC調資料也要三五天,那也是很謎了

看CDC怎麼說了

s87269x: 電子化還撈不出來,我該說中央廢還是老人61F 49.217.111.250 台灣 06/29 07:40
s87269x: 不會用?
steven24205: 推63F 185.189.160.105 台灣 06/29 07:45
※ 編輯: tonyhsie (220.129.204.24 臺灣), 06/29/2021 07:46:50
Palaclin: 國考有資訊處理的 那些人去哪了?64F 223.139.218.69 台灣 06/29 07:46
js52666: 反過勞 不要什麼事都要基層做65F 122.118.237.236 台灣 06/29 07:52
yusanhu: 我覺得真的有把簡訊整理成database嗎66F 110.30.9.151 台灣 06/29 07:52
dovepacket: 疑 我們怕病毒感染所以接觸者自當隔67F 49.217.3.11 台灣 06/29 07:52
dovepacket: 離 規則本來就是這樣吧
dovepacket: 怎麼會有怕資訊太多隔離者太多?
Brian23: 做IOT的資料量和這差不多吧70F 110.28.64.215 台灣 06/29 07:53
dovepacket: 既然不升四級  所以靠科技減少大規模71F 49.217.3.11 台灣 06/29 07:54
dovepacket: 隔離  而採相對少數隔離
diamond0326: 無能中央真的廢到不行……幫台灣QQ73F 223.136.201.151 台灣 06/29 08:01
lin210: 韓粉表示:不管啦!侵犯人權!綠共獨裁!74F 42.75.101.102 台灣 06/29 08:01
sunbreak0723: DBA在幹嘛?75F 36.231.39.54 台灣 06/29 08:03
feichai5566: 我也有開定位可是google的時間軸有時76F 223.136.130.146 台灣 06/29 08:04
feichai5566: 候不準呀
babyMclaren: 一定是系統被柯DDOS攻擊78F 223.137.213.50 台灣 06/29 08:04
pitaya13: 笑死人 一天到晚大數據 有大數據規模的79F 39.10.69.134 台灣 06/29 08:04
pitaya13: 資料進來沒人會做?
grayplace: 台灣就是一堆腦殘老人,不學E化每次都81F 39.13.69.52 台灣 06/29 08:05
grayplace: 在用過去那老套方式
pitaya13: 用時間和場所代碼篩選再寄發通知 哪裡83F 39.10.69.134 台灣 06/29 08:07
pitaya13: 有資料清洗的問題
beergap: 他們是公務員,懂?85F 123.192.181.41 台灣 06/29 08:07
menshuei: 對啊,而且我看大部分的確診足跡都不超86F 1.161.86.47 台灣 06/29 08:08
menshuei: 過10間,有的才三間而已,根本不用大數
menshuei: 據分析吧
yuinami: 中央只會造神啊XD89F 223.138.188.28 台灣 06/29 08:09
chocopie: 國考資訊處理不會考你 SQL 跟 No-SQL的90F 27.246.158.32 台灣 06/29 08:13
chocopie: 差別,更不用說實務上如何建置資料平台
chocopie: 。
beavis77: 有地點代碼 有時間 有簡訊所屬門號93F 220.128.116.82 台灣 06/29 08:15
beavis77: 資料庫有三個條件 怎麼可能無法疫調?
chocopie: 至於是否大數據並不是重點,而是雞生蛋95F 27.246.158.32 台灣 06/29 08:16
chocopie: 蛋生雞的問題。
chocopie: 資料倉儲要先做好,後面作完ETL,資料才
beavis77: 除非三個缺一個 需要人工補齊 這太扯了98F 220.128.116.82 台灣 06/29 08:16
chocopie: 能更精準抓到想要的範圍,而不是大海撈99F 27.246.158.32 台灣 06/29 08:16
chocopie: 針。
jialin6666: 新聞寫五月份,感覺是一開始,有點誤101F 223.137.56.180 台灣 06/29 08:25
jialin6666: 導
Sazip: 地方沒養相關資工人啊103F 223.138.18.186 台灣 06/29 08:38
busstops: 10個有點多,我大概都0-3,平均算2就好104F 42.72.120.54 台灣 06/29 08:45
busstops: ,應該不難吧(?)
k258610: 問題有很多,包含資料格式可能不正確(有106F 114.137.245.134 台灣 06/29 08:47
k258610: 些人可能不會掃qr code ,沒有相機相機壞
k258610: 掉等,所以用手打的,手打容易出錯),所
k258610: 以很多地方還是需要人工校閱
jjcmonster: dpp無能110F 27.52.64.255 台灣 06/29 08:51
johngy: 公務員只會複製貼上111F 223.136.232.3 台灣 06/29 08:53
umum29: 還不如直接和電信業者要資料112F 67.188.233.67 美國 06/29 08:56
vespar: 掃半天結果是沒做後端的雞肋功能...?113F 49.216.24.209 台灣 06/29 09:12
chanceiam: 檔案用錯?沒開資料庫?根本沒整合?114F 220.136.225.35 台灣 06/29 09:16
jzxc56788: 說不會太誇張了 不是地方太爛就是不想115F 42.72.126.179 台灣 06/29 09:21
jzxc56788: 搞
x94fujo6: 公務猿: 資料庫? 黑系蝦小?117F 114.33.176.49 台灣 06/29 09:24
PONANZA: 沒正規化 前端沒應用 只是空做出個存資料118F 1.75.230.119 日本 06/29 09:25
PONANZA: 的倉儲根本沒用
PONANZA: 準備做得好 語法下去一般電腦也能順利撈
PONANZA: 資料
PONANZA: 五億筆普通啦 但如果只有一張表的話就...
PONANZA: .ㄎㄎ
GiPaPa: DB切一下partition就不會有五億了124F 114.36.96.135 台灣 06/29 09:28
h321123aa: 不會吧,前端那麼簡單利索,這後端就算125F 223.137.4.190 台灣 06/29 09:36
h321123aa: 沒做也只是撈出來自己分類跑,這要做應
h321123aa: 該青菜找人都找得到
shangclock: 所以48樓意思不就這系統只是做做樣子128F 114.137.188.132 台灣 06/29 09:37
shangclock: ?要求大家到哪都寄簡訊然後就沒有然
shangclock: 後了,現在許多店家還會要求要看到才
shangclock: 給結帳取餐
BREAKFAST204: 4%阻礙啦 哪次不是4%柯粉害得132F 27.242.128.199 台灣 06/29 09:47
oidkk: 高調133F 111.250.102.168 台灣 06/29 10:10
seatan: 地點時間套用下去不就有了,程式跑累哪?134F 119.14.162.117 台灣 06/29 10:14
seatan: 只做表面嗎?
guenhwyvar: 真是覺得太荒謬了,實聯制到現在多久136F 42.77.201.42 台灣 06/29 10:39
guenhwyvar: 了,基本的應該要做吧
bbbing: 理論能力有這麼強,實際發揮的百分比..138F 36.228.76.152 台灣 06/29 10:59
best0811: 做表面不是政府常做的事嗎139F 61.223.6.167 台灣 06/29 11:16
king22649: 沒有即時性 難度不高才對140F 223.137.64.65 台灣 06/29 11:26
sopdet: 直接拿確診者ID去撈資料是多難 還是你要141F 111.82.50.245 台灣 06/29 11:38
sopdet: 一個個比對電話號碼 智障系統
eldar: 用商家代碼和手機門號歸類的話,這連大數據143F 140.112.235.23 台灣 06/29 11:39
eldar: 都算不上
leecoco: 這個SELECT之後JOIN起來非常可怕145F 111.83.218.147 台灣 06/29 11:49
leecoco: SQL下的不好 SERVER馬上死給你看
leecoco: 看他當初DB怎麼設計的 沒設計好真的就死
leecoco: 照理說應該是連篩選系統都要做好
amgn997: 維穩宣傳用的,認真什麼149F 1.172.114.252 台灣 06/29 11:54
audy: 我覺得是地方政府廢啦!找資訊單位合作很難150F 118.166.126.39 台灣 06/29 12:14
audy: ?
audy: 維穏?中國人滾啦!
f222051618: 整天只會大內宣的垃圾政府153F 116.241.165.65 台灣 06/29 12:24
PatlaborGao: 其實每次到的地方存手機 晚上12:00154F 36.227.9.1 台灣 06/29 12:26
PatlaborGao: 再固定連網路或簡訊傳送一天份就好了
PatlaborGao: 每刷一次發一次簡訊 根本蠢爆了
gmoz: 重點是你不同電信商的資料是否有整併157F 114.34.7.113 台灣 06/29 13:07
gmoz: 若是發文去各電信商這樣要資料 就搞笑了
junglecity: 不論資料量或效率 應該要做好分類檢索159F 123.192.177.169 台灣 06/29 15:06
junglecity: 吧
Csy065: 認真回 撈資料切小塊搜尋比較快161F 150.116.232.85 台灣 06/29 22:41
aasslleepp: 連sql資料庫怎麼建跟怎麼撈都不會就不162F 42.72.169.168 台灣 06/29 23:37
aasslleepp: 要出來丟人現眼了   才幾億筆有這麼難
aasslleepp: 撈?

--
※ 看板: Gossiping 文章推薦值: 2 目前人氣: 0 累積人氣: 971 
作者 tonyhsie 的最新發文:
點此顯示更多發文記錄
分享網址: 複製 已複製
( ̄︶ ̄)b JCB88, markbb01 說讚!
1樓 時間: 2021-06-29 08:41:07 (台灣)
  06-29 08:41 TW
···
Blank space
怎麼會沒用? 現在資料庫處理速度極快 好一點的電腦每秒可以 index 千萬筆資料 Blank space
2樓 時間: 2021-06-29 08:51:19 (台灣)
-1 06-29 08:51 TW
雙北那些高端居民根本沒疫調 實聯制哪會有用
3樓 時間: 2021-06-29 09:30:12 (台灣)
  06-29 09:30 TW
如果只是要這種手機的後台資料,还需要搞程式嗎? 直接你找基地台的通信業者要他們的連網資料不是更快......还花什麼8E閒錢做什麼
4樓 時間: 2021-06-29 09:50:45 (台灣)
  06-29 09:50 TW
樓上 有犯罪才能偵查 您似乎忘了這裡並不是中國 如果是你自己留給店家的 就不會有這種問題 如果不留呢? 那就不要買阿
5樓 時間: 2021-06-29 10:09:48 (台灣)
  06-29 10:09 TW
樓上的,你去翻翻傳染病防治法,不然你以為為什麼要留資料,你覺得是自願的哦! 別法盲好嗎?
6樓 時間: 2021-06-29 11:35:51 (台灣)
  06-29 11:35 TW
還在嘴沒疫調?
可憐小粉紅啊
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇