顯示廣告
隱藏 ✕
※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2021-06-30 09:43:30
看板 Gossiping
作者 blargelp (bernie識形態)
標題 Re: [新聞] 資訊龐大 簡訊實聯制疫調無用
時間 Tue Jun 29 08:25:59 2021


※ 引述《richjf (richArt)》之銘言:

: 澎湖縣衛生局表示,當時有請教中央流行疫情指揮中心,得到的回覆是「實聯制資訊龐大
: ,如何用於疫調仍在研議,使用上有困難。」顯然實聯制在該案疫調中無法發揮作用。

你各位信嗎?
資料龐大?

阿就 疫調後得知 某A 幾點幾分 到 幾點幾分 出現在場所代碼XXXXXXXXX

那就把該場所代碼
這段時間有掃過的手機號拉出來啊?很難嗎?


實聯制資訊不外乎:
日期、幾點、手機號、場所號

用tab隔開的TXT檔 不就有資料了?
用excel來開,篩選場所、時間選某a出沒時間短。

不就有一排手機號碼了?


到底難在哪?

要嘛這篇報導移花接木,指揮中心的回覆可能是針對其他更複雜的功能;要嘛就是撈資料
這件事沒有拍公務員/電信業者去做,卡在行政程序。

不然這麼簡單的事,到底有什麼困難的?

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.200.247.22 (臺灣)
※ 文章代碼(AID): #1WscYPCe (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1624926361.A.328.html
ronga: 很難,資料量那麼大,DB如果沒寫好 會跑到1F 61.228.160.148 台灣 06/29 08:27
ronga: 天荒地老,電腦並沒有那麼神

啊又不用把整個縣市的資料一起開
確診者又不會瞬移,檔案分成好幾個區域查,也不用看到那麼大檔案。
bkm1: 簡單說 東西有出來 硬體跟不上 所以等於廢物3F 101.9.109.145 台灣 06/29 08:28
holypiggy: 那被拉出來的人 去過其它地方要再匡嗎4F 114.137.120.34 台灣 06/29 08:28
holypiggy:  要匡幾層?
hosen: 難在分析6F 106.1.233.247 台灣 06/29 08:29
xx5244: 用逗號隔開,csv好嗎7F 180.217.41.102 台灣 06/29 08:29
bkm1: 平常不準備 急就章東西 打到政敵目的就達到8F 101.9.109.145 台灣 06/29 08:29
※ 編輯: blargelp (1.200.247.22 臺灣), 06/29/2021 08:31:32
A6 
A6: 你用電腦搜500G的硬碟 和5T硬碟時間不一樣9F 101.87.100.118 中國 06/29 08:30
snow3804: 屌打台北通就夠了10F 36.225.220.34 台灣 06/29 08:30
A6 
A6: 這時候有兩種做法 1.做好分組 2.加快CPU11F 101.87.100.118 中國 06/29 08:30
now99: 資料庫多大?不用錢?12F 111.240.239.248 台灣 06/29 08:31
阿就一堆文字檔,能多大?
而且八億就包含業者儲存的費用了,沒有不用錢啊,已經付了。
※ 編輯: blargelp (1.200.247.22 臺灣), 06/29/2021 08:33:12
kausan: 資料收集一堆結果電腦不夠快 笑鼠13F 180.217.156.24 台灣 06/29 08:32
devil0915: 本來就不難,但是聯合報就是要做假新14F 27.242.8.254 台灣 06/29 08:32
kausan: 我看光是要刪資料就要很久15F 180.217.156.24 台灣 06/29 08:32
devil0915: 聞給你們這些智障柯糞高潮16F 27.242.8.254 台灣 06/29 08:32
chigo520: 說資料大的也好笑啊你當初規劃沒有考慮17F 101.10.6.89 台灣 06/29 08:33
chigo520: 這個問題麼?
s0914714: 什麼分析根本不是問題吧 也可以離線做啊19F 123.110.132.67 台灣 06/29 08:34
kausan: 我猜因為個資的關係不敢把資料下放地方20F 180.217.156.24 台灣 06/29 08:34
s0914714: 先分組再merge就好21F 123.110.132.67 台灣 06/29 08:34
widec: 公家機關的軟體都是廢物 搞不好還中國寫的22F 1.165.81.158 台灣 06/29 08:36
bkm1: 系統owner都出來講了 還在假新聞 腦袋還好嗎23F 101.9.109.145 台灣 06/29 08:36
iceyang: 分縣市或分日期 搜尋時間根本沒多少24F 118.170.196.123 台灣 06/29 08:36
echochrome: 上一篇有解釋了25F 60.251.148.6 台灣 06/29 08:37
signm: 你怎麼知道對方不是手寫的26F 223.138.122.147 台灣 06/29 08:37
iceyang: 只是不知道你撈出區段手機號後要怎麼跟電27F 118.170.196.123 台灣 06/29 08:37
iceyang: 信端提取該手機號個資 這段有沒有實作
Kyo824: 就神器被豬用啊29F 42.77.121.184 台灣 06/29 08:38
lucifiel1618: 那就是系統完成不到一半嘛30F 111.254.86.219 台灣 06/29 08:39
lucifiel1618: 要建個資料庫有什麼難,怎麼調資料
lucifiel1618: 分析資料的系統才是開發的核心啊
lucifiel1618: 只有沒分析過的資料那不就垃圾
derekjj: 政府機關的硬體xdddd34F 49.217.3.169 台灣 06/29 08:43
mmchen: 什麼錢都在花了,沒錢買高級電腦?35F 27.240.169.62 台灣 06/29 08:44
nitu2009: azure, gcp, aws選一個36F 112.104.108.109 台灣 06/29 08:46
hosen: data mining 懂?raw data 是沒有用的37F 106.1.233.247 台灣 06/29 08:46
ronga: 看了上一篇,感覺不是DB問題而是使用端問題38F 61.228.160.148 台灣 06/29 08:47
hosen: 疫調要知道的是他的足跡跟誰重疊了,簡訊只39F 106.1.233.247 台灣 06/29 08:48
hosen: 記錄進去的時間那是不夠的
devil0915: 唐自己都出來解釋了,還說不是假新聞41F 27.242.8.254 台灣 06/29 08:50
InfinitySA: 推 沒辦法擷取出有用資訊的資料就是垃42F 140.124.3.122 台灣 06/29 08:53
InfinitySA: 圾 到底有甚麼好護航
tanby: 文組44F 60.251.43.19 台灣 06/29 08:55
after1: 照你說的方法系統會直接卡死吧,資料量太45F 114.137.31.7 台灣 06/29 08:59
after1: 大處理不過來
lazarus1121: 看到用excel來開就知道這篇不用看了47F 36.228.16.142 台灣 06/29 08:59
HeartBreaker: 沒做好資料前處理就是Garbage in48F 223.139.101.119 台灣 06/29 09:03
HeartBreaker: ,garbage out而已
harland: 應該反串吧,excel應該打不開XD50F 223.137.176.14 台灣 06/29 09:14
ifiwant: 資料量過大只是個笑話,系統沒設計好才51F 114.40.148.245 台灣 06/29 09:14
ifiwant: 是真的!
t1329kimo: 文組  光簡訊內容就沒有固定模板  你53F 27.53.178.76 台灣 06/29 09:15
t1329kimo: 以為很好解析喔
kashima228: 你要用excel開也是可以啦55F 61.71.123.77 台灣 06/29 09:18
kashima228: 但我想唐政委應該不會用的這麼簡單
qilar: 開excel可能會當機ㄏ57F 112.78.65.42 台灣 06/29 09:22
ch410773: 誰會用excel處理這種數據量啦58F 103.231.255.119 香港 06/29 09:26
x94fujo6: 你開個1億筆資料的excel就好 用用看^^59F 114.33.176.49 台灣 06/29 09:34
l11111111: 一堆低能找藉口 這麼多藉口你他媽當初60F 111.83.147.44 台灣 06/29 09:48
l11111111: 是沒動腦就做?
lucifer648: 唐鳳又要出手囉~62F 49.216.21.185 台灣 06/29 10:04
aa780318: 沒固定模板才笑死,內容誰設計的?63F 220.141.125.224 台灣 06/29 10:24
s0914714: 就算沒固定模板用個配接器就好阿64F 123.110.132.67 台灣 06/29 10:47
s0914714: 只要知道資料格式就好
philae1112: XDDD66F 125.231.77.133 台灣 06/29 10:57
AIRWAY1021: 若真的存成excel,那糗大了,難怪不找67F 118.170.104.179 台灣 06/29 11:12
benedict76: excel資料太大連5900x開起來都不一定68F 223.136.233.194 台灣 06/29 11:33
benedict76: 快。
owlet: 別人做的事情總是比較簡單70F 69.250.241.36 美國 06/29 11:41
mickyang: 電信公司帳單就不會算錯帳單該收費的金71F 1.164.44.2 台灣 06/29 12:17
mickyang: 額?
mickyang: 是有多難?
k1988771028: 我覺得問題不在這部分,而是手機號碼74F 111.240.210.77 台灣 06/29 13:44
k1988771028: 和使用人兩個table的連結,我認為唐
k1988771028: 鳳的系統沒有存門號用戶的個人資料,
k1988771028: 所以情況可能會變成,A B C 三個號碼
k1988771028: 要匡列,但還要去電信公司問ABC是不
k1988771028: 是你們的門號? 是的話請回傳用戶資
k1988771028: 訊給我,一來一往就花費更多時間
yymeow: 五億筆耶,尼可以看看excel裝不裝得下81F 114.37.71.230 台灣 06/29 15:00

--
※ 看板: Gossiping 文章推薦值: 0 目前人氣: 0 累積人氣: 453 
作者 blargelp 的最新發文:
點此顯示更多發文記錄
分享網址: 複製 已複製
1樓 時間: 2021-06-29 10:42:00 (台灣)
  06-29 10:42 TW
我也看不出到底哪里难.....他妈的就捞数据都做不到,也说不出难在哪,真的很低能
2樓 時間: 2021-06-29 13:04:25 (美國)
     (編輯過) US
忘了簡轉繁  五毛比較低能
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇