看板 Gossiping作者 joshua830325 (Joshua)標題 Re: [新聞] 維修後資料"全消失" 業者損3千萬氣炸時間 Thu Jun 28 20:11:17 2018
原文吃光光 QQ
來分享前公司幾年前發生過的一個故事(事故?!)
先上結論:
再好的 Data Server 備份機制,
也敵不過天兵管理員的辣手摧花!
#RAID = 磁碟陣列。
Data Server = 資料伺服器。
HDD = 硬碟 = 你的 D 槽。
Recipe = 機台吃的程式
Local = 台灣分公司。
RD 單位隸屬母公司。
前公司賣量產機台進客戶端時,
有順便賣了”兩台”Data Server進客戶端
Server 裡頭放機台要用的 Recipe,
讓機台連區網進來抓Recipe,
客戶一次買了兩台 Server,
每台Server都有RAID,
兩台還互相備援,資料平平安安!
直到有一天,Server A 有HDD掛掉,
RAID 降級需要修復,
天才的 Local 工程師就拔 Server B 的
HDD 去插在 Server A上,
拔一顆不夠爽好像還一次拔兩顆以上。
最後兩台 Data Server 的 RAID
就通通一起崩潰了 T_T!
#然後Server 的資料它就通通屎掉惹!
客戶氣 Pu Pu 非常火大,
機台有一堆 Recipe 通通瞬間蒸發,
Local 只好呼叫 RD 部門派人飛來救援。
最後有沒有救回來我是沒去關心啦,
因為我聽到有人這樣修復RAID時就暈掉了。
#去拔硬碟的天兵是Local第一線的設備工程師,
他被客戶一催,腦一殘沒等Local第二線的系統工程師來處理,
就自己對客戶的伺服器下毒手了
正確流程如4樓M大補充的,
叫料,換備品硬碟上去,
RAID自動執行修復,
修復完成校驗完畢系統重新上線。
以上
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.26.19.211
※ 文章代碼(AID): #1RDD1eXj (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1530187880.A.86D.html
※ 同主題文章:
Re: [新聞] 維修後資料"全消失" 業者損3千萬氣炸
06-28 20:11 joshua830325.
噓 CLV518: 工三小,當大家都工程師逆?2F 06/28 20:13
→ HughesMoo: 就 Sever A 和Server B 互相備援,本來不管他也沒事...4F 06/28 20:14
→ HowLeeHi: 應該是要拿新HDD,裝在SERVER A吧5F 06/28 20:14
→ HughesMoo: 就有人一次拔兩顆HDD 結果Sever B 的 RAID 也炸了...結果就是 Sever A 和 B 的 RAID 全炸了這樣....6F 06/28 20:15
→ ffv111: 那位天兵下場如何?8F 06/28 20:16
→ widec: 這種水準也配當MIS嗎11F 06/28 20:17
推 orze04: 未來趨勢應該是erasure code13F 06/28 20:22
→ kivan00: 都HA了要死就死吧 拔硬碟是哪招15F 06/28 20:25
→ stupid0319: server硬碟可以亂拔?????????????16F 06/28 20:26
推 Muroi: 超級天兵18F 06/28 20:33
→ andy199113 …
→ andy199113: 很像飛安事故 不動他沒事 硬要動結果就死掉了19F 06/28 20:34
推 e52155: 很高機率是客戶端老闆不想花錢買新的硬碟啦XDDD20F 06/28 20:41
推 sank: 大概是22k請的大學理科生21F 06/28 20:41
※ 編輯: joshua830325 (114.26.19.211), 06/28/2018 20:52:43
※ 編輯: joshua830325 (114.26.19.211), 06/28/2018 20:56:17
※ 編輯: joshua830325 (114.26.19.211), 06/28/2018 20:57:45
※ 編輯: joshua830325 (114.26.19.211), 06/28/2018 21:00:40
※ 編輯: joshua830325 (114.26.19.211), 06/28/2018 21:03:21
→ joshua830325: 其實那個客戶每年都有乖乖買Service Contract,零件換好換滿是不另外收費的。。。22F 06/28 23:16
推 Windcws9Z: 這個真的有夠天
Storage Server硬碟都是設計成可熱插拔的模組
這個就直接把壞掉的硬碟換成新的
就可以了 至少要同容量的硬碟
新的硬碟換上去
RAID辨識完成就會開始重建
RAID硬碟不能直接拿B給A用24F 06/29 00:42
--
--
(joshua830325.): Re: [新聞] 維修後資料"全消失" 業者損3千萬氣炸 - terievv板