顯示廣告
隱藏 ✕
※ 本文為 terievv 轉寄自 ptt.cc 更新時間: 2018-12-30 11:25:51
看板 Storage_Zone
作者 kaltu (ka)
標題
 [請益] SSD部份檔案經過強讀取之後變成0KB

時間 Thu Dec 27 19:51:18 2018




我買的硬碟是冠元的TP6500 512GB
http://i.imgur.com/DqJgmcq.jpg
[圖]
 

一切使用完全正常

但是只要我拿來做神經網路的訓練
A, B dataset 加起來總共約一百萬張小於100KB的圖片
在數百個epoch(輪)的讀取之後
第一次是五百出頭 第二次是七百出頭
程式就會因為資料IO error停下來
查了之後發現有兩三張圖片變成0KB 導致讀取失敗

由於當下就排除問題了,所以沒有截到圖

請問大家認為這會是什麼問題呢?


-----
Sent from JPTT on my Asus ASUS_Z01KDA.

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.192.12
※ 文章代碼(AID): #1S9BovFx (Storage_Zone)
※ 文章網址: https://www.ptt.cc/bbs/Storage_Zone/M.1545911481.A.3FB.html
maniaque    : "爆了" 就這麼簡單......1F 12/27 19:57
maniaque    : 你有加散熱片或散熱風扇幫助散熱嗎???
maniaque    : 建議你試裝這些散熱元件(尤其主動的風扇),再跑看看
都沒有,沒有給他任何被動或主動散熱
如果確定是過熱就去找個的風扇給他好了

jeff40108   : 你這種用法必死的,因為nand區塊有讀寫次數限制4F 12/27 21:41
jeff40108   : 你這樣操沒有給他搬移做wear leveling的機會
jeff40108   : 建議改用RAM disk
我是一次寫入然後數百次讀取
而且一個檔案一個小時內不會被讀到第二次
不確定這樣的wear有沒有太大
winiel559   : NAND有讀的次數限制嗎 都讀取的讀到死去不太合理= =7F 12/27 22:15
我查到的是read disturb
在約莫數百到數千次讀寫之後
NAND block內的資料會跑掉,但是cell不會死
很像是我的狀況
硬碟沒死,被讀取的資料壞了

ilanese     : RAM disk,終保的ram……8F 12/27 22:23
是推薦用RamDisk取代嗎
※ 編輯: kaltu (42.73.29.6), 12/27/2018 22:54:31
XXXXHAY     : DDR3現在好便宜的,弄個二手Xeon插滿128G也不用多少9F 12/27 23:35
我的CPU是9700K QQ
XXXXHAY     : 錢效能還遠大於SATA10F 12/27 23:35
XXXXHAY     : 啊歹勢原來你買的是PCIe的
XXXXHAY     : 啊不然買PCIe的RAM轉卡也可以,但是不知道現在還有
XXXXHAY     : 沒有
這種卡很難買吧
lagya       : 阿就它沒寫read disturb 的演算法 當然讀多次就爆了14F 12/28 02:54
這顆的主控晶片沒有解這個issue嗎?
我看wiki是很罕見的狀況才會沒寫read disturb
※ 編輯: kaltu (42.76.28.143), 12/28/2018 07:57:34
linlongchau : 數千次讀取都沒差,512G SSD沒有那麼爛,有留意溫度15F 12/28 09:12
linlongchau : S.M.A.R.T圖...你這片還是新的,冠元的品質有那麼爛?
linlongchau : 讀的次數那麼多,Cache開大一些會有用
MAXX228     : 換900(5)P 試試18F 12/28 10:52
maniaque    : 我個人是認為先改善散熱(直接土砲電風扇吹SSD)19F 12/28 11:45
maniaque    : 若有改善,那表示問題在此,你再實質強化散熱
maniaque    : 買散熱片,甚至鎖上小風扇

我目前也懷疑是過熱
因為訓練神經網路的時候GPU會滿載
搭配的GPU並非公版渦輪扇型號
所以造成機箱高熱,可能會影響到SSD

想請教一下這種機箱內高溫的狀況散熱方案配置的訣竅

ilanese     : 8G算1000塊,你大量買128GB,16000元就行了,終保RA22F 12/28 13:03
ilanese     : M disk。
ilanese     : 軟體推薦primo ramisk。
ilanese     : 這種大概是4支32GB比較好,
ilanese     : 更正:primo ramdisk
photoless   : 8g 1000??????27F 12/28 13:33
sma1033     : 再過一陣真的有可能,目前看到新品8G最低到120028F 12/28 13:45
photoless   : 正常大牌至少2400 少說160029F 12/28 13:51
ilanese     : 又是農曆年前宰羊期,短時間內也降不下來了。30F 12/28 13:51
ilanese     : 虛擬貨幣暴跌,要便宜的話,去二手市場撿看看礦機拔
ilanese     : 下來的殺肉貨。
ilanese     : 原PO的MB應該也沒有那麼多的記憶體模組插槽可用,大
ilanese     : 概只能選32GB四支這種組合了,這樣子就貴了。
ilanese     :  
ilanese     : RAM的市場沒那麼好了,虛擬貨幣暴跌,挖礦的話,連
ilanese     : 電費可能都不夠,新礦機沒人組,舊礦機又丟到市場賣
ilanese     : ,供給遠大於需求的話,勢必就是跌價了,只是亞洲市
ilanese     : 場就是農曆年前不跌,農曆年後才跌。
TaiwanisChin: 試試看別家的SSD,說不定是別的問題40F 12/28 17:00
※ 編輯: kaltu (42.76.28.143), 12/28/2018 18:01:42

--
※ 看板: terievv 文章推薦值: 0 目前人氣: 0 累積人氣: 124 
分享網址:
r)回覆 e)編輯 d)刪除 M)不收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇