顯示廣告
隱藏 ✕
※ 本文為 terievv 轉寄自 ptt.cc 更新時間: 2018-12-30 11:25:51
看板 Storage_Zone
作者 kaltu (ka)
標題 [請益] SSD部份檔案經過強讀取之後變成0KB
時間 Thu Dec 27 19:51:18 2018




我買的硬碟是冠元的TP6500 512GB
http://i.imgur.com/DqJgmcq.jpg
[圖]
 

一切使用完全正常

但是只要我拿來做神經網路的訓練
A, B dataset 加起來總共約一百萬張小於100KB的圖片
在數百個epoch(輪)的讀取之後
第一次是五百出頭 第二次是七百出頭
程式就會因為資料IO error停下來
查了之後發現有兩三張圖片變成0KB 導致讀取失敗

由於當下就排除問題了,所以沒有截到圖

請問大家認為這會是什麼問題呢?


-----
Sent from JPTT on my Asus ASUS_Z01KDA.

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.192.12
※ 文章代碼(AID): #1S9BovFx (Storage_Zone)
※ 文章網址: https://www.ptt.cc/bbs/Storage_Zone/M.1545911481.A.3FB.html
maniaque    : "爆了" 就這麼簡單......1F 12/27 19:57
maniaque    : 你有加散熱片或散熱風扇幫助散熱嗎???
maniaque    : 建議你試裝這些散熱元件(尤其主動的風扇),再跑看看
都沒有,沒有給他任何被動或主動散熱
如果確定是過熱就去找個的風扇給他好了

jeff40108   : 你這種用法必死的,因為nand區塊有讀寫次數限制4F 12/27 21:41
jeff40108   : 你這樣操沒有給他搬移做wear leveling的機會
jeff40108   : 建議改用RAM disk
我是一次寫入然後數百次讀取
而且一個檔案一個小時內不會被讀到第二次
不確定這樣的wear有沒有太大
winiel559   : NAND有讀的次數限制嗎 都讀取的讀到死去不太合理= =7F 12/27 22:15
我查到的是read disturb
在約莫數百到數千次讀寫之後
NAND block內的資料會跑掉,但是cell不會死
很像是我的狀況
硬碟沒死,被讀取的資料壞了

ilanese     : RAM disk,終保的ram……8F 12/27 22:23
是推薦用RamDisk取代嗎
※ 編輯: kaltu (42.73.29.6), 12/27/2018 22:54:31
XXXXHAY     : DDR3現在好便宜的,弄個二手Xeon插滿128G也不用多少9F 12/27 23:35
我的CPU是9700K QQ
XXXXHAY     : 錢效能還遠大於SATA10F 12/27 23:35
XXXXHAY     : 啊歹勢原來你買的是PCIe的
XXXXHAY     : 啊不然買PCIe的RAM轉卡也可以,但是不知道現在還有
XXXXHAY     : 沒有
這種卡很難買吧
lagya       : 阿就它沒寫read disturb 的演算法 當然讀多次就爆了14F 12/28 02:54
這顆的主控晶片沒有解這個issue嗎?
我看wiki是很罕見的狀況才會沒寫read disturb
※ 編輯: kaltu (42.76.28.143), 12/28/2018 07:57:34
linlongchau : 數千次讀取都沒差,512G SSD沒有那麼爛,有留意溫度15F 12/28 09:12
linlongchau : S.M.A.R.T圖...你這片還是新的,冠元的品質有那麼爛?
linlongchau : 讀的次數那麼多,Cache開大一些會有用
MAXX228     : 換900(5)P 試試18F 12/28 10:52
maniaque    : 我個人是認為先改善散熱(直接土砲電風扇吹SSD)19F 12/28 11:45
maniaque    : 若有改善,那表示問題在此,你再實質強化散熱
maniaque    : 買散熱片,甚至鎖上小風扇

我目前也懷疑是過熱
因為訓練神經網路的時候GPU會滿載
搭配的GPU並非公版渦輪扇型號
所以造成機箱高熱,可能會影響到SSD

想請教一下這種機箱內高溫的狀況散熱方案配置的訣竅

ilanese     : 8G算1000塊,你大量買128GB,16000元就行了,終保RA22F 12/28 13:03
ilanese     : M disk。
ilanese     : 軟體推薦primo ramisk。
ilanese     : 這種大概是4支32GB比較好,
ilanese     : 更正:primo ramdisk
photoless   : 8g 1000??????27F 12/28 13:33
sma1033     : 再過一陣真的有可能,目前看到新品8G最低到120028F 12/28 13:45
photoless   : 正常大牌至少2400 少說160029F 12/28 13:51
ilanese     : 又是農曆年前宰羊期,短時間內也降不下來了。30F 12/28 13:51
ilanese     : 虛擬貨幣暴跌,要便宜的話,去二手市場撿看看礦機拔
ilanese     : 下來的殺肉貨。
ilanese     : 原PO的MB應該也沒有那麼多的記憶體模組插槽可用,大
ilanese     : 概只能選32GB四支這種組合了,這樣子就貴了。
ilanese     :  
ilanese     : RAM的市場沒那麼好了,虛擬貨幣暴跌,挖礦的話,連
ilanese     : 電費可能都不夠,新礦機沒人組,舊礦機又丟到市場賣
ilanese     : ,供給遠大於需求的話,勢必就是跌價了,只是亞洲市
ilanese     : 場就是農曆年前不跌,農曆年後才跌。
TaiwanisChin: 試試看別家的SSD,說不定是別的問題40F 12/28 17:00
※ 編輯: kaltu (42.76.28.143), 12/28/2018 18:01:42

--
※ 看板: terievv 文章推薦值: 0 目前人氣: 0 累積人氣: 217 
作者 kaltu 的最新發文:
  • +127 Re: [討論] 多少人看到翻譯那個機掰態度就不想進場了 - movie 板
    作者: 74.105.63.214 (美國) 2022-04-25 10:41:07
    他的FB文揭露了很多問題 首先文章使用的語言就不通順導致極難閱讀 代表這個人平時對文字的掌握度和使用習慣並不是以大眾溝通和使人理解為導向的 第二他是停止翻譯工作十數年,臨時被邀請來兼職電影翻譯的,這 …
    237F 127推
  • +55 [聽錯] 你在聽的日本女rapper是誰? - StupidClown 板
    作者: 74.105.63.214 (美國) 2022-03-28 11:33:07
    旁邊滑手機的家人 「你剛才在聽的那個rapper是誰? 我 『蛤? 「她剛剛rap唱什麼 私にはここにいる限り 什麼 ずっとこれから永遠に 的那個啊 『…… 「聽起來還不錯 滿有意境的 『……我在看熊 …
    111F 57推 2噓
  • +16 [眼殘] 5折的話就不會錯了 - StupidClown 板
    作者: 122.117.41.14 (台灣) 2021-10-20 22:46:50
    到了刷卡頁面才發現價格不對 差一點被騙 Sent from JPTT on my Google Pixel 3a XL.
    24F 16推
  • +11 Re: [新聞] 高雄妙齡女隔離14天出關揪眾嗑鍋 吃完確診武漢肺炎 - Gossiping 板
    作者: 122.121.16.40 (台灣) 2020-12-23 23:48:07
    這是我回國完成14天檢疫後最後一封簡訊 規定一直都是這樣 前面有人貼條文了我就不再拍我自己的通知書 反正總共就是21天的管理 前14天非常硬, 有跟家人同住的話是連自己的房間門都不能出 每天紀錄兩次體 …
    17F 13推 2噓
  • +20 Re: [新聞] Google 首度揭曉下一代 Android 功能! - MobileComm 板
    作者: 100.8.243.226 (美國) 2020-09-29 17:32:34
    所以是更開放第三方App商店競爭 同時緊縮自己商城內的搭便車App 我自己的解讀是 Google 想要重新定義封閉平台的意義 把各個作業系統平台競爭的層次提高到各個App商店層次的競爭 基本上就是開手 …
    33F 21推 1噓
點此顯示更多發文記錄
分享網址: 複製 已複製
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇