看板 PC_Shopping作者 EEQQ102938 (EEQQ)標題 [菜單] 200k 實驗室深度學習主機時間 Thu Mar 30 17:33:34 2023
趕畢業跑深度學習實驗,但目前工作站太爛,所以跟老師拿一筆錢升級工作站。
原本想鎖定兩張3090或兩張4090進行升級的,但廠商說他們沒有3090了,所以開了一張有兩
個4090的單,但有點超過預算,想請各位幫忙健檢一下,看看哪裡可以換@@,還沒口試就花
教授一堆錢,很抖QQ
已買/未買/已付訂金(元):未買
預算/用途:200K 實驗室深度學習機
CPU (中央處理器):Intel i9-13900
MB (主機板):華碩Z790-A GAMING WIFI主機板
RAM (記憶體):芝奇幻鋒 D5-5600 32G * 2
VGA (顯示卡):技嘉GeForce RTX4090 GAMING OC * 2
Cooler (散熱器):Noctua NF-A14 PWM 14cm風扇 * 4
SSD (固態硬碟):Samsung 980 PRO 2TB NVMe M.2
PSU (電源供應器):全漢HYDRO PTM PRO 1200W ATX3.0 * 2
CHASSIS (機殼):Phanteks ENTHOO ELITE電腦機殼
水冷:NZXT Kraken X73 水冷散熱器
其它 (自填):
總價 (未稅/含稅):235000 (含稅)
另外想請問,聽說40系列沒有nvlink了,那這樣我是不是不能把兩張卡合在訓練模型?我主
要用tensorflow的package,tf的strategy可以把兩張4090的ram合在一起看嗎?如果不行的
話是不是買一張4090就好了...
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 136.23.35.40 (日本)
※ 作者: EEQQ102938 2023-03-30 17:33:34
※ 文章代碼(AID): #1a9LTm7n (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1680168816.A.1F1.html
推 dos01: 不用砍啦 反正教授的錢也是花學校的錢 學校的錢也是花研究計畫預算 研究計畫的預算又來自繳稅的錢 然後你又遲早會繳稅 想想這其實也是花你自己的錢 直接買了啦!1F 03/30 17:35
→ EEQQ102938: 如果batch大一點或模型大一點的話,一張卡24G可能不夠用…5F 03/30 17:39
推 sugoyeee: 板不需要a有更好的選擇 要拿d5就拿超過6000的8F 03/30 17:40
→ Zenryaku: 哦沒看到 抱歉
先把三星的ssd換掉 爛廠商問題一堆11F 03/30 17:42
這會爆預算吧…
→ Zenryaku: 電源不用兩台1200吧 哪吃那麼多電需要2400w
風扇可以不用買貓頭鷹的,而且這顆不是A12*25沒特別強14F 03/30 17:43
※ 編輯: EEQQ102938 (223.136.228.193 臺灣), 03/30/2023 17:47:22
→ Zenryaku: 然後記憶體也不用買芝奇的,芝奇也是特別貴的那種,時脈至少買到600016F 03/30 17:48
推 blacknate: 放個高速的HDD吧,SSD掛掉模型找不回來會嘔死
深度學習吃SSD的程度很可怕的,尤其是YOLO 那一類圖像的吃很重
記得查一下你用的框架版本,萬一硬體太新不支援就哭了18F 03/30 18:10
推 cmcer: 怕掉資料就組raid吧22F 03/30 18:15
※ 編輯: EEQQ102938 (223.136.228.193 臺灣), 03/30/2023 18:16:58
推 blacknate: 樓上說得對,組raid,不然你光是保內把ssd操壞就有得受了23F 03/30 18:17
推 johnjohnlin: 學校破10萬不是要公開招標嗎
然後雙卡請買HEDT以上25F 03/30 18:20
推 mrme945: 這張主板不妥吧,只有第一槽是x16,下面兩槽都只有x4頻寬而已27F 03/30 18:23
→ mayolane: 有破10萬要招標這回事嗎,儀器隨便幾十萬沒有聽說過招標欸29F 03/30 18:26
推 mrme945: 主板直接用W680的吧,華碩那張也不貴,只是我也不知道這兩槽那麼近能不能裝兩張4090就是了,另外記憶體看能不能找到ECC的,跑起來比較穩,比速度重要多了31F 03/30 18:31
推 remia81: 建議先去TWCC測試一下你的訓練多卡到底能不能用
tf多卡訓練很謎35F 03/30 18:42
推 TingLinDick: 我也是配置兩張4090,但機殼因為怕散熱有問題,所以是用礦機架加pcie延長線讓兩張顯卡有空間,兩張同時跑的話會蠻熱的,所以機殼的散熱最好問一下廠商可不可行37F 03/30 18:46
兩張4090可以share vram嗎?
推 bear1414: 主板不行 風冷佔3點多槽 你第二張卡只剩PCIe 3.0 x1
除非你用延長線
速度建議至少要有PCIE3.0 X8 (=PCIE4.0 X4)
另外你要跑的是哪個領域 CPU 13700系列就非常足夠了
訓練若單卡VRAM夠 多卡可以同時跑不同超參數的
提高效率
另外 你這台要放實驗室還是24小時冷氣server room?41F 03/30 18:47
會放在24hr 冷氣的server room喔
→ bear1414: 現在A6000不好 要6000 ADA才夠快49F 03/30 19:16
※ 編輯: EEQQ102938 (223.136.228.193 臺灣), 03/30/2023 19:17:51
※ 編輯: EEQQ102938 (223.136.228.193 臺灣), 03/30/2023 19:18:11
→ EEQQ102938: 看下來目前應該是換主板,儲存從SSD換HDD,Ram換頻率高一點的嗎@@50F 03/30 19:19
推 blacknate: ML重點是ram大才能做cache,頻率其實沒那麼重要53F 03/30 19:30
推 mrme945: 不是要你SSD換HDD,是要你多準備空間存放模型的,SSD壞掉還有得救,SSD還是要有,只是換別家的吧,980Pro還有0E問題54F 03/30 19:36
推 fuct: 為了你的畢業花那麼多錢喔,真好57F 03/30 19:36
→ dos01: SSD你還是要有 HDD只是多放備用的59F 03/30 20:03
→ GooglePixel: 當我沒說 光一個data center等級GPU就爆預算==60F 03/30 20:05
推 Snowman: 10萬以上是可以選擇公開招標 100萬以上才是強制公開招標61F 03/30 20:07
推 TingLinDick: 如果訓練需要較大的VRAM的話,我是用pytorch DDP去處理,TF的沒用過63F 03/30 20:44
→ Aquarius126: 之前弄兩張3090塞機殼裡面熱到哭 只好弄礦架在外面跑qq65F 03/30 20:45
推 fuless: 怎麼看都像台信仰機 哪間學校碩67F 03/30 20:58
→ cor1os: 信仰?零件沒有AMD哪來的信仰(笑)68F 03/30 22:25
推 HotDogCC: 如果你今年確定畢業,買個pcie4的SSD用完就滾了,壞了給學弟負責(x69F 03/30 22:42
推 GLTyang: 原來實驗室可以自己組電腦 我以為都會想要用工業電腦XDDD73F 03/31 10:55
推 oppoR20: 實驗室可以用自組啊 看過不少台了
不過通常都是找廠商報價 讓她幫你買零件
讓她幫你組 最後有問題還是可以找廠商75F 03/31 11:54
推 dc0244: 記憶體拿6000以上的比較有意義t-create 6000 32G*2雙通道這種的不貴78F 03/31 13:08
--