看板 PC_Shopping
作者 EEQQ102938 (EEQQ)
標題 [菜單] 200k 實驗室深度學習主機
時間 Thu Mar 30 17:33:34 2023


趕畢業跑深度學習實驗,但目前工作站太爛,所以跟老師拿一筆錢升級工作站。
原本想鎖定兩張3090或兩張4090進行升級的,但廠商說他們沒有3090了,所以開了一張有兩
個4090的單,但有點超過預算,想請各位幫忙健檢一下,看看哪裡可以換@@,還沒口試就花
教授一堆錢,很抖QQ


已買/未買/已付訂金(元):未買

預算/用途:200K 實驗室深度學習機

CPU (中央處理器):Intel i9-13900
MB      (主機板):華碩Z790-A GAMING WIFI主機板
RAM     (記憶體):芝奇幻鋒 D5-5600 32G * 2
VGA     (顯示卡):技嘉GeForce RTX4090 GAMING OC * 2
Cooler  (散熱器):Noctua NF-A14 PWM 14cm風扇 * 4
SSD   (固態硬碟):Samsung 980 PRO 2TB NVMe M.2
PSU (電源供應器):全漢HYDRO PTM PRO 1200W ATX3.0 * 2
CHASSIS   (機殼):Phanteks ENTHOO ELITE電腦機殼
水冷:NZXT Kraken X73 水冷散熱器

其它      (自填):
總價 (未稅/含稅):235000 (含稅)

另外想請問,聽說40系列沒有nvlink了,那這樣我是不是不能把兩張卡合在訓練模型?我主
要用tensorflow的package,tf的strategy可以把兩張4090的ram合在一起看嗎?如果不行的
話是不是買一張4090就好了...


--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 136.23.35.40 (日本)
※ 作者: EEQQ102938 2023-03-30 17:33:34
※ 文章代碼(AID): #1a9LTm7n (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1680168816.A.1F1.html
dos01: 不用砍啦 反正教授的錢也是花學校的錢 學校的錢也是花研究計畫預算 研究計畫的預算又來自繳稅的錢 然後你又遲早會繳稅 想想這其實也是花你自己的錢 直接買了啦!1F 03/30 17:35
encorek22554: 多卡訓練一直都跟nvlink無關吧4F 03/30 17:37
EEQQ102938: 如果batch大一點或模型大一點的話,一張卡24G可能不夠用…5F 03/30 17:39
Zenryaku: 實驗室不直接找廠商弄嗎…7F 03/30 17:40
sugoyeee: 板不需要a有更好的選擇 要拿d5就拿超過6000的8F 03/30 17:40
Zenryaku: 以後畢業了還被叩回去修電腦9F 03/30 17:40
EEQQ102938: 原文有說這是廠商報的單喔!10F 03/30 17:41
Zenryaku: 哦沒看到 抱歉
先把三星的ssd換掉 爛廠商問題一堆11F 03/30 17:42
rewisyoung: 20萬預算 有沒有考慮用GA100啊13F 03/30 17:42
這會爆預算吧…
Zenryaku: 電源不用兩台1200吧 哪吃那麼多電需要2400w
風扇可以不用買貓頭鷹的,而且這顆不是A12*25沒特別強14F 03/30 17:43
※ 編輯: EEQQ102938 (223.136.228.193 臺灣), 03/30/2023 17:47:22
Zenryaku: 然後記憶體也不用買芝奇的,芝奇也是特別貴的那種,時脈至少買到600016F 03/30 17:48
blacknate: 放個高速的HDD吧,SSD掛掉模型找不回來會嘔死
深度學習吃SSD的程度很可怕的,尤其是YOLO 那一類圖像的吃很重
記得查一下你用的框架版本,萬一硬體太新不支援就哭了18F 03/30 18:10
cmcer: 怕掉資料就組raid吧22F 03/30 18:15
※ 編輯: EEQQ102938 (223.136.228.193 臺灣), 03/30/2023 18:16:58
blacknate: 樓上說得對,組raid,不然你光是保內把ssd操壞就有得受23F 03/30 18:17
johnjohnlin: 學校破10萬不是要公開招標嗎
然後雙卡請買HEDT以上25F 03/30 18:20
mrme945: 這張主板不妥吧,只有第一槽是x16,下面兩槽都只有x4頻寬而已27F 03/30 18:23
mayolane: 有破10萬要招標這回事嗎,儀器隨便幾十萬沒有聽說過招標欸29F 03/30 18:26
mrme945: 主板直接用W680的吧,華碩那張也不貴,只是我也不知道這兩槽那麼近能不能裝兩張4090就是了,另外記憶體看能不能找到ECC的,跑起來比較穩,比速度重要多了31F 03/30 18:31
nasa930022: 實驗室經費自己買的不用招標吧34F 03/30 18:31
remia81: 建議先去TWCC測試一下你的訓練多卡到底能不能用
tf多卡訓練很謎35F 03/30 18:42
TingLinDick: 我也是配置兩張4090,但機殼因為怕散熱有問題,所以是用礦機架加pcie延長線讓兩張顯卡有空間,兩張同時跑的話會蠻熱的,所以機殼的散熱最好問一下廠商可不可行37F 03/30 18:46
兩張4090可以share vram嗎?
bear1414: 主板不行 風冷佔3點多槽 你第二張卡只剩PCIe 3.0 x1
除非你用延長線
速度建議至少要有PCIE3.0 X8 (=PCIE4.0 X4)
另外你要跑的是哪個領域 CPU 13700系列就非常足夠了
訓練若單卡VRAM夠 多卡可以同時跑不同超參數的
提高效率
另外 你這台要放實驗室還是24小時冷氣server room?41F 03/30 18:47
會放在24hr 冷氣的server room喔
yenchieh1102: 實驗室來張A6000啊48F 03/30 19:16
bear1414: 現在A6000不好  要6000 ADA才夠快49F 03/30 19:16
※ 編輯: EEQQ102938 (223.136.228.193 臺灣), 03/30/2023 19:17:51
※ 編輯: EEQQ102938 (223.136.228.193 臺灣), 03/30/2023 19:18:11
EEQQ102938: 看下來目前應該是換主板,儲存從SSD換HDD,Ram換頻率高一點的嗎@@50F 03/30 19:19
mesmerising: 實驗室拿一堆信仰外觀稅的零件好難懂52F 03/30 19:27
blacknate: ML重點是ram大才能做cache,頻率其實沒那麼重要53F 03/30 19:30
mrme945: 不是要你SSD換HDD,是要你多準備空間存放模型的,SSD壞掉還有得救,SSD還是要有,只是換別家的吧,980Pro還有0E問54F 03/30 19:36
fuct: 為了你的畢業花那麼多錢喔,真好57F 03/30 19:36
GooglePixel: 怎麼不直接買server 效能非家用級能比58F 03/30 20:01
dos01: SSD你還是要有 HDD只是多放備用的59F 03/30 20:03
GooglePixel: 當我沒說 光一個data center等級GPU就爆預算==60F 03/30 20:05
Snowman: 10萬以上是可以選擇公開招標 100萬以上才是強制公開招標61F 03/30 20:07
johnjohnlin: 可是寫限制招標文件很麻煩62F 03/30 20:30
TingLinDick: 如果訓練需要較大的VRAM的話,我是用pytorch DDP去處理,TF的沒用過63F 03/30 20:44
Aquarius126: 之前弄兩張3090塞機殼裡面熱到哭 只好弄礦架在外面跑qq65F 03/30 20:45
fuless: 怎麼看都像台信仰機 哪間學校碩67F 03/30 20:58
cor1os: 信仰?零件沒有AMD哪來的信仰(笑)68F 03/30 22:25
HotDogCC: 如果你今年確定畢業,買個pcie4的SSD用完就滾了,壞了給學弟負責(x69F 03/30 22:42
kidd232: 這台太羊了71F 03/31 00:17
jahnson: 實驗室禁用冷筍72F 03/31 00:34
GLTyang: 原來實驗室可以自己組電腦   我以為都會想要用工業電腦XDDD73F 03/31 10:55
oppoR20: 實驗室可以用自組啊 看過不少台了
不過通常都是找廠商報價 讓她幫你買零件
讓她幫你組 最後有問題還是可以找廠商75F 03/31 11:54
dc0244: 記憶體拿6000以上的比較有意義t-create 6000 32G*2雙通道這種的不貴78F 03/31 13:08

--