作者 remia81
標題 [心得] 從0開始養ROCM深度學習機
時間 Wed Jan 17 09:55:17 2024


趁熱鬧來發廢文
大約ROCM 3的時候就有這個想法可惜一直買不到便宜的Vega來玩,
之前有幸收到版主的二手Vega56終於可以來實做

養機用品:
1. i7 6700K @4.5G + Z170 + 32GB RAM
2. 系統碟建議>128GB SSD不然裝完就沒空間
3. Ubuntu 22.04.3 LTS 安裝隨身碟用rufus做好
4. Vega56不能亡
5. 650W以上電源供應器 + 堪用機殼

全部裝好然後灌系統應該很簡單直接跳過

選擇要裝的ROCM版本,上面只有VII不過都是GCN不要分那麼細應該還是可以用
https://rocm.docs.amd.com/en/docs-5.7.1/release/gpu_os_support.html

 

最後是裝5.7.1但是懶得重截圖
https://rocm.docs.amd.com/en/docs-5.7.1/deploy/linux/index.html

 
https://i.imgur.com/LaDETe3.png
[圖]

eader還要加入兩個群組
https://i.imgur.com/hLmBCR4.png
[圖]
雖然教學這樣寫在後續測試過後還是退render群組,
深度學習用不到gpu render就不增加顯卡負擔,還是其實可以指定intel內顯我不會而已?

有兩種安裝方法用amdgpu-install安裝看起來好像比較簡單,我偏好是載deb檔案手動安裝
https://rocm.docs.amd.com/en/docs-5.7.1/deploy/linux/installer/install.html

 
https://i.imgur.com/BbdB0Ur.png
[圖]

安裝ROCM
sudo amdgpu-install --usecase=rocm
要確定安裝成功就輸入rocm-smi應該會出現基本資訊
https://i.imgur.com/TyX6Btf.png
[圖]

到這邊已經把ROCM搞定,後續用docker環境需要注意啟動指令跟N卡不一樣
docker run -it --device=/dev/kfd --device=/dev/dri --group-add video <container>

不喜歡docker也可以直接找到喜歡的深度學習工具像是最近都在用pytorch就在這邊
https://pytorch.org/get-started/locally/
Start Locally | PyTorch
[圖]
Start Locally ...

 
https://i.imgur.com/ucjBF6D.png
[圖]

加碼做一下性能比較
雖然測試電腦的配備都不一樣,有確認過CPU瓶頸跟GPU瓶頸在哪裡還是可以加減參考
測試用程式就是最近在處理的東西只跑預測,除了有關GPU的套件之外都相同
資料都已經讀進RAM不會讓硬碟速度拖累

本機 Vega56
理論FP32 10.54 TFLOPS
測試速度 2.85 iter/s
https://i.imgur.com/8B4jGbN.png
[圖]
https://i.imgur.com/8uNdKwb.png
[圖]

第一台win10 22H2 i7 7700K @4.6G + 1080Ti
理論FP32 11.34 TFLOPS
測試速度 3.11 iter/s
https://i.imgur.com/Rn5DJZV.png
[圖]

第二台Ubuntu 20.04.6 LTS 9700K @4.8G + RTX Titan
理論FP32 16.31 TFLOPS
測試速度 3.81 iter/s
頂到CPU瓶頸所以都是雙開,效率還要乘以1.5 = 5.71
https://i.imgur.com/melAvlp.png
[圖]

第三台win10 22H2 i7 6700 + 1060 6GB
理論FP32 4.375TFLOPS
測試速度 1.83 iter/s
https://i.imgur.com/aZvIAv2.png
[圖]

版上還沒看到有相關的文章應該發這邊會有人看吧…

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.9.42.254 (臺灣)
※ 作者: remia81 2024-01-17 09:55:17
※ 文章代碼(AID): #1bfpE89G (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1705456520.A.250.html
eXcFerGodSt: 最後一張圖是什麼 top 啊1F 1.162.213.57 台灣 01/17 10:09
remia81: nvtop2F 39.9.42.254 台灣 01/17 10:17
jason90814: htop 詳細版的 top
欸仔細看是gpu的 不是htop3F 180.217.226.180 台灣 01/17 10:18

※ 編輯: remia81 (39.9.128.50 臺灣), 01/17/2024 11:27:11
ZzoozZ: MIOpen已經支援windows
期待新版ROCm5F 1.200.33.169 台灣 01/17 11:47
johnpisces2: 推7F 49.215.27.148 台灣 01/17 12:03
ludashi: 養這要幹嘛?8F 39.14.8.134 台灣 01/17 12:27
aasssdddd: rocm到底消費級顯示卡那些有支援啊?9F 49.218.97.187 台灣 01/17 12:39
※ 編輯: remia81 (39.9.128.50 臺灣), 01/17/2024 12:40:52
Chilloutt: Rocm 有支援apu 嗎?10F 114.36.4.64 台灣 01/17 12:41
Chikei: 消費級目前為止沒有正式支援,哪些架構可以硬上請自己翻code裡的架構code name
https://github.com/ROCm/ROCm/issues/
1714#issuecomment-112832714311F 211.72.92.133 台灣 01/17 12:55
Issues ·  ROCm/ROCm ·  GitHub
[圖]
AMD ROCm™  Software - GitHub Home. Contribute to ROCm/ROCm development by creating an account on GitHub. ...

 

--
作者 remia81 的最新發文: