※ 本文轉寄自 ptt.cc 更新時間: 2025-10-13 11:57:22
看板 PC_Shopping
作者 標題 [心得] RX9070XT 架構ROCm7 SD WebUI 流程測試
時間 Sun Oct 12 17:10:16 2025
這是繼上篇的文章的優化
我花了一點時間
測試如何在Win11系統環境下
讓9070XT跑最新的ROCm7
主要參考SD.Next網站上的說明
https://vladmandic.github.io/sdnext-docs/ZLUDA/
ZLUDA - SD.Next Documentation
SD.Next Documentation ...
SD.Next Documentation ...
使用ROCm團隊架構的PyTorch安裝包
安裝方式參考
https://github.com/ROCm/TheRock
GitHub - ROCm/TheRock: The HIP Environment and ROCm Kit - A lightweight open source build system for HIP and ROCm The HIP Environment and ROCm Kit - A lightweight open source build system for HIP and ROCm - ROCm/TheRock ...
ComfyUI架構ROCm7可以參考下面網址教學
https://xoghfwdske.feishu.cn/docx/J2TmdPNOpoXWwBxOU57cSUjJnRU
架構ROCm7 Stable Diffusion WebUI SD.Next 簡易流程
安裝AMD PyTorch on Windows 測試驅動
https://www.amd.com/en/resources/sup...U-WINDOWS-PYTORCH-PREVIEW.html
安裝AMD HIP SDK 6.4.2
https://www.amd.com/zh-tw/developer/resources/rocm-hub/hip-sdk.html
Git安裝
https://github.com/git-for-windows/git/releases/download/v2.47.1.windows.1/Git-2.47.1-64-bit.exe
Python 3.12.10 安裝
https://www.python.org/ftp/python/3.12.10/python-3.12.10-amd64.exe
https://i.imgur.com/hr83AwA.png
![[圖]](https://i.imgur.com/hr83AwAh.png)
接著開啟Windows PowerShell可以用指令碼執行
桌面工作列上的視窗圖標案右鍵
選擇以系統管理員身分執行 PowerShell
https://i.imgur.com/yw6VzHz.png
![[圖]](https://i.imgur.com/yw6VzHzh.png)
輸入
Set-ExecutionPolicy RemoteSigned
完成後關閉PowerShell
接著開始安裝 Stable Diffusion WebUI SD.Next
準備要安裝的位置新增一個資料夾
我是取名為SD.Next
點進資料夾按右鍵 選擇從終端開啟
呼叫命令提示字元
https://i.imgur.com/JzO58wf.png
![[圖]](https://i.imgur.com/JzO58wfh.png)
依序輸入
git clone https://github.com/vladmandic/sdnext
GitHub - vladmandic/sdnext: SD.Next: All-in-one WebUI for AI generative image and video creation SD.Next: All-in-one WebUI for AI generative image and video creation - vladmandic/sdnext ...
cd sdnext
git switch dev
python -m venv venv
venv\Scripts\Activate
python.exe -m pip install --upgrade pip
AMD RDNA4(RX9070、RX9070XT)系列要安裝ROCm7套件安裝指令如下
pip install --index-url https://d2awnip2yjpvqn.cloudfront.net/v2/gfx120X-all/
torch torchvision torchaudio
這個指令是是直接安裝伺服器最新的套件包
AMD RDNA3(RX7900、RX7800、RX7700、RX7600)系列要安裝ROCm7套件安裝指令如下
pip install --index-url https://d2awnip2yjpvqn.cloudfront.net/v2/gfx110X-dgpu/ torch torchvision torchaudio
跑完後
確認ROCm7是否正確架構
輸入
rocm-sdk test
看到OK就可以關掉PowerShell
接著在sdnext資料夾下找到webui.bat
按右鍵>顯示其他選項>建立捷徑
https://i.imgur.com/I3nCODQ.png
![[圖]](https://i.imgur.com/I3nCODQh.png)
建立的捷徑按右鍵>內容
把連結後面加入 --use-rocm --autolaunch
https://i.imgur.com/D286MG2.png
![[圖]](https://i.imgur.com/D286MG2h.png)
以後啟動就開這個捷徑
點即開啟後會跑架構SD.Next的後續動作
跑完會跳出SD.Next WebUI 網頁操作介面
我重複安裝測試好幾次應該沒問題
有問題請自己DEBUG
成功的人恭喜你
正式踏入修練AI煉金術的其中一員
主要模型會放在\sdnext\models\Stable-diffusion下面
這裡使用wai-nsfw-illustrious-sdxl動漫模型來測試
https://civitai.com/models/827184/wai-nsfw-illustrious-sdxl
WAI-NSFW-illustrious-SDXL - v15.0 | Illustrious Checkpoint | Civitai If you want to use more my checkpoint online generation, please visit here. WAI-NSFW-illustrious-SDXL - Sea... ...
動漫類提示詞我都抄這裡的
https://seesaawiki.jp/nai_ch/
NovelAI 5ch Wiki
画像生成AIの情報を纏めるWikiです。 ...
画像生成AIの情報を纏めるWikiです。 ...
舉例來個生成個天之罩杯
在中世紀旅館房間躺在床上
https://i.imgur.com/Hi3nSOG.png
![[圖]](https://i.imgur.com/Hi3nSOGh.png)
用上ROCm7 生成一張圖片1024x1024+RealESRGAN_x4plus_anime_6B 放大1.5倍
只需要7s的時間 如果不升頻5s左右出圖
沒想到效率提升這麼多...
https://i.imgur.com/FIxkZch.png
![[圖]](https://i.imgur.com/FIxkZchh.png)
https://i.imgur.com/vO8XVHH.jpeg
![[圖]](https://i.imgur.com/vO8XVHHh.jpeg)
https://i.imgur.com/wDyjWpb.jpeg
![[圖]](https://i.imgur.com/wDyjWpbh.jpeg)
https://i.imgur.com/hC7oEBT.jpeg
![[圖]](https://i.imgur.com/hC7oEBTh.jpeg)
這就是賽博時代的煉金術
世界的真理之門
追加設定
現在A卡問題點是VAE解碼器很容易爆顯存
我有找到解VAE卡頓的方法
sdnext根目錄下找到webui.py這個檔案
按右鍵在記事本中編輯
加入一段參數
import torch
torch.backends.cudnn.enabled = False
像這樣
https://i.imgur.com/8DwcfvT.png
![[圖]](https://i.imgur.com/8DwcfvTh.png)
存檔關閉就好
ComfyUI則是修改main.py這個檔案
我想應該是cudnn這個功能是N卡在用的
ROCm現狀是走兼容CUDA
這功能關閉後就完全不卡
任意切換解析度也是
啟動測試
https://i.imgur.com/KSvHugd.png
![[圖]](https://i.imgur.com/KSvHugdh.png)
算20步縮短到只要4s
算30步縮短到只要6s
https://i.imgur.com/s41Rpx5.png
![[圖]](https://i.imgur.com/s41Rpx5h.png)
https://i.imgur.com/FTe2Ga6.png
![[圖]](https://i.imgur.com/FTe2Ga6h.png)
AMD官方正式支持windows系統的ROCm7應該會在10月啦
9070系列應該要起飛了= =
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 125.229.59.186 (臺灣)
※ 作者: trfmk1 2025-10-12 17:10:16
※ 文章代碼(AID): #1ewt1yah (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1760260220.A.92B.html
※ 編輯: trfmk1 (125.229.59.186 臺灣), 10/12/2025 17:12:24
※ 編輯: trfmk1 (125.229.59.186 臺灣), 10/12/2025 17:14:16
※ 編輯: trfmk1 (125.229.59.186 臺灣), 10/12/2025 20:10:31
--
※ 編輯: trfmk1 (125.229.59.186 臺灣), 10/12/2025 17:14:16
推 : 感謝分享1F 36.226.204.22 台灣 10/12 17:21
推 : 時代的發展2F 27.51.112.165 台灣 10/12 17:22
推 : 期待A卡在AI應用的發展3F 111.253.128.115 台灣 10/12 17:24
推 : 太強了4F 101.10.237.26 台灣 10/12 17:29
推 : 戰未來5F 36.231.82.151 台灣 10/12 17:50
推 : 1024*1024只要10秒內也太快6F 118.232.109.177 台灣 10/12 17:52
推 : 無yolo修正七秒內出圖其實真的很快7F 39.9.69.56 台灣 10/12 17:58
→ : grok現在很紅的圖轉影片,不知道能不能8F 111.248.25.229 台灣 10/12 18:00
→ : 在本地辦到
→ : 在本地辦到
推 : 可以啊,wan2.x或hunyuan10F 36.236.235.114 台灣 10/12 18:02
→ : wan用A卡跑一樣會在VAE出問題,目前只
→ : 能用CPU處理VAE
→ : wan用A卡跑一樣會在VAE出問題,目前只
→ : 能用CPU處理VAE
推 : 希望能成功打破cuda一家獨大的局面13F 123.192.240.37 台灣 10/12 18:33
推 : 很難啦 現在ai發展很快 很競爭,幾乎每14F 36.239.0.109 台灣 10/12 18:39
→ : 天都有新模型 而且都要cuda 你是開發ai
→ : 的團隊敢把資源挪到其他地方嗎
→ : 天都有新模型 而且都要cuda 你是開發ai
→ : 的團隊敢把資源挪到其他地方嗎
推 : 看有沒有大量出圖的需求吧17F 182.234.98.55 台灣 10/12 18:42
推 : 感謝大大分享,intel顯卡一樣跑幾張就會18F 61.227.221.63 台灣 10/12 19:03
→ : 爆掉,看來雙11還是換張16g顯卡來試試
→ : 爆掉,看來雙11還是換張16g顯卡來試試
推 : 推20F 42.73.96.40 台灣 10/12 19:22
推 : 7900XTX的24G有地方用了21F 1.121.209.95 澳大利亞 10/12 19:30
我有更新文章增加RDNA3安裝rcom7套件的指令推 : 讚讚!22F 27.242.6.156 台灣 10/12 19:42
推 : 好分享,讚讚23F 101.10.223.40 台灣 10/12 19:43
→ : 樂見N卡之外的發展,I卡的AI其實也能用
→ : ,支援度更沒有A卡好,讚讚
※ 編輯: trfmk1 (125.229.59.186 臺灣), 10/12/2025 20:06:56→ : 樂見N卡之外的發展,I卡的AI其實也能用
→ : ,支援度更沒有A卡好,讚讚
※ 編輯: trfmk1 (125.229.59.186 臺灣), 10/12/2025 20:10:31
推 : 推 之後來玩看看26F 36.227.157.186 台灣 10/12 20:16
推 : 前幾個禮拜弄到wan一直爆就沒玩了,等27F 36.239.247.242 台灣 10/12 20:26
→ : 更新,最近倒是在試新的ai 去碼工具,
→ : 總算搞好torch跟使用amd的硬體編碼器
→ : 然後前幾個月llm 的工具總算能在win上
→ : 跑滿了,感覺是都慢慢有在完善ai生態了
→ : 更新,最近倒是在試新的ai 去碼工具,
→ : 總算搞好torch跟使用amd的硬體編碼器
→ : 然後前幾個月llm 的工具總算能在win上
→ : 跑滿了,感覺是都慢慢有在完善ai生態了
推 : 感謝大大分享教學32F 27.247.39.86 台灣 10/12 20:32
![[圖]](https://i.meee.com.tw/EqeQtd7.jpg)
→ : vae爆ram這個問題至少已經半年還沒解掉35F 123.193.242.14 台灣 10/12 20:52
→ : ,真的不行
→ : ,真的不行
→ : VAE用分塊就不會爆了37F 36.224.166.162 台灣 10/12 21:08
推 : 我只是進來看天之罩杯的38F 123.194.42.140 台灣 10/12 21:39
→ : 喔39F 49.214.8.235 台灣 10/12 21:46
推 : 最近miniPC都搭配395max+128G 應該有料40F 70.95.16.251 美國 10/13 03:20
→ : 可惜只有RDNA3.5不是4 ROCm7還不支援
→ : 可惜只有RDNA3.5不是4 ROCm7還不支援
推 : 推推心得42F 111.71.64.187 台灣 10/13 08:13
推 : 推個,上個禮拜 9070 9070xt各買一張了43F 223.137.129.253 台灣 10/13 08:50
※ 編輯: trfmk1 (125.229.59.186 臺灣), 10/13/2025 11:21:05推 : 爆顯存5000買一張mi50 32GB就搞定了 不44F 27.52.193.223 台灣 10/13 11:25
→ : 行就兩張
→ : 行就兩張
--
※ 看板: PC_Shopping 文章推薦值: 0 目前人氣: 0 累積人氣: 57
→
guest
回列表(←)
分享