作者 oopFoo (3d)
標題 Re: [情報] 7900XTX 的L3快取竟然比7600還慢58%!?
時間 Thu Jun  8 07:53:52 2023


※ 引述《luvstarrysky ()》之銘言:
: 心得:黏膠水的架構似乎生出了快取延遲的問題,這點在Ryzen CPU靠堆疊3D快取的方式
:       來解決,但AMD為了賺錢是絕對不會在Radeon GPU上複製這種方式的,畢竟現在都
:       只能靠吃NV吃剩的大餅碎屑來充飢,不需要搞得多好也有粉絲買單,財報好看,
:       AMD笑哈哈,消費者苦哈哈。
這樣的心得真的只是來挑釁的。引述的url也內容空洞。來看最原始的文章吧

先講L3的latency並不是很重要,GPU的設計本來就是吃bandwidth犧牲latency。
L3在chiplet,latency增加並不是大問題,大問題是data從mcd到gcd需要很大的能耗,所以這是Navi31異常耗能的原因之一。L3真的不應該在chiplet上,N/I擴張L2棄L3是有原因的。

https://chipsandcheese.com/2023/06/04/amds-rx-7600-small-rdna-3-appears/
AMD’s RX 7600: Small RDNA 3 Appears – Chips and Cheese
[圖]
Late last year, AMD launched high end RDNA 3 with the Radeon RX 7900 XTX and Radeon RX 7900 XT. Now, they've rolling out smaller versions of RDNA 3 ta ...

 

這篇其實主要是講VOPD(dual issues)的問題,rdna3在wave32本來就不容易dual issues,舊的wave64模式反而容易dual issues,這是compiler的問題。
rx7600還有另一個大問題,因為用6n而不是5n空間不夠,犧牲掉vector registers,這造成dual issues更困難,因為vector registers的不足。
本來rdna的設計就是wave32雖然效能比wave64差但比較容易達到好性能,但現在VOPD的情況下就反過來了。令人感嘆wave32真是白忙一場的設計。

https://i.imgur.com/wsGh4b3.png
[圖]
可以看到,如果能夠dual issues,rx7600幾乎可以追上rx6900xt。

這篇其實蠻有趣的,如果你想粗淺了解rdna3的架構與問題。

-------------------------------------
如果你想黑A,找一下geohot最近兩天的言論,真是把AMD黑死了,雖然geohot自己的問題也很大,但他黑之有物

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.70.128.119 (臺灣)
※ 作者: oopFoo 2023-06-08 07:53:52
※ 文章代碼(AID): #1aWHYKh3 (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1686182036.A.AC3.html
※ 同主題文章:
Re: [情報] 7900XTX 的L3快取竟然比7600還慢58%!?
06-08 07:53 oopFoo
※ 編輯: oopFoo (219.70.128.119 臺灣), 06/08/2023 07:55:59
qwe753951: rdna3真的是大大大失敗1F 114.44.208.132 台灣 06/08 07:58
E6300: 所以蘇媽該降價了2F 223.138.67.29 台灣 06/08 08:53
wardraw: 黑A真的要言之有物 相比前篇心得跟坨一樣3F 124.11.129.176 台灣 06/08 09:09
Ekmund: the tiny corp 才沒多久 他又轉向了..XD4F 223.137.220.161 台灣 06/08 09:35
Tsukasayeo: 他只是想黑,才不管內容怎樣5F 59.120.196.118 台灣 06/08 09:56
SHR4587: MCM第一代問題多,等下一代6F 220.136.27.203 台灣 06/08 10:15
ideo: 這篇程度和原PO天差地遠7F 39.9.233.5 台灣 06/08 10:24
friedpig: MCD能耗是都花在傳輸上嗎? 這代都2.5D了 感覺是L3太大本來就吃電 應該不是
傳輸的問題
AMD架構本來就贏不過NV也是問題 天生就吃電了 MCM的確還有在傷一點 最後就QQ8F 118.163.149.125 台灣 06/08 11:42
smallreader: 架構還好,看了geohot黑的點應該驅動13F 223.138.107.67 台灣 06/08 11:49
ltytw: 只不過最近我們也是在嘲諷nv功耗換效能?14F 223.141.250.53 台灣 06/08 11:57
oopFoo: L3的頻寬用mcm,耗電量大增,SPR也有同樣問題。驅動就是硬體的延伸,好硬體好驅動15F 219.70.128.119 台灣 06/08 12:33
BlackCoal: 先推再說,雖然我真的看不懂17F 110.30.24.228 台灣 06/08 12:34
friedpig: 傳輸耗能沒那麼多拉 功耗差的量級不是傳輸的問題
2.5D的傳輸功耗應該是1pJ/bit以內
inifite fanout link峰值頻寬是5.3TB/s全頻寬吃下去40~50W吧 不過怎麼可能沒事一直保持那麼大的數據交換 多少有影響但應該不是主因
https://tinyurl.com/23pjrefr
這邊提到CoWoS 0.5pJ/bit而已 InFO到底多少還要查一下
https://tinyurl.com/4v2snb2x InFO參考18F 118.163.149.125 台灣 06/08 12:37
 
GUC Die-to-Die Total Solution Opening the New Era of Flagship SoC
[圖]
HSINCHU, Taiwan, Nov 17 2020 — Global Unichip Corp. (GUC), the Advanced ASIC Leader, disclosed today that it has successfully demonstrated the silicon ...

 
friedpig: 這邊 可能才0.2~0.3pJ/Bit而已 傳輸功耗有可能才20W不到 問題不該是這個29F 118.163.149.125 台灣 06/08 13:00
dildoe: 比較好奇高速io在不傳輸時是不是很省電?XD31F 93.91.80.6 06/08 13:54
leung3740250: spr的問題不在於emib,而是電壓過高加上全吞吐avx512和amx
CML-S之後的任何一代電壓都是比正常需求多出0.1v起跳,SPR都快比電壓表標的多了0.15v了32F 103.77.192.10 香港 06/08 14:24
aegis43210: server就是穩定性和安全性最重要,SPR已經延遲了一年,為了盡快出貨,電壓也只能設定的高一些
EMR會改善的37F 106.104.74.67 台灣 06/08 16:17
oopFoo: 高頻高效能的die2die功耗那有辦法這麼低只跑低頻什麼低功率都有可能。spr的問題真在emib。高功耗i皇還可以解決,emib的效率還需要時間41F 36.224.253.35 台灣 06/08 17:25
phoenixcx: 講太深…45F 112.78.65.80 台灣 06/08 19:47

--
作者 oopFoo 的最新發文:
點此顯示更多發文記錄