看板 PC_Shopping
作者 kqalea (沙丁魚罐頭)
標題 Re: [情報] 如果 AMD 也支援 AVX-512 指令集會發生
時間 Thu Apr  8 10:25:15 2021


TL;DR
https://www.phoronix.com/scan.php?page=article&item=rocket-lake-avx512&num=1
AVX / AVX2 / AVX-512 Performance + Power On Intel Rocket Lake - Phoronix Phoronix is the leading technology website for Linux hardware reviews, open-source news, Linux benchmarks, open-source benchmarks, and computer hardwa ...

 

看跑分就好了

AVX-512

結論 效能跟耗電同比上升,值不值看個人,我個人覺得不值

對照 預設跑分的ryzen 5800x

https://openbenchmarking.org/result/2102077-HA-2101171PT68
Ubuntu 20.10 Kernels AMD Zen 3 Benchmarks - OpenBenchmarking.org Performance benchmarks of Ubuntu 20.10 Kernels AMD Zen 3. ...

 

還是輸到脫褲

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.103.176 (臺灣)
※ 文章代碼(AID): #1WRccGgM (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1617848720.A.A96.html
kimula01 
kimula01: 主要還是看應用 支援AVX可讓特殊需求者更多選擇1F 04/08 10:27
kqalea: 人家zen3 avx2 就跑得比core11 avx-512快了....2F 04/08 10:30
kuninaka: 就看ZEN4的AVX512表現如何阿3F 04/08 11:23
xiemark: AI的Inference會比較快。4F 04/08 11:32
oopFoo: https://i.imgur.com/flYfkZw.png
會寫avx512的話,效能就可以差好幾倍。本來想解釋想想算了,大概也沒人看的懂。5F 04/08 12:14
friedpig: avx512又不是牙膏閒閒沒事硬做的   客戶有需求去生出來的 當然消費級的就被硬塞用不太到的東西就是了8F 04/08 12:34
delaluna: 特殊擴充指令集本來就是有用到就很有效率啊
今天你去創造一個特殊指令再量身打造一個跑分指標一定也天下無敵
問題多少客戶有用到 多頻繁使用的而已10F 04/08 12:37
littlefish1: 一般用戶真的會用到avx512嗎?TR或EPYC等級再給就行了吧  像dx12從底層撰寫能提高優化 但沒幾個團隊真的會用14F 04/08 12:40
arrenwu: 你覺得用Adobe的客戶算很少嗎?17F 04/08 12:45
powerair: "本來想解釋 想想算了,大概也沒人看的懂"真萬用XD18F 04/08 12:46
arrenwu: 實際上我覺得影音編輯算是一般人常用到的吃效能的產品
再少一點就數值分析19F 04/08 12:47
bobbyac01: 實際上AVX512的問題是有程式混用其他指令集 然後效率就沒有純AVX512來的好看22F 04/08 12:49
friedpig: 還有一個問題是大家都很想一步到位  沒有前幾版硬體的砲灰慢慢優化下去 怎麼可能會好用 現在軟硬體都太複雜了 都要很多時間慢慢調整24F 04/08 12:57
oopFoo: https://reurl.cc/2bVvMa
如果想知道為什麼avx512重要,看這篇。Intel人講的27F 04/08 13:01
Why Ice Lake is Important (a bit-basher’s perspective) – Branch Free
With Computex, there's been a ton of news about Ice Lake (hereafter ICL) and the Sunny Cove core (SNC). Wikichip, Extremetech and Anandtech among many ...

 
arrenwu: 欸 其實我覺得那個倒還...就參考
有意義的還是benchmark
這次Intel比較掉漆的是多線程AVX512應用會狀功耗牆29F 04/08 13:03
aegis43210: x86的強勢就在這些特殊擴充指令集呀,並不是只有i皇要面對ARM的浪潮,而是整個x8632F 04/08 13:04
arrenwu: 不然一般應用大家用起來CPU都差不多快了34F 04/08 13:05
oopFoo: 功耗牆很難撞上的,真正使用起來記憶體的頻寬跟本不夠。benchmark只是測指令,才會功耗那麼高。大部份情況是卡在記憶體存取,cpu在等待。
https://reurl.cc/Q7xOLp35F 04/08 13:08
Ice Lake AVX-512 Downclocking | Performance Matters
Examining the extent of AVX related downclocking on Intel’s Ice Lake CPU ...

 
friedpig: 我記得Bios Default不是碰到AVX就會降了嗎 AVX頻率脫鉤的設定 導致頻率飄比較大39F 04/08 13:13
oopFoo: 噴火湖幾乎不降速,但噴功耗。41F 04/08 13:15
friedpig: 噴功耗也很嚴重阿  大家散熱很摳的42F 04/08 13:16
kuma660224: AVX512畢竟性能不會是256兩倍
用AVX256高時脈+多幾核  反而更有效率
AMD即使支援AVX512, 也很可能
不想透過硬體實作1Cycle 512bit
改用2Cycle 256bit更省電晶體43F 04/08 13:20
oopFoo: 就幾乎不可能噴功耗啊。這些測試都是fma*100次然後48F 04/08 13:22
kuma660224: 把那個資源拿去實作更強更多核49F 04/08 13:22
oopFoo: 都不存取記憶體。實際沒有程式這樣跑的,一定是讀取50F 04/08 13:23
kuma660224: 那個為什麼512很重要論 在12代就糗了51F 04/08 13:24
oopFoo: 幾個指令處理再存回去。不可能用fmadd*100次。52F 04/08 13:24
kuma660224: AlderLake搞大小核 為求指令一致性
放棄掉AVX512
於是AVX明年突然又不重要了53F 04/08 13:24
oopFoo: 真的12代沒有就尷尬了,等被Zen4痛宰56F 04/08 13:27
kuma660224: 如果大小核省電性贏不了GG黑科技製程
又沒AVX512可以吹,不知道怎麼戰57F 04/08 13:31
b325019: 比省電應該會贏拉,只是大小核調度沒做好也沒用59F 04/08 13:35
kuma660224: 確定小核一定更省嗎
明年Zen4 5nm vs 10nm 12代60F 04/08 13:40
twflanker: 到時候跟bulldozer一樣被OS衝康就好笑了62F 04/08 13:42
kuma660224: 那跨核切換搬移也是額外耗電
要長時間待在小核才有省電意義
但又不是用在手機....63F 04/08 13:43
twosheep0603: 大小核設計的主要目標是筆電吧 桌機就有點意義不明66F 04/08 13:45
kuma660224: 省電有兩條路線  1.用小核心
2.用先進製程把大核面積做小 降壓67F 04/08 13:46
b325019: 是阿要壓功耗把大核關掉應該很漂亮,只是實際使用就不是這樣了69F 04/08 13:47
kuma660224: 小核但製程輸人  是有可能沒更省電
只能說跟同製程的大核比是省電71F 04/08 13:47
b325019: 只是zen4還有個iod在那邊應該不至於小核功耗還輸,APU就不敢說了73F 04/08 13:48
kuma660224: 問題是萬一對手不講武德 下單GG5nm
連IOD都可能搬到GG7nm
就像蘋果A14的小核其實也不小
小核ipc暴力到有A76的96%
但蘋果製程砸錢包產能 領先對手一代
亂序多發射中核靠製程縮小 當小核用75F 04/08 13:48
leung3740250: n5功耗降20%有很多嗎?
不知道第幾次看到製程大師在吹n5功耗有多低81F 04/08 14:01
aegis43210: 12代本來就會被zen4痛宰,要和Zen4打的是13代83F 04/08 14:23
kuninaka: 如果沒有用,AMD不會在ZEN4支援拉
講這麼多84F 04/08 14:44
a27417332: 我以為現在x86的優勢只剩下固有生態(X86F 04/08 15:14
kngs555: AVX-512這應該是要用上AI.伺服器.特殊運算等,AMD才會塞進去87F 04/08 15:24
kuma660224: n5低不低是看跟誰比 不是跟 GG自己比
因為連GG7省電實測都贏三星589F 04/08 15:33
b325019: 按照現在一個ccd通吃的手法如果真的實作512bit電路上去消費級不想要也得吞,要嘛用現有256bit電路做相容要嘛消費級ccd另外做不然AVX應該會是全面性支援AVX512*91F 04/08 15:43
leung3740250: 4ghz以上n7p打不過10sf,10esf功耗再降15%,請問n5p功耗是能夠低多少?
5lpe那種拉到1.0v就已經比不過無印版n7就別拿來搞笑了,高中生打架找個國中生加入混戰是來當小丑的嗎?95F 04/08 16:29
CORYCHAN: IOD用7nm應該會很爽100F 04/08 19:27
Dissipate: 請問高頻的10sf那裡買的到呢?101F 04/08 20:03
leung3740250: tgl-u不是10sf是什麼,還是說tgl-u沒跑上4g?102F 04/08 20:07
Dissipate: 哇,高頻好厲害,拍拍手,那怎麼不上桌機?噗疵
H版都做不出來就不要拿出來說嘴了啦103F 04/08 21:11
leung3740250: 說製程性能就跳針到能不能生出來的問題?h45還有兩個月就出來了,原來這叫生不出來。
tgl-u的高頻實際上還比h45差一點,h35只能單核turbo 5g,h45可以雙核,順帶一提,h45 4.5g pl2 120w。
至於不上dt的原因,q3 adl-s就要上了,現在出tgl-s是打算賣多久?rkl-s可是delay了將近半年105F 04/08 21:21
kqalea: 10nm superfin的良率能超過50%再說吧
zen3+瞄準6nm不是沒有原因的112F 04/08 21:29
leung3740250: 去年武漢肺炎的影響下有多少東西真的能準時出來還夠產能?
請問誰告訴你10sf良率不過50%的?114F 04/08 21:29
kqalea: 不用別人告訴我,core11沒能搭上10nm 就是鐵證117F 04/08 21:32
leung3740250: 原來這就叫鐵證,10sf良率不夠50%還敢砍掉rkl-u,甚至把die size從上一代的120mm^2加大到接近150mm^2
icl-u的良率都不止50%,原來1.35v可以跑上5g的製程良率可以低於50%118F 04/08 21:38

--