看板 PC_Shopping作者 zseineo (Zany)標題 Re: [情報] GMP 建議不要用 Zen5時間 Thu Aug 28 09:33:57 2025
https://gmplib.org/gmp-zen5
連結內有一些CPU的圖跟兩台的配備
全部貼來PTT好像有點長,我截下面比較重要的部分+AI翻
We really don’t know what is wrong here. Let us list some observations and
thoughts:
The ambient temperature was in both cases quite low.
These are supposedly top-quality motherboard (We’ve had about 50 ASUS
motherboard over the years, and only had one failure).
The offset mounting does not look right to us. But this is how things are
supposed to be done.
It is possible that we caused the 2nd CPU failure by inadequate mounting of
the heat sink. It surely seems bizarre to have the thermal paste squeezed like
shown on the pictures above!
But note that the 1st failure happened with a more centred heat sink. We only
made the off-centre mounting for the 2nd system as to minimise the risk of a
repeated system failure.
The so-called TDP of the Ryzen 9950X is 170W. The used heat sinks are
specified to dissipate 165W, so that seems tight. We have extra fans in the
cases and a low ambient temperature, making these 5W seem negligible. But of
course, this is not completely kosher.
We have a sister system for the 9950X, a 7950X which is similarly configured
and built. That system actually seems to run slightly hotter, but it has been
stable for a long time (under the same crazy load!).
The systems were under maximal load at the time their CPUs died, running very
tight handcrafted asm loops sustaining one MULX per cycle. That might be a “
hot” instruction.
Did the CPUs die of heat stroke? Modern CPUs measure their temperature and
clock down if they get too hot, don’t they?
We don’t overclock or overvolt or play other teen games with our hardware.
The extremely thin layer of thermal paste which resulted from the off-centre
heat sink mount, might seem fine. We however suspect that there might be a
problem, as when the system heats and cools, things bend a little. With a
remaining layer of thermal paste, such bending will not create any void as the
paste’s elasticity will maintain some contact. When the thermal paste is
squeezed away as with the suggested Noctua mounting, an ever-so-slight void
between the CPU and the heat sink might be created.
Neither of the 9950X CPUs died immediately, instead they died the exact same
way after a couple of months at high load. This seems to suggest a gradual but
predictable degradation.
我們真的不清楚問題出在哪裡。以下是一些我們的觀察與想法:
兩次故障發生時,環境溫度都相當低。
我們使用的是公認品質頂尖的主機板
(多年來我們用過約 50 張 ASUS 主機板,只壞過一張)。
偏置安裝看起來很奇怪,但這卻是官方建議的安裝方式。
第二次 CPU 故障有可能是我們安裝散熱器不當所致。散熱膏被擠壓成上圖那樣,確實有
點匪夷所思。
但值得注意的是,第一次故障時散熱器是置中安裝的。我們在第二套系統上改用偏置安裝
,正是為了避免重蹈覆轍。
Ryzen 9950X 的所謂熱設計功耗(TDP)是 170W,而我們使用的散熱器解熱能力規格為
165W,規格上確實有點吃緊。不過考量到我們在機殼內加裝了風扇,且環境溫度低,這
5W 的差距應該可以忽略。但嚴格來說,這確實不是最標準的作法。
我們有一套與 9950X 系統配置相近的 7950X 系統。那套系統的運作溫度似乎還稍微高一
些,但在同樣極端的負載下,它已經穩定運行了很長時間。
CPU 燒毀的當下,系統都處於滿載狀態,持續運行著我們手動編寫、極度精簡的 asm 迴
圈,每個時脈週期執行一次 MULX 指令。這或許是個發熱量極大的指令。
CPU 是因為過熱燒毀的嗎?現代 CPU 不是都有溫度監控,會在過熱時自動降頻保護嗎?
我們從不對硬體進行超頻、加壓或任何類似的胡亂設定。
偏置安裝導致散熱膏層極薄,表面上可能沒問題。但我們懷疑,當系統反覆升溫和降溫時
,金屬會產生微小的形變。如果還有一層散熱膏,膏體的彈性可以填補縫隙,維持接觸。
但若像 Noctua 建議的安裝方式那樣將散熱膏完全擠開,CPU 和散熱器之間就可能因形變
產生一道極其微小的空隙。
兩顆 9950X CPU 都不是立即損壞,而是在高強度負載幾個月後,以完全相同的方式故障
。這似乎指向一種緩慢但可預測的漸進式損耗。
關於文中提到的off-centre mounting
We use a Noctua cooling solution for both systems. For the 1st system, we
mounted the heat sink centred. For the 2nd system, we followed Noctua’s
advice of mounting things offset towards what they claim to be the hotter side
of the CPU. Below is a picture of the 2nd system without the heat sink which
shows that offset. Note the brackets and their pins, those pins are where the
heat sink’s pressure gets centred. Also note how the thermal paste has been
squeezed away from that part, but is quite thick towards the left.
我們的兩套系統都採用 Noctua 散熱器。第一套系統,我們將散熱器置中安裝。到了第二
套系統,我們則遵循 Noctua 的建議,將散熱器偏向他們所謂 CPU 較熱的一側進行安裝
。下方是第二套系統未安裝散熱器的照片,可以清楚看到偏置安裝的狀況。請注意支架和
卡榫,散熱器的壓力就集中在這些卡榫上。同時也請注意,散熱膏如何從壓力集中處被完
全擠開,但在左側卻保留了相當的厚度。
----
因為天氣夠冷所以散熱用稍微不夠是可以的嗎?尤其是在大量數學計算上?
積熱應該還是會積在裡面吧?熱交換不夠快外面再涼也沒意義?
(編輯)
補充:看推文討論溫度可能不是主要原因
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.160.16.3 (臺灣)
※ 作者: zseineo 2025-08-28 09:33:57
※ 文章代碼(AID): #1ehx88ND (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1756344840.A.5CD.html
※ 同主題文章:
Re: [情報] GMP 建議不要用 Zen5
08-28 09:33 zseineo
※ 編輯: zseineo (1.160.16.3 臺灣), 08/28/2025 09:39:47
→ smallreader: 就像冰島蓋資料中心,再冷也不可能放露天自然對流散熱XD1F 111.254.128.252 台灣 08/28 09:42
推 highwayshih: 長期用解熱能力不到TDP的散熱器
燒毀不是理所當然的嗎……?3F 111.71.19.49 台灣 08/28 09:45
→ RAA1144557: 哪裡來的自信?5F 42.79.107.196 台灣 08/28 09:47
推 kuninaka: 換解熱能力更好不就好?
170W你拿165W來解 然後叫大家不要用
ZEN5
你哪來的自信建議人家6F 211.20.234.13 台灣 08/28 09:47
→ zseineo: 瑞典的天氣給他們的吧 XDD10F 1.160.16.3 台灣 08/28 09:48
推 kuninaka: 阿 不是這樣看得吧 XD
要靠散熱器把熱量導出去啊11F 211.20.234.13 台灣 08/28 09:50
→ friedpig: 用165W 正常來說就降頻而已啊 哪有怎樣13F 118.163.149.125 台灣 08/28 09:51
→ lazioliz: 連跳停都沒有你要怎麼跟我說散熱不足14F 101.9.241.134 台灣 08/28 09:52
→ friedpig: 165去嘴太好笑了八 這樣ITX一堆狀況更差的不是死不玩了15F 118.163.149.125 台灣 08/28 09:53
→ smallreader: 使用頻率不同,不然ITX跑Prime95整個月看看
想要24/7高壓的就別偷散熱 很難嗎17F 111.254.128.252 台灣 08/28 09:55
→ william456: 靠,這完全是使用者的錯
散熱都嫌不夠了,還想靠自然環境補救,呵呵20F 36.235.153.145 台灣 08/28 09:57
推 kuninaka: 他就高壓使用阿
friedpig你CPU 24/7 都滿載嗎
官方就寫170W 硬要拿165W
搞事情,然後叫大家不要買 很會喔
不是欠罵是怎樣
這是中國人在瑞典是不是23F 211.20.234.13 台灣 08/28 10:02
→ friedpig: TDP差5 環境溫度還低於20度 從頭到尾也真的提到CPU實際溫度 只說比7950X低而已29F 118.163.149.125 台灣 08/28 10:06
推 kuninaka: 你是聽不懂規格上面寫170W嗎
上法院跟法官說看看
AMD吃飽撐著在規格上面標170W幹嘛
還是說170W其實165W也要沒問題
法官判決AMD要回收全部產品31F 211.20.234.13 台灣 08/28 10:06
推 Fezico: TDP這東西不都是虛標的?如果都開Auto,正常撞功耗牆不是自己會降壓?36F 118.161.70.157 台灣 08/28 10:07
→ friedpig: 這樣要去只關注這個點是有點好笑38F 118.163.149.125 台灣 08/28 10:08
→ kuninaka: 你去跟法官說看看39F 211.20.234.13 台灣 08/28 10:08
→ lazioliz: 5W也就誤差範圍而已 環境溫度差3度散熱能力就差超過5W了 沒有很難算吧40F 101.9.241.134 台灣 08/28 10:08
→ kuninaka: 出來叫大家不要用ZEN5更好笑42F 211.20.234.13 台灣 08/28 10:08
→ friedpig: 不過他就只壞兩顆 要說是通案真的還有43F 118.163.149.125 台灣 08/28 10:08
→ kuninaka: 中國人逆44F 211.20.234.13 台灣 08/28 10:08
→ friedpig: 待觀察 但一只去吵5W真的護航的很好笑45F 118.163.149.125 台灣 08/28 10:09
→ kuninaka: 原來叫大家不要用ZEN5你同意喔 呵呵46F 211.20.234.13 台灣 08/28 10:09
→ friedpig: 我不同意壞兩顆就喊不要用是正常啊
但跟5W TDP在那邊無限放大就算了吧
CPU有虛標 散熱器每家標的也是不一樣算47F 118.163.149.125 台灣 08/28 10:09
→ Fezico: PA120標240w,你真相信他能壓住240w?50F 118.161.70.157 台灣 08/28 10:10
→ friedpig: 法 而且CPU的降溫機制壞掉了?
如果Zen5真的有這問題 我倒覺得比較有可51F 118.163.149.125 台灣 08/28 10:10
→ Fezico: 推不推薦拿Zen5跟Zen5會不會燒是兩件事53F 118.161.70.157 台灣 08/28 10:12
→ friedpig: 能是測溫點改變 導致控溫可能不夠理想Zen5這代有調整測溫點 CPU讀數會比較低54F 118.163.149.125 台灣 08/28 10:12
→ smallreader: TDP就算只是算出來的,也表示AMD只保證在搭配符合解熱能力的散熱器才能穩定運作吧56F 111.254.128.252 台灣 08/28 10:13
→ friedpig: 它的用途又不知道是不是像穩定燒雞59F 118.163.149.125 台灣 08/28 10:13
→ smallreader: 少5W就是少,AMD就不會保證在你這種用法底下不會溫控失敗60F 111.254.128.252 台灣 08/28 10:14
→ friedpig: 不確定向狂boost又降下去 有可能整體溫62F 118.163.149.125 台灣 08/28 10:14
→ Fezico: CPU標的TDP比較像在原廠設定中最高功耗值而已,所以之前牙膏K板才搞出超頻不保的笑話63F 118.161.70.157 台灣 08/28 10:14
→ william456: 但你使用不符規的散熱器上法院一定會輸66F 36.235.153.145 台灣 08/28 10:15
→ friedpig: 度沒拉上去 但是熱點其實有在積熱68F 118.163.149.125 台灣 08/28 10:15
推 terry12369: 這樣就建議不要用,有點不懂69F 42.70.175.179 台灣 08/28 10:15
→ commandoEX: 正常來說散熱不足應該是CPU會啟動過熱保護才對吧,怎麼變成會燒掉?70F 59.125.204.130 台灣 08/28 10:16
→ BAKAUSAGI: 散熱器的TDP每家都自己講自己的..真要72F 223.140.235.2 台灣 08/28 10:16
→ friedpig: 我猜有可能根本沒頂到溫度牆73F 118.163.149.125 台灣 08/28 10:16
→ BAKAUSAGI: 杠拿這個也不對吧…74F 223.140.235.2 台灣 08/28 10:16
→ friedpig: 這篇沒附圖 他第二個壞的針腳有一塊直接75F 118.163.149.125 台灣 08/28 10:18
→ spfy: 過熱是降頻頂多斷電吧 現在CPU還會因為過熱燒壞嗎 I的13.14代好像也是電壞的? 我只記得用過Duron是真的熱到燒掉...76F 223.140.141.190 台灣 08/28 10:18
→ friedpig: 變色 有點像X3D那時候的狀況 是不是板子再搞也不一定79F 118.163.149.125 台灣 08/28 10:18
推 pmes9866: 樓下幫講解熱傳導公式81F 42.72.245.103 台灣 08/28 10:18
→ friedpig: 雖然他是用石頭的板 不是小石頭82F 118.163.149.125 台灣 08/28 10:18
推 terry12369: 阿測試怎麼不用高於170w的看會不會燒83F 42.70.175.179 台灣 08/28 10:18
→ Fezico: 電壓浮動也是有機會電壞U的
現在U都很嬌貴,電壓沒控制好往生也不奇怪84F 118.161.70.157 台灣 08/28 10:19
→ friedpig: 其實不是嬌貴 是為了表現預設都超太誇張了 長期高壓應該都是短命86F 118.163.149.125 台灣 08/28 10:21
→ YouCantGetME: 一堆廠商出設備1U2U殼頂溫度牆在幹的 有到CPU標準TDP就不該燒88F 223.136.124.160 台灣 08/28 10:21
推 mayolane: 他們那兩張主機板都有點丐捏
共碩的B650M-K跟B650M-A90F 114.136.201.173 台灣 08/28 10:21
→ friedpig: 他設定PBO不知道有沒有開92F 118.163.149.125 台灣 08/28 10:21
→ NanaMizuki: cpu如果差5w就會燒毀,那那些忘記撕膜的早就燒爛了好不93F 125.230.22.128 台灣 08/28 10:21
推 oppoR20: Zen5燒起來的案例確實各家都有
小石頭是最嚴重的而已95F 223.137.41.109 台灣 08/28 10:22
→ friedpig: 這代就密度更高 溫控有調整 到底有沒有問題其實還真的不好說 慢慢看八97F 118.163.149.125 台灣 08/28 10:23
推 LiNcUtT: 但現在這例子看起來是板子沒燒只燒u,就很奇妙;另外超過VRM負載能力,正常情況下VRM會過熱降頻,輸出電流會下降,u那邊吃不到395F 114.32.199.111 台灣 08/28 17:27
→ x94fujo6: GPU核心死法之一就是 MOS打穿燒核心398F 114.33.176.49 台灣 08/28 17:30
→ LiNcUtT: 足夠的電流也會降頻才對,沒飯吃還能跑到燒超詭異399F 114.32.199.111 台灣 08/28 17:30
--