看板 PC_Shopping作者 wolflsi (港都狼仔)標題 Re: [情報] (rumor)RTX3080/90設計出包?時間 Sun Sep 27 11:23:18 2020
原文吃光光~
最近RTX Cap Issue狀況之拙見
因為GPU供電是多相VRM,各相依序運作,交錯時會產生一個很小的空窗期,所以會疊加一
個交換頻率*相數的交換雜訊在輸出上,這時輸出端會配置兩種電容,SP-CAP/POSCAP與
MLCC,前者容值較大,可儲能,主要用於交錯空窗期釋放輸出以穩定輸出,後者因為等效
阻抗低,用於輸出端高頻雜訊去耦/退耦(另一個說法是把高頻雜訊旁路到GND上),一般來
說兩者要混合搭配,因為核心電壓很低,如果VRM輸出的高頻雜訊振幅太大時,會導致電
路誤動作(因雜訊疊加電壓後影響高速信號H/L判斷),如果都只有SP-CAP/POSCAP,則高頻
雜訊沒地方走,如果只有MLCC,又不夠在相與相交錯的空窗期提供足夠儲能穩定輸出,
SP-CAP/POSCAP與MLCC是相輔相成,缺一不可
目前EVGA在官方論壇的說法,6顆POSCAP也是翻車,四顆POSCAP+20顆MLCC與五顆
POSCAP+10顆MLCC相對安定,這次TUF版後面全上MLCC,也是蠻特別的方案
主機板CPU插槽中央或是背面,也可以看到許多的MLCC,有些使用者會依此作為用料的參
考
但是MLCC有兩個比較討厭的特點
1.因其積層結構,會導致某些場合下有如壓電元件般振動並發出聲音
2.因外力/振動/溫度衝擊使本體微裂後會造成短路,產生大量發熱,造成自己及
鄰近電路區域因嚴重發熱而燒焦
以上報告完畢
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.174.88.162 (臺灣)
※ 文章代碼(AID): #1VS0MeOG (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1601177000.A.610.html
※ 同主題文章:
Re: [情報] (rumor)RTX3080/90設計出包?
09-27 11:23 wolflsi.
推 jadaboy: 我問業內相關人員,電源線路設計,大電容穩壓,小電容濾高頻雜訊,大概是這樣1F 09/27 11:26
推 asxy25: 狼大發文 先推再看3F 09/27 11:27
→ wolflsi: 大容量主要平滑(smooth),MLCC主要退耦(decouple)_5F 09/27 11:28
推 asxy25: 看起來mlcc比較容易壞 開副本機率高6F 09/27 11:29
→ wolflsi: 其實卡上出現明火或炭化的,MLCC佔不低的比例8F 09/27 11:31
→ wolflsi: 這就要看看了,如果卡溫度控制得宜,熱應力較小10F 09/27 11:34
→ E6300: 你要overspec 用什麼料都會死啦 在那邊嘴MLCC12F 09/27 11:36
→ wolflsi: 沒有說MLCC不好,是材料本身特性,但用在退耦很適用13F 09/27 11:37
推 LoveShibeInu: mlcc的確容易脆化短路 之前修板遇到短路的電路都是先找樣子比較奇怪的mlcc15F 09/27 11:42
→ wolflsi: 或是黑掉的區域XD18F 09/27 11:45
→ wolflsi: 樓上已經有文章針對料去分析了23F 09/27 11:58
→ JoyRex: MLCC的溫度怎麼半?通常都沒在顧的24F 09/27 11:59
→ wolflsi: 主要熱源來自於GPU對銅箔傳導,盡量壓低GPU溫度較好25F 09/27 12:02
→ er230059: MLCC本身不會發熱 會燒起來是CPU太燙害的26F 09/27 12:09
推 jadaboy: tuf也有大電容吧,只是放在正面?29F 09/27 12:14
→ lastblade008: 至少事前有發現問題 改採用MLCCs 極大程度避免高頻供問題 TUF還有其它優點 散熱及VRM供電都是不錯的30F 09/27 12:15
→ protoss: 但之前不是有測3080 TUF...記得溫度也是眾家裏頭出色的...那是不是就降低了MLCC脆化的問題?32F 09/27 12:16
推 a902392001: 反正現在看起來 NV打算用驅動去控頻率 新版測試驅動有看了幾篇 普遍反應分數降低 是不是能理解為頻率有所調降 還是要看看正式版到時候做了什麼34F 09/27 12:17
→ lastblade008: 背面溫度也不高 就開始說是不是容易壞 暈 還有其它高熱的元件更需擔憂吧38F 09/27 12:20
→ protoss: 不管怎樣...開發階段就要發現問題了...這樣爆雷的速度...說真的是要怎麼跟消費者交代他的設計是有信賴度的...一直用保固去撐開發的不足好像不是長久之計.40F 09/27 12:22
→ wolflsi: 之前用紅外線照GPU背面PCB,其實溫度不算低...43F 09/27 12:24
推 jadaboy: AMD 10月底的發表會,會不會拿cap issue來酸Nvidia XD44F 09/27 12:24
→ wolflsi: 因為溫度從正面傳到散熱器,但也有一部分往PCB走
而且鄰近的VRM也會把熱量從鋪銅傳過來46F 09/27 12:25
推 coox: 所以FTW3才是最好的嗎?48F 09/27 12:26
→ wolflsi: AMD這次應該會用實際應用去壓測,而不只是跑分
目前看起來4 POSCAP+20 MLCC會比6 POSCAP要穩
但也不能說TUF的全MLCC不好49F 09/27 12:26
推 avans: 專業推!52F 09/27 12:29
→ lastblade008: 隨便看一下 rog 2080ti vega64 GPU背後也有MLCC 所以現在要討論顯示卡用MLCC容易壞????53F 09/27 12:32
→ j081257: 就cdie設計不當,而pkg/pcb cap抑制高頻能力有限55F 09/27 12:34
推 AreLies: 推狼大
不過ASUS這次都是自家PCB設計
雞排跟小星星也是
NV這次給AIC都參考PCB是PG132 SKU10
EVGA的XC3則是基於PG132但是有做微幅修改
Zotac.Colorful等等都是沿用PG132
但是電容方案有改變
原本PG132的方案好像是1組MLCC跟5組SP-CAP
有幾家AIC基於PG132更改成全SP-CAP的方案
剛好也是這幾家先有問題
NV自己FE版本的PCB PG133 SKU10的方案是 兩組MLCC四組SP-CAP56F 09/27 12:34
推 s800525: 好奇問一下,電容的問題是以前到現在都有嗎?為何就這次特別噴發?68F 09/27 12:40
→ lastblade008: 非專業 但覺得前面擔心gpu背面MLCC會不會壞 是杞人憂天 還是回正題討論某些3080 超過2GHz會crash的原因吧71F 09/27 12:45
推 s800525: 以前高頻也會遇到電容這問題?感覺第一次看到這種大規模出問題的,還是晶片體質問題變得太敏感?74F 09/27 12:48
Hardware Unboxed
@HardwareUnboxed
The crashing with the RTX 3080 cards doesn’t appear to be down to the caps used, which is why we haven’t made a video yet, we don’t know the issue. What we do know is the FE and TUF Gaming models crash just as much as other models and they use MLCC’s.
https://twitter.com/JayzTwoCents/status/1309589586213875712 …
The RTX 3080 Launch can't get any worse... Right? Wrong...
https://youtu.be/x6bUUEEe-X8 via @YouTube
推 AreLies: 我猜是晶片體質差異太大77F 09/27 12:51
推 poeoe: 要先了解問題機制是什麼 不然猜是不是晶片體質根本沒意義79F 09/27 12:52
→ AreLies: 好的沒有很好 爛的就非常爛
雖然散熱不差 但也因為溫度沒有很高
讓Boost機制把時脈衝上去 結果就爆惹81F 09/27 12:53
→ lastblade008: 但搜尋整個reddit 就HardwareUnboxed提到Tuf也會
比例上算是極少吧84F 09/27 12:54
推 cerwvk: 好專業. 看來高頻用MLCC也是遲早問題,只能靠保固.86F 09/27 12:54
→ ILike58: 所以先讓子彈飛一會兒,等卡商這邊的設計先處理完,接下來就比較好釐清是不是三星的鍋。88F 09/27 12:55
推 dickey2: 看來是挑保固不囉嗦的比較安心了90F 09/27 12:56
推 a62511: 背面怕熱就掛個小風扇啊91F 09/27 12:57
→ wolflsi: 好奇有沒有測試者有對GPU背面核心供電抓ripple的?一直沒有討論MLCC易壞問題啊,只對元件特性補充而已92F 09/27 12:59
推 greg7575: 供電出ripple蠻怪的,我覺得晶片抽電的鍋95F 09/27 13:00
→ wolflsi: 當然能不能超,體質也佔因素,爛U用神板也是上不去96F 09/27 13:01
→ greg7575: SPCAP在高頻就是落賽,只能到一萬赫茲左右
但是 POSCAP 沒這問題啊…所以到底是偷料還是超抽97F 09/27 13:01
→ wolflsi: 不得不說,GPU越來越複雜,供電要求一定也只會更高把有問題的卡背面換料,跑起來沒問題就是供電的鍋99F 09/27 13:01
→ ILike58: 不過現在不是才開賣沒多久?論元件特性不是比元件老化變質還實在嗎?101F 09/27 13:07
→ wolflsi: 如果換完料還是有問題,那其他的鍋就比較大了103F 09/27 13:07
推 greg7575: 現在各種搭配都有問題啊,所以那個三星不用出來ry104F 09/27 13:07
→ wolflsi: MLCC除了後天因素,還有先天(製造/上件/迴流焊)因素所以說待測"同一張有問題卡,換料後能不能解決問題"105F 09/27 13:09
推 StarS: 現在看好像還都出問題了
*全都107F 09/27 13:10
→ ILike58: 那就要看murata這牌子信不信得過了,呵。109F 09/27 13:11
→ wolflsi: 應該是說失效率可以壓低,但還是存在(不等於0)110F 09/27 13:14
推 greg7575: murata超大牌的,放心112F 09/27 13:16
→ NerVGear: 其實我TUF再2000以上也是會遊戲崩潰 看來...113F 09/27 13:16
→ wolflsi: 目前看起來所有方案都有問題,等看看後續發展吧114F 09/27 13:17
推 a902392001: 這次感覺算不小包 只有確定加速到2G容易發生 然後多個品牌多種搭配都有案例 也有看到一個板友說老黃早知道 會靠驅動跟軟體修 反正就等公告 回收這種方式難度太高了 NV應該不會輕易用才是115F 09/27 13:18
→ Severine: 世上的商品 除非危害到生命財產 不然一般沒在回收的 了不起RMaa換新
RMA119F 09/27 13:20
推 E6300: 老黃刀法失靈 還得靠村田來救命122F 09/27 13:21
→ ILike58: 所以說保固真的是人類史上最大的發明之一(無誤)。123F 09/27 13:23
→ wolflsi: 保固重要+1
品質再高的商品仍是有發生故障可能,這時就看保固124F 09/27 13:23
推 allyourshit: MLCC退耦用的0.1 1 10uF很少看到出問題的126F 09/27 13:24
推 roloveyou: 前幾篇看下來都是MLCC好棒棒,POSCAP拉積127F 09/27 13:26
推 yudofu: 想太多了,會這樣換只是高容值的時候一大顆poscap比一組mlcc便宜,就這樣,你以為他們考慮的是特性嗎?128F 09/27 13:32
→ wolflsi: 還有Layout,一堆MLCC比一個SP-CAP/POSCAP佔空間130F 09/27 13:33
→ richard42: 簡單就是說便宜佔面小 所以商人就用了 沒考慮特性131F 09/27 13:35
推 greg7575: 三星:我會瞬抽,想不到吧嘻嘻132F 09/27 13:36
推 allyourshit: 其實瞬抽的問題比較大 就算全上MLCC也擋不住大瞬抽然後MLCC也有材質之分 NPO X7R Y5V Y5Z...
同容量下不同材質其實特性差異也很大 通通是學問133F 09/27 13:38
→ wolflsi: 用料牽一髮動全身136F 09/27 13:40
推 allyourshit: 大容量的MLCC溫度特性都不怎麼樣 能選的材質不多
用小容量特性好的MLCC去堆就是面積跟成本大幅增加所以全上MLCC也出包 那是要看上的是什麼MLCC
***製程漏尿不是新聞 所以瞬間超抽的鍋逃不了
別把各廠商用的MLCC都視為一樣才是正確的判斷137F 09/27 13:42
推 bizer: 大概這次瓦特數高的問題吧,瞬間超抽電流更高了142F 09/27 13:53
→ wolflsi: 但實際的料就要從BOM看,除非上料與BOM不符143F 09/27 13:53
推 KrisNYC: 說***的鍋還不一定錯喔 高頻不穩或瞬間超抽阿
漏電會造成的問題蠻奇形怪狀的 要不是顯卡可以做的145F 09/27 14:00
→ pipi5867: 其實就以往nv大晶片都是GG貨,品質穩定147F 09/27 14:01
→ KrisNYC: 比手機大這麼多 NV用***的機率幾乎要降到0148F 09/27 14:01
→ pipi5867: 所以供電那些不用弄到很誇張也沒什麼問題
這一次照慣例上料 就炸了149F 09/27 14:01
推 creepy: 恩恩 我也是這樣想 (完全不懂)151F 09/27 14:06
→ wolflsi: 目前就先等看後續有沒有什麼發展152F 09/27 14:07
→ ang728: 搞到翻車還得要看GPU上面的Cdie夠不夠154F 09/27 14:16
推 Lemming: 都買不到了還變這樣搶到不知是福是禍155F 09/27 14:18
→ asxy25: 搶到要幫忙debug不如沒搶到156F 09/27 14:22
推 vagary0202: 有個疑問 圖片好像是4+2或5+1還是真的mlcc用20顆???157F 09/27 14:27
→ wolflsi: 六個大格,每格可塞一顆SP-CAP/POSCAP或10顆MLCC
有4SP-CAP/POSCAP+20MLCC或5SP-CAP/POSCAP+10MLCC161F 09/27 14:45
推 gabbana: 高頻的抽載要靠晶片上的cap來解 外面再多也沒用163F 09/27 14:53
→ protoss: 通常沒想那麼多啦...都是為了cost down才去改設計...畢竟這最直接反應到成本...至於有沒有確認這種更動是可靠的那又是另一回事了...有查出來是一回事...認定這是不是問題又是一回事...當然也有很大的可能是根本連做都沒做...只是現在消費者開第一槍直覺懷疑到這邊來...你也沒法阻止啥啊...ASUS這次得到比較好的評價你要說他運氣好或是真的有比較嚴謹的研發都行164F 09/27 15:00
→ wolflsi: 因為這次是跑遊戲壓測出來,而非跑分出現
所以推測有可能未進行完整壓測,所以逃脫過去
退耦能在晶片上最好,但背面沒空間,正面空間也有限172F 09/27 15:40
→ labbat: 遊戲是因為很多場景轉換 資料預處理
讓局部負載爆減或爆增 這很難透過跑分覆蓋得到175F 09/27 15:49
推 baka: 狼,推177F 09/27 15:50
推 a902392001: 狼大 問一下 那如果是3D MARK的壓測迴圈呢 這樣還是不能跟一般遊戲相比嗎?179F 09/27 17:28
→ wolflsi: 這方面沒有特別研究,如果能用腳本跑遊戲應該較準181F 09/27 17:33
推 Windcws9Z: 推
山豬馬克有這摸好用,就不會一堆人送修沒問題
回來遊戲繼續破圖184F 09/27 17:39
→ windrain0317: 3dmark很好用阿
剛跑一下,tse stress最高看到1.9
大多在1.8徘徊187F 09/27 17:43
→ Windcws9Z: 沒辦法重現問題啊,還給消費者就是繼續破圖190F 09/27 17:48
→ wolflsi: 顯卡商會不會叫遊戲商開發一個內測用腳本模式?191F 09/27 18:22
→ peiheng: 3Dmark壓力比較穩定,我遇到的情況是壓力降低時頻率跳上去,遊戲程式就會出錯。192F 09/27 19:08
→ j081257: mlcc 頂多稍微改善, 本身 nv cdie 就抓太緊繃
cdie 太小, PDN 最右邊的 peak 會往高頻跑, easy :)195F 09/27 19:37
推 havenn: 可以請問一下 SC-CAP 容量有差嗎 有些用220 有些用470199F 09/27 20:39
→ j081257: 不同容值有不同的抑制頻率點,但也要搭配ESR/ESL201F 09/27 21:17
推 goldie: 推狼大分析文!我覺得要等驗屍報告出來再說,
不然現在解法都很像是挖東牆補西牆。
講到瞬抽,讓我想起A家的 Vega 系列顯卡... XD203F 09/27 22:18
→ wolflsi: 不同種類、系列、容值都會在特性上有些差異
目前VRM低壓大電流,這些小差異就會使輸出產生不同206F 09/28 01:46
--