顯示廣告
隱藏 ✕
看板 PC_Shopping
作者 applejone. (applejone.bbs@ptt.cc)
標題 [轉寄][情報] 4D只是開始 AMD HD 6900新架構官方圖解
時間 2010年11月23日 Tue. PM 01:35:01


看板 PC_Shopping
作者 gt1724 (天野神無伊歐斯)
標題 [情報] 4D只是開始 AMD HD 6900新架構官方圖解
時間 Tue Nov 23 13:00:24 2010


AMD昨日在波蘭舉行了一場內部交流會,向當地媒體講解了Radeon HD 6900系列顯卡的全
新架構設計。雖然經歷了洩露、刪除的風波,不過我們還是保存了其中的關鍵部分。

有趣的是,這些幻燈演示上標注的解禁時間為2010年10月份,證明Radeon HD 6900系列確
實曾經打算上個月就面世,但因為種種原因而推遲到了下個月。

Cayman Radeon HD 6900、Barts Radeon HD 6800兩個系列雖然如此之近,但卻基於兩種
截然不同的核心架構。Radeon HD 6800延續著R600以來的5D式流處理器設計,或者叫
VLIW5,四個簡單加一個複雜流處理器組成一個SIMD單元;Radeon HD 6900則改成了4D式
設計,又叫VLIW4,每組SIMD單元包括四個均等的中型流處理器,外加一個通用目的光柵
單元和一個分支單元。

除此之外,Cayman Radeon HD 6900核心還有更多SIMD陣列和紋理單元、雙圖形引擎、第
八代曲面細分、改進的渲染後端、新的GPU計算能力、增強質量抗鋸齒(EQAA)、帶寬超過
5Gbps的高速256-bit GDDR5顯存界面等等,下邊我們會一一講解。

[圖]


VLIW4 4D式架構採用四路並發設計,所有的流處理器都具有相同的整數、浮點操作執行能
力(不再有T-Unit),不過其中兩個還是附加了一些特殊功能。

AMD宣稱,VLIW4架構相比於VLIW5能將核心面積減少大約10%,同時簡化調度和光柵管理
,邏輯核心也得到了大範圍的重新利用。

雖然家構圖上沒有標明Cayman Radeon HD 6900核心有多少個這種流處理器,但根據此前
消息雙芯的Radeon HD 6990會有3840個,那麼頂級單芯Radeon HD 6970自然就是1920個了
,也就是30個SIMD陣列引擎。

[圖]


前端設計方面,Cayman Radeon HD 6900核心使用了兩個圖形引擎,每時鐘週期可處理兩
個原語(Primitive),具備基於區塊的負載均衡,轉換和隱面消除率翻番。

同時兩個光柵器單元,每時鐘週期最多可處理32個像素;

以及兩個第八代曲面細分單元(Barts Radeon HD 6800是第七代),支持更高曲面細分等級
的片外緩衝以提高性能,相比Radeon HD 5870提升最多三倍。

[圖]


曲面細分技術因為廠商的宣傳而成為DX11的熱點,AMD此番更是將其進化到第八代,並宣
稱自己的做法才是正確的,包括專注於最有效的曲面細分使用模型、自適應曲面細分等等
,可以做到性能與畫質的平衡。

[圖]


在不同曲面細分因數下,Radeon HD 6970的曲面細分性能可以達到Radeon HD 5870的
1.5-3.0倍。

[圖]


渲染器後端的改進包括寫入操作合併、16位整數(unorm/snorm)操作速度提升2倍、32位浮
點(單/雙精度)操作速度提升2-4倍。

[圖]



GPU計算增強包括異步分配(多個計算內核同步執行/每個內核擁有自己的命令隊列和受保
護虛擬尋址域)、兩個雙向DMA引擎(加快系統內存讀寫速度)、著色器讀取操作合併、LDS(
本地數據共享)直接拾取、改進的流控制、更快的雙精度操作(單精度的四分之一)。

[圖]


增強質量抗鋸齒(EQAA)是一種新的多重採樣抗鋸齒(MSAA),每像素最多16個採樣點,色彩
和採樣點數量可以獨立控制,而且能夠自行配置採樣模式和過濾器。

AMD宣稱該技術能夠在使用同樣容量顯存的基礎上帶來更好的畫質,而且兼容自適應AA、
超級採樣抗鋸齒(SSAA)、形態抗鋸齒(MLAA)。

[圖]


EQAA、MSAA採樣點模式對比:
[圖]
 

隨著核心面積的增大,功耗控制也越發重要。Radeon HD 6900會集成一顆功耗控制處理器
,每個時鐘週期都會實時監控功耗並進行動態調整,而且可以直接工制GPU核心功耗,不
再繞過頻率、電壓調整,此外也支持AMD OverDrive工具。

[圖]

[圖]


Radeon HD 6970的最終規格仍未明確公佈。每時鐘週期處理三角形數量為兩個(Radeon
HD 5870一個);Z/Stencil ROP單元、Color ROP單元分別仍是128個和32個;SIMD引擎、
紋理單元只說分別大於20個和80個,猜測應該是30個和120個;顯存帶寬大於160GB/s,說
明顯存等效頻率確實會超過5Gbps。

[圖]




http://news.mydrivers.com/1/180/180203.htm



翻譯:

AMD: 不要小看我的Tessellation

6900: 功耗控制(power containment)我也略懂

--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.121.197.68
gt1724:轉錄至看板 VideoCard                                     11/23 13:01
staff23:TSMC表示:欠婊......1F 11/23 13:25


--
※ 來源: Disp BBS 看板: PC_Shopping 文章連結: http://disp.cc/b/128-MTy
※ 看板: PC_Shopping 文章推薦值: 0 目前人氣: 0 累積人氣: 222 
分享網址: 複製 已複製
guest
x)推文 r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇