RTX 3080 殺手登場　AMD RX 6800 XT

數今年十大硬件新聞， AMD RX 6000 的登場應佔一席之位； RTX 30 顯示卡珠玉在前，要戰勝 NVIDIA 幾成不可能完成的任務，但 AMD 最終做到了。本文筆者將為大家解構 AMD RDNA2 繪圖架構，分析其成功與不足之處。考慮到早前有報道過 Radeon RX 6000 的新技術，這次將嘗試與 NVIDIA RTX 30 作一次正面的比較，以便讀者能夠了解到兩卡的價值所在。

在讀者角度來看， RX 6000 與 RX 30 顯示卡僅屬於一件產品；在筆者角度，這是 AMD 與 NVIDIA 研發團隊經過無數晝夜苦戰的成果。在 RTX 20 成功發表後， NVIDIA 定出 2X 性能的增長目標，這給予 AMD 團隊莫大的壓力。因為 RDNA 架構（即 RX 5700/XT ）比對手遲半年以上，相當於 AMD 團隊要於 1.5 年時間完成 NVIDIA 團隊 2 年才能完成的目標，為迎難而上， AMD 團隊只好另闢路徑，打出漂亮的一仗，而且 Navi 21 才內建 268 億顆電晶體，竟比 NVIDIA GA102 的 283 億顆電晶體少 15 億顆。

2 × FP32 vs 高時脈

NVIDIA 自上一代 Turing 架構開始支援 INT+FP32 同步運算，以帶來更高的效能。在 Ampere 架構上， NVIDIA 嘗試增加 1 倍 FP32 單元，在同一周期可以執行 2×FP32 ，宣稱等於多一倍 CUDA Core 效能，成為 Ampere 架構的一大賣點，不過也造成 RTX 30 功耗大幅度飆升，不惜採用 3-slot 的巨型散熱器。

RDNA2的Cache架構圖。圖中可見有L0、L1、L2及Infinity Cache，竟比CPU還要豐富。

圖中可見128MB Cache容量為最理想的設計。當中又以HD（1,080p）及1,440p時GPU Cache Hit Rates最高，4K次之。

有別於對手， RDNA2 架構參考了 Zen CPU 的高時脈設計，優化管線設計，使 GPU Boost Clock 增至最高 2,250MHz ，比 RX 5700 XT 1,905MHz 有 345MHz 的增長，個別 AIC 非公板設計甚至更高。

GDDR6X vs 128MB Infinity Cache

曾經， AMD 對高速記憶體情有獨鍾，更率先採用 HBM 記憶體，為此付出更高記憶體成本，目前已主要改用 GDDR6 。 RTX 30 因為運算能力倍增，原來 16Gbps GDDR6 記億體頻寬已捉襟見肘，被迫改用 19/19.5Gbps GDDR6X 記憶體，不但成本略增而且限制了 RTX 3080/3090 的產能。在 RX 6000 上， AMD 充份利用 7nm 製程有利於製作小尺寸 SRAM 的優勢。據 AMD 統計， Zen2 32MB Cache 面積為 27mm² ，相當於 74mm² 總面積的 36.5% 。另一項統計是 128MB Cache 只比 4MB GPU L2 Cache 多 4 倍面積，卻可大大減少資料的讀寫時間，而且不會造成功耗的大幅度上升，成為 RX 6000 高性能的最大秘密。

AMD 以 Infinity Cache + 256-bit GDDR6 跟 384-bit GDDR6 作比較，表示有 2.1 7X 頻寬的增加，而功耗有 10% 的減少。作為對比， NVIDIA 針對 Server 及 Workstation 市場的 A100 GPU 也僅有 40MB L2 Cache 、 RTX 3090 僅為 6MB ，可見 AMD 的進取。

Ray-Tracing Core 的選擇

市場均非常關注 RDNA2 新增的 Ray-Tracing 功能，但 AMD 卻有意淡化 RDNA2 新增 Ray Accelerators 的作用，僅表示比軟件 Ray-Tracing 快 10X 。與 NVIDIA Turing/Ampere 架構每 Streaming Multiprocessor 設 1 組 RT Cores做法相似， AMD RDNA2 每 Compute Unit 下設 1 組 Ray Accelerator 光線追蹤引擎，以 RX 6800 XT 為例便有 72 組，似乎比 RTX 3080 的 68組 RT Cores 還要強。然而 NVIDIA RT Cores 已發展至第 2 代產品，並且支援與 FP32 一同運算以提升效能，可見 AMD 仍需努力優化 RDNA2 架構。

Ray Accelerator每時脈可執行1 Ray/Triangles Intersection或4 Ray/Box Intersections。

RDNA2 沒有 DLSS 功能嗎？

從架構上來看， RDNA2 似乎沒有 RTX 30 的 Tensor Cores ，也自然沒有後者的 DLSS 功能。 Tensor Cores 原來是 NVIDIA 為了 Tesla 等工作站及數據中心 GPU 而設，至今已發展示第三代產品，可通過 INT4 及 INT8 等低精度運算提升效能，尤其對於 4K 及 8K 遊戲時幫助最大。筆者認為雖然 RX 6000 沒有 NVIDIA Tensor Cores ，但卻支援 INT4 及 INT8 混合精度運算，有機會提供類似 NVIDIA DLSS 功能。

RDNA2架構支援INT8/INT32及INT4/INT32 Mixed Precision Operations for Tensor Math，未來不排除推出類似NVIDIA DLSS之類的技術。

AMD把RX 6000各卡公版尺寸定在267mm長度，不但較RTX 3080/3090小，也有以相當尺寸取代GeForce GTX 1080 Founders Edition等卡的意味。

ASUS ROG Strix LC RX 6800 XT 水冷版解構　

送測的RX 6800 XT 由 ASUS 提供，採用 240mm AIO 水冷+風扇的混合散熱設計。前者主要為 GPU 及 GDDR6 記憶體散熱，而後者則針對 VRM 等供電模組的散熱。

規格

Game Mode Clock︰2,360MHz（Boost Clock）、2,110MHz（Game Clock）
記憶體︰16GB Samsung GDDR6
記憶體速度︰16Gbps
散熱方案︰ 240mm AIO水冷+70mm風扇 2-slot
介面︰PCI-E 4.0 x16
顯示輸出︰2×DisplayPort 1.4a、1×HDMI 2.1、USB Type-C
Power Connector︰2×8-pin PCI-E
建議用火牛︰750W
尺寸︰27.7×13.08×4.36cm（顯示卡）、27.6×12×5.17cm（冷排連風扇）

查詢︰ASUS HK （3582 4770）
售價︰待定

RTX 3080 殺手登場　AMD RX 6800 XT

電競椅變身按摩椅　Zenox 舒適頸背按摩椅墊

史上最低調發佈　NVIDIA GTX 1630 如何出奇制勝？

頻寬再多一倍　 PCI-E 7.0 規格預告

2 × FP32 vs 高時脈

GDDR6X vs 128MB Infinity Cache

Ray-Tracing Core 的選擇

RDNA2 沒有 DLSS 功能嗎？

ASUS ROG Strix LC RX 6800 XT 水冷版解構

規格

您會感興趣的內容

相關文章

RTX 3080 殺手登場 AMD RX 6800 XT

2 × FP32 vs 高時脈

GDDR6X vs 128MB Infinity Cache

Ray-Tracing Core 的選擇

RDNA2 沒有 DLSS 功能嗎？

ASUS ROG Strix LC RX 6800 XT 水冷版解構

規格

您會感興趣的內容

相關文章

RTX 3080 殺手登場　AMD RX 6800 XT

ASUS ROG Strix LC RX 6800 XT 水冷版解構