數今年十大硬件新聞, AMD RX 6000 的登場應佔一席之位; RTX 30 顯示卡珠玉在前,要戰勝 NVIDIA 幾成不可能完成的任務,但 AMD 最終做到了。本文筆者將為大家解構 AMD RDNA2 繪圖架構,分析其成功與不足之處。考慮到早前有報道過 Radeon RX 6000 的新技術,這次將嘗試與 NVIDIA RTX 30 作一次正面的比較,以便讀者能夠了解到兩卡的價值所在。
在讀者角度來看, RX 6000 與 RX 30 顯示卡僅屬於一件產品;在筆者角度,這是 AMD 與 NVIDIA 研發團隊經過無數晝夜苦戰的成果。在 RTX 20 成功發表後, NVIDIA 定出 2X 性能的增長目標,這給予 AMD 團隊莫大的壓力。因為 RDNA 架構( 即 RX 5700/XT )比對手遲半年以上,相當於 AMD 團隊要於 1.5 年時間完成 NVIDIA 團隊 2 年才能完成的目標,為迎難而上, AMD 團隊只好另闢路徑,打出漂亮的一仗,而且 Navi 21 才內建 268 億顆電晶體,竟比 NVIDIA GA102 的 283 億顆電晶體少 15 億顆。
2 × FP32 vs 高時脈
NVIDIA 自上一代 Turing 架構開始支援 INT+FP32 同步運算,以帶來更高的效能。在 Ampere 架構上, NVIDIA 嘗試增加 1 倍 FP32 單元,在同一周期可以執行 2×FP32 ,宣稱等於多一倍 CUDA Core 效能,成為 Ampere 架構的一大賣點,不過也造成 RTX 30 功耗大幅度飆升,不惜採用 3-slot 的巨型散熱器。
有別於對手, RDNA2 架構參考了 Zen CPU 的高時脈設計,優化管線設計,使 GPU Boost Clock 增至最高 2,250MHz ,比 RX 5700 XT 1,905MHz 有 345MHz 的增長,個別 AIC 非公板設計甚至更高。
GDDR6X vs 128MB Infinity Cache
曾經, AMD 對高速記憶體情有獨鍾,更率先採用 HBM 記憶體,為此付出更高記憶體成本,目前已主要改用 GDDR6 。 RTX 30 因為運算能力倍增,原來 16Gbps GDDR6 記億體頻寬已捉襟見肘,被迫改用 19/19.5Gbps GDDR6X 記憶體,不但成本略增而且限制了 RTX 3080/3090 的產能。在 RX 6000 上, AMD 充份利用 7nm 製程有利於製作小尺寸 SRAM 的優勢。據 AMD 統計, Zen2 32MB Cache 面積為 27mm² ,相當於 74mm² 總面積的 36.5% 。另一項統計是 128MB Cache 只比 4MB GPU L2 Cache 多 4 倍面積,卻可大大減少資料的讀寫時間,而且不會造成功耗的大幅度上升,成為 RX 6000 高性能的最大秘密。
AMD 以 Infinity Cache + 256-bit GDDR6 跟 384-bit GDDR6 作比較,表示有 2.1 7X 頻寬的增加,而功耗有 10% 的減少。作為對比, NVIDIA 針對 Server 及 Workstation 市場的 A100 GPU 也僅有 40MB L2 Cache 、 RTX 3090 僅為 6MB ,可見 AMD 的進取。
Ray-Tracing Core 的選擇
市場均非常關注 RDNA2 新增的 Ray-Tracing 功能,但 AMD 卻有意淡化 RDNA2 新增 Ray Accelerators 的作用,僅表示比軟件 Ray-Tracing 快 10X 。與 NVIDIA Turing/Ampere 架構每 Streaming Multiprocessor 設 1 組 RT Cores做法相似 , AMD RDNA2 每 Compute Unit 下設 1 組 Ray Accelerator 光線追蹤引擎,以 RX 6800 XT 為例便有 72 組,似乎比 RTX 3080 的 68組 RT Cores 還要強。然而 NVIDIA RT Cores 已發展至第 2 代產品,並且支援與 FP32 一同運算以提升效能,可見 AMD 仍需努力優化 RDNA2 架構。
RDNA2 沒有 DLSS 功能嗎?
從架構上來看, RDNA2 似乎沒有 RTX 30 的 Tensor Cores ,也自然沒有後者的 DLSS 功能。 Tensor Cores 原來是 NVIDIA 為了 Tesla 等工作站及數據中心 GPU 而設,至今已發展示第三代產品,可通過 INT4 及 INT8 等低精度運算提升效能,尤其對於 4K 及 8K 遊戲時幫助最大。筆者認為雖然 RX 6000 沒有 NVIDIA Tensor Cores ,但卻支援 INT4 及 INT8 混合精度運算,有機會提供類似 NVIDIA DLSS 功能。
ASUS ROG Strix LC RX 6800 XT 水冷版解構
送測的RX 6800 XT 由 ASUS 提供,採用 240mm AIO 水冷+風扇的混合散熱設計。前者主要為 GPU 及 GDDR6 記憶體散熱,而後者則針對 VRM 等供電模組的散熱。
規格
Game Mode Clock︰2,360MHz(Boost Clock)、2,110MHz(Game Clock)
記憶體︰16GB Samsung GDDR6
記憶體速度︰16Gbps
散熱方案︰ 240mm AIO水冷+70mm風扇 2-slot
介面︰PCI-E 4.0 x16
顯示輸出︰2×DisplayPort 1.4a、1×HDMI 2.1、USB Type-C
Power Connector︰2×8-pin PCI-E
建議用火牛︰750W
尺寸︰27.7×13.08×4.36cm(顯示卡)、27.6×12×5.17cm(冷排連風扇)
查詢︰ASUS HK (3582 4770)
售價︰待定