伴隨著 NVIDIA 新一代 GeForce RTX 2080/2080 Ti 的登場,NVIDIA 也推出第三代 SLI(即 NVLink SLI),取代 GeForce GTX 1080/1080 Ti 的 SLI-HB Bridge。NVLink SLI 是 NVIDIA 自 SLI 推出以來最大的變革,宣稱最高頻寬可達 100GB/s,配合 2×RTX 2080 Ti後,又可以提供怎樣恐怖的運算性能呢?
SLI 這名辭並非 NVIDIA 首創,它是 NVIDIA 當年主要對手 3dfx Voodoo 的一項加速技術,在 NVIDIA 收購 3dfx 後,NVIDIA 借用 SLI 作為全新 GeForce 6000 系列多卡加速技術的命名。早期的 SLI 架構主要利用 PCI-E介面的頻寬作為兩卡之間的橋樑,由卡頂的 MIO(Multiple Input/Output)接口作為指令的傳輸。另外也有一些入門級的顯示卡取消 MIO 接口,僅採用 PCI-E 軟件 SLI 方案。
自 SLI 推出以來,SLI 架構並沒有多大的變化,直至 Pascal 年代才進行一次重要的升級。這次升級不但提升工作時脈(從 400MHz 增至 650MHz),而且改用雙 MIO 架構以提升頻寬,但 Pascal 並沒有一刀切放棄對舊 SLI Bridge 的支援,可以考慮在降低效能的情況下沿用舊 SLI Bridge,因此整個 SLI 架構並未出現重大變化。
來自超級電腦的 NVLink 技術
NVLink 技術推出於 2014 年,主要供多 Tesla P100 協同運算之用,也可用於連接 IBM Power 8+/9 CPU,打造超級電腦方案。NVLink 架構類似 PCI-E 採用點對點結構、串列傳輸,lanes 數目定於 x8,略少於 PCI-E 主流的x16 lanes。
不過 NVLink 的速度極高,1.0 版已有 20GT/s,2.0 版更有 25GT/s,明顯比 PCI-E 3.0 的 8GT/s、PCI-E 4.0 的16GT/s 高,使總頻寬分別達到 20GB/s(1.0)及 25GB/s(2.0),不下於 PCI-E 3.0 的 16GB/s。
RTX NVLink Bridge
在 RTX NVLink Bridge 上,NVIDIA 賦予它 NVLink 2.0 技術,工作在 25GT/s。在每片 RTX 2080/2080 Ti 顯示卡上,頂部均有一條 x8 lanes NVLink 插槽,它在 RTX 2080 為單組 NVLink,可用頻寬是 25GT/s×2(雙工)x8/8 = 50GB/s。若果換了是 RTX 2080 Ti,因為 TU102 核心運算能力較高的關係,改為兩組 NVLink,可用頻寬增加 1 倍至 100GB/s。
3-Slot 寬度成標準
上一代 SLI-HB Bridge 因為是 SLI Bridge 的改良版,基本架構並沒有太大的變化,仍有 2-way、3-way 及 4-way不同的版本。考慮到 Turing 核心運算能力較高關係,NVIDIA RTX NVLink Bridge 設計僅提供 3-way 及 4-way 版本,以確保顯示卡之間擁有足夠的散熱空間。不過這設計與一眾 Intel Z390/Z370 主機板的 2-way SLI 佈局不同,產生兼容問題。
另外,RTX NVLink Bridge 的官方售價也從 SLI-HB Bridge 的US$39.99 猛增至 US$79.99。而自 Pascal 開始,NVIDIA 拒絕公開 3-way 及 4-way SLI功能,在 Turing 核心也不例外。
SLI-HB Bridge 與 RTX NVLink Bridge 比較
非公板設計的 ASUS ROG-NVLink
擁有 ROG 血統的 ASUS ROG-NVLink 主要為配合旗下的 RTX 2080/2080 Ti 顯示卡而設計。此卡加入多項 Gamers 喜歡的功能,如鏡面設計、ROG 之眼 LED,以及 Aura Sync RGB 同步特效功能等等。
[row][double_paragraph]
[/double_paragraph][double_paragraph]
[/double_paragraph] [/row]
不過,最令筆者印象深刻的,是 ASUS 針對官方設計的不足,在 3-Slot 版本支援 2-Slot SLI 主機板(60mm 寬度),也就是主流 Intel Z390/Z370 主機板兩條 PCI-E x16插槽之間的空間。至於 4-Slot 版本則支援 3-Slot SLI 主機板(80mm),符合 NVIDIA RTX SLI 的要求。
售價:HK$899
查詢:ASUS(3582 4770)
RTX SLI 的優化設定
挑戰 1+1>2
實測 RTX 2080/2080 Ti NVLink SLI
NVIDIA曾經表示,每代產品在 SLI 後效能提升水平均有所提升,另一方面則強調新一代遊戲在 SLI(尤其是 3-way 及 4-way SL)優化的困難。對於 RTX 2080/2080 Ti SLI,NVIDIA 並不強調其效能提升多少,但表示 NVLink RTX 2080 的應用在於 5K 75fps+、4K 144Hz Surround 或 8K Gaming。至於最高級的 NVLink RTX 2080 Ti 會以 8K Surround 為主。筆者沒有多台 4K 顯示器,決定先以 4K Gaming 測試為主。
分析:3D Mark 測試最高 92.33%
3D Mark 測試是最能發揮 SLI 性能的測試。在《3D Mark Spy Time》測試中,RTX 2080 SLI 及 RTX 2080 Ti SLI 的組合分別取得 73% 及 66.44% 的增長。如果單看 Graphics Score 的部分,這一幅度更分別達到 92.33% 及 88.81%,十分可觀。然而在遊戲測試的部分,明顯驅動程式未能作出優化,除了《Rise of the Tomb Raider》外,其餘遊戲只有少幅度增長,甚至不升反跌。
2080 SLI 表現最為耀眼
原本以為,RTX 2080 Ti SLI 因為有兩組 NVLink 的關係,表現應該較單組 NVLink 的 RTX 2080 SLI 好,可事實上 RTX 2080 SLI 效能增長較好。筆者認為,一部分原因是現在的驅動程式優化不足,未能發揮 RTX NVLink SLI 的威力;另一方面是 RTX 2080 Ti 本身運算能力較高,都是一大因素。此外,兩張 RTX 2080 Ti 一起工作時發熱量較高,不用特別散熱時「裸跑」GPU 達 85℃,也有可能影響到效能。
Z390 NVLink SLI 測試
除了 AMD X399 平台外,筆者也測試了主流的 Intel Z390 平台,看看在 x8+x8 SLI 組合下的性能。由於測試時剛好手上沒有 RTX 2080 顯示卡,僅能測試 RTX 2080 Ti 的組合。這部分的測試主要改用 Intel Core i7-8700K(6C/12T 3.7GHz Base/4.7GHz Turbo)CPU、ASUS ROG MAXIMUS XI FORMULA 主機板及 2×16GB Corsair DDR4-2666 CMK16GX4M1A2666C16@XMP 記憶體。
分析:雙 x8 SLI 對效能影響不大
早前有報道指,x8 會影響 RTX 2080/2080 Ti 的效能,這次改用 Z390的 x8+x8 組合,是否也會對效能產生影響呢?就測試結果來看,RTX 2080 Ti SLI 效能增長似乎不因為改用 x8+x8 而出現明顯下降,可見 x16+16 組合對於 RTX 2080 Ti 並非必要,出於成本的考慮,Z390 主機板加 Intel 9/8 代 Core CPU 似乎是更高性價比的 RTX NVLink SLI 平台。
Ray-Tracing 會是用武之地?
總的來說,RTX NVLink SLI 並沒有表現出應有效能。筆者認同新技術優化需要,這也無可厚非,另來是 Ray-Tracing 等高階功能尚未開放。隨著新一代 Ray-Tracing 遊戲陸續上市、驅動程式提供更多的優化,相信 RTX NVLink SLI 會表現出應有的效能。