更多

    GF RTX 5080 FE 效能解禁 RTX 4080 SUPER 玩家值得升級嗎?

    Wesley
    Wesley
    經遊戲進入腦界,見證 3D 渲染技術及遊戲引擎互相進步,深信 PC 平台或成最大贏家。

    Blackwell 世代來臨,加強 AI 運用表現及帶來 DLSS 4 多重影格生成技術,GF RTX 5090 D 無疑是封頂之選,但多數玩家都難面對它的售價,次一級 US$999 的 GF RTX 5080 才會是真正戰未來的考慮。對比上一代 RTX 4080 Super,新架構的價值如何?

    GF RTX 5080 改用另一顆新設計的 GB203 GPU,它保留了 GB202 中的所有主要功能,包括:Blackwell SM 引入的所有新技術,例如 Blackwell 的第四代 RT Core 和第五代 Tensor Core 以及 DLSS 4 和新的 AI 遊戲功能等。完整 GB203 晶片由 456 億個電晶體組成,包含 7 個 GPC、42 個 TPC、84 個 SM 和 8 個 32 位元記憶體控制器(總共 256 位元)。每個 SM 包含 128 個 FP32 CUDA 核心,整個晶片包含 10,752 個 CUDA 核心以及 84 個 RT 核心、336 個 Tensor 核心、336 個紋理單元和 112 個 ROPS。快取記憶體設有 10,752KB L1 快取、21,504KB 暫存器檔案和 65,536KB L2 快取。

    對比上代 RTX 4080 及 4080 Super,RTX 5080 核心的電晶體規格只有很微量變化,但當然受惠於 GDDR7 記憶體,可用頻寬就有比較大提升。很視乎新一代架構的效能改進。當然新卡亦會提供第九代 NVENC 編碼器,支援 4:2:2 格式加速。

    顯示卡GF RTX 5080GF RTX 4080 SuperGF RTX 4080
    核心代號GB203AD103AD103
    製程TSMC 4NTSMC 4NTSMC 4N
    電晶體數目456459459
    GPC 數目777
    CUDA / SP 數目10,75210,2409,728
    AI / Tensor 核心數目336320304
    RT 核心數目848076
    Texture Unit 數目336320304
    ROP 數目112112112
    L2 Cache64MB64MB64MB
    遊戲時脈2,617MHz2,550MHz2,505MHz
    記憶體時脈30Gbps23Gbps22.4Gbps
    搭載記憶體16GB GDDR716GB GDDR6X16GB GDDR6X
    記憶體位寬 bit256256256
    記憶體頻寬960 GB/s736 GB/s716.8 GB/s
    介面PCI-E 5.0PCI-E 4.0PCI-E 4.0
    功耗 Watt360320320
    首發售價 USD$999$999$1,199

    【延伸閱讀】Blackwell 架構細節
    【延伸閱讀】GF RTX 5090 D 顯示卡開箱
    【延伸閱讀】GF RTX 5090 D 效能測試

    GF RTX 5080 FE 開箱

    雖然中國地區將僅推出 GF RTX 5090 D,但對下其他型號跟國際相同,NVIDIA 提供 GF RTX 5080 Founders Edition,今代包裝設計都有大改變,使用更多環保物料設計,FE 卡提供的 3×8-pin 轉 16-pin 電纜有大改變,線身更為柔軟。

    FE卡提供的 3x8-pin 轉 16-pin 電纜(右上)有大改變,線身更為柔軟,插頭的纜線使用密封注塑。
    FE 卡提供的 3×8-pin 轉 16-pin 電纜(右上)有大改變,線身更為柔軟。

    至於顯示卡亦跟 RTX 5090 FE 一樣,使用全新 Double Flow Through PCB 設計,在背板及顯示卡尾部各有一把約 115mm 風扇及穿透式風道,內有導熱管鰭片。長度及高度跟 RTX 4080 SUPER FE 相若,雙槽闊度符合之前廠商主導的 SFF 高效顯示卡定義,背板提供 3 個 DP 2.1b 及 1 個 HDMI 2.1b 輸出。相信一般 AIC 顯示卡廠商並不會跟隨此複雜高密度的子母 PCB 設計,仍使用傳統單 PCB 及巨大散熱器。

    測試平台
    處理器:Core i9 14900K
    主機板:ROG MAXIMUS Z790 EXTREME
    記憶體:32GB DDR5-6000

    基本效能

    由於 GB203 核心晶圓規格有明顯縮減至跟 AD103 差不多,在《3DMark》可見比 RTX 4080 Super 快約二成作為參考。到實際遊戲表現中,支援光追及路徑追蹤渲染的畫質設定下,舉如《Cyberpunk 2077》及《黑悟空》,原生渲染能力大約有近一成提升,仍是沒法追上 AD102 核心的 RTX 4090。大概要使用到 DLSS 4 的 3X 影格生成,才可以超過 RTX 4090 的 2X 影格生成表現。

    DLSS 4 效能

    AI、生產力及多媒體編碼

    在 AI 及多媒體編碼方面,RTX 5080 轉用 GDDR7 記憶體有提升三成頻寬,對於 AI 文字生成語言模型測試的 LLAMA 模型有比較大提升約二成餘。全新 H.265 4:2:2 編碼加速表現跟 RTX 5090 相同有極高編碼速度,對影片製作流程有大幫助。

    至於 FP4 精度生成式圖片,目前尚處於測試階段,使用特製版本 Procyon 才可運行,可以比較 FLUX.1 dev 模型的 FP4 及 FP8 生成速度,在原生 FP4 模式下的確會比較 FP8 有顯著提速效果。其他生成式工具模型正在由社群優化成 FP4 版本,使用此類工具的用家需要花一點時間更新所用的模型。

    總結:靠 AI 跑贏大市

    GB203 核心的 RTX 5080 沒有改進製程,電晶體數量幾乎和 RTX 4080 Super 相同,但架構效率提升加上 GDDR7 記憶體,仍然令它的渲染表現平均有一成到二成增長,視乎應用環境而定,如 LLAMA 大型語言模型處理就可見近二成提升,而遊戲的光追路徑渲染模式亦有逾一成改善,以新卡的效能增長水平而言算是合理。不過部分舊款傳統渲染技術的遊戲表現增長就稍為有限。

    如果在支援 DLSS 4 多重影格生成的遊戲,則 RTX 5080 能夠使用 3x/4x 影格生成去超越 RTX 4090 的 2x 影格生成表現。由於顯示卡上市前的驅動程式並未能對多數 DLSS 3 遊戲進行覆寫,廠商指首發會有 75 款遊戲可使用覆寫功能,因此多重影格生成的支援廣泛程度,將會決定 RTX 5080 的真正價值及對玩家的吸引力。RTX 4080 Super 仍然是一張性能很高的顯示卡,配合有 VRR / G-sync 的顯示器遊戲效果足夠穩定,現有玩家毋須急於升級。如果很想用盡 4K144 顯示器規格,仍在 RTX 30 系列的玩家就肯定升級有感。

    延伸閱讀

    ZCOPE 最新影片

    您會感興趣的內容

    相關文章