近來顯示卡界都沒甚麼新的家用產品, AMD 自從推出 Vega 56、Vega 64 後,就因蒙上延遲出貨的陰霾,至非公版到貨時,都沒引起甚麼迴響。而 NVIDIA 雖在去年 12 月發表新的 Volta 架構 GeForce TITAN V 顯示卡,但價錢極昂貴,又針對商用研究市場,最近還被揭發偶爾會運算錯誤,淪為笑柄。在掘礦的熱潮下,不論 A 卡還是 N 卡,都被礦工大手掃貨、炒高市價,令真正的砌機玩家叫苦連天。外界都一直都期望 NVIDIA 能於今天的 GTC( GPU Technology Conference )發表新的 Ampere 架構 GeForce GTX 2080 系列、或者是傳聞的 Turing 架構掘礦專用卡,希望新氣象能消除負面消息。然而「老黃」 NVIDIA CEO 黃仁勳可能是想繼續賺取掘礦熱潮的豐厚利潤,所以民眾的「訴求」都沒在 GTC 達成, GTX 2080 更據聞延期至夏天才有,今次在 GTC 發表的新技術都側重於數據中心、 AI 深度學習、大型運算等商業範疇。(直播連結請按此)
世上最大 GPU 與 DGX-2 超級電腦
大家先別按回上一頁,雖則今年 GTC 的重點不在於家用砌機市場,但 NVIDIA 都發表了不少新穎的技術,其中「世上最大的 GPU」( The World’s Largest GPU )最為矚目。很多時新推出的顯示卡都是史上最快的啦, NVIDIA 這樣形容是否指體積大如桌面的顯示卡,然後內裡有很多很多的電晶體,運算速度極快之類?可以說部分正確啦,因為這並不算是單一張顯示卡,而是把 16 張 Tesla V100 「串連融合」成一體,形成最大的 GPU ,放在一台叫做 DGX-2 的超級電腦中。所以其實這個「最大 GPU 」都沒有正統的型號名字,它內裡每張 V100 都具備 5,120 個 CUDA Core 、 32GB HBM2 記憶體(原本每張 16GB ,現在翻倍)、 900GB/s 記憶體頻寬,再乘以 16 ,就會得出「最大 GPU」 81,920 個 CUDA Core 、 512GB HBM2 記憶體、 14.4TB/s 記憶體頻寬的驚人規格。
這樣的話,自己組台伺服器,再放 16 張 Tesla V100 都可以啦,為何要買 DGX-2 呢?其實重點在於接連這 16 塊 GPU 的「超級膠水」,當中包含了 12 個嶄新的 NVSwitch 技術「橋接」,那就可把 16 張 V100 連成一體、共享運算及記憶體資源,卡與卡之間又沒甚麼延遲,運作上儼如一個極大的 GPU。
那麼也要有個特別設備,才能裝得下如此獨特的「最大 GPU 」吧?所以 NVIDIA 於 GTC 一併推出 DGX-2 的 AI 超級電腦,內裡採用「最大 GPU 」,再配上 2 顆 Intel Xeon Platinum CPU 、 1.5TB 系統記憶體、 30TB NVMe SSD 、以及 100Gbps 乙太網絡,打造強大的深度學習、 AI 研究專用的伺服器,運算性能高達 2 PetaFLOPS !(全球最快的超級電腦則為 125 PetaFLOPS , DGX-2 是要納入全球最快的排行榜嗎?)。相比傳統的數據中心,DGX-2 大概只佔 6U Server 櫃,重量僅為 350lb ,耗電只有 10,000W ,賣 $399,000 美元(約 $3,112,200 港元),能為企業及科研中心省下不少數據中心地租、電力和運作成本,生產力又非常高,能於數分鐘至數小時內,極速發掘出隱藏於大量資料中的模式,並把模式分析、轉化為有用的知識。
新 Quadro GV100 增添 RTC 光影追蹤技術
除了針對 AI 人工智能市場的「最大 GPU」和 DGX-2 外, NVIDIA 亦為圖像處理的伺服器繪圖卡產品線推出新型號。繼去年六月的 Tesla 級「 Tesla V100 」後,今次就把 Volta 架構延伸至低一個檔次的 Quadro 產品線,推出「 Quadro GV100 」。 Quadro GV100 具備 5,120 個 CUDA Core 、 32GB HBM2 記憶體和 640 個 AI 運算用的 Tensor Core , Tensor 性能達 118TFLOPS 。再加上今年 NVIDIA 很愛用的相互串連概念,用 NVLink 串連兩張 GV100 又可把規格翻倍!
另外 GV100 也增添了 NVIDIA RTX 光影追蹤技術( Ray Tracing Technology ),可於遊戲和多媒體中實時造出仿如拍攝電影般迫真的光影效果。當中要計算光源射進來,環境中每一個物件應該是哪些位置最光,物件用的物料會如何影響反光效果,以及人物望著環境的視角等等,現在 GV100 能實時計算那麼多複雜的數據,確實是科技的一大進步,未來大家玩線上遊戲,也可能會有更迫真的光線倒影效果,看以下影片就能明白。
[ot-video][/ot-video]
Tesla V100 獲規格升級
另外剛才所提及的 Tesla V100 GPU ,在今次的 GTC 大會亦能獲得規格提升。記憶體由原本的 16GB HBM2 升級至 32GB HBM2 ,與新出的 Quadro GV100 看齊。
NVIDIA GTC 2018 小結
雖然今次的 NVIDIA GTC 大會都沒有回應一般用家的砌機遊戲卡與掘礦方面的需求,但 NVIDIA 展示了「最大 GPU 」、 DGX-2 、 Quadro GV100 、 RTX 等多種新技術,為數據中心、深度學習和 AI 範疇帶來技術性的突破,開創新局面與發展機遇。
Source:NVIDIA GTC 2018 直播