光纖技術已經被廣泛用,原來只限於遠距離的高速數據傳輸,數據中心內的通訊仍然使用銅質電線為主,成為內部通訊的阻礙。不過,IBM 近日發表新一代光電共封裝 (co-packaged optics,CPO),可令數據中心內部也有光速連接,甚至能大幅提升 AI 的運算效能及成本。
- IBM 發表最新論文,展示其全球首發、可實現高速光學連接的光電共封裝原型。這技術能提高數據中心的通訊頻寬,減少 GPU 停機時間從而加快 AI 的運算速度。IBM 指出,通過銅質電線連接的 GPU 加速器可能有一半以上時間處於閒置狀態,在大型分布式訓練過程中需要等待來自其他設備的數據,導致高昂的成本和能源浪費。但光電共封裝技術則可改善眾多問題:
- 降低生成式 AI 的成本:跟中距電氣互連裝置相比,能耗降低 5 倍以上(從每比特 5 微焦降至不到 1 微焦),同時將數據中心互連電纜的長度從 1 米延長至數百米。
- 高 AI 模型訓練速度:與傳統的電線相比,使用光電共封裝技術訓練大型語言模型的速度快近五倍,從而將標準大語言模型的訓練時間從三個月縮短到三周;用於更大的模型和更多的 GPU,性能將獲得更大提升。
- 提高數據中心能效:每訓練一個 AI 模型所節省的電量,相當於 5,000 個美國家庭的年耗電量總和。
IBM 高級副總裁、IBM 研究院院長 Dario Gil 表示:「光電共封裝技術可以幫助數據中心從容面向未來,光纖電纜也將大幅提升數據中心的數據傳輸效率,晶片之間的通訊、AI 工作負載的處理也會更高效,一個更高速、更可持續的新通訊時代快將來臨。」
論文還強調,光電共封裝技術旨在擴大加速器之間的互連密度,幫助晶片製造商在電子模組上添加連接晶片的光通路,從而超越現有電子通路的限制。IBM 論文所述的新型高頻寬密度光學結構和其他創成果,如通過每個光通道傳輸多個波長,有望將晶片間的通訊頻寬提高至電線連接的 80 倍。
論文還指出,新一代光電共封裝技術還可以讓晶片製造商在硅光子晶片邊緣增加六倍數量的光纖,即所謂的「鬢發密度 (beachfront density)」。每根光纖的寬度約為頭髮絲的三倍,長度從幾釐米到幾百米不等,可傳輸每秒萬億比特級別的數據。 IBM 採用標準封裝工藝,在 50 微米間距的光通道上封裝高密度的聚合物光波導 (PWG),並與硅光子波導絕熱耦合。
同時,這款光電共封裝模塊採用 50 微米間距的聚合物光波導,首次通過製造所需的所有壓力測試。這些模組需要經受高濕度環境、-40°C 至 125°C 的溫度以及機械耐久性測試,以確保光互連裝置即使彎曲,也不會斷裂或丟失數據。此外,研究人員還展示了 18 微米間距的聚合物光波導技術:將四個聚合物光波導設備堆疊在一起,可以實現多達 128 個通道的連接。