來源:半導體行業(yè)觀察
人工智能的蓬勃發(fā)展引發(fā)了一場能源危機,其 耗電量甚至可能超過某些國家的用電量。隨著數據中心競相滿足人工智能對計算能力永無止境的需求,這場變革可能會重新定義我們對高性能計算的認知。其中一個解決方案是用更高效的東西——光——來取代幾十年來一直為計算提供動力的電氣互連。

高盛 預測,到 2030 年,數據中心電力需求將增長 160%,達到每年 945 太瓦時——相當于日本的全部電力消耗量。
問題遠不止軟件效率低下那么簡單。 據彭博社報道,人工智能訓練設施內裝有數十萬顆NVIDIA H100芯片,每顆芯片的功耗高達700瓦,幾乎是普通電視機功耗的八倍。加上冷卻系統(tǒng),一些超大規(guī)模設施的耗電量相當于3萬戶家庭的用電量,這促使科技公司認真考慮建設專用核電站。
應對這一挑戰(zhàn)需要從根本上改變芯片的設計和連接方式。硅光子學——利用光傳輸數據——有望在速度和效率方面顯著優(yōu)于傳統(tǒng)的電互連。精密光學制造使這種轉變成為可能,并實現(xiàn)了可擴展的工藝,從而支持下一代節(jié)能高效、高性能計算的發(fā)展。
硅光子學從根本上重新定義了數據在計算系統(tǒng)中的傳輸方式。它不再像傳統(tǒng)方式那樣通過銅線傳輸電子,而是利用光子(光粒子)在硅波導中傳輸信息。這些硅波導的功能類似于納米級光纖,并直接集成在芯片上。
效率提升非常顯著。光互連傳輸 每比特數據僅消耗 0.05 至 0.2 皮焦耳的能量,而相同距離下電互連的能量需求則高得多。隨著傳輸距離的增加,即使在單個封裝內,光子學的能量優(yōu)勢也變得壓倒性。
自2023年底以來,臺積電已發(fā)表多篇關于硅光子學的研究論文。該公司已宣布與英偉達(NVIDIA)建立公開合作關系,將光互連架構集成到下一代人工智能計算產品中。
據 Yole Group 預測,硅光子學市場規(guī)模將從 2023 年的 9500 萬美元增長 到 2029 年的 8.63 億美元以上, 年增長率達 45%,這反映了該技術預計將得到快速的商業(yè)應用。
這場能源危機的核心在于一個由來已久的根本性瓶頸。盡管計算性能飛速發(fā)展,但連接這些強大處理器的基礎設施卻未能跟上步伐。過去二十年間,硬件浮點運算速度(FLOPS)提升了6萬倍,但DRAM帶寬僅增長了100倍,互連帶寬同期也僅增長了30倍。
這就造成了工程師們所說的“內存墻”,即數據在處理器和內存之間傳輸速度不夠快,無法充分利用可用計算能力。在人工智能應用中,海量數據集必須在圖形處理器、高帶寬內存和其他組件之間無縫流動,這些互連限制就成了關鍵的性能瓶頸。
過去行之有效的解決方案——簡單地縮小銅互連線的尺寸并提高其密度——正接近物理極限。隨著銅線變得更細、數量更多,它們會消耗更多電力,產生更多熱量,并引入越來越難以控制的信號完整性問題。數據中心供電系統(tǒng)中的每一次電壓轉換都會造成效率損失,而銅互連線會加劇整個系統(tǒng)的這些損耗。
現(xiàn)代人工智能架構需要工程師所說的“堆棧內部高速訪問”。芯片變得更薄,互連技術從硅通孔 (TSV) 演變?yōu)榛旌湘I合,內存模塊必須以前所未有的速度直接連接到圖形處理器。但是,當這種高速內存連接必須通過電路板上的銅線才能到達另一個處理器時,帶寬優(yōu)勢就會大打折扣。
硅光子技術并非全新技術;多年來,它一直通過連接數據中心機架的可插拔收發(fā)器為電信網絡提供動力。這些成熟的系統(tǒng)采用硅光子芯片,并結合獨立的激光器和微透鏡技術,封裝成易于更換的模塊。
但人工智能的需求正將光子技術推向未知領域。這項技術不再僅僅是連接獨立的系統(tǒng),而是必須與處理器、內存和其他組件直接集成,工程師們稱之為“共封裝光學器件”。這種方法有望使光互連更接近實際計算環(huán)節(jié),從而在最大限度提高帶寬的同時,最大限度地降低能耗。
挑戰(zhàn)在于可靠性。雖然可插拔收發(fā)器在發(fā)生故障時可以輕松更換,但共封裝光系統(tǒng)直接與昂貴的圖形處理器和高帶寬內存集成,因此可靠性更高。如果此類系統(tǒng)中的光組件發(fā)生故障,維修難度和成本將呈指數級增長。主要芯片開發(fā)商的早期產品仍處于試點階段,在全面部署之前,他們會仔細評估其長期可靠性。
硅光子學之所以如此引人注目,是因為它既能利用現(xiàn)有的半導體制造基礎設施,又需要采用全新的精密制造方法。目前大多數硅光子器件仍采用CMOS(互補金屬氧化物半導體)設計規(guī)則制造,而CMOS設計規(guī)則比最先進的工藝落后好幾代,通常為45至65納米。這是因為與最小的晶體管相比,波導、調制器和探測器等物理元件的尺寸相對較大。
然而,制造要求卻遠非易事。要制造出高效的硅波導,需要在硅晶圓上加工出納米級的光纖電纜,并配備超光滑的側壁以防止光散射。這些結構中的任何粗糙度都會導致光損耗,從而降低系統(tǒng)性能,這就要求其具備遠超傳統(tǒng)CMOS制造工藝的精密蝕刻能力。
行業(yè)路線圖曾經預測到2035年才能實現(xiàn)的能力,如今已被領先的制造商提前實現(xiàn)。迫切的市場需求、巨額投資以及三十年來積累的光子學研究成果,共同造就了商業(yè)化的完美契機。
其影響遠不止于數據中心。隨著光互連技術變得更加經濟高效且成熟,它有望徹底改變從自動駕駛汽車到邊緣計算設備等各個領域。這項能夠實現(xiàn)可持續(xù)人工智能擴展的技術,最終也可能徹底改變幾乎所有應用場景下電子系統(tǒng)的通信方式。
問題在于這項技術能夠以多快的速度實現(xiàn)部署和規(guī)模化。隨著領先制造商已投入數十億美元,試點系統(tǒng)也已進入數據中心,光速計算的未來不再遙不可及。
硅光子學代表著一項根本性的技術變革,它可能決定哪些公司將引領下一階段的數字革命。正如銅互連技術的引入實現(xiàn)了前幾代產品的性能提升一樣,光互連技術也有可能突破阻礙人工智能發(fā)展的重重障礙。
對于正努力應對人工智能指數級增長帶來的可持續(xù)性挑戰(zhàn)的行業(yè)而言,硅光子學提供了一條無需在性能和環(huán)境責任之間做出取舍的發(fā)展路徑。通過以光學精度取代電學效率低下,這項技術有望在推動人工智能持續(xù)發(fā)展的同時,顯著降低其對環(huán)境的影響。

標簽: 點擊: 評論: