世界首顆超高并行光計算集成芯片「流星一號」
近日,中國科學院上海光學精密機械研究所空天激光技術與系統部謝鵬研究員團隊在解決「光芯片上高密度信息并行處理」難題上取得突破,研制出超高并行光計算集成芯片「流星一號」,實現了并行度>100 的光計算原型驗證系統。相關研究成果以《具備 100 波長復用能力的并行光計算》(Parallel Optical Computing Capable of 100-Wavelength Multiplexing)為題,以封面論文形式發表于《光:快訊》。
本文引用地址:http://www.104case.com/article/202506/471495.htm超高并行光計算集成芯片-「流星一號」
光計算集成芯片系統
光計算作為非馮·諾伊曼結構代表,具有可擴展、低功耗、超高速、寬帶寬、高并行度的天然優勢,是后摩爾時代破解高維張量運算、復雜圖像處理等大規模數據快速計算的關鍵技術,為人工智能、科學計算、多模態融合感知、超大規模數據交換等「算力密集+能耗敏感」場景提供硬件加速。
過往幾年,學術界和產業界持續對光計算芯片的矩陣規模、光學主頻開展深度探索,以臺積電的光計算芯片矩陣規模(~512x512)和美國加州理工學院的光計算光學主頻(>100GHz)為典型代表,分別呈現逼近工藝極限和物理極限的趨勢,進一步取得突破難度頗大。因而,有效擴展計算并行度是光計算性能提升的前沿發展方向,也是光計算邁向實用的必由之路。
上海光機所研究團隊圍繞光計算技術并行度提升,創新超高并行光計算架構,破解光計算芯片的信息高密度信道串擾抑制、低時延光信號高精度同步和跨尺度高密度器件集成等核心挑戰,在融合了多波長光源、高速光交互、可重構光計算、高精度光矩陣驅動和并行光電混合計算算法的基礎上,成功研發了全新片上并行光計算集成芯片系統。
該系統核心光芯片全部自主研制,包含了自主研制的集成微腔光頻梳 (頻率間隔~50GHz,輸出光譜范圍>80nm,可支撐波長復用計算通道數>200),作為芯片級多波長光源子系統;自主研制的大帶寬、低時延、可重構光計算芯片 (通光帶寬>40nm),作為高性能并行計算核心;自主研制的高精度、大規模、可擴展的驅動板卡,作為光學矩陣驅動子系統 (通道數>256);基于該光子集成芯片系統,首次驗證了并行度>100 的片上光信息交互與計算原型;在 50GHz 光學主頻下,單芯片理論峰值算力>2560TOPS,功耗比>3.2TOPS/W。
超高并行光計算架構
與傳統單波長光計算相比,在相同矩陣規模和光學主頻的條件下,超高并行光計算可通過波分復用提供超百路并行度,使算力提升 2 個數量級。換言之,在不改變芯片硬件的情況下提升并行度,就像將單車道的高速公路改造成可并行通行百輛車的超級公路,進而大大提高單位時間內的吞吐量。
實現整個系統的高效運行面臨諸多技術挑戰。在芯片設計層面,為支持百通道并行度,工作帶寬成為最關鍵的技術指標,它直接決定了計算芯片的并行處理能力。該團隊對芯片器件進行了特殊設計,確保器件具有足夠大的通光帶寬,并保持器件與芯片的帶寬一致性,降低信號串擾。
在操控系統方面,針對光計算芯片操控節點數量龐大的特點,研究團隊自主研發了高精度多通道光矩陣驅動子系統,以實現對光學矩陣的精確控制。此外,光源、光交互和光計算系統之間的兼容性問題也需要通過系統工程方法進行整體優化設計。
光計算從前沿技術邁向實用性技術
要實現光計算從前沿技術邁向實用性技術,必須充分發揮光子計算相對于電子計算的優勢,需要突破三個方面:
矩陣芯片規模:通過擴大光計算芯片的矩陣規模提升計算能力,該技術路徑主要受限于器件物理性質和制備工藝水平。
光學主頻:通過提高光信號的加載速率實現更大計算能力,其受限于器件本身的性能。
信息并行度墻:這是決定光計算能否實用的關鍵,需要通過多維信息復用的方式,實現更大的信息吞吐量。
上海光機所研究團隊最重要的創新點在于實現了光芯片的高并行度計算能力。在當前工藝情況下,「矩陣芯片規?!购汀腹鈱W主頻」提升有限且代價大,而突破「信息并行度」是光計算性能提高的極優選擇。其有望將光計算的算力能力提升 2-3 個數量級,使其達到與電芯片、電子計算同臺競技的性價比水平。需要特別指出的是,雖然當前研究成果在矩陣規模和光學主頻方面仍存在提升空間,距離超越最先進 GPU 芯片的性能還有一定差距,但研究團隊對未來發展持樂觀態度。
如果未來能將目前行業內最大的矩陣規模、最高的光學主頻和本研究實現的超百并行度這三個關鍵參數進行系統集成,從理論上來看,單芯片算力有望突破 5000POPS,這一性能相當于 1000 顆英偉達最先進芯片的算力總和。
評論