C114訊 7月19日消息(岳明)昨日,“2024中國高質量發展論壇”的第六場線上論壇——“智能光網絡技術專場”順利舉行。論壇邀請來自產業界及學術界的多位重磅嘉賓,圍繞智算時代下光網絡的架構和關鍵技術,AI大模型在DCN和DCI等多種場景中的應用實踐,光網絡通感一體/光算一體等熱點話題,進行深入探討。
會上,中國移動研究院基礎網絡技術研究所主任研究員李允博應邀作了題為《智算時代下智能光網絡技術發展與探討》的主題演講。
李允博表示,人工智能與光網絡發展緊密關聯、相得益彰,光網絡是實現人工智能代際躍遷的關鍵基礎技術,而人工智能促進光網絡功能更加強大、性能更加先進,增強其為上層業務的服務能力。作為AI算力的載體,智能光網絡將構建智算中心內外高可靠、大帶寬、低時延、跨域協同的堅實基座。
面向算力網絡業務:光通信呈現四大發展趨勢
李允博指出,中國移動就400G長距傳輸進行持續性的技術攻關,主導了QPSK、130G高波特率器件和12T寬譜傳輸技術發展和產業實現,為構建算力網絡的大帶寬、低時延全光底座打下堅實基礎。面向算力網絡業務發展,光通信并存“理論研究全局化、非線性化”、“傳輸系統寬帶化、多維化”、“光連接多元化、立體化”、“光網絡孿生化、智能化”四大發展趨勢。
面對光纖的非線性香農極限,可以考慮采用新的顛覆性空芯光纖來降低傳統石英光纖的非線性;從現有C+L波段進一步擴展到S波段、U波段,提升整個光纖傳輸容量;將光連接向下沉至芯片之間,向上提升至衛星光通信,實現光連接技術向立體架構延伸;同時,隨著光網絡規模的不斷擴大,充分利用光網絡數字孿生構建起自愈自優動態智慧的光網絡。
面向未來技術演進,業界在不斷推進800G核心器件的高速化和寬譜化技術發展,包括更高波特率的技術攻關,更寬譜光纖放大器、光合分波器的的研制。在物理介質層面,反諧振空芯光纖技術成為業界關注焦點。
中國移動首先實現了空芯光纖(極小物理量)非線性系數的上限測定,首次對空芯光纖的方向性獨立自由維度進行開發,提出光纖同頻同時全雙工無損傳輸理論;2024年6月,開通首個800G空芯光纖傳輸技術試驗網,實現了基于空芯光纖的20km單芯光纖雙向128Tb/s超大容量傳輸試驗,并實現空芯-空芯光纖熔接損耗低至0.05dB、空芯-實芯連接小于0.3dB和鋪設后光纜損耗每公里0.6dB等多項核心技術指標,均達國際一流水平。
AI賦能光網絡:數字孿生技術成為關鍵
李允博表示,隨著新業務和新技術的蓬勃發展,網絡規模呈指數級增長。新興網絡服務對基礎光網絡提出了更高要求,迫切需要推進傳送網數智化轉型,實現光網絡運維提質增效,滿足用戶極致體驗追求。“我們面臨著組網技術差異大,模擬信號感知難,實施檢測要求高的需求,需要探討引入人工智能去提升光網絡的運維效率。”
李允博介紹,面向光網絡現狀和數字孿生主要功能特點,中國移動設計光網絡孿生總體架構,提出跨層、跨域、跨界技術理念,以及云管端協同訓練、層次化多協議協同、模塊化系統設計等技術架構思路。在跨層方面,通過光層OAM拉通光電協同感知調度;跨域方面,通過統一標準Telemetry實現數據同步;跨界方面,則引入層次化智能檢測和決策,實現聯動算力業務與基礎網絡的聯動。同時,中國移動綜合運用云管端協同訓練,層次化協議協同和模塊化系統設計等關鍵技術,來提高整個數字孿生光網絡泛化能力、高效感知和網絡服務的平滑演進。
在AI賦能光網絡實踐方面,中國移動創新同溝同纜檢測、健康度預測等技術方案。比如在光纖同溝風險深度智能識別領域,可以做到實時感知光纖靜態特征參量(長度、衰減、熔接點)和動態特征(車輛、施工等引發的振動)參量,全程免人工參與,同路由整體識別準確率達 97.7%。
四大技術突破點:智算中心組網重要性凸顯
智算中心是AI算力的物理載體,主要由GPU服務器聯網構成的智算中心需要更加先進的基礎網絡服務。作為承載上層智算業務的重要基礎設施,在AI時代,光網絡與時俱進技術不斷突破。
李允博指出,人工智能自身的發展離不開光網絡提供的有效保障。在智算中心的發展過程當中,與光模塊、光纖、業務調度、智算拉遠的技術發展息息相關。光模塊需要進一步降低功耗、降低時延、提高可靠性;通過引入新的光纖架構和新型光纖,可以進一步降低數據中心內部和數據中心之間業務傳輸的時延;通過引入光交叉則可以進一步提升數據中心內部業務調度的靈活性,并可以通過隔離故障點的方式,提高數據中心內部服務器的可用性。
在高速光模塊方面,速率正在從400G到800G乃至1.6Tbps演進,中國移動協同業界積極推動標準發展,聯合攻關高速EML、硅光等多種關鍵技術,促進AIGC大模型等新型應用繁榮發展。在智算中心內部,傳統基于純電交叉的交換機面臨著擴容的瓶頸,同時也面臨100G/400G/800G混合組網的現實,基于端口級的光交叉技術,可以實現低時延、低功耗的交叉調度和混合組網,同時它還具備拓撲重構、按需擴展、冗余保護的特性,可以實現數據中心內部更高效率、更可靠的業務調度能力。
另外,隨著智算中心規模的不斷擴大,從萬卡集群走向10萬卡集群,在電力供應、機房空間等方面面臨新的瓶頸,通過網絡能力可換取更大的集群規模,同時可以整合算力資源孤島。李允博表示,當前應重點解決園區跨機樓互聯和同城多局址互聯問題,滿足十萬卡建設需求;同時加快跨省多節點互聯技術研究和驗證,滿足未來3-5年潛在的超十萬卡組網需求。目前,中國移動已經完成2/10/20/40/60/80/100公里OTN承載分布式智算試驗,正在聯合產學研、多專業協同進一步攻關千公里級智算拉遠關鍵技術。