C114訊 9月7日消息(水易)第24屆中國國際光電博覽會(CIOE)如期召開,在同期舉辦的“算力網絡與光技術發展論壇”上,中國電信光傳輸專業首席專家李俊杰表示,AI時代,數據中心已成為網絡流量的中心,也是光網絡建設的中心。
特別是隨著ChatGPT的爆火,人們逐漸意識到,模型參數規模與性能提升后,AI大模型訓練對于網絡的需求相比于傳統模型也隨之產生變化。對比現在緊缺的A100和A800的性能參數,A800被限制的是互聯帶寬,而不是算力。
“大模型訓練需要大規模集群算力的保障,網絡帶寬和性能限制影響集群算力的發揮。”李俊杰表示,因此在AI時代,進一步加強了對網絡質量的要求,尤其是數據中心內部組網要求大規模、高帶寬、低時延、零丟包。
DCN高速光互聯是剛需
對于大模型的發展,國內已是“百模”大戰之勢!吨袊人工智能大模型地圖研究報告》數據顯示,截至5月底,中國已經發布了79個大模型(10億參數以上)。
“百模”大戰帶來了數據中心流量的進一步升級,數通光模塊正逐漸實現100G-400G-800G三級跳躍。數據中心內部網絡(DCN)傳輸距離普遍在2km以內,考慮低成本IM-DD方案;數據中心間互聯(DCI)則必須使用相干(ZR/ZR+)。
在李俊杰看來,相對于數據中心互聯(DCI)網絡,數據中心內部(DCN)網絡面臨的挑戰更大,但機遇也更多。目前面向DCN的400G光模塊已日趨成熟,且標準完備。800G預計即將進入數通市場,相關標準仍在制定中,未正式發布,其中2km內光模塊將成為DC內主流。
不過,隨著速率的不斷提升,功耗和200Gb/s+ CEI電接口成為瓶頸。在主流設備商、互聯網廠商、光模塊廠商的推動下,CPO光電合封技術成為熱點, OIF等標準化組織也在積極推進CPO光模塊技術標準。
李俊杰指出,CPO能夠顯著降低功耗,降低電信號傳輸距離,提供信號質量;與可插拔相比,提高ASIC-光模塊互聯密度,高集成,節省空間。不過CPO相對依賴硅光子技術才能做到小型化高集成,需要借助硅光的工藝和封裝測試平臺;另外,更復雜的技術是否能帶來收益,目前可插拔方案能耗問題還能應對,沒到非用不可的地步。
在此背景下,LPO“線性直驅”成為新勢力。李俊杰介紹,LPO仍使用傳統光模塊封裝,DSP被放在設備側,非線性信號處理由設備實現,模塊只處理線性信號,這種方式降低了光模塊功耗和成本。
據了解,進入2023年以來,“線性直驅”已經開始影響產業界。今年3月,IPEC聯合Lightcounting舉辦了關于線性直驅技術的線上研討會;今年OFC上,模塊和芯片廠商聯合打造了112G Linear的樣機demo,OIF也在討論CEI-112G-Linear電氣標準。國內去年9月,由OTT牽頭在ODCC發布相關白皮書。
值得一提的是,全光交換技術開始走入數據中心。李俊杰介紹,先驅者已經將光線路交換(基于MEMS的OCS)引入DCN,展現了成本、功耗、時延等多方面優勢,但是需要架構性創新。“光線路交換技術進入數據中心內部是必然趨勢,光波長交換技術的應用值得研究。”
AI賦能光網絡智慧運營
發展AI大模型的主要目的是加速千行百業數字化轉型升級。因此光網絡技術的升級在推動AI大模型訓練高效可靠的同時,反過來AI技術和能力的持續提升,也將有效賦能光網絡智慧運營。
李俊杰指出,光網絡向超大容量、全光交換、超長距離、超大組網持續演進的同時,智慧運營也是光網絡發展的必然趨勢。
回顧光網絡智能化的進程,從傳統的人工運維,到逐步引入電層ASON、光層WSON,再到后來的SDN化實現集中管控和能力開放。如今已經邁入智能化,李俊杰介紹,目前AI技術已經在流量預測、態勢感知、故障溯源等多個場景展現了其價值。
在客戶流量預測場景,針對不同政企OTN用戶,實現對指定時段流量值的預測分析,現網數據(基于電信自研UMS控制器采集)驗證,預測準確度可達90%以上。“結合歷史數據,分析預測未來的流量趨勢,對路由選擇、擴容建設等有指導意義。”
網絡態勢感知場景,通過光纖傳感+AI算法,識別不同振動模式,提前預警光纜外破風險;通過光纖傳感+智能識別算法,檢測光纜同溝同纜風險。“引入AI,對各類破壞事件展開準確定位,快速精準指導搶修工作,提升運維效率。”
面向未來,數字孿生、大模型都將助力實現智能光網絡。數字孿生以數字化方式在物理網絡上建立一個鏡像數字網絡,實時反映網絡資源的狀態以及業務的運行狀態。對于大模型,高質量的數據是大模型發揮價值的基礎,運營商若希望借助AI提升智慧運營能力,首先需要大力夯實自主掌控的數據基礎。