C114訊 7月18日消息(南山)大模型等AI應用,帶來了洶涌的算力需求,驅動著作為基礎承載的光網絡快速迭代升級。在CIOE中國光博會與C114通信網聯合推出的大型研討會系列活動——“2024中國光通信高質量發展論壇”之智算光網絡技術專場上,中國聯通研究院總師王光全發表演講,對此進行了深入解讀。
王光全介紹,發展東數西算、超算智算是實現網絡強國的重要戰略方向。智算新業務驅動流量高速增長,需要更大帶寬的網絡進行承載;同時隨著大模型參數量的增加,到萬億級、十萬億級時,其訓練不可能由一個算力中心高效完成,而是需要多個互聯的算力中心來協同完成訓練,呼喚更強的算力中心互聯能力。“2000年的PC互聯網時代,主要是PC上網,內容也不多,幾M的帶寬就可以滿足要求;2010年的移動互聯網時代,應用層出不窮,帶寬需要到百兆來匹配。當前,邁向智能時代可能需要千兆、萬兆帶寬。”
一方面,實現智算中心互聯,數據更多的交互,要求更極致的網絡成本,以便提供更有競爭力的算力服務;更快的TTM,用于快速的入算聯算;以及更高的可用率,以減少大模型訓練中斷造成的損失。據了解ChatGPT- 4訓練一次的成本是6300萬美元。網絡需要提供更極致的可用率,盡可能地減少智算訓練帶來的損失。
另一方面,從骨干網看,算力驅動下400G代際發展已經成熟,已成為新一代骨干網的主流選擇。“我們以公路交通出行為例,完整的高速駕駛系統需要有汽車發動機、需要有加油站,需要有高速公路、立交橋,為了安全可靠,還需要自動駕駛等。”王光全形象地比喻,400G/800G高速光傳輸系統非常復雜,如同一套高速駕駛系統,端到端包含四大關鍵技術:
一是電層的高速相干光模塊,用于承載業務,需要支持單波400G/800G傳輸速率,這是傳輸系統的源頭,相當于汽車的發動機;二是光層物理傳輸系統,核心單元包括光放大、光交叉,相比100G系統,需要擴展光譜,光譜寬度由C6T擴展到C6T+L6T,相當于高速公路上需要修建更大的加油站、更寬的路面、以及四通八達的立交橋;三是C+L系統的特有的均衡技術,需要克服SRS效應,構筑一個穩態的光系統;四是管控運維能力,需要具備智能化、數字化,網絡高可靠性,構筑400G/800G高速光傳輸系統的自動駕駛能力。
面向新一代光傳輸系統,從系統架構來看,王光全認為,C+L波段一體化是必然發展趨勢,從應用場景來看,尤其是支持ASON的ROADM網絡,一體化更是剛需。當前中國聯通已經聯合產業實現了WSS一體化,未來將繼續推進OTU/OA一體化。從動態恢復能力來看,光電協同保護提供差異化SLA和業務敏捷能力,增強網絡可靠性,滿足算力業務的高價值、高效率、智能化的承載需求,提供高可用率的算力網絡。
據悉,中國聯通2023年上半年在浙江、廣東、河南、山東等省進行了400G PCS-16QAM的實驗網驗證,下半年完成400G QPSK技術驗證并啟動了800G技術試點;今年第一季度進行了超高速的光電協同現網驗證,二季度則完成了800G PCS-16QAM的實驗網驗證并開展了空芯光纖的探索性驗證。
此外,面向東數西算的全光直連需求,中國聯通開展了DC間高通量高性能長距離RDMA無損傳輸試驗,首次實現了基于OTN無損流控和端網協同擁塞控制的3000公里長距RDMA流量傳輸現網驗證,端口帶寬利用率從20%提升到90%以上,為遠程協同智算奠定了技術基礎。
王光全最后指出,智算聯網目標架構,是基于全光底座實現算間高速互聯和高品質靈活入算。其整體架構基于中國聯通算力時代全光底座構建,通過算網大腦、智能管控系統實現智能管控。樞紐間通過400G、800G OTN、OXC以及光電協同技術構建10ms時延圈,實現算間高速智連,架構穩定,極簡,提供大帶寬、低時延能力;樞紐內通過端到端ROADM/OXC + OTN 和光電協同調度,實現一張全光網一跳直達,穩定低時延構建5ms時延圈;城市內通過ROADM+100G 到站將全光錨點升級為算力錨點實現多業務接入和靈活入云,用戶入算時延小于1ms。