Deepseek加速行業推理應用,面向企業算力租用以及推理數據不出園區的用算需求,上海電信基于“智云上海”新型基礎架構,部署華為星河路由器打造400GE IP智算城域POD,提供分布式云邊協同推理方案,加速算力資源在運營商和企業側高效流轉,降低企業的AI使用門檻,推動AI技術的普惠化進程。
隨著數字經濟時代全面開啟,算力正為各行各業的數字化轉型注入新動能。各個企業加速行業推理應用,以央國企,政教醫等多行業為代表,85%的訓推算力需求通過租賃運營商的算力資源來滿足。由于企業私有數據敏感,要求數據不出園區,越來越多的企業要求租賃的算力資源部署在園區內部。但受限于散熱和供電等條件等限制,園區內部無法規模部署算力服務器,整體承載算力有限。上海電信打造的400GE IP智算城域POD成為聯接企業園區和運營商智算中心的數字底座,云邊協同訓推方案為企業提供高品質算網一體服務,該方案具備如下亮點:
云邊協同推理,分布式推理效率不下降: 為了匹配推理算力快速增長的需求,企業優化推理模型部署,將模型部分Prefill層部署在本地算力服務器,將Decode層部署在運營商智算中心的推理池內,本地算力和云端推理池通過智算廣域網來傳輸不可還原的中間數據層,保護企業敏感數據不泄露。分布式推理模式一方面滿足企業數據傳輸安全的訴求,另一方面企業可以靈活租賃運營商的推理算力資源來應對推理需求的變化。經現網測試驗證,智算廣域網絡提供的RDMA無損傳輸技術實現基于DeepSeek跨240公里拉遠推理效率不下降。
RDMA無損傳輸,模型拉遠訓練效率不下降:部分行業客戶采用基礎大模型疊加私有行業數據進行二次訓練和模型微調,企業將私有行業數據部署在園區,租用運營商智算中心算力卡進行存算分離拉遠訓練。智算業務傳輸采用RDMA協議,協議本身對丟包率的敏感度提升了1個數量級,千分之一的丟包導致模型訓練效率下降50%。智算IP城域POD里每臺路由器能夠深度識別RDMA報文,通過千萬流秒級調度以及流級精準流控技術實現廣域RDMA無損傳輸,跨百公里拉遠算效不下降。
400GE彈性算網,模型快速部署:企業在運營商智算中心完成模型訓練后,需要將模型快速部署在企業指定的推理池內。傳統基于數據拷貝加硬盤快遞的線下模式,模型搬運周期長,并且在運輸過程中存在丟失損壞的風險。智算IP城域POD支持100M-100G彈性專線實現TB級數據分鐘達,實現數據模型敏捷部署。
面向未來,上海電信攜手華為繼續完善云邊訓推一體的方案內涵,基于面向AI WAN的智算IP廣域網方案,為企業內部以及各行業、各領域的數字化、智能化轉型提供強大動力,在新時代的競爭中搶占先機,實現可持續發展。