4月23日,在2025年云網智聯大會主論壇,中國移動研究院攜手中國通信標準化協會、中國信息通信研究院、華為、中興、博通、新華三、上海貝爾、銳捷、思博倫、盛科等10余家合作伙伴,聯合發布了《分布式推理網絡(Distributed Inference Network,DIN)技術白皮書》,中國移動研究院副院長段曉東、中國信息通信研究院科技委主任蔣林濤、中國通信標準化協會TC3主席趙慧玲及合作伙伴代表共同出席了發布儀式,中國移動研究院基礎網絡技術研究所副所長程偉強對白皮書進行了解讀。
2025年,隨著DeepSeekAI大模型的火爆,DAU增長速度不斷刷新行業記錄。然而,隨著海量并發用戶請求訪問,服務器資源被大量消耗,多次出現網頁和API無法訪問的情況。同時,AI大模型的火爆也吸引了攻擊者使用多種技術和手段持續攻擊。隨著普惠AI推理時代的到來,用戶訪問需求及網絡流量模型將出現新的變化,需要考慮構建以AI業務為核心的訓推融合的網絡。針對AI推理服務爆發式增長,當前面臨AI推理基礎設施能力不足,AI推理網絡技術待完善,AI服務網絡安全防護能力待提升等挑戰。
分布式推理網絡(DIN)是中國移動研究院面向普惠AI服務提出的新型網絡架構,采用“端-邊-云-網”分布式協同架構,融合運營商協議可編程和網絡流量感知調度能力的優勢,面向用戶實現“推理無處不在、智能觸手可及、服務體驗最優”,面向推理服務提供商實現“模型隨需部署、隨需更新、彈性調度、高效應對海量并發”的目標。DIN通過微流級流控、層次化細粒度切片以及以太網相干PHYSec等技術,達成廣域納級丟包、微秒級抖動、多層次安全等目標,支撐算網一體安全推理、邊云協同后訓練、模型分層協同、大小模型協同、訓推協同進化、PD分離協同等多種端邊云協同模式,有效應對十億級用戶、IOT的海量并發推理挑戰,助力AI推理普惠化發展。
目前,中國移動在福建已成功完成業界首個分布式推理網絡DIN技術試點,現網驗證了算網安一體機推理、大小模型協同推理、PD分離推理服務場景及關鍵技術。現網驗證表明,算網安一體推理可滿足企業分支安全訪問總部推理服務,可有效保障模型數據安全和推理訪問安全;通過大小模型協同,用戶可按需訪問邊緣或遠端DeepSeek 7B/70B/671B不同參數模型;通過PD分離技術,可在滿足相同業務SLA條件下有效節省計算資源成本,同時驗證了用戶體驗無劣化情況下,PD分離可拉遠距離200-300km。本次試點為進一步完善分布式推理網絡DIN技術體系、拓展業務場景、推動形成產業共識、助力全民AI普惠業務的發展打下堅實基礎。
下一步,中國移動在分布式推理網絡方面,將聯合產業共同構建融合端、邊、網、算的DIN技術體系和標準體系,解決大模型在個人(ToC)、家庭(ToH)及企業(ToB)應用中的成本、效率與場景適配難題,并在實踐中與合作伙伴形成AI推理時代的新商業模式,助力加速全社會普惠AI時代到來。