C114訊 5月24日專稿(蔣均牧)燧石取火讓原始人掙脫黑暗桎梏,蒸汽轟鳴為工業革命注入澎湃動能,硅基芯片的誕生催生了信息時代的高度繁榮……一個個“底座”,構成了人類文明進步的長梯。現如今,人工智能(AI)的浪潮席卷全球,各種AI應用如雨后春筍般涌現,日益成為生產力、創造力的代名詞。如何筑牢托舉起算力這一新時代“火種”的底座,使之如源頭活水般精準灌溉千行萬業,已然成為一個匯聚各方視線的核心議題。
2025年世界電信和信息社會日智算產業創新發展專題研討會上,華為昇騰計算業務副總裁王慶文以“共筑堅實智算底座,加速行業智能化”為題,勾勒出一幅算力筑基、產業共榮的藍圖。基于對AI產業趨勢、運營商算力基礎設施建設與行業智能化發展路徑的深度解讀,他給出了昇騰的答案:大規模專家并行(大EP)集群推理方案。
通過將混合專家(MoE)模型的專家權重分散到更多計算卡上,變“單機獨奏”為“集群交響”,在硬件性能受限的現實中,昇騰用系統級優化開辟新局面——不僅吹響了眾多行業效率革命的號角,提供了運營商深度參與AI盛世的利器,更為國人握緊AI產業發展的“方向盤”創造了條件。
AI2B奇點已至,運營商具天然優勢
“如果說訓練是上學,推理就是上班。”王慶文用一句生動的比喻,道破了AI產業從技術探索到商業落地的躍遷。Gartner數據顯示,2025年全球80%的中國企業將部署生成式AI,60%會將AI融入核心生產系統,標志著企業AI應用從通用場景向核心生產場景滲透的“奇點時刻”到來。
這一轉變的背后,是AI推理從“可用”到“好用”的質變。首先,AI在深度搜索、思維鏈、多模態融合等技術方面已經取得了明顯的突破。大語言模型從原來的黑箱式的問答走向可解釋的因果推理,在多個逐步達到了媲美領域專家的水平。例如某三甲醫院的AI醫療診斷系統將單張病理切片分析時間從40分鐘壓縮至秒級,效率提升超百倍;某日化巨頭的AI質檢系統將故障率從2.3%降至0.05%,年省成本超300萬元;上海300所中小學的教師利用AI來備課,將備課時間縮短82%,教案生成效率提升300%。
其次,AI模型生態已從千模百態演變為“十強并立”,國內更是“五岳爭鋒”,高質量模型脫穎而出。這種收斂并非壟斷,而是產業成熟的標志,促使“高手”們良性競爭、市場健康發展。根據斯坦福大學《2025年人工智能指數報告》,排名第一和第十的模型的差距已從12%銳減至5%。
最后,MoE模型快速成熟,推動AI產業走向商業爆發。《2025年人工智能指數報告》顯示,達到GPT-3.5水平的模型推理成本在兩年間下降9~900倍,小模型成本也在18個月內下降280倍;DeepSeek的成本利潤率則達到驚人的545%。更深層次的影響在于安全與自主,當美國試圖以算力枷鎖遏制中國AI產業發展,MoE架構的出現不啻為一場“平權運動”。
王慶文指出,運營商在提供推理服務上具有天然優勢:憑借領先的泛在多級訓推資源,以及全國性網絡基礎設施和數據中心機房,既能滿足中小企業的靈活需求,也能支撐大型企業核心業務及海量用戶場景。同時,通過多租戶部署技術,保障大租戶資源獨立、中小租戶性能提升的同時全方位確保數據安全。此外,得益于長期向市場提供優質的信息通信服務,運營商積累了廣泛的公眾/政企客戶,樹立了良好的口碑。
昇騰大EP:革命性創新筑基AI未來發展
IDC數據顯示,2024年AI IT總投資規模達3158億美元,到2028年有望增至8159億美元,五年復合增長率32.9%。AI應用的規模化落地也在倒逼基礎設施升級。
一方面,正如蒸汽機的普及反而推動煤炭消費激增,AI技術進步降低了單次應用的算力消耗,卻激發出指數級增長的總需求。另一方面,在模型架構層面,“小專家”模式的興起帶來了專家數量的增加,從DeepSeek V2的160個專家到V3的256個專家,如何在保證負載均衡的同時降低通信開銷,成為新的挑戰。
昇騰從基礎硬件、算子到推理系統全面創新,面向不同的推理場景需求,為包含運營商在內的客戶及伙伴提供集高性能、高可靠、易部署、開源開放于一體的推理解決方案。其面向大型企業、C端超級應用等場景推出的大規模專家并行集群推理方案,正是針對上述癥結的“組合拳”。
其核心邏輯在于“分而治之”——將原本集中于單卡的專家權重分散到多卡,通過動態負載均衡與通信優化,實現“1+1>2”的系統效能。這種設計理念,恰如現代醫院從 “全科大夫” 轉向 “專科細分”,當眼科、外科、內科專家各司其職,整體接診效率自然得以極大提升。數據顯示,采用大EP方案后平均單卡吞吐性能提升3倍以上,大幅降低每Token推理成本,幫助運營商構筑高性能的AI算力基礎設施,為行業客戶帶來更優的業務體驗。
在這背后有幾大革命性創新:分布式部署,單卡專家數從16~32個降至4~5個,內存容量占用減少60%,支持更大KV緩存以承載高并發;動態均衡,通過多層次均衡策略、全局智能調度,實時感知專家負載,自動遷移熱點任務,避免“旱澇不均”;通信優化,采用RoCEv2網絡協議、PA+MLAPO融合算子、雙流并行等手段,大幅降低All-to-All通信時延,讓“專家會診”效率倍增。
今年以來,科大訊飛攜手昇騰率先實現了MoE模型的大EP集群推理,雙方在算子融合、混合并行策略和通信計算并行等方面深度協同創新,推理集群中單卡靜態內存占用僅為雙機部署的1/4,推理吞吐性能提升3.2倍,端到端時延降低50%。工商銀行采用昇騰大EP方案在同業率先完成DeepSeek開源大模型的私有化部署,無縫接入行內“工銀智涌”大模型體系,并在后續的1個月時間內實現行內50余個場景的模型升級,為業務高質量發展注入強勁動力。移動云成功部署基于昇騰AI算力底座的大EP推理集群,在移動云MaaS平臺、COCA推理系統上線,突破性實現單卡吞吐提升3倍,解碼時延降低50%,推動AI技術革新。
大模型應用一體機:大開智能化方便之門
有統計顯示,我國中小微企業數量已突破6000萬戶,每天有超萬戶新企業破土而出,它們貢獻了60%以上的稅收、60%以上的GDP,創造了70%以上的技術創新成果,吸納了80%的城鎮就業。然而,當AI浪潮拍岸,他們卻因為成本、技術、人才、運維等方方面面的問題而在智能化升級上舉步維艱。
昇騰面向中小微企業以及學校、醫院等機構需要快速部署、快速落地AI應用的需求,使能運營商打造大模型應用一體機,大開方便之門。
該方案巧妙打包量化、調優等工具鏈,將部署效率大幅提升50%;借助MLA(Multi-Head Latent Attention)親和等卓越特性,吞吐性能更是飆升90%;支持vLLM,將推理應用業務上線周期縮短至天級,真正實現了從模型部署到應用上線的“即開即用”。這大大降低了AI部署的門檻,讓智能化不再是大型企業的專屬,而是惠及每一家企業、每一個組織。
目前,已有超140家合作伙伴基于昇騰發布大模型應用一體機產品,應用場景廣泛覆蓋醫療、教育、金融、制造等多個領域。
寫在最后:昇騰為舟,駛向星辰大海
站在2025年的門檻回望,AI發展軌跡清晰可辨:從ChatGPT的現象級破圈到DeepSeek的全民普及,再到昇騰大EP集群的工程化突破,AI正由錦上添花的“技術盆景”蛻變真正驅動經濟增長的“水電煤”。“共筑堅實智算底座,加速行業智能化”的演講主題,或許是對昇騰使命的最佳注解。
“單木不成林,眾木自成春”。在生態方面,昇騰圍繞“硬件、算子、加速庫、模型、應用”五大方向,已聯合伙伴開發了160多個高性能算子、孵化40多個大模型和380多個應用,全流程使能大模型從創新到落地。在行業應用上,昇騰已經聯合2500多家應用伙伴、共同孵化了5800多個行業解決方案,加速了大模型在各行各業的規模應用。