C114訊 5月26日消息(苡臻)近日,鯤鵬昇騰開發者大會2025(KADC2025)在北京中關村國際創新中心成功舉辦。期間,華為鯤鵬計算業務總裁李義發表“鯤鵬打造AI時代先進算力底座”的主題演講。
他表示,邁向AI時代,智算、通算走向異構融合,CPU算力無處不在。大模型深入千行萬業,激發全產業創新。需求驅動下,行業場景倍增,企業業務流采用AI功能比例達70%;商業應用加速催熟,國內生成式AI日均Token消耗量從千億級躍升至十萬億級。“從模型訓練到推理,從推理到AI應用,通用算力成為剛需。CPU與xPU進行協同,算力得到充分釋放。”
華為始終堅持“硬件開放、軟件開源、使能伙伴、發展人才”的生態策略,打造開放繁榮的計算產業生態。鯤鵬計算產業歷經六年發展,通過硬件開放與軟件開源戰略構建了覆蓋數據中心到邊緣場景的完整生態,并正式發布面向AI時代的"鯤鵬AI+解決方案"。
AI Core方面,提供鯤鵬+xPU推理方案,能夠兼容昇騰以及其他國產GPU,覆蓋數據中心到邊緣場景。“目前,數據中心場景已推出十多款推理服務器,邊緣場景基于鯤鵬的模組搭建二十多套推理工作站,覆蓋1.5B至671B參數規模的模型訓練與推理需求;同時還實現內存融合與算力融合,推理吞吐量提升10~30%。”
會上,趨境科技依托鯤鵬基礎軟硬件平臺,在Ktransformer架構優化中取得的突破性進展,正式發布鯤鵬+xPU解決方案。
AI Infra方面,提供鯤鵬AI數據工程組件和鯤鵬AI安全組件,提供性能更優、更安全的數據處理、數據檢索等能力。鯤鵬提供AI+數據工程組件,圍繞大模型全生命周期,全面提升數據處理效率和性能,“金融證券報告分析,可以將時延下降超過25%,推理處理性能提升20~30%!蓖瑫r,鯤鵬AI+安全使能套件:3道安全防線實現縱深防御,端到端保護AI模型和私域數據安全,實現系統可信任、攻擊可檢測、數據防竊取。
AI應用方面,提供業務編排、部署、調度等能力,基于開源生態,構建企業端到端AI解決方案,做到開箱即優。發布鯤鵬搜廣推解決方案,圍繞召回和排序極致優化,助力企業打造新一代智能推薦引擎;同時,正式發布鯤鵬RAG 解決方案1.0,基于鯤鵬CPU和昇騰NPU、第三方GPU卡,打造包含RAG業務編排、AI+微服務、部署調度、安全和存儲的開源開放體系,定義企業級RAG的技術標桿。
此外,為了解決大規模集群的管理,openFuyao社區開源發布,助力集群算力充分釋放。openFuyao聚焦“云原生+AI”,打造多樣化算力互聯的集群管理與調度能力,提供算力親和組件及面向生產的社區發行版,實現集群算力的彈性調度和高效釋放!皁penFuyao能以組件化形式支持異構算力的精細化調度,可在在線和離線的場景下將資源利用率提升30%,業務性能提升20%,較業界方案規模提升3.2倍,實現超大規模集群1.6萬節點調度管理;同時,架構可插拔,開發效率顯著提升!
演講最后,李義強調,“回首過去,鯤鵬以算力為舟,與百萬開發者攜手前進。展望未來,鯤鵬的初心不變,與開發者共成長!