C114訊 5月26日消息(苡臻)近日,鯤鵬昇騰開發(fā)者大會(huì)2025(KADC2025)在北京中關(guān)村國際創(chuàng)新中心成功舉辦。期間,華為鯤鵬計(jì)算業(yè)務(wù)總裁李義發(fā)表“鯤鵬打造AI時(shí)代先進(jìn)算力底座”的主題演講。
他表示,邁向AI時(shí)代,智算、通算走向異構(gòu)融合,CPU算力無處不在。大模型深入千行萬業(yè),激發(fā)全產(chǎn)業(yè)創(chuàng)新。需求驅(qū)動(dòng)下,行業(yè)場景倍增,企業(yè)業(yè)務(wù)流采用AI功能比例達(dá)70%;商業(yè)應(yīng)用加速催熟,國內(nèi)生成式AI日均Token消耗量從千億級(jí)躍升至十萬億級(jí)。“從模型訓(xùn)練到推理,從推理到AI應(yīng)用,通用算力成為剛需。CPU與xPU進(jìn)行協(xié)同,算力得到充分釋放。”
華為始終堅(jiān)持“硬件開放、軟件開源、使能伙伴、發(fā)展人才”的生態(tài)策略,打造開放繁榮的計(jì)算產(chǎn)業(yè)生態(tài)。鯤鵬計(jì)算產(chǎn)業(yè)歷經(jīng)六年發(fā)展,通過硬件開放與軟件開源戰(zhàn)略構(gòu)建了覆蓋數(shù)據(jù)中心到邊緣場景的完整生態(tài),并正式發(fā)布面向AI時(shí)代的"鯤鵬AI+解決方案"。
AI Core方面,提供鯤鵬+xPU推理方案,能夠兼容昇騰以及其他國產(chǎn)GPU,覆蓋數(shù)據(jù)中心到邊緣場景。“目前,數(shù)據(jù)中心場景已推出十多款推理服務(wù)器,邊緣場景基于鯤鵬的模組搭建二十多套推理工作站,覆蓋1.5B至671B參數(shù)規(guī)模的模型訓(xùn)練與推理需求;同時(shí)還實(shí)現(xiàn)內(nèi)存融合與算力融合,推理吞吐量提升10~30%。”
會(huì)上,趨境科技依托鯤鵬基礎(chǔ)軟硬件平臺(tái),在Ktransformer架構(gòu)優(yōu)化中取得的突破性進(jìn)展,正式發(fā)布鯤鵬+xPU解決方案。
AI Infra方面,提供鯤鵬AI數(shù)據(jù)工程組件和鯤鵬AI安全組件,提供性能更優(yōu)、更安全的數(shù)據(jù)處理、數(shù)據(jù)檢索等能力。鯤鵬提供AI+數(shù)據(jù)工程組件,圍繞大模型全生命周期,全面提升數(shù)據(jù)處理效率和性能,“金融證券報(bào)告分析,可以將時(shí)延下降超過25%,推理處理性能提升20~30%。”同時(shí),鯤鵬AI+安全使能套件:3道安全防線實(shí)現(xiàn)縱深防御,端到端保護(hù)AI模型和私域數(shù)據(jù)安全,實(shí)現(xiàn)系統(tǒng)可信任、攻擊可檢測、數(shù)據(jù)防竊取。
AI應(yīng)用方面,提供業(yè)務(wù)編排、部署、調(diào)度等能力,基于開源生態(tài),構(gòu)建企業(yè)端到端AI解決方案,做到開箱即優(yōu)。發(fā)布鯤鵬搜廣推解決方案,圍繞召回和排序極致優(yōu)化,助力企業(yè)打造新一代智能推薦引擎;同時(shí),正式發(fā)布鯤鵬RAG 解決方案1.0,基于鯤鵬CPU和昇騰NPU、第三方GPU卡,打造包含RAG業(yè)務(wù)編排、AI+微服務(wù)、部署調(diào)度、安全和存儲(chǔ)的開源開放體系,定義企業(yè)級(jí)RAG的技術(shù)標(biāo)桿。
此外,為了解決大規(guī)模集群的管理,openFuyao社區(qū)開源發(fā)布,助力集群算力充分釋放。openFuyao聚焦“云原生+AI”,打造多樣化算力互聯(lián)的集群管理與調(diào)度能力,提供算力親和組件及面向生產(chǎn)的社區(qū)發(fā)行版,實(shí)現(xiàn)集群算力的彈性調(diào)度和高效釋放。“openFuyao能以組件化形式支持異構(gòu)算力的精細(xì)化調(diào)度,可在在線和離線的場景下將資源利用率提升30%,業(yè)務(wù)性能提升20%,較業(yè)界方案規(guī)模提升3.2倍,實(shí)現(xiàn)超大規(guī)模集群1.6萬節(jié)點(diǎn)調(diào)度管理;同時(shí),架構(gòu)可插拔,開發(fā)效率顯著提升。”
演講最后,李義強(qiáng)調(diào),“回首過去,鯤鵬以算力為舟,與百萬開發(fā)者攜手前進(jìn)。展望未來,鯤鵬的初心不變,與開發(fā)者共成長。”