日韩综合网-日韩综合网站-日韩综合一区-日韩综合在线视频-色涩网站-色涩网站在线观看

資訊
`
2025/5/24 10:40
AI時(shí)代的底座變遷:昇騰大EP+一體機(jī)筑基千行萬(wàn)業(yè)智能化升級(jí)
0
0

C114訊 5月24日專(zhuān)稿(蔣均牧)燧石取火讓原始人掙脫黑暗桎梏,蒸汽轟鳴為工業(yè)革命注入澎湃動(dòng)能,硅基芯片的誕生催生了信息時(shí)代的高度繁榮……一個(gè)個(gè)“底座”,構(gòu)成了人類(lèi)文明進(jìn)步的長(zhǎng)梯。現(xiàn)如今,人工智能(AI)的浪潮席卷全球,各種AI應(yīng)用如雨后春筍般涌現(xiàn),日益成為生產(chǎn)力、創(chuàng)造力的代名詞。如何筑牢托舉起算力這一新時(shí)代“火種”的底座,使之如源頭活水般精準(zhǔn)灌溉千行萬(wàn)業(yè),已然成為一個(gè)匯聚各方視線(xiàn)的核心議題。

2025年世界電信和信息社會(huì)日智算產(chǎn)業(yè)創(chuàng)新發(fā)展專(zhuān)題研討會(huì)上,華為昇騰計(jì)算業(yè)務(wù)副總裁王慶文以“共筑堅(jiān)實(shí)智算底座,加速行業(yè)智能化”為題,勾勒出一幅算力筑基、產(chǎn)業(yè)共榮的藍(lán)圖。基于對(duì)AI產(chǎn)業(yè)趨勢(shì)、運(yùn)營(yíng)商算力基礎(chǔ)設(shè)施建設(shè)與行業(yè)智能化發(fā)展路徑的深度解讀,他給出了昇騰的答案:大規(guī)模專(zhuān)家并行(大EP)集群推理方案。

通過(guò)將混合專(zhuān)家(MoE)模型的專(zhuān)家權(quán)重分散到更多計(jì)算卡上,變“單機(jī)獨(dú)奏”為“集群交響”,在硬件性能受限的現(xiàn)實(shí)中,昇騰用系統(tǒng)級(jí)優(yōu)化開(kāi)辟新局面——不僅吹響了眾多行業(yè)效率革命的號(hào)角,提供了運(yùn)營(yíng)商深度參與AI盛世的利器,更為國(guó)人握緊AI產(chǎn)業(yè)發(fā)展的“方向盤(pán)”創(chuàng)造了條件。

AI2B奇點(diǎn)已至,運(yùn)營(yíng)商具天然優(yōu)勢(shì)

“如果說(shuō)訓(xùn)練是上學(xué),推理就是上班。”王慶文用一句生動(dòng)的比喻,道破了AI產(chǎn)業(yè)從技術(shù)探索到商業(yè)落地的躍遷。Gartner數(shù)據(jù)顯示,2025年全球80%的中國(guó)企業(yè)將部署生成式AI,60%會(huì)將AI融入核心生產(chǎn)系統(tǒng),標(biāo)志著企業(yè)AI應(yīng)用從通用場(chǎng)景向核心生產(chǎn)場(chǎng)景滲透的“奇點(diǎn)時(shí)刻”到來(lái)。

這一轉(zhuǎn)變的背后,是AI推理從“可用”到“好用”的質(zhì)變。首先,AI在深度搜索、思維鏈、多模態(tài)融合等技術(shù)方面已經(jīng)取得了明顯的突破。大語(yǔ)言模型從原來(lái)的黑箱式的問(wèn)答走向可解釋的因果推理,在多個(gè)逐步達(dá)到了媲美領(lǐng)域?qū)<业乃健@缒橙揍t(yī)院的AI醫(yī)療診斷系統(tǒng)將單張病理切片分析時(shí)間從40分鐘壓縮至秒級(jí),效率提升超百倍;某日化巨頭的AI質(zhì)檢系統(tǒng)將故障率從2.3%降至0.05%,年省成本超300萬(wàn)元;上海300所中小學(xué)的教師利用AI來(lái)備課,將備課時(shí)間縮短82%,教案生成效率提升300%。

其次,AI模型生態(tài)已從千模百態(tài)演變?yōu)椤笆畯?qiáng)并立”,國(guó)內(nèi)更是“五岳爭(zhēng)鋒”,高質(zhì)量模型脫穎而出。這種收斂并非壟斷,而是產(chǎn)業(yè)成熟的標(biāo)志,促使“高手”們良性競(jìng)爭(zhēng)、市場(chǎng)健康發(fā)展。根據(jù)斯坦福大學(xué)《2025年人工智能指數(shù)報(bào)告》,排名第一和第十的模型的差距已從12%銳減至5%。

最后,MoE模型快速成熟,推動(dòng)AI產(chǎn)業(yè)走向商業(yè)爆發(fā)。《2025年人工智能指數(shù)報(bào)告》顯示,達(dá)到GPT-3.5水平的模型推理成本在兩年間下降9~900倍,小模型成本也在18個(gè)月內(nèi)下降280倍;DeepSeek的成本利潤(rùn)率則達(dá)到驚人的545%。更深層次的影響在于安全與自主,當(dāng)美國(guó)試圖以算力枷鎖遏制中國(guó)AI產(chǎn)業(yè)發(fā)展,MoE架構(gòu)的出現(xiàn)不啻為一場(chǎng)“平權(quán)運(yùn)動(dòng)”。

王慶文指出,運(yùn)營(yíng)商在提供推理服務(wù)上具有天然優(yōu)勢(shì):憑借領(lǐng)先的泛在多級(jí)訓(xùn)推資源,以及全國(guó)性網(wǎng)絡(luò)基礎(chǔ)設(shè)施和數(shù)據(jù)中心機(jī)房,既能滿(mǎn)足中小企業(yè)的靈活需求,也能支撐大型企業(yè)核心業(yè)務(wù)及海量用戶(hù)場(chǎng)景。同時(shí),通過(guò)多租戶(hù)部署技術(shù),保障大租戶(hù)資源獨(dú)立、中小租戶(hù)性能提升的同時(shí)全方位確保數(shù)據(jù)安全。此外,得益于長(zhǎng)期向市場(chǎng)提供優(yōu)質(zhì)的信息通信服務(wù),運(yùn)營(yíng)商積累了廣泛的公眾/政企客戶(hù),樹(shù)立了良好的口碑。

昇騰大EP:革命性創(chuàng)新筑基AI未來(lái)發(fā)展

IDC數(shù)據(jù)顯示,2024年AI IT總投資規(guī)模達(dá)3158億美元,到2028年有望增至8159億美元,五年復(fù)合增長(zhǎng)率32.9%。AI應(yīng)用的規(guī)模化落地也在倒逼基礎(chǔ)設(shè)施升級(jí)。

一方面,正如蒸汽機(jī)的普及反而推動(dòng)煤炭消費(fèi)激增,AI技術(shù)進(jìn)步降低了單次應(yīng)用的算力消耗,卻激發(fā)出指數(shù)級(jí)增長(zhǎng)的總需求。另一方面,在模型架構(gòu)層面,“小專(zhuān)家”模式的興起帶來(lái)了專(zhuān)家數(shù)量的增加,從DeepSeek V2的160個(gè)專(zhuān)家到V3的256個(gè)專(zhuān)家,如何在保證負(fù)載均衡的同時(shí)降低通信開(kāi)銷(xiāo),成為新的挑戰(zhàn)。

昇騰從基礎(chǔ)硬件、算子到推理系統(tǒng)全面創(chuàng)新,面向不同的推理場(chǎng)景需求,為包含運(yùn)營(yíng)商在內(nèi)的客戶(hù)及伙伴提供集高性能、高可靠、易部署、開(kāi)源開(kāi)放于一體的推理解決方案。其面向大型企業(yè)、C端超級(jí)應(yīng)用等場(chǎng)景推出的大規(guī)模專(zhuān)家并行集群推理方案,正是針對(duì)上述癥結(jié)的“組合拳”。

其核心邏輯在于“分而治之”——將原本集中于單卡的專(zhuān)家權(quán)重分散到多卡,通過(guò)動(dòng)態(tài)負(fù)載均衡與通信優(yōu)化,實(shí)現(xiàn)“1+1>2”的系統(tǒng)效能。這種設(shè)計(jì)理念,恰如現(xiàn)代醫(yī)院從 “全科大夫” 轉(zhuǎn)向 “專(zhuān)科細(xì)分”,當(dāng)眼科、外科、內(nèi)科專(zhuān)家各司其職,整體接診效率自然得以極大提升。數(shù)據(jù)顯示,采用大EP方案后平均單卡吞吐性能提升3倍以上,大幅降低每Token推理成本,幫助運(yùn)營(yíng)商構(gòu)筑高性能的AI算力基礎(chǔ)設(shè)施,為行業(yè)客戶(hù)帶來(lái)更優(yōu)的業(yè)務(wù)體驗(yàn)。

在這背后有幾大革命性創(chuàng)新:分布式部署,單卡專(zhuān)家數(shù)從16~32個(gè)降至4~5個(gè),內(nèi)存容量占用減少60%,支持更大KV緩存以承載高并發(fā);動(dòng)態(tài)均衡,通過(guò)多層次均衡策略、全局智能調(diào)度,實(shí)時(shí)感知專(zhuān)家負(fù)載,自動(dòng)遷移熱點(diǎn)任務(wù),避免“旱澇不均”;通信優(yōu)化,采用RoCEv2網(wǎng)絡(luò)協(xié)議、PA+MLAPO融合算子、雙流并行等手段,大幅降低All-to-All通信時(shí)延,讓“專(zhuān)家會(huì)診”效率倍增。

今年以來(lái),科大訊飛攜手昇騰率先實(shí)現(xiàn)了MoE模型的大EP集群推理,雙方在算子融合、混合并行策略和通信計(jì)算并行等方面深度協(xié)同創(chuàng)新,推理集群中單卡靜態(tài)內(nèi)存占用僅為雙機(jī)部署的1/4,推理吞吐性能提升3.2倍,端到端時(shí)延降低50%。工商銀行采用昇騰大EP方案在同業(yè)率先完成DeepSeek開(kāi)源大模型的私有化部署,無(wú)縫接入行內(nèi)“工銀智涌”大模型體系,并在后續(xù)的1個(gè)月時(shí)間內(nèi)實(shí)現(xiàn)行內(nèi)50余個(gè)場(chǎng)景的模型升級(jí),為業(yè)務(wù)高質(zhì)量發(fā)展注入強(qiáng)勁動(dòng)力。移動(dòng)云成功部署基于昇騰AI算力底座的大EP推理集群,在移動(dòng)云MaaS平臺(tái)、COCA推理系統(tǒng)上線(xiàn),突破性實(shí)現(xiàn)單卡吞吐提升3倍,解碼時(shí)延降低50%,推動(dòng)AI技術(shù)革新。

大模型應(yīng)用一體機(jī):大開(kāi)智能化方便之門(mén)

有統(tǒng)計(jì)顯示,我國(guó)中小微企業(yè)數(shù)量已突破6000萬(wàn)戶(hù),每天有超萬(wàn)戶(hù)新企業(yè)破土而出,它們貢獻(xiàn)了60%以上的稅收、60%以上的GDP,創(chuàng)造了70%以上的技術(shù)創(chuàng)新成果,吸納了80%的城鎮(zhèn)就業(yè)。然而,當(dāng)AI浪潮拍岸,他們卻因?yàn)槌杀尽⒓夹g(shù)、人才、運(yùn)維等方方面面的問(wèn)題而在智能化升級(jí)上舉步維艱。

昇騰面向中小微企業(yè)以及學(xué)校、醫(yī)院等機(jī)構(gòu)需要快速部署、快速落地AI應(yīng)用的需求,使能運(yùn)營(yíng)商打造大模型應(yīng)用一體機(jī),大開(kāi)方便之門(mén)。

該方案巧妙打包量化、調(diào)優(yōu)等工具鏈,將部署效率大幅提升50%;借助MLA(Multi-Head Latent Attention)親和等卓越特性,吞吐性能更是飆升90%;支持vLLM,將推理應(yīng)用業(yè)務(wù)上線(xiàn)周期縮短至天級(jí),真正實(shí)現(xiàn)了從模型部署到應(yīng)用上線(xiàn)的“即開(kāi)即用”。這大大降低了AI部署的門(mén)檻,讓智能化不再是大型企業(yè)的專(zhuān)屬,而是惠及每一家企業(yè)、每一個(gè)組織。

目前,已有超140家合作伙伴基于昇騰發(fā)布大模型應(yīng)用一體機(jī)產(chǎn)品,應(yīng)用場(chǎng)景廣泛覆蓋醫(yī)療、教育、金融、制造等多個(gè)領(lǐng)域。

寫(xiě)在最后:昇騰為舟,駛向星辰大海

站在2025年的門(mén)檻回望,AI發(fā)展軌跡清晰可辨:從ChatGPT的現(xiàn)象級(jí)破圈到DeepSeek的全民普及,再到昇騰大EP集群的工程化突破,AI正由錦上添花的“技術(shù)盆景”蛻變真正驅(qū)動(dòng)經(jīng)濟(jì)增長(zhǎng)的“水電煤”。“共筑堅(jiān)實(shí)智算底座,加速行業(yè)智能化”的演講主題,或許是對(duì)昇騰使命的最佳注解。

“單木不成林,眾木自成春”。在生態(tài)方面,昇騰圍繞“硬件、算子、加速庫(kù)、模型、應(yīng)用”五大方向,已聯(lián)合伙伴開(kāi)發(fā)了160多個(gè)高性能算子、孵化40多個(gè)大模型和380多個(gè)應(yīng)用,全流程使能大模型從創(chuàng)新到落地。在行業(yè)應(yīng)用上,昇騰已經(jīng)聯(lián)合2500多家應(yīng)用伙伴、共同孵化了5800多個(gè)行業(yè)解決方案,加速了大模型在各行各業(yè)的規(guī)模應(yīng)用。

當(dāng)技術(shù)創(chuàng)新與生態(tài)協(xié)同形成共振,AI產(chǎn)業(yè)的未來(lái)必將如星河般璀璨。

版權(quán)說(shuō)明:C114刊載的內(nèi)容,凡注明來(lái)源為“C114通信網(wǎng)”或“C114原創(chuàng)”皆屬C114版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來(lái)源。編譯類(lèi)文章僅出于傳遞更多信息之目的,不代表證實(shí)其描述或贊同其觀(guān)點(diǎn);翻譯質(zhì)量問(wèn)題請(qǐng)指正

給作者點(diǎn)贊
0 VS 0
寫(xiě)得不太好

C114簡(jiǎn)介     聯(lián)系我們     網(wǎng)站地圖

Copyright©1999-2025 c114 All Rights Reserved 滬ICP備12002291號(hào)-4

C114通信網(wǎng)版權(quán)所有 舉報(bào)電話(huà):021-54451141 用戶(hù)注銷(xiāo)

主站蜘蛛池模板: 中文字幕精品一区二区三区视频 | 国产高清一区二区三区视频 | 成人精品一区二区久久 | 精品免费视频 | 亚洲一级毛片免费在线观看 | 亚洲精品一区 | 中文字幕在线永久 | 亚洲国产成+人+综合 | 欧美一级片毛片 | 欧美一级视频在线高清观看 | 亚洲国产天堂久久精品网 | 国产成人aaa在线视频免费观看 | 国产成人91高清精品免费 | 九九视频免费在线观看 | 亚洲天堂男人的天堂 | 一区 在线播放 | 九九视频在线播放 | 国产三级中文字幕 | 中文字幕乱码系列免费 | 成人午夜爽爽爽免费视频 | 美国欧美一级毛片 | 午夜在线亚洲 | www.xxxx欧美| 欧美jizz18性欧美 | 久久精品国产免费中文 | 成年人在线观看网站 | rion美乳弹出来四虎在线观看 | 精品在线观看国产 | 国产毛片在线高清视频 | 97欧美精品一区二区三区 | 中文字幕有码在线观看 | 九九黄色影院 | 中文字幕一区二区在线视频 | 久久久免费观看 | 美女黄色在线 | 成在线人视频免费视频 | 国内精品久久久久久网站 | 九九精品免费视频 | 一色屋成人免费精品网站 | 男人天堂视频网 | 免费永久国产在线视频 |