日韩综合网-日韩综合网站-日韩综合一区-日韩综合在线视频-色涩网站-色涩网站在线观看

資訊
`
2025/6/13 08:33
Instinct MI350 GPU推理性能提升35倍背后:看AMD在Agentic AI時(shí)代的“三張牌”
0
0

C114訊 6月13日消息(岳明)在Generative AI向Agentic AI的演進(jìn)浪潮中,要想繼續(xù)留在“牌桌”上,產(chǎn)品技術(shù)創(chuàng)新和產(chǎn)業(yè)生態(tài)合作同樣重要。

作為在Generative AI時(shí)代的贏家之一,AMD顯然想贏得更大的牌局,但這并非易事,AMD該如何破局?太平洋時(shí)間2025年6月12日上午9:30,AMD董事會(huì)主席及首席執(zhí)行官蘇姿豐(Lisa Su)博士在Advancing AI大會(huì)上給出了自己的答案:領(lǐng)先技術(shù)+開(kāi)放生態(tài)+全棧方案!

在領(lǐng)先技術(shù)層面,AMD瞄準(zhǔn)4000億美元的AI硬件市場(chǎng),已經(jīng)構(gòu)建起了包括CPU、GPU、DPU、FPGA等在內(nèi)的完整技術(shù)堆棧,而且在快速價(jià)值迭代;在開(kāi)放生態(tài)層面,AMD正在加大對(duì)ROCm軟件生態(tài)系統(tǒng)的建設(shè)投入,最新版本ROCm 7已經(jīng)面向生成式AI和高性能計(jì)算工作負(fù)載日益增長(zhǎng)的需求做足準(zhǔn)備;在全棧方案層面,AMD正在強(qiáng)化云邊端協(xié)同的集成 AI 平臺(tái)愿景,將推出基于行業(yè)標(biāo)準(zhǔn)構(gòu)建的、開(kāi)放且可擴(kuò)展的機(jī)架級(jí)AI基礎(chǔ)設(shè)施—“Helios”AI機(jī)柜。

技術(shù)領(lǐng)先:Instinct MI350系列GPU實(shí)現(xiàn)35倍推理性能提升

在上午的發(fā)布環(huán)節(jié),采用臺(tái)積電的3nm工藝,集成1850億晶體管的Instinct MI350系列GPU無(wú)疑是最大亮點(diǎn)。

作為AMD歷史上最為成功的產(chǎn)品之一,Instinct MI350系列GPU采用了CDNA 4架構(gòu),在性能、內(nèi)存容量、帶寬,GPU執(zhí)行單元數(shù)量、吞吐性能等方面實(shí)現(xiàn)了全面進(jìn)化,并且通過(guò)2.5D和3D先進(jìn)封裝技術(shù)實(shí)現(xiàn)了晶體管的更高密度集成以及更好的能效表現(xiàn)。

性能方能,Instinct MI350系列GPU支持多種浮點(diǎn)精度數(shù)據(jù)格式,包括FP8、FP6、FP4、FP16、BF16以及FP64等。相比前代產(chǎn)品,其AI算力得到顯著增強(qiáng),F(xiàn)P16性能達(dá)到18.5 PFlops,F(xiàn)P8為37 PFlops,F(xiàn)P6/FP4高達(dá)74 PFlops。MI350系列GPU的模型參數(shù)處理能力從7140億激增至4.2萬(wàn)億,提升近6倍,能夠有效滿足大語(yǔ)言模型和混合專家模型的訓(xùn)練與推理需求。

內(nèi)存和帶寬容量方面,這是AMD GPU產(chǎn)品區(qū)別于友商的強(qiáng)項(xiàng)。在Instinct MI350產(chǎn)品上,這種優(yōu)勢(shì)得到了進(jìn)一步加強(qiáng),其內(nèi)存容量達(dá)到了288GB HBM3E,最大帶寬能力為 8TB/s,無(wú)論是訓(xùn)練還是推理,都能獲得更好的吞吐量。

對(duì)于如此高算力、高密度的AI硬件產(chǎn)品而言,散熱和功耗是必須要面對(duì)的。Instinct MI350系列GPU可以支持風(fēng)冷和直接液冷靈活配置,風(fēng)冷機(jī)架中最多可部署64個(gè)GPU,液冷機(jī)架中最多可部署128個(gè)GPU,提供高達(dá)2.6 exaFLOPS 的 FP4/FP6 性能。

當(dāng)然,對(duì)于最終用戶而言,TCO是個(gè)更核心的話題。蘇姿豐博士介紹,相比英偉達(dá)B200,AMD Instinct MI300X系列GPU每美元可處理的Token數(shù)量提升高達(dá)40%,相當(dāng)于在運(yùn)行大語(yǔ)言模型(LLM)時(shí),單位成本下的計(jì)算效率提升40%。

而且在本次峰會(huì)上,AMD還劇透了下一代Instinct MI400系列GPU的特性,它將擁有高達(dá)40PF和20PF的FP4/FP8算力,并打在432GB HBM4內(nèi)存,帶寬將提升至19.6 TB/s,每個(gè)GPU的橫向擴(kuò)展帶寬將達(dá)到300 GB/s,進(jìn)一步為AI計(jì)算提速。

不僅在算力層面,在網(wǎng)絡(luò)連接層面,AMD推出了業(yè)界首款支持超以太網(wǎng)聯(lián)盟(UEC)特性的AI智能網(wǎng)卡——AMD Pensando Pollara 400,該AI智能網(wǎng)卡專為加速后端網(wǎng)絡(luò)應(yīng)用而設(shè)計(jì),實(shí)現(xiàn)了400千兆比特每秒(Gbps)的以太網(wǎng)傳輸速率。

開(kāi)放生態(tài):開(kāi)發(fā)者至上,全新ROCm 7+開(kāi)發(fā)者云

開(kāi)發(fā)者,開(kāi)發(fā)者,開(kāi)發(fā)者。

從會(huì)議現(xiàn)場(chǎng)某位演講嘉賓的開(kāi)場(chǎng)白中,我們就能深刻體會(huì)到軟件和生態(tài)的重要性,而這也是AMD最大競(jìng)爭(zhēng)對(duì)手英偉達(dá)的護(hù)城河。

對(duì)此,蘇姿豐博士給出的答案是ROCm 7和開(kāi)發(fā)者云。AMD對(duì)ROCm的愿景是通過(guò)一個(gè)開(kāi)放、可擴(kuò)展且專注于開(kāi)發(fā)者的平臺(tái),為所有人解鎖創(chuàng)新潛能。據(jù)蘇姿豐博士介紹,過(guò)去一年中,ROCm迅速成熟,并深化了與主流開(kāi)源社區(qū)的集成。如今,ROCm驅(qū)動(dòng)著全球最大型的一些AI平臺(tái),支持Llama、DeepSeek等主流模型,特別是在最新的ROCm 7版本中實(shí)現(xiàn)了超過(guò) 3.5 倍的推理性能提升。

隨著AI應(yīng)用從研究轉(zhuǎn)向企業(yè)世紀(jì)部署,ROCm也在同步演進(jìn)。ROCm企業(yè)級(jí)AI將一套全棧式MLOps 平臺(tái)推向臺(tái)前,憑借支持超過(guò) 180萬(wàn)個(gè)Hugging Face模型的開(kāi)箱即用體驗(yàn),以及行業(yè)基準(zhǔn)測(cè)試的引入,ROCm提供用于微調(diào)、合規(guī)、部署和集成的開(kāi)箱即用工具,以實(shí)現(xiàn)安全、可擴(kuò)展的AI。“ROCm 不僅是在追趕——它正在引領(lǐng)開(kāi)放的AI革命”,蘇姿豐博士在演講中強(qiáng)調(diào)。

與ROCm 7相伴而來(lái)的,還有極具靈活性和可擴(kuò)展性的AMD開(kāi)發(fā)者云服務(wù)。AMD開(kāi)發(fā)者云服務(wù)具備零設(shè)置環(huán)境、支持預(yù)安裝的Docker容器和出色的靈活性、在Day-0生態(tài)的Instinct MI350系列GPU系統(tǒng)支持能力、擁有多元化的可擴(kuò)展計(jì)算選項(xiàng)、為開(kāi)發(fā)者提供免費(fèi)額度等多重亮點(diǎn)。也就是說(shuō),無(wú)論是何種應(yīng)用場(chǎng)景,AMD開(kāi)發(fā)者云都提供了即時(shí)開(kāi)始的工具和靈活性,讓開(kāi)發(fā)者在不受限制的環(huán)境中釋放生產(chǎn)力。

全棧方案:“Helios”AI機(jī)架實(shí)現(xiàn)“集大成”

隨著大模型訓(xùn)練和推理對(duì)算力需求的爆炸式增長(zhǎng),傳統(tǒng)計(jì)算架構(gòu)已難以支撐AI技術(shù)的代際躍遷。

超節(jié)點(diǎn),作為AIDC算力Scale Up的當(dāng)前最優(yōu)解,通過(guò)內(nèi)部高速總線互連,能夠有效支撐并行計(jì)算任務(wù),加速GPU之間的參數(shù)交換和數(shù)據(jù)同步,縮短大模型的訓(xùn)練周期,在性能、成本、組網(wǎng)、運(yùn)維等方面,能為用戶帶來(lái)巨大優(yōu)勢(shì)。

AMD顯然也看到了這個(gè)趨勢(shì)。在Advancing AI大會(huì)上,AMD宣布正式推出Helios AI機(jī)柜基礎(chǔ)設(shè)施,將包括AMD EPYC“Venice” CPU、Instinct MI400系列GPU和Pensando “Vulcano” AI 智能網(wǎng)卡——與ROCm軟件統(tǒng)一整合為一個(gè)完全集成的解決方案。AMD的目標(biāo)非常明確,那就是打造“The World’s Best AI Rack Solution”。

從現(xiàn)場(chǎng)披露的數(shù)據(jù)來(lái)看,Helios AI機(jī)架可容納最多72塊MI400系列GPU,總帶寬260TB/s,HBM4內(nèi)存總?cè)萘?1TB、總帶寬1.4PB/s。整機(jī)性能,Helios AI 機(jī)架可高達(dá) FP8 1.4EFlops ( 140 億億次每秒 ) 、FP4 2.9EFlops ( 290 億億次每秒 ) 。

正如蘇姿豐博士所講的,AMD是唯一具備全面覆蓋數(shù)據(jù)中心、邊緣及終端設(shè)備端到端AI能力的供應(yīng)商,擁有支撐全棧AI所需的硬件矩陣與軟件實(shí)力。在過(guò)去的六年中,AMD EPYC在服務(wù)器CPU市場(chǎng)上實(shí)現(xiàn)了超過(guò)18倍的份額提升,從原來(lái)的2%上升到40%(1Q25);我們完全有理由相信,在更加波瀾壯闊的AI時(shí)代,在“領(lǐng)先技術(shù)+開(kāi)放生態(tài)+全棧方案”的加持下,AMD將會(huì)迎來(lái)新一輪成長(zhǎng)。

版權(quán)說(shuō)明:C114刊載的內(nèi)容,凡注明來(lái)源為“C114通信網(wǎng)”或“C114原創(chuàng)”皆屬C114版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來(lái)源。編譯類文章僅出于傳遞更多信息之目的,不代表證實(shí)其描述或贊同其觀點(diǎn);翻譯質(zhì)量問(wèn)題請(qǐng)指正

給作者點(diǎn)贊
0 VS 0
寫(xiě)得不太好

C114簡(jiǎn)介     聯(lián)系我們     網(wǎng)站地圖

Copyright©1999-2025 c114 All Rights Reserved 滬ICP備12002291號(hào)-4

C114通信網(wǎng)版權(quán)所有 舉報(bào)電話:021-54451141 用戶注銷

主站蜘蛛池模板: a级毛片免费看 | 手机在线国产精品 | 久久精品一品道久久精品9 久久精品一区 | 毛片1级| 国产盗摄精品一区二区三区 | a免费毛片在线播放 | 国产精品7m凸凹视频分类大全 | 国产一区二区日韩欧美在线 | 日本在线视频播放 | 精品热线九九精品视频 | 亚洲综合99 | 加勒比日本 | 成人黄色在线视频 | 国产精品日韩一区二区三区 | 成人一a毛片免费视频 | 亚洲国产成人综合 | 美女被拍拍拍拍拍拍拍拍 | a级国产乱理伦片在线 | 欧美一级三级在线观看 | 狠狠色丁香婷婷综合小时婷婷 | 日韩在线视频观看 | 99re5久久在热线播放 | 黄网在线 | 国产黄a三级三级三级 | 成年人免费大片 | 亚洲天堂男人天堂 | 亚洲免费毛片 | 免费国产在线观看 | 国产亚洲欧美日韩综合综合二区 | 1024手机基地在线看手机 | 成人国产网站 | free性chinese国语对白 | 写真片福利视频在线播放 | 日韩久久免费视频 | 久久久精品免费观看 | 成人午夜视频免费观看 | 美女视频在线观看黄 | 免费观看的毛片手机视频 | 国产成人一区二区三区精品久久 | 爽爽爽爽爽爽爽成人免费观看 | 午夜丝袜美腿福利视频在线看 |