2025/5/21 16:34

英偉達(dá)AI-RAN最新動(dòng)作：輕量化解決方案ARC-Compact登場(chǎng)

C114通信網(wǎng) 岳明

C114訊北京時(shí)間5月21日消息（岳明）Light Reading在一篇最新報(bào)道中針對(duì)英偉達(dá)ARC-Compact的推出與潛在市場(chǎng)影響進(jìn)行了分析。

盡管市場(chǎng)反響有限，英偉達(dá)仍未放棄向電信行業(yè)銷售AI芯片的嘗試。不過(guò)這家GPU巨頭似乎正在轉(zhuǎn)向中低端市場(chǎng)，并在最新推出的RAN解決方案中弱化了對(duì)AI的強(qiáng)調(diào)。如果說(shuō)以著名計(jì)算機(jī)奇才兼海軍少將命名的Grace Hopper芯片組是一艘豪華超級(jí)游艇，那么近日發(fā)布的ARC-Compact則像是一艘配置簡(jiǎn)化、功能精簡(jiǎn)的經(jīng)濟(jì)型船只。

去年發(fā)布的搭載Grace Hopper及后續(xù)Grace Blackwell的ARC服務(wù)器主要面向部署集中式RAN（C-RAN）的電信運(yùn)營(yíng)商，旨在通過(guò)就近數(shù)據(jù)中心支撐多基站運(yùn)行。而全新推出的ARC-Compact專為分布式RAN（D-RAN）基站部署設(shè)計(jì)，這一架構(gòu)轉(zhuǎn)變將完全改變技術(shù)需求與經(jīng)濟(jì)模型。

圖：英偉達(dá)ARC-Compact產(chǎn)品圖。

ARC-Compact的核心組件是基于軟銀旗下Arm架構(gòu)的Grace CPU及L4 Tensor Core GPU。相較于Hopper和Blackwell GPU，該解決方案更加輕量級(jí)，適用于一些邊緣視頻處理及推理任務(wù)，但無(wú)法勝任大語(yǔ)言模型訓(xùn)練或高強(qiáng)度AI運(yùn)算。

在官方技術(shù)博客中，英偉達(dá)將ARC-Compact描述為“高性價(jià)比、高能效”的解決方案，適用于“低時(shí)延AI工作負(fù)載與RAN加速”。但即便L4 Tensor Core的配置也可能超出實(shí)際需求。當(dāng)前市場(chǎng)競(jìng)爭(zhēng)有限，僅有三家RAN設(shè)備商可能采用該技術(shù)，且其關(guān)注重點(diǎn)更傾向于Grace CPU而非其他GPU。

CUDA架構(gòu)推進(jìn)遇阻

這三家設(shè)備商為愛立信、諾基亞與三星，它們均已對(duì)虛擬化RAN（vRAN）技術(shù)進(jìn)行投資。該技術(shù)以通用CPU替代了5G 網(wǎng)絡(luò)中常見的專用集成電路（ASIC）。英偉達(dá)提出的AI-RAN是這一概念的演進(jìn)，它建議保留CPU用于處理計(jì)算強(qiáng)度較低的工作負(fù)載，同時(shí)引入GPU作為L(zhǎng)ayer 1的“內(nèi)聯(lián)”加速器——Layer 1在RAN軟件棧中屬于資源密集型部分。

當(dāng)前的問(wèn)題在于，上述三大設(shè)備商均未展現(xiàn)出采用英偉達(dá)統(tǒng)一計(jì)算設(shè)備架構(gòu)（CUDA）來(lái)基于GPU進(jìn)行RAN開發(fā)的強(qiáng)烈意愿。愛立信與三星更傾向于采用“旁路（lookaside）”vRAN架構(gòu)，該方案為實(shí)現(xiàn)硬件獨(dú)立性，致力于最大限度將軟件保留在CPU運(yùn)行。在現(xiàn)行部署中，僅Layer 1中的高負(fù)載任務(wù)——前向糾錯(cuò)（FEC）需使用硬件加速器。

愛立信表示，在試驗(yàn)環(huán)境中，其為英特爾x86架構(gòu)CPU編寫的軟件經(jīng)少量修改即可移植至Grace平臺(tái)。這意味著即便最終采用GPU進(jìn)行任何RAN計(jì)算，也僅用于FEC處理。三星同樣在Grace平臺(tái)進(jìn)行軟件測(cè)試，并在最近明確表示不考慮采用Layer 1內(nèi)聯(lián)加速器。“當(dāng)CPU無(wú)法提供足夠容量時(shí)，才需要內(nèi)聯(lián)加速器。”該公司近期通過(guò)郵件向Light Reading表示，“隨著技術(shù)的進(jìn)步，CPU已具備支持增強(qiáng)容量的能力，我們預(yù)計(jì)即使沒(méi)有內(nèi)聯(lián)加速器也可支持足夠的容量。”

諾基亞則另辟蹊徑，將vRAN資源集中投入內(nèi)聯(lián)架構(gòu)。但其Layer 1加速器來(lái)自Marvell Technology而非英偉達(dá)，且該公司承認(rèn)轉(zhuǎn)向CUDA架構(gòu)需完全重寫代碼。諾基亞移動(dòng)網(wǎng)絡(luò)業(yè)務(wù)集團(tuán)負(fù)責(zé)人Tommi Uitto在今年3月MWC巴塞羅那期間表示，除非電信運(yùn)營(yíng)商采用GPU進(jìn)行主流AI推理，否則幾乎沒(méi)有必要進(jìn)行此類重構(gòu)開發(fā)。

“在這種情況下，大部分計(jì)算將用于Layer 1之外的工作負(fù)載，那么使用Layer 1加速器也就無(wú)關(guān)緊要了。”他當(dāng)時(shí)指出，“最終，我們希望在GPU中也實(shí)現(xiàn)Layer 1。”在此之前，諾基亞對(duì)英偉達(dá)技術(shù)的關(guān)注點(diǎn)更可能聚焦于將Grace用于Layer 1以上的功能模塊。

復(fù)蘇邊緣計(jì)算的設(shè)想

如果說(shuō)將Grace Blackwell芯片作為AI推理的關(guān)鍵組件部署于電信數(shù)據(jù)中心已難以想象，那么ARC-Compact就更難扮演這一角色了。委婉而言，如今關(guān)于電信運(yùn)營(yíng)商可以從超大規(guī)模云服務(wù)商（hyperscaler）與其他數(shù)據(jù)中心企業(yè)服務(wù)不足的眾多地點(diǎn)提供AI 推理服務(wù)并實(shí)現(xiàn)盈利的構(gòu)想近乎不切實(shí)際，這聽起來(lái)像是試圖重振邊緣計(jì)算的又一次嘗試。

甚至連電信運(yùn)營(yíng)商自身亦對(duì)此缺乏信心。Omdia近期開展了一項(xiàng)調(diào)查，詢問(wèn)受訪者認(rèn)為未來(lái)大多數(shù)AI處理將發(fā)生在何處。僅17%的受訪者回答是基站與樞紐站點(diǎn)，另有6%選擇了中心機(jī)房與前端站點(diǎn)。占比高達(dá)43%的最主流答案為終端用戶設(shè)備。電信運(yùn)營(yíng)商似乎處于終端設(shè)備與hyperscaler云服務(wù)之間的無(wú)人區(qū)，他們相較于后者的唯一優(yōu)勢(shì)在于更低的網(wǎng)絡(luò)時(shí)延。

遺憾的是，對(duì)于一個(gè)中等規(guī)模的國(guó)家來(lái)說(shuō)，那種需要大量站點(diǎn)才能支撐的超低時(shí)延服務(wù)需求幾乎為零。Omdia高級(jí)首席分析師Kerem Arsal在最近于倫敦舉行的一場(chǎng)活動(dòng)上指出，AI-RAN方案的負(fù)面因素目前仍遠(yuǎn)超其優(yōu)勢(shì)。“此外，hyperscaler對(duì)邊緣計(jì)算及合作伙伴關(guān)系的興趣有所消退，部分原因在于其商業(yè)模式未必會(huì)給邊緣計(jì)算帶來(lái)那么多回報(bào)。”他分析稱，電信運(yùn)營(yíng)商在邊緣計(jì)算方面迄今尚未展現(xiàn)“具有說(shuō)服力的差異化價(jià)值”。

隨著業(yè)界對(duì)英特爾未來(lái)前景的疑慮升溫，Grace的出現(xiàn)顯得恰逢其時(shí)。此前，英特爾是vRAN CPU領(lǐng)域的唯一選擇。若RAN供應(yīng)商能證明其軟件可近乎零修改地在x86與Arm架構(gòu)之間進(jìn)行遷移，則標(biāo)志著其已實(shí)現(xiàn)底層硬件解耦。同時(shí)，CPU性能的持續(xù)提升對(duì)長(zhǎng)期貶低其能力的廠商構(gòu)成挑戰(zhàn)。英偉達(dá)CEO黃仁勛曾于去年9月表示：“CPU無(wú)法跟上ASIC的工作負(fù)載處理能力。”

Kerem Arsal指出：“AI處理架構(gòu)可能從當(dāng)前以GPU為核心的形態(tài)逐步向性能更強(qiáng)的CPU傾斜。此外，總體而言，模型輕量化趨勢(shì)顯著，設(shè)備自主處理關(guān)鍵AI工作負(fù)載的可能性正在提升。” 這一趨勢(shì)顯然與黃仁勛的預(yù)期背道而馳。

給作者點(diǎn)贊

0 VS 0

寫得不太好

版權(quán)說(shuō)明：C114刊載的內(nèi)容，凡注明來(lái)源為“C114通信網(wǎng)”或“C114原創(chuàng)”皆屬C114版權(quán)所有，未經(jīng)允許禁止轉(zhuǎn)載、摘編，違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位，也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性，并完整標(biāo)注作者信息和本站來(lái)源。編譯類文章僅出于傳遞更多信息之目的，不代表證實(shí)其描述或贊同其觀點(diǎn)；翻譯質(zhì)量問(wèn)題請(qǐng)指正。

相關(guān)鏈接

AI 計(jì)算機(jī)服務(wù)器運(yùn)營(yíng)商基站

英偉達(dá) RTX Pro 企業(yè) AI 與工業(yè) AI 運(yùn)算平臺(tái)發(fā)布，將進(jìn)入量產(chǎn)階段
IT之家汪淼5-19
英偉達(dá)：計(jì)劃于 7 月開源全球最先進(jìn)的物理引擎 Newton
IT之家汪淼5-19
英偉達(dá)推出 NVLink Fusion：對(duì)外授權(quán)互聯(lián) IP，支持半定制 AI 基礎(chǔ)設(shè)施
IT之家溯波（實(shí)習(xí)）5-19
沙特阿美與亞馬遜、英偉達(dá)等美企簽署超 30 份協(xié)議，總價(jià)值可達(dá)約 900 億美元
IT之家浩渺5-15

日韩综合网-日韩综合网站-日韩综合一区-日韩综合在线视频-色涩网站-色涩网站在线观看

英偉達(dá)AI-RAN最新動(dòng)作：輕量化解決方案ARC-Compact登場(chǎng)