C114訊 北京時(shí)間5月21日消息(岳明)Light Reading在一篇最新報(bào)道中針對(duì)英偉達(dá)ARC-Compact的推出與潛在市場(chǎng)影響進(jìn)行了分析。
盡管市場(chǎng)反響有限,英偉達(dá)仍未放棄向電信行業(yè)銷售AI芯片的嘗試。不過(guò)這家GPU巨頭似乎正在轉(zhuǎn)向中低端市場(chǎng),并在最新推出的RAN解決方案中弱化了對(duì)AI的強(qiáng)調(diào)。如果說(shuō)以著名計(jì)算機(jī)奇才兼海軍少將命名的Grace Hopper芯片組是一艘豪華超級(jí)游艇,那么近日發(fā)布的ARC-Compact則像是一艘配置簡(jiǎn)化、功能精簡(jiǎn)的經(jīng)濟(jì)型船只。
去年發(fā)布的搭載Grace Hopper及后續(xù)Grace Blackwell的ARC服務(wù)器主要面向部署集中式RAN(C-RAN)的電信運(yùn)營(yíng)商,旨在通過(guò)就近數(shù)據(jù)中心支撐多基站運(yùn)行。而全新推出的ARC-Compact專為分布式RAN(D-RAN)基站部署設(shè)計(jì),這一架構(gòu)轉(zhuǎn)變將完全改變技術(shù)需求與經(jīng)濟(jì)模型。
圖:英偉達(dá)ARC-Compact產(chǎn)品圖。
ARC-Compact的核心組件是基于軟銀旗下Arm架構(gòu)的Grace CPU及L4 Tensor Core GPU。相較于Hopper和Blackwell GPU,該解決方案更加輕量級(jí),適用于一些邊緣視頻處理及推理任務(wù),但無(wú)法勝任大語(yǔ)言模型訓(xùn)練或高強(qiáng)度AI運(yùn)算。
在官方技術(shù)博客中,英偉達(dá)將ARC-Compact描述為“高性價(jià)比、高能效”的解決方案,適用于“低時(shí)延AI工作負(fù)載與RAN加速”。但即便L4 Tensor Core的配置也可能超出實(shí)際需求。當(dāng)前市場(chǎng)競(jìng)爭(zhēng)有限,僅有三家RAN設(shè)備商可能采用該技術(shù),且其關(guān)注重點(diǎn)更傾向于Grace CPU而非其他GPU。
CUDA架構(gòu)推進(jìn)遇阻
這三家設(shè)備商為愛立信、諾基亞與三星,它們均已對(duì)虛擬化RAN(vRAN)技術(shù)進(jìn)行投資。該技術(shù)以通用CPU替代了5G網(wǎng)絡(luò)中常見的專用集成電路(ASIC)。英偉達(dá)提出的AI-RAN是這一概念的演進(jìn),它建議保留CPU用于處理計(jì)算強(qiáng)度較低的工作負(fù)載,同時(shí)引入GPU作為L(zhǎng)ayer 1的“內(nèi)聯(lián)”加速器——Layer 1在RAN軟件棧中屬于資源密集型部分。
當(dāng)前的問(wèn)題在于,上述三大設(shè)備商均未展現(xiàn)出采用英偉達(dá)統(tǒng)一計(jì)算設(shè)備架構(gòu)(CUDA)來(lái)基于GPU進(jìn)行RAN開發(fā)的強(qiáng)烈意愿。愛立信與三星更傾向于采用“旁路(lookaside)”vRAN架構(gòu),該方案為實(shí)現(xiàn)硬件獨(dú)立性,致力于最大限度將軟件保留在CPU運(yùn)行。在現(xiàn)行部署中,僅Layer 1中的高負(fù)載任務(wù)——前向糾錯(cuò)(FEC)需使用硬件加速器。
愛立信表示,在試驗(yàn)環(huán)境中,其為英特爾x86架構(gòu)CPU編寫的軟件經(jīng)少量修改即可移植至Grace平臺(tái)。這意味著即便最終采用GPU進(jìn)行任何RAN計(jì)算,也僅用于FEC處理。三星同樣在Grace平臺(tái)進(jìn)行軟件測(cè)試,并在最近明確表示不考慮采用Layer 1內(nèi)聯(lián)加速器。“當(dāng)CPU無(wú)法提供足夠容量時(shí),才需要內(nèi)聯(lián)加速器。”該公司近期通過(guò)郵件向Light Reading表示,“隨著技術(shù)的進(jìn)步,CPU已具備支持增強(qiáng)容量的能力,我們預(yù)計(jì)即使沒(méi)有內(nèi)聯(lián)加速器也可支持足夠的容量。”
諾基亞則另辟蹊徑,將vRAN資源集中投入內(nèi)聯(lián)架構(gòu)。但其Layer 1加速器來(lái)自Marvell Technology而非英偉達(dá),且該公司承認(rèn)轉(zhuǎn)向CUDA架構(gòu)需完全重寫代碼。諾基亞移動(dòng)網(wǎng)絡(luò)業(yè)務(wù)集團(tuán)負(fù)責(zé)人Tommi Uitto在今年3月MWC巴塞羅那期間表示,除非電信運(yùn)營(yíng)商采用GPU進(jìn)行主流AI推理,否則幾乎沒(méi)有必要進(jìn)行此類重構(gòu)開發(fā)。
“在這種情況下,大部分計(jì)算將用于Layer 1之外的工作負(fù)載,那么使用Layer 1加速器也就無(wú)關(guān)緊要了。”他當(dāng)時(shí)指出,“最終,我們希望在GPU中也實(shí)現(xiàn)Layer 1。”在此之前,諾基亞對(duì)英偉達(dá)技術(shù)的關(guān)注點(diǎn)更可能聚焦于將Grace用于Layer 1以上的功能模塊。
復(fù)蘇邊緣計(jì)算的設(shè)想
如果說(shuō)將Grace Blackwell芯片作為AI推理的關(guān)鍵組件部署于電信數(shù)據(jù)中心已難以想象,那么ARC-Compact就更難扮演這一角色了。委婉而言,如今關(guān)于電信運(yùn)營(yíng)商可以從超大規(guī)模云服務(wù)商(hyperscaler)與其他數(shù)據(jù)中心企業(yè)服務(wù)不足的眾多地點(diǎn)提供AI 推理服務(wù)并實(shí)現(xiàn)盈利的構(gòu)想近乎不切實(shí)際,這聽起來(lái)像是試圖重振邊緣計(jì)算的又一次嘗試。
甚至連電信運(yùn)營(yíng)商自身亦對(duì)此缺乏信心。Omdia近期開展了一項(xiàng)調(diào)查,詢問(wèn)受訪者認(rèn)為未來(lái)大多數(shù)AI處理將發(fā)生在何處。僅17%的受訪者回答是基站與樞紐站點(diǎn),另有6%選擇了中心機(jī)房與前端站點(diǎn)。占比高達(dá)43%的最主流答案為終端用戶設(shè)備。電信運(yùn)營(yíng)商似乎處于終端設(shè)備與hyperscaler云服務(wù)之間的無(wú)人區(qū),他們相較于后者的唯一優(yōu)勢(shì)在于更低的網(wǎng)絡(luò)時(shí)延。
遺憾的是,對(duì)于一個(gè)中等規(guī)模的國(guó)家來(lái)說(shuō),那種需要大量站點(diǎn)才能支撐的超低時(shí)延服務(wù)需求幾乎為零。Omdia高級(jí)首席分析師Kerem Arsal在最近于倫敦舉行的一場(chǎng)活動(dòng)上指出,AI-RAN方案的負(fù)面因素目前仍遠(yuǎn)超其優(yōu)勢(shì)。“此外,hyperscaler對(duì)邊緣計(jì)算及合作伙伴關(guān)系的興趣有所消退,部分原因在于其商業(yè)模式未必會(huì)給邊緣計(jì)算帶來(lái)那么多回報(bào)。”他分析稱,電信運(yùn)營(yíng)商在邊緣計(jì)算方面迄今尚未展現(xiàn)“具有說(shuō)服力的差異化價(jià)值”。
隨著業(yè)界對(duì)英特爾未來(lái)前景的疑慮升溫,Grace的出現(xiàn)顯得恰逢其時(shí)。此前,英特爾是vRAN CPU領(lǐng)域的唯一選擇。若RAN供應(yīng)商能證明其軟件可近乎零修改地在x86與Arm架構(gòu)之間進(jìn)行遷移,則標(biāo)志著其已實(shí)現(xiàn)底層硬件解耦。同時(shí),CPU性能的持續(xù)提升對(duì)長(zhǎng)期貶低其能力的廠商構(gòu)成挑戰(zhàn)。英偉達(dá)CEO黃仁勛曾于去年9月表示:“CPU無(wú)法跟上ASIC的工作負(fù)載處理能力。”
Kerem Arsal指出:“AI處理架構(gòu)可能從當(dāng)前以GPU為核心的形態(tài)逐步向性能更強(qiáng)的CPU傾斜。此外,總體而言,模型輕量化趨勢(shì)顯著,設(shè)備自主處理關(guān)鍵AI工作負(fù)載的可能性正在提升。” 這一趨勢(shì)顯然與黃仁勛的預(yù)期背道而馳。