近日,紫光股份旗下新華三集團(以下簡稱“新華三”)宣布推出基于 NVIDIA AI 數據平臺參考設計的技術集成方案,打造更智能、更靈活、更安全的大模型數據處理能力,為AI推理場景注入新能力和強勁動能。
當前,在大模型實時交互場景中,用戶對AI服務的響應速度要求極高;同時,如果AI推理沒有基于新的或更新過的內容,就會造成生成內容與事實不符、邏輯錯誤等情況,嚴重影響其可靠性和實用性。新華三新推出的 AI 數據平臺解決方案,打通“算力”和“存力”之間的效率鴻溝,實現從底層硬件到上層AI應用的數據流通加速,大幅提升AI推理的實時性、相關性與準確度,不僅優化了大模型的整體運行效率,也顯著改善了真實場景中使用大模型時的響應速度與使用體驗。
H3C AI數據平臺解決方案:軟硬協同 推理加速
AI數據平臺解決方案整合了新華三與NVIDIA的領先技術,打造存算網技術深度集成的智能數據平臺,并通過上層軟件平臺協同優化,為AI基礎設施注入強勁動能,顯著提升AI大模型的推理能力。
存算網深度集成,打通推理性能瓶頸
AI數據平臺解決方案集成了NVIDIA Spectrum-X AI以太網網絡平臺,包括Spectrum以太網交換機、NVIDIA BlueField-3 DPU數據處理器及NVIDIA ConnectX SuperNIC,將普通以太網的帶寬利用率從50-60%提升至97%以上,有效應對瞬時流量高峰,保障存儲與計算節點間的高速互連。BlueField-3 DPU可與H3C Polaris X20000存儲系統完美適配,支持NVMe over Fabrics、NVIDIA GPU-Direct Storage(GDS)等技術,實現存儲卸載和加速,涵蓋數據冗余、完整性校驗、解壓縮和重復數據刪除等功能,進一步提升存儲性能并降低功耗。
新華三Polaris X20000系列專為AI智算場景設計,采用全新自研存儲引擎,面向AI/HPC場景下的海量數據處理需求提供極致性能,單節點實現120GB/s帶寬和200萬IOPS,集群性能近線性增長,滿足AI大模型訓練中海量小文件高并發和百TB級帶寬需求;并將塊、文件、對象與HDFS協議集成于統一存儲平臺,從數據采集、模型訓練到分發全流程實現數據零遷移。同時,系統大幅提升可靠性,毫秒級故障上報與秒級切換確保訓練任務不中斷,計劃內/外升級擴容對上層應用無感,為企業提供穩定、高效的存儲支持。
軟件平臺協同優化 加速智算推理引擎
在 AI-Q NVIDIA Blueprint 的支持下,代理式系統可以連接到新華三Polaris X20000高性能數據存儲平臺上,AI-Q 使用NVIDIA NeMo Retriever加速數據提取和檢索,NVIDIA NeMo Retriever 是用于處理海量結構化、半結構化及非結構化數據(如文本、PDF、圖像、視頻等)的軟件。如此,可顯著加速RAG(檢索增強生成)應用的響應速度。同時NVIDIA NeMo Guardrails可確保推理問答交互的安全性、準確性和主題相關性。新華三自主研發的靈犀使能平臺(LinSeer Hub)則作為上層管理平臺,提供了AI智能體和推理引擎的功能。
通過上述組件的深度整合,AI 數據平臺解決方案顯著提升大模型的推理性能與Token處理速度,為企業提供實時數據洞察能力,助力業務場景的智能化升級。
數據驅動 加速推理 引領智算未來
隨著AI大模型的快速發展,數據已成為AI生產力的核心要素,與此同時,企業核心生產數據80%存儲于外置專業存儲,新華三作為存儲領域的領先廠商,以PolarisX20000系列的卓越性能和靈活性,提升了AI 數據平臺的能力。NVIDIA則通過硬件加速和軟件能力,釋放Polaris存儲硬件的潛力,幫助新華三實現從“數據倉庫”到“智能數據平臺”的轉型,形成完整的AI數據閉環。并結合存儲廠商成熟的數據管理能力,構建高效AI基礎設施。
作為數字化及AI解決方案提供者,新華三擁有深厚的市場積累和廣泛的行業覆蓋,服務于金融、電信、政務、醫療、教育、制造等多個領域。新華三此次推出的AI 數據平臺解決方案,是新華三“算力╳聯接”技術戰略的持續深化。未來,新華三將持續攜手生態伙伴,推動AI數據平臺的技術革新與產業落地,助力百行百業實現高效、智能、可信的AI轉型。