C114訊 6月21日消息(水易)“芯片問題其實沒必要擔心,用疊加和集群等方法,計算結果上與最先進水平是相當的!華為首席執行官任正非在公開場合表示。
在2025年華為開發者大會(HDC 2025)上,華為常務董事、華為云計算CEO張平安宣布基于CloudMatrix 384超節點的新一代昇騰AI云服務全面上線,同時宣布盤古大模型5.5正式發布,對自然語言處理(NLP)、計算機視覺(CV)、多模態、預測、科學計算五大基礎模型進行全面升級。
基于CloudMatrix 384超節點的新一代昇騰AI云服務
隨著大模型訓練和推理對算力需求的爆炸式增長,傳統計算架構已難以支撐AI技術的代際躍遷。從單節點向超節點架構演進成為重要發展趨勢,其中超高性能網絡的關鍵。這對于國產算力而言是彎道超車的機會,彌補單卡的性能鴻溝。
正如任正非所言:“我們單芯片還是落后美國一代,我們用數學補物理、非摩爾補摩爾,用群計算補單芯片,在結果上也能達到實用狀況!
華為云新一代昇騰AI云服務基于CloudMatrix 384超節點,首創將384顆昇騰NPU和192顆鯤鵬CPU通過全新高速網絡MatrixLink全對等互聯,形成一臺超級“AI服務器”,單卡推理吞吐量躍升到2300 Tokens/s,與非超節點相比提升近4倍。
據了解,超節點架構能更好地支持混合多專家MoE大模型的推理,可以實現“一卡一專家”,一個超節點可以支持384個專家并行推理,極大提升效率;同時,超節點還可以支持“一卡一算子任務”,靈活分配資源,提升任務并行處理,減少等待,將算力有效使用率(MFU)提升50%以上。
對于萬億、十萬億參數的大模型訓練任務,在云數據中心,還能將432個超節點級聯成最高16萬卡的超大集群;同時,超節點還可以支持訓推算力一體部署,如“日推夜訓”,訓推算力可靈活分配,幫助客戶資源使用最優。
據悉,目前昇騰AI云服務已經成為AI基礎設施的最優選擇,為科大訊飛、新浪、硅基流動、面壁智能、中科院、360等超過1300家客戶提供澎湃的AI算力。
基于昇騰全棧軟硬件能力,盤古大模型5.5全面升級
與市面上的其他大模型廠商不同,華為云盤古大模型堅定聚焦行業,其使命是讓各個行業不必重復“造輪子”,不必從零打造自己的企業大模型。本次大會上,華為云重磅發布盤古大模型5.5,五大基礎模型全面升級。
盤古自然語言處理NLP大模型:全新的718B 深度思考模型是一個由256個專家組成的MoE大模型,在知識推理、工具調用、數學等領域大幅增強,實現能力領先。盤古大模型5.5在高效長序列、低幻覺、快慢思考融合、Agent等特性上進行升級,提升用戶體驗。
盤古預測大模型:采用業界首創的triplet transformer統一預訓練架構,將不同行業的數據,包括工藝參數的表格數據,設備運行日志的時間序列數據,產品檢測的圖片數據進行統一的三元組編碼,并在同一框架內高效處理和預訓練,極大地提升預測大模型的精度。以應用于水泥、鋼鐵、有色金屬、供熱等多個行業。
盤古科學計算大模型:持續擴展與更多科學應用領域的結合。深圳氣象局基于盤古升級“智霽”大模型,首次實現AI集合預報,減少單一預報模型的誤差。重慶市氣象局基于盤古打造“天資·12h“氣象大模型,提升災害天氣的日內預報預警能力。深圳能源采用盤古進行中短期風光水發電量預測,減少發電側棄電,提升能源開發效率。
盤古計算機視覺CV大模型:華為云發布全新MoE架構的300億參數視覺大模型,全面支持圖像、紅外、激光點云、光譜、雷達等多維度、泛視覺的感知、分析與決策。另外,盤古CV大模型通過跨維度生成模型,構建油氣、交通、煤礦等工業場景稀缺的泛視覺故障樣本庫,極大地提升了業務場景的可識別種類與精度。
盤古多模態大模型:基于盤古多模態大模型的世界模型,可以為智能駕駛、具身智能機器人的訓練,構建所需要的數字物理空間,實現持續優化迭代。本次大會,華為云基于盤古大模型的多模態能力及思維能力,正式發布CloudRobo具身智能平臺。
值得一提的是,盤古大模型是基于昇騰云的全棧軟硬件訓練而成的,這標志著基于昇騰架構可以打造出世界一流大模型。
在過去的一年中,盤古大模型持續深耕行業,已在30多個行業、500多個場景中落地,在政務、金融、制造、醫療、煤礦、鋼鐵、鐵路、自動駕駛、氣象等領域發揮巨大價值,重塑千行萬業,成就行業AI先鋒。
打造AI Native的云,重塑云服務模式
華為云不僅在基礎設施和大模型方面持續創新,也在不斷通過AI技術重塑云服務,打造AI Native的云,幫助客戶更好地擁抱AI,讓客戶通過華為云服務,更便捷地擁抱AI創新,加速智能化。
華為云CTO張宇昕發布的最佳企業Agent平臺ModelArts Versatile,內置了各類業務場景的經驗模板,支持自助式的智能體開發。Versatile還提供了智能化工具鏈,實現Agent分鐘級工作輸出,達成傳統人工天級工作成果,有效降低Agent開發的復雜度與專業性。
同時,華為云基于AI算力、盤古大模型和Agent能力,對智能助手盤古Doer進行全面升級。
CodeArts Doer構建了業界最全的6大開發領域專業Agent,覆蓋項目經理、產品管理、開發、構建、測試和部署全流程,將軟件研發端到端提效40%以上。GaussDB Doer在精準查詢方面,利用全球上萬個GaussDB運維案例的百億Tokens數據微調,構建專業運維基模型,讓故障處置更加高效。MetaStudio通過個性化TTS語音合成,數字人的音色相似度、讀音準確率都達到業界領先,同時結合更精準的口型匹配、更豐富的動作,實現數字人形象高擬真。
另外,華為云提供包含語料數據安全、模型安全、推理安全、應用安全在內的全生命周期模型安全方案。大模型防火墻通過提示詞攻擊防范和敏感內容實時檢測,保障大模型推理安全。一方面識別越獄、角色扮演、惡意指令等主流提示詞攻擊手段;另一方面預置了百萬級規則庫,針對提示詞攻擊的檢出率大于95%,整體能夠幫助模型綜合安全評測得分提升20%以上。
華為云是華為公司面向開發者的統一底座,目標打造昇騰、鴻蒙、鯤鵬、GaussDB、歐拉等各項根技術的生態,給廣大開發者一個更優的選擇。
為了給開發者提供AI時代的智能應用開發體驗,華為開發者空間全面升級,開發者可以便捷的調用算力、大模型、Agent工具等華為云服務來開發智能應用。如今,華為云開發者已超過800萬;華為云作為云底座,支持鯤鵬、昇騰、鴻蒙等生態的開發者總計達到1300萬。