日前,阿里巴巴發布并開源新一代通義千問模型Qwen3,參數量僅為DeepSeek-R1的1/3,成本大幅下降,性能則全面超越DeepSeek-R1、OpenAI-o1等全球頂尖模型,登頂全球最強開源模型。
Qwen3發布當天,摩爾線程宣布,其率先完成了Qwen3全系列模型在全功能GPU上的高效支持。
摩爾線程表示,這一成果充分驗證了MUSA架構和全功能GPU的技術成熟度與可靠性。
目前,主流推理引擎均可基于摩爾線程MUSA平臺運行Qwen3系列模型。
摩爾線程稱,MUSA平臺能夠作為vLLM、Ollama、GPU Stack等各類主流開源推理引擎的后端,為Qwen3系列模型的高效運行提供強大動力。
例如,QWen3-235B-A22B(Qwen3系列最大參數量模型),基于vLLM-MUSA引擎在摩爾線程全功能GPU上穩定運行。
據了解,此次開源的兩款MoE模型是Qwen3-235B-A22B和Qwen3-30B-A3B;同時還包括六個Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。