本周早些時候,人工智能開發平臺 Hugging Face 發布了一款名為 SmolVLA 的開源機器人 AI 模型。據 Hugging Face 稱,SmolVLA 在虛擬和現實環境中均優于許多規模更大的機器人模型。
IT之家注意到,Hugging Face 在其博客文章中表示:“SmolVLA 致力于普及視覺 - 語言 - 行動(VLA)模型的使用,并加速通用機器人智能體的研究進程。”SmolVLA 不僅是一個輕量級但功能強大的模型,更是一種用于訓練和評估通用機器人技術的方法。
SmolVLA 是 Hugging Face 迅速拓展的低成本機器人軟硬件生態系統的一部分。去年,該公司推出了 LeRobot,這是一套專注于機器人的模型、數據集和工具。近期,Hugging Face 收購了總部位于法國的機器人初創公司 Pollen Robotics,并推出了一系列可供購買的廉價機器人系統,包括人形機器人。
SmolVLA 擁有 4.5 億個參數,這些參數有時也被稱為“權重”,是模型內部決定其行為的組件。該模型是基于 Hugging Face AI 開發平臺上共享的 LeRobot 社區數據集(專門標記的機器人數據集)進行訓練的。Hugging Face 表示,SmolVLA 的規模小到可以在單個消費級 GPU 上運行,甚至可以在 MacBook 上運行,并且可以在包括該公司自身機器人系統在內的“經濟實惠”的硬件上進行測試和部署。
有趣的是,SmolVLA 還支持“異步推理堆棧”,Hugging Face 稱這一功能可以使模型將機器人行動的處理與視覺和聽覺的處理分離。正如該公司在博客中解釋的那樣:“由于這種分離,機器人能夠在快速變化的環境中更快地做出響應。”
SmolVLA 已可在 Hugging Face 官方網站上下載。已經有用戶在社交平臺 X 上聲稱,他們利用該模型控制了第三方機械臂。
值得注意的是,Hugging Face 并非開放機器人領域唯一的參與者。英偉達擁有一套用于開放機器人的工具集,而初創公司 K-Scale Labs 正在開發其所謂的“開源人形機器人”組件。此外,該領域的其他實力強勁的公司包括 Dyna Robotics、杰夫 貝索斯支持的 Physical Intelligence,以及 RLWRLD。