微軟研究院昨日(5 月 19 日)發布博文,介紹了 Magentic-UI 開源研究原型。這是一款以人為中心的 AI 智能體,旨在通過網頁瀏覽器,實時協助用戶完成復雜的網絡任務。
微軟表示現代生產力高度依賴網絡,搜索信息、填寫表單還是操作儀表板等許多任務仍需手動操作,耗時且重復。而 Magentic-UI 通過以人為中心的理念,協助用戶處理這些任務,并為研究人員提供平臺,探索人機協作和 AI 智能體監督機制的開放性問題。
不同于追求完全自主的 AI 工具,Magentic-UI 強調透明和可控,確保用戶在任務執行中擁有主導權。
Magentic-UI 基于 2024 年發布的 Magentic-One 多智能體系統,并由 AutoGen 框架驅動,具備協同規劃(co-planning)、協同任務(co-tasking)、行為防護(action guards)和計劃學習(plan learning)四大核心功能。
在協同規劃中,用戶可通過計劃編輯器修改 AI 制定的步驟;在任務執行中,用戶能隨時暫停系統并提供反饋,甚至直接接管瀏覽器操作。
行為防護機制要求 AI 在執行可能不可逆的操作前獲得用戶批準,而計劃學習功能則讓 AI 從過往任務中學習并保存計劃,提升未來效率。
IT之家援引博文介紹,Magentic-UI 的底層系統由多個專業智能體組成,包括負責規劃和任務分配的 Orchestrator、操控瀏覽器的 WebSurfer、執行代碼的 Coder 以及處理文件的 FileSurfer。
系統采用 Docker 沙箱技術,防止影響主機環境。此外,用戶可設置網站白名單,限制 AI 訪問范圍,并隨時中斷任務執行。微軟還通過紅隊評估測試了 Magentic-UI 的安全性,成功抵御了跨站提示注入和釣魚攻擊等多重威脅。