2022年9月1日,世界人工智能大會(WAIC)“AI領SHOW”欄目在上海世博會議中心火熱拉開序幕。“AI領SHOW”是本屆WAIC整場會議活動全新升級后的配套欄目,“鎮館之寶”、“SAIL獎Top30代表”、“重磅新品發布”、“元宇宙”等代表紛紛閃亮登場,全程通過大會官網及CCTV.com直播。
中科院自動化所研究員、武漢人工智能研究院院長王金橋首先在AI領SHOW欄目登臺演講,展示了基于昇騰 AI 基礎軟硬件平臺打造的全球首個三模態大模型“紫東.太初”。“紫東.太初”通過跨模態多任務自監督學習,實現了圖像、文字、語音和視頻等不同模態數據之間的統一表示和互相生成的,且形成了完整的智能表示、推理和生成能力。
王院長在AI領SHOW欄目向與會嘉賓講述道:“傳統人工智能學習當中,通過視覺模型可以實現人臉的識別,但是并不知道機器怎么表征每個人的特征差異,只能從圖像中間結果的特征圖解釋機器學習的過程,而通過“紫東.太初”三模態的模型,可以把圖像、語音等實現跨模態的統一到人類語言的維度,更接近于人類的理解和思考方式。”
細數“紫東.太初”四大大突破
1.多任務多層次的跨模態自監督學習
提出了多任務多層次的跨模態自監督學習的訓練框架,支持詞條級別、模態級別和樣本級別的訓練,實現了跨模態理解與生成的統一建模。
2.首次使“以圖生音”和“以音生圖”成為現實
“紫東.太初”首次貫通了語音、圖像、文字這幾種信息,形成了完整的智能表示、推理和生成能力,是當前數據智能領域的最新發展趨勢,為探索人類智能本質提供了一個極佳的平臺。
3.首個千億參數多模態預訓練大模型
“紫東.太初”作為全球范圍內首個千億參數的三模態大模型,標志著我國從限定領域的弱人工智能正式邁向通用人工智能路徑的重要探索。
4.“一專一能”突破至“多專多能”
“紫東.太初”多項算法指標性能全球第一。讓AI從“一專一能”邁向“多專多能”的同時,在多項下游任務中超越業界最好的性能,構建了全自主人工智能技術體系。
除了向線上線下參會嘉賓展示“紫東.太初”的技術優勢,王院長還表示已經實現基礎模型開源和大模型的服務開放,近期將開放“紫東.太初”服務平臺新的版本,支持低代碼人工智能模型的訓練、微調和部署,通過API調用的模式,自動上傳數據,自動標注模型,自動形成推理部署的工具,自動體驗效果。