在5月20日的百度AI Day 上,中國信通院公布了大模型推理能力評估結果。
百度文心大模型X1 Turbo在24項能力評估中,16項達5分,綜合評級獲當前最高級“4+級”,成為國內首款通過該測評的大模型。
其中,文心X1 Turbo在邏輯推理、代碼推理、推理效果優化等技術能力及工具支持度、安全可靠度等應用能力均獲得滿分。
AI Day現場,百度吳甜系統性講解了文心大模型最新版的技術創新。
她介紹,文心大模型4.5是多模態基礎大模型,文心4.5 Turbo源自文心4.5,效果更好、成本更低。
基于文心4.5 Turbo,文心X1升級到X1 Turbo,性能提升的同時,具備更先進的思維鏈,問答、創作、邏輯推理、工具調用和多模態能力進一步增強。