谷歌公司今天(6 月 18 日)發(fā)布博文,在宣布 Gemini 2.5 Flash 和 Gemini 2.5 Pro 模型進入穩(wěn)定階段之外,還推出全新輕量級模型 Gemini 2.5 Flash-Lite。
IT之家援引博文介紹,谷歌官方表示,Gemini 2.5 Flash 和 Gemini 2.5 Pro 兩款模型已通過大規(guī)模測試,可穩(wěn)定支持生產(chǎn)級應用開發(fā)。Spline、Rooms 等公司,以及 Snap、SmartBear 等企業(yè),已在過去數(shù)周內使用最新版本開發(fā)實際應用。
谷歌表示 Gemini 2.5 系列以平衡“成本-速度-性能”為核心設計目標,兼顧高效推理與經(jīng)濟性,伴隨著穩(wěn)定版上線,確保開發(fā)者能以更高信心構建復雜系統(tǒng)。
谷歌同步推出 Gemini 2.5 Flash-Lite 的預覽版本,這是目前該系列中成本效益最高、推理速度最快的模型。
測試顯示,F(xiàn)lash-Lite 在代碼編寫、科學計算、多模態(tài)分析等任務中,綜合質量超越前代 2.0 Flash-Lite;其延遲表現(xiàn)也優(yōu)于 2.0 版本,在翻譯、分類等需要快速響應的場景中尤為突出。
該模型繼承 Gemini 2.5 系列核心能力,包括靈活控制推理預算、連接外部工具(如谷歌搜索、代碼執(zhí)行)以及支持 100 萬 token 超長上下文處理。
開發(fā)者可通過 Google AI Studio、Vertex AI 平臺訪問 2.5 Flash 和 Pro 的穩(wěn)定版本,以及 Flash-Lite 的預覽版本。此外,Gemini 應用端也已集成 2.5 Flash 和 Pro,而谷歌搜索則部署了定制化版本的 Flash-Lite 和 Flash 模型以提升服務效率。