谷歌于今年 3 月底發布了 Gemini 2.5 Pro 模型,緊接著又在 4 月推出了面向更廣泛用戶的輕量級版本 Gemini 2.5 Flash。兩者目前仍處于預覽階段,但 Flash 版本已可通過 Gemini App 向全球用戶開放體驗。
目前,谷歌再度更新 Google AI Studio 中的 Gemin 2.5 Pro 預覽版模型(IT之家注:更新至 06-05 版本),并聲稱該模型刷新了多項 AI 性能基準“跑分”:
LMArena Elo 評分上升 24 分
WebDevArena Elo 評分上升 35 分至 1443 分,取得業界領先地位
在 GPQA 和 Humanity's Last Exam 等高難度測試中“表現出色”
谷歌還回應了上一個 Gemini 2.5 Pro 預覽版(05-06 版本)用戶們對于“模型性能短暫下滑”的抱怨,聲稱模型“已在風格與結構方面進行了優化”,使模型“更具創意、回答格式更清晰”,提升了交互體驗。
值得注意的是,谷歌近期還放寬了 Pro 版用戶的請求限制(query limits),這也許預示著該版本在本月正式上線后會有更具吸引力的價格策略。