AI 搜索引擎企業 Perplexity 當地時間昨日宣布推出其開發的新版 Sonar 搜索模型。該模型由 Llama 3.3 70B 進一步訓練而來,對搜索應用進行了優化,運行在 Cerebras 推理基礎設施上。
Perplexity 表示新版 Sonar 的 Token 解碼速度達到 1200 個每秒,是 Gemini 2.0 Flash 的 8.5 倍以上,“幾乎可以即時生成答案”。
而在回答質量方面,Perplexity 稱其用戶對新版 Sonar 模型的表現評價明顯超過了 GPT-4o mini 和 Claude 3.5 Haiku,甚至高于前沿模型 Claude 3.5 Sonnet,同時與 GPT-4o 差異不大。
Perplexity 的新版 Sonar 的兩大優勢是其擁有更優秀的回答事實性;且能更熟練應用 markdown 格式提供可讀性更佳的回答文本。