科技媒體 macstories 昨日(6 月 17 日)發布博文,通過一段長達 34 分鐘,7GB 的視頻文件實測,發現蘋果全新的 Speech API 僅用 45 秒完成,比 OpenAI Whisper(101 秒)快 55%。
注:蘋果公司在 WWDC 2025全球開發者大會上,宣布推出全新的 Speech 框架,其中包含 SpeechAnalyzer 和 SpeechTranscriber 兩款模組。
該媒體實測了基于上述模組開發的 Yap 應用工具,發現轉錄處理一段 34 分鐘、7GB 的 4K 視頻,只需要 45 秒,遠超競品 MacWhisper(基于 OpenAI 的 Whisper 開源語音轉錄模型)的 1 分 41 秒。
該媒體進一步對比 Yap 與 MacWhisper、VidCap 等主流工具的表現:
Yap:45 秒完成轉錄,輸出 SRT 及 TXT 格式文件;
MacWhisper(V3 Turbo):1 分 41 秒;
VidCap:1 分 55 秒;
MacWhisper(V2):3 分 55 秒。
該媒體指出盡管所有工具在專有名詞識別(如“AppStories”)存在誤差,但 Yap 的本地化運算,讓其速度優勢顯著,以每周處理多段視頻計算,累計節省時間效益可觀。