速度与准确性的权衡:苹果新语音转录 API 对比测试
创始人
2025-07-04 10:01:58
0

IT之家 7 月 4 日消息,科技媒体 9to5Mac 昨日(7 月 3 日)发布博文,对比测试了苹果系统的全新转录 API,认为该 API 在速度上优于 OpenAI 的 Whisper 模型,但在准确性上仍有一定差距。

IT之家注:该媒体使用一段 9to5Mac Daily 的播客音频测试,长度为 7 分 31 秒,对比了苹果的新转录 API、OpenAI 的 Whisper Large v3 Turbo(通过 MacWhisper 应用)和英伟达的 Parakeet v2 模型。

测试平台为 M2 Pro 芯片的 MacBook Pro 笔记本,配备了 16GB 内存,使用 Metric: cer 和 Metric: wer 两款 Hugging Face Spaces 来分析实际的字符错误率(CER)和单词错误率(WER)。

结果显示,Parakeet v2 的转录时间最短,仅为 2 秒,但 CER 和 WER 较高;Whisper Large V3 Turbo 的准确性最高,但转录时间长达 40 秒;苹果的模型在速度上接近 Parakeet,但准确性优于后者。

模型转录时间 字符错误率单词错误率Parakeet v22 seconds5.8%12.3%Whisper Large V3 Turbo40 seconds0.2%1.5%Apple9 seconds1.9%10.3%

该媒体还使用了 ChatGPT、Claude 和 Gemini 为基线来计算 CER 和 WER。结果显示,每个模型的性能都有所不同,但 Whisper 在准确性上仍领先。

ChatGPT (o4-mini-high)

模型 转录时间字符错误率单词错误率Parakeet v22 seconds6.0%12.3%Whisper Large V3 Turbo40 seconds0.4%1.4%Apple9 seconds2.1%10.2%

Claude (Sonnet 4)

模型转录时间字符错误率单词错误率Parakeet v22 seconds8.4%11.0%Whisper Large V3 Turbo40 seconds0.1%1.0%Apple9 seconds3.5%8.2%

Gemini (2.5 Pro)

模型转录时间字符错误率单词错误率Parakeet v22 seconds7.6%12.3%Whisper Large V3 Turbo40 seconds0.3%0.4%Apple9 seconds3.4%5.3%

相关内容

热门资讯

“2025能源青年和媒体全球多... 6月30日,以“数智赋能低碳未来”为主题的“2025能源青年和媒体全球多维对话”活动在北京举办。活动...
插HDMI即用!国家广电总局:... 快科技7月4日消息,据国家广电总局的说法,插入式微型机顶盒和通用遥控器已具备千万级规模部署条件。 广...
中央批准:邬小撑任东南大学党委... 【大河财立方消息】 据教育部新闻办,日前,中央批准:邬小撑同志任东南大学党委书记(副部长级);左惟同...
湖北省设立100亿元人形机器人... 湖北日报讯(记者张爱虎、通讯员姚佳)7月4日从省财政厅获悉,该厅依托省政府投资引导基金,支持长江证券...
“700XXXXXXXXXXX... 据工业和信息化部官网消息,为引导号码保护服务业务规范健康发展,加强手机号码使用管理,工业和信息化部近...
8 款实用内网屏幕监控软件测评... 如今这个数字化办公的时代,不少老板和高管都犯愁:怎么才能知道员工有没有认真干活?怎么守住公司的信息安...
无人物流车价格下探至2万元区间... 新华财经北京7月4日电 2025年以来,无人物流车价格下探、频获资本青睐,作为自动驾驶市场中前景广阔...
失序的无人机“飞手”培训市场亟... 江西省抚州市南丰县桑田镇古城村,一名“飞手”操控植保无人机对水稻进行“飞防”作业。图源:视觉中国 无...
商务部就公布对原产于欧盟的进口... 7月4日,商务部新闻发言人就公布对原产于欧盟的进口相关白兰地反倾销调查最终裁定答记者问。有记者问:商...
预警升级,停止户外露天作业!新... 【高温红色预警信号】 新乡市气象台2025年7月4日13时40分将高温橙色预警信号升级为高温红色预警...