【新智元导读】就在今天凌晨,OpenAI的全新音频模型上线了!语音智能体的时代正式开启了!现在可以利用新的语音模型,指导GPT-4o的说话语气:想温柔就温柔,让疯狂就疯狂!而且,定价也很亲民,比上一代语音模型更便宜。
机器之心报道编辑:泽南现在,你可以指导 GPT-4o 的说话方式了。今天凌晨,OpenAI 突然开启了新产品发布直播,这次新发布的内容全是音频模型。据介绍,它们实现了新的 SOTA 水平,在准确性和可靠性方面优于现有解决方案——尤其是在涉及口音、嘈杂环境和不同语速的复杂场景中。这些改进提高了语音 / ...
根据OpenAI官方数据显示,在行业标准的33种语言测试中,gpt-4o-transcribe的错误率相较于Whisper有了显著下降,尤其在英语方面,错误率更是低至 2.46%! 这对于需要高精度语音转录的场景来说,无疑是一个巨大的进步。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果