近日,美国情感智能技术初创公司Hume AI发布了一款名为Octave的新型文本转语音大模型,引起了广泛关注。这款模型不仅能生成富有人设特点、语调起伏和情感色彩的AI语音,还支持用户通过文本指令进行二次调整和创作。作为DeepMind前研究员Alan ...
孩子问我为什么老师教的英语和电脑里的不一样,我想问孩子学英语时语音语调是不是很重要啊?还有,孩子是该学美音还是英音呢?——窝儿妈 众所周知,成人如果语音语调不准,是很难更正 ...
在快速发展的播客领域,Podcastle 平台近日宣布推出其全新的 AI 文本转语音模型 Asyncflow v1.0。这个新模型不仅为用户提供了超过450种不同的 AI 语音,还向开发者开放了 API 接口,以便于他们将这一文本转语音功能直接集成到自己的应用程序中。
近日,国家知识产权局公布了一项重要专利,暗物智能科技(广州)有限公司成功获得名为‘一种流式可控制的中文语音合成方法及系统’的专利授权,公告号为CN115146593B。这一成果标志着中文语音合成技术迈向新高度,为人工智能领域注入强劲动力。
在科技迅速发展的当下,汽车行业也在不断革新。本月26日,岚图汽车正式宣布其自主研发的AI语音对话系统将于2023年上半年正式上线。这一消息不仅引起了业内人士的关注,同时也为广大车主和潜在用户带来了期待。 作为一家近年来崛起的汽车制造品牌,岚图汽车的产品线不断扩展,而其即将推出的AI语音对话系统无疑是其技术创新的重要体现。据官方透露,系统的车控响应速度将小于1秒,唤醒识别率高达98%以上,这意味着用 ...
Hume AI联合创始人兼CEO Alan Cowen在接受VentureBeat视频电话采访时说道:“我们推出了 首个AI文生语音大模型 ,该模型能够理解上下文中的词汇,并预测出适当的情绪、节奏、韵律和重音,从而使AI语音听起来比以往 更人性化 。
微信的语音转文字功能“奈何”不了的方言是什么?四川话。虽然微信语音转文字的识别方言功能已经上线几年了,但对四川话,它似乎依然无可奈何,不仅识别不出具体内容,还“跨语种”地给识别成了英语。许多网友纷纷晒出自己的聊天记录,表示:“四川人的语音转文字,就是 ...
岚图汽车宣布,其自主研发的AI语音对话系统计划在2025年上半年发布并应用于新车型。该系统具备快速的车控响应能力,响应时间小于1秒,同时拥有超过98%的唤醒识别率。岚图汽车的座舱AI技术研究目前集中在三个主要方向:深度优化整车智能座舱系统,提供便捷的用户体验;结合deepseek的CoT训练方案,增强系统的思考与分析能力,确保在面对复杂指令时AI能精准响应;基于下一代芯片算力,设计研发新一代离线基 ...
今天要为大家隆重介绍一款在语音合成领域取得重大突破的新型 TTS 模型—— Llasa 8B。 这款模型由香港科技大学(HKUST)倾力打造,基于强大的 LLaMA 8B 大语言模型进行微调,专注于实现极致的语音克隆效果,并支持令人惊艳的中英双语生成能力。Llasa 8B 并非横空出世,它巧妙地选择了 Meta 公司开源的 LLaMA 8B ...
自动播放 Octave可以根据简单提示词变换AI语音的语气和语调(图源:Hume AI官网) 换而言之,相比于过往一板一眼念文本的AI味语音,Octave旨在让AI ...