业内首个!小米开源模型OmniVoice可覆盖600+语种
创始人
2026-05-08 10:33:51
0

【CNMO科技消息】5月7日,小米AI实验室推出OmniVoice,这是业内首个覆盖数百语种的语音克隆TTS(文本到语音)模型。该模型支持600余种语言的语音合成,包括低资源小语种,能够实现高质量的多语言语音克隆。

小米

据介绍,OmniVoice在数秒内即可完成语音克隆,且覆盖语种范围广泛。传统语音克隆模型通常仅支持少数主流语言,而小米AI实验室通过技术创新,将模型扩展至数百语种,使得几乎所有语种都能通过该模型进行合成。这一突破为多语言语音交互、内容本地化等场景提供了新的技术路径。

小米AI实验室表示,OmniVoice的推出标志着多语言TTS研发进入新范式。该模型在低资源小语种上的表现尤为突出,解决了以往小语种语音数据稀缺导致合成质量低的问题。目前,该技术已在小米旗下部分产品中开始应用测试,未来有望进一步拓展至更多智能设备和服务场景。

除了核心的多语言和语音克隆能力,OmniVoice还新增了多个实用功能,让语音合成更灵活、更贴合实际需求:

1.自定义音色设计:无需参考音频,只需描述音色属性(如性别、年龄、音调、方言、口音等),就能生成符合预期的音色,还支持耳语等特殊风格。

2. 带噪参考音频适配:针对实际使用中参考音频音质不佳的问题,OmniVoice能自动过滤噪声,提取清晰的音色特征,即便在嘈杂环境下录制的音频,也能克隆出高质量语音。

3. 丰富语气表达:支持插入笑声、叹气等语气符号,让合成语音更有表现力,更贴近真人交流。

4. 发音精准纠正:针对中英文多音字、专有名词易读错的问题,用户可通过简单设置,纠正发音错误,提升语音合成的可靠性。

相关内容

热门资讯

全球单机容量最大!16兆瓦漂浮... 全球单机容量最大的16兆瓦漂浮式海上风电平台“三峡领航号”,近日在广东阳江海域完成海上固定安装,标志...
坚朗五金获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示坚朗五金(002791)新获得一项实用新型专利授权,专利名为“...
揭秘展会大屏:看MES数据联动... 在各大工业展会现场,最吸引眼球的往往是那些流光溢彩、数据飞驰的“数字孪生”大屏。它们实时映射着远方工...
原创 发... 汽车界关于全固态电池的喧嚣似乎已然平息。曾几何时,2024年与2025年的车企新品发布会上,2026...
AI“算力税”该不该征? 近日,对AI算力征税引发讨论。支持者认为,AI税既可以帮助政府获得新的财政收入,也可以通过提高AI使...
韩国宣布延长囤积石油禁令至7月 新华社北京5月8日电 韩国政府7日宣布,将禁止囤积和垄断石油产品的措施延长两个月至7月底,以应对中东...
外媒:涉汉坦病毒疫情邮轮乘客曝... 【环球网报道】据美国全国广播公司(NBC)当地时间5月7日报道,涉汉坦病毒疫情的“洪迪厄斯”号邮轮上...
驴友在川西4600米营地帐篷里...   驴友在川西4600米营地帐篷里去世  【驴友在川西4600米营地帐篷里去世】近日,多名驴友发视频...
“顾客用餐盘喂狗”引争议,多家... 近日,多起顾客在饭店用餐盘、铁签喂狗的视频,引发争议。据荔枝新闻5月6日报道,一网友发视频称,在广东...
谢晓亮追忆科学狂人文特尔:一位... 来源:市场资讯 (来源:知识分子) 克雷格·文特尔(Craig Venter) 撰文|谢晓亮 20...