OmniVoice是一款免费开源的语音合成与零样本声音克隆工具,支持600多种语言和方言,能以实时40倍以上速度生成自然语音。适合教育配音、游戏角色、虚拟助手等场景,可插入笑声、叹气等情感表达。需Windows 10/11、16G内存、8G以上显存NVIDIA显卡及CUDA 12.8。解压时避免中文路径,使用WinRAR。
Tags:
OmniVoice 是一款支持 600+ 语言和方言的先进语音合成(TTS)工具,具备强大的零样本语音克隆与声音设计能力,可根据少量音频或文本描述生成逼真、自然且富有情感的语音。它不仅支持插入笑声、叹气等细节表达,还能精细控制发音,并以高达实时 40 倍以上的速度生成语音,适用于教育、游戏、虚拟助手和内容创作等多种场景。简单来说,OmniVoice 就像一个高效且灵活的 AI 配音员,能够快速生成多语言、高质量的语音内容。
开源地址:https://github.com/k2-fsa/OmniVoice
一键启动整合包下载地址:
https://aiyy.info/omnivoice/
软件功能:
• 多语合成:支持600+语言与方言的TTS输出,适合面向全球受众快速生成配音。
• 零样本克隆:仅需少量参考音频即可复刻说话人音色,降低训练成本与使用门槛。
• 情感表达:可插入笑声、叹气等细节并保留语气变化,让语音更自然有感染力。
• 发音可控:支持精细控制发音与读法,减少错读与口音偏差,提升可用性。
• 高速生成:推理速度可达实时40倍以上,适合批量生成长文本与多版本音频。
应用场景:
• 教育配音:为课件与有声教材生成多语言讲解,统一口播风格并提升制作效率。
• 游戏角色:快速生成不同角色台词与情绪语音,便于迭代剧情和丰富沉浸感。
• 虚拟助手:为客服与助手打造稳定音色与自然语气,提升交互体验与品牌一致性。
• 内容创作:为短视频、播客和有声书批量配音,快速出多版本用于测试与分发。
• 本地部署:开源可离线运行,适合对数据隐私与可控性要求更高的团队使用。
配置要求:
电脑满足以下配置:
-
• 操作系统:Windows 10/11 64位 -
• 内存:16G以上 -
• 显卡:至少8G及以上显存的英伟达(NVIDIA)显卡 -
• CUDA:显卡支持的CUDA版本大于等于12.8版本 (如不知道显卡支持的CUDA版本,可点击此链接查看:https://aiyy.info/supported-cuda-versions/) -
• 整个包解压完约14G,要留足硬盘空间
如何查看显卡品牌型号和显存
-
• 打开任务管理器 -
• 点击“性能” -
• 点击“GPU” -
• 右上角可以看到显卡型号,下方可以看到显存大小
使用教程:
① 打开下载页面(https://aiyy.info/omnivoice/)点击页面右侧下载按钮,下载整合包之后解压,建议使用winrar解压(解压软件在文件包中,或者可以自己下载安装,下载地址:https://www.winrar.com.cn/)
不要用Windows自带解压!!不要用360解压!!
注意:文件夹路径和文件名称(包括音频、图片、视频等文件名称)不要出现中文字符,否则部分软件会因识别不出而报错
② 双击“一键启动.bat”,稍等片刻会在浏览器中自动打开操作界面
② 在文本输入框中输入需要合成的文本,然后上传参考音频,输入参考音频对应的文本,选择语种,点击“生成”按钮即可开始合成
如下图所示,生成结果位于右侧,可以播放试听,点击生成结果右侧的下载按钮可以将生成结果音频保存至指定文件夹
更多 AI 软件获取方式
没有评论:
发表评论