AI I024: 免费声音克隆及语音合成工具整合包MegaTTS3，附带海量音色包，工具已打包，一键启动即可

2025年4月11日星期五

免费声音克隆及语音合成工具整合包MegaTTS3，附带海量音色包，工具已打包，一键启动即可

公众号：AI应用帮

「 文中提供获取方式 」

▼

本期带来声音克隆及语音合成工具整合包—— MegaTTS3

MegaTTS3 是由字节跳动与浙江大学联合推出的开源语音合成工具，主模型仅有 0.45 亿参数，具备高度轻量化优势。此外，MegaTTS3 还引入了口音强度控制功能，用户可以通过调整参数生成带有不同程度口音的语音，为个性化语音应用提供了更多可能性。

注意：为防止滥用，此工具暂不支持自定义音色，如需增加音色文件，则需要上传到官方仓库，等待官方生成npy文件方可使用（上传的文件所有人均可查看并下载，请勿上传敏感信息）

开源地址：https://github.com/bytedance/MegaTTS3

# 一键启动整合包下载地址：

https://aiyy.info/megatts3/

视频教程

# 配置要求：

电脑需满足以下配置：

操作系统：Windows 10/11 64位
内存：20G以上
显卡：要求8G及以上显存的英伟达（NVIDIA）显卡，显卡性能越好，生成速度越快

CUDA ：显卡支持的CUDA版本大于等于12.8版本（如不知道显卡支持的CUDA版本，可在此链接查看：https://aiyy.info/supported-cuda-versions/）
整个包解压之后约14.5G，留足硬盘空间

# 如何查看显卡品牌型号和显存：

打开任务管理器
点击"性能"
点击"GPU"
右上角可以看到显卡型号，下方可以看到显存大小

# 使用教程：

① 打开下载页面（https://aiyy.info/megatts3/）点击页面右侧下载按钮，下载整合包之后解压，建议使用winrar解压（解压软件在文件包中，或者可以自己下载安装，下载地址：https://www.winrar.com.cn/）

不要用Windows自带解压！！不要用360解压！！

注意：文件夹路径和文件名称（包括视频、图片、音频等文件名称）不要出现中文字符，否则部分软件会因识别不出而报错

② 双击"一键启动.bat"，稍等片刻会在浏览器中自动打开操作界面

③ 直接使用：

选择示例音频，选择对应音色文件，再输入需要合成的文本，最后点击"合成"，等待生成完毕，生成结果位于右侧

如下方所示：

音频示例：

生成结果：

可以播放试听，点击右上角下载按钮可以保存至指定文件夹

在文件包中的"outputs"文件夹中也能找到生成结果

④ 增加音色：

点击"音频及npy文件仓库"按钮可跳转进入官方音频文件及npy文件仓库，将音频示例及对应的npy文件下载到文件包中的"assets"文件夹中即可使用（需要科学上网）

点击"上传音频文件仓库"按钮可进入上传音频文件仓库，将需要生成npy文件的音频上传到此仓库中，等待官方生成npy文件，即可在"音频及npy文件仓库"中下载使用（需要科学上网）

这里也给大家下载好了仓库中截止2025年4月10日的所有示例音频及音色文件，已打包放在网盘中，解压之后将里面的音频示例及对应的音色文件放置到文件包中的"assets"文件夹中即可使用

将音频示例及对应的音色文件放置到文件包中的"assets"文件夹中之后，在操作界面点击"刷新文件夹"，即可在"音频文件选择"及"潜在文件选择"下拉框中选择音频示例及对应的音色文件

以上就是本期分享的内容，所需工具在下方网址中👇👇👇可以自取👇👇👇

后期持续分享AI应用、AI落地项目及实用工具

更多AI软件获取方式

👇👇👇👇👇👇👇👇👇👇👇👇👇👇👇👇

aiyy.info

（浏览器地址栏中输入上方网址，或点击左下角【阅读原文】可直接跳转）

关注下方公众号

及时获取更多资讯

菜单栏可见Ai应用集合

--------收集不易先点在看后 领取--------

👇 点击下方【阅读原文】可直接进入

没有评论:

发表评论

订阅：博文评论 (Atom)

AI I024

2025年4月11日星期五

免费声音克隆及语音合成工具整合包MegaTTS3，附带海量音色包，工具已打包，一键启动即可

没有评论:

发表评论

Claude Fable 5正式发布免费使用至6月22日附价格与能力测评

标签

2025年4月11日星期五

免费声音克隆及语音合成工具整合包MegaTTS3，附带海量音色包，工具已打包，一键启动即可

没有评论:

发表评论

Claude Fable 5正式发布 免费使用至6月22日 附价格与能力测评

Claude Fable 5正式发布免费使用至6月22日附价格与能力测评