2024年10月28日星期一

MaskGCT,免费的视频音色克隆+翻译工具


又找到一款零样本的TTS工具:

MaskGCT,

能15秒克隆音色,

还把视频翻译+音色克隆也做了。

目前属于公测阶段,免费能嫖,在线能用。


还是以星爷为例子,

我输入一段它的音频和文本让它零样本产生音频:



转录TTS内容

轻松将文本内容转换成专业级音频,不仅能完美复制目标声音的声学特征,还能保持丰富的情感和韵律。

结果:


然后目前还有视频翻译功能:

上传一个付航talkshow的原视频:


翻译后:


视频翻译完之后能够编辑修改翻译后的内容:

1. 对应的翻译效果进行编辑

2. 系统会推荐最佳的字数,方便后续口型和时长的匹配

3. 对翻译后的效果进行试听(克隆音色)

4. 时间戳和说话人的显示


目前口型同步功能尚未放出,

想要更多DIY效果的可以自己布署项目:

https://github.com/open-mmlab/Amphion/tree/main/models/tts/maskgct

https://voice.funnycp.com/audioTrans


最后讲讲我自己运营的一个知识群今天上线了。
  1. AI精选开源项目(日更)

  2. AI资讯日报(日更)

  3. 90篇AI产品增长策略和案例

  4. AI技巧分享和杀手级应用追踪

  5. 70个AI变现案例合集

  6. 付费的AI课程网盘资源

内容如上,至于价格一年就几杯咖啡钱。

没有评论:

发表评论

首个时尚Agent来了!清华&字节等联合推出StyleTailor:时装设计、购物推荐和虚拟试穿功一键搞定。

添加微信号:AIGC_Tech,公众号小助手会拉你进群!点击下方名片关注AIGC Studio公众号! 添加微信号:AIGC_Tech,公众号小助手会拉你进群! 点击下方名片关注AIGC Studio公众号 ! 获取 最新AI前沿应用/ AIGC实践教程 ! 由清华大学、新加...