2025年7月27日星期日

翻译翻译,什么叫 F**king 惊喜?

先来看一个视频,打开声音。

这是 IndexTTS2 文本转语音模型的演示 Demo,是不是很强大?

事情是这样的,B 站之前开源了一个叫做 IndexTTS 的项目,它能把文本转成语音。

IndexTTS2 在筹备中未发布,他们就把 IndexTTS2 的效果演示视频和音频放到了一个基于 GitHub 仓库搭建的网站里。

图片

这链接被外网网友发现了,在外网疯狂讨论传播起来。

里面罗列了 IndexTTS2 模型的效果示例,看完后,外网网友说 IndexTTS2 是目前最逼真、最具有表现力的文本转语音模型。

图片
相当有意思,再来看看几个演示:

目前只有上一个版本 IndexTTS 开源了,现在在 GitHub 上获得了4K 的 Star。

开源地址:https://github.com/index-tts/index-tts
图片
相比于上一个版本,IndexTTS2 不仅支持高质量的零样本语音合成,还大幅度提升情感表达的真实感和表现力,合成的语音情绪更自然和感染了。
以「可控时长+解耦情感」重构了自回归语音合成的能力边界,为影视级语音生成树立新标准。
在官方的开源主页,并没有找到 IndexTTS2 开源模型的仓库,只有公开的论文和演示Demo。
图片
演示网页:https://index-tts.github.io/index-tts2.github.io/
图片
论文地址:https://arxiv.org/pdf/2506.21619v1
图片
先蹲一波吧,如果开源了再推送给大家。

都看到这了,关注下吧。

这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了。

#逛逛GitHub #开源 #GitHub #文本转语音 #TTS 

没有评论:

发表评论

基于claude code 接入国产模型,可调用agent,可控制操作系统,无需梯子使用本地大模型

之前的编程辅助我是一直再用Cursor的,但是最近测试了claude code 后,为彻底迷上了       之前的编程辅助我是一直在用Cursor的,但是最近测试了claude code 后,我彻底迷上了这个 Anthropic 编码工具。大概是从 4 月底,5 月初的时候...