2026年5月28日星期四

开源TTS模型:电影级情感表达+真人呼吸感,平替商业语音合成

最强开源TTS模型,支持电影级情感表达与真人级呼吸感还原,可平替商业语音合成。无需额外信息,即刻体验。

Tags:

工作流在飞书里



链接:

https://my.feishu.cn/wiki/KrKow7S6ziML2IkuhWdc0vlQnnc?from=from_copylink



没有评论:

发表评论

华为&TUM开源Face Anything:单张照片5秒重建4D人脸,消费级显卡可用

慕尼黑工业大学与华为联合推出Face Anything,实现单张照片或视频输入下5秒完成4D人脸重建与密集追踪。相比现有方案,追踪误差降低3倍,推理速度提升32倍,深度精度提升16%,RTX 4090等消费级显卡即可流畅运行(峰值显存19GB)。适用于数字人直播、虚拟偶像、影视动...