Voxtral TTS是Mistral推出的多语言文本转语音模型,仅4B参数即达SOTA性能。支持英语、法语等9种语言,极低延迟,输出24kHz音频。现通过API提供服务,价格每1000字符0.016美元,适用于企业级语音代理、实时交互等场景。 Tags: 文本转语音 ...
没有评论:
发表评论