② 双击"一键启动.exe",稍等片刻会在浏览器中自动打开操作界面③ 3秒复刻音色并生成音频:输入文本,选择"3s声音克隆",放入参考音频(时长3秒-30秒,要求为干音,音频无杂音,无背景音),程序会自动识别参考音频文本,如果识别不准确,可以手动修改,点击"生成语音",生成结果位于底部,可以播放试听,也可以点击右上角下载按钮保存到指定文件夹⑤ 指令语音生成:输入文本,程序会自动识别参考音频文本,如果识别不准确,可以手动修改,输入语音风格指令(如情绪、语气、语种等),点击"生成语音",生成结果位于底部,可以播放试听,也可以点击右上角下载按钮保存到指定文件夹各种语种及方言,支持中文、英文、日语、韩语、中国方言(粤语、四川话、上海话、天津话、长沙话、郑州话等)说话语气、情绪控制,如Happy(开心)、Sad(悲伤)、Surprise(惊喜)、Neutral(自然)、Angry(生气)等另外还支持角色扮演控制、说话情境控制等,可参考下方网址中的示例https://funaudiollm.github.io/cosyvoice2/以上就是本期分享的内容,所需工具在下方网址中👇👇👇可以自取👇👇👇后期持续分享AI应用、AI落地项目及实用工具
没有评论:
发表评论