本文介绍OpenClaw的文字转语音(TTS)功能配置方法。支持Edge TTS(免费)、OpenAI TTS(需API Key)和ElevenLabs(有免费额度),可设置自动播报或仅语音回复。零基础用户五分钟即可完成配置,适合想在起床、做家务时通过语音收听AI回复的用户,无需一直盯着屏幕。
Tags:
朋友们,这是一个喜大普奔的好消息:
你有没有过这种感受——早上刚睁眼,眼睛还没睡醒,脑子还在半死机状态,但又想知道今天有什么值得关注的事情?
这时候盯着手机屏幕看一堆文字,简直是折磨。
我有一段时间就是这样,每天早上拿起手机刷 AI 回复,刷着刷着眼睛就开始抗议。
直到我发现 OpenClaw 有 TTS(文字转语音)功能——AI 直接把答案念给你听,你连眼睛都不用睁开。
配置花了我不到五分钟,从此早上解放了双眼。今天把完整配置方法分享给你,零基础也能搞定(也可以让小龙虾自己去配置,看文末指令)。
一、先搞清楚:它是怎么工作的?
OpenClaw 的语音功能,说白了就是把 AI 的文字回复"翻译"成音频,然后直接发给你。
在 Telegram 上,它会发一个圆形的语音气泡,跟朋友发语音条一样,点一下就播,还能调速、拖进度——体验真的很完整。
支持三个语音服务:
ElevenLabs —— 音质封神,声音有情绪感,像真人在说话,有免费额度
OpenAI TTS —— 音质优秀,声音清晰稳定,有 API Key 直接用
Edge TTS —— 微软出品,完全免费,不需要任何 Key,平时用够了
划重点:什么都不配也没关系,OpenClaw 会自动用 Edge TTS 兜底,直接能用,不会报错。
二、五分钟配好语音功能
第一步:开启语音(核心就一行)
打开 openclaw.json,找到 messages 字段,加进去:
{
"messages": {
"tts": {
"auto": "always"
}
}
}
保存重启,完事。AI 的每一条回复都会自动带语音了。
auto 有四个选项,按需选:
off—— 关闭(默认值)always—— 每次都发语音(我用这个,懒人必选)inbound—— 你发语音过来,它才用语音回tagged—— 只有 AI 觉得适合发语音才发
第二步:选你的语音服务
👉 零成本方案:Edge TTS(强烈推荐入门首选)
{
"messages": {
"tts": {
"auto": "always",
"provider": "edge",
"edge": {
"voice": "zh-CN-XiaoxiaoNeural",
"lang": "zh-CN",
"rate": "+10%"
}
}
}
}
中文声音可选:
zh-CN-XiaoxiaoNeural(女声,温和自然)zh-CN-YunxiNeural(男声)zh-CN-XiaohanNeural(女声,活泼风格)
rate 控制语速,嫌慢可以调到 +10% 到 +20%,我个人用 +10%,刚刚好。
👉 音质进阶:OpenAI TTS
有 OpenAI API Key 的直接用这个,音质比 Edge 好一个档次:
{
"messages": {
"tts": {
"auto": "always",
"provider": "openai",
"openai": {
"apiKey": "sk-xx",
"model": "gpt-4o-mini-tts",
"voice": "nova"
}
}
}
}
六个声音随便选:alloy、echo、fable、onyx、nova、shimmer。
我最喜欢 nova,暖一些,听起来不那么机械。模型用 gpt-4o-mini-tts 就够了,比完整版便宜,质量差不多。
👉 音质天花板:ElevenLabs(想听真人质感就选这个)
{
"messages": {
"tts": {
"auto": "always",
"provider": "elevenlabs",
"elevenlabs": {
"apiKey": "xx",
"voiceId": "你的声音ID",
"modelId": "eleven_multilingual_v2"
}
}
}
}
voiceId 去 ElevenLabs 后台挑一个你喜欢的声音,复制 ID 填进来。eleven_multilingual_v2 支持中文,发音很准。每月有免费额度,个人日常用基本够。
三、高阶操作:配三层备用,永不中断
这个我强烈推荐配上,一劳永逸:
{
"messages": {
"tts": {
"auto": "always",
"provider": "openai",
"openai": {
"apiKey": "sk-xx",
"voice": "nova"
},
"elevenlabs": {
"apiKey": "xx",
"voiceId": "your-voice-id"
}
}
}
}
逻辑是:OpenAI 挂了自动切 ElevenLabs,ElevenLabs 也挂了再切 Edge TTS。三层保底,语音功能基本不会失效。
四、长文章怎么处理?加个自动摘要
AI 有时候回复特别长,全转成语音听着累。OpenClaw 有个自动摘要功能,超过一定长度会先压缩再发语音:
{
"messages": {
"tts": {
"auto": "always",
"summaryModel": "openai/gpt-4o-mini"
}
}
}
默认超过 1500 字符就触发摘要。如果不想要摘要,发指令关掉:/tts summary off
五、不想改配置?直接用指令控制
不想动配置文件,聊天框直接发这些:
/tts always # 开启语音
/tts off# 关闭语音
/tts inbound # 只在我发语音时才回语音
/tts status # 查看当前状态
/tts provider openai # 临时切换提供商
/tts audio 你好,测试 # 单次生成语音
实时生效,不用重启,非常灵活。
六、这功能最适合这几个场景
我自己用下来,语音功能在这几个场景特别香:
早上刚起床 —— 刷牙洗脸的时候听,不用盯屏幕
手头在忙别的 —— 眼睛不用离开手头的事,AI 直接念给你听
和 AI "说话" ——
inbound模式开启,你发语音它回语音,完全像在打电话
七、最后说一句
我对 OpenClaw TTS 的评价是:配置门槛极低,实用性极高,没理由不开。
核心就一行 "auto": "always",五分钟搞定。不想花钱直接用 Edge TTS,追求音质上 OpenAI,想要最像真人的声音上 ElevenLabs。
如果你之前只是用文字跟 AI 聊,现在可以试试换个方式——让 AI 开口说话,感觉真的挺不一样的。
赶快去配一下吧,我的朋友!
人生是一场无限游戏,乾坤未定,你我均是黑马。
关注【元小二学AI】公众号,后台回复「OpenClaw」获取 OpenClaw 多 Agent 协作完整部署指南等openclaw教程 👇
温馨提示:
公众号修改了推送规则,很多人发现收到的消息不及时。
为了能够第一时间收到消息,不错过优质的AI教程,请星标⭐置顶本公众号,以便第一时间获取精选内容!
没有评论:
发表评论