2026年4月1日星期三

OpenClaw TTS语音配置教程:五分钟开启,早起不用盯屏

本文介绍OpenClaw的文字转语音(TTS)功能配置方法。支持Edge TTS(免费)、OpenAI TTS(需API Key)和ElevenLabs(有免费额度),可设置自动播报或仅语音回复。零基础用户五分钟即可完成配置,适合想在起床、做家务时通过语音收听AI回复的用户,无需一直盯着屏幕。

Tags:

图片

你好,我是元小二,专注分享 AI 提效、一人公司实践和个人成长。这里有 OpenClaw、Claude Code、自动化流程、虚拟产品,也有理财、思考和生活系统。

欢迎关注,也欢迎后台留言告诉我,你对哪部分内容感兴趣。


朋友们,这是一个喜大普奔的好消息:
你有没有过这种感受——早上刚睁眼,眼睛还没睡醒,脑子还在半死机状态,但又想知道今天有什么值得关注的事情?
这时候盯着手机屏幕看一堆文字,简直是折磨。

Alt text

我有一段时间就是这样,每天早上拿起手机刷 AI 回复,刷着刷着眼睛就开始抗议。

直到我发现 OpenClaw 有 TTS(文字转语音)功能——AI 直接把答案念给你听,你连眼睛都不用睁开。

配置花了我不到五分钟,从此早上解放了双眼。今天把完整配置方法分享给你,零基础也能搞定(也可以让小龙虾自己去配置,看文末指令)。


一、先搞清楚:它是怎么工作的?

OpenClaw 的语音功能,说白了就是把 AI 的文字回复"翻译"成音频,然后直接发给你。

在 Telegram 上,它会发一个圆形的语音气泡,跟朋友发语音条一样,点一下就播,还能调速、拖进度——体验真的很完整。

支持三个语音服务:

  • ElevenLabs —— 音质封神,声音有情绪感,像真人在说话,有免费额度

  • OpenAI TTS —— 音质优秀,声音清晰稳定,有 API Key 直接用

  • Edge TTS —— 微软出品,完全免费,不需要任何 Key,平时用够了

Alt text

划重点:什么都不配也没关系,OpenClaw 会自动用 Edge TTS 兜底,直接能用,不会报错。


二、五分钟配好语音功能

第一步:开启语音(核心就一行)

打开 openclaw.json,找到 messages 字段,加进去:

{

"messages": {

"tts": {

"auto""always"

}

}

}

保存重启,完事。AI 的每一条回复都会自动带语音了。

auto 有四个选项,按需选:

  • off —— 关闭(默认值)

  • always —— 每次都发语音(我用这个,懒人必选)

  • inbound —— 你发语音过来,它才用语音回

  • tagged —— 只有 AI 觉得适合发语音才发


第二步:选你的语音服务

👉 零成本方案:Edge TTS(强烈推荐入门首选)

{

"messages": {

"tts": {

"auto""always",

"provider""edge",

"edge": {

"voice""zh-CN-XiaoxiaoNeural",

"lang""zh-CN",

"rate""+10%"

}

}

}

}

中文声音可选:

  • zh-CN-XiaoxiaoNeural(女声,温和自然)

  • zh-CN-YunxiNeural(男声)

  • zh-CN-XiaohanNeural(女声,活泼风格)

rate 控制语速,嫌慢可以调到 +10% 到 +20%,我个人用 +10%,刚刚好。


👉 音质进阶:OpenAI TTS

有 OpenAI API Key 的直接用这个,音质比 Edge 好一个档次:

{

"messages": {

"tts": {

"auto""always",

"provider""openai",

"openai": {

"apiKey""sk-xx",

"model""gpt-4o-mini-tts",

"voice""nova"

}

}

}

}

六个声音随便选:alloyechofableonyxnovashimmer

我最喜欢 nova,暖一些,听起来不那么机械。模型用 gpt-4o-mini-tts 就够了,比完整版便宜,质量差不多。


👉 音质天花板:ElevenLabs(想听真人质感就选这个)

{

"messages": {

"tts": {

"auto""always",

"provider""elevenlabs",

"elevenlabs": {

"apiKey""xx",

"voiceId""你的声音ID",

"modelId""eleven_multilingual_v2"

}

}

}

}

voiceId 去 ElevenLabs 后台挑一个你喜欢的声音,复制 ID 填进来。eleven_multilingual_v2 支持中文,发音很准。每月有免费额度,个人日常用基本够。


三、高阶操作:配三层备用,永不中断

这个我强烈推荐配上,一劳永逸:

{

"messages": {

"tts": {

"auto""always",

"provider""openai",

"openai": {

"apiKey""sk-xx",

"voice""nova"

},

"elevenlabs": {

"apiKey""xx",

"voiceId""your-voice-id"

}

}

}

}

逻辑是:OpenAI 挂了自动切 ElevenLabs,ElevenLabs 也挂了再切 Edge TTS。三层保底,语音功能基本不会失效。


四、长文章怎么处理?加个自动摘要

AI 有时候回复特别长,全转成语音听着累。OpenClaw 有个自动摘要功能,超过一定长度会先压缩再发语音:

{

"messages": {

"tts": {

"auto""always",

"summaryModel""openai/gpt-4o-mini"

}

}

}

默认超过 1500 字符就触发摘要。如果不想要摘要,发指令关掉:/tts summary off


五、不想改配置?直接用指令控制

不想动配置文件,聊天框直接发这些:

/tts always        # 开启语音

/tts off# 关闭语音

/tts inbound       # 只在我发语音时才回语音

/tts status        # 查看当前状态

/tts provider openai   # 临时切换提供商

/tts audio 你好,测试  # 单次生成语音

实时生效,不用重启,非常灵活。


六、这功能最适合这几个场景

我自己用下来,语音功能在这几个场景特别香:

  1. 早上刚起床 —— 刷牙洗脸的时候听,不用盯屏幕

  2. 手头在忙别的 —— 眼睛不用离开手头的事,AI 直接念给你听

  3. 和 AI "说话" —— inbound 模式开启,你发语音它回语音,完全像在打电话


七、最后说一句

我对 OpenClaw TTS 的评价是:配置门槛极低,实用性极高,没理由不开。

核心就一行 "auto": "always",五分钟搞定。不想花钱直接用 Edge TTS,追求音质上 OpenAI,想要最像真人的声音上 ElevenLabs。

如果你之前只是用文字跟 AI 聊,现在可以试试换个方式——让 AI 开口说话,感觉真的挺不一样的。

赶快去配一下吧,我的朋友!

人生是一场无限游戏,乾坤未定,你我均是黑马。


关注【元小二学AI】公众号,后台回复「OpenClaw」获取 OpenClaw 多 Agent 协作完整部署指南等openclaw教程 👇



温馨提示:

公众号修改了推送规则,很多人发现收到的消息不及时。

为了能够第一时间收到消息,不错过优质的AI教程,请星标⭐置顶本公众号,以便第一时间获取精选内容!




          我们的口号:学好AI,享受生活


关注【元小二学AI】,你会持续看到更接地气的 AI 学习内容。

这里不讲太多空概念,更关注普通人怎么把 AI 真正用到工作、内容创作和日常生活里。

包括工具实操、提效流程、自动化思路,以及一人公司场景下的真实应用。

你能在这里找到教程、案例、脚本思路和实战经验,少走弯路,早点把 AI 变成自己的帮手。















没有评论:

发表评论

PixVerse V6 AI视频模型上线:支持延时拍摄、慢动作,限时优惠7折

PixVerse V6 AI视频模型全新升级,支持延时拍摄、慢动作、复杂运镜与物理级真实还原,生成速度保持15秒极速。即日起至4月7日,会员购买享7折优惠,适用于内容创作者与小型团队。 Tags: AI视频模型 视频生成 PixVerse V6 限时优惠 ...