2026年4月1日星期三

AI日报|Claude Code源码外泄,OpenAI融资1220亿美元,阿里发布Wan2。7-Image

本AI日报汇总4月1日重要资讯:Anthropic误发调试包致Claude Code超51万行源码外泄,GitHub清理超8100仓库;OpenAI完成1220亿美元融资,估值8520亿美元;阿里发布Wan2.7-Image图像模型,提升人像定制能力。同时涵盖可灵AI会员8折优惠(至6月30日)、智谱财报等动态,适合AI开发者与从业者快速掌握最新进展。

Tags:

AI 日报 · 2026年04月01日

AI资讯

1、ARC-AGI-3发布:前沿模型全线破防低于1%

2、OpenAI融资1220亿美元,估值8520亿美元冲刺超级应用

3、ARC-AGI-3发布:回合像素环境测适应力

4、Claude Code泄露曝光Anthropic路线图与新模型

5、叽伴用2D地图RPG交互重塑AI伙伴体验

6、智谱财报营收7.24亿逆势涨价增量领跑国内大模型

7、Pixverse V6视频生成:微表情与物理真实感大跃升

8、Claude Code源码因npm映射失误泄露超51万行

9、20人Agent团队融资3.85亿美元估值110亿

10、字节Seed全球校招:虚拟股招募百位AI种子

11、《天问》全流程AI科幻短片首发引爆影视工业拐点

12、阿里联手上智院发布智能体安全白皮书

13、iOS 27原生键盘AI纠错升级为系统级写作助手

14、交个朋友GMV破160亿,加码AI改造朋友云

15、Anthropic对Claude泄露代码发DMCA清理8100仓库

16、ClawHub上线中国镜像,AI技能库访问提速

17、阿里Wan2.7-Image发布:人像定制告别AI标准脸

18、联想宣布转型AI原生公司,押注千亿美元交付

19、可灵AI会员优惠上线:3.0视频模型限时8折

20、高德开源ABot-M0:统一架构通用机器人基座模型

21、Chroma Context-1:自编辑搜索智能体重塑RAG

22、Anthropic误发调试包致Claude Code源码外泄

最新开源

1、解析Claude Code泄露源码:工具与系统提示全曝光

2、Llama.cpp-TurboQuant:任意硬件跑LLM提速130%

3、My AI Stack:开源AI工具栈导航页上线


📰 最新资讯


01 · ARC-AGI-3发布:前沿模型全线破防低于1%

 🏷 评测/基准测试

ARC-AGI-3以无指令交互式游戏测自适应推理,要求探索规则并高效行动;主流前沿模型得分均低于1%,而人类满分。评分对冗余动作平方惩罚,暴露"会说不等于会做"。简单RL+图搜索却达12.58%,提示规模扩展非解方,行业与社区正反思评测与技术路线。

主要亮点:

  • • 无指令交互环境测试,自主探索规则完成任务
  • • 主流模型全线低于1%,人类100%形成强反差
  • • RL+图搜索12.58%胜出30倍,指向方法论突破

详情链接: 

https://arxiv.org/abs/2603.24621


02 · OpenAI融资1220亿美元,估值8520亿美元冲刺超级应用

 🏷 行业动态

OpenAI完成1220亿美元巨额融资,投后估值达8520亿美元,跻身史上最大私募融资之一。亚马逊、英伟达、软银与微软加码,资本押注其"AI超级应用"路线。ChatGPT周活将破10亿、年化收入超250亿美元,但服务器成本或至6650亿美元,IPO预期升温,产业竞争进一步加速。

主要亮点:

  • • 融资1220亿美元、估值8520亿美元,规模创纪录
  • • ChatGPT周活将破10亿,年化收入超250亿美元
  • • 整合ChatGPT/Codex/浏览与智能体,企业收入占比超40%

详情链接: 

https://finance.sina.cn/stock/jdts/2026-04-01/detail-inhsysks2651377.d.html?vt=4&cid=76993&node_id=76993


03 · ARC-AGI-3发布:回合像素环境测适应力

 🏷 评测/基准测试

ARC-AGI-3正式推出,以交互式回合制像素游戏衡量机器与人类适应力差距。它剥离语言与外部记忆,不告知目标,仅以行动效率计分,要求智能体自主探索并修正假设。结果显示顶尖智能体得分不足1%。团队线下测试486名人类并公布200万美元奖金的2026 Kaggle挑战赛,凸显AI在高效探索与假设更新上的短板。

主要亮点:

  • • 交互式回合制像素环境,剥离语言与外部记忆
  • • 不透露任务目标,仅以行动效率作为唯一评分
  • • 顶尖智能体得分不足1%,2026 Kaggle设200万美元奖金

详情链接: 

https://arcprize.org/arc-agi/3


04 · Claude Code泄露曝光Anthropic路线图与新模型

 🏷 行业动态

Claude Code源码泄露披露Anthropic内部路线图:挫折遥测监测失败模式、autoDream空闲整合记忆、工具搜索懒加载省令牌,并引用未发opus-4.7/sonnet-4.8支持百万上下文。51万行代码暴露生产级代理架构,也指向Bun工具链源码映射漏洞与反泄露手段。

主要亮点:

  • • 挫折遥测用正则捕捉咒骂与"继续"频率
  • • autoDream子代理空闲合并观察并清除矛盾记忆
  • • 未发opus-4.7/sonnet-4.8或支持百万上下文窗口

详情链接: 

https://x.com/heyshrutimishra/status/2039156929902092606


05 · 叽伴用2D地图RPG交互重塑AI伙伴体验

 🏷 产品更新

叽伴以2D地图与角色操控替代传统聊天框,让用户与AI伙伴在世界场景中并肩行动。其基于行为的记忆可跨世界保留关键决策,智能体具备自主判断并能在危机中主动护航。配套低门槛世界编辑器推动UGC与智能体融合,指向"无限流"可扩展的AI陪伴生态。

主要亮点:

  • • 2D地图+RPG操控,体验从对话转向共同行动
  • • 行为式记忆跨世界生效,保留关键决策而非上下文
  • • 世界编辑器降低创作门槛,UGC驱动无限流生态

详情链接: 

https://news.17173.com/content/03312026/174203442.shtml


06 · 智谱财报营收7.24亿逆势涨价增量领跑国内大模型

 🏷 行业动态

智谱上市后首份财报显示全年营收7.24亿元、同比增132%,在价格战中通过提价与产品迭代实现调用量增长与毛利改善。年度经常性收入约17亿元、近12个月增长60倍,综合毛利率达41%,企业开发者用户达400万并覆盖218国,头部互联网客户加速付费,释放大模型商业化新信号。

主要亮点:

  • • 营收7.24亿同比增132%,成国内收入最大大模型公司
  • • 提价83%后调用量反升,年度经常性收入约17亿增长60倍
  • • 综合毛利率41%且覆盖218国,国内前十互联网9家付费

详情链接: 

https://finance.sina.com.cn/roll/2026-04-01/doc-inhsxvfk1995158.shtml


07 · Pixverse V6视频生成:微表情与物理真实感大跃升

 🏷 技术突破

Pixverse 发布 V6 视频生成模型,实测在面部微表情上实现突破,可生成眼神躲闪、嘴角微动等细节,显著缓解"面瘫"。同时强化物理真实感与镜头语言编排,能自动调度推拉摇移与景别切换,最长支持 15 秒且生成较快。融资与低训练成本叙事凸显其商业化潜力,或加速影视广告短剧生产流程升级。

主要亮点:

  • • 微表情细节显著提升,解决过往人物面部僵硬
  • • 人物运动与力传递更合理,自行车头发反光更贴近直觉
  • • 自动镜头语言组织,支持推拉摇移与景别切换,最长15秒

详情链接:

https://www.csdn.net/article/2026-03-31/159674978


08 · Claude Code源码因npm映射失误泄露超51万行

 🏷 行业动态

Anthropic 因在 npm 包误带调试源映射,致 Claude Code 约51.2万行 TypeScript、1900+文件可被还原。泄露揭示 React+Bun 技术栈、多智能体协调与IDE桥接,并出现"Claude Mythos 5.0"等代号及潜在隐藏模式。虽未涉及模型权重与训练数据,但对供应链与发布流程安全敲响警钟,社区热度迅速飙升。

主要亮点:

  • • npm源映射泄露致51.2万行TS与1900+文件还原
  • • 曝光React+Bun栈、多模块工具箱与IDE桥接能力
  • • 出现Mythos 5.0代号及卧底抹痕等隐藏功能线索

详情链接: 

https://finance.sina.cn/stock/jdts/2026-04-01/detail-inhsxzph1543423.d.html?vt=4&cid=76993&node_id=76993


09 · 20人Agent团队融资3.85亿美元估值110亿

 🏷 行业动态

Genspark完成3.85亿美元B轮融资,投后估值约110亿元。仅约20人的小团队主打可交付结果的"全职Agent",从对话走向任务执行与闭环交付,折射资本对Agent化产品与效率型AI应用的强烈预期,或加速企业AI从助手向自动化劳动力迁移。

主要亮点:

  • • B轮融资3.85亿美元,投后估值约110亿元
  • • 团队约20人,小规模撬动超百亿估值
  • • "全职Agent"强调结果交付,超越传统对话AI

详情链接: 

https://36kr.com/p/3747037419975432


10 · 字节Seed全球校招:虚拟股招募百位AI种子

 🏷 行业动态

字节跳动旗下Seed启动全球校招,面向2027届应届生与实习生,计划在全球招募百位"大模型AI种子",并以"虚拟股"等激励加码抢人。此举意在提前锁定顶尖人才、强化底层研发投入,回应大模型技术高速迭代带来的竞争升级与人才稀缺。

配图
配图

主要亮点:

  • • 面向2027届校招与实习,提前布局大模型人才储备
  • • 全球招募百位"AI种子",打造顶尖研究与工程梯队
  • • 以虚拟股等激励加码,推动大模型人才争夺升级

详情链接: 

https://finance.sina.cn/stock/jdts/2026-04-01/detail-inhsysky1799029.d.html?vt=4&cid=76993&node_id=76993


11 · 《天问》全流程AI科幻短片首发引爆影视工业拐点

 🏷 行业动态

科幻短片《天问》由鲍德熹监制、爱奇艺联合发起,号称首部全流程AI制作,上线9小时登顶双榜。作品以高完成度视觉效果验证AIGC从辅助走向端到端生产,触发行业对"电影工业奥本海默时刻"的讨论,显示影视精品化与规模化生产路径正在被重写。

配图
配图

主要亮点:

  • • 首部宣称全流程AI制作的科幻短片落地
  • • 上线9小时登顶双榜,市场反馈迅速验证
  • • AIGC在影视精品化赛道实现关键突破

详情链接: 

https://article.9466.com/news/5lgymYKE


12 · 阿里联手上智院发布智能体安全白皮书

 🏷 行业动态

阿里巴巴与上海人工智能实验室联合发布AI安全白皮书,聚焦AI从"能说"走向"能干"的智能体化趋势。白皮书梳理智能体普及带来的安全隐患与责任边界问题,并提出面向行业治理的"中国方案",为智能体落地提供安全与合规框架参考。

配图
配图

主要亮点:

  • • 强调智能体进化中安全与责任是核心底座
  • • 系统盘点智能体普及阶段的关键安全隐患
  • • 提出行业治理中国方案,指向可落地规则框架

13 · iOS 27原生键盘AI纠错升级为系统级写作助手

 🏷 产品更新

苹果计划在2026年WWDC发布iOS 27,对iPhone原生输入法引入上下文感知AI纠错,从拼写检查跃迁为深度写作辅助,接近"系统级Grammarly"。这意味着Apple Intelligence进一步下沉到系统基础能力,推动从改错字到推荐表达的交互范式转移,对移动端写作与输入体验形成新标杆。

配图
配图

主要亮点:

  • • 上下文感知纠错:不止拼写,更懂语境与表达
  • • 原生输入法AI下沉:系统级写作能力随处可用
  • • 从改错字到推荐词:输入交互范式发生转变

详情链接: 

https://www.chinaz.com/ainews/26755.shtml


14 · 交个朋友GMV破160亿,加码AI改造朋友云

 🏷 行业动态

交个朋友控股六周年披露AI战略:2025年GMV达160.2亿元、同比增6.23%。公司设立AI子公司"曼达斯克",并推动核心系统"朋友云"全面AI化改造,已将约500万条商品信息交由AI处理,提升内容生产、运营效率与规模化能力,释放直播电商智能化想象空间。

配图
配图

主要亮点:

  • • 2025年GMV160.2亿元,同比增长6.23%表现稳健
  • • 成立AI子公司"曼达斯克",加速AI落地推进
  • • 朋友云全面AI化,500万条商品信息交由AI处理

详情链接: 

https://www.ufcn.cn/scitech/16416.html


15 · Anthropic对Claude泄露代码发DMCA清理8100仓库

 🏷 行业动态

Anthropic针对Claude源码泄露采取法律行动,向GitHub提交DMCA下架通知。GitHub已移除主仓库及逾8100个相关分支,成为近年AI行业最大规模的代码版权清理事件,凸显大模型代码资产保护与平台合规执行力度升级。

配图
配图

主要亮点:

  • • GitHub删除主仓库并清理超8100相关分支
  • • DMCA法律手段应对Claude代码泄露与传播
  • • 创AI行业近年最大规模代码版权下架行动

详情链接: 

https://www.theblockbeats.info/flash/339023


16 · ClawHub上线中国镜像,AI技能库访问提速

 🏷 产品更新

OpenClaw生态技能注册中心ClawHub推出官方中国镜像站,为国内AI Agent开发者提供更快更稳的技能获取与检索体验,显著降低跨境网络延迟。作为"AI Agent的npm仓库",其支持技能发布、版本管理与向量搜索,推动技能复用和生态扩张。

配图
配图

主要亮点:

  • • 官方中国镜像落地,国内访问技能库更快更稳定
  • • 提供技能发布与版本管理,提升组件化复用效率
  • • 支持向量搜索技能,优化Agent能力发现与集成

详情链接: 

https://www.chooseai.net/news/3131/


17 · 阿里Wan2.7-Image发布:人像定制告别AI标准脸

 🏷 模型发布

阿里推出Wan2.7-Image图像模型,在人像定制、色彩精控与长文本渲染上实现升级,直指AI生成图像"千篇一律"痛点。模型已上线阿里云百炼平台API并开放体验,通过"捏脸"式身份塑造与精准调色盘,显著提升可控性与创作自由度,推动个性化生成走向规模化应用。

配图
配图

主要亮点:

  • • 虚拟"捏脸"能力增强,人像身份一致性更高
  • • 精准调色盘与色彩控制,风格与氛围可细调
  • • 长文本渲染更稳定,复杂提示词表现更完整

详情链接: 

https://finance.sina.com.cn/tech/digi/2026-04-01/doc-inhsysky1779720.shtml


18 · 联想宣布转型AI原生公司,押注千亿美元交付

 🏷 行业动态

联想宣布从"组装商"走向AI原生公司,计划以AI重构产品、服务与内部流程,推动从概念到规模化交付。公司将2024年定位为混合式AI实战年,强调可落地的商业成果与交付能力,释放传统硬件巨头向AI驱动增长转型的行业信号。

配图
配图

主要亮点:

  • • 全面重构产品、服务与流程,AI成为公司核心引擎
  • • 将2024定为混合式AI实战年,强调落地与交付
  • • 以千亿美元级目标驱动转型,释放产业升级信号

详情链接: 

http://jjckb.xinhuanet.com/20250401/c11e608becc644d89d856f6bcc665f24/c.html


19 · 可灵AI会员优惠上线:3.0视频模型限时8折

 🏷 产品更新

可灵AI于4月1日上线"会员模型优惠计划",至6月30日覆盖Web与App。铂金及以上会员使用3.0系列视频模型享灵感值8折,黄金会员9折,并同步延长图片模型优惠。此举以价格杠杆降低高阶视频生成门槛,推动创作者与企业更高频试用迭代,加速AIGC视频应用落地。

配图
配图

主要亮点:

  • • 3.0视频模型限时优惠:铂金及以上8折
  • • 黄金会员享9折,Web与App端同步覆盖
  • • 图片模型优惠期延长,提升多模态创作性价比

详情链接: 

https://www.pai.com.cn/news/01kn3ygd10bt55atgdybhcy2e3


20 · 高德开源ABot-M0:统一架构通用机器人基座模型

 🏷 开源项目

高德全量开源统一架构具身操作基座模型ABot-M0,以"一个通用大脑适配多形态机器人"为目标,降低异构硬件适配成本,推动机器人在工业与家庭场景快速落地。其在Libero-Plus等权威基准上表现突出,体现具身智能通用化的重要进展。

配图
配图

主要亮点:

  • • 全球首个统一架构具身操作基座模型全量开源
  • • 通用大脑适配多形态机器人,打破硬件壁垒
  • • Libero-Plus等基准成绩领先,验证泛化能力

详情链接: 

https://finance.sina.com.cn/tech/discovery/2026-04-01/doc-inhsxvfa2814293.shtml


21 · Chroma Context-1:自编辑搜索智能体重塑RAG

 🏷 研究论文

Chroma 在 Context-1 论文中指出单次检索假设限制了 RAG 上限,提出"搜索-评估-优化"的迭代检索范式。实证显示多跳检索优于一次检索,盲目堆叠上下文会引发"上下文腐烂"并降质。其建议以小型搜索智能体动态修剪证据、分离检索与推理,再交由大模型生成,推动代理化RAG成为新主流。

主要亮点:

  • • 将RAG从单次检索改为迭代搜索评估优化
  • • 多跳检索胜过一次检索,堆上下文反而腐烂
  • • 用小型搜索智能体收证据,检索推理解耦

详情链接: 

https://www.trychroma.com/research/context-1


22 · Anthropic误发调试包致Claude Code源码外泄

 🏷 行业动态

Anthropic 在 npm 更新中误将 60MB 调试文件打包,泄露 Claude Code 51.2 万行完整源码。代码被研究者公开后迅速扩散,GitHub 分叉超 4 万次,并被开发者用 Python、Rust 8 小时重写重构。事件凸显软件供应链与发布流程安全风险。

主要亮点:

  • • npm 误捆绑 60MB 调试文件,源码全量泄露
  • • GitHub 分叉超 4 万次,副本外溢难以清除
  • • 开发者 8 小时 Python 重写并 Rust 重构引热捧

详情链接: 

https://wallstreetcn.com/articles/3768915


🔭 最新开源


01 · 解析Claude Code泄露源码:工具与系统提示全曝光

 🏷 开源项目

该仓库对Claude Code泄露的51.2万行源码进行解码梳理,揭示隐藏功能、43个工具定义、系统提示词与架构模式。内容为理解AI编程助手的工具调用设计、安全边界与工程实现提供样本,有助于复现思路、评估风险并启发同类产品迭代。

主要亮点:

  • • 拆解51.2万行源码,提炼关键模块与结构
  • • 汇总43个工具定义,呈现工具调用编排方式
  • • 曝光系统提示与隐藏特性,便于安全审计

详情链接: https://github.com/fattail4477/claw-decode


02 · Llama.cpp-TurboQuant:任意硬件跑LLM提速130%

 🏷 开源项目

GitHub 热门开源项目 Llama.cpp-TurboQuant 基于 llama.cpp,主打让任意大模型在任意硬件上运行,并通过 ExpertFlow 与 TurboQuant 的 KV 压缩实现 MoE 推理最高约 130% 性能提升。同时提供与 Ollama 兼容的 API,降低本地部署与集成门槛,推动轻量高效推理生态扩展。

主要亮点:

  • • ExpertFlow 加速 MoE 推理,性能提升最高约 130%
  • • TurboQuant 进行 KV 压缩,降低显存与带宽压力
  • • 兼容 Ollama API,便于本地部署与应用集成

详情链接: https://github.com/MartinCrespoC/QuantumLeap---Llama.cpp-TurboQuant


03 · My AI Stack:开源AI工具栈导航页上线

 🏷 开源项目

GitHub Trending 出现 My AI Stack 项目,提供开源 AI 工具栈的落地页与导航入口,便于开发者快速了解并组装常用模型、框架与应用组件。虽为早期项目,但有助于降低选型成本,提升AI工程化集成与推广效率。

主要亮点:

  • • 以落地页形式集中展示常用AI工具栈与入口
  • • 面向开发者的开源导航,降低AI选型与集成门槛
  • • Trending 曝光带来社区关注,利于后续生态扩展

详情链接: https://github.com/my-ai-stack/home


以上内容由 AI 汇总,数据来源于网络公开平台。

OpenClaw TTS语音配置教程:五分钟开启,早起不用盯屏

本文介绍OpenClaw的文字转语音(TTS)功能配置方法。支持Edge TTS(免费)、OpenAI TTS(需API Key)和ElevenLabs(有免费额度),可设置自动播报或仅语音回复。零基础用户五分钟即可完成配置,适合想在起床、做家务时通过语音收听AI回复的用户,无需一直盯着屏幕。

Tags:

图片

你好,我是元小二,专注分享 AI 提效、一人公司实践和个人成长。这里有 OpenClaw、Claude Code、自动化流程、虚拟产品,也有理财、思考和生活系统。

欢迎关注,也欢迎后台留言告诉我,你对哪部分内容感兴趣。


朋友们,这是一个喜大普奔的好消息:
你有没有过这种感受——早上刚睁眼,眼睛还没睡醒,脑子还在半死机状态,但又想知道今天有什么值得关注的事情?
这时候盯着手机屏幕看一堆文字,简直是折磨。

Alt text

我有一段时间就是这样,每天早上拿起手机刷 AI 回复,刷着刷着眼睛就开始抗议。

直到我发现 OpenClaw 有 TTS(文字转语音)功能——AI 直接把答案念给你听,你连眼睛都不用睁开。

配置花了我不到五分钟,从此早上解放了双眼。今天把完整配置方法分享给你,零基础也能搞定(也可以让小龙虾自己去配置,看文末指令)。


一、先搞清楚:它是怎么工作的?

OpenClaw 的语音功能,说白了就是把 AI 的文字回复"翻译"成音频,然后直接发给你。

在 Telegram 上,它会发一个圆形的语音气泡,跟朋友发语音条一样,点一下就播,还能调速、拖进度——体验真的很完整。

支持三个语音服务:

  • ElevenLabs —— 音质封神,声音有情绪感,像真人在说话,有免费额度

  • OpenAI TTS —— 音质优秀,声音清晰稳定,有 API Key 直接用

  • Edge TTS —— 微软出品,完全免费,不需要任何 Key,平时用够了

Alt text

划重点:什么都不配也没关系,OpenClaw 会自动用 Edge TTS 兜底,直接能用,不会报错。


二、五分钟配好语音功能

第一步:开启语音(核心就一行)

打开 openclaw.json,找到 messages 字段,加进去:

{

"messages": {

"tts": {

"auto""always"

}

}

}

保存重启,完事。AI 的每一条回复都会自动带语音了。

auto 有四个选项,按需选:

  • off —— 关闭(默认值)

  • always —— 每次都发语音(我用这个,懒人必选)

  • inbound —— 你发语音过来,它才用语音回

  • tagged —— 只有 AI 觉得适合发语音才发


第二步:选你的语音服务

👉 零成本方案:Edge TTS(强烈推荐入门首选)

{

"messages": {

"tts": {

"auto""always",

"provider""edge",

"edge": {

"voice""zh-CN-XiaoxiaoNeural",

"lang""zh-CN",

"rate""+10%"

}

}

}

}

中文声音可选:

  • zh-CN-XiaoxiaoNeural(女声,温和自然)

  • zh-CN-YunxiNeural(男声)

  • zh-CN-XiaohanNeural(女声,活泼风格)

rate 控制语速,嫌慢可以调到 +10% 到 +20%,我个人用 +10%,刚刚好。


👉 音质进阶:OpenAI TTS

有 OpenAI API Key 的直接用这个,音质比 Edge 好一个档次:

{

"messages": {

"tts": {

"auto""always",

"provider""openai",

"openai": {

"apiKey""sk-xx",

"model""gpt-4o-mini-tts",

"voice""nova"

}

}

}

}

六个声音随便选:alloyechofableonyxnovashimmer

我最喜欢 nova,暖一些,听起来不那么机械。模型用 gpt-4o-mini-tts 就够了,比完整版便宜,质量差不多。


👉 音质天花板:ElevenLabs(想听真人质感就选这个)

{

"messages": {

"tts": {

"auto""always",

"provider""elevenlabs",

"elevenlabs": {

"apiKey""xx",

"voiceId""你的声音ID",

"modelId""eleven_multilingual_v2"

}

}

}

}

voiceId 去 ElevenLabs 后台挑一个你喜欢的声音,复制 ID 填进来。eleven_multilingual_v2 支持中文,发音很准。每月有免费额度,个人日常用基本够。


三、高阶操作:配三层备用,永不中断

这个我强烈推荐配上,一劳永逸:

{

"messages": {

"tts": {

"auto""always",

"provider""openai",

"openai": {

"apiKey""sk-xx",

"voice""nova"

},

"elevenlabs": {

"apiKey""xx",

"voiceId""your-voice-id"

}

}

}

}

逻辑是:OpenAI 挂了自动切 ElevenLabs,ElevenLabs 也挂了再切 Edge TTS。三层保底,语音功能基本不会失效。


四、长文章怎么处理?加个自动摘要

AI 有时候回复特别长,全转成语音听着累。OpenClaw 有个自动摘要功能,超过一定长度会先压缩再发语音:

{

"messages": {

"tts": {

"auto""always",

"summaryModel""openai/gpt-4o-mini"

}

}

}

默认超过 1500 字符就触发摘要。如果不想要摘要,发指令关掉:/tts summary off


五、不想改配置?直接用指令控制

不想动配置文件,聊天框直接发这些:

/tts always        # 开启语音

/tts off# 关闭语音

/tts inbound       # 只在我发语音时才回语音

/tts status        # 查看当前状态

/tts provider openai   # 临时切换提供商

/tts audio 你好,测试  # 单次生成语音

实时生效,不用重启,非常灵活。


六、这功能最适合这几个场景

我自己用下来,语音功能在这几个场景特别香:

  1. 早上刚起床 —— 刷牙洗脸的时候听,不用盯屏幕

  2. 手头在忙别的 —— 眼睛不用离开手头的事,AI 直接念给你听

  3. 和 AI "说话" —— inbound 模式开启,你发语音它回语音,完全像在打电话


七、最后说一句

我对 OpenClaw TTS 的评价是:配置门槛极低,实用性极高,没理由不开。

核心就一行 "auto": "always",五分钟搞定。不想花钱直接用 Edge TTS,追求音质上 OpenAI,想要最像真人的声音上 ElevenLabs。

如果你之前只是用文字跟 AI 聊,现在可以试试换个方式——让 AI 开口说话,感觉真的挺不一样的。

赶快去配一下吧,我的朋友!

人生是一场无限游戏,乾坤未定,你我均是黑马。


关注【元小二学AI】公众号,后台回复「OpenClaw」获取 OpenClaw 多 Agent 协作完整部署指南等openclaw教程 👇



温馨提示:

公众号修改了推送规则,很多人发现收到的消息不及时。

为了能够第一时间收到消息,不错过优质的AI教程,请星标⭐置顶本公众号,以便第一时间获取精选内容!




          我们的口号:学好AI,享受生活


关注【元小二学AI】,你会持续看到更接地气的 AI 学习内容。

这里不讲太多空概念,更关注普通人怎么把 AI 真正用到工作、内容创作和日常生活里。

包括工具实操、提效流程、自动化思路,以及一人公司场景下的真实应用。

你能在这里找到教程、案例、脚本思路和实战经验,少走弯路,早点把 AI 变成自己的帮手。















AI日报|Claude Code源码外泄,OpenAI融资1220亿美元,阿里发布Wan2。7-Image

本AI日报汇总4月1日重要资讯:Anthropic误发调试包致Claude Code超51万行源码外泄,GitHub清理超8100仓库;OpenAI完成1220亿美元融资,估值8520亿美元;阿里发布Wan2.7-Image图像模型,提升人像定制能力。同时涵盖可灵AI会员8折优惠...