本文实测开源AI Agent Hermes,它具备学习循环和技能沉淀能力,可将YouTube链接自动生成摘要、脚本思路并封装为新技能。全程无需编写代码,适合AI提效与内容创作者。但存在任务易中断、技能调度不足等问题,需半自动化协作使用。
Tags:
朋友们,最近AI圈又炸了一个新玩意儿——Hermes Agent。
OpenClaw的热度还没完全散,它就杀出来了。我昨晚实测了整整一个晚上,有些话必须直接跟你说。
一、先说它到底是什么东西
Hermes 是 Nous Research 推出的开源 Agent,主打一个卖点:越用越聪明。
普通 Agent 每次对话完就清零了,就像你养了一条金鱼,七秒记忆,昨天教的今天全忘。
但 Hermes 不一样——它内置了学习循环(learning loop),会自动从任务里提炼技能(skills),记住你的习惯和偏好,第二次做同类任务直接调用已进化的技能。
说白了,就是养一个会自己成长的 AI 助手,陪你一起变强。
它可以跑在终端命令行里,也能接 Telegram、Discord、Slack、WhatsApp、Signal 这些平台。我昨晚是在终端里跑的,底层模型接的 gemini-2.5-flash。
二、它和 OpenClaw 到底哪里不一样?
1. 技能机制:一个靠人养,一个自己长
OpenClaw 的技能靠社区维护,ClawHub 上有几千个插件,听起来很牛,但你用完一个任务,下次换场景还得自己找、自己配。
Hermes 完全不一样。每次你完成一个复杂任务,它会自动把这个成功的工作流提炼成一个”Skill 文档”,下次直接调用,不用你再说一遍。
用了三个月,它已经完全知道我喜欢怎么写内容、怎么整理资料了。OpenClaw 用三年,还是原地踏步。
2. 记忆系统:一个像金鱼,一个像老朋友
OpenClaw 的记忆是 Markdown 文件,静态的,需要你手动整理。换个会话,基本从零开始。所以,有时候你得特意强调,让它记下来才行。
而Hermes 有多层记忆栈:持久记忆 + SQLite 全文搜索历史 + LLM 自动摘要 + 用户行为建模。
什么意思?就是你今天跟它说”我不喜欢总结太长”,下周它还记得。你上个月做过的工作流,它能直接检索调用。这才是真正的”个人 AI 伙伴”,不是每次都要重新介绍自己的那种。
3. 部署体验:一个要调教,一个开箱即用
OpenClaw 基础安装简单,但要用起来高级功能,配置量不小,更新有时候还得自己修 bug。
Hermes 就一条命令:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
装好之后跑 hermes setup,按向导选模型、填 API Key,五分钟搞定。而且默认就是安全的,不需要你主动配置安全边界,真正做到了”开箱即安全”。
4. 技能沉淀能力真的厉害
我发了一个 YouTube 链接,它用自带的 youtube-content skill 直接给我出了摘要。
然后我让它在此基础上生成 5 条短视频脚本思路,并把整个工作流封装成一个新 skill:youtube_short_script。
再发一个新的 YouTube 链接?它直接复用了这个 skill!
很多同类产品功能之间是散的,各做各的。Hermes 在往可沉淀、可复用的方向进化,这一点是真的。
5. 结构化沉淀,直接帮你建知识库
我让它用 llm-wiki skill 创建一个 Obsidian 笔记,它不只写了主文件,还自动补了 index.md 和 log.md。
后来研究 OpenClaw、处理 YouTube 视频、生成公众号文章、小红书笔记、Twitter 帖子,我都让它往 Wiki 里沉淀。
它在试图把一次性对话变成结构化资产,这比那些只会吐一段文字的 Agent 高了不止一个档次。
三、但是——它最大的问题不是笨
用了一整晚,我发现 Hermes 真正的短板,不是某个单点功能不够强,而是缺少一套把能力组织起来、稳定推进到交付的机制。
具体说,踩了这些坑:
❌ 1. 动作很多,但不一定直奔结果
我让子代理 A 研究我们整晚的互动,再让子代理 B 产出一篇公众号文章。
Hermes 拆解任务很有一套,看起来头头是道。
结果呢?子代理 A 根本拿不到父代理的完整会话历史,整个流程要重跑一遍。
它抓住了”步骤正确”,但没有第一时间围绕最终交付来组织这些步骤。 它会动,但不一定朝着最短闭环去动。
❌ 2. 撞上南墙,也不会主动换路
让它联网搜索 OpenClaw 的资料,直接被 Google 验证码拦住了。
然后呢?它就停在原地了。
它难道不能切 GitHub、切官网、切文档、换搜索源吗?完全可以,但它没有这么做。
它更像是在执行”一条路径”,而不是在完成”一个目标”。
做 Manim 动画也一样,最后卡在 sudo 权限就卡死,说做不了让我换需求。它懂得指出边界,但不会主动降级方案——比如”我给你脚本 + 运行说明”,或者”给你一个更低成本的替代方案”。
❌ 3. skill 不少,但不会调度 skill
Hermes 自带的 skill 很多,看起来武器库丰富。
但到了复杂任务里,这些能力并没有真正形成一个聪明的调度层。
它不缺 skill,而是缺少把这些 skill 变成可调度、可回退、可组合的系统。
❌ 4. 没有任务状态管理,任务反复重启
这个是我昨晚最抓狂的问题。
只要我在它执行过程中再发一条新消息,它就直接中断当前流程,界面会出现”New message detected, interrupting…”这样的提示。
然后我再让它继续,它又要重新理解一遍当前状态。
它不是在持续推进任务,而是在反复重新开始任务。 短任务还好,任务一长,这个代价会被迅速放大。
❌ 5. 会反思,会承诺,但屡教不改
这一条是我觉得最有意思的观察。
每次我指出它没有及时同步进度,它都能非常认真地分析原因,提出一套改进方案,还越来越卑微……
但结果就是——屡教不改。
这种”反思—承诺—后续仍沉默”的循环,昨晚至少出现了 4、5 次。
“认知改进”和”行为改进”是断开的。它特别适合职场写总结汇报,但自己的问题就是不改。 说到却做不到,这让我想起了古代圣贤王阳明的心学——知行合一。或许,Hermes目前缺乏的,就是这种知行合一的态度。如果能够把王阳明的这套理论嵌入到agent系统里面,那就太棒了!
❌ 6. 有记忆,但没有记忆策略
Hermes 确实能把东西写进记忆文件,也能在你明确要求时记下踩坑经验。
但那些应该高优先级记住的教训,比如上面说的反馈机制问题,它反而没有主动记,还是我明确要求之后才写进去。
它能存很多东西,但不知道什么真正值得记,什么该升级成下一次执行时的默认规则。
四、实测之后,我对 Agent 的理解变了
昨晚测到后半段,我突然意识到:
我已经不只是在给它下命令了,我在和它协作,在不断定义标准、规则和边界。
什么叫完成、什么算踩坑、什么必须记录、什么时候必须反馈、什么要升级成长期规则——以前我不会对一个普通工具做这些事,但对 Agent,你不做这件事,它就没办法跑顺。
所以我现在对 Agent 最有效的使用方式,不是丢一个大任务过去看它能不能接住,而是先把工作流拆清楚,再一点点把规则固定进去。
人和 Agent 的协作,本质上是在持续把隐性标准显性化。
有朋友会问,这样不会让自己变懒、懒于思考吗?
实测下来,我反而更乐观了——至少眼下,还有很多必须人为参与、需要动脑子的环节。 前提是你得先用上这些最先进的工具,跟最先进的智力持续碰撞、协作。
六、最后的建议
Hermes 值得试,但你要带着正确的预期去用它:
它不是全自动的,而是半自动的
它需要你帮它定义清楚规则和边界
把工作流拆清楚,封装成 skill,它才能稳定复用
去试试吧,我的朋友!
人生是一场无限游戏,乾坤未定,你我均是黑马。🖤
温馨提示:
公众号修改了推送规则,很多人发现收到的消息不及时。
为了能够第一时间收到消息,不错过优质的AI教程,请星标⭐置顶本公众号,以便第一时间获取精选内容!
没有评论:
发表评论