Hermes 为什么能接过 OpenClaw 的风头
进入 2026 年 4 月,开源 Agent 圈子的热度几乎在短短几周之内就完成了一次主角更替。两个月前,OpenClaw 还凭借“龙虾”式的交互体验占据社区中心,成为开发者口中最具想象力的自动化 Agent;而到了四月,另一个名字开始频繁出现在 GitHub Trending 顶部——Hermes。它连续数周停留在热门榜单前列,迅速收获数万颗星标,也让整个社区的讨论方向,从“谁最像 Claude 的开源替代品”,转向“谁更接近真正能够自我成长的 Agent”。
Hermes 之所以突然爆红,并不是因为它比 OpenClaw 多出了多少肉眼可见的新功能,而恰恰是因为在把两者拆开逐项比较之后,很多人会意外发现,它们在表面能力上其实高度重叠。无论是定时调度、子 Agent 分工、浏览器自动化、视觉识别、语音合成,还是多平台消息接入,Hermes 几乎都能在 OpenClaw 已经覆盖的清单里找到对应的位置。换句话说,如果只看功能表,Hermes 并没有创造出一个完全不同的新物种,它更像是在同一条赛道上,用另一种方式重新组织了一套几乎相同的能力。
真正让它脱颖而出的,不是“它会什么”,而是“它替用户做了多少决定”。
在过去的开源 Agent 工具里,很多复杂度虽然被包装成了自动化,但最终仍然停留在用户身上。你仍然需要自己判断什么时候建立技能、什么时候调用记忆、什么时候整理上下文,以及什么时候让系统停止。而 Hermes 做的事情,是把这些原本需要用户介入的判断,尽可能向底层系统里收回,让用户看到的是一个更像“会自己运转”的智能体,而不是一个需要持续维护的工具框架。
最典型的差异,首先体现在它的 Skill 系统上。
在 Agent 的世界里,Skill 本质上就是工作流模板,是一套让模型知道“某类事情应该怎么做”的执行经验。过去很多系统也有类似机制,但大多数都依赖人工创建、手动挂载,再由用户决定什么时候启用。而 Hermes 的做法,是让技能不再只是静态配置,而是变成一个可以自动形成、自动迭代的能力模块。
当 Hermes 在一次任务里连续调用多次工具,或者在执行过程中出现错误后自行修正,又或者用户直接指出它刚刚哪里做错,它都会把这段过程视为一次“值得学习的行为”。随后系统会在后台悄悄把这段流程整理成新的 Skill 文件,写入本地知识库,而整个过程很多时候用户甚至察觉不到。它不是等你告诉它该总结什么,而是主动把一次成功经验沉淀下来,让自己在下一次遇到类似任务时更快进入状态。
更重要的是,Hermes 并不满足于记录,它还尝试让这些技能继续演化。
它在后台引入了一套离线优化机制,定期回顾已有 Skill 的执行表现,把过去的任务记录重新抽出来分析,判断某个技能的步骤是否冗余、提示是否可以更精准、错误恢复是否还有优化空间。它不是简单地把技能越存越多,而是试图让这些技能在长期使用中逐渐形成一套更高效的行为模式。虽然这种“自进化”目前还远远谈不上真正意义上的自主学习,但它至少让 Agent 第一次显现出了一种“使用越久越顺手”的感觉,而这种体感,恰恰是很多开发者第一次在开源 Agent 身上感受到的东西。
除了技能,Hermes 被反复讨论的另一个核心,是它对记忆系统的处理方式。
今天很多 Agent 都有记忆,但不同系统之间的差异,往往不在于有没有,而在于它们究竟在替谁记。
有些系统记住的是项目本身,比如代码结构、调试方法和运行命令;有些系统记住的是对话内容,但只有在上下文快溢出时才被动保存。而 Hermes 的思路,是把记忆对象从“任务”进一步延伸到“用户”。
它不会等到对话即将崩溃才仓促存档,而是在交互过程中周期性地主动回顾,判断刚刚的对话里是否出现了值得长期保留的信息,比如你的表达习惯、偏好的工作方式、常见的指令风格,甚至你对结果呈现的审美倾向。它把记忆从一种临时补救机制,变成了一种持续发生的行为。
这意味着当你连续使用一段时间之后,Hermes 给人的感受不只是“记住了你说过什么”,而更像是“逐渐摸清了你喜欢怎么做事”。这种体验上的变化非常微妙,却恰恰是决定一个 Agent 是否像“工具”还是像“助手”的关键区别。因为大多数用户并不会仔细研究它背后的架构,他们感知到的只是:这个系统是不是越来越懂自己。
而 Hermes 最大的聪明之处,并不是让系统更复杂,而是把复杂藏起来。
很多人误以为自动化意味着复杂度消失,实际上复杂度从来不会凭空蒸发,它只会转移。过去需要用户亲自做的判断,在 Hermes 里被提前写进了系统规则里。什么时候生成技能,什么时候触发记忆,什么时候压缩上下文,什么时候要求人工确认,什么时候禁止模型自由决定,这些都不是模型临场推断,而是开发团队预先替用户做好的工程判断。
从外部看,用户体验到的是一种轻松——几乎不需要理解系统内部逻辑,就能直接使用;但从内部看,Hermes 实际上是用更多的底层规则,换取了更少的用户干预。它并不是让系统变简单,而是让复杂性从界面消失。
这也是它和 OpenClaw 最大的分水岭。
OpenClaw 更像一个强大的框架,它提供能力,但仍然默认你愿意参与管理;Hermes 则更像一个愿意替你承担管理成本的系统,它默认你并不想知道内部细节。前者强调可控,后者强调省心,而在更广泛的用户群体里,后者显然更容易形成传播。
当然,Hermes 并不是没有问题。
它引以为傲的自动进化,也可能在某些情况下变成风险。社区里已经有人抱怨,自己精心调试的技能会被后续自动优化覆盖,导致原本稳定的流程突然发生变化;它的主动记忆有时也会过度自信,把一些其实并不重要的习惯误判成长期偏好;而在涉及复杂代码审查、合同生成、财务建模这类高风险任务时,全自动本身就意味着更多不可控因素。对于专业用户来说,这种“替你决定”的能力有时是便利,有时也是隐患。
但即便如此,Hermes 仍然踩中了一个非常清晰的方向。
过去两年的 Agent 演化,其实一直围绕一个核心问题展开:到底应该让用户控制系统,还是让系统逐渐接管用户。
Claude 倾向于谨慎控制,OpenClaw 试图平衡,而 Hermes 选择了最激进的一端——尽可能减少用户参与,让 Agent 自己承担更多判断。它并不是因为今天做得最完美才火,而是因为它率先把“更少干预”的未来提前做成了一个可以摸到的产品。
从这个角度看,Hermes 的价值也许并不在于它今天比 OpenClaw 强多少,而在于它让整个开源 Agent 社区第一次更清楚地看见:下一阶段竞争的关键,可能已经不再是谁的工具更多,而是谁能把同样的复杂能力,变成一种更接近“无感”的体验。
因为在 Agent 这条路上,真正能留下用户的,往往不是最聪明的系统,而是那个让人最容易忘记自己正在使用系统的产品。