Skip to content
OpenInfoHub
Go back

Hermes vs OpenClaw:两款开源自主 AI 代理的深度对比

两款都是开源自托管的 AI 代理,都支持多平台消息接入,都声称「真正自主」——但它们解决的核心问题截然不同。这篇文章不做优劣排名,只帮你看清两者的本质差异,做出符合自己需求的选择。

目录

一、出身决定气质

在比较具体功能前,先理解两个项目的来源——这直接决定了它们的设计取舍。

OpenClaw:从个人痒点出发

OpenClaw 由 PSPDFKit 创始人 Peter Steinberger 创建,最初名为 Clawdbot(因 Claude 而得名)。它的起点是一个非常具体的个人需求:

「我想在 WhatsApp 里指挥 Claude 帮我处理邮件、管理日历、控制浏览器。」

这个起点塑造了 OpenClaw 的一切:以消息应用为入口,以真实生活任务为目标。它的核心隐喻是「网关(Gateway)」——一个将你日常使用的聊天 App 与 AI 能力桥接起来的中间层。

项目在 2026 年初迅速走红,社区评价它「感觉像早期的 AGI」。

Hermes:从研究室出发

Hermes Agent 来自 Nous Research,这是一个以开源大模型研究著称的团队(Hermes 系列模型和 Nomos 模型的作者)。它的起点是研究问题:

「如何构建一个能从自身经验中持续学习、不断改进的 AI 代理?」

这个起点塑造了 Hermes 的一切:以学习循环为核心,以代理自主性为目标。它的核心隐喻是「进化(Evolution)」——一个不只执行任务,还会归纳经验、自动生成技能的代理操作系统。


二、架构哲学:网关 vs 代理

两者的系统架构图揭示了最根本的设计差异。

OpenClaw:以网关为中心

WhatsApp / Telegram / Slack / Discord / iMessage


┌───────────────────────────────┐
│      Gateway(控制平面)       │
│    ws://127.0.0.1:18789       │
└──────────────┬────────────────┘

      ┌────────┼────────┐
      │        │        │
   Pi Agent  CLI    WebChat

      ┌────────┼────────┐
      │        │        │
   macOS节点  iOS节点  Android节点

OpenClaw 是一个以 Gateway 为神经中枢的分布式系统。Gateway 是 WebSocket 控制平面,所有客户端(CLI、Web UI、手机 App)、所有平台频道都连接到它。这个设计让 OpenClaw 可以同时协调多个设备节点,甚至控制手机摄像头和屏幕录制。

Hermes:以代理为中心

Telegram / Discord / Slack / WhatsApp / Signal


┌───────────────────────────────┐
│         Hermes Agent          │
│    (SQLite记忆 + Skills)     │
└──────────────┬────────────────┘

    ┌──────────┼──────────┐
    │          │          │
  本地终端  Docker容器  SSH远程
    │          │          │
  Modal     Daytona  Singularity

Hermes 是一个以代理为核心的平台。不同于 OpenClaw 的 Gateway 中心化,Hermes 强调代理本身的能力——它的「大脑」(记忆、技能、学习系统)是主体,各种接入方式和执行环境是外围。

关键区别:OpenClaw 问的是「谁在和我说话、通过什么渠道?」,Hermes 问的是「我从这次交互中学到了什么?」


三、核心能力对比总览

维度OpenClawHermes Agent
核心定位消息平台 AI 网关自学习自主代理
项目背景独立创作者(PSPDFKit 创始人)AI 研究机构(Nous Research)
模型绑定主要面向 Claude,支持其他完全模型无关
安装难度中等(Node.js 22 必须)低(仅需 Git)
学习机制手动维护工作区文件自动生成/改进 Skills
记忆存储Markdown 文件(MEMORY.md)SQLite + FTS5 全文检索
平台支持20+ 个(含 iMessage)15+ 个
设备节点✅ iOS、macOS、Android
浏览器控制✅ Chrome/CDP 集成❌(需通过 Skills 扩展)
主动心跳✅ HEARTBEAT.md 机制✅ 内置 Cron 调度
多代理并行✅ 多 Agent 配置✅ Profiles + 子代理
终端后端本地 + Docker本地/Docker/SSH/Modal/Daytona/Singularity
Git Worktrees✅ 原生 -w 标志
版本回滚✅ Shadow Git 快照
安全模型DM 配对 + 白名单七层防御体系
技能生态Skills 目录(手动)agentskills.io + 自动生成
研究支持✅ 批量轨迹生成
配置语言JSONYAML
运行时Node.jsPython + Node.js

四、学习与记忆:最核心的差异

这是两者最本质的分歧,也最值得深挖。

OpenClaw 的「声明式记忆」

OpenClaw 的记忆系统建立在工作区文件上,完全由用户维护:

~/.openclaw/workspace/
├── SOUL.md        # 个性定义(我是谁)
├── AGENTS.md      # 操作指令(我该怎么做)
├── HEARTBEAT.md   # 心跳任务(我定期做什么)
├── MEMORY.md      # 持久记忆(我记得什么)
└── skills/        # 技能目录

你告诉 OpenClaw 它是谁、它该做什么、它要记住什么。这是声明式的——高度可控,但需要用户主动维护。

# MEMORY.md 示例
## 用户偏好
- 喜欢简洁的回复
- 工作时间:9:00-18:00

## 重要信息
- 项目 A 截止日期:2026-05-01

优点:完全透明,每条记忆可审查可修改。
局限:你要自己写进去它才记得,无法从对话中自主归纳。

Hermes 的「自适应记忆」

Hermes 的记忆系统是动态的:

~/.hermes/
├── state.db      # SQLite(FTS5 全文索引)
├── sessions/     # JSONL 原始对话记录
└── skills/       # 自动生成/改进的技能

Hermes 不只「记住」——它归纳。每次交互后,它会分析能否提炼出可复用的操作模式,并自动生成或改进对应的 Skill。

行为OpenClawHermes
记住你的名字你写进 MEMORY.md自动从对话归纳
学会你的工作流你写进 AGENTS.md自动生成 Skill
搜索历史对话手动翻 JSONL 文件/search + FTS5 布尔查询
改进已有技能你手动修改 Skill 文件代理自主迭代

五、多平台接入:旗鼓相当,细节各异

两者都支持主流消息平台,但各有独特覆盖:

OpenClaw 独有

Hermes 独有

结论:如果你用 iPhone、需要控制浏览器或手机设备——OpenClaw 明显领先。如果你只需要纯消息接入——两者差距不大。


六、主动任务调度:两种实现思路

两者都支持让代理「主动干活」,但实现方式体现了不同的设计哲学。

OpenClaw:HEARTBEAT 机制

OpenClaw 的 HEARTBEAT.md 文件定义代理的心跳行为:

# HEARTBEAT.md
## 每日任务
- 检查未读邮件数量
- 查看今日日程

## 条件任务
- 如果有紧急邮件,立即通知
- 如果磁盘空间不足,发出警告

每隔 N 分钟,代理读取这个文件并决定做什么。优点是任务描述用自然语言,AI 自行判断执行方式。缺点是执行时机不够精确(分钟级间隔,不支持精确 cron 表达式)。

Hermes:内置 Cron 调度

Hermes 使用标准 cron 语法进行精确调度:

hermes schedule "每天早上 9 点分析 GitHub 新 Issue"
hermes schedule list

支持 */5 * * * * 这样的标准 cron 表达式,执行时机精确。代价是任务描述需要更结构化。

结论:需要「大概每隔一段时间做个什么」→ OpenClaw 的 HEARTBEAT 更直觉。需要「精确在某个时刻执行」→ Hermes 的 Cron 更可靠。


七、安全模型:深度 vs 易用

OpenClaw 的安全策略

OpenClaw 的安全围绕两个核心机制:

DM 配对码:未知用户发消息时,收到一个配对码,不被处理直到你审批通过。

白名单:所有平台频道都需要显式配置 allowFromopenclaw doctor 会检测危险配置。

这套机制简单直观,适合个人使用场景。但它主要防止的是「谁能和代理说话」,对代理执行命令时的安全性关注相对少。

Hermes 的七层防御

Hermes 构建了更系统的安全模型,因为它面向的是「代理在服务器上执行命令」这个更高风险的场景:

层 1: 用户授权      → 白名单 + DM 配对码(与 OpenClaw 类似)
层 2: 危险命令审批  → 人工确认 rm -rf、DROP TABLE 等
层 3: 容器隔离      → Docker/Singularity/Modal 沙箱
层 4: 凭证过滤      → 子进程执行时剥离环境变量
层 5: 上下文扫描    → 检测项目文件中的提示词注入
层 6: 跨会话隔离    → 会话间数据不可互访
层 7: 输入消毒      → 工作目录参数防 Shell 注入

Tirith 集成还会在执行前扫描同形字欺骗(rm 和看起来像 rm 的 Unicode 字符)和管道到解释器模式(curl | bash)。

结论:个人助手场景下 OpenClaw 的安全性足够。需要在服务器上执行生产代码、处理敏感数据时,Hermes 的防御纵深更适合。


八、开发者工作流:Hermes 的主场

对于软件开发者,Hermes 有几个 OpenClaw 目前没有的专属能力:

Git Worktrees 原生集成

# 一个标志,自动隔离分支和工作目录
hermes -w

# 多个代理并行处理不同功能
hermes -w -s feature-auth     # 代理 1:处理认证模块
hermes -w -s feature-payments # 代理 2:处理支付模块

每个 worktree 有独立的 Checkpoint 历史,互不干扰。

Shadow Git 快照与回滚

/rollback            # 查看所有快照
/rollback diff 3     # 预览快照 3 之后的所有变更
/rollback 3          # 恢复 + 撤销对应对话轮次
/rollback 3 src/api.py  # 只恢复单个文件

代理修改文件前自动打快照,完全不影响项目自己的 .git。这意味着你可以让代理大胆尝试,随时后悔。

研究基础设施

Hermes 内置批量轨迹生成支持,可以直接用于训练 Tool-Calling 模型。这是 OpenClaw 没有、也不打算有的功能——因为 OpenClaw 不是为 AI 研究者设计的。


九、安装体验

OpenClaw

# 前置要求:Node.js 22(必须手动安装)
node --version  # 必须 >= 22

# 安装
npm install -g @openclaw/openclaw

# 初始化
openclaw setup

需要先有 Node.js 22,配置需要编辑 JSON 文件,初次上手需要一定时间熟悉工作区文件体系。

Hermes

# 唯一前置要求:Git(通常已安装)
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# 重载 Shell
source ~/.bashrc

# 诊断
hermes doctor

# 选模型,开始聊
hermes model
hermes

安装脚本自动处理 Python 3.11、Node.js 22、ripgrep 等所有依赖,普通用户到「第一次对话」的路径更短。


十、典型使用场景对比

场景 1:「帮我管理邮件和日历」

推荐:OpenClaw

OpenClaw 的 HEARTBEAT 机制专为这类主动式个人助手场景设计。你在 AGENTS.md 里写「每天早上检查未读邮件」,它就真的每天早上去做。配合 Gmail Pub/Sub 触发器和 Google Calendar 集成,这是 OpenClaw 的主场。

场景 2:「帮我同时开发几个功能分支」

推荐:Hermes

hermes -w 一个命令就能为每个功能创建隔离的 worktree + branch + checkpoint 历史。多个代理并行工作,互不干扰,随时可以对某个代理的修改做 diff 和回滚。

场景 3:「我想通过 WhatsApp 控制我的 Mac」

推荐:OpenClaw

OpenClaw 的 macOS 原生节点支持 system.run、系统通知、摄像头访问。加上 WhatsApp 集成,你可以真正从手机控制 Mac 上运行的代理。Hermes 没有设备节点这个概念。

场景 4:「我想要一个真正记住我工作习惯的 AI 助手」

推荐:Hermes

Hermes 的 Skills 自动生成机制会从你的工作模式中归纳出可复用的操作。用它两周后,它会比第一天「更懂你」——不是因为你手动维护了什么文件,而是它自己学的。

场景 5:「我要在服务器上运行一个安全的自动化代理」

推荐:Hermes

七层安全防御 + Docker/Modal 容器隔离 + 危险命令审批机制,Hermes 更适合在生产服务器上无人值守运行。OpenClaw 的安全模型更适合个人设备。

场景 6:「切换不同 LLM 模型测试效果」

推荐:Hermes

Hermes 从设计上就是模型无关的——一条命令 hermes model 切换任意后端,无需改代码。OpenClaw 主要围绕 Claude 设计,虽然也支持其他模型,但体验上不如 Hermes 流畅。


十一、一个不那么明显的区别

OpenClaw 和 Hermes 都说自己支持「Skills」,但含义差异很大:

OpenClaw SkillsHermes Skills
创建方式手动编写 Markdown 文件代理自动生成 + 手动创建
改进方式手动编辑代理自主迭代
来源官方 + 社区agentskills.io 生态 + 自动
调用方式由代理判断何时使用成为斜杠命令,可直接调用

OpenClaw 的 Skills 更像「工具箱里的工具」——你放进去,代理用。
Hermes 的 Skills 更像「可进化的 SOP」——从使用中提炼,边用边改进。


十二、如何选择?

用两个问题快速定位:

问题 1:你的核心需求是什么?

问题 2:你更看重什么?

快速决策树

你主要用手机聊天 App 发指令吗?
  ├── 是 → 需要控制 iPhone/Mac 设备?
  │         ├── 是 → OpenClaw
  │         └── 否 → 两者都行,OpenClaw 更成熟
  └── 否 → 你主要写代码 / 在服务器上工作?
            ├── 是 → Hermes(worktrees + rollback + 7层安全)
            └── 否 → 需要模型自由切换?
                      ├── 是 → Hermes
                      └── 否 → 两者皆可,看哪个 UI 更合口味

可以同时用吗?

完全可以,而且有合理的分工:


十三、总结

OpenClaw 和 Hermes 代表了开源 AI 代理的两种演化方向:

OpenClaw 是「消息应用入口 + 真实世界执行器」的化身。它的精髓在于把 AI 能力无缝嵌入你已有的沟通习惯,无论是 WhatsApp 还是 iMessage,无论是浏览器操作还是手机摄像头。它的用户是「想让 AI 真正帮我做事的普通人」。

Hermes 是「自我进化的代理操作系统」的化身。它的精髓在于构建一个随时间越用越好的代理——不只执行任务,还从任务中学习。它的用户是「想让 AI 深度融入开发工作流,并在我的基础设施上持久运行的工程师」。

两者没有高下之分,只有场景之别。在你的场景里最顺手的那个,就是最好的那个。


延伸阅读:

项目链接:


Share this post on:

Next Post
Hermes Agent 完全指南:Nous Research 打造的自我进化 AI 助手