Hermes vs OpenClaw：两款开源自主 AI 代理的深度对比

两款都是开源自托管的 AI 代理，都支持多平台消息接入，都声称「真正自主」——但它们解决的核心问题截然不同。这篇文章不做优劣排名，只帮你看清两者的本质差异，做出符合自己需求的选择。

一、出身决定气质

在比较具体功能前，先理解两个项目的来源——这直接决定了它们的设计取舍。

OpenClaw：从个人痒点出发

OpenClaw 由 PSPDFKit 创始人 Peter Steinberger 创建，最初名为 Clawdbot（因 Claude 而得名）。它的起点是一个非常具体的个人需求：

「我想在 WhatsApp 里指挥 Claude 帮我处理邮件、管理日历、控制浏览器。」

这个起点塑造了 OpenClaw 的一切：以消息应用为入口，以真实生活任务为目标。它的核心隐喻是「网关（Gateway）」——一个将你日常使用的聊天 App 与 AI 能力桥接起来的中间层。

项目在 2026 年初迅速走红，社区评价它「感觉像早期的 AGI」。

Hermes：从研究室出发

Hermes Agent 来自 Nous Research，这是一个以开源大模型研究著称的团队（Hermes 系列模型和 Nomos 模型的作者）。它的起点是研究问题：

「如何构建一个能从自身经验中持续学习、不断改进的 AI 代理？」

这个起点塑造了 Hermes 的一切：以学习循环为核心，以代理自主性为目标。它的核心隐喻是「进化（Evolution）」——一个不只执行任务，还会归纳经验、自动生成技能的代理操作系统。

二、架构哲学：网关 vs 代理

两者的系统架构图揭示了最根本的设计差异。

OpenClaw：以网关为中心

WhatsApp / Telegram / Slack / Discord / iMessage
               │
               ▼
┌───────────────────────────────┐
│      Gateway（控制平面）       │
│    ws://127.0.0.1:18789       │
└──────────────┬────────────────┘
               │
      ┌────────┼────────┐
      │        │        │
   Pi Agent  CLI    WebChat
               │
      ┌────────┼────────┐
      │        │        │
   macOS节点  iOS节点  Android节点

OpenClaw 是一个以 Gateway 为神经中枢的分布式系统。Gateway 是 WebSocket 控制平面，所有客户端（CLI、Web UI、手机 App）、所有平台频道都连接到它。这个设计让 OpenClaw 可以同时协调多个设备节点，甚至控制手机摄像头和屏幕录制。

Hermes：以代理为中心

Telegram / Discord / Slack / WhatsApp / Signal
               │
               ▼
┌───────────────────────────────┐
│         Hermes Agent          │
│    （SQLite记忆 + Skills）     │
└──────────────┬────────────────┘
               │
    ┌──────────┼──────────┐
    │          │          │
  本地终端  Docker容器  SSH远程
    │          │          │
  Modal     Daytona  Singularity

Hermes 是一个以代理为核心的平台。不同于 OpenClaw 的 Gateway 中心化，Hermes 强调代理本身的能力——它的「大脑」（记忆、技能、学习系统）是主体，各种接入方式和执行环境是外围。

关键区别：OpenClaw 问的是「谁在和我说话、通过什么渠道？」，Hermes 问的是「我从这次交互中学到了什么？」

三、核心能力对比总览

维度	OpenClaw	Hermes Agent
核心定位	消息平台 AI 网关	自学习自主代理
项目背景	独立创作者（PSPDFKit 创始人）	AI 研究机构（Nous Research）
模型绑定	主要面向 Claude，支持其他	完全模型无关
安装难度	中等（Node.js 22 必须）	低（仅需 Git）
学习机制	手动维护工作区文件	自动生成/改进 Skills
记忆存储	Markdown 文件（MEMORY.md）	SQLite + FTS5 全文检索
平台支持	20+ 个（含 iMessage）	15+ 个
设备节点	✅ iOS、macOS、Android	❌
浏览器控制	✅ Chrome/CDP 集成	❌（需通过 Skills 扩展）
主动心跳	✅ HEARTBEAT.md 机制	✅ 内置 Cron 调度
多代理并行	✅ 多 Agent 配置	✅ Profiles + 子代理
终端后端	本地 + Docker	本地/Docker/SSH/Modal/Daytona/Singularity
Git Worktrees	❌	✅ 原生 `-w` 标志
版本回滚	❌	✅ Shadow Git 快照
安全模型	DM 配对 + 白名单	七层防御体系
技能生态	Skills 目录（手动）	agentskills.io + 自动生成
研究支持	❌	✅ 批量轨迹生成
配置语言	JSON	YAML
运行时	Node.js	Python + Node.js

四、学习与记忆：最核心的差异

这是两者最本质的分歧，也最值得深挖。

OpenClaw 的「声明式记忆」

OpenClaw 的记忆系统建立在工作区文件上，完全由用户维护：

~/.openclaw/workspace/
├── SOUL.md        # 个性定义（我是谁）
├── AGENTS.md      # 操作指令（我该怎么做）
├── HEARTBEAT.md   # 心跳任务（我定期做什么）
├── MEMORY.md      # 持久记忆（我记得什么）
└── skills/        # 技能目录

你告诉 OpenClaw 它是谁、它该做什么、它要记住什么。这是声明式的——高度可控，但需要用户主动维护。

# MEMORY.md 示例
## 用户偏好
- 喜欢简洁的回复
- 工作时间：9:00-18:00

## 重要信息
- 项目 A 截止日期：2026-05-01

优点：完全透明，每条记忆可审查可修改。
局限：你要自己写进去它才记得，无法从对话中自主归纳。

Hermes 的「自适应记忆」

Hermes 的记忆系统是动态的：

~/.hermes/
├── state.db      # SQLite（FTS5 全文索引）
├── sessions/     # JSONL 原始对话记录
└── skills/       # 自动生成/改进的技能

Hermes 不只「记住」——它归纳。每次交互后，它会分析能否提炼出可复用的操作模式，并自动生成或改进对应的 Skill。

行为	OpenClaw	Hermes
记住你的名字	你写进 MEMORY.md	自动从对话归纳
学会你的工作流	你写进 AGENTS.md	自动生成 Skill
搜索历史对话	手动翻 JSONL 文件	`/search` + FTS5 布尔查询
改进已有技能	你手动修改 Skill 文件	代理自主迭代

五、多平台接入：旗鼓相当，细节各异

两者都支持主流消息平台，但各有独特覆盖：

OpenClaw 独有

iMessage：通过 BlueBubbles 或原生 imsg CLI 支持，是苹果用户的独门优势
原生设备节点：macOS 节点（系统通知、摄像头）、iOS 节点（语音唤醒、相机、屏幕录制）、Android 节点（设备命令、语音）
浏览器自动化：管理专属 Chrome/Chromium 实例，通过 CDP 控制网页交互

Hermes 独有

更多消息平台：除常见平台外还有 Matrix 等去中心化协议
统一个性配置：通过 Profile 的 SOUL.md 管理多代理个性

结论：如果你用 iPhone、需要控制浏览器或手机设备——OpenClaw 明显领先。如果你只需要纯消息接入——两者差距不大。

六、主动任务调度：两种实现思路

两者都支持让代理「主动干活」，但实现方式体现了不同的设计哲学。

OpenClaw：HEARTBEAT 机制

OpenClaw 的 HEARTBEAT.md 文件定义代理的心跳行为：

# HEARTBEAT.md
## 每日任务
- 检查未读邮件数量
- 查看今日日程

## 条件任务
- 如果有紧急邮件，立即通知
- 如果磁盘空间不足，发出警告

每隔 N 分钟，代理读取这个文件并决定做什么。优点是任务描述用自然语言，AI 自行判断执行方式。缺点是执行时机不够精确（分钟级间隔，不支持精确 cron 表达式）。

Hermes：内置 Cron 调度

Hermes 使用标准 cron 语法进行精确调度：

hermes schedule "每天早上 9 点分析 GitHub 新 Issue"
hermes schedule list

支持 */5 * * * * 这样的标准 cron 表达式，执行时机精确。代价是任务描述需要更结构化。

结论：需要「大概每隔一段时间做个什么」→ OpenClaw 的 HEARTBEAT 更直觉。需要「精确在某个时刻执行」→ Hermes 的 Cron 更可靠。

七、安全模型：深度 vs 易用

OpenClaw 的安全策略

OpenClaw 的安全围绕两个核心机制：

DM 配对码：未知用户发消息时，收到一个配对码，不被处理直到你审批通过。

白名单：所有平台频道都需要显式配置 allowFrom，openclaw doctor 会检测危险配置。

这套机制简单直观，适合个人使用场景。但它主要防止的是「谁能和代理说话」，对代理执行命令时的安全性关注相对少。

Hermes 的七层防御

Hermes 构建了更系统的安全模型，因为它面向的是「代理在服务器上执行命令」这个更高风险的场景：

层 1: 用户授权      → 白名单 + DM 配对码（与 OpenClaw 类似）
层 2: 危险命令审批  → 人工确认 rm -rf、DROP TABLE 等
层 3: 容器隔离      → Docker/Singularity/Modal 沙箱
层 4: 凭证过滤      → 子进程执行时剥离环境变量
层 5: 上下文扫描    → 检测项目文件中的提示词注入
层 6: 跨会话隔离    → 会话间数据不可互访
层 7: 输入消毒      → 工作目录参数防 Shell 注入

Tirith 集成还会在执行前扫描同形字欺骗（rm 和看起来像 rm 的 Unicode 字符）和管道到解释器模式（curl | bash）。

结论：个人助手场景下 OpenClaw 的安全性足够。需要在服务器上执行生产代码、处理敏感数据时，Hermes 的防御纵深更适合。

八、开发者工作流：Hermes 的主场

对于软件开发者，Hermes 有几个 OpenClaw 目前没有的专属能力：

Git Worktrees 原生集成

# 一个标志，自动隔离分支和工作目录
hermes -w

# 多个代理并行处理不同功能
hermes -w -s feature-auth     # 代理 1：处理认证模块
hermes -w -s feature-payments # 代理 2：处理支付模块

每个 worktree 有独立的 Checkpoint 历史，互不干扰。

Shadow Git 快照与回滚

/rollback            # 查看所有快照
/rollback diff 3     # 预览快照 3 之后的所有变更
/rollback 3          # 恢复 + 撤销对应对话轮次
/rollback 3 src/api.py  # 只恢复单个文件

代理修改文件前自动打快照，完全不影响项目自己的 .git。这意味着你可以让代理大胆尝试，随时后悔。

研究基础设施

Hermes 内置批量轨迹生成支持，可以直接用于训练 Tool-Calling 模型。这是 OpenClaw 没有、也不打算有的功能——因为 OpenClaw 不是为 AI 研究者设计的。

九、安装体验

OpenClaw

# 前置要求：Node.js 22（必须手动安装）
node --version  # 必须 >= 22

# 安装
npm install -g @openclaw/openclaw

# 初始化
openclaw setup

需要先有 Node.js 22，配置需要编辑 JSON 文件，初次上手需要一定时间熟悉工作区文件体系。

Hermes

# 唯一前置要求：Git（通常已安装）
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# 重载 Shell
source ~/.bashrc

# 诊断
hermes doctor

# 选模型，开始聊
hermes model
hermes

安装脚本自动处理 Python 3.11、Node.js 22、ripgrep 等所有依赖，普通用户到「第一次对话」的路径更短。

十、典型使用场景对比

场景 1：「帮我管理邮件和日历」

推荐：OpenClaw

OpenClaw 的 HEARTBEAT 机制专为这类主动式个人助手场景设计。你在 AGENTS.md 里写「每天早上检查未读邮件」，它就真的每天早上去做。配合 Gmail Pub/Sub 触发器和 Google Calendar 集成，这是 OpenClaw 的主场。

场景 2：「帮我同时开发几个功能分支」

推荐：Hermes

hermes -w 一个命令就能为每个功能创建隔离的 worktree + branch + checkpoint 历史。多个代理并行工作，互不干扰，随时可以对某个代理的修改做 diff 和回滚。

场景 3：「我想通过 WhatsApp 控制我的 Mac」

推荐：OpenClaw

OpenClaw 的 macOS 原生节点支持 system.run、系统通知、摄像头访问。加上 WhatsApp 集成，你可以真正从手机控制 Mac 上运行的代理。Hermes 没有设备节点这个概念。

场景 4：「我想要一个真正记住我工作习惯的 AI 助手」

推荐：Hermes

Hermes 的 Skills 自动生成机制会从你的工作模式中归纳出可复用的操作。用它两周后，它会比第一天「更懂你」——不是因为你手动维护了什么文件，而是它自己学的。

场景 5：「我要在服务器上运行一个安全的自动化代理」

推荐：Hermes

七层安全防御 + Docker/Modal 容器隔离 + 危险命令审批机制，Hermes 更适合在生产服务器上无人值守运行。OpenClaw 的安全模型更适合个人设备。

场景 6：「切换不同 LLM 模型测试效果」

推荐：Hermes

Hermes 从设计上就是模型无关的——一条命令 hermes model 切换任意后端，无需改代码。OpenClaw 主要围绕 Claude 设计，虽然也支持其他模型，但体验上不如 Hermes 流畅。

十一、一个不那么明显的区别

OpenClaw 和 Hermes 都说自己支持「Skills」，但含义差异很大：

	OpenClaw Skills	Hermes Skills
创建方式	手动编写 Markdown 文件	代理自动生成 + 手动创建
改进方式	手动编辑	代理自主迭代
来源	官方 + 社区	agentskills.io 生态 + 自动
调用方式	由代理判断何时使用	成为斜杠命令，可直接调用

OpenClaw 的 Skills 更像「工具箱里的工具」——你放进去，代理用。
Hermes 的 Skills 更像「可进化的 SOP」——从使用中提炼，边用边改进。

十二、如何选择？

用两个问题快速定位：

问题 1：你的核心需求是什么？

「随时随地通过手机/聊天 App 指挥 AI 做真实生活任务」→ OpenClaw
「让 AI 在代码仓库/服务器上自主工作，并随时间越用越顺手」→ Hermes

问题 2：你更看重什么？

透明可控（我知道代理记住了什么、会做什么）→ OpenClaw（工作区文件完全可审查）
自动进化（代理自己学，我不用手动维护）→ Hermes（SQLite + 自动 Skills）

快速决策树

你主要用手机聊天 App 发指令吗？
  ├── 是 → 需要控制 iPhone/Mac 设备？
  │         ├── 是 → OpenClaw
  │         └── 否 → 两者都行，OpenClaw 更成熟
  └── 否 → 你主要写代码 / 在服务器上工作？
            ├── 是 → Hermes（worktrees + rollback + 7层安全）
            └── 否 → 需要模型自由切换？
                      ├── 是 → Hermes
                      └── 否 → 两者皆可，看哪个 UI 更合口味

可以同时用吗？

完全可以，而且有合理的分工：

OpenClaw 处理「生活层」任务：邮件、日历、家庭自动化、手机控制
Hermes 处理「工作层」任务：代码开发、服务器自动化、跨项目知识积累

十三、总结

OpenClaw 和 Hermes 代表了开源 AI 代理的两种演化方向：

OpenClaw 是「消息应用入口 + 真实世界执行器」的化身。它的精髓在于把 AI 能力无缝嵌入你已有的沟通习惯，无论是 WhatsApp 还是 iMessage，无论是浏览器操作还是手机摄像头。它的用户是「想让 AI 真正帮我做事的普通人」。

Hermes 是「自我进化的代理操作系统」的化身。它的精髓在于构建一个随时间越用越好的代理——不只执行任务，还从任务中学习。它的用户是「想让 AI 深度融入开发工作流，并在我的基础设施上持久运行的工程师」。

两者没有高下之分，只有场景之别。在你的场景里最顺手的那个，就是最好的那个。

延伸阅读：

项目链接：

Hermes GitHub: NousResearch/hermes-agent
OpenClaw 官网: openclaw.ai