← 返回项目列表

一句话结论

Hermes Agent 是 Nous Research 做的一个“长期运行、跨平台、有记忆、会沉淀技能的个人/团队 AI Agent 操作层”。它不是只给开发者嵌入代码的 Agent SDK,而是更像一个可以部署在本机、VPS、容器、SSH 远程机、Modal/Daytona 云沙箱里的 AI 助手运行时:用户可以在 CLI、桌面端、Telegram、Discord、Slack、WhatsApp、Signal、Email、企业 IM、API Server、IDE 等入口跟它对话,它在背后调用模型、工具、MCP、终端、文件、浏览器、定时任务和子 Agent 完成工作。

对售前来说,它最值得关注的不是“又一个聊天机器人”,而是三件事:第一,跨渠道统一 Agent 入口;第二,Agent 通过 Memory、Session Search、Skills 形成可持续学习闭环;第三,它对工具、MCP、容器隔离、审批、安全边界、后台任务和定时任务的工程化程度比较高,适合拿来讲“企业级 Agent 从 Demo 走向常驻运行”的落地形态。

项目能做什么

1. 跨终端与跨消息平台的 AI Agent

Hermes 有两类主入口:一类是本地/远程工作入口,包括 CLI、TUI、桌面端、API Server、IDE/ACP 适配器;另一类是消息网关,包括 Telegram、Discord、Slack、WhatsApp、Signal、Email、Home Assistant、Mattermost、Matrix、钉钉、飞书/飞书国际版、企业微信、微信、QQ、Teams、LINE、ntfy、Raft、IRC 等。

这意味着用户不是必须打开某个 Web 应用才能使用 Agent,而是可以从自己已有的工作入口发起任务。例如:

  • 在 Telegram 中发一句“帮我每天早上 8 点汇总竞品新闻”。
  • 在 Slack 中让它查某个服务状态、整理日志、发日报。
  • 在 CLI 中让它改代码、跑测试、读本地文件。
  • 在 IDE 中把 Hermes 作为编辑器 Agent 使用。
  • 在 API Server 或 Webhook 里把它接入企业自动化流程。

售前表达上,可以把它理解为“一个 Agent,多端入口,一个后台网关统一承接任务”。

2. 多模型与多服务商路由

Hermes 支持 Nous Portal、OpenRouter、OpenAI、自定义 OpenAI-compatible endpoint,以及文档中提到的多种模型提供商。用户可以通过 hermes model/model provider:model 切换模型,而不是在业务代码里重写调用逻辑。

这对客户的价值在于:

  • 避免被单一模型厂商绑定。
  • 可以按任务切模型,例如编码、长文本、低成本后台任务使用不同模型。
  • 可以接企业已有的模型网关或私有部署接口。
  • Nous Portal 还把模型、Web Search、图像生成、TTS、云浏览器等工具能力做成统一订阅入口,降低 API Key 配置成本。

3. 工具系统:从对话到真正执行

官方文档显示 Hermes 内置工具覆盖 Web 搜索、网页抽取、终端执行、文件读写、patch、浏览器自动化、视觉分析、图像生成、TTS、TODO、记忆、会话搜索、定时任务、子 Agent 委派、Home Assistant、MCP 外部工具等。架构文档提到内部是中心化 Tool Registry,约 70+ 工具、约 28 个 toolsets。

典型能力包括:

  • terminal:执行命令,支持后台进程。
  • read_file / patch:读取和修改文件。
  • web_search / web_extract:搜索和抽取网页内容。
  • browser_navigate / browser_snapshot / browser_vision:浏览器自动化。
  • delegate_task:委派子 Agent 并行处理任务。
  • cronjob:创建、运行、暂停、恢复定时任务。
  • memory / session_search:保存长期偏好与检索历史会话。
  • MCP 工具:接 GitHub、数据库、内部 API、文件系统、第三方 SaaS 等外部工具服务器。

售前要点:Hermes 不是“只会回复”,而是具备任务执行链路。它的关键价值在于把 LLM、工具、执行环境和消息入口串成一个可长期运行的 Agent Runtime。

4. 记忆与技能闭环

Hermes 的 README 把自己定位为 “self-improving AI agent”。它的学习闭环主要由三部分组成:

模块作用售前解释
Persistent Memory保存用户偏好、环境事实、项目约定等让 Agent 逐步理解用户和团队习惯
Session Search基于 SQLite + FTS5 检索历史会话让 Agent 能回忆过去讨论过的具体内容
Skills System把重复流程沉淀为可复用技能把一次性的经验变成下次可调用的 SOP

Memory 文档显示,Hermes 默认用 MEMORY.md 保存 Agent 自身工作笔记,用 USER.md 保存用户画像,且有字符上限,避免记忆无限膨胀。Session Search 则保存所有 CLI 和消息会话,可以按需搜索历史记录。Skills 则是按需加载的知识文档,兼容 agentskills.io 开放标准,并支持 /learn 从文档、目录、URL 或刚刚完成的工作流中生成新的技能。

这点对企业客户很容易形成价值故事:传统 Chatbot 每次都要重新解释上下文,而 Hermes 希望把“客户的偏好、组织流程、项目约束、常见修复方法”逐步沉淀下来,形成可复用知识资产。

5. MCP 集成与可扩展工具生态

Hermes 支持作为 MCP Client 连接 stdio 或 HTTP MCP Server,也可以反过来以 hermes mcp serve 形式作为 MCP Server,把它的消息会话能力暴露给 Claude Code、Cursor、Codex 等 MCP Client。

MCP 对售前的意义很大,因为它让 Hermes 不必为每个企业系统单独写原生工具。企业已有的 GitHub、Linear、Stripe、数据库、内部 API、文件系统、知识库等,只要通过 MCP 暴露,就能被 Hermes 自动发现并注册为工具。Hermes 还支持 per-server 工具过滤,例如只暴露 list_issuescreate_issue,屏蔽删除、退款等高风险动作。

适合的客户话术:

如果客户已经在建设 MCP 工具层,Hermes 可以作为一个多渠道 Agent 入口,把 MCP 工具带到 CLI、IM、定时任务、桌面端和自动化流程里。

6. 后台任务、子 Agent 与定时自动化

Hermes 支持后台任务和子 Agent。最新 Release v0.17.0 中强调了 delegate_task(background=true):主 Agent 可以把长任务派给后台子 Agent,并继续处理当前对话,任务结束后结果再回到会话。

消息网关也支持 /background ,例如在聊天里启动“检查所有服务器健康状态并汇报异常”,主聊天不中断。Cron 则把任务变成自然语言定时自动化,比如日报、夜间备份、周审计、竞品监控、会议纪要生成等。

这类能力适合展示“从问答助手到自动化员工”的过渡。

官方架构示意

项目文档中的架构图是文本图,核心结构如下:

Entry Points
  CLI / Gateway / ACP / Batch Runner / API Server / Python Library
        |
        v
AIAgent (run_agent.py)
  Prompt Builder
  Provider Resolution
  Tool Dispatch
  Compression & Caching
  Tool Registry
        |
        +--> Session Storage: SQLite + FTS5
        |
        +--> Tool Backends:
             Terminal: local / Docker / SSH / Singularity / Modal / Daytona
             Browser
             Web
             MCP
             File / Vision / Media

从这个图可以看出,Hermes 的设计是“平台入口和 Agent Core 分离”:CLI、消息网关、Cron、ACP、API Server 等入口最终都会进入同一个 AIAgent 核心,再由核心做 Prompt 构造、模型路由、工具调度、会话持久化和执行环境选择。这种架构比“每个平台一个 bot”更利于统一配置和统一治理。

适用场景

场景一:研发团队的常驻编码与运维 Agent

适合客户:研发团队、平台工程团队、DevOps/SRE 团队、AI 原生创业团队。

可以做:

  • 在 CLI/桌面端中让 Agent 读代码、改代码、跑测试。
  • 在 Slack/飞书/企业微信中触发检查、部署、日志分析、服务健康报告。
  • 用 Cron 定时跑每日构建报告、依赖风险扫描、Issue 汇总。
  • 通过 MCP 接 GitHub、Linear、Jira、内部监控系统。

售前价值:把研发和运维中的碎片化操作沉淀成自然语言可调度流程,减少“人肉查状态、人肉汇总、人肉重复脚本”。

场景二:企业内部多渠道 AI 助手网关

适合客户:已经有多个 IM 渠道、跨地区团队、希望把 AI 能力放到员工日常入口中的企业。

可以做:

  • 一个 Agent 同时接入 Slack、Teams、飞书、企业微信、Email 等。
  • 对不同平台设定不同 Toolset 和权限。
  • 通过 allowlist、DM pairing 控制谁能访问。
  • 把自动化结果投递回用户所在渠道。

售前价值:不用强迫员工切换到新平台,AI 能力直接进入已有协作环境。

场景三:个人或小团队的“长期私人 AI 助手”

适合客户:创始人、顾问、研究员、售前、技术负责人。

可以做:

  • 记住用户偏好和工作方式。
  • 搜索过往会话,找回之前讨论过的项目、客户、方案。
  • 把常用流程学成 Skills。
  • 在 VPS 上常驻运行,从手机消息软件远程调用。

售前价值:强调“AI 助手不再只是一页聊天窗口,而是一个长期跟随用户工作的个人工作层”。

场景四:Agent 工具生态与 MCP 落地试验田

适合客户:正在建设内部 Agent 平台、MCP Server、统一工具网关的团队。

可以做:

  • 通过 Hermes 验证 MCP 工具暴露是否合理。
  • 测试不同模型对工具调用的稳定性。
  • 比较本地、Docker、SSH、Modal、Daytona 等执行后端。
  • 用轨迹生成和压缩能力为工具调用模型训练准备数据。

售前价值:Hermes 可以作为 Agent 工具层的“体验终端”和“验证平台”,帮助客户更快看见 MCP/工具化的业务效果。

不适合的场景

Hermes 并不适合所有项目。以下场景要谨慎推荐:

  • 只需要在产品里嵌入一个轻量聊天组件,Hermes 可能过重。
  • 强监管环境要求明确的企业级 RBAC、审计、审批流、租户隔离,Hermes 当前更偏单租户/个人 Agent,需要额外封装。
  • 不允许 Agent 执行命令、读写文件或调用外部工具的场景,会削弱 Hermes 最大价值。
  • 客户希望采购开箱即用的商业 SaaS,而不是部署和维护一个开源 Agent Runtime。
  • 对第三方 Skills、Plugins、MCP Server 没有审查机制的团队,不宜直接开放高权限工具。

如何使用

快速安装

Linux、macOS、WSL2、Termux:

curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
source ~/.bashrc
hermes

Windows PowerShell:

iex (irm https://hermes-agent.nousresearch.com/install.ps1)

常用命令:

hermes              # 启动交互式 CLI
hermes model        # 选择模型提供商和模型
hermes tools        # 配置启用工具
hermes setup        # 完整设置向导
hermes gateway      # 启动消息网关
hermes update       # 更新 Hermes
hermes doctor       # 诊断环境问题

启动消息网关

hermes gateway setup
hermes gateway start

消息平台中常用命令:

/new 或 /reset        开启新会话
/model               切换模型
/skills              查看或调用技能
/background          启动后台任务
/stop                中断当前任务
/reload-mcp          重新加载 MCP 工具
/usage               查看用量

配置 MCP

最小 stdio MCP 示例:

mcp_servers:
  filesystem:
    command: "npx"
    args: ["-y", "@modelcontextprotocol/server-filesystem", "/home/user/projects"]

最小 HTTP MCP 示例:

mcp_servers:
  company_api:
    url: "https://mcp.internal.example.com/mcp"
    headers:
      Authorization: "Bearer ***"

工具过滤示例:

mcp_servers:
  github:
    command: "npx"
    args: ["-y", "@modelcontextprotocol/server-github"]
    env:
      GITHUB_PERSONAL_ACCESS_TOKEN: "***"
    tools:
      include: [list_issues, create_issue, update_issue]
      prompts: false
      resources: false

安全与部署要点

Hermes 的安全文档讲得比较坦诚:它把“操作系统级隔离”视为真正的安全边界,审批门、命令扫描、输出脱敏、Skills Guard 等都属于启发式防护,不应被当成强隔离。

售前必须提醒客户:

  • 默认本地后端会在宿主机执行命令,不适合接入不受控输入源。
  • 生产或多人场景建议使用 Docker、Modal、Daytona、SSH 远程机等隔离后端。
  • 消息网关必须配置 allowlist 或 DM pairing,不要开放给所有用户。
  • MCP Server、Skills、Plugins 都可能带来供应链风险,需要审查来源和暴露工具。
  • 对敏感系统应采用工具白名单,优先只开放读操作或低风险操作。
  • 高安全场景应考虑整个 Agent 进程级别的容器/沙箱包装,而不是只隔离 terminal。

官方推荐的生产网关 Checklist 包括:设置明确 allowlist、使用容器后端、限制资源、妥善保存密钥、开启 DM pairing、审查命令 allowlist、限定工作目录、非 root 运行、监控日志、定期更新。

售前讲解框架

客户痛点

  • AI 助手目前停留在聊天窗口,不能进入真实工作流。
  • 每个渠道都有单独机器人,知识和会话割裂。
  • Agent Demo 很容易,长期运行、权限、安全、记忆、工具治理很难。
  • 内部工具很多,但缺少一个自然语言统一入口。
  • 员工重复性工作多,例如查资料、整理报告、跑脚本、巡检、汇总、发通知。

Hermes 的价值主张

  • 多入口:CLI、桌面端、IM、Email、API、IDE 都能接入。
  • 多模型:支持多服务商和自定义 endpoint,降低厂商锁定。
  • 多工具:内置 Web、终端、文件、浏览器、媒体、定时任务、子 Agent、MCP。
  • 可学习:Memory、Session Search、Skills 让它逐渐沉淀用户和团队流程。
  • 可部署:本机、VPS、Docker、SSH、Modal、Daytona、Singularity 都能跑。
  • 可治理:危险命令审批、网关 allowlist、MCP 工具过滤、容器隔离、SSRF 防护、上下文注入扫描等。

与一般 Agent 框架的差异

对比维度一般 Agent SDKHermes Agent
主要定位给开发者写代码集成 Agent给用户/团队运行一个常驻 Agent
入口通常是 API 或应用内组件CLI、桌面、IM、Email、API、IDE
长期记忆需要自己做内置 Memory 与 Session Search
工作流沉淀需要自己设计Skills 系统与 /learn
工具执行依赖开发者接入内置工具与 MCP
部署形态通常服务端应用本地、容器、远程、云沙箱、网关
售前卖点开发灵活性常驻运行与真实工作流落地

PoC 建议

PoC 目标一:企业 IM 中的研发助理

验证内容:

  • 接入 Slack、飞书或企业微信。
  • 配置 allowlist,只允许测试用户。
  • 接一个 GitHub 或内部 Issue MCP。
  • 让 Hermes 完成“查 Issue、总结 PR、生成日报、创建待办”的闭环。
  • 开启 Docker 后端,验证命令执行隔离。

成功标准:

  • 用户能在 IM 中发起任务并收到结果。
  • Agent 能调用至少一个外部工具。
  • 危险命令会触发审批或被隔离。
  • 一条定时日报能自动投递到指定频道。

PoC 目标二:售前研究与资料整理助手

验证内容:

  • 使用 Web Search / Web Extract 搜索竞品和开源项目。
  • 用 Skills 沉淀固定分析模板。
  • 用 Memory 记录售前偏好,例如输出结构、客户行业、常用目录。
  • 用 Cron 每周自动生成竞品监控。

成功标准:

  • 同一个项目二次分析时,输出风格和结构更稳定。
  • 可以搜索历史会话找回之前做过的项目分析。
  • 能把一次流程学习成可复用 Skill。

PoC 目标三:MCP 工具网关验证

验证内容:

  • 接入一个只读数据库 MCP 或内部 API MCP。
  • 设置工具 include/exclude,屏蔽写操作。
  • 在 CLI 与 IM 中分别调用同一 MCP 能力。
  • 观察工具调用日志和失败处理。

成功标准:

  • Agent 能在自然语言下正确选择 MCP 工具。
  • 权限过滤生效。
  • 同一能力可以跨入口复用。

主要风险与问题清单

  • 开源项目体量很大,功能面广,部署和维护需要技术团队投入。
  • GitHub API 当前显示 Issue 数量很高,售前展示前建议核实项目 issue 质量和维护节奏。
  • 多平台网关意味着凭证和权限面扩大,客户需要明确谁能访问、能调用哪些工具。
  • Skills 和 Plugins 的安全边界依赖人工审查,不适合无治理地安装社区扩展。
  • 对强合规客户,需要补充企业级审计、RBAC、审批流程、日志留存、数据隔离等方案。
  • 如果客户只想做单一业务应用里的 Agent,Hermes 可能不是最轻的选择。

可用于售前的客户提问

  • 你们希望员工从哪里使用 AI?Web、IM、IDE、CLI,还是多个入口都要?
  • 你们的 AI 助手是否需要调用内部系统、执行脚本、读写文件?
  • 是否已有 MCP Server 或内部工具 API?
  • 是否需要 Agent 记住团队流程、客户偏好、项目约定?
  • 是否有定时任务场景,例如日报、周报、巡检、竞品监控?
  • Agent 会接触哪些不可信输入源,例如公网网页、外部邮件、群聊消息?
  • 对命令执行、文件访问、凭证管理有什么安全要求?
  • 是偏个人效率工具、研发助手,还是企业级统一 Agent 网关?

我的售前判断

Hermes Agent 适合放在“Agent 落地从聊天走向执行”的方案里讲。它不是最轻量的 Agent SDK,但它把一个真实可运行 Agent 需要的很多工程问题都摆在台面上:多端入口、工具系统、记忆、技能、历史检索、后台任务、Cron、MCP、模型路由、容器/远程执行、安全审批、网关授权、部署服务化。

如果客户已经明确要做“企业内部 AI 助手入口”“研发/运维 Agent”“多渠道自动化助手”“MCP 工具生态验证”,Hermes 是很好的参考项目和 PoC 候选。如果客户只是想做产品内的一个聊天框,或者需要严格商业化的多租户后台管理,Hermes 更适合作为架构参考,而不是直接拿来交付。