从 Hermes 学 Agent

一本用 Hermes Agent 源码教你怎么造 Agent 的代码级教材。

18 章 · 约 14 万字 · 面向 LLM 应用开发者

本书不是"Agent 入门 30 分钟"。它的目标是让你真正理解一个上线产品级的 Agent 在工程上是如何运转的——从最里层的 9 行 while 循环，到最外层的跨平台部署、模型切换、自我改进、安全沙箱。

教材是开源项目 Hermes Agent， Nous Research 开源的多模型、多平台 Agent 框架。所有章节都基于 Hermes 的真实代码—— 每个抽象都对应到具体文件和行号，每个设计决策都讨论它在解决什么实际问题。并配合 2023–2026 年间 Agent 研究的关键论文与工业实践（ReAct、Voyager、MemGPT、 Anthropic Context Engineering、MCP、Claude Code、SWE-Bench Verified 等）做横向对照。

怎么读这本书

顺序读：从 Part I 到 Part VII，按依赖顺序铺开。约 6–8 小时。
跳读：每章顶部有"前置知识"提示。如果你已经懂基本概念，可以直接跳到 Part III 或 IV。
对照源码读：每章列出涉及的 Hermes 文件路径。强烈建议git clone 源码，打开 IDE 对照。
做习题：每章末尾有 2–4 道思考/实战题。Hard 标记的题目通常需要动手改 Hermes 或写一个 Plugin。

前置知识

读过 OpenAI Function Calling 文档（理解 tools 参数和 tool_calls 返回值）。
中等水平 Python：能看懂 dataclass、ABC、装饰器、async/await。
对 LLM 推理 API 有基本认识：context window、token、streaming。
命令行基本操作。

·完整目录

01 Agent 的前世今生从 AutoGPT 到 Claude Code：四年时间里 Agent 这个词的含义变了什么 ~25 min
02 心智模型 ReAct、CoT、Workflow vs Agent：把概念对齐到代码 ~20 min

03 run_conversation 深度解剖从 13 行精髓到生产级实现：budget、grace call、interrupt、retry ~35 min
04 消息协议与 Tool Calling OpenAI 标准如何成为事实标准；reasoning 字段、Provider 差异、错误恢复 ~25 min
05 System Prompt 与缓存经济三层结构 stable / context / volatile：每次破缓存就是 10 倍成本 ~20 min

06 Tool Registry 与自动发现从写一个工具到 LLM 调用它的全链路；schema、handler、check_fn 四件套 ~30 min
07 Toolset、安全边界与 Hook Capability-based security；为什么 Webhook 不能用 terminal；MCP 集成 ~25 min

08 Skills：程序性记忆从 Voyager 的 skill library 到 Hermes 的 SKILL.md；为何作为 user message 注入 ~25 min
09 Memory 与 FTS5 跨会话搜索 MemGPT、Generative Agents 与 Hermes 的 memory_provider ABC ~25 min
10 Curator：技能库自我维护 active → stale → archived 状态机；inactivity-triggered 后台 review ~15 min

11 CLI / Gateway / Profile 架构 profile 隔离的"导入前"技巧；中心化 Slash Command Registry；Platform Adapter 模式 ~25 min
12 Provider 与 Plugin 生态 30 个 ProviderProfile 怎么处理 Provider quirks；Plugin Hook 体系 ~25 min

13 2024–2026 Agent Frontier Anthropic Context Engineering · MCP · Long-running Harnesses · SWE-Bench · Reasoning Models ~30 min

14 动手实践与设计哲学从零写 Plugin / Skill / MCP server；10 条带走的工程原则；推荐阅读路径 ~30 min

15 后台执行栈 Cron 调度 · Batch Runner · 轨迹压缩 · mini SWE-Bench 评测 ~30 min
16 多 Agent 协作的工程化 delegate_task 深剖 · Kanban SQLite WAL + CAS · 失败熔断 · 文件状态协调 ~35 min
17 IDE 集成与 PTY 桥 ACP · Ink TUI + tui_gateway · Dashboard PTY WebSocket ~30 min
18 MCP 双向架构作为 host(消费) · 作为 server(暴露) · 子进程隔离 · 凭证脱敏 · 注入扫描 ~35 min

致谢与说明

本书并非 Hermes 官方文档。它是一份由代码倒推出来的学习材料，目的是让中文世界的 LLM 应用开发者多一份可以"啃源码"的进阶教材。Hermes 项目本身的官方文档在 hermes-agent.nousresearch.com。

所有引用的研究论文和工业博客均通过原始链接给出。如发现错误或希望补充，欢迎反馈。Hermes 是 MIT 协议开源项目，GitHub 仓库在这里。

从哪开始读

如果你完全没接触过 Agent：从第 1 章顺读。

如果你写过 LangChain / OpenAI Assistants：从第 3 章开始，前两章可以快速扫读。

如果你只想了解前沿：直接看第 13 章。