从 Hermes 学 Agent
一本用 Hermes Agent 源码教你怎么造 Agent 的代码级教材。
本书不是"Agent 入门 30 分钟"。它的目标是让你真正理解一个上线产品级的 Agent 在工程上是如何运转的——从最里层的 9 行 while 循环,到最外层的 跨平台部署、模型切换、自我改进、安全沙箱。
教材是开源项目 Hermes Agent, Nous Research 开源的多模型、多平台 Agent 框架。所有章节都基于 Hermes 的真实代码—— 每个抽象都对应到具体文件和行号,每个设计决策都讨论它在解决什么实际问题。 并配合 2023–2026 年间 Agent 研究的关键论文与工业实践(ReAct、Voyager、MemGPT、 Anthropic Context Engineering、MCP、Claude Code、SWE-Bench Verified 等)做横向对照。
怎么读这本书
- 顺序读:从 Part I 到 Part VII,按依赖顺序铺开。约 6–8 小时。
- 跳读:每章顶部有"前置知识"提示。如果你已经懂基本概念,可以直接跳到 Part III 或 IV。
- 对照源码读:每章列出涉及的 Hermes 文件路径。强烈建议
git clone源码,打开 IDE 对照。 - 做习题:每章末尾有 2–4 道思考/实战题。Hard 标记的题目通常需要动手改 Hermes 或写一个 Plugin。
前置知识
- 读过 OpenAI Function Calling 文档(理解
tools参数和tool_calls返回值)。 - 中等水平 Python:能看懂 dataclass、ABC、装饰器、async/await。
- 对 LLM 推理 API 有基本认识:context window、token、streaming。
- 命令行基本操作。
·完整目录
- 01 Agent 的前世今生 从 AutoGPT 到 Claude Code:四年时间里 Agent 这个词的含义变了什么 ~25 min
- 02 心智模型 ReAct、CoT、Workflow vs Agent:把概念对齐到代码 ~20 min
- 03 run_conversation 深度解剖 从 13 行精髓到生产级实现:budget、grace call、interrupt、retry ~35 min
- 04 消息协议与 Tool Calling OpenAI 标准如何成为事实标准;reasoning 字段、Provider 差异、错误恢复 ~25 min
- 05 System Prompt 与缓存经济 三层结构 stable / context / volatile:每次破缓存就是 10 倍成本 ~20 min
- 06 Tool Registry 与自动发现 从写一个工具到 LLM 调用它的全链路;schema、handler、check_fn 四件套 ~30 min
- 07 Toolset、安全边界与 Hook Capability-based security;为什么 Webhook 不能用 terminal;MCP 集成 ~25 min
- 08 Skills:程序性记忆 从 Voyager 的 skill library 到 Hermes 的 SKILL.md;为何作为 user message 注入 ~25 min
- 09 Memory 与 FTS5 跨会话搜索 MemGPT、Generative Agents 与 Hermes 的 memory_provider ABC ~25 min
- 10 Curator:技能库自我维护 active → stale → archived 状态机;inactivity-triggered 后台 review ~15 min
- 11 CLI / Gateway / Profile 架构 profile 隔离的"导入前"技巧;中心化 Slash Command Registry;Platform Adapter 模式 ~25 min
- 12 Provider 与 Plugin 生态 30 个 ProviderProfile 怎么处理 Provider quirks;Plugin Hook 体系 ~25 min
- 13 2024–2026 Agent Frontier Anthropic Context Engineering · MCP · Long-running Harnesses · SWE-Bench · Reasoning Models ~30 min
- 14 动手实践与设计哲学 从零写 Plugin / Skill;7 条带走的工程原则;推荐阅读路径 ~30 min
致谢与说明
本书并非 Hermes 官方文档。它是一份由代码倒推出来的学习材料,目的是让中文世界的 LLM 应用开发者多一份可以"啃源码"的进阶教材。Hermes 项目本身的官方文档在 hermes-agent.nousresearch.com。
所有引用的研究论文和工业博客均通过原始链接给出。如发现错误或希望补充, 欢迎反馈。Hermes 是 MIT 协议开源项目,GitHub 仓库在这里。