研究来源:@akshay_pachaar 推文 + Hermes Agent 官方文档 + 实际使用观察 研究时间:2026-06-26
一句话总结
/learn 让 AI Agent 从”被动积累经验”变成”主动学习材料”——把任何文档、代码库、操作流程,提前变成可复用的技能(Skill),不用等到踩了坑才记住。
背景:Agent 学习的两种模式
模式一:被动学习(自动技能生成)
Hermes Agent 本来就有学习循环。当 agent 完成一个复杂任务、或者从死胡同里恢复后,后台会悄悄把这次经验捕获下来,存成一个 SKILL.md 文件。
- 触发条件:只在任务完成后触发
- 学习来源:agent 自己走过的路
- 缺点:每次学习都需要一次”痛苦的实战”,lesson costs you a painful session
模式二:主动学习(/learn 命令)
2026年6月,Nous Research 发布了 /learn 命令。这是”刻意学习”版本:
- 触发条件:用户主动调用
- 学习来源:agent 从未接触过的材料——别人的文档、没读过的 repo、粘贴进来的操作笔记
- 核心价值:把学习前置,不用等踩坑
/learn 的四种输入源
| 输入类型 | 示例 | 适用场景 |
|---|---|---|
| 本地目录 | /learn ./my-api-client |
把内部 SDK 变成技能 |
| 文档 URL | /learn https://docs.example.com/api |
学习第三方 API 文档 |
| 对话流程 | 刚走完一遍流程后 /learn |
捕获一次性操作变成可复用流程 |
| 纯文本笔记 | 粘贴操作步骤后 /learn |
把人写的 SOP 变成 agent 技能 |
可以指定学习重点:/learn https://docs.example.com/api,然后告诉它”只关注认证和分页”,生成的技能就只覆盖这些部分。
工作机制(技术解析)
/learn 的设计哲学:不是一个独立的”学习引擎”,而是一个普通的 agent 对话轮次。
用户输入 /learn → 构建"技能编写 prompt" → 交给 agent 作为正常对话 →
agent 用现有工具收集材料 → 编写 SKILL.md → 实时测试技能 → 保存
这意味着: 1. 零部署成本——CLI、Telegram、飞书、Discord 所有平台都能用,因为只是一个对话 2. 用同一套工具——agent 用它已有的工具(读文件、抓网页、跑命令)来收集材料 3. 用同一套技能系统——写出来的 SKILL.md 走标准的 skill_manage 工具保存
SKILL.md 的结构
每个技能是一个 Markdown 文件,包含:
---
name: my-api-client
description: 调用内部 REST API 的认证和分页处理
triggers:
- 需要调用内部 API
- 处理 API 认证
---
# 具体操作步骤
1. 先获取 token...
2. 分页参数格式...
# 验证步骤
- 确认 token 过期时间
- 测试分页边界
质量保障
每个技能在保存前会实时测试——agent 会实际跑一遍验证流程是否 work。这意味着保存的技能已经是经过验证的 draft,不是纸上谈兵。
Memory vs Skills:两种记忆的区别
这是理解 /learn 的关键概念:
| 维度 | Memory(记忆) | Skill(技能) |
|---|---|---|
| 记住什么 | 事实——“jovi 用 Windows”、“API key 在 .env” | 方法——“怎么部署服务器”、“怎么筛选新闻” |
| 格式 | 键值对,注入每个对话 | Markdown 文档,按需加载 |
| 触发 | 始终在场 | 匹配到 trigger 条件才加载 |
| 积累方式 | 对话中自动捕获 | /learn 主动创建 + 完成任务后自动创建 |
Memory remembers facts. Skills remember how to do the work.
/learn 是通往第二种记忆的前门——让你可以刻意填充技能库,而不是等 agent 从每次痛苦中慢慢学。
实际应用场景
1. 内部 API onboarding
一个私有 API,以前每次新 session 都要重新读文档。/learn 一次,变成技能,整个团队用 slash 命令调用。
2. 代码库 → Playbook
指向一个代码仓库,/learn 会捕获代码模式和开发流程。下一个 session 直接从”怎么跟这个 repo 工作”开始,不用从零摸索。
3. 一次性操作变成可复用流程
部署 staging 服务器,手动走一遍,/learn 把过程变成技能。下次——甚至换人——直接调用技能就行。
4. 文档→技能的转化
把别人的 runbook、操作手册 paste 进来,/learn 自动转化为结构化技能文件,带验证步骤。
与我们实际使用的关系
我们的 Hermes Agent(小蚊+小虾)已经在大量使用技能系统:
已有的技能积累
cron-delivery-troubleshooting——cron 推送故障排查的完整流程(昨晚刚用过)jovi-writing-style——jovi 的公众号写作风格规范(8层分层架构)aiposter-news-sync——新闻采集筛选标准(刚才用到的筛选偏好)multi-bot-collaboration——双 Bot 协作协议
这些技能大部分是被动学习模式——我们在实际工作中踩了坑、发现了问题、找到了解法,然后固化成技能。
/learn 能给我们带来什么
- 把 jovi 的操作习惯快速技能化——比如 jovi 的 NAS 文件操作规则,不用等犯错再学,直接
/learn把规范文档变成技能 - 新工具快速上手——接入新的 API 或工具时,用
/learn预读文档生成技能 - 跨 Bot 知识同步——小虾子上的经验可以
/learn成技能同步到 NAS,小蚊直接获取
竞品对比
| 特性 | Hermes Agent | Claude Code | Codex (OpenAI) |
|---|---|---|---|
| 被动技能生成 | ✅ 完成任务后自动 | ❌ | ❌ |
| 主动技能学习 (/learn) | ✅ 从任何来源 | ❌ | ❌ |
| 技能可验证 | ✅ 实时测试 | ❌ | ❌ |
| 跨平台使用技能 | ✅ CLI+消息平台 | ❌ 仅 IDE | ❌ 仅 IDE |
| 技能自进化 (GEPA) | ✅ DSPy+GEPA 优化 | ❌ | ❌ |
Hermes Agent 的技能学习循环是目前 AI Agent 领域最完整的:被动学习 + 主动学习 + 自动进化 + 跨平台。
核心洞察
- /learn 的本质是”知识前置”——不是让 AI 更聪明,而是让 AI 在做事情之前就准备好怎么做
- 技能 ≠ 记忆——记忆是”知道什么”,技能是”知道怎么做”。/learn 填充的是后者
- 最大的范式变化:从”每次 session 从零开始”到”技能跨 session 积累复用”——这才是 AI Agent 真正的护城河
- 可验证性是关键差异化——不是写完就存,是跑一遍确认能用才存
原文金句
“agents usually learn the hard way. they struggle through a task live, fail a few times, find the path that works, and only then write down what they figured out.”
“memory remembers facts. skills remember how to do the work.”
“the best builders stopped re-teaching the agent the same procedure every session. they hand it the source once and keep the skill.”
研究报告 by 小蚊 🦟 | 2026-06-26