Hermes自进化框架:让AI Agent自动优化提示词的开源方案

Hermes Agent通过DSPy和GEPA算法实现AI智能体提示词的自动进化优化
Hermes Agent是NousResearch开源的AI智能体框架,核心创新在于内置学习闭环,能从执行经验中自动提取技能并持续优化。它结合Stanford的DSPy声明式编程框架和GEPA遗传帕雷托进化算法,通过深度分析执行轨迹实现针对性提示词变异,同时以帕雷托前沿平衡多目标。系统设有五层安全保护机制确保进化可控,不需GPU,单次优化成本仅2-10美元。
什么是Hermes Agent?
一个AI Agent能自己修改自己的提示词,自动优化自己的技能——这听起来像科幻,但NousResearch开源的Hermes Agent已经把它变成了现实。这个项目在GitHub上获得了超过10万颗星,采用MIT协议完全开源,是目前开源社区中最完整的Agent自进化方案之一。
Hermes Agent与普通Agent的核心区别在于:它内置了学习闭环。每次执行任务后,系统会自动从成功和失败案例中提取经验,生成技能文件。下次遇到类似任务时,直接调用已有经验,而不是从零开始。

打个比方,普通Agent像照着手册办事的实习生,而Hermes像一个会自己写笔记、复盘错误、不断更新工作方法的老手。它支持模型无关架构(Model-Agnostic Architecture)——这是近年来Agent框架设计的重要趋势,通过统一的抽象接口层将业务逻辑与底层模型解耦。大模型市场竞争激烈,GPT-4、Claude 3.5、Gemini等模型能力差距在快速缩小,锁定单一供应商风险极高;不同任务对模型的需求也差异显著,代码生成可能偏好DeepSeek-Coder,多语言任务可能偏好Qwen。Hermes通过LiteLLM等统一接口层实现这一特性,底层可以接入GPT、Claude、LLaMA等任何API,支持自托管部署,数据不外泄,并允许将简单子任务路由到更便宜的小模型以控制成本。当前版本为0.14,仍在快速迭代中。
自进化背后的两大核心技术
Hermes Agent Self Evolution仓库做了一件关键的事:让Agent的技能不再依赖人工编写,而是自动进化。这背后是两个技术的精妙组合。
DSPy:把提示词变成可编程对象
DSPy是Stanford开发的声明式编程框架,全称为Declarative Self-improving Language Programs,于2023年由斯坦福大学NLP实验室发布。核心理念是把提示词当成可编程对象,而非手工调参的文本。
传统提示词工程的核心痛点在于:提示词是脆弱的自然语言字符串,换一个模型版本或任务场景就可能完全失效,且优化过程高度依赖人类直觉。DSPy通过引入"签名(Signature)"和"模块(Module)"的抽象层,将提示词工程转化为一个可优化的问题。开发者只需定义输入、输出和度量标准,DSPy内置的优化器(如BootstrapFewShot、MIPROv2)会自动搜索最优的few-shot示例组合和指令措辞——整个过程类似于神经网络的反向传播,只不过优化的对象从权重变成了提示词本身。这从根本上改变了提示词工程的范式:从"人凭感觉改"变成"系统自动搜索"。
GEPA:遗传帕雷托提示词进化算法
GEPA(Genetic Pareto Prompt Evolution)是一篇ICLR 2026 Oral论文提出的方法,与传统提示词优化有本质区别。

遗传算法(Genetic Algorithm)是模拟生物进化过程的启发式搜索方法,包含选择、交叉、变异三个核心算子。将遗传算法应用于提示词优化并非GEPA首创——EvoPrompt(2023)等工作已验证了这一方向的可行性。但早期方法的变异策略较为随机,类似于在提示词上做"盲目的文字替换"。GEPA的关键创新在于将变异操作与Agent执行轨迹(Execution Trace)深度绑定。
执行轨迹是Agent系统中记录完整推理和行动过程的结构化日志,通常包含:思维链推理步骤、工具调用请求与返回结果、中间状态变量以及最终输出。在ReAct(Reasoning + Acting)框架普及后,执行轨迹成为理解Agent行为的核心诊断工具。传统的提示词优化只关注最终输出的对错,相当于只看考试分数而不看答题过程;GEPA对轨迹的深度分析则类似于"逐题批改"——能精确定位Agent在第几步开始走偏、哪个工具调用返回了误导性信息、推理链在哪个环节出现了逻辑跳跃。
GEPA的独特之处体现在三个方面:
- 深度读取执行轨迹:不只看成功/失败的标签,而是分析Agent完整的执行过程——哪一步走了弯路、工具调用返回了什么、推理链在哪里断裂。
- 针对性修改:根据轨迹中的具体失败点提出修改建议,而非随机变异,使得每一代变异都具有明确的改进意图,大幅提升搜索效率。
- 多目标平衡优化:引入帕雷托最优(Pareto Optimality)的概念——这一概念源自经济学家维尔弗雷多·帕雷托,描述"无法在不损害任何一个目标的前提下继续改善某个目标"的状态。在AI系统中,提高准确率通常意味着更多Token消耗,而压缩Token又可能牺牲推理质量。GEPA维护一组在不同目标权衡下各有优势的候选提示词(帕雷托前沿),同时考量准确率、Token消耗、延迟等多个指标,让开发者根据实际部署约束灵活选择,而非被迫接受单一的"最优解"。
自进化的完整工作流程
整个进化流程是一个持续循环:现有技能 → 跑测试集 → 收集执行轨迹 → GEPA分析失败模式 → 生成变异版本 → 跑分对比 → 保留更优版本 → 进入下一轮。
实际操作分两步
第一步:准备评估数据。 有两种来源可选:
- Synthetic:由LLM自动生成的测试用例,适合快速起步验证流程
- Session:从Hermes实际运行日志中提取的真实任务-结果对,质量更高
建议先用Synthetic跑通流程,再切到Session做精细优化。
第二步:运行进化命令。 执行 python -m evolution_skills evolve_skill,指定技能名称、迭代轮数和评估数据来源即可。每次迭代自动完成跑分、分析、变异、对比和保留的全流程。

五个递进的发展阶段
仓库规划了清晰的演进路线:
| 阶段 | 优化目标 | 状态 |
|---|---|---|
| 第一阶段 | 技能文件 | ✅ 已完成 |
| 第二阶段 | 工具描述 | 开发中 |
| 第三阶段 | 系统提示词 | 开发中 |
| 第四阶段 | 工具代码 | 开发中 |
| 第五阶段 | 持续自动循环 | 开发中 |
其中第四阶段最为激进——Agent不只修改自己的提示词,还能改写自己的工具代码,这意味着真正意义上的自我进化。
五层安全保护机制
自动进化最大的风险是"改着改着改坏了"。Hermes为此设计了五层保护机制:
- 测试套件全通过才保留变异结果
- 提示词大小限制,防止无限膨胀
- 缓存机制保护,不能破坏已有的缓存逻辑
- 核心意图锁定,不能改变技能的根本目标
- 人类审查关卡,进化结果以PR形式提交,人工审查后才合并

这套机制确保了自进化过程既有自主性,又保持可控性。值得注意的是,"核心意图锁定"这一层保护在哲学上对应了AI对齐领域的"目标稳定性"问题——防止系统在优化过程中发生目标漂移(Goal Drift),即系统为了在评估指标上得高分而扭曲原始任务意图。
成本与实用性分析
在成本方面,Hermes的自进化方案相当友好:
- 不需要GPU,所有进化操作通过API调用完成
- 每次优化运行约2-10美元,取决于迭代轮数和评估规模
- 成本优化策略:用小模型跑进化过程本身,用目标模型跑评估,整体成本可控
这一成本结构之所以可行,正是得益于模型无关架构的灵活路由能力——进化迭代本身是计算密集型但对模型能力要求相对较低的任务,可以交给更廉价的模型处理,而最终评估则使用目标部署模型,确保优化结果的真实有效性。
本质:达尔文进化论的工程实现
Hermes的自进化本质上就是达尔文进化论的工程化实现:
- 变异:靠GEPA读取执行轨迹,提出针对性修改
- 选择:靠测试集跑分淘汰差解
- 遗传:好的变异成为下一代的基础
每个技能独立进化,互不干扰。与传统提示词工程相比,传统方式是人坐在那里反复修改、看效果、再改,依据往往是直觉和经验。Hermes把这个过程完全自动化了,而且修改的依据不是感觉,而是真实的执行轨迹数据。
这一范式转变的深远意义在于:它将提示词工程从一门依赖个人经验的"手艺",转变为一个可重复、可度量、可自动化的工程流程。随着第四阶段(工具代码自进化)和第五阶段(持续自动循环)的落地,Agent系统有望在无人干预的情况下持续提升自身能力边界。
对于正在做Agent开发的团队来说,Hermes提供了一条从"手工调优"到"自动进化"的清晰路径。虽然目前仍处于早期阶段(v0.14),但其架构设计和安全机制已经相当成熟,值得持续关注和尝试。
核心要点
- Hermes Agent是NousResearch开源的AI智能体框架,内置学习闭环,能从执行经验中自动提取技能并持续优化
- 核心技术结合了Stanford的DSPy声明式编程框架和ICLR 2026 Oral论文GEPA遗传帕雷托提示词进化算法
- GEPA通过深度分析Agent完整执行轨迹而非简单的成功/失败标签,实现针对性的提示词变异优化,并以帕雷托前沿方式平衡准确率、Token消耗、延迟等多目标
- 系统设计了五层安全保护机制,包括测试套件验证、大小限制、缓存保护、意图锁定和人工审查,确保进化过程可控
- 整体方案不需要GPU,每次优化成本约2-10美元,模型无关架构支持灵活的成本路由策略,是目前开源社区最完整的Agent自进化方案之一
相关推荐
深度解读OpenClaw开源小龙虾AI Agent运作原理深度解析
深度解析OpenClaw(开源小龙虾)AI Agent的底层运作原理,涵盖System Prompt、工具调用、SubAgent分身、Skill系统、记忆机制与Context Engineering等核心概念,帮你彻底理解AI Agent与普通语言模型的本质区别。
深度解读Transformer本质解析:一个被拆解的文字接龙函数
用文字接龙的视角理解Transformer本质。将复杂的语言生成任务拆解为Embedding、Transformer Block、概率输出三大模块,帮助深度学习初学者快速建立直觉。
深度解读Claude Code与普通AI对话的五大核心差异
详细对比Claude Code与普通AI对话工具在交互方式、上下文理解、执行力、记忆能力和工具调用五个维度的核心差异,帮你理解AI编程助手的真正价值。