播客频道 | Hermes Agent实战：四层记忆系统打造不失忆的AI助手

今天想聊一个特别实际的问题——你有没有发现，我们用的AI助手，聊着聊着就失忆了？窗口一关，之前说的全忘了。很多人觉得这是模型不够强，但其实我最近看到一个特别有意思的观点，说问题根本不在模型身上。对，这个观点我特别认同。你想啊，现在的大模型其实已经很聪明了，GPT-4、Claude这些，推理能力都很强。但问题是，光有一个聪明的大脑是不够的。打个比方，你有一匹千里马，但你没给它配马鞍、没有缰绳、也没有导航，它再能跑也到不了你想去的地方。这个比喻很形象。所以你说的这套马鞍、缰绳，具体指的是什么？其实就是模型之外的一整套系统基础设施。业内现在有个概念叫Harness Engineering，翻译过来就是'驾驭工程'。它关注的不是模型参数多大、推理多强，而是怎么在模型之上搭一套运行时的基础设施，让AI从'能聊天'变成'能干活'。这里面包括四个核心层：工具调用、上下文管理、记忆持久化，还有技能进化。等一下，工具调用我大概理解，就是让模型能调API、执行代码之类的。但上下文管理这个，很多人可能会说，现在模型的上下文窗口不是已经很大了吗？GPT-4 Turbo都128K了，Claude 3甚至200K，这还不够用？嗯，这其实是一个特别常见的误区。上下文窗口大，和上下文管理好，是两码事。窗口大只是说模型一次能'看到'更多内容，但问题是——你把所有信息一股脑塞进去，模型反而找不到重点了。这就是所谓的'大海捞针'问题。真正的上下文管理是系统工程层面的事：哪些信息该保留、哪些该压缩、多轮对话怎么动态调整、多个任务之间怎么隔离和共享上下文……这些都需要精心设计。明白了，就好比你书桌上堆满了资料，虽然都在眼前，但如果没有分类整理，找起来反而更慢。那说到记忆持久化，这应该就是解决'失忆'问题的关键了吧？没错，这是我觉得最有意思的部分。现在有一个开源框架叫Hermes Agent，它在记忆系统上做得特别系统化。它直接借鉴了认知心理学的理论，把记忆分成了四层——工作记忆、情景记忆、语义记忆和程序记忆。这套分类其实来自上世纪六十年代Atkinson和Shiffrin的多重存储模型，后来Tulving又做了细化。把认知科学的框架映射到AI系统设计里，我觉得这个思路特别漂亮。四层记忆，听起来挺复杂的。能一层一层给大家拆解一下吗？好，先说工作记忆。这个最好理解，就类似人的短期记忆。你跟AI聊天的时候，它需要记住这轮对话里你前面说了什么，这样才能理解后面的问题。比如你先说'帮我查一下北京的天气'，然后又说'那上海呢'，它得知道'那'指的是天气。技术上就是在模型的上下文窗口里做动态的信息筛选和压缩，确保最关键的即时信息始终在模型的注意力范围内。这个是基础。那情景记忆呢？情景记忆就厉害了，它是跨会话的。它记录的是你和AI过去的交互经历，让AI能回忆起'上次我们聊过什么'。比如你上周跟它讨论过一个项目方案，这周再聊的时候它还记得。而且Hermes Agent在实现的时候，会给每条记忆打上时间戳和会话标识，可以按时间线回溯。这一步其实是AI从'工具'升级为'伙伴'的关键——它开始跟你有共同的经历了。有意思，这就像你跟一个同事合作久了，不用每次都从头解释背景。那语义记忆和情景记忆有什么区别？区别在于，情景记忆是跟具体情境绑定的——什么时候、在哪个对话里说的。而语义记忆是去情境化的，它只关心信息本身是什么。比如你告诉AI'我们团队用的是React技术栈'，这个事实会被存到语义记忆里，它不需要记住你是哪天告诉它的，只要知道这个知识点就行。这样可以更高效地做结构化组织，支持更精准的知识检索和推理。对，一个记经历，一个记知识。那最后一层，程序记忆？程序记忆记的是'怎么做'。你教AI一套工作流程，比如'每次收到客户邮件先分类、再提取关键信息、然后生成回复模板'，它会把这个流程固化下来。技术上通常用有向无环图或者状态机来存储，而不是简单的自然语言描述，这样执行起来才有确定性。下次遇到类似任务，它自动调用，不用你再教一遍。而且随着使用时间越长，它积累的技能越多，就越来越'懂你'。这四层配合起来，确实比简单地在提示词里塞历史对话要高级太多了。那底层技术上，这些记忆是怎么存储和检索的？核心是向量数据库。当AI需要'记住'一段内容时，先通过嵌入模型把文本转成高维向量，通常是768维或1536维的浮点数数组，然后存到向量数据库里。需要'回忆'的时候，把当前的查询也转成向量，通过近似最近邻搜索找到语义最相似的记忆。这种方式比关键词匹配高明得多——你不需要记住原话，意思相近就能找到。其实特别像人类的联想式记忆。说到落地，我知道文章里还提到了一个实战案例，把Hermes Agent接入飞书做AI助手。这个场景确实很刚需，毕竟大家每天都在办公软件里泡着。对，而且这个场景的价值在于它不是一个Demo，是真的能嵌入日常工作流的。技术路径也比较清晰：在飞书开放平台创建机器人应用，配置事件回调，用户在飞书里@机器人或者私聊，消息通过Webhook推到后端，后端调Hermes Agent处理再返回结果。有了四层记忆之后，体验就完全不一样了。比如你上周跟它说'下周三有个重要汇报'，到了周三它还记得，主动提醒你。这种体验，普通的聊天机器人根本做不到。这让我想到一个更大的趋势——现在AI应用开发的重心，是不是正在从'选模型'转向'搭架构'？完全是这样。你看现在模型能力其实在趋于同质化，各家大模型的差距在缩小。但实际生产环境中，80%的问题出在模型之外。没有稳定的工具调用，模型没法跟真实世界交互；没有记忆系统，每次对话从零开始；没有上下文管理，长任务链必然断裂。真正拉开产品差距的，是工程层面的设计。而且现在开源框架已经大幅降低了门槛，像LangChain、AutoGPT、CrewAI这些都有各自的侧重，但在记忆系统的完整性上普遍有短板，大多停留在简单的对话历史存储。Hermes Agent在这一点上确实做出了差异化。所以总结一下，与其等一个更强的模型出来，不如先把手头的模型驾驭好。驾驭工程这个思路，可能比追逐最新模型更有长远价值。记忆系统是AI Agent的灵魂，四层缺一不可——工作记忆保证即时响应，情景记忆积累经验，语义记忆支撑推理，程序记忆驱动进化。对于想做AI Agent的开发者来说，这套思路值得好好研究。嗯，说得特别到位。其实核心就一句话：好马还需好鞍。模型再强，没有系统工程的支撑，也只是一个高级聊天工具。把驾驭层做好了，才是AI真正落地的关键。

Hermes Agent实战：四层记忆系统打造不失忆的AI助手

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报

Hermes Agent实战：四层记忆系统打造不失忆的AI助手

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报