小米MiMo Code开源:跨会话记忆如何改变AI编程协作

小米MiMo团队用14天时间,5个人做出了一款定位独特的终端编程Agent——MiMo Code。它不只是又一个Claude Code的开源替代品,而是把"跨会话记忆"和"长期项目协作"作为核心能力,试图解决当前AI编程工具最大的痛点:用完即忘。
不只是终端里的代码生成器
MiMo Code第一眼看上去确实很像小米版Claude Code:运行在终端中,能读写代码、执行命令、管理Git,也能调动子Agent处理复杂任务。但它的真正差异化在于,基于Open Code分支加入了记忆系统、上下文管理、多Agent协作和自动化工作流。
Open Code是一个开源的终端AI编程框架,本身是对Claude Code交互范式的开源复刻。Claude Code由Anthropic推出,是一款运行在命令行终端中的AI编程助手,开发者可以通过自然语言与之交互来完成代码编写、调试和项目管理。这种终端原生的交互方式相比IDE插件(如GitHub Copilot、Cursor)有其独特优势:它更贴近资深开发者的工作习惯,能直接操作文件系统和执行Shell命令,且不依赖特定编辑器。MiMo Code选择在Open Code基础上分支开发,意味着它继承了成熟的终端交互层,将精力集中在记忆系统和多Agent协作等差异化能力上。

安装方式很直接,官方提供一键脚本或NPM全局安装。首次启动时可以选择限时免费的MiMo Auto匿名通道,也支持登录小米MiMo平台,甚至可以从Claude Code导入已有认证,或接入兼容OpenAI API的自定义模型服务。这意味着MiMo Code没有把自己锁死在单一模型生态里。这种多模型兼容策略在当前AI工具市场中越来越常见——随着大语言模型的快速迭代和价格竞争,绑定单一模型供应商既限制了用户选择,也增加了供应链风险。支持OpenAI API兼容接口意味着用户可以接入包括DeepSeek、Qwen、Llama等在内的众多开源和商业模型,根据任务复杂度和成本预算灵活切换。
三种主Agent模式:Build、Plan、Compose
MiMo Code最值得关注的架构设计,是把Agent的工作拆成了更明确的能力层,提供三种主Agent模式:
- Build模式:直接开发,快速生成和修改代码
- Plan模式:只读分析,不动代码只给方案
- Compose模式:完整工作流编排,从规划到交付

将Agent能力显式分层,反映了业界对AI编程工具使用场景的深入理解。在实际开发中,开发者与AI的交互并非总是"帮我写代码"这一种模式——有时需要的是架构分析和方案评估(对应Plan模式),有时需要快速实现一个功能(对应Build模式),有时则需要端到端地完成一个完整特性的交付(对应Compose模式)。这种分层设计避免了"一个提示词打天下"的粗放模式,让每种模式都能针对性地优化系统提示词、工具权限和行为约束。例如,Plan模式下Agent被限制为只读权限,从根本上杜绝了"只是想问问方案结果代码被改了"的风险。
主Agent还能按需创建子Agent,把任务拆分后并行处理,并追踪它们的完整生命周期。多Agent协作是当前AI系统架构的重要趋势。传统的单Agent模式下,一个大语言模型需要同时处理理解需求、规划方案、编写代码、自我检查等多重任务,容易在复杂场景中出现注意力分散和上下文污染。多Agent架构的核心思想是"分治"——将不同职责分配给专门的Agent,每个Agent拥有独立的系统提示词、工具集和上下文窗口。主Agent充当协调者,负责任务拆解和结果汇总;子Agent则专注于各自的子任务。这种架构在微软AutoGen、CrewAI、LangGraph等框架中已有广泛实践。MiMo Code的创新在于将这种多Agent模式与跨会话记忆结合,使子Agent不仅能并行执行,还能在会话恢复时继承之前的工作状态。
配合跨会话记忆、上下文自动重建和终止条件判断,有效缓解了"半途失忆"和"过早宣布完成"这两个AI编程中最常见的问题。"过早宣布完成"是AI编程Agent的一个典型缺陷——模型在生成代码后倾向于输出"任务已完成"的结论,即使代码存在明显错误或未覆盖边界情况。这本质上是大语言模型的"讨好倾向"(sycophancy)在编程场景中的体现。MiMo Code通过引入终止条件判断机制,要求Agent在宣布完成前通过预设的验证检查(如测试通过、lint检查等),用工程化手段约束模型的这一行为偏差。
跨会话记忆:项目档案而非更长的上下文
MiMo Code最有意思的设计,是把长任务连续性放到了产品核心。它建立了一套多层次的记忆体系:
- MEMO文件:保存项目知识和架构决策
- Checkpoint:保存会话快照
- Node:保存临时笔记
- Progress:记录任务进度

这些内容通过SQLite全文搜索进行检索,在恢复任务时按上下文预算注入回来。SQLite是一种嵌入式关系数据库,无需独立服务器进程,数据以单个文件形式存储在本地。其FTS5(Full-Text Search 5)扩展提供了高效的全文检索能力,支持BM25排序算法和前缀查询。对于终端AI工具而言,选择SQLite而非向量数据库(如ChromaDB、Pinecone)有明确的工程考量:零部署成本、无外部依赖、离线可用,且对结构化的项目记忆(如架构决策、任务进度)来说,关键词匹配往往比语义向量检索更精确可控。当然,这也意味着MiMo Code的记忆检索目前可能缺乏语义模糊匹配能力,未来或许会引入混合检索策略。
"上下文预算"是这套记忆系统中一个值得注意的设计细节。由于大语言模型的每次调用都有token数量限制和成本开销,不可能将所有历史记忆一次性全部注入。上下文预算机制意味着系统需要在每次会话恢复时做出智能取舍——根据当前任务的相关性,从记忆库中选择最有价值的信息片段,在有限的token配额内最大化信息密度。这类似于人类在回忆项目细节时的选择性记忆:你不会回忆起每一次代码提交,但会记住关键的架构决策和踩过的坑。
设计思路很明确——不是简单地拉长上下文窗口,而是建立一套能跨会话接力的项目档案。当前大语言模型的上下文窗口虽然已从最初的4K token扩展到128K甚至百万级别,但单纯增加窗口长度并不能真正解决长期项目协作的问题。长上下文会导致"中间遗忘"现象(Lost in the Middle)——研究表明,模型对上下文中间部分的信息检索准确率显著下降,对开头和结尾的信息则保持较高的关注度。每次新会话都需要重新注入全部上下文,既浪费token配额也增加延迟。更根本的是,原始对话记录中充斥着试错过程、废弃方案和冗余讨论,直接塞入上下文反而会干扰模型判断。MiMo Code的记忆体系本质上是在做信息的结构化压缩和分层管理——MEMO保存经过提炼的高价值知识,Checkpoint保存可恢复的状态快照,这比简单拉长上下文窗口要高效得多。每次重新启动时,Agent能快速重建对项目的理解,而不是从零开始。
Compose模式与自我进化机制
Compose模式是MiMo Code辨识度最高的功能。它把规划、执行、代码审查、TDD调试、验证和合并组织成可编排的完整流程。用户给出需求后,Agent不只是生成几段代码,而是沿着完整的软件交付过程逐步推进。
TDD(Test-Driven Development,测试驱动开发)是一种先写测试用例、再编写实现代码的开发方法论,由Kent Beck在极限编程(XP)中系统化提出。其核心循环是"红-绿-重构":先写一个会失败的测试(红),再写最少的代码让测试通过(绿),最后优化代码结构(重构)。在AI编程Agent的语境下,TDD具有特殊价值:测试用例为Agent提供了明确的、可机器验证的成功标准,使其能够自主判断代码是否正确,而不是依赖模型的"自我感觉"。这一点至关重要——大语言模型在生成代码后进行自我评估时,往往会高估代码的正确性。Compose模式将TDD嵌入自动化流程,意味着Agent生成代码后会自动运行测试、根据失败信息修复代码,形成闭环迭代。这种做法有效缓解了AI编程中常见的"看起来对但实际跑不通"问题。将代码审查、测试验证和Git合并串联成可编排流程,本质上是在用软件工程的成熟实践来约束和引导AI的行为。
配合Dream和Distill命令,MiMo Code会把会话轨迹提炼成项目记忆,把反复出现的人工流程沉淀为可复用资产。

官方称这套机制为"自我进化",更准确地说是对使用反馈的结构化沉淀:有长期价值的信息进入项目记忆,过时内容被清理,反复出现的流程被识别后封装成Skill、Agent或命令。将反复出现的操作模式封装为可复用资产,是AI Agent领域的重要演进方向。在学术界,这被称为"经验学习"或"技能库"(Skill Library)机制,最早在VOYAGER(2023年,基于Minecraft的AI Agent研究,由英伟达等团队提出)中得到系统验证——Agent在探索过程中将成功的行为序列保存为可调用的JavaScript技能函数,后续遇到类似场景时直接复用,实现了持续的能力积累而非每次从零开始。在工业界,Devin(由Cognition Labs推出的"AI软件工程师")、Factory等AI编程产品也在探索类似的工作流沉淀能力。MiMo Code的Dream和Distill命令将这一理念落地到实际开发场景:Dream负责从会话轨迹中识别有价值的模式,Distill负责将其提炼为结构化的Skill或命令。这种机制的长期价值在于,团队的隐性知识(如特定项目的部署流程、代码规范偏好、常见bug的修复模式)能被逐步显性化并自动执行,降低团队成员变动带来的知识流失风险。
一旦这个闭环跑通,Agent就不再是一次性的代码生成器,而会逐步贴近团队自己的交付习惯。
现阶段的局限与方向价值
现阶段把MiMo Code当成Claude Code的成熟替代品还为时过早。作为V0.1.0版本,长期任务的稳定性、记忆质量、Agent调度效率和多模型体验都需要真实项目验证。免费通道的持续时间、后续定价和服务策略,也会影响它能否融入开发者的日常工作流。
值得注意的是,MiMo Code面临的竞争格局正在快速演变。Claude Code本身在持续迭代,GitHub Copilot已推出Agent模式,Cursor和Windsurf等AI-native IDE也在加强多文件编辑和项目理解能力。在开源领域,Aider、Continue、Cline等工具各有侧重。MiMo Code选择"跨会话记忆"作为差异化切入点,瞄准的是一个目前所有竞品都未能很好解决的痛点——但这也意味着它需要在记忆系统的可靠性和实用性上达到足够高的水准,才能让开发者愿意将项目知识托付给它。
不过MiMo Code指出了一个重要方向:AI编程Agent的竞争正在从"一次性写代码"走向"长期项目协作和工作流沉淀"。谁能让Agent真正理解一个项目的历史、架构和团队偏好,谁就能在下一阶段的竞争中建立壁垒。这种壁垒的本质是数据飞轮效应——Agent使用得越久,积累的项目记忆越丰富,对团队工作方式的理解越深入,用户的迁移成本也就越高。这与传统SaaS产品通过数据锁定用户的逻辑一脉相承,但在AI Agent场景下,锁定的不仅是数据,更是经过提炼的知识和工作流。小米用14天和5个人跑出了第一版,接下来要看的是它能否在真实开发场景中兑现这个愿景。
相关推荐

Wise大额转账延迟两周:跨境创业者该如何应对?
Wise Business用户遭遇大额转账延迟10-14天,引发金融科技是否重蹈传统银行覆辙的讨论。本文分析延迟原因,对比Stripe等替代方案,并为跨境创业者提供资金管理实用建议。

Perplexity联手Intel:本地AI模型与混合推理登陆笔记本电脑
Perplexity与Intel达成合作,将本地AI模型和混合推理能力带到Intel Core Ultra Series 3笔记本电脑上。本文解析混合推理架构的优势、Intel NPU算力支撑,以及AI从云端走向终端的行业趋势。

AI大模型学习路线拆解:三阶段从应用开发到模型微调
深度拆解一条热门AI大模型学习路线,涵盖LangChain应用开发、RAG检索增强生成、Agent智能体、LoRA模型微调等核心技术栈,分析三阶段规划的合理性与局限性,为转型者提供理性参考。