播客频道 | Rovo Agent：每天2000万免费Token，SWE-bench排名第一的AI编程CLI工具

最近AI编程的CLI工具真是一个接一个地冒出来，Gemini CLI、OpenCode、Claude Code……说实话我都快审美疲劳了。但今天要聊的这个工具，我看完资料之后确实觉得，嗯，这个不太一样。"}, {"speaker": "guest", "text": "你说的是Rovo Agent吧？Atlassian出的那个。我最近也在关注，说实话一开始我也是抱着"又一个轮子"的心态去看的，结果一看数据——SWE-bench全量测试排名第一，每天免费送2000万个Claude 4 Sonnet的Token，我就觉得这事儿没那么简单了。"}, {"speaker": "host", "text": "对，先说这个SWE-bench的成绩。41.98%的解决率，听起来好像不到一半，但了解这个基准测试的人都知道，这个数字其实相当炸裂。你给大家解释一下SWE-bench到底在测什么？"}, {"speaker": "guest", "text": "好，这个很关键。SWE-bench是普林斯顿大学搞的一个评估基准，它跟以前那种让AI写个排序函数的测试完全不同。它是从GitHub上真实的开源项目里——比如Django、scikit-learn这些——抽取了将近2300个真实的bug和对应的修复方案。模型要做的事情是：在一个完整的代码仓库里，自己找到问题在哪，理解跨文件的依赖关系，然后生成正确的补丁。这就非常接近我们程序员日常干的活了。"}, {"speaker": "host", "text": "所以41.98%意味着它能自主修复将近一千个真实世界的软件缺陷？"}, {"speaker": "guest", "text": "对，差不多就是这个量级。一年前这个数字大家想都不敢想。而且它不光是跑分厉害，实际体验中它对代码库的全局理解能力确实很强，几秒钟就能分析整个仓库，你用自然语言问它代码结构的问题，它都能回答得上来。"}, {"speaker": "host", "text": "好，那我们来聊聊那个最抓眼球的数字——每天2000万免费Token。我帮大家换算一下，2000万Token大概相当于1500万英文单词，差不多是30本技术书的量。按Anthropic的官方API定价，这每天价值大概60到100美元。这个额度是真的够用吗？"}, {"speaker": "guest", "text": "日常开发绝对绰绰有余。你想啊，一个开发者一天就算高强度地写代码、做代码审查、重构，能用掉的Token量其实远到不了这个上限。而且你可以在终端里随时输入usage命令查看剩余额度。其实我觉得Atlassian这一手很聪明，直接把使用成本这个顾虑给你消除了。你看Gemini CLI和OpenCode的免费额度都很有限，这一对比差距就出来了。"}, {"speaker": "host", "text": "确实，免费策略很激进。不过我更感兴趣的是它的自适应记忆系统，这个听起来很有意思，越用越懂你的项目？"}, {"speaker": "guest", "text": "嗯，这个是我觉得Rovo Agent技术上最有亮点的地方。你知道传统的大模型对话，会话一结束，上下文就没了，下次聊天又得从头来。但Rovo Agent会在本地维护一套结构化的记忆文件，把你项目的架构信息、编码规范、历史决策、甚至你个人的偏好都存下来。每次新会话启动的时候，它会自动把相关记忆加载进去，作为系统提示词的一部分注入模型。"}, {"speaker": "host", "text": "这有点像是给AI配了一个专属的项目笔记本。"}, {"speaker": "guest", "text": "对，这个比喻很好。而且它借鉴了RAG——就是检索增强生成的思路，但更侧重个人化和项目级别的知识积累。实际体验就是，你用得越久，它越了解你的项目，不需要每次都重新解释一遍背景。你甚至可以定制它的行为风格，让它匹配你们团队的工作流程。这个能力Gemini CLI和OpenCode目前都没有。"}, {"speaker": "host", "text": "还有一个不能忽略的优势，就是它背后站着Atlassian。Jira、Confluence、Bitbucket这些工具，全球超过30万家企业在用。这个生态集成意味着什么？"}, {"speaker": "guest", "text": "意味着它不只是一个编码助手，而是可以打通整个开发工作流。你想象一下，它可以直接读Jira工单来理解需求，去Confluence查文档获取业务上下文，然后在Bitbucket上创建分支、提交代码。从需求到交付，端到端自动化。这对企业用户来说吸引力太大了。当然它也支持GitHub，不是说非得全套Atlassian不可。"}, {"speaker": "host", "text": "我看到它还有个多智能体并行会话的功能？"}, {"speaker": "guest", "text": "对，这个也很前沿。你可以同时跑多个AI代理，让它们并行处理不同任务。比如一个代理写代码，一个做代码审查，第三个生成测试用例。每个代理有独立的提示词、工具集和记忆空间，各司其职。这种Multi-Agent架构是现在AI应用开发的一个大趋势，Rovo Agent直接内置了这个能力。"}, {"speaker": "host", "text": "实际用起来效果怎么样？我看到有人测试，就给它一句话——"创建一个SaaS登录页"，两分钟就搞定了？"}, {"speaker": "guest", "text": "是的，而且生成质量相当不错，功能完整，设计现代，自带动画和交互。整个过程中你可以选择让它全自动跑，也可以逐个审批每一步文件改动，终端里会直观显示所有变更计划。对于快速做原型或者MVP验证来说，这个效率真的是把构建时间从几天压缩到几分钟。"}, {"speaker": "host", "text": "那安装麻烦吗？"}, {"speaker": "guest", "text": "不麻烦，三步走。先注册一个免费的Atlassian账户，然后安装他们的命令行工具ACLI，最后生成一个API令牌做授权就行了。macOS、Linux、Windows都支持。不过Windows用户我建议用WSL环境来跑，就是Windows自带的那个Linux子系统，能避免不少路径处理和Shell兼容性的坑。"}, {"speaker": "host", "text": "最后帮大家做个总结。Rovo Agent目前还在测试阶段，这个2000万Token的免费额度正式发布后还能不能保持，确实是个未知数。所以感兴趣的开发者建议尽早去试试。当然，选工具最终还是要看你的技术栈和团队生态——如果你们重度依赖Google Cloud，Gemini CLI可能更合适；如果追求开源灵活性，OpenCode也有它的价值。但如果你们本身就在用Atlassian的产品，或者单纯想要一个免费额度最大、跑分最强的AI编程助手，Rovo Agent现在确实是第一选择。"}, {"speaker": "guest", "text": "嗯，我补充一句。其实不管你最终选哪个工具，Rovo Agent的出现说明AI编程CLI工具的竞争已经进入新阶段了。不再是简单套个大模型API就完事，而是要在记忆系统、生态集成、工作流自动化这些维度上真正做出差异化。这个方向对开发者来说是好事，值得持续关注。"} ],

Rovo Agent：每天2000万免费Token，SWE-bench排名第一的AI编程CLI工具

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报