最近AI编程的CLI工具真是一个接一个地冒出来,Gemini CLI、OpenCode、Claude Code……说实话我都快审美疲劳了。但今天要聊的这个工具,我看完资料之后确实觉得,嗯,这个不太一样。"},
{"speaker": "guest", "text": "你说的是Rovo Agent吧?Atlassian出的那个。我最近也在关注,说实话一开始我也是抱着"又一个轮子"的心态去看的,结果一看数据——SWE-bench全量测试排名第一,每天免费送2000万个Claude 4 Sonnet的Token,我就觉得这事儿没那么简单了。"},
{"speaker": "host", "text": "对,先说这个SWE-bench的成绩。41.98%的解决率,听起来好像不到一半,但了解这个基准测试的人都知道,这个数字其实相当炸裂。你给大家解释一下SWE-bench到底在测什么?"},
{"speaker": "guest", "text": "好,这个很关键。SWE-bench是普林斯顿大学搞的一个评估基准,它跟以前那种让AI写个排序函数的测试完全不同。它是从GitHub上真实的开源项目里——比如Django、scikit-learn这些——抽取了将近2300个真实的bug和对应的修复方案。模型要做的事情是:在一个完整的代码仓库里,自己找到问题在哪,理解跨文件的依赖关系,然后生成正确的补丁。这就非常接近我们程序员日常干的活了。"},
{"speaker": "host", "text": "所以41.98%意味着它能自主修复将近一千个真实世界的软件缺陷?"},
{"speaker": "guest", "text": "对,差不多就是这个量级。一年前这个数字大家想都不敢想。而且它不光是跑分厉害,实际体验中它对代码库的全局理解能力确实很强,几秒钟就能分析整个仓库,你用自然语言问它代码结构的问题,它都能回答得上来。"},
{"speaker": "host", "text": "好,那我们来聊聊那个最抓眼球的数字——每天2000万免费Token。我帮大家换算一下,2000万Token大概相当于1500万英文单词,差不多是30本技术书的量。按Anthropic的官方API定价,这每天价值大概60到100美元。这个额度是真的够用吗?"},
{"speaker": "guest", "text": "日常开发绝对绰绰有余。你想啊,一个开发者一天就算高强度地写代码、做代码审查、重构,能用掉的Token量其实远到不了这个上限。而且你可以在终端里随时输入usage命令查看剩余额度。其实我觉得Atlassian这一手很聪明,直接把使用成本这个顾虑给你消除了。你看Gemini CLI和OpenCode的免费额度都很有限,这一对比差距就出来了。"},
{"speaker": "host", "text": "确实,免费策略很激进。不过我更感兴趣的是它的自适应记忆系统,这个听起来很有意思,越用越懂你的项目?"},
{"speaker": "guest", "text": "嗯,这个是我觉得Rovo Agent技术上最有亮点的地方。你知道传统的大模型对话,会话一结束,上下文就没了,下次聊天又得从头来。但Rovo Agent会在本地维护一套结构化的记忆文件,把你项目的架构信息、编码规范、历史决策、甚至你个人的偏好都存下来。每次新会话启动的时候,它会自动把相关记忆加载进去,作为系统提示词的一部分注入模型。"},
{"speaker": "host", "text": "这有点像是给AI配了一个专属的项目笔记本。"},
{"speaker": "guest", "text": "对,这个比喻很好。而且它借鉴了RAG——就是检索增强生成的思路,但更侧重个人化和项目级别的知识积累。实际体验就是,你用得越久,它越了解你的项目,不需要每次都重新解释一遍背景。你甚至可以定制它的行为风格,让它匹配你们团队的工作流程。这个能力Gemini CLI和OpenCode目前都没有。"},
{"speaker": "host", "text": "还有一个不能忽略的优势,就是它背后站着Atlassian。Jira、Confluence、Bitbucket这些工具,全球超过30万家企业在用。这个生态集成意味着什么?"},
{"speaker": "guest", "text": "意味着它不只是一个编码助手,而是可以打通整个开发工作流。你想象一下,它可以直接读Jira工单来理解需求,去Confluence查文档获取业务上下文,然后在Bitbucket上创建分支、提交代码。从需求到交付,端到端自动化。这对企业用户来说吸引力太大了。当然它也支持GitHub,不是说非得全套Atlassian不可。"},
{"speaker": "host", "text": "我看到它还有个多智能体并行会话的功能?"},
{"speaker": "guest", "text": "对,这个也很前沿。你可以同时跑多个AI代理,让它们并行处理不同任务。比如一个代理写代码,一个做代码审查,第三个生成测试用例。每个代理有独立的提示词、工具集和记忆空间,各司其职。这种Multi-Agent架构是现在AI应用开发的一个大趋势,Rovo Agent直接内置了这个能力。"},
{"speaker": "host", "text": "实际用起来效果怎么样?我看到有人测试,就给它一句话——"创建一个SaaS登录页",两分钟就搞定了?"},
{"speaker": "guest", "text": "是的,而且生成质量相当不错,功能完整,设计现代,自带动画和交互。整个过程中你可以选择让它全自动跑,也可以逐个审批每一步文件改动,终端里会直观显示所有变更计划。对于快速做原型或者MVP验证来说,这个效率真的是把构建时间从几天压缩到几分钟。"},
{"speaker": "host", "text": "那安装麻烦吗?"},
{"speaker": "guest", "text": "不麻烦,三步走。先注册一个免费的Atlassian账户,然后安装他们的命令行工具ACLI,最后生成一个API令牌做授权就行了。macOS、Linux、Windows都支持。不过Windows用户我建议用WSL环境来跑,就是Windows自带的那个Linux子系统,能避免不少路径处理和Shell兼容性的坑。"},
{"speaker": "host", "text": "最后帮大家做个总结。Rovo Agent目前还在测试阶段,这个2000万Token的免费额度正式发布后还能不能保持,确实是个未知数。所以感兴趣的开发者建议尽早去试试。当然,选工具最终还是要看你的技术栈和团队生态——如果你们重度依赖Google Cloud,Gemini CLI可能更合适;如果追求开源灵活性,OpenCode也有它的价值。但如果你们本身就在用Atlassian的产品,或者单纯想要一个免费额度最大、跑分最强的AI编程助手,Rovo Agent现在确实是第一选择。"},
{"speaker": "guest", "text": "嗯,我补充一句。其实不管你最终选哪个工具,Rovo Agent的出现说明AI编程CLI工具的竞争已经进入新阶段了。不再是简单套个大模型API就完事,而是要在记忆系统、生态集成、工作流自动化这些维度上真正做出差异化。这个方向对开发者来说是好事,值得持续关注。"}
],