谷歌Jules 2.0全面升级:七大新功能深度解析

谷歌AI编程助手Jules结束Beta,密集升级为系统性智能编程代理
谷歌在「Jules Week」中对AI编程助手Jules进行了全面升级,正式结束Beta测试。新增环境快照加速启动、基于Actor-Critic强化学习的Critic Agent实时代码审查、交互式计划协商、网页预览截图、联网搜索及直接创建PR等功能,围绕开发者完整工作流进行系统性优化,使Jules从代码生成工具进化为更接近人类开发者协作模式的智能编程代理。
谷歌的AI编程助手Jules在过去一周迎来了密集更新,官方称之为「Jules Week」。经过这轮升级,Jules正式走出Beta阶段,新增了多项实用功能,包括环境快照、Critic Agent、交互式计划、网页预览等。这些改进让Jules从一个简单的代码生成工具,进化为更接近人类开发者工作流的智能编程代理。
正式告别Beta,免费用户也能用
Jules正式结束Beta测试,所有在Beta期间使用过Jules的用户将获得三个月的Google AI Pro免费订阅,这是谷歌对早期用户的回馈。
在定价方面,免费用户每天可执行15个任务,同时运行3个并发任务;AI Pro计划用户每天可执行115个任务;Ultra计划则有更高的上限。说个细节,Jules并非独立付费产品,而是被整合进了Google AI订阅计划中,这意味着订阅用户可以同时享受谷歌其他AI服务。

直接创建Pull Request:简化工作流
此前使用Jules时,它只能为你的功能请求创建一个独立分支,开发者需要手动打开Pull Request。现在,你可以直接从Jules界面发起PR,完成代码审查后一键合并到主分支。这个改进看似简单,但极大地减少了开发者在IDE、终端和GitHub之间来回切换的摩擦。
Pull Request(PR)是现代软件协作开发的核心机制,起源于Git分布式版本控制工作流。开发者在独立分支上完成功能开发后,通过PR向主分支发起合并申请,团队成员可在此过程中进行代码审查、讨论和自动化测试。将PR创建直接集成进Jules界面,意味着AI生成的代码可以无缝进入团队的标准审查流程,而不是绕过它——这对于企业级代码质量管控尤为重要。
环境快照:告别重复初始化
这是一个针对开发效率的底层优化。以前每次在新任务中启动Jules时,它都需要重新运行环境配置脚本来搭建项目环境,这个过程既耗时又浪费资源。
升级后,Jules会在首次配置完成后捕获虚拟机的快照(Snapshot),后续任务直接从快照启动,环境已经就绪,可以立即开始工作。
虚拟机快照(VM Snapshot)是云计算和虚拟化领域的成熟技术,最早由VMware在2000年代初商业化普及。快照本质上是对虚拟机在某一时刻完整状态(包括内存、磁盘、CPU寄存器等)的持久化记录,可以在任意时刻将系统精确还原至该状态。在CI/CD流水线中,快照技术被广泛用于加速构建环境的初始化。Jules将这一技术引入AI编程代理场景,解决的是「冷启动」问题——对于依赖Node.js、Python虚拟环境或Docker容器的复杂项目,传统方式每次初始化可能耗费数分钟,而快照启动通常可压缩至秒级。对于依赖复杂、初始化时间长的项目来说,这个优化的效果尤为显著。
网页预览:无需本地克隆即可验证
这是一个非常实用的功能。以前Jules完成前端任务后,开发者必须将分支克隆到本地,手动启动项目才能查看效果。现在你可以直接要求Jules验证其工作成果,它会使用Playwright渲染网页并返回截图。
Playwright是微软于2020年开源的现代Web自动化测试框架,支持Chromium、Firefox和WebKit三大浏览器引擎,提供跨浏览器、跨平台的一致性测试体验。相比前代工具Selenium,Playwright原生支持异步操作、自动等待机制和网络请求拦截,在处理现代单页应用(SPA)时表现更为稳定。Jules选择Playwright作为网页预览和前端测试的底层引擎,一方面是因为其截图API成熟可靠,另一方面也是因为Playwright在开发者社区中已成为前端自动化测试的事实标准之一,降低了开发者理解和扩展测试脚本的门槛。
虽然目前还不能与渲染出的页面进行交互操作,但仅凭截图预览就已经能帮助开发者快速判断UI是否符合预期,避免了大量不必要的本地操作。同时,Jules也支持基于Playwright的前端自动化测试。
Critic Agent:内置的代码审查官
Critic Agent是本次升级中技术含量最高的功能。它本质上是一个代码质量审查代理,在Jules生成代码的过程中实时介入,对每一处修改进行「对抗性审查」。

Critic Agent的工作方式包括:
- 发现隐蔽Bug:标记容易被忽略的边界情况和潜在错误
- 优化性能:识别低效代码并提出改进建议
- 安全审查:检查代码中可能存在的安全隐患
- 实时反馈:Jules根据Critic的反馈即时修改代码
值得关注的是,Critic Agent并非简单的Linter或测试工具,也不是通过系统提示词驱动的普通代理。谷歌明确表示,它基于Actor-Critic强化学习框架进行了专门的微调——Actor负责生成代码,Critic负责评估质量。
Actor-Critic是强化学习领域的经典架构,结合了策略梯度(Policy Gradient)和值函数估计(Value Function)两种方法的优势。Actor负责根据当前状态选择动作(即生成代码),Critic则负责评估该动作的好坏并给出反馈信号,指导Actor不断优化策略。这种架构最早可追溯至1990年代的强化学习研究,在DeepMind的AlphaGo、OpenAI的PPO算法中均有广泛应用。将其引入代码生成领域,意味着模型不再只是基于监督学习模仿人类代码,而是通过持续的自我博弈和反馈循环来提升代码质量,理论上能够发现训练数据中未曾出现的优化路径。这种架构借鉴了多步骤、工具交互式批评的研究成果,使其能够理解代码背后的意图和上下文,类似于人类同行评审的效果。
交互式计划:与AI协商开发方案
以前Jules在接收任务后会自动生成一个执行计划,开发者只能选择接受或拒绝。现在新增的交互式计划(Interactive Plan)功能允许你在任务开始前与Jules进行对话,共同构建一个精确符合你需求的执行方案。

这意味着你不再需要在任务描述框中绞尽脑汁地定义每一个细节,而是可以通过自然对话逐步明确需求。Jules还会在执行过程中主动向你确认不明确的地方,这种交互模式让AI编程助手的使用体验更加接近与真人开发者的协作。这一设计理念与软件工程中的「需求澄清」阶段高度契合——在正式编码前通过充分沟通对齐预期,是减少返工成本的关键实践。
联网搜索:知识库不再是瓶颈
Jules现在具备了联网搜索能力。当你的项目使用了较新的依赖库或框架时,Jules可以主动搜索最新的官方文档,查找相关的代码示例和实现参考。这解决了AI编程工具一个长期存在的痛点——训练数据截止日期导致的知识滞后问题。
大型语言模型的训练数据存在固定的截止日期(Knowledge Cutoff),这意味着模型对截止日期之后发布的新版本框架、API变更或安全补丁一无所知。对于快速迭代的JavaScript生态(如Next.js、React)或Python机器学习库(如PyTorch、Transformers)而言,版本间的API差异可能导致AI生成的代码直接无法运行。联网搜索能力通过实时检索官方文档和社区资源,将模型的有效知识边界从训练截止日期延伸至当下,是AI编程工具走向实用化的重要一步。
总结与思考
从这次「Jules Week」的更新来看,谷歌在AI编程代理领域的布局正在加速。Jules 2.0的升级并非单点突破,而是围绕开发者的完整工作流进行了系统性优化:
- 效率层面:环境快照和直接PR减少了重复操作
- 质量层面:Critic Agent通过强化学习提升代码质量
- 体验层面:交互式计划和网页预览让人机协作更加顺畅
- 能力层面:联网搜索突破了知识边界
这些功能的组合使Jules从一个「代码生成器」进化为更接近「AI开发者同事」的角色。在Cursor、GitHub Copilot、Claude Code等竞品激烈角逐的当下,当前AI编程助手市场已进入白热化竞争阶段:Cursor基于VSCode深度定制,主打IDE内的沉浸式编程体验;GitHub Copilot依托微软生态和庞大的GitHub代码库,拥有最广泛的用户基础;Anthropic的Claude Code则以强大的上下文理解和长文档处理能力见长;而Devin作为首个「全自主AI软件工程师」概念的落地产品,定义了Agentic Coding的行业想象空间。Jules的差异化路径在于深度整合Google Cloud基础设施与Gemini模型,并以异步、后台执行的任务模式区别于实时交互型竞品,更适合耗时较长的复杂工程任务。对于开发者来说,现在是尝试Jules的好时机。
核心要点
- Jules 正式结束 Beta,免费用户每天可执行 15 个任务,Beta 用户获赠三个月 Google AI Pro
- 新增 Critic Agent 功能,基于 Actor-Critic 强化学习框架对生成代码进行实时对抗性审查
- 环境快照技术通过保存虚拟机镜像,避免每次任务重复初始化环境,显著提升启动速度
- 支持交互式计划制定、网页预览截图和联网搜索最新文档,全面优化开发者工作流
- 可直接从 Jules 界面创建 Pull Request 并一键合并,简化代码协作流程
相关推荐
产品体验Qoder vs Cursor实测对比:同样20美金谁更强?
实测对比Qoder和Cursor两款AI IDE,从Agent自主修复能力、人工沟通次数、架构决策等维度评测。Qoder仅需2次沟通完成任务,Cursor需8次。详细分析两者差异,帮你选择最适合的AI编程工具。
产品体验Cursor云Agent演示:打通软件开发全链路瓶颈
深度解析Cursor云Agent最新Demo,展示如何通过云端虚拟机、自动测试产物和全链路控制平面,系统性消除软件开发生命周期中的人类瓶颈,让Agent自主运行、人按需介入。
产品体验Cursor 3.0深度解析:多Agent并行、Design Mode与Best-of-N模型对比
Cursor 3.0正式发布,从AI辅助编程工具进化为Agent舰队指挥中心。本文详解多智能体并行、Design Mode可视化编辑、Best-of-N多模型择优等核心功能,解读AI编程新范式。