Codex最新版本功能全解析:宠物模式、导入Agent配置、Computer Use升级有多香?

Codex最新版本功能全解析:宠物模式、导入Agent配置、Computer Use升级有多香?
万万没想到,2025年程序员最大的生产力提升,居然来自一只像素小猪。OpenAI的Codex最新版本(5月2日更新)一口气塞进了宠物模式、Computer Use性能飞升、导入Agent配置等一堆新功能,今天就来逐个拆开聊聊,到底值不值得上手。
Codex宠物模式:你的IDE居然能养电子宠物了
别人家的IDE在卷性能、卷模型,Codex直接卷出了一个宠物系统。在设置 → 外观的最下方,你会发现一个「宠物」选项,官方提供了好几种宠物形象,包括默认的Codex宠物、小猪、小水滴等等。
宠物一共有三种状态:
- 待机状态:安安静静待在屏幕上卖萌
- 工作状态:你派发任务后,它会跟着一起"干活"
- 移动状态:拖动它的时候会有挣扎动画
任务完成后宠物还会打个勾告诉你搞定了,比老板的"辛苦了"有诚意多了。这不就是打工人的真实写照吗?待机时卖萌、干活时努力、被拖动时挣扎。情绪价值这块,Codex算是拿捏了。

三步自定义像素宠物:比泡面还简单
不喜欢官方宠物?自己做一个。通过Codex内置的Pixel Art相关Skills工具,三步就能搞出一只像素风小猪:
- 选择创建自定义宠物
- 系统自动生成头像、待机、移动、工作和伤心五种状态的像素图
- 文件自动存放在Codex目录下对应的宠物文件夹中
没错,系统还贴心地生成了"伤心状态"——我猜这是代码报错时的专属表情。宠物的本质就是几张图片素材,你的电子宠物不会饿死,因为它根本就没活过。但谁在乎呢,可爱就完事了。
Computer Use电脑操控功能:性能提升20%,多线程并行
这次Codex的Computer Use电脑操控能力迎来了实打实的升级:
- 速度提升20%:原来一分钟完成的任务,现在大约40秒搞定
- 容错率更高:操作更接近真人点击行为,不容易翻车
- 多线程并行:支持同时跑多个代理线程,互不干扰
举个例子,你可以让一个线程登QQ,另一个登微信,再来一个登谷歌,三条线同时跑,互不影响。以前我们嘲笑老板不会用电脑,以后老板可以嘲笑我们不会用AI了。

容错率更高、更接近真人点击这个描述,说实话让人有一种微妙的感觉——AI正在学习如何假装是人类。
图像识别能力增强:从近视眼升级到鹰眼
这次Codex的图像理解插件也跟着升级了,底层用的是GPT-4V和GPT-4o这类多模态模型来识别图像,对各种类型图片的理解都更加清晰准确。
翻译成人话就是:以前你截图给AI看,它说"这好像是个按钮";现在它能说"这是一个灰色的、被禁用的、鼠标悬停时会变蓝的提交按钮"。识别精度的提升,直接让Computer Use的操控也跟着受益。

侧边栏分支对话:写代码时的"支线剧情"
这个功能太懂程序员了。按住Shift键可以快捷打开侧边栏,基于当前会话开启一个临时的分支对话。
使用场景很好理解:你正在跟AI聊主线任务,突然冒出一个新想法,又不想打断当前对话——就像你看电影时突然想查演员八卦,但又不想按暂停。分支对话会自动引用原会话内容进行总结或回答,还支持HTML预览等内容的快速查看,面板可以随意拖动和隐藏。

记忆功能优化:从金鱼记忆进化到大象记忆
之前Codex的记忆机制是复用线程,说白了就是把之前的对话原封不动搬过来,又长又占空间。新版本把会话压缩得更加彻底,记忆功能明显好用了不少。
以前跟AI聊天像跟失忆症患者对话,每次都要从"你好我是谁我在哪"开始。现在它终于能记住你上次说了什么了——虽然这个功能在人类社交中叫"基本礼貌"。
导入Agent配置:从Cursor无缝迁移,叛逃之路从未如此丝滑
Codex现在支持导入其他IDE的Agent配置,比如Cursor的规则配置文件。导入之后,Codex会保留原有IDE的规则习惯,相当于直接复用你之前的工作流。
这一招太狠了。就相当于新开的火锅店跟你说:"把你在海底捞的口味偏好带过来,我们照着做。"迁移成本直接归零,Cursor用户的叛逃之路从未如此丝滑。IDE之间的抢人大战,已经从"我比你好用"升级到了"你不用重新适应"。

语音识别词库优化:终于教会了AI念你的术语
最后一个更新看似不起眼,实则是语音编程的关键拼图。Codex新增了自定义听写词库功能,你可以把常用的专业术语(比如"OpenClaw")加进去。
以前对着麦克风喊"OpenClaw",AI给你识别成"Open Claw"甚至"Open Call",改完心态都崩了。现在加入词库后一次就能正确识别,这种丝滑感,就像终于教会了Siri正确念你的名字一样令人感动。
写在最后
官方把宠物功能命名为"宠物组件",多么正经的名字,仿佛在说"我们不是在搞花活,我们是在做严肃的产品功能"。但你骗不了我,这分明就是给程序员的电子拓麻歌子。不过话说回来,一个能实时显示工作状态还能帮你跑自动化任务的宠物,确实比桌面上的多肉植物有用多了——至少它不会被你养死。
当你的IDE开始养宠物的时候,你就知道,AI工具的竞争已经从"谁更能干"卷到了"谁更可爱"——而最可怕的是,Codex两样都要。
相关推荐
产品体验Qoder vs Cursor实测对比:同样20美金谁更强?
实测对比Qoder和Cursor两款AI IDE,从Agent自主修复能力、人工沟通次数、架构决策等维度评测。Qoder仅需2次沟通完成任务,Cursor需8次。详细分析两者差异,帮你选择最适合的AI编程工具。
产品体验Cursor云Agent演示:打通软件开发全链路瓶颈
深度解析Cursor云Agent最新Demo,展示如何通过云端虚拟机、自动测试产物和全链路控制平面,系统性消除软件开发生命周期中的人类瓶颈,让Agent自主运行、人按需介入。
产品体验Cursor 3.0深度解析:多Agent并行、Design Mode与Best-of-N模型对比
Cursor 3.0正式发布,从AI辅助编程工具进化为Agent舰队指挥中心。本文详解多智能体并行、Design Mode可视化编辑、Best-of-N多模型择优等核心功能,解读AI编程新范式。