李博!你上周是不是又熬夜了,我看你朋友圈凌晨三点还在发什么Claude Code更新。
哈哈被你抓到了。没办法,Anthropic出了2.0版本,我手痒忍不住要试。
行,那正好今天聊聊。我们组最近也在评估要不要把Claude Code引入工作流,你先给我说说,这次更新到底值不值得关注?
我先抛个结论啊——这次更新不算炸裂,但非常务实。就是那种你用了之后会觉得,诶,终于把该补的坑补上了。
好,那我们一个一个聊。首先它默认换了Sonnet 4.5模型,这个你体感怎么样?
速度明显比Opus快,而且用了大概一周,没遇到什么离谱的错误。不过说实话,2025年了,各家最新模型都很强,你让我说Sonnet 4.5比GPT或者Gemini好多少,我真说不出来。
Anthropic自己发的benchmark说编码能力略优于Opus 4.1,但你懂的,每家发新模型都说自己'刚好比竞品好一点',这个在圈子里叫benchmark gaming,选对自己有利的维度测。
哈哈,懂了,王婆卖瓜。那有没有什么功能层面让你眼前一亮的?
有一个!按Tab键可以切换思考模式的开关。开启的时候模型会先做一轮内部推理——分解问题、评估方案、验证逻辑,就是Chain-of-Thought那套。关掉就直接出答案,快很多。
等会儿,这不就是让开发者自己选要不要让AI'多想一步'吗?
对!本质上就是在推理深度和响应速度之间给你选择权。简单的代码补全就关掉,复杂的多步骤重构就打开。这个设计我觉得很聪明。
诶那VS Code扩展呢?我看到说Cursor也能用,我们组有人用Cursor的。
扩展装上之后侧边栏会多一个Claude按钮,UI确实比终端友好很多,看代码变更的体验好了一大截。但是——
但是什么?
它不支持自动接受权限的模式。就是那个dangerously-skip-permissions标志。
真的假的?那不是每一步都要手动确认?
对啊!你想象一下,Agent要连续执行几十步操作,每一步都弹窗问你'允许吗',不光打断工作流,还会让Agent丢失执行上下文。GitHub上已经一堆人在喊了。
那现在等于说还是得老老实实用终端?
暂时是的。等Anthropic修了再说吧。
好,那来聊重头戏吧。我看这次有三个核心新功能,你觉得哪个最值得说?
我跟你说,Rewind回滚功能,这个是真的厉害。以前Claude Code改坏了代码,你只能在对话里说'undo what you just did',然后看着它尝试撤销——又慢又不靠谱。
对对对,我之前试过,它撤销的时候经常撤不干净,特别崩溃。
现在它会在每次代码变更时自动创建检查点。注意啊,这个跟Git不一样——Git是你主动commit,粒度你自己定。Claude的检查点是每一步操作都自动记录,而且同时保存对话上下文状态。
等等,你是说回滚的时候不光恢复代码,连AI当时的'记忆'也能恢复?
没错!回滚之后Agent回到那个时刻的思维状态,你不用重新解释一遍需求。而且你可以选只恢复代码、只恢复对话、或者都恢复。
这就很爽了。不过我猜肯定有限制吧?
你们产品经理直觉就是准。有三个限制:bash命令改的文件不回滚,你手动改的代码不回滚,只有Agent直接写入的才行。
那这不是在逼开发者把所有代码修改都交给AI吗?
Bingo!这其实跟现在流行的spec-driven development高度一致。开发者写规格说明,AI生成代码,你只负责审查。手动改代码只在最后微调UI之类的时候才做。
从产品经理角度说,这个趋势我是能感受到的。我们组现在写PRD越来越像在写AI的prompt了。
哈哈,你看,殊途同归了吧。
行,另外两个功能呢?/usage和Ctrl+R?
/usage解决了一个特别让人恼火的问题——之前Claude Code有周限额,但你完全不知道自己用了多少、还剩多少。
就很离谱,限额了但不告诉你余额?
对!而且它用的是5小时滑动窗口机制,不是每天零点重置那种。比如你下午两点用了一大波,这部分额度晚上七点才释放。以前我总在猜什么时候能恢复,现在/usage直接告诉你重置时间,一目了然。
这个功能虽然简单,但对规划工作节奏太重要了。
然后Ctrl+R是跨会话的提示词搜索。你可以搜到之前几个会话里用过的prompt,直接复用。
这个我能想到场景——比如对话太长需要compact压缩的时候,压缩完很多细节就丢了,用Ctrl+R把之前写好的关键prompt找回来补上?
完全正确。还有一个场景是多Agent并行工作的时候,你在Claude Code里写好的prompt可以快速复制到Cursor Agent或者Codex CLI里。本质上这是个上下文管理工具。
主动管理AI的短期记忆,而不是靠自动压缩。
对,这其实是用好AI编码工具的核心技能之一。很多人忽略了这一点。
嗯,聊下来感觉这次更新确实不算革命性,但每个功能都在解决真实的痛点。回滚、额度透明、上下文管理,组合在一起确实让这个工具更成熟了。
我觉得最值得关注的趋势是,这些功能都在推动开发者往spec-driven的方向走。写规格、审代码、管上下文,而不是自己一行行敲代码。工具在重新定义开发者的角色。
行,那我回去跟组里同步一下,先在终端模式跑起来试试。等侧边栏支持自动权限了再切过去。
对,记得养成看/usage的习惯,别到周五才发现额度用光了,哈哈。