最近我身边越来越多开发者朋友跟我说,他们开始把主力编程工具从Cursor切到Claude Code了。一开始我还觉得是个别现象,后来发现这个趋势还挺明显的。今天正好请到了对AI编程工具有深入研究的林老师,咱们来聊聊这背后到底发生了什么。
对,这个趋势确实很有意思。其实要理解Claude Code为什么突然火了,得先搞清楚一个底层逻辑——你看Cursor也好,Windsurf也好,它们底层用的模型其实都是一样的,比如都可以调Claude 4.0。那为什么体验会不同呢?
对,这个问题我也想过。模型一样,差别到底在哪?
差别在于工具调用这一层。你可以这样理解:大语言模型本身就像一个超级大脑,它懂很多东西,但它没有手。它不能自己去打开一个文件、不能自己去执行代码。所以这些IDE要做的事情,就是给这个大脑装上手脚——定义一套工具,比如读文件的工具、写文件的工具、运行命令的工具,然后告诉模型你可以用这些工具去完成任务。
嗯,就像给大脑配了一套操作系统。
没错,非常好的类比。而且不光是配什么工具的问题,还有工具调用的顺序怎么编排、多轮调用之间上下文怎么管理,这些工程细节直接决定了用户体验。这也是为什么Windsurf要开发自己的模型,Cursor融了9亿美元也准备做同样的事——因为当大家都用同一个底层模型的时候,工具层就是唯一能拉开差距的地方。
所以本质上Cursor和Windsurf是在工具层这个维度上竞争。那Claude Code的出现,是怎么打破这个格局的?
这就是最关键的一点了。Claude Code是Anthropic自己做的,也就是说,开发模型的人亲自来构建工具调用系统。你想想,谁最了解Claude这个模型的脾气?当然是造它的人。他们可以让模型专门针对这些工具做优化,形成一种深度的协同。这种优势是第三方厂商几乎没法复制的。
这就有点像苹果做芯片和系统的逻辑了——软硬一体化的优势。
对对对,就是这个道理。而且有个很有说服力的细节——Anthropic 95%的工程师都在用Claude Code,只有极少数人还在用Vim或者Cursor。它最早其实是个内部工具,后来才开放出来的。你想,这帮人天天跟模型打交道,他们选择用什么工具,本身就说明问题了。
确实。那在实际使用体验上,Claude Code跟Cursor的差距大吗?
差距主要体现在代理能力上。所谓代理能力,就是AI不再是你问一句它答一句,而是它能自己规划任务、分解步骤、执行操作,遇到问题还能自动调整。Claude Code有个自动模式,开启之后它会持续执行直到任务完成,还会主动写测试、验证代码。有个开发者的描述特别生动,他说在Cursor和Windsurf上试了30分钟搞不定的东西,Claude Code一个提示就解决了,他输入完prompt出去倒杯水回来,活儿就干完了。
哈哈,这也太夸张了。不过话说回来,是不是意味着Cursor就可以扔掉了?
其实不是的,这也是我觉得很多人容易走极端的地方。目前最佳实践反而是把它们组合起来用。Claude Code放在左上角当执行者,负责实际的代码编写和修改;Cursor的Chat功能当助手,用来提问、理解代码库、构建思路;终端保持可用,随时看运行状态。这样你既能享受Claude Code强大的代理能力,又有Cursor友好的图形界面。
这个思路挺务实的。那市面上还有OpenAI的Codex和Devin,它们跟Claude Code怎么比?
这三个的定位其实挺不一样的。Codex最大的特点是在云端运行,好处是零配置,对非技术用户很友好,但坏处是你受限于OpenAI允许的环境,没法自由安装依赖,处理敏感密钥也有安全顾虑。Claude Code是本地运行的,灵活性和安全性都更好。而Devin呢,它更像是企业内部的一个AI程序员,擅长在已有代码库上做功能开发和维护,可以通过Slack接收指令,但很少有人用它从零开始建项目。
明白了,各有各的生态位。对了,你刚才提到代码审查,这块能展开说说吗?AI写的代码真的靠谱吗?
这是个特别好的问题。AI生成的代码通常能跑起来,但可能存在安全漏洞、性能瓶颈或者架构不一致这些隐性问题。而且AI在长时间编码过程中会逐渐丢失上下文。所以现在有个工具叫CodeRabbit,专门做AI代码审查的,它能一次性审视所有代码变更,捕捉问题,还能生成修复提示直接粘贴到Claude Code里去改。这种编码AI加审查AI的双重保障模式,正在成为行业最佳实践。
编码的AI和审查的AI互相制衡,这个思路挺巧妙的。
嗯,而且还有一个更大的事情值得关注——Anthropic正在推出Claude Code的SDK。这意味着任何人都可以在Claude Code之上构建自己的编程工具。你可以把它理解成Anthropic把Claude Code从一个工具升级成了一个开放平台,就像Stripe把复杂的支付能力封装成简单的API一样。以后可能会涌现出大量垂直领域的编程工具,比如专门做React开发的、专门做WordPress的。
这对Cursor和Windsurf来说压力就更大了。
确实。不过它们也在自救,Cursor在做移动端和后台代理,Windsurf推出了自己的SWE-1模型,专门针对软件工程任务训练的。但说实话,要训练一个能跟Claude竞争的模型,需要的算力和数据投入是巨大的,对创业公司来说是一场豪赌。
最后一个问题,对于普通开发者来说,现在应该怎么选?
我的建议是不要站队。Claude Code负责执行,Cursor或Windsurf负责界面和交互,CodeRabbit负责质量把关,组合着用。另外技术栈的选择上,优先选AI擅长处理的,比如TypeScript,因为它的类型系统相当于给AI提供了额外的语义信息,AI生成代码出错时编译器会立刻报错,形成一个自我验证的反馈循环。在这个快速变化的时代,灵活性比忠诚度重要得多。
说得好。模型厂商亲自下场做工具,这个趋势确实值得所有开发者关注。工具在变,工作流在变,但核心逻辑不变——谁最懂模型,谁就能造出最好的工具。好了,今天关于AI编程工具格局变化的话题就聊到这儿,大家可以自己去试试Claude Code加IDE的组合工作流,亲身感受一下差别。