今天聊一个特别实在的话题——怎么几乎不花钱,就能用上顶级的AI编程工具。熟悉AI编程的朋友应该都知道Claude Code,界面好用、工具链丰富、提示工程做得非常成熟。但它有个让人特别头疼的问题。
对,就是模型锁定嘛。Claude Code只能用Anthropic自家的模型,你想用Gemini、DeepSeek?不好意思,不支持。而且成本真的不低,Claude Sonnet 4的API价格,输入token每百万3美元、输出15美元,高频使用的话账单看着挺肉疼的。
没错,虽然Anthropic有那个100美元和200美元的Max Plan月费套餐,但对很多独立开发者来说还是不便宜。那有人说,我直接用Gemini CLI或者Codex CLI不就行了?反正也是免费的。
嗯,这个想法可以理解,但实际体验差距还是挺大的。Gemini CLI和Codex CLI都是2025年才推出的,还处于比较早期的阶段。Claude Code经过长时间打磨,在图形界面、错误处理、第三方集成这些方面都成熟得多。尤其是MCP工具链的支持——Claude Code作为MCP协议的发起者,社区已经有几百个MCP服务器了,覆盖GitHub、Slack、数据库、浏览器自动化各种场景。Gemini CLI在这方面还是实验阶段。
所以本质上就是一个两难:Claude Code的体验最好,但模型选择被锁死了;其他工具模型自由,但体验跟不上。那今天要聊的Claude Code Router,就是来解决这个矛盾的?
对,而且解决得非常优雅。Claude Code Router是一个开源工具,它的原理其实不复杂——在你本地起一个代理服务器,拦截Claude Code发往Anthropic API的请求,然后做一个协议转换,把消息格式转成目标模型需要的格式,比如Gemini的API格式,再把响应结果转回来。对Claude Code来说,它完全感知不到底层模型变了。
你看这就很巧妙,相当于在中间加了一个翻译层。那我好奇一个细节,Claude Code内部其实不是只调一个模型对吧?
这是很多人不知道的一点。Claude Code内部其实是多模型协作的架构,不同任务用不同的模型。Claude Code Router针对这个设计了四种角色配置。第一种是后台模型,处理生成摘要、加载信息这些轻量任务,推荐用Gemini 2.0 Flash,速度快成本低。第二种是思考模型,这是核心,负责深度推理,推荐Gemini 2.5 Pro。第三种是通用模型,处理日常编码,也可以用Gemini 2.5 Pro。第四种是长上下文模型,处理大型项目代码的时候用。
等等,你提到Gemini 2.5 Pro,这个模型现在的免费额度是什么情况?
这是整个方案最吸引人的地方。Google现在给Gemini 2.5 Pro提供每天大约1500次的免费API请求额度,而且包含思考配额功能。你只需要去Google AI Studio注册一下,一键就能生成API Key,连信用卡都不用绑。Google这么做其实跟当年Google Maps API免费推广是一个思路,就是用免费策略快速扩大开发者生态。
每天1500次,对于大多数个人开发者来说确实够用了。那安装配置复杂吗?
特别简单,一条命令装好,然后ccr start启动。首次启动会引导你配置,就填三个东西:API的基础URL、API Key、还有模型名称。配完全局模型之后,你还可以给不同角色单独指定模型。比如后台任务用免费的Flash模型省配额,核心推理用Gemini 2.5 Pro保证质量,某些场景还能切到DeepSeek——它在中文编程场景下表现特别好,而且API价格只有同级别模型的几分之一。
这种灵活的模型分配策略,原版Claude Code是完全做不到的。那实际用起来效果怎么样?有没有什么明显的短板?
有人专门做了测试,用配了Gemini 2.5 Pro的Claude Code Router去写一个扫雷游戏。结果相当惊喜——MCP工具链完全正常运行,文件创建、编辑、执行都没问题;生成的代码没有报错,一次性就完成了功能开发。而且Gemini的超长上下文窗口,最高支持100万token,处理大型项目的时候甚至比原版Claude模型还有优势。
100万token,这大概是什么概念?
大约相当于70万个英文单词,或者数百个代码文件的总量。你可以把整个项目的代码库一次性丢给模型,不用担心信息被截断。传统模型的上下文窗口通常才8K到32K token,差距是非常大的。
那有没有什么需要注意的问题?
有两个小点。一个是差异编辑偶尔会出小错误——就是模型修改已有代码的时候,它不是重写整个文件,而是只输出变更的部分,类似Git diff。不同模型对这种特殊格式的支持程度不一样,所以偶尔会有格式偏差。不过这种情况很少见,而且可以通过插件系统解决。另一个是用免费API的时候响应速度会慢一些,因为免费请求的优先级低于付费用户,高峰期会被限流。切到付费模型就流畅多了。
你刚才提到插件系统,这个能展开说说吗?
其实这个设计挺聪明的。Claude Code原本的系统提示是专门为Claude模型优化的,直接转发给Gemini或DeepSeek可能会出现理解偏差。插件系统的作用就是在请求到达目标模型之前,自动调整系统提示的措辞和结构,让它更符合目标模型的理解习惯。比如针对DeepSeek就有专门的插件,能显著提升兼容性。
所以总结一下,Claude Code Router加上Gemini 2.5 Pro的免费API,本质上实现了一个什么效果呢?
一句话概括就是:工具层和模型层的解耦。你用Claude Code最好的前端体验、最成熟的工具链和MCP生态,但底层可以自由切换到当下最强或者性价比最高的模型。这其实代表了AI工具发展的一个重要趋势——没有哪家厂商能在所有场景永远领先,开发者需要的是随时能切换到最优选择的自由度。
确实,这种「最佳前端加最佳模型」的自由组合思路,可能会成为接下来AI编程工具的主流方向。对于想尝试的朋友,Claude Code加Claude Code Router加Gemini 2.5 Pro免费API这套组合,可能真的是2025年性价比最高的AI编程方案了。几乎零成本,但体验不打折,值得一试。