最近开发者圈子里炸锅了,起因是Anthropic干了一件让很多人寒心的事——他们在推出Claude 4.5 Sonnet新模型的同时,悄悄把200美元Max套餐用户的Opus模型额度砍了大概20倍。你想想,每个月花200美元订阅的用户,一觉醒来发现自己能用的量缩水到原来的二十分之一,这搁谁谁不火大?
对,这事儿确实挺离谱的。你得先理解Anthropic的产品线——Opus、Sonnet、Haiku,从高到低三档。Opus是旗舰,参数量最大,处理复杂推理、大型代码重构、跨文件依赖分析这些硬活儿的时候,Sonnet真的比不了。很多专业开发者之所以愿意掏200美元,就是冲着Opus去的。
所以本质上就是,用户付了顶级的钱,结果被强制降级到中端体验。
没错。而且Anthropic给的替代方案是什么呢?新出的Claude 4.5 Sonnet。但实际用下来,性能提升也就10%左右,跟Opus在调试、架构规划这些复杂任务上的差距还是很明显的。你说你推个新模型,结果把老用户最依赖的东西砍了,这不是釜底抽薪嘛。
我看Reddit上的反应也是相当激烈,还有人怀疑Anthropic给200美元套餐提供的其实是量化版模型?这个量化是怎么回事?
嗯,量化简单说就是一种模型压缩技术。比如原来模型的权重是用32位浮点数存的,量化之后可能降到8位甚至4位整数。这样GPU显存占用和推理成本都能大幅下降,但代价是模型在一些精细推理、边缘案例处理上会打折扣。INT8量化影响还好,通常1-2%以内,但如果搞INT4甚至更激进的量化,在代码生成、数学推理这些对精度敏感的任务上,质量下降就很明显了。
关键是用户不知情啊,如果真的在背后偷偷用了量化版,这就是商业透明度的问题了。
对,而且这不是个案。其实已经有多家AI公司被社区发现在没有公开声明的情况下对API用了量化模型。这已经成了行业透明度争议的一个焦点。Anthropic曾经是最受开发者喜爱的AI公司之一,但这一系列操作下来,信任消耗得非常快。
说到这儿,我们得聊聊定价了。Claude 4.5 Sonnet的API价格,输入3美元、输出15美元每百万Token。这个数字单看可能没感觉,但一对比就吓人了。
你看GLM 4.6,性能跟Claude 4.5 Sonnet基本对标,输入才0.6美元,输出2.2美元每百万Token,价差将近10倍。你想在编码场景里,一次复杂的代码生成请求可能消耗几千到几万个Token,高频使用下这个费用累积起来是很可观的。10倍价差在实际开发预算里就是天壤之别。
这里可能有听众会问,为什么输出Token比输入Token贵那么多?
这其实跟大语言模型的生成机制有关。输入Token可以并行处理,一次性算完。但输出是自回归的,每生成一个新Token都要把前面所有已生成的Token重新算一遍注意力权重,计算量跟序列长度成正比,整体近似平方关系增长。所以所有主流API提供商都对输出收更高的价格,这是有技术原因的。
那我们来好好聊聊GLM 4.6。它在Claude 4.5 Sonnet发布仅一天后就推出了,感觉是有备而来。
确实,而且它有几个非常实在的优势。首先是20万Token的上下文窗口,这个在处理大型代码库的时候特别关键。你想一个中等规模的代码文件就有几千个Token,一个完整项目涉及几十个文件,20万Token大概相当于一本500页技术书的信息量,模型可以一次性看到整个项目的全貌,给出的建议自然更准确。
然后还有一个我觉得很重要的点——它是开放权重模型。
这个太关键了。开放权重意味着开发者可以把模型下载到本地或者私有云上部署,数据不用出自己的基础设施。更重要的是避免了供应商锁定——你看Claude用户现在的遭遇,厂商说改条款就改条款,说砍额度就砍额度。但如果你用的是开放权重模型,就算厂商明天倒闭了,你手里的模型照样能用。这对金融、医疗这些对数据主权有严格要求的行业来说,简直是刚需。
还有一个我注意到的特性是内置MCP服务器,这个能展开说说吗?
MCP全称是Model Context Protocol,模型上下文协议。你可以把它理解成AI模型和外部工具之间的一个标准化桥梁。有了MCP服务器,模型在生成代码的同时可以去查最新文档、搜索代码仓库、甚至执行代码验证,形成一个闭环的开发体验。不用你在各种工具之间来回切换、复制粘贴。GLM 4.6内置了网页搜索和视觉功能的MCP服务器,开箱即用,这个体验是很丝滑的。
定价方面呢?我看GLM的编码套餐也挺有意思的。
他们的策略确实很激进。基础版月付从3美元起,专业版15美元,高级版30美元。而且如果你选择年付或者季付,价格直接锁定在初始价不涨。算下来,花跟Claude月费差不多甚至更低的钱,能拿到一整年的服务,额度还远超Claude Max套餐。
这么一对比,确实很难不心动。不过我想客观地说,这个市场现在不只是Claude和GLM两家在打。
对,GPT-5 Codex、Gemini都在编码领域发力,Cursor、Windsurf、Cline这些新兴工具也在通过更深度的IDE集成抢市场。其实整个AI编码已经从简单的代码补全进化到Agent式的自主编码了——模型能理解项目结构、执行终端命令、跑测试然后根据结果自我修正。这种能力跃迁让底层模型的选择变得更关键,竞争也更白热化。
所以本质上是市场从卖方市场转向了买方市场,开发者终于有了更多话语权。
没错。任何试图通过锁定用户和高溢价来维持利润的策略,阻力只会越来越大。Anthropic现在的路子,越来越像它曾经试图区别于的OpenAI——刻意挑选基准测试、不公平的模型对比、价格持续攀升。这条路走下去,开发者社区的信任只会继续流失。
最后给听众一个实在的建议吧。如果现在要重新评估自己的工具链,你觉得该怎么想这个问题?
我觉得核心就四个维度:性价比、开放性、功能完整性、价格稳定性。Claude Sonnet在某些场景下确实还是好用的,但'最好用'和'最有性价比'是两回事。当价差到了10到20倍的时候,微小的性能差异真的很难证明高价的合理性。如果你正在为Claude的额度限制和费用发愁,GLM 4.6至少值得认真试一试。AI编码工具的竞争才刚开始,最终受益的一定是我们这些有更多选择权的开发者。