播客频道 | Claude额度暴降20倍，GLM 4.6能否成为最佳平替？

最近开发者圈子里炸锅了，起因是Anthropic干了一件让很多人寒心的事——他们在推出Claude 4.5 Sonnet新模型的同时，悄悄把200美元Max套餐用户的Opus模型额度砍了大概20倍。你想想，每个月花200美元订阅的用户，一觉醒来发现自己能用的量缩水到原来的二十分之一，这搁谁谁不火大？对，这事儿确实挺离谱的。你得先理解Anthropic的产品线——Opus、Sonnet、Haiku，从高到低三档。Opus是旗舰，参数量最大，处理复杂推理、大型代码重构、跨文件依赖分析这些硬活儿的时候，Sonnet真的比不了。很多专业开发者之所以愿意掏200美元，就是冲着Opus去的。所以本质上就是，用户付了顶级的钱，结果被强制降级到中端体验。没错。而且Anthropic给的替代方案是什么呢？新出的Claude 4.5 Sonnet。但实际用下来，性能提升也就10%左右，跟Opus在调试、架构规划这些复杂任务上的差距还是很明显的。你说你推个新模型，结果把老用户最依赖的东西砍了，这不是釜底抽薪嘛。我看Reddit上的反应也是相当激烈，还有人怀疑Anthropic给200美元套餐提供的其实是量化版模型？这个量化是怎么回事？嗯，量化简单说就是一种模型压缩技术。比如原来模型的权重是用32位浮点数存的，量化之后可能降到8位甚至4位整数。这样GPU显存占用和推理成本都能大幅下降，但代价是模型在一些精细推理、边缘案例处理上会打折扣。INT8量化影响还好，通常1-2%以内，但如果搞INT4甚至更激进的量化，在代码生成、数学推理这些对精度敏感的任务上，质量下降就很明显了。关键是用户不知情啊，如果真的在背后偷偷用了量化版，这就是商业透明度的问题了。对，而且这不是个案。其实已经有多家AI公司被社区发现在没有公开声明的情况下对API用了量化模型。这已经成了行业透明度争议的一个焦点。Anthropic曾经是最受开发者喜爱的AI公司之一，但这一系列操作下来，信任消耗得非常快。说到这儿，我们得聊聊定价了。Claude 4.5 Sonnet的API价格，输入3美元、输出15美元每百万Token。这个数字单看可能没感觉，但一对比就吓人了。你看GLM 4.6，性能跟Claude 4.5 Sonnet基本对标，输入才0.6美元，输出2.2美元每百万Token，价差将近10倍。你想在编码场景里，一次复杂的代码生成请求可能消耗几千到几万个Token，高频使用下这个费用累积起来是很可观的。10倍价差在实际开发预算里就是天壤之别。这里可能有听众会问，为什么输出Token比输入Token贵那么多？这其实跟大语言模型的生成机制有关。输入Token可以并行处理，一次性算完。但输出是自回归的，每生成一个新Token都要把前面所有已生成的Token重新算一遍注意力权重，计算量跟序列长度成正比，整体近似平方关系增长。所以所有主流API提供商都对输出收更高的价格，这是有技术原因的。那我们来好好聊聊GLM 4.6。它在Claude 4.5 Sonnet发布仅一天后就推出了，感觉是有备而来。确实，而且它有几个非常实在的优势。首先是20万Token的上下文窗口，这个在处理大型代码库的时候特别关键。你想一个中等规模的代码文件就有几千个Token，一个完整项目涉及几十个文件，20万Token大概相当于一本500页技术书的信息量，模型可以一次性看到整个项目的全貌，给出的建议自然更准确。然后还有一个我觉得很重要的点——它是开放权重模型。这个太关键了。开放权重意味着开发者可以把模型下载到本地或者私有云上部署，数据不用出自己的基础设施。更重要的是避免了供应商锁定——你看Claude用户现在的遭遇，厂商说改条款就改条款，说砍额度就砍额度。但如果你用的是开放权重模型，就算厂商明天倒闭了，你手里的模型照样能用。这对金融、医疗这些对数据主权有严格要求的行业来说，简直是刚需。还有一个我注意到的特性是内置MCP服务器，这个能展开说说吗？ MCP全称是Model Context Protocol，模型上下文协议。你可以把它理解成AI模型和外部工具之间的一个标准化桥梁。有了MCP服务器，模型在生成代码的同时可以去查最新文档、搜索代码仓库、甚至执行代码验证，形成一个闭环的开发体验。不用你在各种工具之间来回切换、复制粘贴。GLM 4.6内置了网页搜索和视觉功能的MCP服务器，开箱即用，这个体验是很丝滑的。定价方面呢？我看GLM的编码套餐也挺有意思的。他们的策略确实很激进。基础版月付从3美元起，专业版15美元，高级版30美元。而且如果你选择年付或者季付，价格直接锁定在初始价不涨。算下来，花跟Claude月费差不多甚至更低的钱，能拿到一整年的服务，额度还远超Claude Max套餐。这么一对比，确实很难不心动。不过我想客观地说，这个市场现在不只是Claude和GLM两家在打。对，GPT-5 Codex、Gemini都在编码领域发力，Cursor、Windsurf、Cline这些新兴工具也在通过更深度的IDE集成抢市场。其实整个AI编码已经从简单的代码补全进化到Agent式的自主编码了——模型能理解项目结构、执行终端命令、跑测试然后根据结果自我修正。这种能力跃迁让底层模型的选择变得更关键，竞争也更白热化。所以本质上是市场从卖方市场转向了买方市场，开发者终于有了更多话语权。没错。任何试图通过锁定用户和高溢价来维持利润的策略，阻力只会越来越大。Anthropic现在的路子，越来越像它曾经试图区别于的OpenAI——刻意挑选基准测试、不公平的模型对比、价格持续攀升。这条路走下去，开发者社区的信任只会继续流失。最后给听众一个实在的建议吧。如果现在要重新评估自己的工具链，你觉得该怎么想这个问题？我觉得核心就四个维度：性价比、开放性、功能完整性、价格稳定性。Claude Sonnet在某些场景下确实还是好用的，但'最好用'和'最有性价比'是两回事。当价差到了10到20倍的时候，微小的性能差异真的很难证明高价的合理性。如果你正在为Claude的额度限制和费用发愁，GLM 4.6至少值得认真试一试。AI编码工具的竞争才刚开始，最终受益的一定是我们这些有更多选择权的开发者。

Claude额度暴降20倍，GLM 4.6能否成为最佳平替？

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报