李博!我昨天看到Anthropic发了个新模型,Haiku 4.5,你研究了没?
哈哈,你消息还挺快。研究了,而且我跟你说,这次挺有意思的。
我看了一眼定价就觉得离谱——每百万输入Token才1美元?这比上一代便宜了三分之二?
对,输入1美元,输出5美元,每百万Token。速度还快了将近一倍。你想想这意味着什么。
等会儿让我算算……我们之前有个客服场景,日均大概百万级请求,光API成本就是大头。这要是换过去……
省60%以上,轻轻松松。这就是它的杀手锏——很多项目卡在原型到生产这一步,不是技术不行,是成本扛不住。
对对对,我太有体会了。之前我们有个内容生成的项目,效果挺好,但算了算Token成本,老板直接说先搁着吧。
所以Haiku 4.5本质上是在降低AI商业化的门槛。你们产品经理最关心ROI对吧?这个模型就是给你们算账用的。
得了吧,我们关心的是用户体验好不好!不过……便宜归便宜,性能呢?轻量级模型会不会缩水很多?
这就是最炸裂的地方了。它在部分任务上,注意我说的是部分任务,居然超过了自家旗舰Sonnet 4.5。
真的假的?!小模型打赢大模型?
真的。特别是在计算机使用任务上——就是让AI直接操作电脑界面,浏览网页、填表单那种。Haiku 4.5的表现比Sonnet还好。
这怎么做到的?参数量不是小很多吗?
关键词:蒸馏。就是把大模型的知识高效压缩到小模型里。你可以理解为,大模型是百科全书,小模型是精编笔记,在特定考试里精编笔记反而更好使。
懂了懂了,就是针对性优化做得好。那编程和实时问答这些呢?
编程辅助、实时问答、客服响应,这三个场景它都很能打。特别是延迟低这一点,做聊天机器人或者智能助手的团队应该会很兴奋。
延迟这事儿我太懂了,用户等超过两秒就开始烦躁。
对嘛,所以速度翻倍不只是数字好看,是直接影响产品体验的。
诶,我还看到一个概念特别有意思——什么大脑加手脚的架构?你给我讲讲。
这个是我觉得Anthropic这次最有远见的设计。他们提出了一种多智能体协同策略:Sonnet 4.5当大脑,负责复杂推理和任务拆解,然后派出一堆Haiku 4.5当手脚,并行干活。
就像一个项目经理带一群执行力超强的员工?
哈哈,你这个类比很产品经理。但确实是这个意思——大脑想清楚怎么做,手脚快速执行,而且是并行的,效率极高。
那跟OpenAI的Swarm或者微软AutoGen比呢?
哦你还知道这些?
我们产品经理也是要做竞品调研的好吧!
行行行。Anthropic的优势在于,Sonnet和Haiku是同一家族的模型,API完全兼容,编排的工程复杂度低很多。别家的多智能体方案经常要对接不同厂商的模型,光调通信协议就够喝一壶的。
这不就是生态的力量嘛。对了,安全性方面呢?我记得之前用Claude经常被误拒,问个正常医学问题它都不回答。
这次Haiku 4.5的错误拒绝率是整个Claude系列里最低的,比Sonnet 4.5和Opus 4.1都低。
终于!这个真的太影响体验了。
对,早期的对齐方法太保守了,宁可错杀不可放过。现在他们用Constitutional AI加上精细的RLHF调优,做到了该拒的拒、不该拒的放行。
而且我看他们还公开了系统卡,训练数据来源、测试结果什么的都写了。这个透明度在行业里不多见吧?
确实不多见。而且这跟欧盟AI法案的要求是高度契合的,Anthropic显然在提前布局合规。
部署方面呢?我看已经上了AWS Bedrock和Google Vertex AI。
对,加上Claude自己的API和Claude Code。多平台同时上线意味着不存在云厂商锁定的问题,你用AWS就在Bedrock调,用GCP就在Vertex调。
而且已经在用Claude的团队迁移成本极低,换个API端点就行,业务代码不用动。
没错。所以你看,这个模型从成本、性能、架构设计、安全性到部署便利性,每个维度都在降低门槛。
我突然有个感慨——AI能力的民主化可能真的在加速。以前觉得顶级模型只有大厂用得起,现在好像不是了。
嗯,这是个很明确的趋势。顶级能力变得更快、更便宜、更易获取。Haiku 4.5不只是一个模型发布,它代表的是整个行业从实验走向大规模落地的转折点。
行,我回去就跟我们技术团队聊聊,看看那个被搁置的项目能不能重新算一笔账。
去吧去吧,算完了请我喝咖啡。