最近国产大模型圈又炸了一个大新闻——智谱发布了GLM-4.5,号称综合排名全球第三,国产第一,开源第一。这个成绩单一出来,我身边搞开发的朋友基本都在讨论。今天我们就来好好聊聊,这个模型到底实力如何,普通人和开发者分别怎么用起来。
对,这个排名确实挺炸裂的。我先说一下背景吧,智谱AI是清华大学计算机系孵化出来的公司,2019年成立的,核心团队就是清华的。他们的GLM架构其实一直比较有特色,跟GPT的纯自回归、BERT的纯掩码都不一样,用的是一种自回归填空的预训练范式,所以在理解和生成两头都比较强。
嗯,你说的这个全球第三,具体是怎么排的?因为我知道不同排行榜标准差别挺大的。
这个问题问得好。所谓综合排名,一般是把MMLU、HumanEval、GSM8K这些主流评测基准的分数做加权汇总。MMLU测的是多任务语言理解,HumanEval测代码生成,GSM8K测数学推理,还有GPQA这种研究生级别的问答。不过说实话,单一排名不能完全代表实际体验,不同场景下表现可能差异很大。但有一点是确定的——在开源模型这个赛道里,GLM-4.5确实跑赢了Kimi、通义千问这些国内选手,差距还挺明显的。
这里可能有些听众不太清楚开源和闭源的区别,你能简单说一下吗?
简单来说,开源模型就是把模型权重、架构都公开了,你可以自己下载、部署、甚至魔改。闭源模型呢,像GPT-4o、Claude这些,你只能通过API调用,看不到里面的东西。开源的好处是数据隐私可控,可以本地跑,社区还能持续优化。以前开源模型跟闭源的差距很大,但GLM-4.5这次能逼近闭源模型的表现,说明这个鸿沟在快速缩小,这对整个行业格局影响挺深远的。
除了性能,我觉得GLM-4.5还有一张特别能打的牌——价格。每百万Token输入才0.8元?
对,这个价格真的是白菜价了。我给大家换算一下,一百万Token大概对应五六十万个汉字,处理这么多内容只要八毛钱。作为对比,GPT-4o的输入价格大概是每百万Token 18块人民币,差了二十多倍。你看,现在国内大模型打价格战打得多狠——2024年初百万Token还要几十块,到现在已经降到个位数了。对开发者来说这绝对是好消息。
好,聊完实力和价格,我们来说说具体怎么用。其实GLM-4.5有两种用法,网页版和API。网页版是完全免费的对吧?
没错,直接访问z.ai,登录就能用,不用充值不用绑卡。网页版里我最推荐两个功能:全栈开发和PPT生成。全栈开发模式真的很惊艳,它用的是Agent模式——就是AI不只是回答问题,而是能自己拆解任务、调用工具、一步步执行。你给它一句话,比如说「帮我做一个模拟必应官网的网站」,它会自动列出待办事项,然后逐个完成,写前端、写后端、跑起来,全程自动化。
等等,它怎么能直接跑代码呢?用户本地又没装开发环境。
这就是它厉害的地方了。它内置了代码沙箱,底层一般是用Docker容器或者WebAssembly做的隔离执行环境。AI生成的代码直接在云端沙箱里跑,你在浏览器里就能看到实时效果,完全不需要本地配任何东西。这个思路其实跟Replit、CodeSandbox这些在线IDE类似,但把它跟大模型的代码生成能力结合起来,体验就完全不一样了。
那实际效果怎么样?比如你说的那个模拟必应官网。
实测下来还挺惊喜的,外观高度还原,搜索功能可用,界面还带动效。除了网站,你还可以让它做小游戏、3D交互场景之类的,基本一次成型。另外PPT生成也很实用,一句话描述需求,它就能生成逻辑清晰、排版美观的幻灯片,还支持在线编辑和导出PDF。经常赶汇报材料的人真的可以试试,效率提升不是一点半点。
好,网页版说完了,我们来聊开发者更关心的——API搭配Claude Code的玩法。这个组合我最近听好多人在推荐。
嗯,这套组合确实性价比很高。先说Claude Code是什么——它是Anthropic出的命令行AI编程工具,跑在终端里,能直接读写你本地的项目文件、执行Shell命令、跑测试,比Copilot那种IDE插件更像一个真正的结对编程伙伴。它有个很关键的特性,就是支持通过环境变量配置自定义的API端点和模型。
也就是说,你可以把底层模型从Claude换成GLM-4.5?
对,这就是精髓所在。因为现在几乎所有模型提供商都兼容OpenAI的API格式,这已经成了事实标准了。你只需要改一下API地址和密钥,就能无缝切换模型。所以你可以保留Claude Code优秀的交互体验,同时用GLM-4.5的低价来跑,成本一下子就降下来了。
具体操作复杂吗?
其实很简单,三步走。第一步确认本地有Node.js 20以上版本,命令行输入node -v就能查。第二步用npm安装Claude Code。第三步去智谱BigModel官网拿API Key,配到环境变量里,然后终端输入claude启动就行了。最低充值6.9元就能开始用,对于个人开发者来说门槛非常低。不过我要提醒一句,API Key一定要保管好,别放到公开的代码仓库里,不然额度可能被盗用。
好,最后帮大家总结一下。如果你是普通用户,直接上z.ai网页版,全栈开发和PPT生成免费用,零成本体验。如果你是开发者,花6.9块充个API,搭配Claude Code就能搭出一套很能打的编程工作流。
其实我觉得GLM-4.5最大的意义不只是它自己有多强,而是它代表了一个趋势——顶级AI能力的使用门槛在急速下降。一年前你想用这个级别的模型,成本可能是现在的几十倍。现在国产大模型卷成这样,最终受益的还是用户和开发者。所以如果你一直在观望,现在确实是个很好的上手时机。
说得好。国产大模型这场仗越打越精彩,我们也会持续关注后续的发展。对GLM-4.5感兴趣的朋友,不妨今天就去试试,反正网页版又不要钱,对吧?