共 1 篇相关文章
独立测试者对Claude 4.5 Haiku进行全面实测,发现其在SVG生成、3D渲染、代理编码等任务中表现远低于预期。与GPT-5 Mini、GLM 4.6对比,性价比严重不足。深度分析Anthropic产品线困境与基准测试刷分隐忧。