产品体验2026年5月23日· 1 分钟阅读· 918 字

MiniMax M2.5实测：10B参数如何跑出旗舰级编程能力

MiniMax M2.5以10B激活参数在编程任务上接近旗舰模型表现

MiniMax发布M2.5模型，采用MoE架构，仅10B激活参数就在编程任务上接近Claude Opus 4.6和GPT-5.2等旗舰模型。文章通过3D游戏开发、AI翻译平台搭建和博客项目创建等实际场景，评估其在Claude Code环境下的真实编程能力。

概述：10B参数凭什么叫板旗舰模型

MiniMax近期发布了最新一代模型M2.5，仅用10B的激活参数，就在编程任务上跑出了接近Claude Opus 4.6和GPT-5.2等旗舰级模型的表现。

10B激活参数背后的MoE架构

理解这一成就，需要先了解"激活参数"与"总参数"的区别。M2.5采用混合专家架构（Mixture of Experts，MoE）——与传统稠密模型每次推理都激活全部参数不同，MoE模型在处理每个token时，只会通过门控网络（Gating Network）动态路由，选择性地激活一小部分"专家"子网络。M2.5的总参数量可能远超10B，但每次推理只有10B参数真正参与计算。这一设计带来了显著的工程优势：显存占用与推理延迟均按激活参数量计算，而非总参数量。GPT-4、Mixtral等主流大模型也采用了类似的MoE思路，这已成为大模型"降本增效"的主流技术路径。

10B激活参数意味着什么？同样的显存和算力条件下，别人只能跑一个模型，你可以跑三个——推理速度是Opus的三倍，而价格依然保持"加量不加价"的策略。

本文通过3D游戏开发、AI翻译平台搭建以及博客项目创建等多个实际场景，全面评估M2.5在Claude Code环境下的真实编程能力。

bilibili source: 【实测】MiniMax M2.5 + Claude Code 挑战项目测评，结果离谱

依旧保持传统

提升了这么大的一个空间

这里有一个小细节

实测一：3D飞行竞速游戏开发

第一个测试任务是一个相当复杂的游戏需求：用Three.js创建一个3D飞行竞速游戏，要求支持键盘控制、包含音效，且不能使用外部音频资源。

Three.js与Web端3D开发的独特挑战

Three.js是目前最主流的WebGL封装库，由Ricardo Cabello（Mr.doob）于2010年创建并开源，将底层的WebGL图形API抽象为更易用的场景图（Scene Graph）模型，开发者无需直接编写GLSL着色器代码，即可完成3D场景构建、光照渲染、物理碰撞等复杂操作。在Web端实现3D游戏面临独特挑战：浏览器沙箱环境限制了本地文件访问，因此M2.5选择用Web Audio API的OscillatorNode动态合成音效，而非加载外部音频文件，这是一种典型的"约束驱动创新

#MiniMax M2.5 #AI编程模型 #Claude Code配置 #10B参数模型 #Spec规范驱动开发 #AI编程性价比 #M2.5实测 #开源编程模型

分享：