共 2 篇相关文章
通过网页生成、编程开发、财报分析、视频理解、Computer Use五个真实任务,实测对比MiniMax M3与Claude、GPT Codex、Gemini的表现差异,含价格对比和使用建议。
MiniMax M3全量发布后实测评分仅58.3分。通过3D场景复刻、物理模拟、光学折射、前端开发等7项硬核任务,深度揭示M3原生多模态模型的真实编码能力与工程落地短板。