共 1 篇相关文章
深度实测Nex N2 Pro开源Agent模型,对比官方Benchmark与独立评测结果。397B参数模型在前端生成、代码输出方面表现不俗,但官方跑分与真实能力存在明显差距,实际排名第十二而非前五。