共 1 篇相关文章
Google Gemini 3.1 Pro发布,ARC-AGI-2抽象推理得分77.1%断档领先,GPQA Diamond 94.3%、编程ELO 2887多项登顶。本文从推理、编程、搜索等维度横向对比o4和GPT-5.2,揭示其真实实力与短板。