AI周报：Codex子代理、MiniMax M2.7、英伟达GTC与Claude百万token窗口

本周AI动态速览

本周AI领域迎来密集更新，从OpenAI的Codex子代理功能到MiniMax即将发布的M2.7模型，再到英伟达GTC大会的多项重磅发布，以及Claude Code的百万token上下文窗口升级。本文梳理本周最值得关注的AI动态。

OpenAI Codex引入子代理：云端编码的新范式

OpenAI为Codex推出了子代理（Sub-Agent）功能，这是一项可能改变开发者工作流程的重大更新。

子代理架构的技术根基源于多智能体系统（Multi-Agent Systems）的研究传统。在经典的AI代理理论中，单一代理面临"任务分解瓶颈"——当任务复杂度超过单个上下文窗口或单一专业能力范围时，性能会急剧下降。子代理模式借鉴了软件工程中的微服务架构思想：将一个庞大的单体任务拆解为多个专注的子任务，由专门优化的代理分别处理，再通过协调层（Orchestrator）整合结果。不同子代理可以加载不同的系统提示、使用不同的模型版本，甚至拥有不同的工具访问权限，从而在各自擅长的领域发挥最大效能。

子代理的核心理念是：你可以在主工作环境中启动多个专业代理，让它们并行处理任务的不同部分，最终智能整合输出为统一结果。

具体来说，开发者现在可以一次性创建多个专业代理，每个代理负责任务的不同部分。你还能根据不同任务重新设置自定义代理的表现和模型配置，调整指令参数。这意味着你不再依赖通用代理，而是在打造一支专注的AI协作团队。

对于处理庞大代码库的复杂流程，或者执行多步骤的功能规划，这种并行工作模式将带来显著的效率提升。这也让Codex成为云端代码开发领域的强大竞争者。

MiniMax M2.7即将发布：开源模型再添猛将

MiniMax本周几乎确认即将发布新模型M2.7。在Designer AI的测试中，该模型已经以"MiniMax M2.7"的名称出现，这基本预示着正式发布在即。

理解M2.7的意义，需要放在开源大模型竞争格局中审视。 以Meta的LLaMA系列为起点，开源模型逐渐从"闭源模型的廉价替代品"演变为真正的技术竞争者。MiniMax作为中国AI独角兽，其模型架构采用了混合专家（MoE）与线性注意力的创新组合，在推理效率上具有独特优势。开源模型的代码生成能力提升尤为显著——这得益于大规模代码训练数据，以及针对编程任务的专项强化学习（RLHF/RLAIF）微调。UI构建测试（如生成MacOS界面）已成为评估模型"多模态理解+代码生成"综合能力的标准基准之一。

从测试表现来看，M2.7在代码生成方面展现出令人印象深刻的能力。测试者让它构建一个MacOS操作系统界面，结果相当出色——它成功制作出了响应良好的底部工具栏，几乎完成了所有应用程序的编码，每个应用都有流畅的动画效果。

MiniMax M2.7生成的MacOS界面效果

虽然在某些细节上（如文件管理器内容）还有不足，但整体而言，M2.7在实现操作系统主要功能方面表现出色，相比之前的模型有了明显进步。

值得一提的是，VS Code的代理模式近几个月发展迅速，新推出的代理浏览工具让代理可以与实时浏览器互动——打开网页、读取内容、点击页面元素并实时验证修改。这标志着AI编码工具正从单纯的代码生成迈向真正的自主测试能力。

英伟达GTC 2026：从Neutron Ultra到DLSS 5

英伟达GTC大会带来了多项重磅发布：

Neutron Ultra与Nemo Cloud

Neutron Ultra是英伟达最新的推理优化模型，专注于工作流程、机器人和安全AI。配套推出的Nemo Cloud是基于Open Cloud开发的开源平台，支持安全运行Neutron模型，让用户能在自己的设备上实现生活自动化。

DLSS 5：AI驱动的游戏画面革命

AI驱动的DLSS 5将在今年秋季推出，承诺提升每个像素的逼真光影效果，优化材质渲染，让游戏世界比以往更接近真实。

DLSS的演进历程清晰展示了AI技术在实时图形渲染领域的渗透轨迹：DLSS 1.0（2018年）依赖卷积神经网络进行图像重建；DLSS 2.0引入时间超采样（Temporal Super Sampling），利用前帧信息大幅提升画质稳定性；DLSS 3.0加入"帧生成"（Frame Generation）技术，通过AI预测并插入中间帧将帧率翻倍；DLSS 4则实现多帧生成（Multi Frame Generation）。即将到来的DLSS 5聚焦像素级光影与材质渲染的神经网络重建，代表着从"图像放大"向"场景理解与重建"的范式跃迁——每一代的核心突破都建立在前代积累的神经网络推理能力之上。

Mistral小型版发布

Mistral发布了一个紧凑但功能全面的模型，包含128个专家，总参数达1190亿。速度提升40%，吞吐量达到原来的三倍，拥有56万token的上下文窗口。这是他们首次将旗舰模型的所有能力整合到一个多功能模型中。

理解"128个专家、总参数1190亿"需要了解混合专家（MoE）架构的工作原理。 MoE模型在处理每个token时，并不激活全部1190亿参数，而是通过一个轻量级的"路由器

AI周报：Codex子代理、MiniMax M2.7、英伟达GTC与Claude百万token窗口

本周AI动态速览

OpenAI Codex引入子代理：云端编码的新范式

MiniMax M2.7即将发布：开源模型再添猛将

英伟达GTC 2026：从Neutron Ultra到DLSS 5

Neutron Ultra与Nemo Cloud

DLSS 5：AI驱动的游戏画面革命

Mistral小型版发布

相关推荐

GitHub Agent HQ发布：AI编程工具进入平台化竞争时代

Gemini 3.5 Flash在GDPval基准上实现巨大飞跃

Google Gemini Antigravity周配额三倍提升，AI编程不再受限