AI周报:Codex子代理、MiniMax M2.7、英伟达GTC与Claude百万token窗口

本周AI领域密集更新,涵盖OpenAI Codex子代理、MiniMax M2.7、英伟达GTC等重磅发布。
本周AI领域迎来多项重要更新:OpenAI为Codex推出子代理功能,支持多个专业代理并行处理复杂编码任务;MiniMax即将发布M2.7模型,在代码生成方面表现出色;英伟达GTC大会发布Neutron Ultra推理模型、DLSS 5游戏画面技术及Nemo Cloud开源平台;Mistral发布128专家、1190亿参数的紧凑多功能模型。
本周AI动态速览
本周AI领域迎来密集更新,从OpenAI的Codex子代理功能到MiniMax即将发布的M2.7模型,再到英伟达GTC大会的多项重磅发布,以及Claude Code的百万token上下文窗口升级。本文梳理本周最值得关注的AI动态。
OpenAI Codex引入子代理:云端编码的新范式
OpenAI为Codex推出了子代理(Sub-Agent)功能,这是一项可能改变开发者工作流程的重大更新。
子代理架构的技术根基源于多智能体系统(Multi-Agent Systems)的研究传统。在经典的AI代理理论中,单一代理面临"任务分解瓶颈"——当任务复杂度超过单个上下文窗口或单一专业能力范围时,性能会急剧下降。子代理模式借鉴了软件工程中的微服务架构思想:将一个庞大的单体任务拆解为多个专注的子任务,由专门优化的代理分别处理,再通过协调层(Orchestrator)整合结果。不同子代理可以加载不同的系统提示、使用不同的模型版本,甚至拥有不同的工具访问权限,从而在各自擅长的领域发挥最大效能。
子代理的核心理念是:你可以在主工作环境中启动多个专业代理,让它们并行处理任务的不同部分,最终智能整合输出为统一结果。
具体来说,开发者现在可以一次性创建多个专业代理,每个代理负责任务的不同部分。你还能根据不同任务重新设置自定义代理的表现和模型配置,调整指令参数。这意味着你不再依赖通用代理,而是在打造一支专注的AI协作团队。
对于处理庞大代码库的复杂流程,或者执行多步骤的功能规划,这种并行工作模式将带来显著的效率提升。这也让Codex成为云端代码开发领域的强大竞争者。
MiniMax M2.7即将发布:开源模型再添猛将
MiniMax本周几乎确认即将发布新模型M2.7。在Designer AI的测试中,该模型已经以"MiniMax M2.7"的名称出现,这基本预示着正式发布在即。
理解M2.7的意义,需要放在开源大模型竞争格局中审视。 以Meta的LLaMA系列为起点,开源模型逐渐从"闭源模型的廉价替代品"演变为真正的技术竞争者。MiniMax作为中国AI独角兽,其模型架构采用了混合专家(MoE)与线性注意力的创新组合,在推理效率上具有独特优势。开源模型的代码生成能力提升尤为显著——这得益于大规模代码训练数据,以及针对编程任务的专项强化学习(RLHF/RLAIF)微调。UI构建测试(如生成MacOS界面)已成为评估模型"多模态理解+代码生成"综合能力的标准基准之一。
从测试表现来看,M2.7在代码生成方面展现出令人印象深刻的能力。测试者让它构建一个MacOS操作系统界面,结果相当出色——它成功制作出了响应良好的底部工具栏,几乎完成了所有应用程序的编码,每个应用都有流畅的动画效果。

虽然在某些细节上(如文件管理器内容)还有不足,但整体而言,M2.7在实现操作系统主要功能方面表现出色,相比之前的模型有了明显进步。
值得一提的是,VS Code的代理模式近几个月发展迅速,新推出的代理浏览工具让代理可以与实时浏览器互动——打开网页、读取内容、点击页面元素并实时验证修改。这标志着AI编码工具正从单纯的代码生成迈向真正的自主测试能力。
英伟达GTC 2026:从Neutron Ultra到DLSS 5
英伟达GTC大会带来了多项重磅发布:
Neutron Ultra与Nemo Cloud
Neutron Ultra是英伟达最新的推理优化模型,专注于工作流程、机器人和安全AI。配套推出的Nemo Cloud是基于Open Cloud开发的开源平台,支持安全运行Neutron模型,让用户能在自己的设备上实现生活自动化。
DLSS 5:AI驱动的游戏画面革命
AI驱动的DLSS 5将在今年秋季推出,承诺提升每个像素的逼真光影效果,优化材质渲染,让游戏世界比以往更接近真实。
DLSS的演进历程清晰展示了AI技术在实时图形渲染领域的渗透轨迹:DLSS 1.0(2018年)依赖卷积神经网络进行图像重建;DLSS 2.0引入时间超采样(Temporal Super Sampling),利用前帧信息大幅提升画质稳定性;DLSS 3.0加入"帧生成"(Frame Generation)技术,通过AI预测并插入中间帧将帧率翻倍;DLSS 4则实现多帧生成(Multi Frame Generation)。即将到来的DLSS 5聚焦像素级光影与材质渲染的神经网络重建,代表着从"图像放大"向"场景理解与重建"的范式跃迁——每一代的核心突破都建立在前代积累的神经网络推理能力之上。
Mistral小型版发布
Mistral发布了一个紧凑但功能全面的模型,包含128个专家,总参数达1190亿。速度提升40%,吞吐量达到原来的三倍,拥有56万token的上下文窗口。这是他们首次将旗舰模型的所有能力整合到一个多功能模型中。
理解"128个专家、总参数1190亿"需要了解混合专家(MoE)架构的工作原理。 MoE模型在处理每个token时,并不激活全部1190亿参数,而是通过一个轻量级的"路由器
相关推荐
科技前沿GitHub Agent HQ发布:AI编程工具进入平台化竞争时代
GitHub Universe大会发布Agent HQ平台,统一管理编码Agent,Copilot升级支持多模型集成。同期OpenAI完成重组,Anthropic新模型测试,NVIDIA开源系列AI模型,AI编程工具格局加速整合。
科技前沿Gemini 3.5 Flash在GDPval基准上实现巨大飞跃
Google Gemini 3.5 Flash在GDPval基准测试中超越Gemini 3.1 Pro,轻量级Flash模型借助后训练技术逼近前沿水平,重新定义性能与成本的平衡点,为AI应用开发者带来重大利好。
科技前沿Google Gemini Antigravity周配额三倍提升,AI编程不再受限
Google Gemini团队再次将Antigravity周配额提升至三倍,继日配额提升后再次加码。本文解析此次配额调整对开发者的实际影响,以及在AI编程助手竞争格局中的战略意义。