AI周报:GPT 6代号Spud曝光、Claude Conway代理、DeepSeek V4转向华为芯片

AI领域迎来密集更新,基座模型、AI代理与硬件格局全面变革。
过去一周AI领域重磅消息密集:OpenAI集中力量训练下一代基座模型Spud(GPT 6级别),预计2026年春季发布;Anthropic开发长驻型AI代理Conway并收紧订阅政策;Cursor 3为AI代理重构IDE;DeepSeek V4转向华为昇腾芯片训练,推动国产AI算力崛起;通义千问3.6和Gemma 4在开源领域展现强劲竞争力。行业呈现基座模型白热化竞争、AI代理产品化、硬件格局战略转移三大趋势。
过去一周,AI领域迎来密集的重磅更新。从OpenAI下一代基座模型Spud到Anthropic的长驻型AI代理Conway,从Cursor 3的全面重构到DeepSeek V4转向华为芯片训练,每一条消息都在重塑我们对AI未来的认知。本文逐一梳理这些关键动态,帮你快速把握行业脉搏。
OpenAI Spud:GPT 6级别的基座模型呼之欲出
OpenAI近期将资源从SORA等项目中抽调,集中力量训练代号为"Spud"的下一代模型。据悉,这款模型本质上是GPT 5.5甚至可能直接跳至GPT 6,定位为全新的基座模型,目标是从根本上提升AI的智能水平。
OpenAI总裁Greg Brockman将其描述为"飞跃性的成果",称该模型基于多年研究积累,规模极其庞大。与简单的微调不同,Spud是一次彻底的革新——它能处理复杂的长程任务,在理解用户意图方面将更加精准和灵活,并解锁以往做不到的全新能力。

不过也有消息源指出,相较GPT 5.4,Spud的提升"算不上重大飞跃",可能难以比肩Anthropic的顶尖模型。但无论如何,该模型预计将于2026年春季发布,届时将是检验OpenAI技术路线的关键时刻。
GPT Image 2悄然亮相
OpenAI的动作不止于此。GPT Image 2已悄然登陆Arena进行早期测试,表现令人惊艳:它拥有极其丰富的知识储备,文本渲染近乎完美,甚至可能超越Nano Banana Pro。目前该模型在Arena中以三个代号运行——Masking Tape Alpha、Gaffer Tape Alpha和Packing Tape Alpha,用户可以在对战模式中选择图像功能直接体验。
Anthropic Conway代理:长驻型AI代理与生态变革
Conway——面向企业的长驻型AI代理
Anthropic正在开发名为"Conway"的长驻型AI代理。根据Testing Catalog的发现,Conway将运行在独立的UI实例中,能操作浏览器、连接器和云端代码,支持通过各种Webhook触发,并兼容即将推出的CNV ZEP标准。开发者可以构建自定义工具、UI标签及上下文处理器,未来有望实现企业内部大量功能的自动化。
Claude订阅政策收紧引发争议
从4月4日起,Pro和Max等Cloud订阅服务将不再支持OpenCloud等第三方工具,今后使用这些工具需额外付费。Anthropic仅提供一笔等同月费的一次性抵扣额度作为补偿。

这一变化的背景是:部分用户利用200美元月费套餐运行了价值数千美元的智能体工作负载,本质上是在"薅羊毛"。从商业角度看,Anthropic的调整可以理解,但Cloud生态确实一夜之间变贵了不少。依赖第三方工具的用户需要在4月17日前做出选择:开启超额计费、改用API密钥,或尽快用完余额。
Claude Code新增Ultra Plan与语音模式
好消息是,Claude Code新增了Ultra Plan功能。用户可通过斜杠命令、提示词调用或网页端规划模式三种方式启动,核心优势在于在正式实施前就详细设计达成一致,提升代码可读性和规划质量。
更值得关注的是,Claude Code的泄露信息揭示了其语音模式下集成了Deepgram Nova 3。这表明Anthropic正从文本和代码领域向全能多模态AI扩展,有望在下一代模型(可能随Claude 5发布)中正式上线语音功能。
Cursor 3重构:为AI代理而生的新一代IDE
Cursor团队发布了重构后的Cursor 3 IDE,设计理念是让智能体处理大部分编码工作,同时保留完整开发环境的深度。

核心亮点包括:
- 多智能体并行:可同时运行多个智能体,支持本地、远程SSH或云端运行
- 界面重构:新增独立窗口,精准呈现编辑器核心功能
- 灵活定位:在需要时作为IDE的得力助手,而非强制替代
对于以云端开发为主的开发者来说,Cursor 3的这次升级确实颇具吸引力。
DeepSeek V4转向华为芯片:AI硬件格局正在改写
DeepSeek V4预计于春季发布,但真正的重磅消息在于——它将首次实现国产前沿AI模型在华为昇腾芯片上的原生运行。
这一战略选择的影响远超表面:阿里、字节跳动、腾讯等巨头已批量采购成千上万颗华为昇腾系列芯片,导致相关芯片价格在几周内飙升20%。DeepSeek刻意优先向国产厂商开放适配,却将英伟达拒之门外。
对英伟达而言,短期营收影响有限,但战略层面的冲击不容小觑——各家厂商转向适配华为芯片将降低对CUDA生态的依赖,可能动摇其长期技术护城河。两年前,这种国产AI算力架构实际上还不存在,如今已成为现实。
开源模型:通义千问3.6与Gemma 4双雄并立
通义千问3.6:百万Token上下文与全方位升级
阿里云发布的通义千问3.6表现极为强劲:拥有100万Token超大上下文窗口,在SWE-Bench测试中拿下78.8分(对比Claude Opus的80.9分),在多数基准测试中已超越Claude 3.5 Opus,且代码能力更强、成本更低。它能像真人一样理解图像和屏幕内容,在多模态理解与实际应用方面实现了全方位升级。
Gemma 4:从手机到工作站的全场景覆盖

谷歌推出的Gemma 4采用Apache 2.0开源协议发布,提供从轻量级端侧到大型版本的多种尺寸,具备高级推理、编码及多模态处理能力。更令人惊叹的是,Gemma 4已能在iPhone 17 Pro等设备上运行,借助MLX优化达到每秒4万Token的速度,即使在端侧也具备图像理解和逻辑推理能力。目前该模型在Arena榜单上位列第三,展现了开源模型的强劲竞争力。
总结与展望:2026年春季将是AI行业关键节点
这一周的AI动态呈现出几个清晰趋势:基座模型的竞争进入白热化阶段,OpenAI、Anthropic、DeepSeek和开源阵营都在加速迭代;AI代理从概念走向产品化,Conway和Cursor 3都在探索人机协作的新范式;AI硬件格局正在发生战略性转移,华为昇腾芯片的崛起可能重塑全球AI算力版图。2026年春季将是一个关键节点,届时GPT 6、DeepSeek V4等多款重量级模型的集中发布将深刻影响AI行业的走向。
相关推荐
科技前沿GitHub Agent HQ发布:AI编程工具进入平台化竞争时代
GitHub Universe大会发布Agent HQ平台,统一管理编码Agent,Copilot升级支持多模型集成。同期OpenAI完成重组,Anthropic新模型测试,NVIDIA开源系列AI模型,AI编程工具格局加速整合。
科技前沿Gemini 3.5 Flash在GDPval基准上实现巨大飞跃
Google Gemini 3.5 Flash在GDPval基准测试中超越Gemini 3.1 Pro,轻量级Flash模型借助后训练技术逼近前沿水平,重新定义性能与成本的平衡点,为AI应用开发者带来重大利好。
科技前沿Google Gemini Antigravity周配额三倍提升,AI编程不再受限
Google Gemini团队再次将Antigravity周配额提升至三倍,继日配额提升后再次加码。本文解析此次配额调整对开发者的实际影响,以及在AI编程助手竞争格局中的战略意义。