GPT 5.6内测代号曝光，谷歌月付9.2亿美元租SpaceX算力

OpenAI动态：GPT 5.6内测启动与账号故障补偿

OpenAI内部已开启GPT 5.6新检查点的测试，内部代号为"Kindle Alpha"，同时停用了此前两个旧的检查点。在大模型开发中，"检查点"是模型训练过程中某个特定阶段的完整参数快照，研发团队通常保存多个检查点以便比较性能和回滚实验。使用内部代号是大型AI实验室的常见做法，既便于沟通，也能在信息泄露时降低外界对技术细节的推断。停用旧检查点通常意味着新版本在综合评估中已全面超越前代。

据爆料者透露，泄露的模型测试效果图是在未开启思考模式下的产物，这意味着GPT 5.6在基础推理能力上可能已有显著提升。值得注意的是，当前主流推理模型存在基础模式和思考模式（Chain-of-Thought）两种工作方式，后者通过消耗更多计算资源进行显式逐步推理来提升准确率。如果GPT 5.6在未启用思考模式时就表现强劲，说明其基座模型本身的能力已经大幅跃升，而非依赖推理时的额外计算开销——这在技术层面是更为根本的进步。

说个细节，OpenAI近期因系统故障误封了部分用户的ChatGPT账号。官方已陆续恢复账号权限，并对受影响的订阅用户给予延长一个月订阅的补偿。这一事件也提醒用户关注账号安全和平台稳定性问题。

此外，OpenAI旗下的Codex工具也迎来功能更新，新增了设置检索功能，同时完善了全屏对话、消息通知等多项细节功能，进一步提升开发者的使用体验。

均可以基于QAT进行优化

谷歌与SpaceX达成云计算合作

助力用户承接体量更大复杂度更高的任务

谷歌多线并进：Gemma 4量化优化与SpaceX算力合作

Gemma 4量化感知训练正式发布

谷歌在Hugging Face发布了Gemma 4的量化感知训练（QAT）检查点。量化感知训练是一种在模型训练阶段就模拟低精度推理的技术，与传统的训练后量化（PTQ）直接将32位浮点参数压缩为低精度整数不同，QAT在训练过程中插入"伪量化"节点，让模型学会在低精度环境下保持性能，从而大幅降低精度损失。

所有不同尺寸的Gemma 4模型均可基于QAT进行优化，并支持定制移动端量化格式。经过优化后，模型最低内存占用可降低至1GB，这对于端侧部署和移动设备运行大模型不能忽视——1GB的内存占用意味着即便是中端手机也具备了本地运行大模型的条件，为离线AI应用和隐私敏感场景打开了大门。

Gemini Omni模型正式开放

谷歌面向Plus、Pro和Ultra订阅用户开放了Gemini Omni模型，用户可在官网和移动端APP中使用。Omni模型代表的是原生多模态架构——模型从训练阶段就同时处理文本、图像、音频和视频等多种信息形式，而非将不同模态的模型简单拼接。相比早期管线式方案，原生多模态能更好地理解跨模态语义关联，例如准确把握视频中语音与画面的对应关系。谷歌将该模型限定在付费用户层级，既是商业化策略，也反映了多模态推理所需的计算成本远高于纯文本交互。

谷歌与SpaceX达成月付9.2亿美元算力合作

据华尔街日报报道，谷歌与SpaceX达成了重磅云计算合作协议。合作约定从2026年10月到2029年6月，谷歌每月向SpaceX支付9.2亿美元用于租用算力。

这一合作的深层背景是全球AI算力供需严重失衡。当前英伟达GPU产能受限，各大云厂商的GPU集群排期已满。谷歌虽拥有自研TPU芯片，但面对Gemini系列模型训练和推理的爆发式需求仍显不足。SpaceX虽以航天业务闻名，但其星链业务积累了大量数据中心基础设施，具备提供算力服务的条件。

这一合作对双方都有重要战略意义——谷歌能够补充自家TPU算力的不足，而SpaceX则可借此助力公司IPO进程。月付9.2亿美元、总合同近26个月的规模约合240亿美元，接近一些中型云计算公司的全年营收，充分反映出当前AI算力需求的巨大缺口，也印证了算力作为"新石油"的战略地位。

Anthropic与开源生态新动向

Claude Cowork限时额度翻倍福利

Anthropic开启了Claude Cowork限时福利活动，用户可用额度翻倍，优惠持续至次月。这一举措旨在助力用户承接体量更大、复杂度更高的任务，也体现了Anthropic在用户增长方面的积极策略。

Riverflow 2.5图像生成模型发布

图像生成模型Riverflow 2.5正式发布，文生图和图生图全系列能力均获提升。该模型搭载内置推理编辑逻辑，这代表图像生成领域的新趋势：模型不仅能生成图像，还能理解编辑指令的语义逻辑。例如用户指示"把背景换成夜晚但保持人物光照自然"，模型需要推理出哪些像素该修改、哪些该保留、光影如何协调，这比简单的图像修复复杂得多，本质上要求模型具备物理世界的常识推理能力。

模型最高支持4K图像导出，Pro版本可在OpenRouter免费使用，为创作者提供了又一高质量选择。

英伟达Nemotron 3 Ultra免费开放使用

OpenCode宣布，英伟达开源旗舰模型Nemotron 3 Ultra现已在平台中免费提供使用，支持长上下文处理。不过截止时间官方暂未明确，感兴趣的开发者建议尽早体验。

总结与展望

从今日的AI行业动态来看，头部公司之间的竞争正在多个维度同时展开：OpenAI持续推进GPT系列迭代，谷歌通过算力合作和模型优化巩固生态，Anthropic则以福利活动争夺用户。算力资源的争夺已成为AI竞赛的核心战场之一，谷歌与SpaceX的合作规模充分说明了这一点。