GPT 5.6内测代号曝光,谷歌月付9.2亿美元租SpaceX算力

OpenAI动态:GPT 5.6内测启动与账号故障补偿
OpenAI内部已开启GPT 5.6新检查点的测试,内部代号为"Kindle Alpha",同时停用了此前两个旧的检查点。在大模型开发中,"检查点"是模型训练过程中某个特定阶段的完整参数快照,研发团队通常保存多个检查点以便比较性能和回滚实验。使用内部代号是大型AI实验室的常见做法,既便于沟通,也能在信息泄露时降低外界对技术细节的推断。停用旧检查点通常意味着新版本在综合评估中已全面超越前代。
据爆料者透露,泄露的模型测试效果图是在未开启思考模式下的产物,这意味着GPT 5.6在基础推理能力上可能已有显著提升。值得注意的是,当前主流推理模型存在基础模式和思考模式(Chain-of-Thought)两种工作方式,后者通过消耗更多计算资源进行显式逐步推理来提升准确率。如果GPT 5.6在未启用思考模式时就表现强劲,说明其基座模型本身的能力已经大幅跃升,而非依赖推理时的额外计算开销——这在技术层面是更为根本的进步。
说个细节,OpenAI近期因系统故障误封了部分用户的ChatGPT账号。官方已陆续恢复账号权限,并对受影响的订阅用户给予延长一个月订阅的补偿。这一事件也提醒用户关注账号安全和平台稳定性问题。
此外,OpenAI旗下的Codex工具也迎来功能更新,新增了设置检索功能,同时完善了全屏对话、消息通知等多项细节功能,进一步提升开发者的使用体验。



谷歌多线并进:Gemma 4量化优化与SpaceX算力合作
Gemma 4量化感知训练正式发布
谷歌在Hugging Face发布了Gemma 4的量化感知训练(QAT)检查点。量化感知训练是一种在模型训练阶段就模拟低精度推理的技术,与传统的训练后量化(PTQ)直接将32位浮点参数压缩为低精度整数不同,QAT在训练过程中插入"伪量化"节点,让模型学会在低精度环境下保持性能,从而大幅降低精度损失。
所有不同尺寸的Gemma 4模型均可基于QAT进行优化,并支持定制移动端量化格式。经过优化后,模型最低内存占用可降低至1GB,这对于端侧部署和移动设备运行大模型不能忽视——1GB的内存占用意味着即便是中端手机也具备了本地运行大模型的条件,为离线AI应用和隐私敏感场景打开了大门。
Gemini Omni模型正式开放
谷歌面向Plus、Pro和Ultra订阅用户开放了Gemini Omni模型,用户可在官网和移动端APP中使用。Omni模型代表的是原生多模态架构——模型从训练阶段就同时处理文本、图像、音频和视频等多种信息形式,而非将不同模态的模型简单拼接。相比早期管线式方案,原生多模态能更好地理解跨模态语义关联,例如准确把握视频中语音与画面的对应关系。谷歌将该模型限定在付费用户层级,既是商业化策略,也反映了多模态推理所需的计算成本远高于纯文本交互。
谷歌与SpaceX达成月付9.2亿美元算力合作
据华尔街日报报道,谷歌与SpaceX达成了重磅云计算合作协议。合作约定从2026年10月到2029年6月,谷歌每月向SpaceX支付9.2亿美元用于租用算力。
这一合作的深层背景是全球AI算力供需严重失衡。当前英伟达GPU产能受限,各大云厂商的GPU集群排期已满。谷歌虽拥有自研TPU芯片,但面对Gemini系列模型训练和推理的爆发式需求仍显不足。SpaceX虽以航天业务闻名,但其星链业务积累了大量数据中心基础设施,具备提供算力服务的条件。
这一合作对双方都有重要战略意义——谷歌能够补充自家TPU算力的不足,而SpaceX则可借此助力公司IPO进程。月付9.2亿美元、总合同近26个月的规模约合240亿美元,接近一些中型云计算公司的全年营收,充分反映出当前AI算力需求的巨大缺口,也印证了算力作为"新石油"的战略地位。
Anthropic与开源生态新动向
Claude Cowork限时额度翻倍福利
Anthropic开启了Claude Cowork限时福利活动,用户可用额度翻倍,优惠持续至次月。这一举措旨在助力用户承接体量更大、复杂度更高的任务,也体现了Anthropic在用户增长方面的积极策略。
Riverflow 2.5图像生成模型发布
图像生成模型Riverflow 2.5正式发布,文生图和图生图全系列能力均获提升。该模型搭载内置推理编辑逻辑,这代表图像生成领域的新趋势:模型不仅能生成图像,还能理解编辑指令的语义逻辑。例如用户指示"把背景换成夜晚但保持人物光照自然",模型需要推理出哪些像素该修改、哪些该保留、光影如何协调,这比简单的图像修复复杂得多,本质上要求模型具备物理世界的常识推理能力。
模型最高支持4K图像导出,Pro版本可在OpenRouter免费使用,为创作者提供了又一高质量选择。
英伟达Nemotron 3 Ultra免费开放使用
OpenCode宣布,英伟达开源旗舰模型Nemotron 3 Ultra现已在平台中免费提供使用,支持长上下文处理。不过截止时间官方暂未明确,感兴趣的开发者建议尽早体验。
总结与展望
从今日的AI行业动态来看,头部公司之间的竞争正在多个维度同时展开:OpenAI持续推进GPT系列迭代,谷歌通过算力合作和模型优化巩固生态,Anthropic则以福利活动争夺用户。算力资源的争夺已成为AI竞赛的核心战场之一,谷歌与SpaceX的合作规模充分说明了这一点。
核心要点
相关推荐
CherryStudio+MCP搭建自动化AI智能体与本地知识库教程
CherryStudio+MCP搭建自动化AI智能体与本地知识库教程
详细介绍Cherry Studio配置MCP协议搭建自动化AI智能体的完整流程,涵盖环境配置、MCP Server实战、网页抓取、Shell命令执行及Ollama本地知识库搭建,助你打造个性化AI工作流。
MCP实战教程:用AI自动化逆向分析JS加密算法
MCP实战教程:用AI自动化逆向分析JS加密算法
详细介绍MCP协议环境配置与实战流程,演示如何借助AI自动定位加密接口、分析JS混淆代码、打断点调试并还原sign签名算法生成Python爬虫代码,大幅提升逆向工程效率。

Claude Code Skill机制详解:渐进式加载与实战创建指南
深入解析Claude Code的Skill机制,包括渐进式加载原理、与CLAUDE.md/MCP的区别、四种创建方式及进阶特性。掌握Skill让AI编程效率提升数倍,告别重复指令。