六月AI大战：Mythos、Sonnet 4.8、GPT-5.6集中曝光

2025年的AI竞赛正以前所未有的速度升温。仅仅在过去一个周末，Anthropic旗舰模型Mythos、Claude Sonnet/Opus 4.8系列、OpenAI的GPT-5.6以及DeepSeek V4 Pro永久降价等重磅消息接连浮出水面。六月，很可能成为AI领域有史以来最密集的发布月份之一。

Anthropic Mythos 1 Preview：旗舰模型蓄势待发

被Anthropic高调预热的旗舰模型Mythos，正以"Cloud Mythos 1 Preview"的名称出现在后端系统中。有用户发现，该模型已在Cloud Code、Cloud Security等多个Anthropic应用中短暂现身后又消失，同时后端代码中也出现了包括"Mentos"在内的多个Mythos相关引用字符串。

Project Glasswing更新

说个细节，Anthropic此前曾暗示，部分Mythos内部变体可能仅限于特定产品、测试组、企业安全工具或未来的智能体基础设施使用，而非作为标准API对外开放。但从最新动向来看，Anthropic的态度正在发生微妙变化。其Project Glasswing项目的最新更新明确表示："由于强大的安全防护措施正在到位，Mythos级别的模型可能很快就会面向公众发布。"

更关键的信号是，Mythos已经开始出现在Google Cloud和AWS的**漏洞发现计划（Bug Bounty Program）**中。漏洞发现计划是科技公司邀请外部安全研究人员测试系统漏洞并给予奖励的机制。当一个AI模型被纳入这类计划的范围时，意味着该模型已被视为"生产级基础设施"的一部分——只有即将或已经承载真实用户流量的系统，才有必要进行大规模外部安全审计。对于Mythos而言，这一信号意味着它不再只是实验室内部的研究模型，而是正在经历面向公众部署前的最后一道安全关卡。这意味着更广泛的基础设施测试已在幕后展开。虽然不能断言Mythos会立即发布，但这些迹象通常是模型接近部署阶段的典型前兆。保守估计，某种蒸馏版本的Mythos可能会在未来几个月内发布，最迟不超过十月。

Claude Sonnet 4.8与Opus 4.8：跳级升级引关注

Sonnet 4.8和Opus 4.8的**模型标识符（model slugs）**近日在Google Vertex AI上被发现，这通常是模型即将发布的明确信号。模型标识符是AI服务商在API和云平台基础设施中用于唯一标识特定模型版本的字符串（例如claude-sonnet-4-8-20250615）。云平台需要提前注册模型元数据以配置路由、限流和计费规则，因此这类"泄露"往往比官方公告早数周出现，已成为AI社区追踪模型发布节奏的重要信号源。发布时间窗口可能在六月中旬到下旬，甚至更早。据传，部分Anthropic合作伙伴已经在进行内部评估。

Sonnet 4.8能力提升

一个有趣的细节是：早在3月31日，Anthropic曾意外通过Cloud Code的NPM API泄露了一份长达50万行的内部调试源码映射文件。在这份泄露文件中，就已经出现了Sonnet 4.8的引用，隐藏在未发布的关键词过滤系统中——这强烈暗示Anthropic可能直接跳过了Sonnet 4.7。

从目前流传的信息来看，Sonnet 4.8预计将继承Opus 4.7引入的多项重大升级：

视觉理解能力：在UI原型图、截图和复杂架构图的识别准确率有望突破98%
编码性能：一次性代码生成质量大幅提升，指令遵循更加精确
推理能力：新增"X-High"推理等级，在不大幅增加生成时间的前提下提供更强的推理能力

但也有一个值得关注的代价：更新后的**分词器（Tokenizer）**在相同提示词下可能会多消耗约30%的token。分词器是将原始文本转换为模型可处理的离散单元（token）的核心组件。不同版本的分词器对同一段文字的切分粒度存在差异——更新的分词器有时为了支持更多语言或特殊符号，会采用更细粒度的切分策略，导致相同输入消耗更多token。对于每月调用量达数十亿token的企业用户，30%的token增幅意味着实际成本增幅可能远超模型单价的变化，是大规模生产部署中需要单独评估的关键技术决策。

GPT-5.6：OpenAI的快速迭代

GPT-5.5在四月底才刚刚发布，OpenAI就已经在紧锣密鼓地准备GPT-5.6了。OpenAI的研究人员近期透露，GPT-5.6在内部已被用于数学研究突破，并且已成为调试和技术工作流的日常主力模型。

在部署测试阶段，"iris alpha"、"ember alpha"和"beacon alpha"等内部测试标签被发现，暗示可能有多个GPT-5.6变体正在同步评估。从泄露信息来看，GPT-5.6重点强化了以下方向：

多步推理能力显著增强
智能体工作流表现更优
前端代码生成质量大幅提升

**智能体工作流（Agentic Workflow）**是指AI模型不再仅仅响应单次问答，而是作为自主执行多步骤任务的"代理人"——能够调用外部工具、浏览网页、执行代码、管理文件，并根据中间结果动态调整行动计划。这类应用对模型提出了远超传统对话场景的要求：需要精确的指令遵循能力（避免在长任务链中偏离目标）、强健的错误恢复机制，以及对上下文窗口的高效利用。GPT-5.6和Sonnet 4.8均将智能体工作流列为重点强化方向，折射出整个行业正从"更聪明的聊天机器人"向"能独立完成复杂任务的数字员工"转型的核心趋势。

六月AI发布密集

目前的泄露指向两个独立版本的发布：GPT-5.6标准版和GPT-5.6 Pro版。根据早期测试体验，GPT-5.6的表现甚至强于同样预计在下月发布的Gemini 3.5 Pro。这意味着六月将同时迎来Sonnet/Opus 4.8、Gemini 3.5 Pro和GPT-5.6三大重磅模型——一场前所未有的AI模型混战。

DeepSeek V4 Pro永久降价：价格战的核弹

DeepSeek正式确认，V4 Pro此前推出的75%折扣将成为永久定价。具体价格对比如下：

模型	输入价格（百万token）	输出价格（百万token）
DeepSeek V4 Pro	$0.43	$0.87
GPT-5.5	$5.00	$30.00
Claude Opus 4.7	$5.00	$25.00

数据一目了然：DeepSeek V4 Pro的输入价格仅为GPT-5.5和Opus 4.7的不到十分之一，输出价格更是低至三十分之一以下。理解这组数字需要了解当前主流大语言模型普遍采用的**"输入token+输出token"双轨计费模式**。输出token通常比输入token贵2-6倍，原因在于生成过程需要逐token自回归推理，计算密度远高于输入的并行编码阶段。DeepSeek V4 Pro的输入/输出价格比约为1:2，远低于GPT-5.5的1:6，这对于输出密集型场景（如代码生成、长文档撰写）的成本优势尤为显著。这种定价能力的背后，是DeepSeek通过**混合专家架构（Mixture of Experts，MoE）**和更低廉的算力成本实现的效率优势——MoE架构每次推理仅激活部分"专家"子网络，在保持模型知识容量的同时大幅降低单次推理计算量。

在编码和推理等核心工作负载上，DeepSeek V4 Pro仍然能够与这些顶级模型在同一梯队竞争。这对整个AI市场的影响是深远的。对于构建大规模智能体系统和AI应用的开发者来说，token成本会快速累积，而DeepSeek的定价策略直接将成本压力传导给了所有前沿实验室。虽然DeepSeek不一定是每个场景下的最优选择，但作为处理大量重复性技术任务的日常工具，其性价比已经难以匹敌。

行业格局：竞争加速与理性看待

除了模型发布，Anthropic还在积极推进其Co-work协作平台的生态建设，推出了每周免费体验的推荐计划，并将Excel、PowerPoint、Chrome以及Cloud Code等集成工具打包进产品体验中。这表明Anthropic正在将Co-work定位为一个更广泛的生产力生态系统，而非仅仅是一个AI聊天应用。

AI的积极影响