英国AISI评估报告：GPT-5.5网络安全能力与风险全解析

英国AI安全研究所（AI Safety Institute, AISI）近日发布了对OpenAI最新模型GPT-5.5的网络安全能力评估报告。这是继此前对Anthropic的Claude Mythos进行类似评估之后，AISI对又一主流大语言模型在安全漏洞发现方面的系统性测试。

结果显示，GPT-5.5在网络安全能力上与Claude Mythos大致相当，但有一个不容忽视的关键区别——GPT-5.5目前已面向公众开放使用，这让评估结论的现实意义更加突出。

AISI评估背景：谁在测试AI的网络安全能力

英国AI安全研究所是全球范围内较早对AI模型安全风险进行系统性评估的官方机构之一。其核心职责包括在前沿AI模型发布前后，对模型的潜在危险能力进行独立测试，重点覆盖网络安全、生物安全等高风险领域。

AISI的评估工作不代表任何AI厂商的立场，其独立性和标准化流程使其报告在行业内具有较高的参考价值。此次对GPT-5.5的评估，延续了此前对Claude Mythos的测试框架，确保了不同模型之间结果的可比性。

GPT-5.5网络安全评估方法与重点

此次评估聚焦于GPT-5.5在发现安全漏洞方面的能力，具体测试内容通常涵盖以下几个维度：

代码漏洞识别：让模型分析代码片段，判断其中是否存在安全缺陷
系统架构分析：评估模型能否识别系统设计层面的薄弱环节
渗透测试辅助：测试模型在模拟攻防场景中的表现，包括是否能辅助或独立完成渗透测试任务

这些能力对安全研究人员来说是高效的防御工具，但同样可能被恶意行为者利用。正因如此，对前沿模型的网络安全能力进行客观、独立的评估才显得尤为重要。

核心发现：GPT-5.5与Claude Mythos能力对比

漏洞发现能力处于同一水平

AISI的评估结论表明，GPT-5.5在网络安全漏洞发现方面的表现与Anthropic的Claude Mythos处于同一水平。这一结果传递出一个重要信号：当前两大主流AI实验室的前沿模型在网络安全能力上正在趋于收敛，模型之间的能力差距在持续缩小。

关键差异在于可用性

不过，两者之间存在一个影响深远的实际差异：

对比维度	GPT-5.5	Claude Mythos
网络安全能力	专业级	专业级
公开可用性	已公开发布	评估时处于预览阶段
公众可触及程度	高	有限

Claude Mythos在AISI评估时尚处于预览阶段，并未向公众全面开放；而GPT-5.5已经是一个任何人都可以访问的模型。这意味着GPT-5.5所具备的网络安全能力已经实际进入了公众可触及的范围，对安全生态的影响更为直接。

AI网络安全能力的双刃剑效应

大语言模型在网络安全领域的能力提升，本质上是一把双刃剑。

防御侧的价值：

帮助安全研究人员更快速地发现和修补漏洞
降低安全审计的时间和人力成本
提升企业整体安全防护水平

攻击侧的风险：

降低网络攻击的技术门槛
使技术水平较低的攻击者也能发现和利用复杂漏洞
可能加速零日漏洞的发现和武器化

这种双重属性决定了，单纯限制AI能力并不是最优解，更务实的做法是在提升防御能力的同时，建立有效的风险管控机制。

公开可用的GPT-5.5对安全生态意味着什么

GPT-5.5已经公开可用这一事实，将围绕AI网络安全能力的讨论从理论层面推向了现实层面。安全社区需要正视几个紧迫问题：

1. 防御体系是否需要升级？

当具备专业级漏洞发现能力的AI模型人人可用时，传统的安全防御假设可能不再成立。企业和组织需要重新评估自身的安全态势，将AI辅助攻击纳入威胁模型。

2. 漏洞修补速度能否跟上？

AI可以大幅加速漏洞发现的过程，但漏洞修补仍然依赖人工流程和组织协调。如果发现速度远超修补速度，安全窗口期将被大幅压缩。

3. 安全人才的角色如何转变？

当AI能够承担大量基础性的漏洞发现工作时，安全从业者的核心价值将更多体现在策略制定、风险判断和复杂场景应对上。

AI安全评估体系的未来走向

AISI持续对不同厂商的前沿模型进行标准化评估，这一实践本身具有重要的行业意义：

为行业提供客观参照基准，避免各厂商自说自话
为政策制定者提供决策依据，支撑监管框架的建立
推动评估方法论的迭代，随着模型能力演进不断完善测试标准

随着越来越多的模型达到类似的网络安全能力水平，建立统一的评估框架和风险分级标准将变得越来越迫切。可以预见，未来的AI安全评估将不仅关注模型"能做什么"，还会更多地关注模型在实际部署环境中"会被怎样使用"。

写在最后

前沿AI模型的网络安全能力正在快速发展，不同模型之间的能力差距也在持续缩小。AISI对GPT-5.5的这份评估报告，既是一份技术能力的客观记录，也是一个值得整个安全行业认真对待的信号。

对于安全从业者而言，当务之急是：将AI工具纳入自身的防御体系，同时为AI可能催生的新型威胁做好充分准备。在AI能力快速迭代的今天，被动等待已不再是一个选项。