GPT-5.5网络安全能力评估：英国AISI揭示AI漏洞发现能力已向公众开放

当一个能发现安全漏洞的AI模型不再锁在实验室里，而是向全世界敞开大门时，我们究竟是在武装防御者，还是在武装攻击者？英国AI安全研究所（AISI）最新发布的GPT-5.5网络安全能力评估报告，把这个问题摆到了所有人面前。

英国AISI对GPT-5.5的网络安全能力做了什么评估？

英国AI安全研究所（UK AI Security Institute）是英国政府在2023年AI安全峰会后成立的官方机构，专门负责对前沿AI模型进行安全测试。这次，他们把目光对准了OpenAI的GPT-5.5，重点测试了一项让人既兴奋又紧张的能力——发现软件安全漏洞。

评估结果显示：GPT-5.5在漏洞发现方面的表现，与此前接受过同类评估的Anthropic Claude Mythos模型基本持平。

这个结论本身并不算特别意外。前沿大语言模型在网络安全领域的能力一直在快速提升，能辅助发现代码中的缺陷、生成漏洞利用代码、甚至模拟渗透测试流程。真正让人坐不住的，是另一个事实。

同样具备专业级漏洞发现能力，Claude Mythos在接受AISI评估时还没有面向公众开放。而GPT-5.5呢？它已经正式公开发布（Generally Available），全球任何人注册个账号就能用。

这个差异有多大？打个比方：同样是一把锋利的刀，一把锁在保险柜里，另一把摆在超市货架上。刀的锋利程度一样，但风险等级完全不同。

一个具备专业级网络安全攻击辅助能力的工具，现在对所有人敞开了大门。原本需要多年安全研究经验才能完成的漏洞挖掘工作，现在可能只需要一次对话就能启动。

说句公道话，这件事不能只看一面。

从防御角度看，安全研究人员确实能借助GPT-5.5更快地发现和修补漏洞，提升整体网络安全水位。对于资源有限的中小企业来说，这甚至可能是他们第一次有能力做深度安全审计。

但从攻击角度看，它极大地降低了网络攻击的技术门槛。以前搞不定的事情，现在可能变得容易了。而且不只是GPT-5.5——评估结果表明，前沿AI模型在这一领域的能力正在趋于接近，这不是某一家公司的问题，而是整个行业的趋势。

AISI的工作本身值得肯定。作为全球最前沿的AI风险评估机构之一，他们在做的事情非常重要。但一个尴尬的现实是：当评估报告还在撰写的时候，模型已经在被数百万人使用了。

这暴露了当前AI治理框架的一个根本性缺口——评估机制和发布节奏之间的脱节。OpenAI选择在模型具备显著网络安全能力的情况下仍然公开发布，这到底是对自身安全护栏的自信，还是商业竞争压力下的冒险？

这不只是一个技术问题，而是一个关于AI能力民主化边界的治理问题。

我们是否应该对AI的某些能力设置"发布门槛"？就像我们不会把武器级材料摆在超市货架上一样，是否应该对具备显著攻击辅助能力的AI模型设定更严格的准入条件？

目前来看，行业内还没有形成共识。但GPT-5.5的案例至少说明了一件事：AI安全评估不应该是事后的体检报告，而应该是事前的通行许可。当能力已经扩散，再谈风险管控，说白了就是亡羊补牢。

相关背景补充：

AISI（英国AI安全研究所）：前身为Frontier AI Taskforce，主要职责包括评估AI模型在网络攻击、生物风险、虚假信息等方面的潜在危险能力
安全漏洞（Security Vulnerability）：软件或系统中可被攻击者利用的缺陷，严重程度通常用CVSS评分系统衡量
Cyber Capabilities：在AI安全评估中特指模型在漏洞发现、漏洞利用代码编写、渗透测试等方面的能力