播客频道 | GPT-5.5网络安全能力评估：英国AISI揭示AI漏洞发现能力已向公众开放

哎李博，你最近看英国那个AI安全研究所出的报告没？就是测GPT-5.5网络安全能力那个。看了看了，AISI那份。我正想找你聊这个呢，这事儿挺有意思的。我先说我的第一反应啊——就，GPT-5.5能发现安全漏洞这件事本身，其实不太让我意外。但是报告里有个点让我有点坐不住。你说的是可及性那个问题对吧？对！就是它跟Claude Mythos对比那段。两个模型漏洞发现能力差不多，但一个还没公开，另一个已经全球随便用了。嗯，我给你捋一下背景。英国AISI是2023年那个AI安全峰会之后成立的，专门干一件事——对前沿模型做安全评估。这次他们测的是GPT-5.5在cyber capabilities方面的表现。结论是：GPT-5.5在漏洞发现上的能力，跟Anthropic的Claude Mythos基本持平。能辅助发现代码缺陷、生成exploit代码、甚至模拟渗透测试流程。等等，这个能力具体到什么程度？就比如说我们公司的代码，丢给它能直接找出漏洞来？理论上可以。以前这种活儿需要资深安全研究员花好几天甚至几周去做的事情，现在可能一次对话就能启动。真的假的？！那这不就等于——原来你得是个黑客才能干的事，现在随便一个人注册个账号就行了？你这个理解基本没毛病。我跟你打个比方啊——同样一把锋利的刀，Claude Mythos那把还锁在保险柜里，GPT-5.5这把已经摆超市货架上了。刀一样锋利，但风险等级完全不同。这个比喻好。那我站产品经理的角度问一个很现实的问题——OpenAI为什么敢发？他们不知道这个风险吗？哈哈，这就是商业竞争压力嘛。你看现在前沿模型的能力趋同速度多快，你不发别人发。而且他们肯定觉得自己的安全护栏够硬。够硬？护栏这东西……我做产品的太知道了，用户绕过限制的创造力是无穷的。得了吧，你们产品经理就知道用户体验，但这次你说得还真对。哈哈哈你这什么态度！不过说真的，这事儿也不能只看坏的一面吧？对，说句公道话。从防御角度看，这其实是个好事。安全研究人员能更快发现和修补漏洞，整体安全水位是在提升的。特别是中小企业，以前根本请不起专业安全团队做深度审计，现在可能第一次有能力做这件事了。诶这个点我有体感。我之前负责的产品线，安全审计一次外包出去要大几十万，小公司根本玩不起。但问题是——攻击者也在用同样的工具。而且攻防不对称你知道吧？防御者要堵住所有洞，攻击者只需要找到一个。这不就是……把武器发给所有人，然后说'希望好人比坏人多'？本质上是的。而且更关键的是，这不是OpenAI一家的问题。评估结果说明前沿模型在这个领域的能力正在趋同，这是整个行业的趋势。那AISI的评估机制能管住这事儿吗？这就是最尴尬的地方了。你想啊，评估报告还在写的时候，模型已经被几百万人在用了。等会儿让我想想……所以现在的状况是——先上车后补票？比这还糟。是车都开出去一百公里了，安检报告才出来说'这车刹车可能有问题'。哈哈哈这比喻太损了。但确实是这个道理。那你觉得应该怎么办？总不能说不让发模型吧。我个人的观点是——我们需要给AI的某些能力设发布门槛。不是所有能力都适合无门槛开放。就像武器级材料不会摆超市一样，具备显著攻击辅助能力的模型应该有更严格的准入。但这个'门槛'谁来定？怎么定？各国标准不一样怎么办？这就是目前行业没有共识的地方。但GPT-5.5这个案例至少说明了一件事——AI安全评估不应该是事后的体检报告，应该是事前的通行许可。能力已经扩散了再谈管控，就是亡羊补牢。对。而且这场前沿模型的网络安全能力竞赛已经开始了，治理框架还在后面追。这个gap每大一天，风险就多一分。嗯……说实话聊完这个我心情挺复杂的。一方面觉得技术进步确实能帮到很多人，另一方面又觉得这个潘多拉盒子开得有点快了。是啊。这关系到每一个联网设备的安全，不夸张地说，跟我们每个人都有关。希望治理能跑快点吧。

GPT-5.5网络安全能力评估：英国AISI揭示AI漏洞发现能力已向公众开放

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报