哎李博,你最近看英国那个AI安全研究所出的报告没?就是测GPT-5.5网络安全能力那个。
看了看了,AISI那份。我正想找你聊这个呢,这事儿挺有意思的。
我先说我的第一反应啊——就,GPT-5.5能发现安全漏洞这件事本身,其实不太让我意外。但是报告里有个点让我有点坐不住。
你说的是可及性那个问题对吧?
对!就是它跟Claude Mythos对比那段。两个模型漏洞发现能力差不多,但一个还没公开,另一个已经全球随便用了。
嗯,我给你捋一下背景。英国AISI是2023年那个AI安全峰会之后成立的,专门干一件事——对前沿模型做安全评估。这次他们测的是GPT-5.5在cyber capabilities方面的表现。
结论是:GPT-5.5在漏洞发现上的能力,跟Anthropic的Claude Mythos基本持平。能辅助发现代码缺陷、生成exploit代码、甚至模拟渗透测试流程。
等等,这个能力具体到什么程度?就比如说我们公司的代码,丢给它能直接找出漏洞来?
理论上可以。以前这种活儿需要资深安全研究员花好几天甚至几周去做的事情,现在可能一次对话就能启动。
真的假的?!那这不就等于——原来你得是个黑客才能干的事,现在随便一个人注册个账号就行了?
你这个理解基本没毛病。我跟你打个比方啊——同样一把锋利的刀,Claude Mythos那把还锁在保险柜里,GPT-5.5这把已经摆超市货架上了。
刀一样锋利,但风险等级完全不同。
这个比喻好。那我站产品经理的角度问一个很现实的问题——OpenAI为什么敢发?他们不知道这个风险吗?
哈哈,这就是商业竞争压力嘛。你看现在前沿模型的能力趋同速度多快,你不发别人发。而且他们肯定觉得自己的安全护栏够硬。
够硬?护栏这东西……我做产品的太知道了,用户绕过限制的创造力是无穷的。
得了吧,你们产品经理就知道用户体验,但这次你说得还真对。
哈哈哈你这什么态度!不过说真的,这事儿也不能只看坏的一面吧?
对,说句公道话。从防御角度看,这其实是个好事。安全研究人员能更快发现和修补漏洞,整体安全水位是在提升的。
特别是中小企业,以前根本请不起专业安全团队做深度审计,现在可能第一次有能力做这件事了。
诶这个点我有体感。我之前负责的产品线,安全审计一次外包出去要大几十万,小公司根本玩不起。
但问题是——攻击者也在用同样的工具。而且攻防不对称你知道吧?防御者要堵住所有洞,攻击者只需要找到一个。
这不就是……把武器发给所有人,然后说'希望好人比坏人多'?
本质上是的。而且更关键的是,这不是OpenAI一家的问题。评估结果说明前沿模型在这个领域的能力正在趋同,这是整个行业的趋势。
那AISI的评估机制能管住这事儿吗?
这就是最尴尬的地方了。你想啊,评估报告还在写的时候,模型已经被几百万人在用了。
等会儿让我想想……所以现在的状况是——先上车后补票?
比这还糟。是车都开出去一百公里了,安检报告才出来说'这车刹车可能有问题'。
哈哈哈这比喻太损了。但确实是这个道理。那你觉得应该怎么办?总不能说不让发模型吧。
我个人的观点是——我们需要给AI的某些能力设发布门槛。不是所有能力都适合无门槛开放。就像武器级材料不会摆超市一样,具备显著攻击辅助能力的模型应该有更严格的准入。
但这个'门槛'谁来定?怎么定?各国标准不一样怎么办?
这就是目前行业没有共识的地方。但GPT-5.5这个案例至少说明了一件事——AI安全评估不应该是事后的体检报告,应该是事前的通行许可。
能力已经扩散了再谈管控,就是亡羊补牢。
对。而且这场前沿模型的网络安全能力竞赛已经开始了,治理框架还在后面追。这个gap每大一天,风险就多一分。
嗯……说实话聊完这个我心情挺复杂的。一方面觉得技术进步确实能帮到很多人,另一方面又觉得这个潘多拉盒子开得有点快了。
是啊。这关系到每一个联网设备的安全,不夸张地说,跟我们每个人都有关。希望治理能跑快点吧。