共 5 篇相关文章
科技前沿Anthropic将AI对齐测试工具Petri正式捐赠给Meridian Labs,并发布重大更新提升适应性、真实性和深度。本文解析这一事件对AI安全领域的深远影响及行业趋势。
科技前沿英国政府数字服务部门GDS发布官方指南,公开反对NHS因AI安全漏洞一刀切关闭开源代码仓库,主张"保持默认开放"。这场罕见的政府内部公开分歧,揭示了公共部门在AI时代如何平衡开源透明与代码安全的深层治理挑战。
科技前沿DeadEnd-CLI是一款开源AI代理式渗透测试工具,在XBOW基准测试中以KIMI K2.5模型实现81%全黑盒通过率。支持多模型兼容、完全自托管部署,为安全团队提供低成本自动化渗透测试方案。
科技前沿Guardrails AI的PyPI包guardrails-ai 0.10.1遭Mini Shai-Hulud供应链攻击,TanStack、Mistral等项目同时受害。本文详解攻击过程、影响范围及开发者应急修复措施,并提供AI开源生态供应链安全防护建议。
英国AI安全研究所评估GPT-5.5:网络安全能力比肩Claude Mythos
英国AI安全研究所(AISI)发布GPT-5.5网络安全能力评估报告,结果显示其漏洞发现能力与Claude Mythos相当,但GPT-5.5已公开可用。本文解读评估核心发现及其对AI安全治理的深远影响。