#开源安全

共 5 篇相关文章

Anthropic将AI对齐测试工具Petri正式捐赠给Meridian Labs，并发布重大更新提升适应性、真实性和深度。本文解析这一事件对AI安全领域的深远影响及行业趋势。

英国政府数字服务部门GDS发布官方指南，公开反对NHS因AI安全漏洞一刀切关闭开源代码仓库，主张"保持默认开放"。这场罕见的政府内部公开分歧，揭示了公共部门在AI时代如何平衡开源透明与代码安全的深层治理挑战。

DeadEnd-CLI是一款开源AI代理式渗透测试工具，在XBOW基准测试中以KIMI K2.5模型实现81%全黑盒通过率。支持多模型兼容、完全自托管部署，为安全团队提供低成本自动化渗透测试方案。

Guardrails AI的PyPI包guardrails-ai 0.10.1遭Mini Shai-Hulud供应链攻击，TanStack、Mistral等项目同时受害。本文详解攻击过程、影响范围及开发者应急修复措施，并提供AI开源生态供应链安全防护建议。

英国AI安全研究所评估GPT-5.5：网络安全能力比肩Claude Mythos

英国AI安全研究所（AISI）发布GPT-5.5网络安全能力评估报告，结果显示其漏洞发现能力与Claude Mythos相当，但GPT-5.5已公开可用。本文解读评估核心发现及其对AI安全治理的深远影响。