共 4 篇相关文章

海外安全博主对DeepSeek进行系统性越狱测试,通过直接请求、变换措辞、不同提示策略等多种手段尝试突破安全防线。测试结果显示DeepSeek安全机制具备意图识别、一致性拦截和上下文感知能力,在防护与可用性之间取得良好平衡。
科技前沿Anthropic正式公开HackerOne漏洞赏金计划,任何安全研究者均可提交Claude模型漏洞报告并获得奖励。本文解读这一转变对AI安全行业的深远影响,以及白帽黑客如何参与AI安全防护。
科技前沿Meta宣布关停Horizon Worlds VR端,800亿美元元宇宙投入画上句号。同日Google收紧Gemini CLI免费权限,OpenAI收购Astro加速Codex生态,图灵奖首颁量子领域。2026年科技巨头全面转向AI的深度解读。
科技前沿Guardrails AI发布2024年度数据:每周保护超100万次LLM调用,拥有64个验证器、50万+安装量。深度解读LLM安全护栏为何成为AI应用的刚需,以及2025年发展趋势展望。