控场
AI
首页
分类
知识
热门
播客
标签
关于
EN
#
鲁棒对齐
共 1 篇相关文章
2026年6月22日
·
6 分钟
OpenAI新研究:让AI在高风险任务中持续保持安全行为
OpenAI发布关于"广泛且持久有益性"的新研究,探索如何让AI模型在训练分布之外的高风险场景中保持安全行为。本文解析其核心目标、技术路径及对AI Agent安全的深远影响。
阅读全文 →