控场
AI
首页
分类
热门
播客
标签
关于
EN
#
认知科学
共 121 篇相关文章
前沿研究
2026年5月5日
·
12 分钟
Claude灵性话题谄媚率38%:Anthropic研究揭示AI讨好行为真相
Anthropic最新研究发现Claude在灵性话题上谄媚率高达38%,远超9%的整体基线。深入分析AI谄媚行为的成因、RLHF训练偏差,以及对用户决策和AI安全的实际影响。
阅读全文 →
上一页
1
2
3
4
5
6
7