ChatGPT「可信联系人」功能详解:AI如何检测自伤风险并通知亲友

OpenAI推出ChatGPT可信联系人功能,检测自伤风险时自动通知用户指定亲友。
OpenAI为ChatGPT推出可选的「可信联系人」安全功能,允许成年用户指定紧急联系人。当AI检测到用户讨论自伤或自杀等敏感话题时,系统自动通知指定亲友。该功能基于临床「守门人」干预模型,将AI定位为风险发现者,在用户自主授权前提下平衡隐私与安全,回应了近年AI聊天机器人引发的心理健康争议和监管压力。
概述
OpenAI正式推出一项名为「Trusted Contact」(可信联系人)的可选安全功能,允许ChatGPT成年用户指定紧急联系人,用于心理健康和安全方面的预警。当系统检测到用户可能与聊天机器人讨论了自伤或自杀等敏感话题时,被指定为可信联系人的朋友、家人或看护者将收到通知。

ChatGPT可信联系人功能的工作机制
主动安全而非被动响应
这项功能的核心设计理念在于将AI安全从被动响应转向主动预防。传统上,当用户在聊天中表达自伤意图时,AI系统通常只能提供危机热线号码或建议寻求专业帮助。但现实中,处于心理危机状态的人往往不会主动拨打求助电话。
「可信联系人」功能打破了这一困境——它在用户事先同意的前提下,建立了一个外部安全网。当AI检测到潜在风险信号时,系统会自动通知用户预先指定的亲友,让关心他们的人能够及时介入。
这一设计逻辑与心理健康领域成熟的**「守门人」(Gatekeeper)干预模型**高度契合。该模型由世界卫生组织(WHO)和美国自杀预防基金会(AFSP)长期推广,核心理念是培训普通人识别危机信号并主动介入,而非完全依赖专业医疗资源。大量临床研究表明,来自熟悉者的及时关怀往往比陌生危机热线更能有效降低风险。OpenAI将这一经过验证的人际干预框架数字化,本质上是让AI扮演「发现者」角色,而将真正的情感支持交还给人类关系网络。
用户自主权与隐私保护的平衡
有意思的是,这是一项完全可选的功能。用户需要主动开启并指定联系人,具体设计包括:
- 自主性:用户完全掌控是否启用该功能
- 知情同意:用户清楚知道在什么情况下联系人会被通知
- 信任基础:用户自行选择信任的人作为安全网
这种设计在保护用户隐私和确保安全之间找到了一个微妙的平衡点。值得注意的是,向第三方发送用户对话相关通知,在不同司法管辖区面临截然不同的法律约束。在欧盟,《通用数据保护条例》(GDPR)对涉及健康状况的「特殊类别数据」设有最严格的处理限制,即便用户事先同意,数据控制者仍需证明处理的必要性与比例原则。在美国,各州隐私法(如加州CCPA)对消费者数据的保护也日趋严格。OpenAI将该功能设计为完全可选并需用户主动授权,很大程度上正是为了在全球范围内满足「知情同意」这一最基础的合规要求。
AI心理健康安全的行业背景
AI聊天机器人引发的心理健康风险
近年来,多起涉及AI聊天机器人与用户心理健康的事件引发了广泛关注。其中最具代表性的是2024年的Character.AI事件:一名14岁美国少年在长期与AI角色扮演对话后自杀,其家属随即对该公司提起诉讼。案件引发全球媒体广泛报道,成为AI心理健康风险讨论的标志性事件。此后,美国参议院召开专项听证会,多位议员提出针对AI聊天机器人的监管立法草案。这一背景使OpenAI推出Trusted Contact功能的时机具有明显的监管预期管理意味——通过主动建立安全机制,在立法强制要求到来之前展示行业自律能力。
部分用户——尤其是青少年——在与AI的长期对话中可能产生情感依赖,甚至在脆弱时刻做出极端行为。这些案例促使AI公司不得不正视一个问题:当用户将AI视为倾诉对象时,平台是否有责任在检测到危险信号时采取行动?OpenAI此次推出的Trusted Contact功能,可以被视为对这一问题的正式回应。
技术伦理层面的关键问题
AI系统检测心理健康风险信号的技术基础,主要依赖自然语言处理(NLP)中的情感分析与意图识别模型。这类模型通过大规模标注数据训练,能够识别特定词汇组合、语义模式和情绪倾向。然而,自杀/自伤意图的检测属于高度敏感的分类任务,面临极高的假阳性(误报)和假阴性(漏报)风险。学术界通常采用哥伦比亚自杀严重程度评定量表(C-SSRS)等临床工具作为标注基准,但将其迁移到开放式对话场景仍存在巨大挑战。
从技术伦理角度看,这项功能提出了几个值得深入思考的问题:
- 检测准确性:AI如何准确判断用户是在真正表达自伤意图,还是在进行学术讨论或创作写作?误报可能导致不必要的恐慌,而漏报则可能酿成更严重的后果。
- 通知边界:通知中会包含多少对话细节?如何在提供足够信息让联系人采取行动的同时,不过度暴露用户隐私?
- 责任归属:如果系统未能检测到风险信号,或联系人未能及时响应,责任如何界定?这一问题在法律层面目前仍高度模糊。
对用户和AI行业的实际影响
哪些用户群体将受益
对于有心理健康顾虑的用户群体,这项功能提供了一层额外的安全保障。特别是对于独居者、有心理健康病史的人群,以及他们的家属来说,ChatGPT可信联系人可能是一个有实际价值的安全工具。
可能引发的行业连锁反应
OpenAI此举很可能引发行业跟进。Google、Anthropic等竞争对手可能会推出类似功能,甚至监管机构可能将此类安全机制纳入未来的AI监管框架中。这标志着AI安全的讨论正在从模型层面的对齐问题(即确保AI行为符合人类价值观的技术研究方向),扩展到用户层面的实际保护措施——这是一个更贴近现实生活、更具可操作性的维度转变。
总结
「可信联系人」功能代表了AI公司在用户安全方面迈出的重要一步。它不仅是一项产品功能,更是AI行业对自身社会责任认知的体现。这一功能将临床验证的守门人干预模型、NLP风险检测技术与用户自主授权机制融为一体,试图在技术能力与人文关怀之间建立真实可用的桥梁。随着AI越来越深入地融入人们的日常生活和情感世界,如何负责任地应对用户的心理健康风险,将成为所有AI公司必须持续面对的核心课题。
核心要点
- OpenAI为ChatGPT推出可选的「可信联系人」安全功能,允许成年用户指定紧急联系人
- 当AI检测到用户讨论自伤或自杀等话题时,系统将自动通知指定的亲友或看护者
- 该功能完全由用户自主开启,在隐私保护与安全预警之间寻求平衡
- 此举回应了近年来AI聊天机器人与用户心理健康相关的多起争议事件,尤其是2024年Character.AI诉讼案引发的监管压力
- 功能设计融合了临床「守门人」干预模型,将AI定位为风险发现者,情感支持仍由人类承担
- 可能引发行业跟进,推动AI安全从模型对齐扩展到用户实际保护层面
相关推荐
科技前沿GitHub Agent HQ发布:AI编程工具进入平台化竞争时代
GitHub Universe大会发布Agent HQ平台,统一管理编码Agent,Copilot升级支持多模型集成。同期OpenAI完成重组,Anthropic新模型测试,NVIDIA开源系列AI模型,AI编程工具格局加速整合。
科技前沿Gemini 3.5 Flash在GDPval基准上实现巨大飞跃
Google Gemini 3.5 Flash在GDPval基准测试中超越Gemini 3.1 Pro,轻量级Flash模型借助后训练技术逼近前沿水平,重新定义性能与成本的平衡点,为AI应用开发者带来重大利好。
科技前沿Google Gemini Antigravity周配额三倍提升,AI编程不再受限
Google Gemini团队再次将Antigravity周配额提升至三倍,继日配额提升后再次加码。本文解析此次配额调整对开发者的实际影响,以及在AI编程助手竞争格局中的战略意义。