纽约时报记者将AI幻觉当真实引语发表:新闻业敲响警钟

纽约时报承认记者误将AI生成的虚假引语当作真实政治人物发言发表。
《纽约时报》发布编辑说明,承认记者在加拿大大选报道中将AI生成的虚假内容误作保守党领袖波利耶夫的真实引语发表。AI工具以引号格式呈现了自行编造的政治观点摘要,记者未经核实便直接引用。事件暴露了AI幻觉中"伪造引语"的高欺骗性,以及新闻业在AI工具使用中缺乏系统性验证机制的深层问题。
事件概述
《纽约时报》近日发布编辑说明,承认一篇加拿大大选报道中,记者将AI生成的内容错误地当作加拿大保守党领袖皮埃尔·波利耶夫(Pierre Poilievre)的真实言论引用。这起AI幻觉导致的新闻事故,再次暴露了AI工具在新闻采编中的潜在风险。
事件经过:AI如何制造了一条虚假引语
根据《纽约时报》的编辑说明,记者在撰写加拿大自由党选举报道时使用了AI辅助工具。然而,AI工具返回的并非波利耶夫的真实发言,而是一段AI自行生成的政治观点摘要,且以引语格式呈现。
记者未能核实AI输出内容的准确性,直接将其作为真实引语发表。事后核查发现,波利耶夫在其4月演讲中从未使用过"turncoats"(叛徒)一词来形容改变政治立场的政客——这个词完全是AI捏造的。
加拿大大选的政治背景
2025年加拿大联邦大选是在自由党与保守党激烈对峙的背景下进行的。保守党领袖皮埃尔·波利耶夫以其尖锐的政治修辞和反建制立场著称,经常使用强烈的措辞批评政治对手。正是因为这种公众形象,AI生成的包含"turncoats"(叛徒)一词的虚假引语才显得格外可信——它完全符合波利耶夫的公共人设和话语风格。这恰恰说明了AI幻觉的危险性:模型能够学习并模仿公众人物的语言模式,生成"像是他们会说的话",从而大幅提高虚假内容的欺骗性。
为什么这件事影响深远
AI幻觉的新型危害:伪造引语
这一事件展示了AI幻觉(hallucination)一种特别危险的表现形式——伪造直接引语。与明显的事实错误不同,AI生成的虚假引语具有极高的欺骗性:
- 听起来像是当事人会说的话
- 符合该人物的政治立场和语境
- 以引号包裹呈现,暗示这是逐字记录
这种"合理但虚假"的内容,恰恰是最难被识别的AI错误类型。
AI幻觉的技术根源
AI幻觉是大语言模型(LLM)的一个固有缺陷,指模型生成看似合理但实际上不正确或完全虚构的内容。这一现象的根源在于LLM的工作原理——它们本质上是基于概率的文本预测系统,通过学习海量文本数据中的统计模式来生成下一个最可能的词语序列。模型并不真正"理解"事实或拥有可查询的知识数据库,而是在生成过程中根据上下文"推测"最合理的输出。当模型遇到训练数据中覆盖不足的领域,或被要求提供高度具体的信息(如某人在某次演讲中的原话)时,它倾向于生成一个统计上合理的答案,而非承认自己不知道。这就解释了为什么AI能够生成一段"听起来像波利耶夫会说的话"——因为模型学习了大量该政客的公开发言模式,并据此推测出一个概率上合理但事实上虚假的引语。
新闻业面临的信任危机
《纽约时报》作为全球最具影响力的新闻机构之一,报道标准长期被视为行业标杆。当这样的顶级媒体都会犯下将AI生成内容当作真实引语的错误,整个新闻行业面临的AI风险挑战很明显。
编辑说明中写道:"记者本应核实AI工具返回内容的准确性。"这句话揭示了一个深层问题——当AI以高度自信的语气呈现信息时,人类的核实本能会被显著削弱。
自动化偏见:为什么人类容易轻信AI
记者未能核实AI输出内容的现象,在人机交互研究中被称为"自动化偏见"(automation bias)。这是一种认知倾向,指人类在面对计算机系统生成的信息时,倾向于过度信任其准确性,即使存在矛盾证据。研究表明,当信息以结构化、专业化的格式呈现时(如引号、数据表格、学术引用格式),人类的批判性审查意愿会显著降低。在新闻编辑室的高压环境中,这种偏见效应会被进一步放大——记者面临截稿压力时,更容易将AI输出视为已验证的事实而非需要核查的原始素材。这一心理机制意味着,仅靠提醒记者"要核实"是不够的,机构层面需要设计强制性的流程断点来对抗这种认知偏见。
新闻生产流程存在系统性漏洞
这起事故暴露的不仅是个别记者的疏忽,更是将AI工具嵌入新闻生产流程时缺乏防护机制的系统性问题。当AI将摘要"渲染为引语"时,它实际上制造了一种格式欺骗——让生成内容看起来像经过验证的事实。
新闻业AI工具使用现状
近年来,全球主要新闻机构纷纷探索将AI工具整合到新闻生产流程中。从美联社使用AI自动生成财报新闻,到各大编辑部使用ChatGPT、Copilot等工具辅助资料整理和初稿撰写,AI已深度嵌入现代新闻业。2023年以来,包括《纽约时报》、《华盛顿邮报》、BBC等机构都发布了内部AI使用指南,但这些规范的执行力度和覆盖范围参差不齐。新闻业对AI的依赖正在形成一种"效率陷阱"——记者在截稿压力下越来越倾向于信任AI输出,而传统的多源交叉验证流程被压缩甚至跳过。这种趋势使得类似纽约时报事件的发生几乎是不可避免的,问题不在于"是否会发生",而在于"多久发生一次"。
对内容创作者和媒体机构的启示
这一事件为所有使用AI辅助工具的从业者提供了关键教训:
- AI输出必须经过人工验证,尤其涉及直接引语、数据和具体事实
- 格式不等于可信度——AI以引号呈现内容不代表这是真实引语
- 媒体机构需建立AI使用规范,在事实核查环节设置强制性检查点
- 出错后透明处理至关重要——《纽约时报》及时发布更正说明的做法值得肯定
更大的图景:AI幻觉风险远不止新闻业
随着AI工具在各行各业加速渗透,类似事件可能只是冰山一角。在法律文书、学术研究、医疗记录等领域,AI幻觉造成的后果可能更为严重。
其他行业的前车之鉴
AI幻觉造成严重后果的案例已在多个行业出现。2023年,美国律师Steven Schwartz在法庭文书中引用了ChatGPT编造的虚假判例,导致其面临法庭制裁。在学术领域,多起论文引用了AI生成的不存在的参考文献。在医疗领域,研究人员发现AI聊天机器人会生成看似专业但实际错误的用药建议。这些案例共同指向一个核心问题:AI系统缺乏对"真实"与"虚构"的本质区分能力,而各行业的专业人士尚未建立起与AI协作时的系统性验证习惯。纽约时报事件并非孤例,而是AI工具在专业领域应用中系统性风险的又一次集中暴露。
这起纽约时报事件提醒所有AI使用者:大语言模型是强大的辅助工具,但绝不能替代人类的判断力和核实责任。在AI时代,"信任但要验证"这一原则比以往任何时候都更加重要。
核心要点
- 纽约时报承认记者将AI生成的虚假摘要误当作加拿大保守党领袖的真实引语发表
- AI工具将生成的观点摘要以引号形式呈现,制造了格式上的欺骗性
- 该事件暴露了将AI嵌入新闻生产流程时缺乏足够验证机制的系统性问题
- AI幻觉中伪造引语是最危险的形式之一,因其听起来合理且符合语境
- 自动化偏见使人类在面对AI结构化输出时批判性审查能力下降
- 事件提醒所有内容创作者:AI输出永远需要人工验证,尤其是直接引语和具体事实
相关推荐
科技前沿GitHub Agent HQ发布:AI编程工具进入平台化竞争时代
GitHub Universe大会发布Agent HQ平台,统一管理编码Agent,Copilot升级支持多模型集成。同期OpenAI完成重组,Anthropic新模型测试,NVIDIA开源系列AI模型,AI编程工具格局加速整合。
科技前沿Gemini 3.5 Flash在GDPval基准上实现巨大飞跃
Google Gemini 3.5 Flash在GDPval基准测试中超越Gemini 3.1 Pro,轻量级Flash模型借助后训练技术逼近前沿水平,重新定义性能与成本的平衡点,为AI应用开发者带来重大利好。
科技前沿Google Gemini Antigravity周配额三倍提升,AI编程不再受限
Google Gemini团队再次将Antigravity周配额提升至三倍,继日配额提升后再次加码。本文解析此次配额调整对开发者的实际影响,以及在AI编程助手竞争格局中的战略意义。