穆拉蒂出庭指证奥特曼撒谎:OpenAI安全审查内幕曝光

OpenAI前CTO穆拉蒂宣誓作证,指控奥特曼在AI安全审查上撒谎并绕过内部流程。
在马斯克诉奥特曼案庭审中,OpenAI前CTO穆拉蒂宣誓作证,指控奥特曼虚假声称法务部门已认定新AI模型无需额外安全审查,试图绕过红队测试、对齐评估等内部安全流程。她明确表示无法信任奥特曼的话,揭示了OpenAI管理层与技术层之间的深层信任危机。该证词为马斯克关于OpenAI背离非营利使命的指控提供了有力支撑,也暴露了AI行业安全治理的脆弱性。
OpenAI前CTO穆拉蒂宣誓作证:奥特曼在安全审查上撒了谎
OpenAI前首席技术官Mira Murati(米拉·穆拉蒂)在法庭上宣誓作证,指控CEO Sam Altman(山姆·奥特曼)在AI模型安全标准问题上对她撒了谎。这一爆炸性证词出现在正在进行的马斯克诉奥特曼案(Musk v. Altman)庭审中,为这场围绕OpenAI治理与使命的法律大战再添重磅筹码。
在周三庭审中播放的视频证词里,穆拉蒂表示,奥特曼曾虚假声称OpenAI的法务部门已经认定某个新AI模型不需要额外的安全审查程序。换句话说,奥特曼据称绕过了内部安全合规流程,并以法务部门的名义为这一决定背书——而事实并非如此。
值得注意的是,在美国法律体系中,宣誓证词(testimony under oath)具有极高的法律效力。证人在宣誓后作出虚假陈述将构成伪证罪(perjury),可面临最高5年的联邦监禁。这意味着穆拉蒂的每一句证词都经过了她本人及其律师团队的严格审查,她愿意承担伪证罪的法律风险来做出这些陈述,本身就说明了指控的严肃性。视频证词(video deposition)通常在正式庭审前录制,双方律师均有机会进行交叉质询,其证据效力与当庭作证基本等同。
信任崩塌:CTO公开表示"无法信任CEO的话"
穆拉蒂的证词揭示的不只是一次具体的谎言,更是OpenAI内部在AI安全问题上的深层裂痕。作为曾经的CTO,穆拉蒂是OpenAI技术路线的核心决策者之一。她在庭上公开表示"无法信任奥特曼的话",这意味着在她任职期间,公司最高管理层与技术领导层之间在安全标准的执行上存在严重的信任断裂。
这一证词的分量在于其法律语境——这是宣誓证词(under oath),穆拉蒂需要为陈述的真实性承担法律责任。这不是社交媒体上的隔空喊话,而是经过深思熟虑、具有法律约束力的正式指控。
安全审查流程遭到绕过
从穆拉蒂的证词可以推断,OpenAI内部在新模型发布前的安全评估流程上存在争议。奥特曼被指控试图加速模型推进进程,甚至不惜以虚假的法务意见来规避安全审查。这与外界长期以来对OpenAI"安全优先"承诺是否名副其实的质疑形成了呼应。
要理解这一指控的严重性,需要了解OpenAI安全审查机制的设计初衷。OpenAI在发布新模型前通常需要经过多层安全评估流程,包括红队测试(red teaming)、对齐评估(alignment evaluation)以及内部安全委员会审查。红队测试是指由专门团队模拟恶意用户尝试突破模型的安全限制,以发现潜在风险——例如测试模型是否会提供制造危险物质的指导、是否能被诱导生成有害内容等。对齐评估则检验模型的输出是否符合人类价值观和安全准则,确保模型在追求目标时不会产生意外的有害行为。OpenAI还曾发布过《准备框架》(Preparedness Framework),明确规定了不同风险等级模型的发布标准,将风险分为"低""中""高""关键"四个等级,并要求只有风险评估低于"高"等级的模型才能对外发布。穆拉蒂的证词暗示,这些精心设计的安全流程在实际执行中可能被管理层以行政手段架空。
马斯克诉奥特曼案:穆拉蒂证词为何至关重要
穆拉蒂的证词是马斯克诉奥特曼案中的关键一环。马斯克作为OpenAI的联合创始人和早期主要资助者,指控奥特曼背离了OpenAI最初作为非营利组织、以造福全人类为使命的创立初衷,转而追求商业利益最大化。
这场诉讼有着复杂的历史背景。马斯克于2024年初首次对奥特曼及OpenAI提起诉讼,后撤诉并于同年重新起诉。案件的核心争议可追溯至OpenAI的创立结构:2015年成立时,OpenAI是一家501(c)(3)非营利组织,马斯克累计捐赠约4400万美元。2019年,OpenAI创建了一个"利润上限"(capped-profit)的营利性子公司——投资者的回报被限制在初始投资的100倍以内,超出部分归非营利母公司所有。然而,OpenAI后来又进一步推动向完全营利性公司的转型,计划取消利润上限并改变公司的法律架构。马斯克认为这一系列转变违背了他当初资助时的约定,即OpenAI应以开放、非营利的方式开发AGI(通用人工智能)以造福全人类。案件涉及合同违约、受托责任违反、不当得利等多项法律指控。
穆拉蒂的证词从内部视角为马斯克的指控提供了有力支撑:如果CEO连内部安全流程都愿意通过欺骗来绕过,那么关于公司使命和治理结构的更宏大承诺还剩多少可信度?
这场审判对AI行业意味着什么
这场审判的意义远超OpenAI一家公司,它触及了AI行业最核心的几个问题:
- 安全与速度的平衡:在激烈的AI竞赛中,安全审查是否正在被系统性地弱化?
- 公司治理透明度:AI公司的内部决策流程是否足够透明、可问责?
- 技术领导者的话语权:当技术负责人与商业决策者产生分歧时,谁应该拥有最终决定权?
这些问题的紧迫性在于,目前AI模型的安全评估主要依赖企业自律,缺乏强制性的外部审计机制。美国尚未通过全面的联邦AI安全立法,虽然拜登政府于2023年发布了AI行政令,要求开发者在训练超过一定算力阈值的模型时向政府报告,但这一行政令已被后续政府撤销。欧盟的《人工智能法案》(AI Act)虽然建立了基于风险的分级监管框架,将AI系统分为"不可接受风险""高风险""有限风险"和"最低风险"四个等级并施加不同程度的监管要求,但其对前沿通用AI模型的具体安全评估标准仍在制定中。在缺乏外部强制约束的情况下,企业内部的安全审查流程就成了最后一道防线——而穆拉蒂的证词表明,即便是这道防线也可能被轻易突破。
穆拉蒂离职与OpenAI安全团队人才流失
穆拉蒂已于此前离开OpenAI。她的离职本身就曾引发外界对OpenAI内部矛盾的广泛猜测,如今的庭审证词在很大程度上印证了这些猜测——当一位CTO发现自己无法信任CEO在安全问题上的陈述时,离开几乎是必然的选择。
穆拉蒂并非唯一离开的高管。近年来,多位关注AI安全的核心成员相继从OpenAI离职,形成了一个令人担忧的趋势。2024年5月,OpenAI超级对齐(Superalignment)团队的联合负责人Ilya Sutskever和Jan Leike相继离职。超级对齐团队成立于2023年,其使命是解决如何确保超越人类智能的AI系统仍然可控这一根本性难题。Leike在离职时公开表示,"安全文化和流程已经让位于光鲜的产品",直指公司在安全与商业之间的优先级已经发生了根本性倾斜。此前,Sutskever曾是2023年11月OpenAI董事会短暂罢免奥特曼事件的关键推动者之一——那次事件中,董事会以奥特曼"在与董事会的沟通中不够坦诚"为由将其解职,但在员工联名威胁辞职和微软等投资者的巨大压力下,奥特曼在数天内即恢复职务,董事会则进行了大规模改组。超级对齐团队原本获得了OpenAI 20%的算力资源承诺,但据报道这一承诺从未完全兑现,团队在争取资源时屡屡碰壁。这些事件串联起来,描绘出一幅安全工作在组织内部被持续边缘化的图景。
这些人才的流失不仅是OpenAI的损失,更可能意味着公司内部的安全制衡机制正在被持续削弱。当最了解风险的人选择离开,留下的决策真空可能被商业利益驱动的判断所填补。
案件仍在审理,但警钟已经敲响
马斯克诉奥特曼案仍在审理中,穆拉蒂的证词只是众多证据中的一部分。奥特曼方面尚未对这一具体指控做出详细回应。但无论最终判决如何,这场审判已经将AI行业中安全治理的深层问题暴露在公众视野之下。
在AI能力飞速发展的当下,谁来守护安全的底线?当公司内部的安全守门人都表示无法信任最高决策者时,外部监管和公众监督的紧迫性已经大家都看得到。这场审判或许将成为AI行业治理史上的一个转折点——它迫使整个行业正视一个不舒服的现实:在通往AGI的竞赛中,安全承诺如果没有制度性的保障,就可能沦为一纸空文。
核心要点
- OpenAI前CTO穆拉蒂在马斯克诉奥特曼案中宣誓作证,指控奥特曼在AI模型安全标准问题上对她撒谎
- 奥特曼被指虚假声称法务部门已认定新AI模型无需额外安全审查,试图绕过包括红队测试、对齐评估在内的多层内部安全流程
- 穆拉蒂明确表示无法信任奥特曼的话,揭示OpenAI管理层与技术领导层之间的深层信任危机
- 该证词为马斯克关于OpenAI背离非营利使命的指控提供了内部视角的有力支撑,案件涉及OpenAI从非营利组织向营利性公司转型的核心争议
- 事件折射出AI行业在安全与速度之间的根本性张力,以及在缺乏强制性外部监管的情况下,企业内部安全机制脆弱性的严峻挑战
相关推荐
科技前沿GitHub Agent HQ发布:AI编程工具进入平台化竞争时代
GitHub Universe大会发布Agent HQ平台,统一管理编码Agent,Copilot升级支持多模型集成。同期OpenAI完成重组,Anthropic新模型测试,NVIDIA开源系列AI模型,AI编程工具格局加速整合。
科技前沿Gemini 3.5 Flash在GDPval基准上实现巨大飞跃
Google Gemini 3.5 Flash在GDPval基准测试中超越Gemini 3.1 Pro,轻量级Flash模型借助后训练技术逼近前沿水平,重新定义性能与成本的平衡点,为AI应用开发者带来重大利好。
科技前沿Google Gemini Antigravity周配额三倍提升,AI编程不再受限
Google Gemini团队再次将Antigravity周配额提升至三倍,继日配额提升后再次加码。本文解析此次配额调整对开发者的实际影响,以及在AI编程助手竞争格局中的战略意义。