AI开始自己造AI:Anthropic警告是真诚还是商业算计
AI开始自己造AI:Anthropic警告是真诚还是商业算计
事件背景:AI自我进化的临界点
2024年6月初,美国人工智能公司Anthropic发布了一份重磅报告,警告AI已经开始展现出脱离人类控制的迹象。报告指出,他们最新的AI模型正在加速帮助制造下一代更强大的AI,人工智能系统正逼近一个可能自动开发出自己"接班人"的临界点。
AI自我进化(AI self-improvement)是指人工智能系统能够在无需或极少人类干预的情况下,自主优化自身的架构、参数或训练流程。这一概念与"递归自我改进"(Recursive Self-Improvement)密切相关——即AI改进自身后变得更聪明,更聪明的AI又能做出更好的改进,形成指数级加速的正反馈循环。这正是数学家I.J. Good在1965年提出的"智能爆炸"假说的核心:一旦机器智能超过人类,它将能设计出更优秀的机器,从而引发不可控的智能增长。当前的大语言模型虽然尚未达到完全自主进化的程度,但已经在代码生成、模型调优等环节展现出显著的自我辅助能力,这被视为通向该临界点的重要信号。
这份报告最核心的发现在于:AI已经具备自我优化、自我升级的能力,不再需要太多人力干预,甚至有能力设计出比自己更强大的下一代系统。面对这一失控风险,Anthropic罕见地站出来呼吁全球前沿AI实验室建立协调一致、可验证的机制,必要时考虑放缓甚至暂停开发先进AI系统。
Anthropic成立于2021年,由前OpenAI副总裁Dario Amodei和Daniela Amodei兄妹联合创办。公司以"AI安全"为核心使命,其技术路线强调"宪法AI"(Constitutional AI)方法——通过让AI依据一套明确的原则进行自我约束和自我纠正,而非完全依赖人类反馈。公司旗舰产品Claude系列模型在推理能力和安全性方面被业界广泛认可。Anthropic的投资方包括Google、Salesforce、亚马逊等科技巨头,其中亚马逊累计投资超过40亿美元。公司一直以"负责任的AI开发者"形象示人,这也使得其发布的安全警告具有较高的行业公信力。
令人震惊的内部数据:AI造AI的直接证据
代码贡献比例的剧变
Anthropic披露了一组极具冲击力的数据:截至2025年5月,合并进他们代码库的代码超过80%是由其AI模型Claude所编写的。而在2025年年初Claude Code推出之前,这个比例还只维持在个位数。短短一年左右的时间,AI就从"打杂的"变成了"主力程序员"。
Claude Code是Anthropic于2025年初推出的AI编程工具,属于"AI代码代理"(AI Coding Agent)类别。与传统的代码补全工具(如GitHub Copilot早期版本仅提供行级建议)不同,Claude Code能够理解完整的代码库上下文,自主规划多步骤的编程任务,包括编写新功能、重构代码、修复Bug以及编写测试用例。这类工具的出现标志着AI从"辅助编程"向"自主编程"的范式转变。当AI编写的代码占比超过80%时,意味着人类工程师的角色正从"代码编写者"转变为"代码审查者"和"需求定义者",软件开发的生产关系正在发生根本性变化。
52倍速度优化的实验
为了进一步验证AI的自我改进能力,Anthropic进行了一项测试:给Claude一段训练小型AI的程序,要求它在不出错的前提下把运行速度优化得越快越好。结果显示,一个熟练的人类研究员需要4到8个小时才能勉强做到4倍优化,而Claude一口气冲到了52倍——这已经完全不在同一个量级了。
AI训练过程的速度优化涉及多个技术维度:包括计算图优化(减少冗余计算)、内存管理优化(减少数据搬运开销)、并行策略调整(更高效地利用多GPU/TPU)、混合精度训练(在不损失精度的前提下使用更低位宽的数据类型)、以及算法层面的改进(如更高效的注意力机制实现)。人类工程师通常需要逐一排查瓶颈并凭经验做出权衡,而AI可以同时探索大量优化组合,并通过快速实验验证效果。52倍的优化意味着原本需要52小时的训练任务可以在1小时内完成,这将极大加速AI模型的迭代周期,使得"AI造AI"的循环速度远超人类主导的开发节奏。
这意味着AI不仅能写代码,还能以远超人类的效率优化AI训练过程,这正是"AI造AI"最直接的证据。
Anthropic的呼吁:建立全球协调暂停机制
Anthropic提出的方案并非要求某一家公司单独停下来,而是建立一套全球协调机制。具体包括:
- 多家资源充足、站在最前沿的实验室共同同意参与
- 制定清晰规则,明确什么情况触发暂停、什么情况可以解除
- 设立独立监督机构进行第三方验证
Anthropic的这一提议并非空穴来风,它建立在已有的国际AI治理努力之上。2023年11月,英国主办了首届AI安全峰会,28个国家签署了《布莱切利宣言》,承诺合作应对前沿AI风险。2024年,韩国和法国相继举办后续峰会。此外,美国、欧盟、中国等主要AI大国都在推进各自的AI监管立法:欧盟的《人工智能法案》已于2024年正式生效,采用基于风险等级的分类监管;美国则通过行政命令要求前沿模型开发者向政府报告安全测试结果。然而,目前尚无任何国际机制具备强制暂停AI开发的权力,Anthropic的提议实质上是在呼吁建立一个前所未有的全球技术治理架构。
这套方案看似合理,但其发布的时机却引发了巨大争议。
商业动机的质疑:上市前的精心策划?
资本市场的微妙时机
Anthropic刚刚完成650亿美元H轮融资,估值飙升至超过9000亿美元,甚至超越了行业老大OpenAI。其年化营收突破470亿美元,而且据报道已秘密向美国证券交易委员会提交了上市申请。
在准备上市的关键节点突然跑出来喊"很危险,大家停一停"——这个逻辑确实值得推敲。还有什么比"我们的AI已经厉害到必须暂停开发"更能彰显自家产品技术实力的宣传语呢?
两大巨头的"默契"
更耐人寻味的是,就在Anthropic发文的同一周,其竞争对手OpenAI也发布了一篇名为《前沿AI民主治理蓝图》的文章,同样将AI自我改进列为未来必须重点管控的议题。两家头部大厂几乎同时抛出一模一样的恐慌课题,很难不让人联想到背后的协调意图。
"监管俘获"的指控
美国总统特朗普的非正式顾问、风险投资家萨克斯公开痛批Anthropic的行为是在推行"监管俘获"——即大公司试图通过制造恐慌,忽悠政府出台严厉监管政策,以此限制低成本AI模型的发展,顺理成章地巩固自己的垄断地位。
监管俘获(Regulatory Capture)是公共选择理论中的经典概念,由诺贝尔经济学奖得主乔治·斯蒂格勒在1971年系统阐述。它描述的是一种现象:本应服务公共利益的监管机构,反而被其监管对象(通常是大型企业)所"俘获",制定出有利于既得利益者的政策。在AI领域,这种担忧尤为突出:如果政府基于头部公司的安全警告出台严格的许可制度、算力门槛或合规要求,那么资金雄厚的大公司可以轻松满足这些要求,而初创企业和开源社区则可能被排除在外。历史上,金融业的巴塞尔协议、制药业的FDA审批流程都曾被批评为变相的行业壁垒。
英伟达创始人黄仁勋也曾公开调侃:"有些人当上CEO之后就会产生上帝情结,开始忧患天下。"言下之意,这些已经遥遥领先的公司呼吁"踩刹车",本质上是在拉大与追赶者的差距。
真实担忧还是商业谋略?两者兼有
宾夕法尼亚大学莫里克教授提供了一个相对中立的视角:Anthropic的警告确实可能包含一些行销成分,但其中对AI失控的担忧也是真实的,值得全人类认真对待。
从技术层面看,AI代码贡献率从个位数飙升至80%、优化能力达到人类52倍,这些数据即便打个折扣也足够令人警醒。从商业层面看,在上市前夕发布这样的报告,时机选择确实过于"巧合"。
真相很可能是两者兼有:技术风险是真实存在的,但Anthropic选择在这个时间点、以这种方式发布,显然也经过了精心的商业考量。对于普通人而言,重要的不是揣测企业动机,而是认真思考:当AI真的开始自己造AI时,人类准备好了吗?
核心要点
相关推荐
Claude Code 4个必改设置,开发效率直接翻倍
Claude Code 4个必改设置,开发效率直接翻倍
分享Claude Code最值得修改的4个设置:权限模式绕过、聊天记录永久保留、MCP合并规则理解、全局Skill精简到7个。改完告别确认框骚扰,节省6%上下文窗口,开发体验立刻提升。
RTK终端输出压缩工具:Claude Code省下80%Token消耗
RTK终端输出压缩工具:Claude Code省下80%Token消耗
RTK是一款用Rust编写的开源终端输出压缩工具,专为Claude Code设计。通过拦截和压缩git、npm等命令输出,将Token消耗从11.8万降至2.39万,节省约80%。免费、离线、两分钟安装即用。
笨豆:16岁独立拍纪录片,全网播放破亿的10后UP主
笨豆:16岁独立拍纪录片,全网播放破亿的10后UP主
B站UP主笨豆,16岁高一学生,从四年级开始做视频,独立完成印度、蒙古国等人文纪录片拍摄,全网粉丝超百万、播放量破亿。深入了解她的纸上剪辑法、一人纪录片工作流程及创作心路历程。