AI对话编程冲击RPA：革命还是互补？深度解析能力边界

引言：对话式编程带来的行业震撼

AI领域近期发生了诸多重要变化，其中对RPA（机器人流程自动化）行业冲击最大的，莫过于"小龙虾"等对话式编程工具的出现。通过自然语言对话就能操作电脑、调用文件、执行自动化动作——这在过去是RPA的专属领域，如今AI似乎要将其取而代之。

RPA（Robotic Process Automation）作为一项技术，起源于2000年代初期，最早由Blue Prism、UiPath、Automation Anywhere等企业推动商业化。其核心原理是通过模拟人类在计算机上的操作（如点击、输入、复制粘贴等），将重复性的规则化业务流程自动化。RPA不需要修改底层系统代码，而是在UI层面进行操作，这使其能够跨越不同系统和应用进行集成。在中国市场，影刀、来也科技、弘玑等厂商是主要玩家，广泛应用于财务对账、报表生成、客服工单处理等场景。

然而，事实真的如此吗？来自B站UP主"大树AI"的深度分析给出了一个出人意料的答案：很多用户在体验AI对话编程后，反而回归了RPA工具。

bilibili source: AI对话编程冲击RPA行业，复杂自动化还得靠传统工具

AI对话编程的能力边界在哪里

对话式编程工具的技术本质

文中提到的"小龙虾"等对话式编程工具，代表了一类基于大语言模型（LLM）的新型自动化范式。这类工具的技术架构通常包含三层：自然语言理解层（解析用户意图）、代码生成层（将意图转化为可执行脚本）、以及执行层（通过操作系统API或浏览器自动化框架执行动作）。典型代表还包括OpenAI的Code Interpreter、Anthropic的Computer Use功能、以及国内的Manus等。它们的核心优势在于零配置启动，用户无需学习特定的编排语法或拖拽界面，只需用日常语言描述需求即可。

简单任务：AI游刃有余

对于简单、明确的任务，AI对话式编程确实表现出色。例如：

将一个文件夹中的100篇文章汇总成一篇
从三个表格中提取特定行的数据
简单的文件整理和格式转换

这类操作逻辑清晰、步骤有限，用自然语言描述即可让AI完成，甚至比传统RPA配置更加便捷。

复杂任务：AI对话编程力不从心

但当任务复杂度上升时，情况就完全不同了。以"淘宝商品上架"为例，这涉及登录验证、页面跳转、表单填写、图片上传、规格设置等数十个步骤，还需要处理各种异常情况（如网络超时、验证码弹出、页面结构变化等）。让AI通过对话来完成这样的复杂流程，结果往往是"直接崩掉"。

这里存在一个被称为"错误累积效应"的技术瓶颈：即便AI每一步的准确率达到95%，在一个包含10个步骤的流程中，整体成功率也会降至约60%（0.95的10次方≈0.60）。步骤越多，整体可靠性下降越快，这是当前AI Agent技术面临的核心挑战。

核心问题在于：

业务理解的深度：AI需要真正理解业务逻辑，而不仅仅是执行指令
驯服成本高：用户需要把每一步都讲清楚，过程困难重重
稳定性不足：对话式编程在长流程中容易出错，缺乏可靠的错误处理机制

RPA为何仍然不可替代

十几年积累的技术稳定性

RPA作为一套成熟的自动化工具体系，已经发展了十几年。它的核心价值在于：

稳定运行：经过大量实践验证的执行引擎，具备确定性的行为模式
复杂逻辑支持：完善的条件分支、循环、异常处理机制，支持try-catch式的错误恢复
网页操作能力：针对各类网页场景的专业化解决方案，包括元素定位、iframe处理、动态加载等待等

与AI的概率性输出不同，RPA的每一步操作都是确定性的——相同的输入必然产生相同的输出。这种确定性在企业级应用中至关重要，尤其是涉及财务数据、客户信息等不容出错的场景。

这些能力并非AI对话编程能够轻易替代的。正如大树AI所言，"真正能够稳定运行的，还是RPA"。

AI反而为RPA带来了新用户

一个有趣的现象是：AI对话编程的普及反而为RPA行业带来了新用户。很多人被AI"启蒙"了自动化意识，认识到自动化可以提升效率，但在实际落地时发现AI并非万能，最终转向了更稳定的RPA工具。

这种现象在技术传播中并不罕见——新技术的出现往往会扩大整个品类的市场认知。就像智能手表的普及反而带动了传统机械表的销量，因为更多人开始关注"手腕上的设备"这个品类。AI对话编程扮演了自动化领域的"市场教育者"角色。

这解释了为什么部分RPA厂商在近期反而迎来了业务突破——AI帮他们完成了市场教育。

RPA行业格局的变化与挑战

龙头企业面临双重压力

对于RPA行业龙头（如影刀）来说，面临的挑战是双重的：

与AI拼能力：用户期待RPA工具也能实现对话式编程，降低学习门槛
与AI拼成本：Token经济模式对传统订阅制构成价格压力

关于Token经济模式，这是大语言模型服务的计费方式，按照输入和输出的token数量（大致相当于字词片段）收费。例如GPT-4o每百万输入token收费约5美元，DeepSeek的价格更是低至每百万token不到1元人民币。这种按量付费的模式与RPA传统的年度订阅制（通常数万至数十万元/年）形成了鲜明对比。对于低频使用场景，Token模式成本极低；但对于高频、大批量的自动化任务，累计token消耗可能反而更贵。这种定价差异正在重塑用户对自动化工具的成本预期。

这种"既要又要"的局面，让头部企业承受了巨大的转型压力。

正确的应对策略：拥抱AI而非对抗

明智的RPA厂商选择的是与AI融合而非对抗。例如在DeepSeek推出后迅速对接，积极探索AI Agent等新方向。

DeepSeek是中国深度求索公司推出的大语言模型系列，其中DeepSeek-V3和DeepSeek-R1因性能接近GPT-4水平且成本极低而引发行业关注。RPA厂商对接DeepSeek的典型应用包括：用AI理解非结构化文档内容后触发RPA流程、用自然语言生成RPA脚本降低开发门槛、以及在RPA执行过程中调用AI进行智能判断（如识别验证码、理解邮件意图等）。

AI Agent（智能体）是当前AI领域最热门的方向之一，指的是能够自主感知环境、制定计划、执行动作并根据反馈调整策略的AI系统。与简单的对话式AI不同，Agent具备记忆、工具调用、多步推理等能力。在自动化领域，AI Agent的愿景是：用户只需描述最终目标，Agent自动分解任务、选择工具、处理异常。这种融合模式被业界称为"智能自动化"（Intelligent Automation），被Gartner列为超级自动化（Hyperautomation）趋势的核心组成部分。

未来的自动化工具，很可能是"AI理解意图 + RPA稳定执行"的混合模式——AI负责理解模糊的自然语言指令并将其转化为精确的执行计划，RPA负责以确定性的方式可靠地执行每一个步骤。

对普通用户的实用建议

使用AI自动化需要什么基础

一个关键观点是：想要更好地驯服AI，前提是你要有一定的基础。

如果你完全不懂代码和业务逻辑，纯靠AI对话来完成复杂自动化，目前还不现实
如果你懂代码、懂业务，AI确实能大幅提升效率——你能更精确地描述需求，也能在AI出错时快速定位和修正问题
如果你是小白用户，RPA的可视化编排（拖拽式流程设计器）反而更容易上手，因为所见即所得的界面降低了抽象思维的要求

这里的核心逻辑是：AI对话编程本质上是将"编程"这个动作从写代码变成了写提示词（Prompt），但"编程思维"——即将复杂问题分解为有序步骤的能力——仍然是必需的。

不同场景如何选择自动化工具

场景	推荐工具	原因
简单文件处理	AI对话编程	启动成本低，一句话即可完成
复杂业务流程	RPA工具	需要稳定的异常处理和流程控制
需要长期稳定运行	RPA工具	确定性执行，不受模型更新影响
一次性数据处理	AI对话编程	无需维护，用完即弃
涉及多系统交互	RPA + AI混合	AI处理非结构化理解，RPA处理跨系统操作

结语：互补而非替代

黄仁勋曾说"程序员最后会变成打字员"，但至少在当前阶段，这个预言还远未实现。AI对话编程和RPA不是零和博弈，而是互补关系——AI降低了自动化的认知门槛，RPA保障了复杂场景的稳定执行。

从技术演进的角度看，这种互补关系可能会持续相当长的时间。即便AI的推理能力持续提升，企业对"可预测性"和"可审计性"的需求不会消失。一个AI Agent可能偶尔会以不同的路径完成同一任务，但企业的合规要求往往需要每次执行都遵循完全相同的步骤——这正是RPA的核心优势所在。

对于从业者和用户来说，最理性的选择不是押注某一方，而是理解两者的能力边界，在合适的场景使用合适的工具。未来的赢家，一定是能够将AI智能与RPA稳定性完美融合的产品。

核心要点

AI对话编程在简单任务上表现出色，但面对复杂业务流程（如电商上架）时稳定性严重不足
很多用户被AI启蒙自动化意识后，因实际落地困难反而回流到RPA工具
RPA凭借十几年积累的稳定性和复杂逻辑处理能力，在复杂场景中仍不可替代
RPA行业龙头面临与AI拼能力和拼成本的双重压力，正确策略是拥抱融合而非对抗
驯服AI完成复杂自动化的前提是用户本身具备代码和业务逻辑基础
未来的自动化形态很可能是"AI理解意图 + RPA稳定执行"的混合架构

引言：对话式编程带来的行业震撼

然而，事实真的如此吗？来自B站UP主"大树AI"的深度分析给出了一个出人意料的答案：很多用户在体验AI对话编程后，反而回归了RPA工具。

bilibili source: AI对话编程冲击RPA行业，复杂自动化还得靠传统工具