3小时零代码，用AI Agent自动开发微信小程序实战

从一个真实需求说起

作者的孩子上二年级，班主任要求每天拍摄孩子大声读课文的视频并发到微信。班里五十多个孩子，老师的微信每天都被打卡视频淹没。发群里？会打扰其他家长。

这个痛点催生了一个想法：做一个微信小程序，家长各自上传打卡视频，老师随时批量查看，谁都不打扰。

进一步抽象这个需求——它本质上就是一个「公共打卡活动」系统，适用于任何团队、组织或小组的日常打卡场景。

AI Agent开发微信小程序需求描述

作者将口述需求通过笔记工具整理成文字，然后原封不动地粘贴到自己搭建的小程序开发框架中。整个过程，人工实际介入时间仅约30分钟，剩下的两个多小时完全由AI Agent自动运行。

核心方法：用AI流程输出代码

作者提出了一个精辟的类比：

传统软件开发中，我们用代码去处理数据；AI Agent开发体系中，我们用AI流程去输出代码。

这个框架的核心思路是：将软件开发的完整流程（需求→设计→开发→测试）编排成一条自动化的Agent流水线，每个环节由不同角色的AI Agent负责。

**AI Agent（智能代理）**是一种能够感知环境、自主决策并执行动作以完成目标的AI系统，与传统的脚本自动化有本质区别。传统自动化依赖预定义的规则和固定流程，遇到意外情况就会失败；而AI Agent能够理解上下文、处理模糊指令、动态调整策略。在软件开发场景中，Agent不仅能写代码，还能理解需求意图、发现潜在问题、自主决定下一步行动。多Agent协作系统（Multi-Agent System）则进一步将复杂任务分解给具有不同专长的Agent，类似于一个虚拟开发团队，每个成员各司其职，通过结构化的信息传递协同完成整体目标。

流程设计：多版本发散+融合

整个零代码开发流程分为以下几个关键阶段：

原始需求 → 填入需求文档
产品经理（多版本发散） → 利用模型的随机性生成多份产品设计方案，再融合为一份PRD
原型设计师（多版本发散） → 同样生成多个交互原型版本，互相借鉴取长补短，融合为最终原型
UI审查 → 对原型进行视觉审查
架构师 → 设计技术架构（也采用多版本发散思路）
开发 → 输出完整小程序代码
UI Review + 修复 → 针对微信小程序UI的专项审查
测试 + 迭代 → 发现问题并自动修复

Agent工作流中利用模型随机性进行多版本发散

**PRD（Product Requirements Document，产品需求文档）**是软件工程中连接业务需求与技术实现的核心文档，通常包含功能描述、用户故事、交互逻辑、边界条件和验收标准等内容。在传统开发流程中，PRD由产品经理耗费数天甚至数周撰写，是整个项目的「宪法」。让AI扮演产品经理角色自动生成PRD，意味着AI需要具备需求分析、用户场景建模和功能优先级判断等高阶能力。值得注意的是，AI生成的PRD质量直接决定后续所有环节的输出质量——这也是为什么作者采用「多版本发散+融合」策略，通过多轮生成来提升PRD的覆盖度和合理性。

为什么要「多版本发散」？大语言模型的输出受「温度」（Temperature）参数控制——温度越高，输出越随机多样；温度越低，输出越确定保守。「多版本发散+融合」策略本质上是一种集成学习（Ensemble Learning）思想在生成式AI中的应用：通过多次采样获得多个候选方案，再通过融合步骤提取各方案的优质特征，最终产出比任何单一输出都更优秀的结果。这与软件工程中的「代码审查」和「设计评审」机制异曲同工——多个视角的碰撞往往能发现单一视角的盲点，而AI可以在几分钟内完成人类团队需要数天才能完成的多轮评审迭代。这比试图让模型一次性输出完美结果要务实得多。

框架结构详解

Agent定义

所有Agent都在 agents 目录下定义，每个Agent有标准的结构：

名字和描述：明确角色定位
可用工具：定义Agent能调用的能力
工作规范和产物：与具体业务无关的通用规范

AI Agent定义结构示例

这些定义都是可复用的，换一个需求文档，同样的框架就能开发另一个微信小程序。这意味着你搭建一次框架，就能反复用于不同项目。

一键启动自动化开发

作者定义了一个自定义命令 allbegon，填入需求后只需执行这一个命令，整个Agent工作流就会自动跑起来。

技术栈方面，使用的是 Claude Code——Anthropic推出的面向开发者的命令行AI编程工具，基于Claude模型构建，专为代码生成、调试和工程任务优化。与普通对话式AI不同，Claude Code能够直接读写本地文件系统、执行终端命令、管理项目目录结构，具备真正的「动手能力」。其核心优势在于超长上下文窗口（支持数十万token），能够同时理解整个代码库的上下文，而不是孤立地处理单个文件。通过添加特定参数让AI在执行过程中不中断、不询问，从而实现长时间自主运行。

模型选用的是智谱（国内效果较好），并且针对其限流问题做了并发控制。国内大模型API普遍存在限流（Rate Limiting）机制，通常以RPM（每分钟请求数）和TPM（每分钟Token数）为单位进行限制。在多Agent并发执行场景下，如果不加控制地同时发起大量API请求，会触发限流导致任务失败。常见的应对策略包括令牌桶算法控制请求速率、指数退避重试处理失败请求、请求队列化管理并发上限——这是将AI工具从「实验室可用」推向「生产环境可用」的关键工程细节。

AI Agent自动执行开发过程