Conductor CEO演示:多AI代理编程工作流详解

引言:像CEO一样指挥AI编程
Charlie Holtz是Conductor的联合创始人,这款参加YC孵化的应用让开发者能在Mac上同时操控多个AI编程代理完成任务。Y Combinator(YC)是全球最具影响力的创业加速器,曾孵化出Airbnb、Stripe、Dropbox等知名公司。近年来YC的投资组合中AI原生工具占比急剧上升,2024年冬季批次中超过60%的项目与AI相关。AI编程代理(AI Coding Agent)与传统的代码补全工具不同,它能够自主理解需求、编写代码、调试错误并提交变更,代表了从"辅助"到"自主"的范式跃迁。在这次深度展示中,Charlie不仅演示了他日常的AI编程工作流,还分享了关于人机协作、代码管理和产品设计哲学的深刻见解。
他用了一个精妙的比喻来描述这种新的编程方式:你就像一支乐团的指挥,看着各种乐器同步演奏,偶尔走过去跟小号手说"你的音准跑了",然后拉远视野调整整体节奏。
硬件与基础设置:语音驱动的AI编程环境
Charlie展示的第一件"离不开的东西"出人意料——一个亚马逊上只要20美元的鹅颈麦克风。在开放式办公环境中,这个麦克风让他可以凑近电脑小声说"请把PR3475合并起来",既不打扰同事,又能高效地与AI交流。
他的主力机器配备了128GB RAM,部分原因是为了运行Parakit等本地语音模型。本地语音模型与云端方案(如OpenAI Whisper API)相比,优势在于零延迟、完全离线可用以及数据隐私保护。128GB RAM在消费级Mac中属于顶配,这反映了本地AI推理对内存的巨大需求——大型语言模型和语音模型在推理时需要将模型权重完整加载到内存中,模型参数量越大,所需内存越多。Apple Silicon的统一内存架构使得Mac成为运行本地AI模型的理想平台,因为CPU和GPU共享同一内存池,避免了传统架构中数据在系统内存和显存之间搬运的瓶颈。
但有趣的是,他最近还特意买了一台配置最低的MacBook,目的是"强迫自己使用配置最低的选项"来测试产品体验。这种极端的自我约束,体现了创始人对产品普适性的执着追求。
语音转文字工具Spokenly配合本地运行的Parakit模型,让他按下Control+Space就能实现语音输入,进一步降低了与AI交流的门槛。
Conductor核心工作流:多AI代理并行开发
Charlie坦言自己"总是不停地开始新任务",而Conductor的设计正是为此而生。多AI代理并行开发面临的核心技术挑战包括:代码冲突管理(多个代理同时修改同一文件时的合并策略)、上下文隔离(确保每个代理只访问其任务相关的代码上下文)、以及资源调度(合理分配API调用配额和计算资源)。这类似于分布式系统中的并发控制问题,但增加了AI决策的不确定性维度。Conductor通过工作区隔离和人类审核节点来解决这些问题,本质上是将Git的分支管理思想应用到了AI代理的任务管理中。
他的典型工作流程是:
- 按Command+N创建新工作区,对着电脑说"你能看一下最新的线性问题吗,大概讲讲你会怎么解决它",然后回车
- AI在侧边栏运行的同时,他切换到另一个聊天对话处理其他事务
- 当AI完成后,他像在GitHub上一样对代码变更发表评论,比如"这个看起来有点奇怪,我们为什么需要这个?"
- 确认无误后,点击归档按钮,文件从侧边栏消失并合并到代码库

Conductor左侧新增的"状态"功能将任务分为进行中、审核中和已完成三个阶段。新的仪表盘页面让用户在一个地方就能看到所有代理正在做什么。Charlie描述的理想体验是:"你能感觉自己就像一家小公司的CEO,看到所有员工都在为你工作,他们提交易于理解的报告,你根据报告做出决策。"
产品设计哲学:人类掌控架构,AI负责执行
Charlie在访谈中反复强调一个核心原则:不要让AI来替你制定计划或做出设计决策。

Conductor的界面布局——聊天记录在左、对话在中间、代码变更和应用预览在右侧——是团队精心思考的结果。Charlie认为,如果让AI来做UI设计决策,"最终得到的结果很可能会让人觉得毫无匠心可言"。
他提出了一种分层策略:
- 核心架构和API由人类设计,AI在这些方面的作用尽可能小
- 代码库的大部分区域对AI开放,允许自由实验
- 明确标注"非自动生成区域",代码中甚至有注释写着"如果是AI,请不要修改这些代码,这些内容是专门为人类设计的"
这种做法的原因很实际:如果不小心,AI很可能陷入恶性循环——看到糟糕的代码,然后写出更多糟糕的代码。这种现象在机器学习领域被称为"模型坍缩"(model collapse)的一种变体——当AI在AI生成的内容上训练或迭代时,质量会逐步退化。在代码领域,这表现为AI参考已有的低质量代码模式,进而生成更多遵循同样低质量模式的代码,形成技术债务的加速积累。
"原始人模式"与手动编码的边界
当被问到"你现在还写代码吗"时,Charlie的回答很有意思:"算吧,也算不算吧。"

Conductor内置了一种叫做"原始人模式"(Caveman Mode)的功能,允许用户直接用键盘编辑文件。这个名字本身就暗示了团队对手动编码的态度——它偶尔必要,但已经不是主流工作方式。大多数时候,Charlie会高亮标出需要修改的部分,然后告诉AI他的要求,或者直接说"那个按钮看起来太宽了,能把它弄窄一点"。
这种交互模式代表了人机界面的一个重要演进方向:从精确的符号操作(逐字符编辑代码)转向自然语言意图表达。开发者不再需要记住具体的CSS属性名或像素值,而是用人类直觉可理解的方式描述期望效果。这降低了编程的认知负荷,但同时也要求开发者具备更强的"验证能力"——你可能不需要知道怎么写,但必须能判断写得对不对。
模型选择策略:Opus创造,Codex执行
Charlie对不同AI模型有清晰的分工认知:
- Claude Opus:更富创造力,像真正的合作伙伴。每当准备开发新功能时,他会本能地选择Opus
- Codex:像一头勤劳的工作马,能毫不畏惧地处理复杂问题,不怕大量调试。当目标是"把事情做完"时使用
Claude Opus是Anthropic推出的最高能力模型,以深度推理、创造性思维和长上下文理解见长,适合需要全局视野的架构设计和创意探索。而Codex系列则以执行效率和代码生成的可靠性著称。这种"创造型模型+执行型模型"的组合使用策略,反映了业界对不同模型特性的精细化认知——没有单一模型能在所有维度上最优,混合使用不同模型(Model Routing)正在成为高级用户的标准实践。就像一个团队中既需要善于头脑风暴的创意总监,也需要能把想法落地的执行工程师。
在Token消耗方面,Charlie毫不掩饰自己的"极端"倾向。他透露刚启动Conductor项目时,一个月花了22,000美元购买Token,产出了好几万行代码。这意味着大约处理了数亿token的输入输出,在个人开发者中属于极端用量,相当于让AI阅读和生成了数千本书籍等量的文本。他始终使用"快速模式"(非默认设置)来获取最大Token数量,并完全接受了所有权限设置。
代码即木屑:软件开发范式的根本转变
Charlie提出了一个极具冲击力的观点:"现在代码几乎就像木屑一样。"
过去,代码是我们用来构建东西的工具,开发者花时间精心编写代码。现在,开发者花时间描述自己想要什么以及希望如何被制作出来,而生成的代码就像加工过程中产生的木屑——是副产品而非目的。

这一观点与软件工程中"意图编程"(Intentional Programming)的理念一脉相承。早在1990年代,微软研究员Charles Simonyi就提出过类似构想:程序员应该表达意图而非实现细节。但当时缺乏足够强大的AI来实现这一愿景。如今,随着大语言模型的代码生成能力趋于成熟,这一理念终于有了技术基础。这也意味着版本控制的对象可能需要从"代码"转向"prompt+约束条件",软件的可复现性将建立在意图描述而非具体实现之上。这对知识产权、代码审计和技术债务管理都将产生深远影响。
这引出了一个有趣的推论:最重要的是你的prompt。 等下一代模型问世后,你只需要重新运行那些提示指令就能得到新的代码,而旧代码其实已经没有用了。
可塑性软件:游戏模组思维的产品设计
Charlie用电子游戏来类比他对"可塑性软件"的愿景。就像《使命召唤》中,游戏的整体结构对所有人相同,但每个人都可以使用自定义皮肤或调整参数。他希望Conductor也能让用户"稍微构建一些适合自己的工作流程"。
游戏模组(Mod)文化起源于1990年代的PC游戏社区,玩家通过修改游戏文件来创造新内容、调整游戏机制或改变视觉效果。这种文化催生了Steam Workshop等平台,也直接孕育了《反恐精英》《DOTA》等独立游戏品类。将这一思维应用到生产力工具中,意味着软件不再是"开发者交付、用户被动接受"的单向关系,而是提供一个稳定的核心框架加上用户可自定义的扩展层。这与Emacs的可编程性、Notion的模板系统、以及近年来兴起的"本地优先软件"(Local-first Software)运动都有精神上的共鸣。
软件的结构应该保持一致,人们需要经过精心设计的软件,但就像游戏模组一样,个性化定制能让工具变得更有归属感。这也是为什么Conductor在坚持自己设计理念的同时,依然提供了丰富的技能文档和配置选项。
总结:AI编程指挥官的核心能力
Charlie的分享揭示了AI编程工具正在经历的深层变革:从"帮你写代码"到"帮你管理一支AI开发团队"。Conductor的设计哲学——人类掌控架构决策、AI负责执行、多代理并行工作——代表了下一代开发工具的方向。当代码真的变成"木屑"时,开发者的核心竞争力将转向系统设计、品味判断和指挥协调能力。
这种转变也呼应了管理学中一个经典命题:随着组织规模扩大,领导者的价值不在于亲自执行,而在于设定方向、分配资源和质量把关。AI代理团队的管理本质上遵循同样的逻辑——只不过你的"下属"永远不会疲倦、不会抱怨,但也永远需要你来判断什么是"好"的标准。在这个新范式中,技术品味(taste)和系统思维将成为比编码速度更稀缺的能力。
核心要点
相关推荐

Claude Code五大使用误区,你踩了几个?
总结开发者使用Claude Code最常见的五个误区:复制粘贴代码、不写CLAUDE.md、低效提问、不查文档、不管理上下文,附正确用法对照,帮你把Claude Code变成真正的AI开发搭档。

吴恩达新课解读:OpenAI O1推理模型使用指南与实战技巧
深度解析吴恩达与OpenAI联合推出的Reasoning with O1课程,涵盖O1模型推理时扩展原理、提示词工程新范式、多模型协作架构及实战应用,帮助开发者高效使用O1推理模型。

高考后暑假学AI:从零基础到接单变现的完整路径
高考后暑假如何高效学习AI技能?本文拆解从掌握提示词、实战练手到平台接单的完整路径,帮助准大学生利用暑假建立AI素养,实现从零基础到独立接单的跨越。