李博!你最近是不是又在用手机写代码了?我昨天看到你朋友圈发了个截图,地铁上都在搞。
哈哈被你发现了。不是我主动要卷啊,是OpenAI逼的——Codex上移动端了你知道吧?
知道知道,我们组还专门讨论了一下。但说实话我有点没想通,手机那么小的屏幕写代码,这不是反人类吗?
诶,你这个理解就偏了。关键点不在于你在手机上敲代码,而是你用自然语言告诉AI你要干嘛,它在云端帮你干完。
等会儿让我想想……就是说手机只是一个遥控器?
对!你这个类比特别准。它背后有一套云端沙盒架构,你在手机上发一个指令,OpenAI的服务器上就会创建一个隔离的计算环境。
这个沙盒里预装了各种编程语言的运行时、包管理器、开发工具,Codex的Agent在里面自己写代码、装依赖、跑测试,全干完了把结果返回给你看。
所以我在地铁上就能审查代码、批准提交?
没错,手机变成了一个审查和指挥中心。重度编辑还是留给桌面端,但轻量级的任务完全可以移动端搞定。
这我就理解了。但我更好奇的是——为什么是现在?OpenAI之前不是一直在搞各种支线任务吗,又是机器人又是硬件的。
我跟你说,这事儿的核心原因就俩字:Claude。
真的假的?就因为Anthropic?
真的。Claude Code今年太猛了。它是一个命令行AI编程工具,直接跑在开发者的终端里,能读你的项目文件、理解整个代码库结构、执行shell命令、改代码。
而且它用的是agentic coding的思路——你用自然语言说需求,它自己规划步骤、写代码、跑测试、根据结果迭代。在SWE-bench上的表现非常炸裂,尤其是跨文件重构这种复杂任务。
难怪我们组的后端同学最近天天念叨Claude Code,感情是真的好用。
对,开发者社区的口碑起来了。OpenAI肯定慌了。所以Sam Altman内部喊话要砍支线任务,聚焦核心产品。
哈哈,又开始学术分析了。说人话就是——被打了,得还手。
你们产品经理就知道简化!但本质上确实是这样。
那我从产品视角问一个实际的问题啊。Codex现在集成在ChatGPT移动端里,是不是意味着用户不用单独装一个新App?
对,这恰恰是它聪明的地方。ChatGPT的移动端装机量多大啊,直接在里面加Codex功能,用户零切换成本。
这个我太懂了,减少工具切换的摩擦成本,做产品的都知道这有多重要。而且它把对话、编程、应用操控全整合在一起了。
没错,ChatGPT正在从一个聊天工具变成全能型AI助手平台。
但是李博,我有个担心——移动网络不稳定怎么办?地铁里信号一断,任务不就挂了?
你这个问题问到点上了。这确实是移动端编程的硬伤,需要任务状态持久化和断点续传机制。还有安全性的问题,在手机上处理敏感代码库,端到端加密和访问控制都得跟上。
所以现在还不完美。
远远没有。但方向是对的。
诶对了,你帮我捋一下现在整个AI编程工具的竞争格局呗?我感觉已经眼花缭乱了。
行,我给你分三个梯队。第一梯队是平台级玩家:GitHub Copilot背靠微软和OpenAI,装机量最大,已经能从Issue到Pull Request全流程自动化了;Google的Gemini Code Assist深度绑定Google Cloud生态。
第二梯队是垂直创新者:Cursor做AI-first IDE,Replit搞云端开发和编程教育,Windsurf也在快速迭代。第三梯队是开源社区,Continue、Aider这些给不想被厂商锁定的开发者提供替代选择。
这也太卷了吧!
而且你注意到没有,竞争维度已经变了。
怎么变的?
以前拼的是代码生成质量——谁写的代码更准确。现在大家能力趋同了,开始拼生态集成深度、多模态理解、还有这次Codex代表的全场景覆盖。
就是从'能不能写代码'变成了'在哪儿都能写代码'。
精辟!谁能让用户更方便地用工具,谁就赢得长期忠诚。这其实跟你们做产品的逻辑一模一样。
得了吧,你终于承认我们产品经理的价值了。
哈哈,偶尔承认一下。
说真的,我回头想想这事儿还挺感慨的。2021年Codex刚出来的时候,只是个API,帮你补补代码。现在四年过去,已经变成了能在云端自主执行多步骤任务的Agent了。
嗯,从Copilot到Agent,从副驾驶到自动驾驶。这个跃迁的速度说实话超出了大部分人的预期。而且这场军备竞赛才刚进入白热化阶段,后面还有得看。
好,那我们就拭目以待。今天先聊到这儿,我得赶紧回去在手机上试试Codex了。
去吧去吧,试完告诉我体验怎么样,我帮你写个测评。