播客频道 | Datasette官方博客上线：Simon Willison用OpenAI Codex从零构建

今天聊一个挺有意思的事儿。Simon Willison，就是Django框架的联合创始人之一，他最近给自己的开源项目Datasette上线了一个官方博客。你可能会说，上线个博客有什么好聊的？但关键在于，他是怎么做的——他用OpenAI Codex桌面版从零构建了整个博客，然后把跟AI交互的完整会话记录全部公开了。对，这件事之所以值得聊，是因为它其实有好几层意思叠在一起。首先Datasette本身就是一个很有影响力的开源项目，它做的事情说起来很简单——把任何一个SQLite数据库文件，一条命令就变成一个可以浏览、可以查询的网站和API。你想想，记者拿到一份政府预算数据，不用写后端代码，不用搭数据库服务器，直接就能发布成一个在线查询工具。所以它在数据新闻、开放数据这些领域特别受欢迎。嗯，这个项目从2017年就有了，插件生态也很丰富，但一直没有一个正式的官方博客来集中发布动态。Simon说团队有一系列令人期待的公告要发，所以才决定先把博客搭起来。对，但真正让大家关注的不是博客本身，而是他搭建博客的方式。他用的是OpenAI Codex桌面版，这个工具2025年才推出，跟之前云端沙箱版本最大的区别是——它直接在你本地环境里跑。可以读写你的本地文件，运行终端命令，跟你的开发工具链无缝集成。这跟我们平时用的GitHub Copilot有什么本质区别？Copilot不也是AI辅助编程吗？区别还挺大的。Copilot更像是一个聪明的自动补全，你写到一半它帮你补后面几行。但Codex桌面版更偏向Agent模式——你用自然语言描述一个完整的任务，比如说'帮我搭一个博客系统，要支持Markdown写作，要有RSS订阅'，然后它会自己规划步骤、写代码、跑测试，发现问题了还会自己迭代修正。你可以把它理解成一个能自主工作的初级工程师，而不只是一个代码补全工具。这个比喻很形象。不过我更好奇的是Simon特别强调的那个功能——Markdown会话记录导出。他为什么这么看重这个？这其实触及了一个很核心的问题。你想啊，现在AI生成的代码在生产环境里占比越来越高，但大多数AI编程工具的交互过程是封闭的，用完就没了。你三个月后回头看一段代码，完全不知道当时给AI下了什么指令，AI做了什么假设，你接受了哪些建议、拒绝了哪些。这在出Bug的时候就很麻烦了。对，这就是软件工程里说的可追溯性和可审计性。没错。Codex的Markdown导出功能，就是把你跟AI的每一轮对话——包括提示词、AI的响应、代码生成结果、中间的修改迭代——全部以结构化的Markdown文本导出来。Markdown本身是纯文本，可以用Git做版本控制，可以放进项目文档里。这就把原本封闭在工具内部的AI交互过程，变成了可存档、可检索、可分享的知识资产。而且Simon不光是自己存档，他是直接把完整的会话记录公开发到了GitHub Gist上，谁都能看。这就是Simon一贯的风格了。他本身就是Django的联合创始人，技术功底不用说。但这些年他把大量精力投入到AI和开发工具的交叉领域，写了几百篇LLM应用的实践笔记，还开发了LLM命令行工具这些开源项目。他一直强调透明和可复现，公开会话记录完全是一脉相承的做法。那从这份公开的会话记录里，开发者具体能学到什么？其实挺多的。比如怎么向AI编程助手清晰地描述需求，这本身就是一门学问。然后你能看到AI在实际项目中生成代码的质量到底怎么样，不是那种demo级别的演示，而是真实项目。还有人机协作的迭代过程——从零到完成一个功能模块，到底需要多少轮交互，中间会遇到什么问题，怎么纠正。这些东西你光看教程是感受不到的。嗯，这确实比那些'我用AI十分钟写了个APP'的标题党有价值多了。你能看到真实的过程，包括不顺利的部分。而且我觉得这件事还有一个更深层的意义。随着AI生成代码越来越普遍，尤其在金融、医疗这些受监管的行业，代码审计是合规要求的一部分。如果你没法回溯AI生成代码的上下文，企业可能连监管标准都满足不了。所以Simon选择Codex而不是其他工具，并且特别强调会话导出功能，这背后反映的是整个行业对AI编程工具可追溯性的刚需。说到这儿，我们也别忘了这件事的起点——Datasette项目本身。Simon暗示有一系列重要公告要发，虽然没透露具体内容，但结合Datasette最近的方向，你觉得可能会有什么？我个人猜测，大概率跟AI和LLM的集成有关。Datasette本身就是把数据变成可查询的API，如果跟大语言模型结合，想象空间很大——比如用自然语言查询数据库，或者让LLM直接基于Datasette的数据做分析。当然这只是猜测，但官方博客的建立本身就说明项目在走向更成熟的运营阶段。所以总结一下，这个看似简单的'博客上线'公告，其实包含了好几层信息：Datasette即将有大动作、AI辅助编程正在成为日常开发的标配、开发过程透明化的趋势在加速。Simon用实际行动展示了一种理念——用AI构建，并且把过程公开。这对整个开源社区来说，确实是一个很好的示范。嗯，而且我觉得最有价值的一点是，他不是在布道说'AI多厉害'，而是把真实的、完整的过程摆在那里，让你自己判断。这种务实的态度，可能比任何宣传都更有说服力。

Datasette官方博客上线：Simon Willison用OpenAI Codex从零构建

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报