今天聊一个挺有意思的事儿。Simon Willison,就是Django框架的联合创始人之一,他最近给自己的开源项目Datasette上线了一个官方博客。你可能会说,上线个博客有什么好聊的?但关键在于,他是怎么做的——他用OpenAI Codex桌面版从零构建了整个博客,然后把跟AI交互的完整会话记录全部公开了。
对,这件事之所以值得聊,是因为它其实有好几层意思叠在一起。首先Datasette本身就是一个很有影响力的开源项目,它做的事情说起来很简单——把任何一个SQLite数据库文件,一条命令就变成一个可以浏览、可以查询的网站和API。你想想,记者拿到一份政府预算数据,不用写后端代码,不用搭数据库服务器,直接就能发布成一个在线查询工具。所以它在数据新闻、开放数据这些领域特别受欢迎。
嗯,这个项目从2017年就有了,插件生态也很丰富,但一直没有一个正式的官方博客来集中发布动态。Simon说团队有一系列令人期待的公告要发,所以才决定先把博客搭起来。
对,但真正让大家关注的不是博客本身,而是他搭建博客的方式。他用的是OpenAI Codex桌面版,这个工具2025年才推出,跟之前云端沙箱版本最大的区别是——它直接在你本地环境里跑。可以读写你的本地文件,运行终端命令,跟你的开发工具链无缝集成。
这跟我们平时用的GitHub Copilot有什么本质区别?Copilot不也是AI辅助编程吗?
区别还挺大的。Copilot更像是一个聪明的自动补全,你写到一半它帮你补后面几行。但Codex桌面版更偏向Agent模式——你用自然语言描述一个完整的任务,比如说'帮我搭一个博客系统,要支持Markdown写作,要有RSS订阅',然后它会自己规划步骤、写代码、跑测试,发现问题了还会自己迭代修正。你可以把它理解成一个能自主工作的初级工程师,而不只是一个代码补全工具。
这个比喻很形象。不过我更好奇的是Simon特别强调的那个功能——Markdown会话记录导出。他为什么这么看重这个?
这其实触及了一个很核心的问题。你想啊,现在AI生成的代码在生产环境里占比越来越高,但大多数AI编程工具的交互过程是封闭的,用完就没了。你三个月后回头看一段代码,完全不知道当时给AI下了什么指令,AI做了什么假设,你接受了哪些建议、拒绝了哪些。这在出Bug的时候就很麻烦了。
对,这就是软件工程里说的可追溯性和可审计性。
没错。Codex的Markdown导出功能,就是把你跟AI的每一轮对话——包括提示词、AI的响应、代码生成结果、中间的修改迭代——全部以结构化的Markdown文本导出来。Markdown本身是纯文本,可以用Git做版本控制,可以放进项目文档里。这就把原本封闭在工具内部的AI交互过程,变成了可存档、可检索、可分享的知识资产。
而且Simon不光是自己存档,他是直接把完整的会话记录公开发到了GitHub Gist上,谁都能看。
这就是Simon一贯的风格了。他本身就是Django的联合创始人,技术功底不用说。但这些年他把大量精力投入到AI和开发工具的交叉领域,写了几百篇LLM应用的实践笔记,还开发了LLM命令行工具这些开源项目。他一直强调透明和可复现,公开会话记录完全是一脉相承的做法。
那从这份公开的会话记录里,开发者具体能学到什么?
其实挺多的。比如怎么向AI编程助手清晰地描述需求,这本身就是一门学问。然后你能看到AI在实际项目中生成代码的质量到底怎么样,不是那种demo级别的演示,而是真实项目。还有人机协作的迭代过程——从零到完成一个功能模块,到底需要多少轮交互,中间会遇到什么问题,怎么纠正。这些东西你光看教程是感受不到的。
嗯,这确实比那些'我用AI十分钟写了个APP'的标题党有价值多了。你能看到真实的过程,包括不顺利的部分。
而且我觉得这件事还有一个更深层的意义。随着AI生成代码越来越普遍,尤其在金融、医疗这些受监管的行业,代码审计是合规要求的一部分。如果你没法回溯AI生成代码的上下文,企业可能连监管标准都满足不了。所以Simon选择Codex而不是其他工具,并且特别强调会话导出功能,这背后反映的是整个行业对AI编程工具可追溯性的刚需。
说到这儿,我们也别忘了这件事的起点——Datasette项目本身。Simon暗示有一系列重要公告要发,虽然没透露具体内容,但结合Datasette最近的方向,你觉得可能会有什么?
我个人猜测,大概率跟AI和LLM的集成有关。Datasette本身就是把数据变成可查询的API,如果跟大语言模型结合,想象空间很大——比如用自然语言查询数据库,或者让LLM直接基于Datasette的数据做分析。当然这只是猜测,但官方博客的建立本身就说明项目在走向更成熟的运营阶段。
所以总结一下,这个看似简单的'博客上线'公告,其实包含了好几层信息:Datasette即将有大动作、AI辅助编程正在成为日常开发的标配、开发过程透明化的趋势在加速。Simon用实际行动展示了一种理念——用AI构建,并且把过程公开。这对整个开源社区来说,确实是一个很好的示范。
嗯,而且我觉得最有价值的一点是,他不是在布道说'AI多厉害',而是把真实的、完整的过程摆在那里,让你自己判断。这种务实的态度,可能比任何宣传都更有说服力。