Kimi Agent做网站实测:3个场景看OK Computer真实水平

通过三个场景测试评估Kimi OK Computer Agent的网页生成能力与局限
文章通过数据分析报表、电影画廊交互页面、国风神兽网站三个场景,测试了Kimi OK Computer这一AI Agent的实际能力。结果显示它在任务拆解、多能力集成、可中断干预和主动扩展内容方面表现出色,但生成的原生HTML代码缺乏工程化结构,不适合大型项目。其最佳定位是快速原型制作和小型页面生成的辅助工具。
什么是Agent?从大脑到身体的进化
如果你一直关注 AI 领域,应该对大模型不陌生。但模型本身只是"大脑",它能思考、能回答问题,却无法自主行动。而 Agent(智能体)则相当于给大脑装上了"身体"——它不仅能理解任务,还能自己拆解任务、调用工具、一步步执行,最终交付完整的结果。
Agent 的核心架构通常由感知、规划、记忆和行动四个模块构成。规划模块是 Agent 的灵魂,目前主流方案包括 ReAct(Reasoning + Acting)框架和 Chain-of-Thought 推理链,前者让模型在每一步行动前先进行显式推理,后者则通过分步思考提升复杂任务的成功率。行动模块则依赖工具调用(Tool Use / Function Calling)能力,允许模型调用浏览器、代码解释器、文件系统、外部 API 等真实工具。这一能力的成熟,标志着大模型从"对话助手"向"自主执行者"的关键跃迁。
Kimi 的 OK Computer 就是这样一个 Agent。它的工作界面分为左右两栏:左边展示运行流程和当前执行步骤,右边则是实时预览界面,可以查看生成的图片、代码、网页等内容。整个过程中用户可以随时暂停、干预,这一点在实际使用中非常重要。
场景一:数据分析——30个获奖网站的自动化报表
第一个测试是让 OK Computer 分析 Awwwards 的 SOTD(Site of the Day)获奖网站数据。Awwwards 是全球最具影响力的网页设计评奖平台之一,其 SOTD 奖项由专业评审团队从设计、可用性、创意和内容四个维度综合评分,入选网站通常代表当前网页设计的前沿趋势,是设计师和前端开发者的重要参考来源。对这类数据进行批量抓取,在技术上涉及反爬虫绕过、动态渲染页面解析(许多现代网站使用 React/Vue 等框架,需要 JavaScript 执行后才能获取完整内容)等挑战,这也是此类任务对 Agent 能力的真实考验。
启动任务后,OK Computer 首先将大任务拆解为多个小任务清单,然后按顺序逐步执行。它先去获取获奖网站的信息内容,右侧界面会实时显示它访问网站的预览画面,方便用户确认每一步是否正确。

数据收集完成后,它自动生成脚本来处理数据,再用处理好的数据生成可视化图表。最终,它还贴心地将所有内容整合成一个可视化的 HTML 文件,并直接部署上线——用户只需一个链接就能访问。

生成的数据报表涵盖了评分分析、SOTD 分类、技术栈分布等多个维度,图表详细且直观。此外,它还额外生成了一个表格文件供下载。对于30个网站的数据分析来说,这种自动化流程确实省去了大量重复劳动。
场景二:交互网页——电影画廊的生成质量
第二个测试更具挑战性:让 OK Computer 生成一个电影画廊的交互页面,要求纯英文、黑白风格设计。
在执行过程中出现了一个值得注意的细节——作者中途暂停了任务,因为担心 Agent 从外网获取图片资源会导致国内访问时加载缓慢。于是临时追加了"使用国内图片源"的限制条件。OK Computer 在中途暂停后重新运行,完全没有出现问题,这说明它的任务中断恢复能力相当稳定。
最终生成的电影画廊包含30部随机获取的电影信息,整体排版布局、构图和色彩搭配都达到了不错的水准。

客观来说,这个网站和专业设计师的作品相比还有差距,但已经明显优于很多常规功能网站的水平。更关键的是,这只是一次性生成的结果,还没有经过任何后期打磨。
场景三:国风神兽网站——AI生图+交互的综合考验
第三个测试最为综合:生成一个插画风格的国风交互网站,展示中国传统神话中的神兽,并且图片由 AI 自行生成。
这里展现了 OK Computer 一个强大的能力——在任务流程中调用 AI 生成功能。这类多模态 Agent 系统通常通过编排层(Orchestration Layer)将文生图模型、文生音模型与代码生成模型串联起来,形成完整的内容生产流水线。OK Computer 不仅能生成图片,还能生成音频(包括音效和 BGM),这意味着如果用它来做小型网页游戏,素材生成也可以一并解决。

生成的网站包含以下几个部分:
- 首屏:简短的背景介绍,配有视差滚动效果
- 神兽展示区:支持横向切换浏览,点击可查看详细资料卡片
- 数据图表:使用 eCharts 制作的神兽属性对比图,支持勾选筛选
值得一提的是,数据图表部分并不在原始提示词的要求中,是 OK Computer 自行联想扩充的内容。eCharts 是百度开源的 JavaScript 数据可视化库,在国内开发者生态中广泛使用,Agent 能够主动选择并正确调用 eCharts 而非 D3.js 等国际主流方案,说明其在工具选型上具备一定的上下文感知能力,能够根据使用场景做出合理判断——这也印证了它不只是机械地执行指令,还会主动思考如何让内容更丰富。
冷静评估:OK Computer的能力边界
经过三个场景的测试,可以对 OK Computer 做一个相对客观的评价。
优势所在
- 任务拆解流畅:从接收任务到拆分执行,整个流程非常丝滑
- 多能力集成:数据抓取、代码编写、图片生成、网页部署一条龙
- 可中断可干预:支持随时暂停和追加条件,容错性好
- 主动扩展内容:不局限于提示词,会联想补充
明确的局限
但必须指出的是,OK Computer 生成的网页文件都是原生 HTML,文件结构也不够工程化。现代前端工程化体系以组件化、模块化为核心,主流框架包括 React、Vue 和 Angular,配合 Vite、Webpack 等构建工具,以及 TypeScript 类型系统、ESLint 代码规范、单元测试框架等工具链,形成一套完整的协作与维护体系。原生 HTML 文件虽然可以直接运行,但缺乏组件复用机制、状态管理能力和构建优化流程,在多人协作、版本迭代和性能调优方面存在天然短板。这也是当前绝大多数 AI 代码生成工具面临的共同瓶颈——生成单文件原型容易,但融入真实工程项目仍需大量人工适配。这意味着:
- 它不适合大型工程项目或需要持续迭代的产品
- 生成的代码难以直接融入现有的前端工程体系
- 对于复杂交互逻辑和性能优化,仍然力不从心
最佳使用场景
综合来看,OK Computer 最适合以下场景:
- 快速原型制作:验证创意想法,几分钟出一个可交互的 Demo
- 数据分析报表:自动抓取、处理、可视化,省去大量重复劳动
- 创意灵感探索:用 AI 生成的内容激发设计思路
- 小型功能页面:活动页、展示页等不需要长期维护的页面
结语
Agent 做网站靠谱吗?答案是:看场景。如果你需要快速产出一个原型或小型页面,OK Computer 已经能交出令人满意的答卷。但如果你期望它替代专业的前端开发流程,那目前还为时过早。它的定位应该是一个高效的辅助工具,而非项目的全权负责人。真正的生产力解放,来自于人与 AI 的合理分工。
相关推荐
产品体验Qoder vs Cursor实测对比:同样20美金谁更强?
实测对比Qoder和Cursor两款AI IDE,从Agent自主修复能力、人工沟通次数、架构决策等维度评测。Qoder仅需2次沟通完成任务,Cursor需8次。详细分析两者差异,帮你选择最适合的AI编程工具。
产品体验Cursor云Agent演示:打通软件开发全链路瓶颈
深度解析Cursor云Agent最新Demo,展示如何通过云端虚拟机、自动测试产物和全链路控制平面,系统性消除软件开发生命周期中的人类瓶颈,让Agent自主运行、人按需介入。
产品体验Cursor 3.0深度解析:多Agent并行、Design Mode与Best-of-N模型对比
Cursor 3.0正式发布,从AI辅助编程工具进化为Agent舰队指挥中心。本文详解多智能体并行、Design Mode可视化编辑、Best-of-N多模型择优等核心功能,解读AI编程新范式。