共 131 篇相关文章
科技前沿Anthropic发布Claude Code Web版,支持浏览器和移动端启动编码任务,配合Haiku 4.5模型以1/3成本实现旗舰级编程能力。本文详解并行任务处理、多模型协作、云端到本地无缝衔接等核心功能。
产品体验深度评测Claude Haiku 4.5性能表现,SWE-bench得分73.3%媲美Sonnet 4,输入仅1美元/百万token。涵盖代码生成、智能体编码、SVG图形等实测案例,解析Sonnet+Haiku双模型协同策略与最佳使用方案。
科技前沿Anthropic发布Claude Haiku 4.5,作为Sonnet 4.5的蒸馏版本,编码性能接近旗舰级水平,速度提升一倍,成本降至三分之一。SWE-Bench评测73.3分,稳居AI编码第一阵营,是开发者降本增效的理想选择。
科技前沿Datasette项目创始人Simon Willison宣布推出官方博客,并使用OpenAI Codex桌面版完成开发。文章解析AI辅助编程的实践过程、Codex会话记录导出功能的价值,以及Datasette项目未来发展方向。
科技前沿SWE-bench团队宣布开放更多评测环境、任务集、运行轨迹和训练方案,降低AI编程智能体研发门槛。本文详解此次更新的核心内容及其对AI软件工程领域的深远影响。
观点碰撞Django联合创始人Simon Willison发现Vibe Coding与Agentic Engineering两种AI编程范式正在融合。当Claude Code等工具越来越可靠,专业工程师是否还需要逐行审查代码?本文探讨AI编程的责任边界、偏差正常化风险及软件工程师的未来。
科技前沿SWE-agent Multimodal正式发布,新增图像查看和网页浏览器调试能力,可自动定位前端视觉Bug并生成修复方案。配套推出SWE-bench Multimodal评测基准,为多模态AI编程工具提供标准化衡量体系。
科技前沿SWE-bench官方博客正式上线,将持续发布AI编程评测、AI Agent及工具链深度内容。本文详解SWE-bench基准测试的核心价值、博客上线的行业意义,以及AI代码生成评测的未来趋势。
科技前沿Qwen团队在SWE-bench基准测试中持续领跑开源模型,展现出强大的软件工程能力。本文解析SWE-bench评测标准、Qwen系列模型的进步历程,以及开源AI编程工具对开发者的实际价值。
产品体验深入解析AutoGPT开源项目,涵盖其自主AI智能体架构、核心功能、应用场景及未来发展。了解这个GitHub上18.4万Star的AI Agent如何让每个人都能构建和使用自主AI。
教程攻略Simon Willison在手机上使用Claude Code for web,将iNaturalist十年野生动物观察数据聚合到个人博客。本文解析其技术架构、Beats系统扩展方案,以及AI辅助编程如何改变开发者工作流。
教程攻略Simon Willison在露营时仅用手机和Claude Code,从零搭建了完整的iNaturalist观察记录展示工具。本文拆解其Python CLI数据处理、Git Scraping自动化更新、纯前端展示的三层架构,展示零成本无服务器开发的完整实践。
观点碰撞Vibe Coding让开发应用像写博客一样简单,但个人小工具的分发缺乏好的渠道。本文探讨用RSS作为轻量级应用分发协议的可能性,以及AI编程如何推动软件回归手工艺时代。
观点碰撞AI辅助编程让开发小工具像写博客一样简单,但这些个人应用如何被发现?Matt Webb提出用RSS聚合vibe-coded应用,Simon Willison迅速实践。本文探讨RSS如何成为去中心化应用分发的新方案。
教程攻略Simon Willison在露营时用手机和Claude Code,结合Git Scraping与GitHub Actions,零服务器搭建了iNaturalist自然观察记录展示工具。本文拆解其三层架构设计、Prompt工程技巧及对开发者的实用启示。
观点碰撞AI编程让开发微应用像发博客一样简单,但分发成了新瓶颈。Matt Webb提出用RSS订阅机制分享vibe-coded应用,Simon Willison已率先实践。本文探讨RSS如何成为微应用分发的理想方案,以及"安装到哪里"这一核心难题。
科技前沿深入解析 Simon Willison 开源项目 LLM 0.32 alpha 版本的两大核心重构:消息序列 API 对齐 OpenAI 消息格式,stream_events 实现流式多类型响应处理,以及序列化机制与向后兼容的设计哲学。
观点碰撞Vibe Coding让AI编程像写博客一样简单,个人微应用正在爆发式增长。Matt Webb提出用RSS机制分享微应用,Simon Willison已率先实践。探讨微应用分发、安装与信任的未来。
教程攻略Simon Willison在露营中用手机和Claude Code完成了一个完整的iNaturalist观察记录展示工具。本文详解其三层技术架构:Python CLI数据聚合、Git Scraping自动化更新、AI生成前端页面,实现零服务器、零成本的GitHub全栈方案。
产品体验Simon Willison在露营途中仅用手机和Claude Code完成了一个iNaturalist观察记录展示工具。本文拆解其三层技术架构:Python CLI数据聚类、Git Scraping自动更新、AI生成纯前端画廊,展示零服务器个人项目开发的完整范式。