共 86 篇相关文章
科技前沿Google在AI Studio中推出智能鼠标指针原型,让光标具备理解屏幕内容、预判用户意图的能力。本文解析这一AI交互创新的技术原理、体验效果及对操作系统基础层的深远影响。
深度解读介绍开源项目claude-skill-video-transcribe,支持YouTube、B站和本地视频转文字。采用优先提取字幕、无字幕时Gemini 2.5 Flash AI听写的双路策略,Python开发,高效实现视频内容转录。
教程攻略Google开源gemini-fullstack-langgraph-quickstart项目,斩获18000+ Star。深度拆解Gemini 2.5与LangGraph构建全栈AI Agent的技术架构、状态机设计模式与工具调用机制,附适用场景分析,助你快速上手Agent开发。
产品体验深度解析GitHub开源项目zaiis2api,支持免费无限调用Gemini 3 Pro、Claude Opus等AI模型。详解技术实现原理、逆向API代理机制、支持模型列表及合规风险,帮助开发者全面评估这类免费AI API工具。
One API:统一管理30+大模型的开源网关系统
One API 是一款开源 LLM API 管理与分发系统,支持 OpenAI、Claude、Gemini、通义千问等30+大模型的统一接入。提供 Key 管理、负载均衡、额度控制等功能,Docker 一键部署,GitHub 32K+ Star。
产品体验实测谷歌Gemini 3.5 Flash模型,前端代码生成、Three.js 3D建模、粒子动画全方位评测,性能逼近Pro版却便宜得多,AI竞技场排名惊人。