One API：统一管理30+大模型的开源网关系统完整指南

文章正文

在大模型百花齐放的今天，开发者往往需要同时对接多个 LLM 服务商——OpenAI、Claude、Gemini、DeepSeek、通义千问……每个平台都有不同的 API 格式、认证方式和计费逻辑。如何高效管理这些 API Key，并以统一的接口对外提供服务？GitHub 上星标超过 3.2 万的开源项目 One API 给出了一个相当优雅的答案。

github source: songquanpeng/one-api: LLM API 管理 & 分发系统，支持 OpenAI、Azure、Anthropic Claude、Google Gemini、DeepSeek、字节豆包

项目概览：一个入口，通达所有大模型

One API 是由开发者 songquanpeng 创建的 LLM API 管理与分发系统。它的核心理念非常直接：将市面上主流大模型的 API 统一适配为 OpenAI 兼容格式，让下游应用只需对接一套接口，即可无缝切换和调用不同的模型服务。

这里所说的「OpenAI 兼容格式」，指的是 OpenAI 的 Chat Completions API——这一接口已经成为大模型调用的事实标准。其请求格式以 JSON 结构传递 messages 数组，包含 role（system/user/assistant）和 content 字段，响应则以流式或非流式方式返回模型生成的内容。

流式响应底层采用的是 SSE（Server-Sent Events） 协议——一种基于 HTTP 的单向实时通信机制，允许服务器向客户端持续推送数据流。在大模型场景中，SSE 使得模型生成的文字可以逐 token「打字机效果」地呈现给用户，而非等待完整响应后一次性返回。相比 WebSocket，SSE 更轻量，天然支持 HTTP/2 多路复用，且在断线重连方面有内置支持。每个 SSE 数据帧以 data: 前缀开头，OpenAI 规范中每帧携带一个 JSON delta 对象，流结束时发送 data: [DONE] 信号。这一设计极大改善了用户体验，也是当前几乎所有主流大模型 API 都采用 SSE 作为流式传输方案的根本原因。由于 OpenAI 是最早大规模商业化 LLM API 的公司，几乎所有主流开发框架、SDK 和前端应用都优先适配了这一格式。这意味着，任何能够将自身 API 转换为 OpenAI 兼容格式的中间层，都能立即获得整个生态的支持，而不需要下游开发者做任何改动。这正是 One API 适配层设计的底层逻辑。

目前，One API 已支持的模型供应商包括但不限于：

海外主流：OpenAI（GPT 系列）、Azure OpenAI、Anthropic Claude、Google Gemini
国内头部：DeepSeek、字节豆包、百度文心一言、阿里通义千问、讯飞星火、智谱 ChatGLM、腾讯混元、360 智脑

项目以 JavaScript 编写，在 GitHub 上已获得 32,851 颗星标 和超过 6,200 次 Fork，是 LLM API 网关领域最受欢迎的开源方案之一。

核心功能解析

统一 API 适配层：一套接口调用所有大模型

One API 最核心的价值在于其适配层设计。无论后端对接的是哪家模型服务商，对外暴露的始终是 OpenAI 兼容的 API 格式。这意味着任何支持 OpenAI API 的客户端、SDK 或应用框架（如 LangChain、ChatGPT-Next-Web 等），只需修改 API 地址和 Key，就能直接调用 One API 背后的任意模型。

从架构角度来看，One API 本质上采用了 API 网关（API Gateway） 这一经典的设计模式。API 网关最早由 Netflix、Amazon 等公司在大规模分布式系统中广泛采用，其核心思想是在客户端与后端服务之间设置一个统一入口，负责请求路由、协议转换、认证鉴权、限流熔断和日志监控等横切关注点。在传统的 Web 服务领域，Kong、Nginx、AWS API Gateway 等是典型代表。One API 将这一成熟的架构模式移植到了 LLM 领域——后端的多个模型供应商相当于不同的微服务，One API 作为网关统一管理流量分发和协议适配。

这种设计带来的好处非常实际——开发者不再需要为每个供应商编写独立的适配代码，也不必担心某家 API 格式变更导致全局代码改动。多模型集成的工程复杂度大幅降低。

值得一提的是，LangChain 是目前最流行的 LLM 应用开发框架之一，它提供了链式调用（Chain）、智能体（Agent）、检索增强生成（RAG）等高级抽象。LangChain 默认以 OpenAI 的 API 格式作为基础接口，同时也为 Anthropic、Google 等供应商提供了独立的集成模块。然而在实际开发中，频繁切换不同供应商的集成模块会增加代码复杂度。通过 One API，开发者只需使用 LangChain 的 OpenAI 集成模块，修改 base_url 指向 One API 实例，即可透明地调用任何后端模型。类似地，ChatGPT-Next-Web、LobeChat、Dify 等热门开源项目也都原生支持自定义 OpenAI API 端点，与 One API 形成了天然的生态协同。

Key 管理与二次分发：精细化控制 API 用量

One API 提供了一套完善的 API Key 管理机制，管理员可以：

集中管理多个供应商的原始 API Key，避免 Key 散落在各处
生成二次分发 Key，分配给团队成员或下游用户
设置额度和权限，控制每个分发 Key 可调用的模型范围和使用量上限
监控用量，实时追踪每个 Key 的调用情况和消费数据

API Key 的安全管理是企业使用大模型服务时的核心关切之一。直接将原始 API Key 分发给开发者存在严重的安全风险：Key 可能被意外提交到 Git 仓库、泄露到日志系统，或被离职员工带走。One API 的二次分发机制本质上实现了一层代理鉴权——原始 Key 仅存储在 One API 服务端，下游用户持有的是由 One API 生成的令牌（Token），这些令牌可以随时吊销、设置过期时间和使用额度。这种设计借鉴了 OAuth 2.0 中的令牌委托模式，在不暴露原始凭证的前提下实现了细粒度的访问控制。同时，所有通过 One API 的请求都会被记录，为事后的安全审计和成本追溯提供了完整的数据链路。

在成本归集层面，One API 还解决了一个容易被忽视的技术难题：不同供应商对 Token 的定义和计量方式存在差异。OpenAI 使用 tiktoken 分词器，中文模型通常有不同的字符到 Token 转换比例（例如一个汉字在 GPT 系列中约等于 0.6 个 Token，而部分中文模型则按字符直接计量）。One API 在记录用量时会统一换算为标准 Token 数，并支持按渠道配置不同的计费倍率，使得跨供应商的成本对比和归集成为可能。这对于需要向各业务部门分摊 AI 成本的企业财务管理来说，是一个不可或缺的基础能力。

这套机制在企业内部的 AI 能力共享场景中尤其好用——IT 部门统一采购各家模型的 API 额度，通过 One API 分发给各业务团队使用，既保障了原始 Key 的安全性，又实现了精细化的成本管控。

极简部署：Docker 一条命令搞定

在部署层面，One API 做到了真正的开箱即用：

单可执行文件：无需复杂的依赖环境，下载即可运行
Docker 镜像：提供官方 Docker 镜像，一条命令完成部署
Web 管理界面：内置中英文 UI，支持可视化配置和管理

个人开发者在本地启动一个实例即可开始使用；团队和企业则可以通过 Docker Compose 或 Kubernetes 快速搭建高可用的生产环境。

典型应用场景

场景一：多模型路由与故障自动转移

当同一模型配置了多个 Key 或多个供应商时，One API 可以自动进行负载均衡和故障转移。举个例子，当 OpenAI 的某个 Key 触发速率限制时，系统会自动切换到 Azure OpenAI 的备用通道，确保服务不中断。对于对可用性要求较高的生产环境来说，这个能力非常关键。

从技术实现角度来看，LLM API 场景中的负载均衡面临一些独特挑战：不同供应商的速率限制（Rate Limit）策略各异，例如 OpenAI 按 TPM（Tokens Per Minute）和 RPM（Requests Per Minute）双重限制，而部分国内供应商则按 QPS（Queries Per Second）计费。One API 通过维护一个渠道优先级队列和健康检查机制来实现故障转移——当某个渠道返回 429（速率限制）或 5xx（服务端错误）状态码时，系统会自动标记该渠道为临时不可用，并将后续请求转发到下一个可用渠道。

这一机制在设计上借鉴了微服务领域经典的断路器（Circuit Breaker）模式：正常状态下断路器「闭合」，请求正常通过；当错误率超过阈值时断路器「断开」，后续请求直接快速失败或转移，避免雪崩效应；经过一段冷却时间后，断路器进入「半开」状态，允许少量探测请求通过以判断服务是否恢复。One API 的渠道健康管理系统还会持续追踪每个供应商渠道的响应延迟和剩余额度估算，在多个健康渠道之间按优先级和权重进行智能分流，确保即使单一供应商出现问题，整体服务依然保持连续性。

场景二：企业 AI 中台的核心组件

企业可以将 One API 作为内部 AI 能力中台的基础设施。各业务系统通过统一的 OpenAI 兼容接口调用大模型能力，IT 部门则通过管理后台完成模型选型、成本控制和安全审计，实现 AI 能力的集约化管理。

AI 中台是企业数字化转型中的新兴架构概念，其核心目标是将分散在各业务线的 AI 能力抽象为共享服务，避免重复建设和资源浪费。一个典型的企业 AI 中台通常包含三层：底层的模型服务层（负