New API实战：搭建自己的AI API中转站完整教程

为什么需要AI API中转站？

如果你正在做AI应用开发、工具集成，或者同时使用多个大模型（GPT、Claude、DeepSeek等），你一定遇到过这样的痛点：每个模型的接口格式不同、密钥管理混乱、无法统一控制额度和权限。

New API 这个开源项目正是为了解决这些问题而生。它能帮你统一管理所有模型接口，自动分发请求到不同模型，控制API权限与额度，让所有AI调用变成一个标准的OpenAI兼容接口。无论是自用还是对外提供商业服务，它都能让你的整个调用体系变得干净高效。

OpenAI兼容接口为何成为行业标准

OpenAI兼容接口（OpenAI Compatible API）已经成为大模型调用的事实标准。OpenAI最早定义了一套RESTful API规范，包括/v1/chat/completions、/v1/embeddings等端点，使用Bearer Token认证，请求和响应均为JSON格式。由于OpenAI的市场先发优势，几乎所有AI开发工具（如LangChain、LlamaIndex、各类IDE插件）都原生支持这套接口格式。因此，后来的模型厂商（如DeepSeek、Mistral、通义千问）也纷纷兼容这套规范，而API中转站的核心价值就是将那些不完全兼容的接口统一转换为这一标准格式，实现"一次对接，处处可用"。

API网关与中转站的架构原理

API网关（API Gateway）是微服务架构中的核心组件，充当客户端与后端服务之间的中间层。它负责请求路由、协议转换、负载均衡、限流熔断、认证鉴权等功能。在AI场景下，API中转站本质上就是一个专门为大模型调用设计的API网关。它接收下游用户的请求，根据配置的渠道策略将请求转发到上游模型供应商，同时完成格式转换、Token计费、流量控制等工作。这种架构模式在传统互联网中已经非常成熟，Kong、Nginx、Envoy等都是知名的网关实现，New API则是将这一模式专门适配到了AI API管理场景。

New API 实战教程

服务器配置要求

在搭建之前，需要根据你的使用场景选择合适的服务器配置。

自用配置（最低要求）

CPU：1核
运行内存：1GB
硬盘：有实际可用空间即可

这个配置仅适合个人使用，不建议对外开放。

小规模运营配置（几十人）

CPU：2核
运行内存：4GB
硬盘：40GB
数据库：MySQL
Redis：建议开启

这样的配置大概能承受30到100在线用户，每分钟几十到几百次请求。如果是真正的公开商业运营，配置至少要在此基础上翻四倍以上。

Docker部署全流程

安装Docker环境

项目需要在Docker中部署，首先执行一键安装命令安装Docker。安装过程中可能会卡住一会，这是正常现象。安装完成后，启动Docker并设置开机自启，然后安装Docker Compose。

Docker是一种操作系统级别的虚拟化技术，它将应用及其所有依赖打包成一个标准化的容器镜像。相比传统的直接在服务器上安装软件，Docker部署具有环境一致性（消除"在我机器上能跑"的问题）、快速部署回滚、资源隔离等优势。Docker Compose则是Docker的编排工具，通过一个YAML配置文件定义多个容器的启动参数、网络关系和数据卷挂载，一条命令即可启动整个应用栈（如应用+数据库+缓存）。对于New API这类需要数据库和Redis配合的项目，Docker Compose大大简化了部署复杂度。

拉取项目并配置

拉取New API项目后进入项目目录，官方提供的Docker Compose配置文件已经比较完整。但如果你是对外开放、多用户使用的场景，以下几处配置必须修改，否则风险很大：

第一处：数据库密码

必须改成强密码。数据库存储所有用户数据、API Key、Token等敏感信息，如果被扫到弱密码，很容易全部泄露。如果用户量大，建议使用MySQL数据库（取消注释MySQL配置，注释掉PostgreSQL）。

第二处：Redis密码

必须设置强密码。Redis裸露在公网非常危险，很多服务器被入侵就是因为没密码或密码太弱。

Redis是一个基于内存的高性能键值存储数据库，读写速度可达每秒十万次以上。在API中转站场景中，Redis主要承担以下职责：一是请求限流（Rate Limiting），通过滑动窗口或令牌桶算法控制每个用户的请求频率；二是Session缓存，存储用户登录状态避免频繁查询数据库；三是额度缓存，将用户的剩余额度缓存在内存中实现实时扣减而不必每次都写入数据库；四是分布式锁，在多节点部署时保证数据一致性。Redis未设密码暴露在公网是极其危险的，攻击者可以通过Redis写入SSH公钥或Crontab实现服务器入侵，这也是为什么必须设置强密码。

第三处：流式响应参数

建议设置大一些，过小会导致流式输出时中断，影响用户体验。

流式响应是大模型API的重要特性，它基于HTTP的Server-Sent Events（SSE）协议实现。传统的HTTP请求是"请求-等待-一次性返回"模式，而流式响应允许服务器在生成内容的同时逐步推送给客户端，用户可以看到文字像打字一样逐字出现。这对于大模型生成长文本时的用户体验至关重要——用户不必等待几十秒才看到完整回复。在中转站场景中，流式响应需要保持长连接不中断，如果缓冲区设置过小或超时时间过短，连接会在模型还在生成内容时被提前关闭，导致输出截断。

第四处：SESSION_SECRET

自用可以不管，但对外公开建议开启。它的作用是Session加密、多节点同步、防止Cookie被伪造。SESSION_SECRET本质上是一个用于对称加密的密钥字符串，服务端用它对Session数据进行签名和加密。如果不设置或使用默认值，攻击者可能伪造合法的Session Cookie，冒充管理员身份登录系统。在多节点部署时，所有节点必须使用相同的SESSION_SECRET才能正确解析彼此生成的Session。

启动服务

配置确认无误后，执行Docker Compose命令启动服务。镜像拉取时间可能较长，取决于网络速度。完成后，在浏览器访问服务器IP加3000端口即可进入管理界面。

系统初始化与模式选择

进入界面后需要完成系统初始化：

设置管理员账户：用户名和密码坚决不能设置弱密码，尤其不要用admin作为用户名，很容易被暴力破解。
选择运行模式：
- 对外服务模式：提供多租户商业化服务，用于盈利
- 自用模式：本地部署或个人使用，不对外开放
- 演示站点模式：了解功能、熟悉操作用

域名与安全配置建议

如果对外提供服务，强烈建议：

注册公网域名，通过反向代理指向IP+端口
使用HTTPS加密传输，不要直接暴露服务器IP
将域名托管到Cloudflare，利用其CDN和DDoS防护能力

Cloudflare是全球最大的CDN和网络安全服务商之一，其免费套餐即提供DNS管理、DDoS防护、SSL证书和基础WAF（Web应用防火墙）功能。将域名托管到Cloudflare后，所有流量先经过Cloudflare的全球边缘节点，恶意流量在到达源服务器之前就被过滤。反向代理（Reverse Proxy）则是指用Nginx或Caddy等软件监听80/443端口，将请求转发到内部的3000端口服务。这种架构的好处是：源服务器IP不暴露（攻击者无法直接扫描）、自动获得HTTPS加密、可以利用Cloudflare的全球节点加速访问。对于AI中转站这类涉及API Key传输的服务，HTTPS加密是防止中间人攻击窃取密钥的基本保障。

很多AI中转站都采用这种架构，既安全又稳定。

核心功能配置

订阅管理

订阅管理用于给用户定制购买套餐。你可以设置套餐名称（如"DeepSeek套餐"）、金额、币种（默认美元）、购买上限（套餐能被购买几次）、有效期和额度。

渠道管理

渠道管理是定义Token来源的地方。不管你是个人还是服务商，都通过这里添加API Token的上游来源，支持很多常见供应商。

重要提示：这里填入的密钥是你从供应商（如DeepSeek官网）购买的API Key，不是你分发给用户的密钥。

渠道管理还支持优先级和权重配置，当同一个模型配置了多个渠道时，系统会根据优先级和权重进行智能路由。例如你可以为同一个模型配置多个供应商的Key，当某个供应商出现故障或额度耗尽时，系统自动切换到备用渠道，实现高可用。这种负载均衡和故障转移机制对于保障服务稳定性至关重要。

令牌管理

令牌管理才是给自己或用户分发API Key的入口。可以设置：

过期时间
额度限制（可开启无限额度）
访问限制：允许或禁止访问哪些模型

创建完成后系统会生成一个密钥，用户拿这个密钥就可以调用服务。

多租户与商业化架构

多租户（Multi-tenancy）是SaaS软件的核心架构模式，指一套系统同时服务多个独立的用户（租户），每个租户的数据相互隔离但共享底层基础设施。在New API的场景中，多租户体现为：每个注册用户拥有独立的API Key、独立的额度余额、独立的使用记录和独立的模型访问权限。管理员可以为不同用户设置不同的套餐和限制。这种设计使得一个New API实例就能支撑一个完整的API转售业务——管理员从上游批量采购API额度，通过订阅套餐加价分发给下游用户，中间的差价即为利润。目前国内大量的"AI中转站"商业服务都是基于类似架构运营的。

客户端调用验证

以VSCode中的Cline插件为例，验证API中转是否正常工作：

安装Cline插件后，在左侧找到Cline面板
点击添加供应商配置
关键点：不要选DeepSeek、Anthropic或OpenRouter，要选择"OpenAI Compatible"或"OpenAI"，因为New API本质是OpenAI兼容接口
URL填写：服务器IP:端口/v1（有域名则填域名/v1），后面的/v1不能少
填入之前生成的密钥

发送对话后如果能正常返回响应，说明整个API中转流程已经完全打通。这里的/v1路径是OpenAI API规范中定义的版本前缀，所有兼容接口都遵循这一约定。实际的完整请求路径会是/v1/chat/completions（对话补全）、/v1/models（模型列表）等，客户端SDK会自动在/v1基础上拼接具体的端点路径。

总结

New API项目为AI开发者提供了一个强大的API网关解决方案。它的核心价值在于：

统一接口：所有模型通过OpenAI兼容格式调用
灵活管理：精细化的权限、额度、模型访问控制
商业化就绪：支持订阅套餐、多租户、用量统计
部署简单：Docker一键部署，配置清晰

对于正在构建AI应用或需要管理多个模型API的开发者来说，New API是一个值得尝试的基础设施工具。随着大模型生态的快速发展，模型供应商越来越多、接口差异越来越大，API中转站这类基础设施的价值只会越来越高。无论是降低开发对接成本、实现供应商无锁定切换，还是构建商业化的API分发服务，统一的API管理层都是不可或缺的一环。