CliRelay：免费用GPT-5/Gemini Pro，命令行工具秒变API服务

项目概述：一行命令，免费调用顶级大模型API

CliRelay 是一个用 Go 语言编写的开源项目，它能把 Gemini CLI、ChatGPT Codex、Claude Code、Qwen Code 等主流 AI 命令行工具，封装为兼容 OpenAI/Gemini/Claude 的标准 API 服务。

简单来说，你可以通过统一的 API 接口，免费调用 Gemini 2.5 Pro、GPT-5、Claude、Qwen 等顶级大模型——不花一分钱。

项目目前在 GitHub 上已获得 646 颗星标和 50 个 Fork，热度持续攀升。

github source: kittors/CliRelay: Wrap Gemini CLI, Antigravity, ChatGPT Codex, Claude Code, Qwen Code, iFlow as an O

为什么需要 CliRelay？命令行到 API 的桥梁

免费命令行工具的痛点

Google、OpenAI、Anthropic 等厂商都推出了免费的 AI 命令行工具，而且额度相当慷慨。2025 年各大厂商在命令行工具上给出的免费额度相当可观：Google 的 Gemini CLI 提供每分钟 60 次、每天 1000 次的免费请求额度，且可调用最新的 Gemini 2.5 Pro 模型；OpenAI 的 ChatGPT Codex 面向开发者提供免费的代码生成与对话能力；Anthropic 的 Claude Code 则允许开发者在终端中直接与 Claude 交互。

但问题在于：这些工具只能在终端里交互使用，没法被第三方应用、自动化脚本或开发工具直接调用。它们的共同特点是——额度慷慨但仅限于命令行交互模式，不提供可编程的 HTTP API 端点。

你想在 LobeChat 里用免费的 Gemini 2.5 Pro？想在自己的项目里批量调用 GPT-5？命令行工具帮不了你。

CliRelay 怎么解决

CliRelay 充当一个中间层（Relay），把命令行工具的输入输出转化为标准的 HTTP API 接口。任何支持 OpenAI API 格式的客户端，都能直接接入，无需改动一行代码。

这里需要理解一个重要的行业背景：OpenAI 在 2023 年确立的 Chat Completions API 格式（以 /v1/chat/completions 端点为核心）已成为大模型调用的事实标准。几乎所有主流 AI 客户端、开发框架（如 LangChain、LlamaIndex）和编排工具都优先支持这一格式。这意味着，只要一个服务能输出符合 OpenAI API 规范的 JSON 响应（包含 model、choices、usage 等字段），就能被整个生态中的数百款工具无缝调用。CliRelay 正是利用了这一生态优势——它不需要说服每个客户端单独适配，只需"说 OpenAI 的语言"就够了。

支持的工具与模型一览

命令行工具	对应模型	兼容 API 格式
Gemini CLI	Gemini 2.5 Pro	OpenAI/Gemini
ChatGPT Codex	GPT-5	OpenAI/Codex
Claude Code	Claude 系列	Claude/OpenAI
Qwen Code	Qwen 系列	OpenAI
Antigravity	多模型	OpenAI
iFlow	多模型	OpenAI

技术实现：进程代理 + Go 语言的天然优势

CliRelay 的核心设计理念是进程代理（Process Proxy）。这是一种经典的系统集成模式，其核心思想是：将一个只支持标准输入/输出（stdin/stdout）交互的命令行程序，包装为可通过网络协议调用的服务。

工作流程如下：

在本地启动一个 HTTP 服务器
收到 API 请求后，将参数转化为对应命令行工具的输入
启动子进程执行命令行工具
捕获输出，按照标准 API 响应格式返回给调用方

具体实现中，代理程序通过操作系统的进程管理 API（如 Go 的 os/exec 包）创建子进程，将 HTTP 请求中的参数序列化后写入子进程的 stdin，然后持续读取 stdout 的输出流，再将其解析、格式化为标准的 API 响应返回给调用方。对于流式输出（Streaming），代理还需要实现 Server-Sent Events（SSE）协议，将子进程的逐行输出实时推送给客户端，模拟大模型的逐 token 生成效果。这种架构的优势在于完全不需要修改原始命令行工具的代码，属于非侵入式集成。

用 Go 语言来做这件事非常合适：

并发处理能力强：Go 的 goroutine 天然适合同时处理多个 API 请求的并行转发。goroutine 是一种用户态轻量级线程，由 Go 运行时调度器管理，而非直接映射到操作系统线程。一个 goroutine 的初始栈空间仅约 2-8 KB（相比之下，操作系统线程通常需要 1-8 MB），这意味着单台机器可以轻松运行数十万个 goroutine。在 CliRelay 的场景中，每个 API 请求都可以由一个独立的 goroutine 处理，包括启动子进程、等待输出、格式化响应等操作，彼此互不阻塞。配合 Go 的 channel 机制进行协程间通信，可以优雅地实现请求队列管理和并发数控制，避免同时启动过多子进程导致系统资源耗尽。
单二进制部署：编译后就是一个可执行文件，不依赖任何运行时环境
跨平台编译：轻松生成 Linux、macOS、Windows 版本，覆盖主流操作系统

三大实际应用场景

场景一：接入图形化 AI 客户端

ChatBox、Open WebUI、LobeChat 等热门 AI 客户端都支持自定义 OpenAI 兼容端点。这些工具代表了当前开源 AI 客户端的主流方向：LobeChat 是一个支持插件扩展的现代化聊天界面，内置多模型切换和知识库管理功能；Open WebUI（原 Ollama WebUI）最初为本地模型设计，现已扩展为支持任意 OpenAI 兼容端点的通用前端；ChatBox 则是一款跨平台桌面客户端，以简洁易用著称。

这些工具的共同设计哲学是"后端无关"——用户只需填入 API 地址和密钥，就能切换不同的模型提供商。这种架构恰好为 CliRelay 这类中间层工具创造了完美的接入条件。配合 CliRelay，你可以把免费的命令行模型接入图形界面，告别黑底白字的终端窗口，获得更友好的对话体验。

场景二：开发集成与自动化

开发者可以在自己的应用中直接调用 CliRelay 提供的 API，不用为每个 AI 服务单独写适配代码。统一的接口标准让集成成本大幅降低，特别适合需要快速原型验证的场景。

场景三：多模型横向对比评测

CliRelay 同时支持多个模型的 API 化，研究人员可以用相同的测试脚本对 GPT-5、Gemini 2.5 Pro、Claude 进行横向对比，不用分别配置各自的 API Key，省时省力。

使用风险与注意事项

这类工具本质上是对免费命令行工具的二次封装，使用前需要了解以下风险：

合规性问题：将命令行工具转为 API 服务可能违反部分厂商的使用条款，建议仔细阅读相关服务协议。各大 AI 厂商的命令行工具通常在服务条款中明确规定了使用方式。例如，Google 的 Gemini CLI 服务条款中可能包含"禁止通过自动化手段批量调用"或"禁止将服务转售或再分发"等条款；OpenAI 的使用政策也对 API 滥用行为有明确限制。将命令行工具转为 API 服务，本质上改变了工具的预期使用方式——从人机交互变为机器间调用，这可能被厂商视为违反服务协议。历史上，类似的"免费转 API"项目（如早期的 ChatGPT 逆向代理）曾遭到厂商的技术封锁和法律警告。因此，用户在使用 CliRelay 时应当充分评估法律风险，避免用于商业用途或大规模部署。
稳定性隐患：一旦上游命令行工具更新版本或厂商调整限制策略，CliRelay 的服务可能随时中断
速率限制：免费额度本身有调用频率和总量上限，API 化后如果不加控制，很容易触发限流甚至封号

总结：零成本体验顶级AI模型的实用方案

CliRelay 展现了开源社区的典型创新思路——用巧妙的工程手段，把分散的免费资源整合为统一、标准化的服务。

对于个人开发者和小团队来说，它提供了一条零成本体验 GPT-5、Gemini 2.5 Pro、Claude 等顶级模型 API 的捷径。不过在实际使用中，务必关注各平台的使用政策，合理合规地利用这些资源。

项目地址：github.com/kittors/CliRelay