CliRelay:免费用GPT-5/Gemini Pro,命令行工具秒变API服务

CliRelay将免费AI命令行工具转为标准API,零成本调用顶级大模型
CliRelay是一个Go语言开源项目,通过进程代理技术将Gemini CLI、ChatGPT Codex、Claude Code等免费AI命令行工具封装为兼容OpenAI标准的HTTP API服务。开发者可借此在图形化客户端、自动化脚本中免费调用GPT-5、Gemini 2.5 Pro等顶级模型,但需注意合规性风险和稳定性隐患。
项目概述:一行命令,免费调用顶级大模型API
CliRelay 是一个用 Go 语言编写的开源项目,它能把 Gemini CLI、ChatGPT Codex、Claude Code、Qwen Code 等主流 AI 命令行工具,封装为兼容 OpenAI/Gemini/Claude 的标准 API 服务。
简单来说,你可以通过统一的 API 接口,免费调用 Gemini 2.5 Pro、GPT-5、Claude、Qwen 等顶级大模型——不花一分钱。
项目目前在 GitHub 上已获得 646 颗星标和 50 个 Fork,热度持续攀升。

为什么需要 CliRelay?命令行到 API 的桥梁
免费命令行工具的痛点
Google、OpenAI、Anthropic 等厂商都推出了免费的 AI 命令行工具,而且额度相当慷慨。2025 年各大厂商在命令行工具上给出的免费额度相当可观:Google 的 Gemini CLI 提供每分钟 60 次、每天 1000 次的免费请求额度,且可调用最新的 Gemini 2.5 Pro 模型;OpenAI 的 ChatGPT Codex 面向开发者提供免费的代码生成与对话能力;Anthropic 的 Claude Code 则允许开发者在终端中直接与 Claude 交互。
但问题在于:这些工具只能在终端里交互使用,没法被第三方应用、自动化脚本或开发工具直接调用。它们的共同特点是——额度慷慨但仅限于命令行交互模式,不提供可编程的 HTTP API 端点。
你想在 LobeChat 里用免费的 Gemini 2.5 Pro?想在自己的项目里批量调用 GPT-5?命令行工具帮不了你。
CliRelay 怎么解决
CliRelay 充当一个中间层(Relay),把命令行工具的输入输出转化为标准的 HTTP API 接口。任何支持 OpenAI API 格式的客户端,都能直接接入,无需改动一行代码。
这里需要理解一个重要的行业背景:OpenAI 在 2023 年确立的 Chat Completions API 格式(以 /v1/chat/completions 端点为核心)已成为大模型调用的事实标准。几乎所有主流 AI 客户端、开发框架(如 LangChain、LlamaIndex)和编排工具都优先支持这一格式。这意味着,只要一个服务能输出符合 OpenAI API 规范的 JSON 响应(包含 model、choices、usage 等字段),就能被整个生态中的数百款工具无缝调用。CliRelay 正是利用了这一生态优势——它不需要说服每个客户端单独适配,只需"说 OpenAI 的语言"就够了。
支持的工具与模型一览
| 命令行工具 | 对应模型 | 兼容 API 格式 |
|---|---|---|
| Gemini CLI | Gemini 2.5 Pro | OpenAI/Gemini |
| ChatGPT Codex | GPT-5 | OpenAI/Codex |
| Claude Code | Claude 系列 | Claude/OpenAI |
| Qwen Code | Qwen 系列 | OpenAI |
| Antigravity | 多模型 | OpenAI |
| iFlow | 多模型 | OpenAI |
技术实现:进程代理 + Go 语言的天然优势
CliRelay 的核心设计理念是进程代理(Process Proxy)。这是一种经典的系统集成模式,其核心思想是:将一个只支持标准输入/输出(stdin/stdout)交互的命令行程序,包装为可通过网络协议调用的服务。
工作流程如下:
- 在本地启动一个 HTTP 服务器
- 收到 API 请求后,将参数转化为对应命令行工具的输入
- 启动子进程执行命令行工具
- 捕获输出,按照标准 API 响应格式返回给调用方
具体实现中,代理程序通过操作系统的进程管理 API(如 Go 的 os/exec 包)创建子进程,将 HTTP 请求中的参数序列化后写入子进程的 stdin,然后持续读取 stdout 的输出流,再将其解析、格式化为标准的 API 响应返回给调用方。对于流式输出(Streaming),代理还需要实现 Server-Sent Events(SSE)协议,将子进程的逐行输出实时推送给客户端,模拟大模型的逐 token 生成效果。这种架构的优势在于完全不需要修改原始命令行工具的代码,属于非侵入式集成。
用 Go 语言来做这件事非常合适:
- 并发处理能力强:Go 的 goroutine 天然适合同时处理多个 API 请求的并行转发。goroutine 是一种用户态轻量级线程,由 Go 运行时调度器管理,而非直接映射到操作系统线程。一个 goroutine 的初始栈空间仅约 2-8 KB(相比之下,操作系统线程通常需要 1-8 MB),这意味着单台机器可以轻松运行数十万个 goroutine。在 CliRelay 的场景中,每个 API 请求都可以由一个独立的 goroutine 处理,包括启动子进程、等待输出、格式化响应等操作,彼此互不阻塞。配合 Go 的 channel 机制进行协程间通信,可以优雅地实现请求队列管理和并发数控制,避免同时启动过多子进程导致系统资源耗尽。
- 单二进制部署:编译后就是一个可执行文件,不依赖任何运行时环境
- 跨平台编译:轻松生成 Linux、macOS、Windows 版本,覆盖主流操作系统
三大实际应用场景
场景一:接入图形化 AI 客户端
ChatBox、Open WebUI、LobeChat 等热门 AI 客户端都支持自定义 OpenAI 兼容端点。这些工具代表了当前开源 AI 客户端的主流方向:LobeChat 是一个支持插件扩展的现代化聊天界面,内置多模型切换和知识库管理功能;Open WebUI(原 Ollama WebUI)最初为本地模型设计,现已扩展为支持任意 OpenAI 兼容端点的通用前端;ChatBox 则是一款跨平台桌面客户端,以简洁易用著称。
这些工具的共同设计哲学是"后端无关"——用户只需填入 API 地址和密钥,就能切换不同的模型提供商。这种架构恰好为 CliRelay 这类中间层工具创造了完美的接入条件。配合 CliRelay,你可以把免费的命令行模型接入图形界面,告别黑底白字的终端窗口,获得更友好的对话体验。
场景二:开发集成与自动化
开发者可以在自己的应用中直接调用 CliRelay 提供的 API,不用为每个 AI 服务单独写适配代码。统一的接口标准让集成成本大幅降低,特别适合需要快速原型验证的场景。
场景三:多模型横向对比评测
CliRelay 同时支持多个模型的 API 化,研究人员可以用相同的测试脚本对 GPT-5、Gemini 2.5 Pro、Claude 进行横向对比,不用分别配置各自的 API Key,省时省力。
使用风险与注意事项
这类工具本质上是对免费命令行工具的二次封装,使用前需要了解以下风险:
- 合规性问题:将命令行工具转为 API 服务可能违反部分厂商的使用条款,建议仔细阅读相关服务协议。各大 AI 厂商的命令行工具通常在服务条款中明确规定了使用方式。例如,Google 的 Gemini CLI 服务条款中可能包含"禁止通过自动化手段批量调用"或"禁止将服务转售或再分发"等条款;OpenAI 的使用政策也对 API 滥用行为有明确限制。将命令行工具转为 API 服务,本质上改变了工具的预期使用方式——从人机交互变为机器间调用,这可能被厂商视为违反服务协议。历史上,类似的"免费转 API"项目(如早期的 ChatGPT 逆向代理)曾遭到厂商的技术封锁和法律警告。因此,用户在使用 CliRelay 时应当充分评估法律风险,避免用于商业用途或大规模部署。
- 稳定性隐患:一旦上游命令行工具更新版本或厂商调整限制策略,CliRelay 的服务可能随时中断
- 速率限制:免费额度本身有调用频率和总量上限,API 化后如果不加控制,很容易触发限流甚至封号
总结:零成本体验顶级AI模型的实用方案
CliRelay 展现了开源社区的典型创新思路——用巧妙的工程手段,把分散的免费资源整合为统一、标准化的服务。
对于个人开发者和小团队来说,它提供了一条零成本体验 GPT-5、Gemini 2.5 Pro、Claude 等顶级模型 API 的捷径。不过在实际使用中,务必关注各平台的使用政策,合理合规地利用这些资源。
相关推荐
产品体验Qoder vs Cursor实测对比:同样20美金谁更强?
实测对比Qoder和Cursor两款AI IDE,从Agent自主修复能力、人工沟通次数、架构决策等维度评测。Qoder仅需2次沟通完成任务,Cursor需8次。详细分析两者差异,帮你选择最适合的AI编程工具。
产品体验Cursor云Agent演示:打通软件开发全链路瓶颈
深度解析Cursor云Agent最新Demo,展示如何通过云端虚拟机、自动测试产物和全链路控制平面,系统性消除软件开发生命周期中的人类瓶颈,让Agent自主运行、人按需介入。
产品体验Cursor 3.0深度解析:多Agent并行、Design Mode与Best-of-N模型对比
Cursor 3.0正式发布,从AI辅助编程工具进化为Agent舰队指挥中心。本文详解多智能体并行、Design Mode可视化编辑、Best-of-N多模型择优等核心功能,解读AI编程新范式。