RAGFlow部署教程:从Docker安装到Agent工作流完整实战指南

RAGFlow开源RAG引擎的部署、知识库搭建与Agent应用全面教程
RAGFlow是一款GitHub超5万Star的开源RAG引擎,基于Docker一键部署,集成Redis、MySQL、Elasticsearch等组件。它支持接入DeepSeek等大模型,通过深度文档理解技术实现高精度文档解析与智能分块,提供可溯源的知识问答能力。其亮点在于可视化Agent工作流编排系统,支持意图分类、多知识库检索和第三方API调用,可嵌入实际业务网站,适用于企业级复杂AI应用场景。
RAGFlow 是由英飞流(InfiniFlow)开源的 RAG 引擎项目,目前已在 GitHub 斩获超过 5 万颗 Star,一度冲上 GitHub 趋势热榜第一名。它不仅仅是一个知识库工具,更集成了丰富的 AI Agent 模板,让普通用户也能快速搭建智能助理和复杂业务流程。
本文将从 Docker 安装部署、知识库搭建到 Agent 应用,手把手带你全面掌握 RAGFlow 的核心用法。
环境准备与Docker部署RAGFlow
Docker环境搭建
RAGFlow 基于 Docker 容器化部署,因此第一步需要确保本地已安装 Docker。前往 Docker 官网 下载 Docker Desktop,按照引导一路"下一步"即可完成安装。安装完成后,打开命令行输入 docker 命令,若指令有效则说明环境就绪。
Docker 是一种操作系统级别的虚拟化技术,它将应用程序及其所有依赖项打包到一个标准化的「容器」中运行,确保在任何环境下都能获得一致的行为。Docker Compose 则是 Docker 官方提供的多容器编排工具,通过一个 YAML 配置文件即可定义和管理多个相互关联的容器服务。RAGFlow 选择这种部署方式的好处在于:用户无需手动安装和配置 Redis、MySQL、Elasticsearch 等多个中间件,一条命令即可拉起整个技术栈,极大降低了部署门槛。
下载并启动RAGFlow
接下来访问 RAGFlow 的 GitHub 仓库,点击 Code 按钮下载 ZIP 压缩包。解压后进入 docker 文件夹,在该目录下打开命令行,执行 Docker Compose 启动指令。

首次执行时需要拉取镜像,体积较大,下载时间可能较长。如果你已经提前准备好了离线镜像包,可以通过 docker load 命令将镜像文件加载到本地,然后再执行以下命令快速启动:
docker compose up -d
启动成功后,RAGFlow 会运行五个容器,它们各司其职,构成了一个完整的 RAG 系统架构:
- Redis:一款基于内存的高性能键值数据库,在 RAGFlow 中主要用于会话缓存和热点数据加速,显著降低重复查询的响应延迟
- MinIO:兼容 Amazon S3 协议的开源对象存储系统,专门用于存储用户上传的 PDF、Word 等原始文档文件,支持大规模非结构化数据管理
- MySQL:关系型数据库,负责存储用户账号、知识库元数据、Agent 配置等结构化业务数据
- Elasticsearch:基于 Lucene 的分布式搜索引擎,在 RAGFlow 中承担全文检索和向量检索的双重角色,是 RAG 检索环节的核心基础设施
- RAGFlow Server:核心服务端,协调以上所有组件完成文档解析、知识检索和回答生成的完整流程
在浏览器中访问 http://127.0.0.1,即可打开 RAGFlow 的应用界面。首次使用需要注册账号,数据全部存储在本地数据库中,注册过程非常简单。
模型服务配置:接入DeepSeek等大模型
登录后,首先需要配置 AI 大模型服务。点击头像进入设置页面,RAGFlow 支持本地部署的模型和在线服务商两种接入方式。

以硅基流动(SiliconFlow)为例,选择该服务商后输入 API Key 即可完成接入。硅基流动是国内领先的 AI 模型推理服务平台,提供统一的 API 接口来访问多种开源和商业大模型,包括 DeepSeek、Qwen、ChatGLM 等主流模型。它的商业模式类似于「模型即服务」(MaaS),开发者无需自行部署 GPU 服务器,只需通过 API Key 调用即可使用各种模型的推理能力,按 Token 用量计费。对于 RAGFlow 用户而言,一个 API Key 即可访问多种不同用途的模型,且国内访问延迟低、稳定性好。
随后需要设置几个关键的默认模型:
| 模型用途 | 推荐选择 | 技术角色 |
|---|---|---|
| 对话模型 | DeepSeek V3 | 大语言模型(LLM),负责理解用户意图并基于检索到的上下文生成自然语言回答 |
| 嵌入模型 | 有道 Embedding | 将文本转化为高维向量(通常 768 或 1024 维),使语义相近的文本在向量空间中距离更近 |
| 图片转文字 | DeepSeek-VL2 | 视觉语言模型(VLM),识别文档中的图表、扫描件等非文本内容并转化为可检索的文字 |
嵌入模型是 RAG 系统中至关重要的组件——当用户提问时,系统会将问题也转化为向量,然后通过余弦相似度或欧氏距离等算法在向量数据库中检索最相关的文档片段。图片转文字模型对于处理包含大量图表的 PDF 文档尤为关键,它能确保图表中的信息也被纳入知识库的检索范围。
此外,建议在设置中开启 RAGFlow 的 API 功能并生成一个 API Key。这个 Key 在后续将 Agent 嵌入网站时会用到。如果你是开发者,也可以通过这个 API Key 直接调用 RAGFlow 的开放接口,实现更灵活的系统集成。
知识库搭建与文档解析实战
创建知识库
模型配置完成后,就可以开始使用 RAGFlow 的核心功能——知识库。点击右上方的"创建"按钮,输入知识库名称后保存,然后向知识库中上传本地文档。RAGFlow 支持多种文档格式,包括 PDF、Word、Excel 等常见类型。
文档解析效果实测
以一份长达 90 多页的 PDF 投资者手册为例,上传完成后点击"解析"按钮,RAGFlow 会自动将文档进行向量化处理并存入知识库。

解析完成后可以看到,RAGFlow 将整份文档拆分成了 100 多条结构化的知识条目。选中任意一条知识,还能查看其对应的原始文档片段。文档解析的准确性和精细度是 RAGFlow 的一大核心亮点,相比很多同类工具,它在表格识别、版式理解等方面表现尤为出色。
RAG技术原理深度解析
RAG(Retrieval-Augmented Generation,检索增强生成)由 Meta AI 研究团队于 2020 年提出,旨在解决大语言模型的两大核心缺陷:知识截止日期限制和「幻觉」问题(即模型自信地生成看似合理但实际错误的内容)。
RAG 的工作流程分为三个阶段:
- 索引阶段:将文档通过分块(Chunking)策略切分为适当大小的语义片段,再通过嵌入模型转化为向量并存入向量数据库。分块策略的质量直接影响最终检索效果——切分过大会导致噪声过多,切分过小则可能丢失上下文语义。
- 检索阶段:用户提问时,通过向量相似度搜索(也可结合关键词搜索形成混合检索)找到最相关的 Top-K 个文档片段。
- 生成阶段:将检索到的片段作为上下文拼接到提示词(Prompt)中,交给大语言模型生成最终回答。
RAGFlow 在分块策略上做了大量优化,采用了深度文档理解技术(Deep Document Understanding),能够识别文档的标题层级、表格结构、页眉页脚等版式信息,从而实现更精准的语义切分。这也是其文档解析精度领先同类工具的关键原因——它不是简单地按固定字数或段落切分,而是真正「理解」了文档的结构。
聊天助理:快速创建智能问答机器人
有了知识库之后,就可以创建聊天助理来实现智能问答。点击"新建助理",设置名称并关联一个或多个知识库,系统会自动使用之前配置的 DeepSeek V3 模型进行对话。
例如创建一个名为"小屁"的销售助理,关联基金知识库后,向它提问:"我是一个风险厌恶型的客户,我应该买什么基金?"
助理的回答会充分参考知识库中的内容。将鼠标悬浮到回答旁边的信息图标上,还能查看它具体引用了哪些知识库原文。这种可溯源的回答机制让用户对 AI 的输出更有信心,也便于验证答案的准确性。这一设计在企业级应用中尤为重要——在金融、医疗、法律等对准确性要求极高的领域,每一个 AI 生成的建议都需要有据可查,可溯源机制正是建立用户信任的关键。
Agent工作流:可视化编排复杂业务场景
如果说聊天助理适合简单的问答场景,那么 RAGFlow 的 Agent 功能则是处理复杂业务流程的利器,也是整个产品中最让人惊艳的部分。
AI Agent(智能体)是当前大模型应用的重要发展方向,它超越了简单的「一问一答」模式,赋予 AI 系统自主规划、工具调用和多步推理的能力。与传统的聊天机器人不同,Agent 能够根据用户输入动态决定下一步行动——是查询知识库、调用外部 API,还是请求用户补充信息,这种自主决策能力使其能够处理远比简单问答复杂得多的业务场景。
可视化画布与组件库
点击"创建 Agent",RAGFlow 提供了多种预置模板,涵盖客服、数据分析等典型场景。以客服模板为例,系统提供了一个功能齐备的可视化画布,左侧是可拖拽的组件库,包含流程组件和大量第三方组件。

RAGFlow 的 Agent 工作流本质上是一种有向无环图(DAG)编排系统,每个节点代表一个处理步骤,节点之间的连线定义了数据流转和条件分支逻辑。这种可视化编排方式借鉴了低代码/无代码平台的设计理念,让非技术人员也能通过拖拽组件构建复杂的业务流程。
客服Agent工作流拆解
一个典型的客服 Agent 工作流如下:
- 开始组件:接收用户提问
- 问题优化:对用户原始问题进行语义优化,例如将口语化的表述转化为更精确的查询语句,补充上下文信息,从而提高后续检索的准确率
- 意图分类:判断问题类型——联系方式、随意对话、投诉、还是产品相关。这一步通常利用大模型的 Few-shot 能力,通过在提示词中提供少量示例来引导模型将用户输入归类到预定义的类别中,从而实现精准的流程路由
- 知识库检索:如果是产品相关问题,则进入知识库组件检索答案
- 回答生成:基于检索结果生成最终回复
可以看到,知识库只是整个客服流程中的一个环节。面对更复杂的场景,你可以引入多个知识库,甚至接入第三方 API 组件,实现真正的端到端业务自动化。这种架构的优势在于高度模块化——每个节点可以独立调试和替换,企业可以根据实际业务需求灵活组合不同的处理逻辑。
将Agent嵌入网站
Agent 流程定义完成后,可以点击运行进行测试。而它真正的价值在于嵌入到实际业务网站中。结合之前生成的 API Key,RAGFlow 会自动生成一段 HTML 嵌入代码。将这段代码复制到一个 HTML 文件中,用浏览器打开即可看到一个完整的对话界面。
从用户视角来看,它和普通的聊天窗口没有区别,但背后可能运行着极其复杂的 Agent 工作流——问题分类、多知识库检索、条件分支判断等逻辑全部自动执行。这正是 Agent 的强大之处。
RAGFlow核心优势与适用场景总结
RAGFlow 之所以能在 GitHub 上获得超过 5 万 Star 的关注,核心在于它解决了企业级 AI 应用的几个关键痛点:
- 文档解析精度高:采用深度文档理解技术,对复杂 PDF、表格等格式的处理能力领先同类工具,能够识别标题层级、表格结构等版式信息进行智能分块
- 知识可溯源:每个回答都能追溯到原始文档,增强可信度,满足金融、医疗、法律等高合规性行业的审计需求
- Agent工作流:基于 DAG 编排的可视化工作流系统,支持意图分类、条件分支、多知识库检索和第三方 API 调用,大幅降低 AI 应用的开发门槛
- 部署灵活安全:Docker 一键部署,数据完全存储在本地,满足数据安全需求,特别适合对数据主权有严格要求的企业和政府机构
对于个人用户而言,RAGFlow 可以帮你快速搭建个人知识库和智能助理;对于企业用户,它的 Agent 能力和 API 接口则提供了构建生产级 AI 应用的完整基础设施。如果你正在寻找一款开源的 RAG 解决方案,RAGFlow 绝对值得深入体验。
相关推荐
教程攻略Cursor+Codex双IDE协同:开源项目二开实战方法论
基于实战经验总结的开源项目二次开发完整方法论,详解Cursor+Codex双IDE协同工作流,涵盖二开七环节、MVP验证、AI读源码技巧,帮助开发者三天跑通项目、两周完成业务集成。
教程攻略Cursor多Agent实战:50分钟搭建Next.js全栈博客
使用Cursor IDE多Agent协作模式,50分钟内从零搭建全栈博客。涵盖Next.js、Clerk认证、Supabase数据库集成,详解4个AI Agent分阶段开发流程与关键避坑经验。
教程攻略从零搭建AI软件工厂:Cursor工程师的多Agent协作实战经验
Cursor工程师Eric分享AI软件工厂构建实战:从自动化六层级、护栏设计、并行Agent管理到规模化扩展,详解如何用多Agent协作实现7×24小时高效软件开发。