QuantBrain-Agent：用Qwen2.5-72B打造A股全链路自动化投研系统，每天9点准时出研报

当华尔街还在用Bloomberg Terminal手动翻K线的时候，有人已经让AI每天早上9点准时给你发研报了——而且还是「机构级」的那种。今天要聊的这个开源项目 QuantBrain-Agent，正是一套基于 Qwen2.5-72B-AWQ 大模型构建的A股全链路自动化投研系统，直指投研领域最头疼的三大问题：分析时效差、逻辑不全、数据难量化。

项目地址：SR88888888/quantbrain-agent

A股投研的三大痛点，到底有多痛？

做过A股研究的人都知道，传统投研流程有三个老大难问题：

分析时效差：分析师还没写完报告，股价已经涨停了。市场瞬息万变，手动搜集数据、整理逻辑、撰写报告的周期实在太长。
逻辑不全：不少研报只看了PE就敢喊买入，缺乏多维度的交叉验证和产业链上下游的关联分析。
数据难量化：「利好出尽是利空」这类市场情绪和定性判断，很难用结构化的数字去表达和建模。

QuantBrain-Agent 的野心不小——它要把整条投研链路自动化，相当于用AI替代了一个由数据分析师、行业研究员和报告撰写人组成的小团队。如果这套系统真能跑通，券商研究所的灯可能要早熄几个小时了。

核心技术架构：2024年AI热门论文的全家桶

这个项目的技术栈堆得相当扎实，几乎把近两年AI领域最前沿的技术做了一次全家桶套餐。我们一个个拆开来看。

Qwen2.5-72B-AWQ：大象塞进冰箱，还能正常跳舞

系统的核心推理引擎选用了阿里通义千问团队的 Qwen2.5-72B，这是一个拥有720亿参数的大型语言模型，语言理解和生成能力都很强。

但720亿参数意味着巨大的显存开销，直接部署成本极高。项目采用了 AWQ（Activation-aware Weight Quantization，激活感知权重量化） 技术来解决这个问题。AWQ 的核心思路很巧妙：不是所有权重对模型输出的影响都一样大。它通过观察模型推理时的激活值，找出哪些权重通道最关键，对这些重要权重做特殊保护，其余权重则大胆压缩到4bit精度。这样一来，模型体积大幅缩小，显存需求骤降，但精度损失却很小。

打个比方，就像把一头大象塞进了冰箱，但神奇的是大象还能正常跳舞。

LangGraph多智能体协作：给AI员工画工作流程图

单个AI再强，面对复杂的投研任务也力不从心。QuantBrain-Agent 用 LangGraph 框架编排了多个AI智能体的协作流程。

LangGraph 是 LangChain 团队开发的多智能体工作流框架，它把整个AI应用建模成一个有向图——节点代表不同的处理步骤或AI智能体，边代表流程走向，支持条件分支和循环。

本质上，这就是给一群AI员工画了张清晰的工作流程图：谁负责找数据、谁负责分析、谁负责写报告、谁负责挑刺，分工明确，各司其职。相比传统的线性链式调用，这种图结构能实现更复杂的协作模式，比如审核不通过就打回修改的循环流程。

LoRA垂直微调：给通用大模型上一堂A股速成班

通用大模型什么都懂一点，但在金融投研这个垂直领域，还不够专业。项目采用了 LoRA（Low-Rank Adaptation，低秩适配） 技术进行领域微调。

LoRA 的原理很优雅：传统微调要更新模型全部参数，成本极高。但研究发现，模型适配新任务时，权重的变化量其实是"低秩"的——可以用两个很小的矩阵的乘积来近似。所以 LoRA 冻结原始模型权重，只在每一层旁边插入两个小矩阵，训练参数量可以减少到原来的千分之一甚至万分之一。

这相当于给 Qwen2.5-72B 上了一堂A股速成班，让它从"什么都懂一点"变成"金融特别懂"——更熟悉金融术语、更擅长分析逻辑、更贴合A股市场的特点。

AWQ量化 + LoRA微调，这是一种很常见也很聪明的大模型部署策略：先用AWQ把大模型压缩到可部署的规模，再用LoRA进行领域适配，兼顾了部署成本和领域专业性。

MCP工具链：AI的万能遥控器

MCP（Model Context Protocol，模型上下文协议） 是 Anthropic 公司在2024年11月提出的开放标准协议，你可以把它理解为AI领域的"USB接口"。

通过MCP，大模型可以用统一标准化的方式调用各种外部工具——行情数据接口、新闻爬取工具、财务数据查询等等，不需要为每个工具单独写适配代码。在投研场景中，这意味着系统能随时调取最新的股价、财报、新闻等实时数据，而不是只靠训练时学到的"旧知识"。

CoT+ReAct：边想边查，查完再想

推理架构上，项目采用了 CoT（Chain of Thought，思维链） 和 ReAct（Reasoning + Acting，推理与行动结合） 的组合。

CoT 让模型不直接给结论，而是一步步展示推理过程，就像分析师在研报里写清楚从数据到结论的每一步逻辑。
ReAct 让模型在推理过程中交替进行"思考"和"行动"——想到需要什么数据就去查，查到新信息再继续分析，如此循环直到得出结论。

这两者组合起来，模型就不再是闭门造车拍脑袋出结论，而是像一个真正的研究员那样：边想边查、查完再想、想完再验证。

整套架构的设计哲学就是：一个AI不够用，那就上一群AI；还不够？那就让它们学会自己找资料和自我反省。

功能闭环：从数据采集到研报推送的完整链路

QuantBrain-Agent 不只是一个技术Demo，它构建了一条完整的投研生产线：

行情舆情实时采集

系统通过MCP工具链实时抓取市场行情数据和舆情信息，解决了传统投研中的"信息茧房"问题。不管是股价异动、政策变化还是社交媒体上的热点讨论，都能被纳入分析视野。

产业链知识图谱多维推演

这是整个系统最有意思的部分之一。知识图谱用"实体-关系-实体"的结构来组织知识，特别适合产业链关系的建模。

举个例子：锂矿涨价了，系统可以通过知识图谱快速追溯到所有受影响的电池厂、整车厂，甚至进一步推演到充电桩企业和储能板块。这种多维关联分析，是传统单线程研究很难做到的。

Reflexion反思审核：AI自己给自己挑毛病

最妙的设计是 Reflexion反思机制。系统生成研报后，不是直接输出，而是会进行自我评估和反思——检查逻辑是否完整、数据是否准确、结论是否合理。发现问题就自动修正，这个过程可以迭代多次。

Reflexion 的工作流程是：执行任务→自我评估→识别不足→存入记忆→重新执行。说白了，AI写完研报后还会自己审稿、自己挑毛病、自己改，这觉悟比某些实习生高多了。

每日9点定时产出，飞书自动推送

最终，系统每天早上9:00定时产出机构级专业研报，并自动推送到飞书。这个设定对基金经理来说简直是美梦——开盘前就能看到一份多维度分析的研报；但对卖方分析师来说，可能就不那么友好了。

项目提到的"定时产出+飞书推送"这个细节也说明，这不是一个停留在概念验证阶段的玩具项目，而是面向实际生产环境设计的系统。

技术选型背后的思考

回过头来看整个技术栈，有几个值得注意的设计选择：

CoT + ReAct + Reflexion 三位一体：CoT负责推理深度，ReAct负责与外部环境交互获取实时信息，Reflexion负责质量把控。三者形成了"推理-行动-反思"的完整闭环，这也是当前主流Agent架构的最佳实践。
AWQ + LoRA 的组合拳：先量化压缩降低部署门槛，再微调提升领域能力，这是一种兼顾成本和效果的务实策略。
LangGraph 而非简单的链式调用：投研任务天然需要多步骤、多角色的协作，图结构的工作流比线性流程灵活得多，尤其是在需要"审核-修改"循环的场景下。

写在最后

"quantbrain"这个名字——"量化大脑"——很好地概括了这个项目的定位：一个具备量化分析能力的AI智能体。它把大模型、多智能体、微调、量化、知识图谱等技术整合到金融投研这一垂直场景中，体现了当前AI应用从通用能力向行业深度落地的趋势。

当然，AI生成的研报能否真正达到"机构级"水准，还需要在实际使用中持续验证。但至少从技术架构的完整性和工程化程度来看，这个项目给出了一个相当有说服力的参考方案。

在AI时代，最可怕的不是机器比你聪明，而是机器比你勤快还比你会反思——它每天9点准时交作业，而你还在纠结今天的咖啡要不要加糖。

项目地址：https://github.com/SR88888888/quantbrain-agent

QuantBrain-Agent：用Qwen2.5-72B打造A股全链路自动化投研系统，每天9点准时出研报

QuantBrain-Agent：用Qwen2.5-72B打造A股全链路自动化投研系统，每天9点准时出研报

A股投研的三大痛点，到底有多痛？

核心技术架构：2024年AI热门论文的全家桶

Qwen2.5-72B-AWQ：大象塞进冰箱，还能正常跳舞

LangGraph多智能体协作：给AI员工画工作流程图

LoRA垂直微调：给通用大模型上一堂A股速成班

MCP工具链：AI的万能遥控器

CoT+ReAct：边想边查，查完再想

功能闭环：从数据采集到研报推送的完整链路

行情舆情实时采集

产业链知识图谱多维推演

Reflexion反思审核：AI自己给自己挑毛病

每日9点定时产出，飞书自动推送

技术选型背后的思考

写在最后

相关推荐

OpenClaw开源小龙虾AI Agent运作原理深度解析

Transformer本质解析：一个被拆解的文字接龙函数

Claude Code与普通AI对话的五大核心差异