量化交易系统完整进化：从多用户隔离到AI交易Agent实战

引言

构建一个真正可用的量化交易系统，远不止写几个策略脚本那么简单。从数据隔离、审计日志，到交易经验系统、AI Agent自动决策，再到LLM调用的统一管控——每一层都是将系统从「玩具」推向「生产级」的关键一步。

本文梳理了一位开发者对其量化交易系统的多轮迭代过程，涵盖用户隔离、策略分析、交易经验沉淀、AI Agent决策以及LLM网关等核心模块的设计思路与实现细节。

交易Agent系统概览

多用户隔离与审计日志：生产级系统的基石

资源归属模型设计

在系统早期，所有用户共享同一份数据，这在多人使用场景下显然不可接受。为了解决这个问题，系统将资源划分为两大类：

用户独占资源（工作空间）：策略、模拟账户、Agent运行时配置、回测记录等，通过添加 user_id 字段实现隔离。查询时根据用户ID过滤，确保不同用户之间互不干扰。
系统共享资源：新闻、事件、信号、K线等市场数据，所有用户共同使用。

这种划分思路非常清晰——市场数据本身是客观的，不需要重复存储；而策略和交易记录则高度个人化，必须严格隔离。

审计日志的必要性

多用户环境下，公共资源的操作需要可溯源。系统引入了审计日志模块，记录「哪个用户在什么时间做了什么操作」，尤其针对删除信号、删除新闻等敏感操作。这是企业级系统的标配，也是出问题时快速定位责任的关键手段。

同时，前端菜单也进行了重新分类，从原来的三个副菜单扩展为：仪表盘、数据中心、策略中心、交易中心、智能体分析中心、系统设置。模块职责更加清晰，避免单一菜单承载过多功能。

策略分析与多账户模拟：数据驱动的策略验证

策略级数据分析

系统此前缺少对策略效果的量化分析能力。新增的策略分析模块提供了两个层次的统计：

全局统计：汇总所有策略的总收益、平均胜率，并自动筛选出表现最强的策略。
单策略详情：针对每个策略的收益曲线、每笔交易的详细记录进行统计和筛选。

有了这些数据支撑，用户能够用数据说话，而不是凭感觉判断策略好坏。

多账户模拟的闭环设计

单一模拟账户无法满足同时验证多个策略的需求。系统支持了多账户创建功能，用户可以为不同策略分配独立的模拟账户。在运行管理中，可以指定某个策略驱动哪个账户进行模拟交易，不同账户的数据同样是隔离的。

这形成了一个完整的策略验证闭环：

创建策略 → 绑定模拟账户 → 运行模拟交易 → 分析策略表现 → 优化策略

交易经验系统：让AI像人类一样复盘成长

设计理念

这是整个迭代中最有思想深度的部分。其核心洞察在于：人类主观交易的核心能力来自不断交易、不断复盘、不断积累经验的过程。要实现真正有效的自动化交易，必须用编码将这种「经验沉淀」的思想落地。

经验数据结构

每条交易经验包含以下关键字段：

类型：策略模式、事件模式、风险、市场环境、信号等
标题与摘要：经验的具体内容描述
标签与关联信息：便于检索和关联
状态：有效/失效
评分（自信度）：经验的可靠程度

自信度的动态调整机制

这里引入了一个类似强化学习的反馈机制：

当AI依赖某条经验做出了正确的交易，该经验的自信度上升
当AI依赖某条经验做出了错误的交易，该经验的自信度下降
当自信度降到某个阈值以下，该经验自动标记为失效
用户也可以手动将经验标记为失效

这种设计让系统具备了自我进化的能力——好的经验会越来越被信任，差的经验会逐渐被淘汰。

交易Agent：从信号到决策的自动化闭环

Agent的决策流程

交易Agent处于整个交易链路的关键位置。完整流程为：

新闻生成信号 → 策略过滤 → Agent评估 → 执行交易

Agent在评估环节会综合考虑多个维度：

经验库：参考历史积累的交易经验
当前仓位：判断是否超出健康水平（风控）
信号质量：评估信号本身的可靠性
风险等级：对高风险信号直接拒绝

实际运行效果

从Agent的运行日志可以看到，它拒绝了大量信号——即使某些信号评分很高，但因为仓位已高于健康水平，Agent也会果断拒绝。对于风险等级高或信号质量低的情况，同样直接过滤。只有综合评估通过的信号才会被执行。

这种「宁可错过，不可做错」的保守策略，恰恰是成熟交易者的典型特征。从账户表现来看，Agent的收益率优于其他随机交易的账户，初步验证了经验系统+Agent决策的有效性。

强化学习式的工作流

Agent交易完成后，会反过来修改经验库中的相关经验——这形成了一个完整的强化学习循环：

经验指导决策 → 决策产生结果 → 结果反馈修正经验 → 更好的经验指导更好的决策

这种闭环机制是交易Agent区别于简单规则引擎的核心所在。

LLM网关：AI调用的统一管控

为什么需要LLM Gateway

系统中有大量调用LLM接口的场景（新闻分析、信号生成、Agent决策、经验总结等），每次调用都有成本。LLM网关的核心职责包括：

请求频次控制：防止过度调用导致成本失控
Token消耗统计：精确追踪每次请求的Token用量
缓存命中：相同请求避免重复调用，节省开支
日志记录：包括请求模型、Request ID、是否命中缓存、Token消耗等
成本预估：统计今日消耗和预计花费

前端的AI运行中心页面提供了直观的监控面板，让用户对LLM的使用情况一目了然。对于任何依赖大模型的生产系统来说，这种统一管控层都是不可或缺的。

总结与思考

经过多轮迭代，这个量化交易系统已经从一个简单的策略回测工具，进化为一个具备用户隔离、审计追踪、多账户模拟、AI经验沉淀、自动化Agent决策和LLM成本管控的完整平台。

其中最值得借鉴的设计思想是交易经验系统——它将人类交易者「复盘-积累-成长」的认知过程进行了系统化的编码实现，配合自信度的动态调整机制，让AI Agent具备了持续进化的能力。这种思路不仅适用于量化交易，在任何需要AI进行持续决策的场景中都有参考价值。

一个真正可用的AI交易系统，需要的远不止模型能力，更需要工程化的系统设计和持续的迭代打磨。从用户隔离到经验沉淀，从Agent决策到成本管控，每一个模块都在回答同一个问题：如何让AI系统在真实环境中可靠地运行？