伦敦证券交易所AI转型:33PB数据如何驱动智能金融分析

引言
在金融服务领域,AI的落地应用正在从实验阶段迈向规模化部署。伦敦证券交易所集团(LSEG)作为全球金融市场基础设施和数据提供商,服务着全球44,000家客户,覆盖170个市场。其集团分析与AI负责人Emily Prince在OpenAI的活动中分享了LSEG的AI转型历程,揭示了一家百年金融机构如何在快速变化的技术浪潮中找到平衡点。
LSEG的历史可追溯至1698年Jonathan's Coffee House中的股票交易活动,经过三百多年的发展,已成为全球最重要的金融市场基础设施之一。LSEG不仅运营伦敦证券交易所本身,还拥有意大利证券交易所(Borsa Italiana)、富时罗素指数(FTSE Russell)、LCH清算所等核心资产。2021年LSEG以270亿美元完成对Refinitiv的收购——这是金融数据行业有史以来最大的交易之一——使LSEG从传统的交易所运营商转型为综合性金融数据与分析服务商,直接与彭博终端形成竞争。这次收购使其数据业务收入占比超过70%,从一家以交易费用为主要收入的交易所转型为以数据订阅为核心商业模式的金融科技公司,与彭博(Bloomberg)、S&P Global、FactSet等形成直接竞争。Refinitiv的前身是汤森路透的金融与风险业务部门,拥有Eikon终端、Datastream等标志性产品。这次收购为LSEG带来了海量的金融数据资产,但也带来了数据整合的巨大挑战——而这正是其AI战略的出发点。



LSEG Everywhere:AI战略的核心理念
从数据孤岛到统一智能平台
LSEG的AI战略被命名为"LSEG Everywhere",核心理念是:无论用户在哪里工作、使用什么工具,都应该能够锚定在可信的金融信息之上。这不仅仅是对信息的通用摘要,而是要实现工作方式的真正变革。
Emily Prince指出,LSEG经历了多次收购,积累了大量不同的数据模型和系统。仅数据与分析业务就拥有超过33PB的数据。要理解这个规模,美国国会图书馆的全部数字化馆藏约为15PB。LSEG的数据涵盖实时市场报价、历史交易记录、公司财务报表、ESG评级、新闻资讯、另类数据等多个维度,来自全球170个市场,包括股票、债券、外汇、大宗商品、衍生品等各类资产。
金融数据的价值不仅在于体量,更在于其结构化程度、时效性和覆盖广度。LSEG的33PB数据包括:实时行情数据(每秒处理数百万条价格更新)、参考数据(证券主数据、公司层级结构)、历史时间序列(部分可追溯至19世纪)、公司事件数据(分红、拆股、并购)、ESG评分(覆盖超过12,000家公司)、新闻与研究报告、另类数据(卫星图像、船舶追踪、专利数据等)。这些数据的整合难度在于:不同来源的数据使用不同的标识符体系(如SEDOL、ISIN、RIC)、不同的时区和交易日历、不同的数据质量标准,需要复杂的数据治理和实体解析技术来统一。
数据的时间跨度从数十年的历史数据到毫秒级的实时行情,构成了金融决策的基础信息层。如何将这些分散的数据资产统一起来,并以可扩展的方式服务内部团队和外部客户,是他们面临的核心挑战。
MCP协议:打通金融数据的关键一步
LSEG与OpenAI合作,通过Model Context Protocol(MCP)实现了数据的统一接入。MCP是Anthropic于2024年底开源的一项协议标准,旨在解决大语言模型与外部数据源之间的连接问题。在MCP出现之前,每个AI应用要接入不同的数据源都需要定制化的集成方案,导致大量重复工程。MCP提供了一个标准化的"通用接口",类似于USB-C对硬件设备的统一作用——通过MCP,AI模型可以安全地查询数据库、调用API、访问文件系统,而无需为每个数据源编写专门的适配代码。OpenAI在2025年将MCP支持集成到ChatGPT中,使得第三方数据提供商可以直接将其数据服务嵌入ChatGPT的对话界面。
从技术架构来看,MCP采用客户端-服务器模式,其中AI应用作为客户端,数据源作为服务器。MCP定义了三种核心原语:Resources(数据资源,如文件或数据库记录)、Tools(可执行的操作,如API调用或查询)、Prompts(预定义的交互模板)。与传统的API集成相比,MCP的优势在于:第一,它是模型无关的,同一个MCP服务器可以被不同的AI模型调用;第二,它支持动态发现,AI模型可以在运行时了解可用的数据源和工具;第三,它内置了安全和权限控制机制。对于LSEG这样拥有数百个数据产品的机构,MCP意味着只需构建一次标准化的数据服务层,即可被所有支持MCP的AI平台访问,大幅降低了集成成本。
这意味着用户可以直接在ChatGPT中提出具体的金融问题、生成报告,而这些回答都基于LSEG的可信数据,而非泛泛的通用信息。
更重要的是,这种接入是"即插即用"的——没有长达六个月的数据对接流程,没有庞大的项目工程,用户可以直接在电子表格中生成过去需要数小时才能完成的分析内容。Emily坦言,这种效率提升"既令人兴奋,又有点让人沮丧"——因为它让人意识到过去花了多少时间在低效的工作上。
从实验到规模化:AI评估框架的构建
千花齐放之后的战略收敛
Emily用"从千花齐放到可扩展影响"来描述LSEG的AI演进路径。在早期实验阶段,组织内部涌现了大量独立的AI项目。但要实现真正的规模化,必须建立系统性的评估框架。
她强调,评估框架(evaluation framework)是她每天提及频率最高的词汇之一。这个框架需要回答几个关键问题:
- 我们在解决什么问题?
- 对于不同的团队(财务、营销、产品、工程、客户端的IBD、投资组合管理、研究分析),成功分别是什么样子?
- 如何在所有应用场景中保持质量标准?
这里值得展开说明IBD和投资组合管理的具体工作场景。IBD(Investment Banking Division,投资银行部)是投行中负责并购顾问、IPO承销、债务融资等业务的核心部门,分析师的日常工作包括制作pitch book(推介材料)、构建财务模型、进行可比公司分析和先例交易分析,这些工作高度依赖数据获取和文档生成。投资组合管理则涉及资产配置、风险监控、绩效归因等环节,需要持续跟踪数百甚至数千只证券的表现。这两类角色都面临严重的信息过载问题,是AI赋能的典型场景。
超越模型选择的系统性思维
你可能没注意到,LSEG的评估体系超越了单纯的模型选择。他们关注的是不同应用场景下的成功标准,以及如何在规模化部署中维持一致的质量水平。API策略的通用性和模型选择的灵活性,使他们能够快速迭代而不被锁定在单一技术路径上。
金融分析师工作流的AI变革
核心痛点:信息过载与时间约束
对于金融分析师而言,AI解决的核心问题是信息获取的广度与深度之间的矛盾。分析师理想状态下希望获取所有相关信息,尤其是那些"略微正交"的洞察——它们往往能带来差异化的分析视角和竞争优势。
但现实是,每个人的时间都是有限的。长期以来,分析师不得不将自己"条件化"为只从特定的信息源获取数据。AI的介入改变了这一局面:分析师可以从更丰富的来源中提取信息,同时通过内置的标准、政策和偏好设置来维持质量标准。
从小时级到实时级的分析迭代
LSEG是首批在ChatGPT中上线应用的金融机构之一,为分析师和客户创建了新的交互界面。过去需要数小时甚至数天的分析迭代周期,现在可以在实时对话中完成。这不仅是效率的提升,更是工作模式的根本性转变。
这种"工作流压缩"现象正在金融行业广泛发生。摩根大通CEO Jamie Dimon曾表示AI可能将每周工作时间缩短至3.5天。高盛的研究报告估计,生成式AI可能影响金融服务业约35%的工作任务。具体而言,过去一份equity research报告的撰写可能需要分析师团队一周时间,涉及数据收集、模型更新、同行比较、报告撰写等多个环节。AI介入后,数据收集和初稿生成可在数分钟内完成,分析师的角色从"信息搬运工"转向"洞察验证者"和"判断决策者"。
工作流压缩不仅是效率问题,更将深刻重塑金融行业的人才金字塔。传统投行的层级结构(分析师→经理→副总裁→董事→董事总经理)部分建立在信息处理的劳动密集型特征之上——初级分析师负责数据收集和模型搭建,高级人员负责判断和客户关系。当AI承担了大量初级工作后,行业面临的问题是:如何培养下一代高级人才?如果年轻分析师不再经历"手工搭建模型"的训练过程,他们能否发展出足够的金融直觉?这也是为什么LSEG强调AI应"赋能"而非"替代"——保持人在回路中(human-in-the-loop)不仅是合规要求,也是人才发展的需要。
治理与文化:AI规模化的两大支柱
负责任AI原则:赋能而非束缚
LSEG在两年前就开始系统性地构建负责任AI原则和治理框架。Emily强调,他们的目标不是"给人戴上手铐",而是创建一个安全的脚手架,让团队能够在其中自由创新。
这一治理框架的构建需要放在金融行业特殊的监管背景下理解。在欧盟,《人工智能法案》(AI Act)将信用评分、保险定价等金融AI应用归类为"高风险"系统,要求进行合规性评估和人工监督。美国SEC和FINRA也在加强对AI驱动投资建议的监管审查。英国FCA采取了更为原则导向的方法,强调AI系统的可解释性和公平性。此外,巴塞尔银行监管委员会也在研究AI对银行业资本充足率模型的影响。金融机构还需遵守数据隐私法规(如GDPR)、模型风险管理指引(如美联储SR 11-7)以及反洗钱(AML)合规要求。对于LSEG这样的全球性机构,需要同时满足多个司法管辖区的监管要求,这使得治理框架的设计必须具备足够的灵活性和适应性。这意味着金融机构的AI治理框架不能简单照搬科技公司的做法,必须将监管合规作为核心设计原则。
具体做法是:不创造全新的规则体系,而是审视端到端的构建和服务流程,识别需要适配的环节,并将治理嵌入日常工作流中。随着工作流压缩(从十人团队缩减到一两人在更短时间内解决问题),确保治理和流程仍然被嵌入其中,是一个持续演进的课题。
文化转型:从恐惧到积极参与
在Emily看来,AI采纳更多是文化问题而非技能问题。她观察到,那些真正"飞跃"的人,共同特征是开放的心态和积极的实验精神。但与兴奋并存的,往往是恐惧和对AI的误解。
LSEG的应对策略包括三个层次:
- 赋能:确保每个人都能使用ChatGPT和MCP等工具
- 教育:提供系统性的学习项目
- 实践:从意识培养转向动手构建,解决具体而非泛泛的问题
对金融行业的启示
没有蓝图的自我颠覆时代
Emily在总结中提出了一个深刻的观点:当前是金融行业"自我颠覆"的最佳时机。过去20年积累的繁重流程和工作方式,很多并非出于设计,而是历史演化的结果。现在应该勇于追问:这个流程真的有监管要求必须如此吗?还是我们可以重新发明它?
她坦言,这个时代没有现成的蓝图可循——没有一本书、一个先例可以参考。所有人都在同时学习和创造。这种不确定性本身,恰恰是机遇所在。
结语
LSEG的案例展示了大型金融机构AI转型的典型路径:从战略定位(LSEG Everywhere)到技术基础设施(MCP和API策略),从评估框架到治理体系,从文化变革到持续迭代。在这个"没有蓝图"的时代,保持开放心态、建立灵活框架、快速迭代验证,或许是最务实的前进方式。
核心要点
核心要点
相关推荐

Codex编程智能体全解析:和ChatGPT到底有什么区别?
深入解析OpenAI Codex编程智能体的核心能力,对比Codex与ChatGPT在编程场景中的本质区别,帮助开发者理解AI编程智能体如何改变软件开发模式。

Databricks开源Omni:统一管理所有AI Agent的元框架
Databricks以Apache 2.0协议开源Omni项目,通过元框架统一管理Claude Code、Codex等多个AI Agent。支持统一会话、跨供应商交叉审查、安全策略强制执行和实时协作,彻底解决多Agent协同与供应商锁定问题。

一句话提示词生成10款网页游戏:Claude Code实战体验
资深开发者用Claude Code命令行工具,仅凭一句话自然语言提示词,在一小时内生成2048、五子棋、俄罗斯方块等10款可玩网页游戏并部署上线。深度解析AI编程的真实能力与局限。