Qlib专为AI而生的量化投资平台
1、三层
Infrastructure层
该层为量化研究提供了基础支持。Data Server模块为用户管理和检索原始数据提供了高性能的基础架构。Trainer模块提供了灵活的接口来定义模型的训练过程,同时也为分布式训练提供了接口。Model Manager模块可以让用户更好地管理繁多的AI模型,更快地迭代其AI算法。
Workflow层
该层涵盖了量化投资的整个工作流。Information Extractor模块为模型提取数据。Forecast Model侧重于为其他模块产生各种预测信号====(如Alpha信号、风险信号),利用这些信号,Portfolio Generator模块将生成目标投资组合,并由Order Executor模块执行交易。Meta Controller模块就是在解决不同时期调整模型、策略、执行的问题,辅助用户进行操作。
Interface层
交互层是为底层系统提供一个友好的界面。Analyser模块为用户提供详细的预测信号、投资组合和执行结果的分析报告。
一些信息
- 网址:https://github.com/microsoft/qlib/ 15.8K星
- 所有模块均可灵活配置
- Qlib支持Python3,可以在Windows和Linux下运行。Qlib也需要lightgbm和pytorch包的支持。
1、量化投资流程(Workflow)
- 分析模块(Analyzer)
会根据下层的预测信号、仓位、执行结果做出详细的分析并呈现给用户。 - 信息抽取模块(Information Extractor)
负责从异构数据中提取有效的信息,因为用 AI 进行投资分析数据是关键,尽管金融行业有一定的数据基础,但 AI 模型可以直接使用的高质量数据仍然十分有限,所以这就需要更多精细化处理和信息抽取。 - 预测模型(Forecast Model)会输入抽取的信息,输出可供金融专家参考的未来收益、风险等等预测,然而预测模型需要依靠底层海量数据才能训练出精准、有效的预测模型。
- 投资组合生成模块(Portfolio Generator)则能根据预测得到 Alpha 信号和风险信号辅助生成投资策略组合。
- 订单执行模块(Order Executor)是投资的最后一步——交易执行,帮助用户判断何时下单也是一门艺术。
2、数据
- 数据层面,Qlib 提供了基于领域知识设计的多个跨市场的数据集。
- 其数据服务模块中内含了为金融数据专门设计的表达式计算引擎,对金融数据和运算进行了存储和计算优化。相比传统 IT 平台,Qlib 的计算性能要快数十倍,可以让用户的 AI 模型更轻松地驾驭更多的数据。
- 数据的使用方面,AI 模型与传统模式也有很大不同,传统量化投资的信息抽取依赖于金融行业研究员根据经验和领域知识实现的因子,但 AI 算法则有能力自动从数据中抽取信息。对此,Qlib 的数据管理框架未来会满足 AI 模型所特有的使用方式。
3、算法与模型
Qlib 目前内置了常见的金融 AI 模型(例如== LightGBM、GRU、GATs 等十几个模型==),用户可以基于平台和自己的数据甚至是引用的最新的外部论文去创建全新的模型,挖掘差异化的投资因子,针对不同的数据和目标训练相应的预测模型并构建自己的投资组合。如果用户愿意分享自己的模型,也可以开源到 Qlib 平台,与更多业内人士共享。
- Qlib 提供了专门的模型管理器模块(Model Manager)
帮助用户更加系统化地管理自己的 AI 模型。只有管理有序,才能在需要的时候找到最适合的模型,提高预测分析的效率和准确率。
Qlib 支持的数据集和 AI 模型(持续更新中), 点击以下链接,一键“跑遍”所有模型https://github.com/Microsoft/qlib/blob/main/examples/run_all_model.py