当前位置:文档之家› 量化策略培训内部课程_常见量化投资数据源

量化策略培训内部课程_常见量化投资数据源

1)量化因子仓库 2)风控因子数据库
量化投资成功三要素“质量、经验、运气”,量化投 资对于数据的高质量要求首当其冲。
数据决定了量化投资各个环节——市场、标的、策略、 语言……
量化投资三部曲——数据准备(50%),策略编写 (30%),策略调优(20%)
3
金融信息分类
金融信息
• 数字形式
金融信息
• 政府机构
金融信息
• 宏观经济信息 • 技术面信息 • 金融衍生信息
股指/国债期 货交易量及仓
位状况
◇跨品种策略:似品种特征 的商品期货合约配对。
商品期货数据
商品期货品种 基本信息
商品期货交易 数据
商品期货交易 量及仓位状况
现货价格信息
国债期货
国债期货品种 基本信息
国债期货交易 数据
国债期货交易 量及仓位状况
国债价格信息
15
1.8 指数数据
指数数据反映其编制对象的总体情况。如:沪深300反应沪深市场
股票是量化投资最常用品种。股票投资策略一般包括:风格轮动 策略、行业轮动策略、资金流策略、动量反转策略和趋势跟踪策略等。 ◇风格轮动策略:根据市场/个股的发展阶段以及呈现出的风格特征进行选股买卖;
◇行业轮动:根据不同市场周期特征选择行业进行投资; ◇资金流策略:根据市场的资金流向进行选股配置; ◇动量反转趋势跟踪策略:根据股价的回复或趋势特征进行套利。
熊市行情时选用风险防御能力较强的非 周期性行业,代表:医药行业、公用事 业行业等。
主题类投资策略和事件驱动类投资策略, 如战争时期人们会偏向相关行业如军工 股、造船和机械等,科技繁荣时会偏向 互联网、电子等。
行业进 出口
风格轮动效应,不同市场发展阶段往往 呈现个别行业发展的相对优势。
行业概 况
• 包括上市公司的一些交易指标,如1月动量因子、EMA、换 手率和资金流量等,由于本节主要介绍上市公司财务数据, 因此不详细介绍技术因子方面的数据。
行为因子
• 需要研究消化公司的及时信息并将其转化为量化投资的信号
分析师预测因子
• 表征为市场情绪指标,情绪具有催化剂的作用,对于股市尤 其如此
11
1.4 股票数据
股票数据源
个股交易停复牌数据
个股回报率
日大宗交易数据
异常波动信息
复权信息
市场行情
12
1.5 基金数据
基金有广义和狭义之分,人们平常所说的基金主要是指证券投资基金。
基金一般可反映金融市场环境情况,如市场从业人员口中的“基金88 魔咒”是指公募基金整体仓位达到百分之88的高位时,往往大盘就会见顶回
落。
标准券折算比例
债券回购日交易信息
债券现期收益率
债券派息信息
企业债公司债主要财务 指标
14

1.7 期货数据
期货的投资策略可分为: 股指期货数据
1)单一品种策略 2)混合品种策略
股指/国债期 货基本信息数

◇单一品种策略:趋势跟踪、 动态反转和跨期套利等
股指/国债期 货交易数据
◇跨市场策略:商品期货与 现货之间的基差套利等
按形式分类
文本形式
按来源分类
公司公告
按内容分类
行业信息 行为偏差信息
机构和媒体信息
公司信息 高频数据信息
4
常见量化投资数据源
在金融量化投资领域,数据是人们研究金融现象的纽带和通道。策略 开发人员往往先应用历史数据对策略进行历史回验,策略调整至有效后 进行实盘交易。
• 1.基本面数据 • 2.历史高频数据 • 3.实时数据
基本面数据主要用于择时、选股等策略构建
择时策略包括趋势追踪策略、反转策略和市场情绪等 选股策略包括多因子策略、风格轮动策略、行业轮动策略等 配置策略包括套期保值策略和期现套利策略等
8
1.1 宏观数据
宏观数据体现了一个国家经济发展的现状。任何策略只要资产存在
风险暴露,则必然要考虑金融市场行情和宏观因素的影响。
行业数 据
行业产 品产量
行业经 济指标
10
1.3 公司数据
上市公司策略研究大多集中于从公司的财务指标或因子进行研究分析。 如:多因子选股策略需要财务数据源。
公司行情数据一般可分为基本面因子、技术因子、事件因子及分析师 预测因子。
基本面因子 技术因子
• 包括有公司财务方面的数据,如规模因子、估值因子、成长 因子、盈利因子和偿债能力因子。
数据源
数据供应商
• CSMAR • Wind • ....
• 客户端提取数据 • API提取数据
用户
5
目录
1
基本面数据源
2 历史高频数据源
3
实时数据源
4
数据提取方法
5
数据提供商
6
1 基本面数据源
1 基本面数据源
基本面数据包括宏观、行业、公司、股票、基金等9大类数据。
基本数据源
宏观 行业 公司 股票 基金 债券 期货 指数 衍生 数据 数据 数据 数据 数据 数据 数据 数据 数据
宏观数据
经国工行商消电就固居
济内
力业定民物景
指生业业品费工基资消价气
标产增增房品业本产费指指


加 值
加 值
销 售
零 售






比值
据况资平
牛市偏向成长类股票
熊市偏向于资产保值类股票
9
1.2 行业数据
行业数据代表中观市场情况
牛市行情时选用强劲的周期性行业,代 表:有色金属、钢铁、化工等
《量化投资分析》
常见量化投资数据源
量化投资的模块构建
公司盈利 模式设计
资金来源 -营销和融资
模型来源 -技术团队管理
金融信息概述
什么是金融信息? 金融信息是影响金融投资行为和金融市场发展的信息。 具有可度量、可处理、可存储性质; 具有海量、有效性、传染性、对资产价格产生影响等特点。
2
金融信息的重要性
的市场行情;农林牧渔行业指数反应农林牧渔行业的总体试产行情。 ◇被动型基金利用成分股按权重复制指数以获得市场平均收益率; ◇积极性基金在成分股组成的股票池进行资产配置,以获得超过市场平均
水平的收益。
指数基本信息
指数数据源
股票指数样本股基本信息
指数成份股权重数据
16
1.9 衍生数据
衍生数据可以提高金融市场投资者策略构建能力、策略绩效评估及 风险控制水平,能够反映和预测盈利能力。 量化投资研究常用的衍生数据库包括:
基金数据源
基金基本数据 基金净值数据 除权息数据 基金数据评价
回报率
资产配置
基金财务指标
13
1.6 债券数据
债券作为一种相对风险较低的品种,适合于风险规避行的投资者。
策略方法:采用债券品种进行套利,如不同到期债券之间的套利,同 一公司债券股票之间的套利,可转债与股票之间的套利。
债券数据源
债券基本数据
相关主题