当前位置:文档之家› 量化投资-用机器学习寻找Alpha

量化投资-用机器学习寻找Alpha

用机器寻找Alpha
xinhua.sun@
目录
• 量化投资的基本概念
– 什么是Alpha?
• 机器学习在资产管理中应用 • Signal Weighting
– Lasso/Ridge Regression vs. OLS – AdaBoost
量化投资
• 定性投资和量化投资在投资理念上没有本质上的区 别,只是投资方法不同 • 定性投资:
单个因子 分析
因子之间 的优化
常见因子池
基本面 • 市净率 • 市盈率 • 企业估值倍 数 • 企业负债率 • 等等 技术 • 动量趋势 • 价格反转 • 流动性 • 波动率 • 等等 其他风格 • 规模 • 成长 • 分析师 • 等等
机器学习
• 基于数据构建概率统计模型并运用模型对数据进 行预测与分析的一门学科,也称为统计机器学习
• • • • •
OLS & Lasso & Ridge Regression AdaBoost SVM RandomForest …
OLS & Lasso & Ridge Regression
OLS的问题
Ridge Regression & Lasso
Model selection in Lasso
股票因子 定价模型

• •
依据国外学术界和业界多年研究发明的股票定价多因子模 型 已经在海外市场被广泛应用并得到充分验证 A股市场非常适合运用多因子模型来挖掘股票投资价值
• • • 以基本面为导向的估值因子 以技术分析为导向的股票走势技术因子 以及其他风格因子 • 综合多维度因子:综合考量单 因子贡献度,以及因子之间的 相关性/互补性
AdaBoost
动 态 多 因 子 算 法 流 程
风格可测性
回测结果
参考资料
• [1] 李航. 《统计学习方法》2012.3 • [2] 兴业证券. 聪明的Alpha,机器觉醒! • [3] Grinold & N.Kahn 《Active Portfolio Management》 • Thanks to ElecQuant Team!
谢谢 !
Copyright © 2016 DataYes. All rights reserved

保密文件,请勿外泄
Alpha的解释
• Alpha (a) 指的是投资回报中来自投资经理选 股的一部分,而不是来自于基准表现 • Alpha 也指“剩余收益” • 如果我们规定b=1, 则禁止标的指数择时, Alpha就是主动收益(传统做多投资目标)
• 如果将基准设定等于某一计价单位(例如: 美元),那么alpha=主动回报=超额收益和 投资经理资产配置(对冲基金投资目标)
机器学习在投资中的应用
• 信息处理
– – – – 公告阅读 关联关系 主题发现 情感分析
• 策略研究
– 事件研究 – 动态多因子
• 财富管理
– 机器人理财 – 资产配置
机器学习 & 策略研究
• 寻找新的因子
– 探索新的数据源(特别是信噪比高的数据)
• 因子配权 Signal Weighting
– 固定权重
• Lasso算出来的w很多项是0 • 参数估计和选择一并完成
AdaBoost简介
• 监督学习、分类问题 • 弱分类器比强分类器容易 • Boosting方法
– 从弱学习算法出发,反复学习,得到一系列弱分类器,然后组合 这些弱分类器,构成一个强分类器
• Why AdaBoost
– – – – 模型机制与原理清晰 模型参数少,参数敏感度低 每一轮如何改变训练数据的权值或概率分布 如何将弱分类器组合成一个强分类器
AdaBoost算法流程
训练样本 因子数据标准化 按收益率区分强势弱势股 权重初始化为等权重 计算因子区分度 选择区分度最优的因子 降低分类正确的股票权重 提高分类正确的股票权重
弱分类器
权重调整
强分类器
合并所有的弱分类器
示例
来源:浅谈AdaBoost算法
细节处理
• 经验和主观偏好 • 稳定,对极端值不敏感 • 抓不住短期风格变化
– 动态多因子
• 对于短期风格变化敏感 • 对于极端值敏感
Signal Weighting
• 假设我们已经有了多个不同风格因子的集合, 如何确定因子在模型中的权重(因子收益率) • 固定权重
– 根据经验 – Grinold(2010)
– 偏艺术 – 深入研究 – 少而精
• 定量投资:
– 偏科学 – 发掘市场规律 – 广度
• 用统计规律和数学模型来指导投资,本质是定性投 资的数量化实践
对冲基金常用量化策略
收敛性套利
常 用 的 量 化 策 略
市场中性Alpha 事件驱动 统计套利 多空策略 CTA
风 险 +
Alpha
假设任何有价证券的超额收益都来自于以下模型: r = a + b rb 那么 ra = r – rb = a + b rb - rb = a -(1- b) rb 其中 a = 主动收益的选股部分 (b - 1) rb = 主动收益的基准择时部分
市场性Alpha
• 国内常用的市场中性策略做法:
构建一个股票组合(多因子 模型)
放空一个指数(沪深300,中证500……)
风险收益来源于股票组合 相对于指数的表现,与指 数本身的表现无关
多因子模型
• A股市场由于散户的参与量大,价格与价值往往偏差较大,因此A股市 场非常适合运用多因子模型来挖掘股票投资的价值
相关主题