《量化投资用机器学习寻找Alpha课件.pptx》由会员分享,可在线阅读,更多相关《量化投资用机器学习寻找Alpha课件.pptx(28页珍藏版)》请在三一办公上搜索。
1、用机器寻找Alpha,2022/12/2,1,目录,量化投资的基本概念什么是Alpha?机器学习在资产管理中应用Signal WeightingLasso/Ridge Regression vs. OLSAdaBoost,2022/12/2,2,量化投资,定性投资和量化投资在投资理念上没有本质上的区别,只是投资方法不同定性投资:偏艺术深入研究少而精定量投资:偏科学发掘市场规律广度用统计规律和数学模型来指导投资,本质是定性投资的数量化实践,2022/12/2,3,对冲基金常用量化策略,常用的量化策略,收敛性套利,市场中性Alpha,事件驱动,统计套利,多空策略,CTA,风险 +,2022/12/
2、2,4,Alpha,假设任何有价证券的超额收益都来自于以下模型:r = a + b rb那么ra = r rb = a + b rb - rb = a -(1- b) rb其中a = 主动收益的选股部分(b - 1) rb = 主动收益的基准择时部分,2022/12/2,5,Alpha的解释,Alpha (a) 指的是投资回报中来自投资经理选股的一部分,而不是来自于基准表现Alpha 也指“剩余收益”如果我们规定b=1, 则禁止标的指数择时,Alpha就是主动收益(传统做多投资目标)如果将基准设定等于某一计价单位(例如:美元),那么alpha=主动回报=超额收益和投资经理资产配置(对冲基金投资
3、目标),2022/12/2,6,市场中性Alpha,国内常用的市场中性策略做法:,构建一个股票组合(多因子模型),放空一个指数(沪深300,中证500),风险收益来源于股票组合相对于指数的表现,与指数本身的表现无关,2022/12/2,7,多因子模型,A股市场由于散户的参与量大,价格与价值往往偏差较大,因此A股市场非常适合运用多因子模型来挖掘股票投资的价值,股票因子定价模型,单个因子分析,因子之间的优化,依据国外学术界和业界多年研究发明的股票定价多因子模型已经在海外市场被广泛应用并得到充分验证A股市场非常适合运用多因子模型来挖掘股票投资价值,以基本面为导向的估值因子以技术分析为导向的股票走势技
4、术因子以及其他风格因子,综合多维度因子:综合考量单因子贡献度,以及因子之间的相关性/互补性,2022/12/2,8,常见因子池,2022/12/2,9,机器学习,基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称为统计机器学习,2022/12/2,10,机器学习在投资中的应用,信息处理公告阅读关联关系主题发现情感分析策略研究事件研究动态多因子财富管理机器人理财资产配置,2022/12/2,11,机器学习 & 策略研究,寻找新的因子探索新的数据源(特别是信噪比高的数据)因子配权 Signal Weighting固定权重经验和主观偏好稳定,对极端值不敏感抓不住短期风格变化动态多
5、因子对于短期风格变化敏感对于极端值敏感,2022/12/2,12,Signal Weighting,假设我们已经有了多个不同风格因子的集合,如何确定因子在模型中的权重(因子收益率)固定权重根据经验Grinold(2010)OLS & Lasso & Ridge RegressionAdaBoostSVMRandomForest,2022/12/2,13,OLS & Lasso & Ridge Regression,多因子策略固定权重稳定,对极端值不敏感抓不住短期风格变化回归法 OLS对于短期风格变化敏感对于极端值敏感 , = 0 + 1 1 + 2 2 + min 2 2,2022/12/2,
6、14,2022/12/2,15,OLS的问题,对于 min 2 2 ,其解析解为 = ( ) 1 Almost singularX的轻微扰动造成 的巨大变化不合理加入正则项,2022/12/2,16,Ridge Regression & Lasso,Ridge Regression优化目标: min 2 2 + 2 2 其中0Lasso优化目标: min 1 2 2 + 1,2022/12/2,17,Model selection in Lasso,Lasso算出来的w很多项是0参数估计和选择一并完成,2022/12/2,18,AdaBoost简介,监督学习、分类问题弱分类器比强分类器容易Bo
7、osting方法从弱学习算法出发,反复学习,得到一系列弱分类器,然后组合这些弱分类器,构成一个强分类器Why AdaBoost模型机制与原理清晰模型参数少,参数敏感度低每一轮如何改变训练数据的权值或概率分布如何将弱分类器组合成一个强分类器,2022/12/2,19,AdaBoost算法流程,训练样本,弱分类器,权重调整,强分类器,因子数据标准化按收益率区分强势弱势股权重初始化为等权重,计算因子区分度选择区分度最优的因子,降低分类正确的股票权重提高分类正确的股票权重,合并所有的弱分类器,2022/12/2,20,示例,来源:浅谈AdaBoost算法,2022/12/2,21,细节处理,训练样本集
8、数据准备:以横截面上因子去极值+行业内标准化之后的值为输入按收益率排序,前后30%分别记为1,其余为噪声组合构建行业中性行业按照市值权重加权,2022/12/2,22,AdaBoost动态多因子算法流程,2022/12/2,23,风格可测性,2022/12/2,24,回测结果,2022/12/2,25,参考资料,1 李航. 统计学习方法2012.32 兴业证券. 聪明的Alpha,机器觉醒!3 Grinold & N.Kahn Active Portfolio ManagementThanks to ElecQuant Team!,2022/12/2,26,谢谢 !,2022/12/2,28,