
{{aisd}}
AI生成 免责声明
本报告从多个视角深入探讨基于相关性的因子优化的背后逻辑。理论视角下,从量化策略全局最优出发,得出拟合估计收益率和实际收益率在可行集上投影的夹角是正确的选择,而优化IC可证明与其等价;可视化视角下,相关性作为优化目标更适合区分不同因子的重要性和方向性;模型行为视角下,模型通过学习因子间的对冲关系来实现更稳定的超额收益。经组合优化后,2012年以来回测相对中证500指数年化超额收益13.39%,信息比率2.63,较直接选取前100只股票有进一步提升。
▍前言:
在报告《多因子量化选股系列专题研究—破局低信噪比:基于深度学习的因子优化研究》(2021年11月23日)中,我们提出了基于相关性的目标函数。为了提升对于其背后的逻辑和模型行为的理解,本报告从三个视角——理论视角、可视化视角和模型行为视角继续深入探讨,并且补充了经组合优化后的策略测试结果。
▍理论视角:优化IC等价于优化投影向量夹角。
1)最优组合是关于估计收益率的函数:从量化策略全局最优出发,将实现的量化策略的与最优量化策略的收益之差作为损失函数,则损失取决于最优组合,而最优组合受估计收益率影响;
2)最优组合只与估计收益率的方向有关,而均方误差对于实际收益率的模也进行了拟合,导致信噪比降低;
3)根据夹角余弦值的两种计算方式可证明优化IC等价于优化投影向量夹角。
▍可视化视角:相关性更关注向量方向。
假定因子与收益之间符合线性模型,采用模拟数据观察。采用均方误差作为损失函数时,函数曲面的等高线是类似的同心椭圆形;而采用相关性时,函数曲面的等高线是过原点的射线,表明相关性更适合区分不同因子的重要性和方向性。
▍模型行为视角:学习因子间的对冲关系。
1)因子数据及其处理流程。采用了基本面、估值等共计21个因子。因子和下期收益均转化为行业市值中性化的排序分位数;2)通过求网络输出值对因子的一阶偏导可观察因子对输出值的影响。EP5年分位数、北向持有占比以及净资产收益率(TTM)对于网络输出值的影响最大,并且模型还学习到在EP5年分位数与净资产收益率(TTM)之间构建对冲关系来实现更稳定的超额收益。
▍组合优化下的模型回测。
1)5种基线系统。构造了等权加权、历史IC加权、最大化历史IC、最大化IC_IR、和Loss1神经网络5个基线系统用于比较。
2)模型测试:采用与上篇报告同样的股票打分进行组合优化来测试深度相关性模型(DCM),控制市值和行业的风险暴露在0.1%以内,个股偏离限定在1%以内。在2012年1月1日至2022年1月19日的测试区间上,DCM策略实现13.39%的年化超额收益,信息率2.63,超额最大回撤5.02%。并且信息率较选取前100股票实现的 2.31有进一步提升。
▍结论与投资建议:
对基于相关性的因子合成提出了理论基础并进行了实证验证。文中提出的可视化方法和求偏导观察因子影响的方法也可作为投资者分析模型的重要手段。
▍风险因素:
训练的随机性风险、因子效果衰减风险、历史业绩不代表未来表现。
(作者为中信证券量化策略首席分析师)