1. 仅涉及利润表(或现金流量表)指标或仅涉及资产负债表指标(无需平均)时:所有指标取最近报告期值即可2. 仅涉及利润表(或现金流量表)指标或仅涉及资产负债表指标(需平均)时:资产负债表平均指标=(期初值+最近报告期值)/2,其他指标取最近报告期值3. 同时涉及利润表(或现金流量表)指标和资产负债表指标(无需平均)时:资产负债表非平均指标直接取最近报告期值;利润表或现金流量表的指标,需乘以年化调整系数进行处理,一季度年化系数为4,二季度为2,三季度为4/3,四季度为1.4. 同时涉及利润表(或现金流量表)指标和资产负债表指标(需平均)时:资产负债表平均指标=(年初值+本期期末值)/2;利润表或现金流量表的指标,需乘以年化调整系数进行处理,一季度年化系数为4,二季度为2,三季度为4/3,四季度为1.•LTM:后缀为LTM的因子表示该因子计算所需指标的取值逻辑为LTM1. LTM因子同时涉及利润表(或现金流量表)指标和资产负债表指标时:利润表指标取最近12个月数值;资产负债表指标取平均值,平均值=(本期报告值+上年同期值)/22. LTM因子仅涉及利润表和现金流量表指标时:利润表和现金流量表指标取最近12个月数值。
财务因子数据映射说明由于财务数据一般每季度公布一次,且通常会延迟公布(一季度与上一年四季度数据一般在今年4月底全部公布,二季度在8月底公布,三季度在10月底公布),所以将季度数据转换为更高频率数据时采用以下逻辑:•1、2、3月底采用上一年Q3的数据;Ⅱ. 因子目录1. 数据概览单因子有效性评价首页为数据概览界面,基本参数设置同上,该界面呈现如下内容:•近12期所选股票池的因子值分布箱形图•近12期所选股票池的收益率分布箱形图•近12期股票覆盖率序列图(股票覆盖率:即每期被纳入到选股范围的股票占股票池所有股票的百分比)•单期因子值分布直方图•单期股票收益率和因子值散点图•单期各档收益率分布:横轴为按照所选‘因子方向’排序后划分为10组,纵轴为每组内股票收益率的分布箱形图又称为盒须图,如上图所示,自上而下分别为离群点(异常值)、上界(最大值)、上四分位数、均值、中位数、下四分位数、下界(最小值)。
2 . IC分析信息系数相关算法•图-因子自相关序列:即所有股票当期因子值与滞后i期因子值的相关系数;首先,计算每期因子暴露值和之后i期的因子值的相关系数,其中,i=1,2,...,12;其次,分别对因子每隔i期的相关系数计算均值。
3 . 收益率分析收益率相关指标算法4 .换手率分析换手率算法5 . 选股结果6 . 月历效应金融市场与日期联系密切,有季节效应、月历效应、星期效应、假日效应等。
月历效应,即因子在不同月份表现有所差异,Wachtel在1942年首次提出著名的“一月效应”,此后众多学者研究发现,大多数国家的股价指数1月份的收益率明显高于其他月份。
•因子月历效应页面,按月份展示各年各月的收益率情况,通过横向纵向对比,可进一步研究因子的月历效应;•因子年度表现,呈现该因子各年度的信息系数、收益率、换手率等相关指标(详见算法说明)。
Ⅳ因子对比Ⅴ因子收藏等;Ⅶ算法说明单因子评价算法逻辑因子数据获取与处理流程:•根据回测起始日期确定所涉及到的财报报告期;•根据起始日期与调仓频率确定回测期间的调仓期(具体的日期);•根据调仓期与财务数据映射原则确定所用到财报报告期;•跟据用户输入的参数从数据库中提取原始数据,原始数据有三个维度:报告期,股票名,因子值;•对原始数据进行去极值和标准化处理;•将原始数据的频率转换至用户设定的调仓周期。
MAD去极值处理去极值算法的主要目的是为了使因子数据在一个合理的范围之内。
去极值的方法主要有两种:MAD去极值法和标准差去极值法,主要区别是对极值定义不一样。
f′i=⎧⎩⎨f m+nf MAD f m−nf MAD f i if f i>u+nf MAD if f i<f m−nf MAD iff m−nf MAD<f i< f m+nf MAD.fi′={fm+nfMADif fi>u+nfMADfm−nfMADif fi<fm−nfMADfiiffm−nfMAD<fi<fm+nfMAD.f m为f i序列中位数fm为fi序列中位数f MAD为|f i−f m|的中位数fMAD为|fi−fm|的中位数标准化处理标准化处理使得每个报告期的所有因子的横截面数据都在一个固定范围内,处理的逻辑是用每个元素减去均值再除以标准差,主要有普通标准化和行业标准化,区别是因子暴露值的均值和标准差计算方式不同,行业标准化需要分别计算各股票所在行业的因子值的均值和标准差。
f i=f rawi−uσfi=firaw−uσf i为标准化后的修正值fi为标准化后的修正值f rawi:原始数值firaw:原始数值u:f i序列均值u:fi序列均值σ:f i序列标准差σ:fi序列标准差IC信息系数IC(Information Coefficient,信息系数):•normalIC,即某时点某因子在全部股票的暴露值与其下期回报的截面相关系数;normalIC=corr(factor t−1,return t)normalIC=corr(factort−1,returnt) factor t−1为t-1期的因子值factort−1为t-1期的因子值return t为t期的因子收益率returnt为t期的因子收益率•rankIC,即某时点某因子在全部股票暴露值排名与其下期回报排名的截面相关系数;rankIC=corr(order factort−1,order returnt)rankIC=corr(ordert−1factor,ordertreturn)order factort−1为各股票t-1期的因子值排名ordert−1factor为各股票t-1期的因子值排名order returnt为各股票t期的因子收益率排名ordertreturn为各股票t期的因子收益率排名因子收益率相关指标平均收益率R avg=1t∑i=1t R t Ravg=1t∑i=1tRtt为总样本期数t为总样本期数R t为因子t期的当期收益率Rt为因子t期的当期收益率累计收益率R cumt=Π((1+R1)⋯(1+R t))−1Rtcum=Π((1+R1)⋯(1+Rt))−1年化收益率R annual=(Π(1+R1)⋯(1+R t))Nt=(R cumt+1)Nt Rannual=(Π(1+R1)⋯(1+Rt))Nt=(Rtcum+1)NtN为一年调仓次数N为一年调仓次数t为总样本期数t为总样本期数最大盈利、最小盈利Bestmonth=max(R t)Bestmonth=max(Rt)Worstmonth=min(R t)Worstmonth=min(Rt)R t为因子t期的收益率Rt为因子t期的收益率最大回撤(Drawdown)最大回撤:在选定样本周期内任一历史时点往后推,资产价格走到最低点时的收益率回撤幅度的最大值。
最大回撤用来描述买入资产后可能出现的最糟糕的情况。
Drawdown t={0NET t−min j≥t NET j NET t if NET t=min j≥t NET j else Drawdownt={0if NETt=minj≥tNETjNETt−minj≥tNETjNETtelseNET为某期净值NET为某期净值MaxDrawdown=max(Drawdown t)MaxDrawdown=max(Drawdownt)标准差(年化)波动率,即组合收益率的方差,波动率越大,则风险越高。
Volatility=N×∑i=1T(R i−R¯)2T−1−−−−−−−−−−−−−−−⎷Volatility=N×∑i=1T(Ri−R¯)2T−1R i为{组合收益率}Ri为{组合收益率}R¯为组合收益率均值R¯为组合收益率均值T为样本期数,N为一年调仓次数T为样本期数,N为一年调仓次数下行标准差(年化)s=N×∑R i≺R¯(R i−R¯)2T−1−−−−−−−−−−−−−−−−⎷s=N×∑Ri≺R¯(Ri−R¯)2T−1R i为组合收益率Ri为组合收益率R¯为组合收益率均值R¯为组合收益率均值T为样本期数,N为一年调仓次数T为样本期数,N为一年调仓次数超额收益R excesst=R t−I t Rtexcess=Rt−ItR t为因子t期收益率Rt为因子t期收益率I t为基准指数t期收益率It为基准指数t期收益率年化超额收益excessR annual=R annual−I annual excessRannual=Rannual−IannualR annual为因子年化收益率Rannual为因子年化收益率I annual为基准指数年化收益率Iannual为基准指数年化收益率最大、最小超额收益BestExcess=maxR excesst BestExcess=maxRtexcessWorstExcess=minR excesst WorstExcess=minRtexcessCAPM Alpha ,BetaCAPM Alpha 和Beta由因子某组收益率序列对指数同期收益率做一元线性回归得到:Alpha即每组收益相对于回测选股基准收益的Alpha值,表示风险调整后的超额收益,其中,风险用Beta衡量;Beta,即每组收益相对于回测选股基准收益的Beta值,表示该组收益相对于基准指数的波动性大小,该值大于1表示该组收益波动性大于样本,反之,则波动性小于样本;R t=Alpha+Beta∗I t Rt=Alpha+Beta∗It跟踪误差(Tracking Error)跟踪误差即超额收益的年化标准差;TE=∑t=1T(R t−I t)2T−1−−−−−−−−−−−⎷TE=∑t=1T(Rt−It)2T−1T为样本观测期T为样本观测期R t为因子t期收益率Rt为因子t期收益率I t为基准指数t期收益率It为基准指数t期收益率胜率(Hit Ratio)胜率即在整个样本期内,组合收益率战胜市场平均收益率的次数占整个样本期的比率胜率越大,有效性越显著。
HitRatio=num(R i>M i)T HitRatio=num(Ri>Mi)Tnum(R i>M i)为组合收益率战胜市场平均收益率的次数num(Ri>Mi)为组合收益率战胜市场平均收益率的次数夏普比率(Sharp Ratio)夏普比率,表示每承受一单位风险,会产生多少超额报酬,这里风险被定义为波动率,即组合收益的标准差。