数据分析中常见问题的解决方案及心得体会
论坛君:在数据分析实践中,你遇到过这样的问题吗?你们的标准误差算对了吗?回测过程中的过度拟合问题怎
么解决?聚类分析时的极端值又该怎么处理呢?快来看今
天的文章吧,马上告诉你答案。
你们的标准误差(standarderror)算对了吗?(附程序)
大家都知道,当残余相是独立同分布(iid)时,OLS的标准误差是无偏的(unbiased),但是当残余相与观测值相关时,此标准误差就不再无偏了,需要做相应的调整。
这里向大家介绍一篇Northwestern大学教授MitchellPeterson在顶级权威刊物ReviewofFinancialStudies 上发表的文章(EstimatingStandardErrorsinFinancePanelDataSets:ComparingApproaches,2009),专门探讨标准误差在不同面板数据结构中的调整。
据他统计,即使是在专业刊物上发表的文章:
'42%的文章没有对标准误差进行必要的调整。
'剩下的58%的文章做了调整。
1.其中,34%用了Fama-MacBeth方法,
2.29%用了虚拟变量(dummyvariable),
3.7%用OLS计算回归系数但用Newy-West方法对标准误差
做调整,
4.23%则报告了群集标准误差(clusteredstandarderror)
那么,到底哪种处理方法是正确的呢?本篇文章给出了指导意见。
简单来说,在二维的面板数据里包含了'企业固定效应'(firmfixedeffect)和'时间效应'(timeeffect)。
'在只具有'企业固定效应'的面板数据中,OLS和
Fama-MacBeth方法的标准误差都会被低估,建议使用群集标准误差(clusteredstandarderror)。
'在只具有'时间效应'的面板数据中,建议使用Fama-MacBeth 方法。
最新文件---------------- 仅供参考--------------------已改成word文本--------------------- 方便更改。