当前位置：文档之家› 数据分析中常见问题的解决方案及心得体会(优.选)

数据分析中常见问题的解决方案及心得体会(优.选)

数据分析中常见问题的解决方案及心得体会
论坛君：在数据分析实践中，你遇到过这样的问题吗？你们的标准误差算对了吗？回测过程中的过度拟合问题怎
么解决？聚类分析时的极端值又该怎么处理呢？快来看今
天的文章吧，马上告诉你答案。

你们的标准误差（standarderror）算对了吗？（附程序）
大家都知道，当残余相是独立同分布（iid）时，OLS的标准误差是无偏的（unbiased），但是当残余相与观测值相关时，此标准误差就不再无偏了，需要做相应的调整。

这里向大家介绍一篇Northwestern大学教授MitchellPeterson在顶级权威刊物ReviewofFinancialStudies 上发表的文章（EstimatingStandardErrorsinFinancePanelDataSets：ComparingApproaches，2009），专门探讨标准误差在不同面板数据结构中的调整。

据他统计，即使是在专业刊物上发表的文章：
'42%的文章没有对标准误差进行必要的调整。

'剩下的58%的文章做了调整。

1.其中，34%用了Fama-MacBeth方法，
2.29%用了虚拟变量（dummyvariable），
3.7%用OLS计算回归系数但用Newy-West方法对标准误差
做调整，
4.23%则报告了群集标准误差（clusteredstandarderror）
那么，到底哪种处理方法是正确的呢？本篇文章给出了指导意见。

简单来说，在二维的面板数据里包含了'企业固定效应'（firmfixedeffect）和'时间效应'（timeeffect）。

'在只具有'企业固定效应'的面板数据中，OLS和
Fama-MacBeth方法的标准误差都会被低估，建议使用群集标准误差（clusteredstandarderror）。

'在只具有'时间效应'的面板数据中，建议使用Fama-MacBeth 方法。

最新文件---------------- 仅供参考--------------------已改成word文本--------------------- 方便更改。

e商务文档

数据分析中常见问题的解决方案及心得体会(优.选)

相关文档推荐：