当前位置:文档之家› 残差

残差

残差
编辑
简介
残差是指观测值与预测值(拟合值)之间的差,即是实际观察值与回归估计值的差。
1特征
2分析
1特征
编辑
在回归分析中,测定值与按回归方程预测的值之差,以δ表示。残差δ遵从正态分布N(0,σ2)。(δ-残差的均值)/残差的标准差,称为标准化残差,以δ*表示。δ*遵从标准正态分布N(0,1)。实验点的标准化残差落在(-2,2)区间以外的概率≤0.05。若某一实验点的标准化残差落在(-2,2)区间以外,可在95%置信度将其判为异常实验点,不参与回归直线拟合。
上述多个问题也许同时存在。除非你有直接或间接的证据来判断其性质,否则很难说清到底是哪种问题。但是,如果其中某些相关程度较高(如你的结果中有一对相关系数较高),反映了你的模型很可能存在着其它理论解释(alternative explanations),这时就很有必要报告一下,以提醒读者对本研究验证的模型保留一定的余地。
残差图
编辑
residual plot
指以残差为纵坐标,以任何其他指定的量为横坐标的散点图。
如在分析测试中常用的散点图是以自变量为横坐标的残差图。可用它来检查回归线的异常点。
残差图的评价
“残差图”以回归方程的自变量为பைடு நூலகம்坐标,以残差为纵坐标,将每一个自变量的残差描在该平面坐标上所形成的图形。当描绘的点围绕残差等于0的直线上下随机散布,说明回归直线对原观测值的拟合情况良好。否则,说明回归直线对原观测值的拟合不理想。
从“残差图”可以直观地看出残差的绝对数值都比较小,所描绘的点都在以0为横轴的直线上下随机散布,回归直线对各个观测值的拟合情况是良好的。说明变量X与y之间有显著的线性相关关系。
SEM中各个因变量(也叫内生因子)的残差(“残差”比你用的“误差”更准确一些)之间的相关关系(i.e., correlation between error variances of endogenous factors),由以下来源:由有关因变量之间本身的内在联系(这是理论问题、但也许不属于你的研究范围)所造成;由一至数个对这些因变量同时有影响、但没有被收入模型的“第三者”自变量所造成(即所谓model misspecification l问题);由相同的测量工具(如5-级态度量表)所造成(即存在若干common-method factors);由个别个案的极端值所造成(这是数据预处理的问题)等等。
显然,有多少对数据,就有多少个残差。残差分析就是通过残差所提供的信息,分析出数据的可靠性、周期性或其它干扰。
2分析
编辑
“残差”蕴含了有关模型基本假设的重要信息。如果回归模型正确的话,我们可以将残差看作误差的观测值。它应符合模型的假设条件,且具有误差的一些性质。利用残差所提供的信息,来考察模型假设的合理性及数据的可靠性称为残差分析。残差有多种形式,上述为普通残差。为了更深入地研究某一自变量与因变量的关系,人们还引进了偏残差。此外,还有学生化残差、预测残差等。以某种残差为纵坐标,其它变量为横坐标作散点图,即残差图,它是残差分析的重要方法之一。通常横坐标的选择有三种:(1)因变量的拟合值;(2)自变量;(3)当因变量的观测值为一时间序列时,横坐标可取观测时间或观测序号。残差图的分布趋势可以帮助判明所拟合的线性模型是否满足有关假设。如残差是否近似正态分布,是否方差齐次,变量间是否有其它非线性关系及是否还有重要自变量未进入模型等。.当判明有某种假设条件欠缺时,进一步的问题就是加以校正或补救。需分析具体情况,探索合适的校正方案,如非线性处理,引入新自变量,或考察误差是否有自相关性。[1]
相关主题