相关与回归区别与联系 Document number:NOCG-YUNOO-BUYTT-UU986-1986UT
直线回归与相关的区别和联系
1.区别:
①资料要求不同:直线回归分析中,若X 为可精确测量和严格控制的变量,则对应于每个X 的Y 值要求服从正态分布;若X 、Y 都是随机变量,则要求X 、Y 服从双变量正态分布。
直线相关分析要求服从双变量正态分布;
②应用目的不同:说明两变量间相关关系用相关,此时两变量的关系是平等的;说明两变量间的数量变化关系用回归,用以说明Y 如何依赖于X 的变化而变化;
③指标意义不同:r 说明具有直线关系的两变量间相互关系的方向与密切程度;b 表示X 变化一个单位时Y 的平均变化量; ④计算不同:YY XX XY l l l r /=,XX XY l l b /=;
⑤取值范围不同:?1≤r ≤1,∞<<∞-b ;
⑥单位不同:r 没有单位,b 有单位。
2.联系:
① 二者理论基础一致,皆依据于最小二乘法原理获得参数估计值; ② 对同一双变量资料,回归系数b 与相关系数r 的正负号一致。
b >0与r
>0,均表示两变量X 、Y 呈同向变化;同理,b <0与r <0,表示变化的趋势相反;
③ 回归系数b 与相关系数r 的假设检验等价。
即对同一双变量资料,
r b t t =。
由于相关系数较回归系数的假设检验简单,在实际应用中,常以相关系数的假设检验代替回归系数的假设检验;
④ 用回归解释相关。
由于决定系数总回归SS SS R /2=,当总平方和固定时,
回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则2R 越接近1,说明引入相关的效果越好。
例如,当r =,n =100
时,按检验水准拒绝0H ,接受1H ,认为两变量有相关关系。
但2R ==,表示回归平方和在总平方和中仅占4%,说明两变量间的相关关系实际意义不大。