一元线性回归效果的显著性检验
(相关系数检验法)
为了检验两个变量x、y 之间是否具有显著的线性关系,我们介绍了一元线性回归效果的显著性检验(F检验法),这里我们介绍另一种检验方法-相关系数检验法.
为了检验假设:H0:b=0 ,H1:b≠0 .
根据样本观测数据(x i, y i)(i=1,2,…,n),由一元线性回归中未知参数的最小二乘估计中的结论知回归直线方程为:
其中, ,
,
,
.
令,
此统计量称为相关系数.
而回归平方和:
,
误差平方和:
=L yy(1-r2).
[其中是回归值与其平均值的离差平方和,而,可以把看成是由于x的变化而引起的y值变化,因此称之为回归平方和;
反映的是观测值与回归值之间的离差平方和,它表示除x对y的线性影响之外的一切因素引起的y值的变化,称之为误差平方和或残差平方和.]
不难看出,•由于Q≥0,L yy≥0,故1-r2≥0,即0≤|r|≤1.
|r|越接近1,Q越小,回归方程对样本数据的拟合程度越好;反之,|r|越接近0,Q 越大,回归方程对样本数据的拟合程度越差.
下面利用散点图具体说明,当r取各种不同数值时,散点分布的情形,见下图.
具体说明如下:
(1)当r=0时,L xy=0,因此,回归直线平行于x轴,说明y的取值与x无关.注意,此时x与y可能存在其他非线性关系.
(2)当|r|=1时,Q=0,从而y=这时所有的点都在回归直线上,此时x与y存在确定的线性函数关系,称x与y完全线性相关.
(3)当0<|r|<1时,x与y存在一定的线性关系.若r与L xy同号,则r>0,>0,称x与y正相关:若r与L xy异号,则r<0,<0,称x与y负相关.
当0<|r|<1时,x与y线性相关.但只有当r的绝对值大到一定程度时,才能认为x与y线性关系密切.此时,我们认为相关系数是显著的,所求的回归直线方程才有意义,否则无意义.|r|究竟大到什么程度时,才算x与y线性关系为密切呢?
对于给定的显著性水平α,查相关系数临界值表(附录6),可得临界值rα(n-2),使得
.
因此其拒绝域是W={|r| > rα(n-2)}.
由样本观测值计算统计量r的观测值r0,若|r0|≥rα(n-2),则应拒绝H0,即x与y 之间线性关系显著;否则认为x与y之间的线性关系不显著或根本不存在线性关系,回归方程没有实用价值.这种检验方法称为相关系数检验法.
例3.10.5试用相关系数检验法检验例3.10.1中回归直线方程的效果.(α=0.05)解.根据题意,要检验的假设为
H0:b=0 ,H1:b≠0 .
例3.10.1.某种合成纤维的强度与其拉伸倍数之间有一定关系,下表是实测24个纤维样品的强度y与相应的拉伸倍数x的数据记录.试求出它们之间的关系.
编号拉伸倍数x强度y编号拉伸倍数x强度y
1 2 3 4 5 6 7 8 91.9
2.0
2.1
2.5
2.7
2.7
3.5
3.5
4.0
1.4
1.3
1.8
2.5
2.8
2.5
3.0
2.7
4.0
13
14
15
16
17
18
19
20
21
5.0
5.2
6.0
6.3
6.5
7.1
8.0
8.0
8.9
5.5
5.0
5.5
6.4
6.0
5.3
6.5
7.0
8.5
回归直线方程的计算步骤(I)
19
20
21
22
23
24 8.0
8.0
8.9
9.0
9.5
10.0
6.5
7.0
8.5
8.0
8.1
8.1
64.00
64.00
79.21
81.00
90.25
100.0
42.25
49.00
72.25
64.00
65.61
65.61
52.00
56.00
75.65
72.00
76.95
81.00
Σ127.5 113.1 829.61 650.93 731.6 回归直线方程的计算步骤(II)
, , n=24 ,
, ,
, , ,
,
,
,
,
.
所以所求回归直线方程为:
.
又n=24 , α=0.05 ,
L xx=152.2663,
L xy=130.7563,
L yy=117.9463.
查相关系数临界值表得
0.3809<rα(n-2)=r0.05(22)<0.4227.
而,
显然|r0|=0.9757>r0.05(22).
所以拒绝H0,接受H1,即x与y之间的线性关系是显著的.
附录6 相关系数显著性检验表。