第一讲 逐步回归分析讲解
2 1 4 2
A(0)
1
1.5
3
4
4
3
10
5
0.5 0.5 2 1
A(1)
0.5
1
1 3
2
1 2 1
1.5-1×0.5=1 3-1×2=1 4-1×1=3
0.5-0.5×(-0.5)=0.75 2-0.5×1=1.5 1-0.5×3=2.5
SS
1b1
SP12 b2
SP13b3
SP1y
SP21b1 SS 2b2 SP23b3 SP2 y
SP31b1 SP32b2 SS 3b3 SP3y
2b1 1b2 4b3 2 1b1 1.5b2 3b3 4 4b1 3b2 10b3 5
x5
y,%
68.6
70.9
62.2
66.7
57.3
60.5
56.7
60.5
58.0
58.9
x
17.2
13.3
10.3
64.4
62.5
63.4
s
4.1
3.8
4.4
7.0
5.6
3.8
一、计算相关系数阵
1、计算各变量的平均数(为表1—1) 设自变量x1,x2,…,xm与依变量y存在线性关系,m元线性回归 方程为:
由x估测y的估计值 yˆ 的直线回归方程: yˆ =a+bx
第一节 逐步回归分析的基本方法
逐步回归分析的基本方法可以通过一个实例介绍其分析步骤。 例1 为考察舍内干球温度(x1)、湿球温度(x2)、露点温度(x3)、相对湿 度(x4)及舒适度指数(x5)对罗曼蛋鸡产蛋率(y)的影响。随机抽测12个位点 各64只鸡在56—67周令的平均周产蛋率如表1—1。
-0.5-1×(-1.5)=1 1-1×(-1)=2 3-1×(-2)=5
a (3)
3 1
1.5
1 2 1
1.5 1 1
2.5 5 2
b1=2.5 b2=5 b3=-2
预备知识
生物各性状间的关系是相互依赖和相互制约的关系,改变某一性状,即会引起 另一性状也发生变异。而生物现象数量的表现多半是随机的,因此对现象关系的 研究亦就是对随机变量关系的研究。对随机变量关系的研究,在统计学中有相关 分析和回归分析两种不同的方法。相关分析是研究变量间的相互之间关系,研究 变量间相互联系的性质和紧密程度。回归分析是研究一个变量对另一个变量的单 向依存关系,即研究一个变量随另一个变量变化而变化。这里,后一个变量叫自 变量,前一个变量叫依变量或应变量。变量间的相关关系及分析方法归纳如下:
yˆ b0 b1x1 b2 x2 bm xm
b0 y b1x b2 x2 bm xm
(1—1) (1—2)
若有n对观察值: xk1,xk2,…,xkm,yk, k=1,2,…,n
则各变量平均数:
n
x
1 n
xki
1
i=1,2,…,m
(1—3)
n
y
1 n
第一讲 逐步回归分析
STEPWISE REGRESSION ANALYSIS
在多元线性回归分析时,为建立一个较为简化又能准确预测依 变量的最优回归方程,通常是逐个剔除复回归方程中经检验对y影 响不显著的所有自变量。这种先全部引入,后逐个剔除的方法,也 是建立最优回归方程的一种分析法。此类分析法还很多,它们多适 用于自变量个数较少,或大多数自变量对y有显著影响的资料分析。 否则,计算量将大大增加。目前较为常用的逐步回归分析法是按自 变量与y影响程度的大小,逐个地由大至小将自变量引入回归方程。 而每引入一个自变量,都要对方程中的各个自变量作显著性检验。 检验时先选偏回归平方和最小的自变量进行检验,若为显著,余者 皆为显著;若检验差异不显著,即从方程中剔除,直至留在方程中 的自变量均检验为显著后,再引入另一个与y影响最大的变量,并 进行显著性检验。如此反复,直至没有自变量可再被引入,而方程 中所有自变量均与y存在显著的线性关系为止。
称x变量的平方和;
SSy (y y)2 y 2 ( y)2 / n
称y变量的平方和;
SPxy
(x
x)( y
y)
xy
x n
y
称乘积和(sum of products)。
回归系数
b (x x)(y y) SPxy
(x x)2
SS x
a y bx
表1—1各变量的观察值、平均数及标准差 n=12
周令
56 57 58 ┇ 65 66 67
x1,℃
22.1 17.4 20.1 ┇ 13.8 13.0 13.4
x2,℃
16.7 12.6 15.7 ┇ 9.4 9.4 10.7
x3,℃
13.3 9.0 12.5 ┇ 5.2 6.4 8.3
x4,%
58.4 58.6 60.2 ┇ 58.0 60.4 71.2
相关系数
r COV xy SxSy
式中
(x x)(y y)
n 1
(x x)2 ( y y)2
n 1
n 1
(x x)(y y) (x x)2 ( y y)2
SPxy SSx SS y
SSx (x x)2 x 2 ( x) 2 / n
yk
1
(1—4)
本例计算结果列于表1—1。
2、计算离差阵 自变量平方和ssi,自变量间及其与依变量间的乘积和SPij及SPiy由下式算出:
0.75 0.5 1.5 0.5 0.75-1.5×(-1.5)=3
A(2) 0.5 1 1.5 1
1 1
3 2
-0.5-1.5×(-1)=1 -0.5-1.5×(-2)=2.5
3-4×0.5=1 10-4×2=2 5-4×1=1
-2-1×(-0.5)=-1.5 2-1×1=1 1-1×3=-2
简单相关分析
直线相关分析
正相关:两变量同长同 负相关:两变量此长彼
消 消
平衡关系(相关分析)
曲线相关分析
相关关系
多元相关分析
复相关分析 偏相关分析
因果关系(回归分析)多一元元回回归归分分析析
直线回归分析 曲线回归分析 多元线性回归分析 多元非线性回归分析