当前位置:
文档之家› 第一讲 逐步回归分析_PPT幻灯片
第一讲 逐步回归分析_PPT幻灯片
ss1b1 sp12b2 sp1mbm sp1y
sp21b1 ss2b2 sp2mbm sp2y
spm1b1 spm2b2 ssmbm spm y
本例m=5,n=12 算得:
18.94b116.67b218.84b372.20b425.1b5 13.65
1186..8647bb11 1185..618bb22
1.5 1 1 2 -0.5-1.5×(-2)=2.5
3-4×0.5=1 10-4×2=2 5-4×1=1
-2-1×(-0.5)=-1.5 2-1×1=1 1-1×3=-2
-0.5-1×(-1.5)=1 1-1×(-1)=2 3-1×(-2)=5
3 1 1.5 2.5
a(3)
1
2 1 5
1.5 1 1 2
在逐步回归中,为便于计算和表达,通常将离差阵化为相关阵,计算公式为:
rij=spij/(ssissj)1/2 i、j=1,2,,x2,…,xm,y间的相关系数,且rii=1,于是正规方程组(1—8)可改
写为:
r11p1 r12p2 r1mpm r1y
r21p1 r22p2 r2mpm r2y
第一讲 逐步回归分析
STEPWISE REGRESSION ANALYSIS
在多元线性回归分析时,为建立一个较为简化又能准确预测依 变量的最优回归方程,通常是逐个剔除复回归方程中经检验对y影 响不显著的所有自变量。这种先全部引入,后逐个剔除的方法,也 是建立最优回归方程的一种分析法。此类分析法还很多,它们多适 用于自变量个数较少,或大多数自变量对y有显著影响的资料分析。 否则,计算量将大大增加。目前较为常用的逐步回归分析法是按自 变量与y影响程度的大小,逐个地由大至小将自变量引入回归方程。 而每引入一个自变量,都要对方程中的各个自变量作显著性检验。 检验时先选偏回归平方和最小的自变量进行检验,若为显著,余者 皆为显著;若检验差异不显著,即从方程中剔除,直至留在方程中 的自变量均检验为显著后,再引入另一个与y影响最大的变量,并 进行显著性检验。如此反复,直至没有自变量可再被引入,而方程 中所有自变量均与y存在显著的线性关系为止。
18.61b312.35b423.25b5 10.51 21.92b318.83b426.31b5 10.34
72.20b112.35b218.38b353.09b414.12b5 77.5
25.1b123.52b226.31b314.21b434.49b5 17.15
(1—8) (1—9)
3、计算相关系数阵
(1—5)
n
S i jP (x k ix i)x k ( jx j) x kx k i j x k ix kn j i、j=1,2,…,m,i≠j (1–6) 1
n
S i y P ( x k ix i)y k ( y ) x ky k i x k iy kn
1
(1—7)
于是可得正规方程组
rm1p1 rm2p2 rmmpm rmy
(1—11)
本例由公式(1-10)算得:
p10.976p220.931p320.228p470.994p540.7910 00..993716pp1122 0p.2980.79p2587pp335 00..545258pp4473 00..999634pp5562 00..65661155 0.228p170.428p230.555p37p40.327p550.2648 0.994p140.993p260.964p320.327p45p5 0.7325
若有n对观察值: xk1,xk2,…,xkm,yk, k=1,2,…,n
则各变量平均数:
n
x
1 n
1
xki
i=1,2,…,m
(1—3)
n
y
1 n
1
yk
(1—4)
本例计算结果列于表1—1。
2、计算离差阵 自变量平方和ssi,自变量间及其与依变量间的乘积和SPij及SPiy由下式算出:
n
SiS (xk i xi)2 xk 2 i ( xk)i2n 1
简单相关分直析线相关分负 正析相 相关 关: :两 两变 变量 量此 同消 消长 长彼 同
平衡关(系 相关分)析
曲线相关分析
相关关系
多元相关分复 偏析相 相关 关分 分析 析
因果关(系 回归分)析 多 一元 元回 回归 归分 分曲 多 多 直 析 析线 元 元 线回 非 线 回归 线 性 归分 性 回 分析 回 归 析归 分分 析析
b1=2.5 b2=5 b3=-2
预备知识
生物各性状间的关系是相互依赖和相互制约的关系,改变某一性状,即会引起 另一性状也发生变异。而生物现象数量的表现多半是随机的,因此对现象关系的 研究亦就是对随机变量关系的研究。对随机变量关系的研究,在统计学中有相关 分析和回归分析两种不同的方法。相关分析是研究变量间的相互之间关系,研究 变量间相互联系的性质和紧密程度。回归分析是研究一个变量对另一个变量的单 向依存关系,即研究一个变量随另一个变量变化而变化。这里,后一个变量叫自 变量,前一个变量叫依变量或应变量。变量间的相关关系及分析方法归纳如下:
SS1b1 SP12b2 SP13b3 SP1y SP21b1 SS2b2 SP23b3 SP2y SP31b1 SP32b2 SS3b3 SP3y
2b1 1b2 4b3 2 1b1 1.5b2 3b3 4 4b1 3b2 10b3 5
A(0)
2 1
1 1.5
4 3
2 4
4 3 10 5
一、计算相关系数阵
1、计算各变量的平均数(为表1—1) 设自变量x1,x2,…,xm与依变量y存在线性关系,m元线性回归 方程为:
y ˆ b 0 b 1 x 1 b 2 x 2 b m x m (1—1)
b 0 y b 1 x b 2 x 2 b m x m (1—2)
0.5 0.5 2 1
A(1)
0.5
1
1 3
2 1 2 1
1.5-1×0.5=1 3-1×2=1 4-1×1=3
0.5-0.5×(-0.5)=0.75 2-0.5×1=1.5 1-0.5×3=2.5
0.75 0.5 1.5 0.5 0.75-1.5×(-1.5)=3 A(2) 0.5 1 1 3 -0.5-1.5×(-1)=1