当前位置:文档之家› [课件]第一讲 逐步回归分析PPT

[课件]第一讲 逐步回归分析PPT

第一讲 逐 步回归分析
第一讲 逐步回归分析 STEPWISE REGRESSION ANALYSIS
在多元线性回归分析时,为建立一个较为简化又能准确预测依 变量的最优回归方程,通常是逐个剔除复回归方程中经检验对 y 影 响不显著的所有自变量。这种先全部引入,后逐个剔除的方法,也 是建立最优回归方程的一种分析法。此类分析法还很多,它们多适 用于自变量个数较少,或大多数自变量对 y有显著影响的资料分析。 否则,计算量将大大增加。目前较为常用的逐步回归分析法是按自 变量与 y影响程度的大小,逐个地由大至小将自变量引入回归方程。 而每引入一个自变量,都要对方程中的各个自变量作显著性检验。 检验时先选偏回归平方和最小的自变量进行检验,若为显著,余者 皆为显著;若检验差异不显著,即从方程中剔除,直至留在方程中 的自变量均检验为显著后,再引入另一个与 y 影响最大的变量,并 进行显著性检验。如此反复,直至没有自变量可再被引入,而方程 中所有自变量均与y存在显著的线性关系为止。
58.4 58.6 60.2 ┇ 58.0 60.4 71.2 64.4 7.0
x5
68.6 62.2 66.4 ┇ 57.3 56.7 58.0 62.5 5.6
y,%
70.9 66.7 64.3 ┇ 60.5 60.5 58.9 63.4 3.8
正相关:两变量同长同 消 直线相关分析 简单相关分析 负相关:两变量此长彼 消 平衡关系 ( 相关分析 ) 曲线相关分析 复相关分析 多元相关分析 偏相关分析 相关关系 直线回归分析 一元回归分析 曲线回归分析 因果关系 (回归分析 ) 多元线性回归分析 多元回归分析 多元非线性回归分析
相关系数
( x x )( y y ) COV SP ( x x )( y y ) xy xy n 1 r 2 2 2 2 S S SS SS x y ( x x ) ( y y ) ( x x ) ( y y ) x y n 1 n 1
SS b b b 1 1 SP 12 2 SP 13 3 SP 1 y SP b b b 21 1 SS 2 2 SP 23 3 SP 2y SP b b b 31 1 SP 32 2 SS 3 3 SP 3 y
2b1 1b2 4b3 2 1b1 1.5b2 3b3 4 4b 3b 10 b3 5 2 1
2 1 4 2 (0) A 1 1.5 3 4 4 3 10 5 .5 0 .5 2 1 0 (1 ) A 0 .5 1 1 3 2 1 2 1
1.5-1×0.5=1 3-1×2=1 4-1×1=3 0.5-0.5×(-0.5)=0.75 2-0.5×1=1.5 1-0.5×3=2.5
3-4×0.5=1 10-4×2=2 5-4×1=1 -2-1×(-0.5)=-1.5 2-1×1=1 1-1×3=-2 -0.5-1×(-1.5)=1 1-1×(-1)=2 3-1×(-2)=5
0 .5 1 .5 0 .5 .75 0 0.75-1.5×(-1.5)=3 (2 ) A 0 .5 1 1 3 -0.5-1.5×(-1)=1 -0.5-1.5×(-2)=2.5 1 . 5 1 1 2
周令
56 57 58 ┇ 65 66 67
x1,℃
22.1 17.4 20.1 ┇ 13.8 13.0 13.4 17.2 4.1
x2,℃
16.7 12.6 15.7 ┇ 9.4 9.4 10.7 13.3 3.8
x3,℃
13.3 9.0 12.5 ┇ 5.2 6.4 8.3 10.3 4.4
x4,%
回归系数
( x x )( y y ) SP xy b SS ( x x )2 x
ayb x
ˆ 的直线回归方程: 由x估测y的估计值 y ˆ =a+bx y
第一节 逐步回归分析的基本方法
逐步回归分析的基本方法可以通过一个实例介绍其分析步骤。 例1 为考察舍内干球温度(x1)、湿球温度(x2)、露点温度(x3)、相对湿 度(x4)及舒适度指数(x5)对罗曼蛋鸡产蛋率(y)的影响。随机抽测12个位点 各பைடு நூலகம்4只鸡在56—67周令的平均周产蛋率如表1—1。 表1—1各变量的观察值、平均数及标准差 n=12
式中
2 2 2 SS ( x x ) x ( x ) / n x
2 2 2 SSy ( y y ) y ( y ) / n
称x变量的平方和; 称y变量的平方和;
x y 称乘积和(sum of products)。 S P ( x x ) ( y y ) xy xy n
1 1 .5 2 .5 3 (3 ) a 1 2 1 5 1 . 5 1 1 2
b1=2.5 b2=5 b3=-2
预备知识
生物各性状间的关系是相互依赖和相互制约的关系,改变某一性状,即会引起 另一性状也发生变异。而生物现象数量的表现多半是随机的,因此对现象关系的 研究亦就是对随机变量关系的研究。对随机变量关系的研究,在统计学中有相关 分析和回归分析两种不同的方法。相关分析是研究变量间的相互之间关系,研究 变量间相互联系的性质和紧密程度。回归分析是研究一个变量对另一个变量的单 向依存关系,即研究一个变量随另一个变量变化而变化。这里,后一个变量叫自 变量,前一个变量叫依变量或应变量。变量间的相关关系及分析方法归纳如下:
相关主题