当前位置:文档之家› 生物统计 第9章 多元线性回归与多项式回归

生物统计 第9章 多元线性回归与多项式回归

分别代入方程组(9-2)中的后m个方程,经整
理可得到关于偏回归系数b1、b2、…、bm的正规
方程组(normal equations)为:
SS1b1 SP b2 SP m bm SP 12 1 10 SP21b1 SS 2 b2 SP2 m bm SP20 SPm1 b1 SPm 2 b2 SS m bm SPm0
4、选择仅对依变量有显著线性影响的自 变量,建立最优多元线性回归方程。 5、评定各个自变量对依变量影响的相对
重要性,以及测定最优多元线性回归
方程的偏离度等。
多元线性回归方程的建立
一、多元线性回归的数学模型
设依变量y与自变量x1、x2、…、xm,共有n
组实际观测数据:
假定依变量y与自变量x1,x2,…xm间存在线




复相关分析
偏相关分析


多项式回归*
通经分析*
第一节 多元线性回归分析
多元线性回归分析的基本任务
1、根据依变量与多个自变量的实际观测 值建立依变量对多个自变量的多元线 性回归方程。
2、检验、分析各个自变量对依变量的 综合线性影响的显著性。 3、检验、分析各个自变量对依变量的单 纯线性影响的显著性。
(multiple regression analysis)。
而其中最为简单、常用并且具有基础性 质的是多元线性回归分析(multiple linear regression analysis),许多非线性回归(nonlinear regression)和多项式回归(polynomial regression)都可以化为多元线性回归来解决,
nb0 (x1 )b1 (x2 )b2 (xm )bm y (x )b (x 2 )b (x x )b (x x )b x y 1 1 1 2 2 1 m m 1 1 0 2 (x2 )b0 (x2 x1 )b1 (x2 )b2 (x2 xm )bm x2 y 2 (xm )b0 (xm x1 )b1 (xm x2 )b2 (xm )bm xm y
(9-2)
b0 y b1 x1 b2 x2 bm xm
即:
b0 y
bi xi
i 1
m
其中 :
1 n 1 n y y j , xi xij n j 1 n j 1
若记
SSi

j 1
n
( x ij x i ) 2 ,
n
SS 2 c1m c21 c22 c 2 m cm1 c m 2 c mm
其中:C矩阵的元素Cij(i,j=1、2、…、m)称为高
斯乘数,是多元线性回归分析中显著性检验所需要
的。
关于求系数矩阵A的逆矩阵A-1的方法有 多种,如行(或列)的初等变换法等,请参阅 线性代数教材,这里就不再赘述。 对于矩阵方程(9—7)求解,有:
性关系,其数学模型为:
y j 0 1 x1 j 2 x2 j ... m xmj j
( j=1,2,…,n) (9-1)
式中:
x1,x2,…、xm可以观测的一般变量(或为可
以观测的随机变量);
y为可以观测的随机变量,随x1,x2,…,xn而
变,受试验误差影响;
因而多元线性回归分析有着广泛的应用。
研究多元线性回归分析的思想、方
法和原理与直线回归分析基本相同,但
是其中要涉及到一些新的概念以及进行
更细致的分析,特别是在计算上要比直
线回归分析复杂得多,当自变量较多时
,需要应用电子计算机进行计算。
本章的主要内容:
多元线性回归分析
多元线性回归方程的建立
多元线性回归的显著性检验
则正规方程组(9-4)可用矩阵形式表示为
SS1 SP21 SPm1

SP SP m b1 SP 12 1 10 SS2 SP2 m b2 SP20 SPm 2 SSm bm SPm0
指标,而影响猪瘦肉量的有猪的眼肌面积、胴体
长、膘厚等性状。设依变量
y
为瘦肉量
( kg ),自变量 x1 为眼肌面积( cm2),自 变量 x 2 为胴体长(cm ),自变量 x 3 为膘厚
( cm)。根据三江猪育种组的54头杂种猪的实 测数据资料,经过整理计算,得到如下数据:
SS1 846.2281 SS 2 745.6041 SS 3 13.8987 SP12 40.6832 SP13 6.2594 SP23 45.1511 SP10 114.4530 SP20 76.2799 SP30 11.2966 x1 25.7002 x 2 94.4343 x3 3.4344 SS y 70.6617 y 14.8722
解正规方程组(9-4)即可得各偏回归系数b1、 b2、…、bm的解,而
b0 y b1 x1 b2 x2 bm xm
于是得到m元线性回归方程
ˆ y b0 b1 x1 b2 x2 ....... bm xm
b0为回归常数项,在b0有实际意义时,表示y
的起始值;
试建立y对x1、x2 、x3的三元线性回归方程。
ˆ y b0 b1 x1 b2 x2 b3 x3
将上述有关数据代入(9-5)式,得到关
于偏回归系数 b1 、b2 、b3 的正规方程组:
846.2281b1 40.6832b2 6.2594b3 114.4530 40.6832b1 745.6041b2 45.1511b3 76.2799 6.2594b1 45.1511b2 13.8987b3 11.2966
b A B b CB

1
b1 c11 c12 c1m SP10 b2 c 21 c 22 c 2 m SP20 bm c m1 cm 2 c mm SPm 0
即关于b1、b2、b3的解为:
- 0.000040 b1 0.001187 b 0.000040 0.001671 2 b3 0.000403 0.005410 0.1282 0.0617 0.5545 0.000403 114 .4530 0.005410 76.2799 0.089707 11 .2966
bi称为依变量y对自变量xi的偏回归系数
(partial regression coefficient),表示除自变量xi
以外其余m-1个自变量都固定不变时,自变量xi每
变化一个单位,依变量y平均变化的单位数。
b0 y b1 x1 b2 x 2 bm x m
ˆ y y b1 ( x1 x1 ) b2 ( x2 x2 ) bm ( xm xm )
Ab=B
为常数项矩阵(列向量)。
其中 A 为正规方程组的系数矩阵、 b 为偏回归系数矩阵
(列向量)、B
设系数矩阵A的逆矩阵为C矩阵,即
A 1 C ,则
C A 1
SS1 SP SP m 12 1 SP21 SS 2 SP2 m SPm1 SPm 2 SS m
若使Q值达到最小,则应有:
Q 2 ( y j b0 b1 x1 j b2 x2 j ... bm xmj ) 0 b0
Q 2 x ij ( y j b0 b1 x1 j b2 x2 j bm xmj ) 0 bi
(i=1、2、…、m)
的最小二乘估计值。即b0、b1、b2……、bm应使
实际观测值y与估计值 y 的偏差平方和最小。 ˆ
令:
ˆ Q ( yj yj )
j 1 n j 1
n
2
( y j b0 b1 x1 j b2 x2 j ... bm xmj )
2
Q为关于b0、b1、b2、…、bm的m+1元函数。
1
根据式(9-8),关于b1 、b2 、b3 的 解可表示为:
b1 c11 c12 c13 SP 10 b2 c 21 c 22 c 23 SP20 b3 c31 c32 c33 SP30
用线性代数有关方法求得系数矩阵的逆矩阵如 下:
C A 1 846 .2281 40.6832 40.6832 745.6041 - 6.2594 - 45.1511 - 0.000040 0.001187 - 0.000040 0.001671 0.000403 0.005410 c12 c13 c11 c21 c22 c23 c31 c32 c33 - 6.2594 - 45.1511 13.8987 0.000403 0.005410 0.089707
关于偏回归系数 bi 的解可表示为:
bi ci1 SP ci 2 SP20 cim SPm0 10
(i=1、2、…、) (9-9)
或者
bi cij sp j 0
j 1
m

b0 y b1 x1 b2 x2 bm xm
【例9.1】 猪的瘦肉量是肉用型猪育种中的重要
εj为相互独立且都服从N(0,σ2)的随机变
量。
我们可以根据实际观测值对β1,
β2,...,βm 以及方差σ2作出估计。
二、建立线性回归方程
设y对x1、x2、…、xn的m元线性回归方程
相关主题