当前位置:文档之家› 一元线性回归-方差分析-显著性分析

一元线性回归-方差分析-显著性分析

一元线性回归分析及方差分析与显著性检验
某位移传感器的位移x 与输出电压y 的一组观测值如下:(单位略)
设x 无误差,求y 对x 的线性关系式,并进行方差分析与显著性检验。

(附:F 0。

10(1,4)=4.54,F 0。

05(1,4)=7.71,F 0。

01(1,4)=21.2)
回归分析是研究变量之间相关关系的一种统计推断法。

一. 一元线性回归的数学模型
在一元线性回归中,有两个变量,其中 x 是可观测、可控制的普通变量,常称它为自变量或控制变量,y 为随机变量,常称其为因变量或响应变量。

通过散点图或计算相关系数判定y 与x 之间存在着显著的线性相关关系,即y 与x 之间存在如下关系:
y =a +b ∗x +ε (1)
通常认为ε~N (0,δ2)且假设δ2与x 无关。

将观测数据(x i ,y i ) (i=1,……,n)代入(1)再注意样本为简单随机样本得:
{y i =a +b ∗x i +εi
ε1⋯εn 独立同分布N (0,σ2)
(2) 称(1)或(2)(又称为数据结构式)所确定的模型为一元(正态)线性回归模型。

对其进行统计分析称为一元线性回归分析。

模型(2)中 EY= a +b ∗x ,若记 y=E(Y),则 y=a+bx,就是所谓的一元线性回归方程,其图象就是回归直线,b 为回归系数,a 称为回归常数,有时也通称 a 、b 为回归系数。

设得到的回归方程
根据最小二乘原理可求得回归系数b 0和b 。

对照第五章最小二乘法的矩阵形式,令
⎪⎪⎪⎪⎪⎭
⎫ ⎝⎛=⎪
⎪⎭

⎝⎛=⎪⎪⎪⎪⎪⎭

⎝⎛=⎪⎪⎪
⎪⎪⎭⎫ ⎝⎛=v v v V b b b x x x X y y y Y 2102121ˆ111
则误差方程的矩阵形式为
对照X A L V -=,设测得值
Y X X X b T T 1)(-=
将测得值分别代入上式,可计算得
,)()
)((2
2
1
1
1
xx
xy N
t N t t t t t t t t l l x x N y x y x N b =
--=
∑∑∑∑∑===x b y x x N y x x y x b N N
t t t t t t t t t t t -=--=
∑∑∑∑∑∑====2
21
111
2
0)()
)(())((
其中
2
2
2
1
1112
11
2
12
1
1)(1)()
)((1)()()(1)(1∑∑∑∑∑∑∑∑∑∑∑∑=========-=-=-=--=-=-==
=
N
t N N
t t yy N
t t N
t t N
t t t t N
t t xy N
t t N
t t N
t t xx N t t
t t
y y y y l y x N y x y y x x l x N x x x l y
N
y x
N x
二、回归方程的方差分析及显著性检验
问题:这条回归直线是否符合y 与x 之间的客观规律回归直线的预报精度如何?
解决办法:
方差分析法—分解N 个观测值与其算术平均值之差的平方和;从量值上区别多个影响因素;用F 检验法对所求回归方程进行显著性检验。

(一)回归方程的方差分析
总的离差平方和(即N 个观测值之间的变差)
∑=-=yy t l y y S 2)(可以证明:
S=U+Q
其中
∑=-=xy t bl y y U 2)(xy yy t t bl l y
y Q -=-=∑2)ˆ(,Q U —回归平方和,反映总变差中由于x 和y 的线性关系而引起 y 变化的部分。

Q —残余平方和,反映所有观测点到回归直线的残余误差,即其它因素对y 变差的影响。

(二)回归方程显著性检验— F 检验法
基本思路:方程是否显著取决于U 和Q 的大小,U 越大Q 越小说明y 与x 的线性关系愈密切。

计算统计量F
Q
U
Q F ν/=
对一元线性回归,应为
)
2/(-=
N Q F
查F 分布表,根据给定的显著性水平α和已知的自由度1和N-2进行检验: 若,0.01的水平上高度显著。

0.05的水平上显著。

0.1的水平上显著。

(三)残余方差与残余标准差
残余方差:排除了x 对y 的线性影响后,衡量y 随机波动的特征量。

22-=
N σ
残余标准差:
含义:
σ
越小,回归直线的精度越高。

程序如下:
test=[1 5 10 15 20 25;
0.1051 0.5262 1.0521 1.5775 2.1031 2.6287] N=length(test(1,:));
sx=0;sx2=0;sy=0;sy2=0;sxy=0;Lxy=0;Lyy=0; for i=1:N
sx=sx+test(1,i); sx2=sx2+test(1,i)^2;
sy=sy+test(2,i);
sy2=sy2+test(2,i)^2;
sxy=sxy+test(1,i)*test(2,i);
Lxy=Lxy+(test(1,i)-sum(test(1,:))/N)*(test(2,i)-sum(test(2,:)/N));
Lyy=Lyy+(test(2,i)-sum(test(2,:))/N)^2;
end
r=[N,sx;sx,sx2]\[sy;sxy];
a=r(1);b=r(2);
U=b*Lxy;
Q=Lyy-U;
F=(N-2)*U/Q;
x=test(1,:);y=a+b*x;eq=sum(test(2,:))/N;
ssd=0;ssr=0;
for i=1:N
ssd=ssd+(test(2,i)-y(i))^2;
ssr=ssr+(y(i)-eq)^2;
end
sst=ssd+ssr;
RR=ssr/sst;
str=[blanks(5),'y=','(',num2str(a),')','+','(',num2str(b),')','*x'];
disp(' ')
disp('回归方程为')
disp(str)
disp('R^2拟合优度校验')
strin=['R^2=',num2str(RR)];
disp(strin)
disp('方差检验:')
strin=['sgm^2=',num2str(sgm)];
disp(strin)
disp('F-分布显著性校验')
stri=['F计算值',num2str(F),blanks(4),'自由度f1=1,f2=',num2str(N-2)];
disp(stri)
disp('注:请对照F-分布表找到所需置信水平下的F临界值Fa,若F>Fa,则通过检验。

') yy=a+b*test(1,:);
plot(test(1,:),test(2,:),'r.'),hold on
plot(test(1,:),yy,'b-'),hold off
title(str)
结果如下:
test =
1.0000 5.0000 10.0000 15.0000 20.0000 25.0000
0.1051 0.5262 1.0521 1.5775 2.1031 2.6287
回归方程为:
y=(0.0003321)+(0.10514)*x
R^2拟合优度检验:
R^2=1
方差检验:
sgm^2=8.1002e-008
F-分布显著性检验:
F计算值:56408931.6024 自由度:f1=1,f2=4
注:请对照F-分布表找到所需置信水平下的F临界值Fa,若F>Fa,则通过检验。

(注:可编辑下载,若有不当之处,请指正,谢谢!)。

相关主题