当前位置:文档之家› 线性回归的显著性检验及回归预测.

线性回归的显著性检验及回归预测.


双曲线
1. 基本形式:
1. 线性化方法 令:y' = 1/y,x'= 1/x, 则有y' = a+ bx' 2. 图像
b<0
b>0
幂函数曲线
1. 基本形式:
2. 线性化方法
两端取对数得:lg y = lga + b lg x 令:y' = lgy,x'= lg x,则y' = lga + b x‘ 3. 图像
非线性回归--练习
一种商品的需求量与其价格有一定的关系。现对 一定时期内的商品价格 x 与需求量 y进行观察,取得 的样本数据如表所示。试判断商品价格与需求量之 间回归函数的类型,并求需求量对价格的回归方程, 以及相应的判定系数。
2 2 2
2 2
R 1 ( y yc ) / ( y y )
相关指数计算表
序号 1 y 106.42 yc 107.53 (y-yc)2 1.2321 (y-yˉ)2 13.0012
2
3 4 5 6 7 8
108.20
109.58 109.50 110.00 109.93 110.49 110.59
0.0023
0.0018 0.0013 0.0011 0.0009 0.0008 0.0006 0.0006 0.0006 0.0005 0.0005
14
合计
20

111.18
-
0.0500
2.1009
0.0090
0.1271
0.0025
0.5397
0.0004
0.0193
非线性判定系数与相关系数
0.0091
0.0091 0.0091 0.0091 0.0091 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090
0.0625
0.0400 0.0204 0.0156 0.0100 0.0083 0.0051 0.0044 0.0039 0.0031 0.0028
•由a0.05,可知临界值
♥ Fa(1,n-2)=F0.05(1,14)=4.6
♥F>F0.05(1,14),拒绝H0,
表明总体的两变量间线性相关关系是显 著地,所拟和的线性回归方程具有95% 的置信度。
回归预测
利用回归方程进行估计和预测
1. 根据自变量x的取值估计或预测因变量 y的取值 2. 估计或预测的类型 点估计 • 因变量y 置信区间估计 区间估计 • 因变量y 置信区间估计
n xy x y b 0.0006 2 2 n x ( x) y 0.009 0.0006 x a y bx 0.009
将x 1/ x, y 1/ y代入回归方程,可得双曲线回归方程为: 1/ yc 0.009 0.0006 / x 即 x yc 0.009 x 0.0006
•由a0.05,可知临界值
♥ ta/2(n-2)=t0.025(14)=2.1448
♥|t|=16.6548>t0.025(14)=2.1448
拒绝H0,表明总体的两变量之间存在着 显著的线性相关关系,即能源消耗量与 工业总产值之间存在显著的线性相关关 系。
回归方程的显著性检验
1、目的:对回归方程拟合优度的检验 2、具体方法:将回归离差平方和(SSR)同 剩余离差平方和(SSE)加以比较,应用F检 验来分析二者之间的差别是否显著 ♥如果是显著的,两个变量之间存在线性 关系 ♥如果不显著,两个变量之间不存在线性 关系
区间估计
1. 点估计不能给出估计的精度,点估 计值与实际值之间是有误差的,因 此需要进行区间估计; 2. 对于自变量 x 的一个给定值 x0 ,根据 回归方程得到因变量y的一个估计区 间; 3. 区间估计的类型 置信区间估计
置信区间估计
对于给定的任一值x0 ,由一元线性 模型知道,不可能求出y相应的精确y0 , 但是我们可以预测y的取值范围.对于 给定的1 a ,求出y0的置信区间,称之为 预测区间.求预测区间的方法与抽样 推断中的区间估计原理相同.
置信度 95 %的情况下,当能源消耗量为 73( 十万吨 ) 时,工 业总产值的预测区间在45.9345亿元到57.2677亿元之间。
影响区间宽度的因素
1. 置信水平 (1 - a) 区间宽度随置信水平的增大而增大 2. 回归估计标准差Se 区间宽度随离散程度的增大而增大 3. 样本容量 区间宽度随样本容量的增大而减小 4. 用于预测的x0 与x 的差异程度 区间宽度随x0 与x 的差异程度的增大而增大
109.58
109.50 110.00 109.93 110.49 110.59 110.61 110.90 110.76 111.00 111.20
0.2500
0.2000 0.1429 0.1250 0.1000 0.0909 0.0714 0.0667 0.0625 0.0556 0.0526
对【例6.1】的回归系数进行显著性检验(a=0.05)
提出假设 H 0: b = 0 H 1: b 0 选择检验的统计量 t=b / S (b) ~t(14) 计算检验统计量
2
由b 0.7961; Se 2.457, ( x x ) x 2 ( x )2 / n 55086 (916)2 / 16 2645 1 则S ( b ) S e 2.457 2 2645 ( x x) b 0.7961 t 16.6548 S (b) 0.0478 1
F检验的步骤
提出假设 H0:b0; H1:b≠0 • 选择检验统计量F,
• 计算实际统计量F的值
• 确定显著性水平a,查F分布表得临界值 Fa(1,n-2),进而作出决策: 若FF a(1,n-2),拒绝H0;表明在总体两 变量间线性相关性显著; ♥ 若F<F a(1,n-2),接受H0,表明总体两变 量间线性相关性不显著.
对于给定的1 a , y0的置信度 为1 a的置信区间为:
yc ta 2 Se 1 x0 x ) 1 (小样本) 2 n ( x x)
2
yc Za 2 S ( e 大样本,n充分大时)
【例】求出例6.1中能源消耗量为73(十万吨)时,工 业总产值95%置信水平下的预测区间
12
13 14 合计
18
19 20 -
111.00
111.20 111.18 -
112.00 111.00 110.00 109.00 108.00 107.00 106.00 0 5 10 15 20 25 系列1
1/ y a b / x 令x 1/ x y 1/ y y a by
0.1936 2.2999
1.3790
1.3324 22.6589
计算可得 R 1 ( y yc ) / ( y y ) 1 2.999 / 22.6589
2 2 2
0.8985 进而得到 R 0.8985 0.9497
R2=0.8985表明两变量之间有高度的非线性相关关系。
回归方程计算表
序号
1 2
x
2 3
y
106.42 108.20
x′=1/x
0.5000 0.3333
y′=1/y
0.0094 0.0092
x′2
0.2500 0.1111
x′y′
0.0047 0.0031
3
4 5 6 7 8 9 10 11 12 13
4
5 7 8 10 11 14 15 16 18 19
第三节
线性回归的显著性检验及回归预测
一、回归系数的显著性检验(t检验) 二、回归方程的显著性检验(方差分析(F检验))
三、回归预测
回归系数的显著性检验 --t检验
目的:检验X与Y之间是否具有 线性关系;或者说检验自变量X 对因变量Y的影响是否显著
t检验的步骤
提出假设 H 0: b = 0
注意:
预测区间以估计值yc为中点,区间
长度为2 .其中区间长度在x0 x处最短,
x0离x 越远区间长度越长.故置信区间上、
下限的曲线对称地落在回归直线两侧,
呈喇叭型.
y
预测区间上限
yc a bx
预测区间下限
x
x0
x
第四节
可线性化的配合回归曲线的问题 三、非线性判定系数与相关系数
110.61
110.90 110.76 111.00
110.58
110.62 110.65 110.70
0.0009
0.0784 0.0121 0.0900
0.3414
0.7644 0.5392 0.9493
13
14 合计
111.20
111.18 1540.36
110.72
110.74 -
0.2304
解:根据前面的计算结果有 n 16, Se 2.457, yc 51.6011, ta / 2 ( n 2) t 0.025 (14) 2.1448
2 x x / n 57.25, nS x ( x x )2 2645
故置信上下限为: 1 51.6011 2.1448 2.457 1 (73 57.25)2 / 2645 16 即51.6011 5.6666 置信区间为45.9345 y0 57.2677

方差分析表
离差来源 回归 剩余 总计 平方和 自由度
2 2
F值
SS R F SS E /( n 2)
SS R ( yc y ) SS E ( y yc )
相关主题