数学建模回归分析.ppt
2. 2 的无偏估计
n
记 Qe Q(ˆ0 , ˆ1 )
yi ˆ0 ˆ1xi 2 n ( yi yˆi )2
i 1
i 1
称 Qe 为残差平方和或剩余平方和(SSE).
2 的无偏估计为
ˆ
2 e
Qe
(n 2)
称
ˆ
2 e
为剩余方差(残差的方差),
ˆ
2 e
分别与
ˆ0
、
ˆ1
独立.
ˆ e 称为剩余标准差.
0 和 1 置信水平为 1-α的置信区间分别为
ˆ
0
t 1 2
(n
2)ˆ e
1 n
x2 Lxx
,
ˆ0
t
1 2
(n
2)ˆ e
1
x2
n Lxx
和
ˆ1
t
1 2
(n
2)ˆ e
/
Lxx
,
ˆ1
t
1
(n
2)ˆ e
/
2
Lxx
2 的置信水平为 1- 的置信区间为
Qe
2 1
(n
2
2)
,
2
2
Qe (n
故 F> F1 (1, n 2) ,拒绝 H 0 ,否则就接受 H 0 .
检验
r 检验
n
(xi x)( yi y)
记
r
i 1
n
n
(xi x)2 ( yi y)2
i 1
i 1
当|r|> r1 时,拒绝 H0;否则就接受 H0.
其中 r1
1
1 n 2 F1 1, n 2
检验
回归系数的置信区间
先对两个变量 x 和 y 作 n 次试验观察得 (xi , yi ), i 1,2,..., n 画出散点图,
根据散点图确定须配曲线的类型.然后由 n 对试验数据确定每一类曲线的未知 参数 a 和 b.采用的方法是通过变量代换把非线性回归化成线性回归,即采用 非线性回归线性化的方法.
通常选择的六类曲线如下:
解答
102
100
98
y 0 1x (1)
96
94
92
90
88
86
84
140
145
150
155
160
165
散点图
一般地,称由(1)确定的模型为一元线性回归模型,
记为
y 0 1x E 0, D 2
固定的未知参数 0 、 1 称为回归系数,自变量 x 也称为回归变量.
Y 0 1x ,称为 y 对 x 的回归直线方程.
数学建模
回归分析
回归分析
统计工具箱中的回归分析命令
一元线性回归
多元线性回归
* *
* *
数 学 模 型 及 定 义
模 型 参 数 估 计
检 验
性可 回线 归性
(化
曲的
线一
回元
归非
)线
数 学 模 型 及 定 义
模 型 参 数 估 计
检 验多 与元 预线 测性
回 归
逐 步 回 归 分 析
中
的
一、数学模型
返回
由此 aˆ eAˆ 11.6789
1.1107
最后得 y 11.6789e x
一、数学模型及定义
一般称
Y X
例1 测16名成年女子的身高与腿长所得数据如下:
身高
143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164
(cm)
腿长
88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102
(cm)
以身高x为横坐标,以腿长y为纵坐标将这些数据点(xi,yi) 在平面直角坐标系上标出.
解得
ˆ0 y ˆ1x
ˆ1
xy x2
xy x2
n
xi x yi y
或 ˆ1 i1 n
xi x2
i 1
其中 x
1 n
n i 1
xi , y
1 n
n i 1
yi
, x2
1 n
n i 1
xi 2 , xy
1 n
n i 1
xi yi
.
(经验)回归方程为:
yˆ ˆ0 ˆ1x y ˆ1(x x)
使用次数
10 11 12 13 14 15 16
增大容积
10.49 10.59 10.60 10.80 10.60 10.90 10.76
解答
11
曲线回归 10.5 10
9.5
9
8.5
散
8
点
7.5
图
7
6.5
6
2
4
6
8
10
12
14
16
此即非线性回归或曲线回归 问题(需要配曲线) 配曲线的一般方法是:
检验
F 检验
当 H 0 成立时,
F/(n 2)
n
其中 U yˆi y 2 (回归平方和)(SSR) i 1
n
记 Qe Q(ˆ0 , ˆ1 )
yi ˆ0 ˆ1xi 2 n ( yi yˆi )2
i 1
i 1
称 Qe 为残差平方和或剩余平方和(SSE).
2)
四、可线性化的一元非线性回归 (曲线回归)
例2 出钢时所用的盛钢水的钢包,由于钢水对耐火材料的侵蚀, 容积不断增大.我们希望知道使用次数与增大的容积之间的关 系.对一钢包作试验,测得的数据列于下表:
使用次数
2 3 4 5 6 7 8 9
增大容积
6.42 8.20 9.58 9.50 9.70 10.00 9.93 9.99
设
yi 0 x1 i ,i 1, 2,..., n
E
i
0,
D i
2
且1 2 ,..., n相互独立
n
n
记
Q Q(0 , 1)
2 i
yi 0 1xi 2
i 1
i 1
最小二乘法就是选择 0 和 1 的估计 ˆ0 , ˆ1 使得
Q(ˆ0
,
ˆ1 )
min
0 ,1
Q( 0
,
1 )
一元线性回归分析的主要任务是:
1.用试验值(样本值)对 0 、 1 和 作点估计;
2.对回归系数 0 、 1 作假设检验;
3.在 x= x0 处对 y 作预测,对 y 作区间估计.
返回
二、模型参数估计
1.回归系数的最小二乘估计
有 n 组独立观测值(x1,y1),(x2,y2),…,(xn,yn)
(1)双曲线 1 a b
y
x
(2)幂函数曲线 y=a x b , 其中 x>0,a>0
(3)指数曲线 y=a ebx 其中参数 a>0.
(4)倒指数曲线 y=a eb / x 其中 a>0,
(5)对数曲线 y=a+blog x,x>0
(6)S
型曲线
y
a
1 bex
解例 2.由散点图我们选配到指数曲线 y=a eb / x 根据线性化方法,算得 bˆ 1.1107 , Aˆ 2.4587
返回
检验
1.回归方程的显著性检验
对回归方程 Y 0 1x 的显著性检验,归结为对假设 H0 : 1 0; H1 : 1 0
进行检验. 假设 H0 : 1 0 被拒绝,则回归显著,认为 y 与 x 存在线性关
系,所求的线性回归方程有意义;否则回归不显著,y 与 x 的关系 不能用一元线性回归模型来描述,所得的回归方程也无意义.