当前位置:
文档之家› 简单实用回归分析(含matlab程序)
简单实用回归分析(含matlab程序)
Residual Case Order Plot 4
4、预测及作图: 、预测及作图: z=b(1)+b(2)*x plot(x,Y,'k+',x,z,'r')
3 2 1 Residuals 0 -1 -2 -3 -4 -5 2 4 6 8 10 Case Number 12 14 16
2011-10-28
y1 y Y = 2 ... yn
1 1 X = ... 1
x1 x2 ... xn
2011-10-28
14
2、求回归系数的点估计和区间估计、并检验回归模型: 、求回归系数的点估计和区间估计、并检验回归模型: [b, bint,r,rint,stats]=regress(Y,X,alpha)
r2=0.9282, F=180.9531, p=0.0000
2011-10-28 p<0.05, 可知回归模型 y=-16.073+0.7194x 成立. 16
3、残差分析,作残差图: 、残差分析,作残差图: rcoplot(r,rint) 从残差图可以看出,除第二个数据外,其余数据的残 差离零点均较近,且残差的置信区间均包含零点,这说明 回归模型 y=-16.073+0.7194x能较好的符合原始数据,而第 二个数据可视为异常点.
2011-10-28 19
通常选择的六类曲线如下:
1 b (1)双曲线 = a + 双曲线 y x
(2)幂函数曲线 y=a x b , 其中 x>0,a>0 幂函数曲线
(3)指数曲线 y=a e bx 其中参数 a>0. 指数曲线
(4)倒指数曲线 y=a e b / x 其中 a>0, 倒指数曲线
σ 2 的置信水平为 1-α 的置信区间为
Qe Qe χ 2 ( n − 2) , χ 2 ( n − 2) α 1− α 2 2
2011-10-28 11
3、预测与控制 、 (1)预测 )
ˆ ˆ ˆ 用 y0 的回归值 y 0 = β 0 + β 1 x 0 作为 y0 的预测值.
回
多元线性回归
归 分 析
可化为线性 回归 非线性回归 非线性回归
2011-10-28
一元非线性情形 多项式情形
逐步回归
3
一、数学模型
例1 测16名成年女子的身高与腿长所得数据如下:
身高 腿长
143 88 145 85 146 88 147 91 149 92 150 93 153 93 154 95 155 96 156 98 157 97 158 96 159 98 160 99 162 100 164 102
β 0 , β1
2011-10-28 6
解得
ˆ ˆ β 0 = y − β1 x ( y = n ∑ xi yi − nx y ˆ β1 = i =1n xi2 − nx 2 ∑ i =1
∑y
i =1
n
i
n
,x =
∑xi =1ni Nhomakorabean
)
经验) (经验)回归方程为 :
返回
17
可线性化的一元非线性回归 曲线回归) (曲线回归)
例2 出钢时所用的盛钢水的钢包,由于钢水对耐火材料的侵蚀, 容积不断增大.我们希望知道使用次数与增大的容积之间的关 系.对一钢包作试验,测得的数据列于下表:
使用次数 2 3 4 5 6 7 8 9 增大容积 6.42 8.20 9.58 9.50 9.70 10.00 9.93 9.99 使用次数 10 11 12 13 14 15 16 增大容积 10.49 10.59 10.60 10.80 10.60 10.90 10.76
2011-10-28
9
(Ⅰ)F检验法 检验法 当 H 0 成立时,
其中 U =
n
U ~F(1,n-2) F= Qe /( n − 2)
回归平方和) 回归平方和 ( y i − y )2 (回归平方和) ∑ ˆ
i =1
故 F> F1−α (1, n − 2) ,拒绝 H 0 ,否则就接受 H 0 .
(Ⅱ)t检验法 检验法
当 H 0 成立时, T = 故T >t
α
2
n
ˆ Lxx β 1 ~t(n-2) ˆ σe
1−
(n − 2) ,拒绝 H 0 ,否则就接受 H 0 .
n 2 i =1
其中L xx = ∑ ( xi − x ) = ∑ xi2 − nx 2
2011-10-28
i =1
10
2、回归系数的置信区间 、
数学建模与数学实验
回归分析
2011-10-28 1
变量间的关系
• 确定性关系:确定性变量之间的关系。 描述:y=f(x) s=1/2*gt2 • 随机性关系:确定性变量和随机变量之 间的关系,或随机变量之间的关系。 描述:回归模型或相关模型。 身高体重之间的关系
2011-10-28
2
一元线性回归 线性回归
记
Q = Q ( β 0 , β 1 ) = ∑ ε = ∑ ( y i − β 0 − β 1 xi )
i =1 2 i i =1
n
n
2
ˆ ˆ 最小二乘法就是选择 β 0 和 β 1 的估计 β 0 , β 1 使得 最小二乘法
ˆ ˆ Q ( β 0 , β 1 ) = min Q ( β 0 , β 1 )
ˆ ˆ ˆ ˆ y − σ e u 1− α , y + σ e u 1− α 2 2
2011-10-28 12
(2)控制 )
要求: y =
β 0 + β 1 x + ε 的值以 1 − α 的概率落在指定区间 ( y ′, y ′′)
ˆ ˆ y − δ ( x) ≥ y ′, y + δ ( x) ≤ y ′′ ˆ ˆ 要求 y ′′ − y ′ ≥ 2δ ( x ) . 若 y − δ ( x ) = y ′, y − δ ( x ) = y ′′ 分别有解 x′ ˆ ˆ 和 x ′′ ,即 y − δ ( x ′) = y ′, y + δ ( x ′′) = y ′′ . 则 ( x ′, x ′′) 就是所求的 x 的控制区间.
解答
2011-10-28 18
11 10.5 10 9.5 9 8.5 8 7.5 7 6.5 6 2 4 6 8 10 12 14 16
散 点 图
此即非线性回归 曲线回归 问题(需要配曲线) 非线性回归或曲线回归 非线性回归 ( ) 配曲线的一般方法是: 配曲线的一般方法是:
先对两个变量 x 和 y 作 n 次试验观察得 ( x i , y i ), i = 1,2,..., n 画出散点图, 根据散点图确定须配曲线的类型. 然后由 n 对试验数据确定每一类曲线的未知 参数 a 和 b. 采用的方法是通过变量代换把非线性回归化成线性回归,即采用 非线性回归线性化的方法.
置 回 残 信 差 区 间 数 性 为 的 水 区 间 估 计 F 检验回归模型的 计 数 : 系数r2、 、 F 的 p 0 平 05 ) . 时 系 著 省 归 显 缺 (
系数 r2 F F 的 回归
1
回归
p<α
H0 回归模型
.
3、 、
2011-10-28
区间: 区间:
rcoplot
r
rint
15
y 0 的置信水平为 1 − α 的预测区间 预测区间为 预测区间 ˆ ˆ [ y0 − δ ( x0 ), y 0 + δ ( x0 )]
1 (x0 − x ) ˆ 其中 δ ( x 0 ) = σ e t α ( n − 2) 1 + + 1− n L xx 2
2
特 别 , 当 n 很 大 且 x0 在 x 附 近 取 值 时 , y 的 置 信 水 平 为 1 − α 的预 测 区 间 近 似 为
只要控制 x 满足以下两个不等式
2011-10-28
13
MATLAB统计工具箱中的回归分析命令 统计工具箱中的回归分析命令
y = β 0 + β1 x + ε
一元线性回归
1、确定回归系数的点估计值: 、确定回归系数的点估计值:
b=regress( Y, X )
ˆ β0 b= ˆ β1
β 0 和 β 1 置信水平为 1-α 的置信区间分别为
1 x2 ˆ 1 x2 ˆ ˆ ˆ , β 0 + t α (n − 2)σ e + + β 0 − t α (n − 2)σ e 1− 1− n Lxx n L xx 2 2
ˆ ˆ + t (n − 2)σ / L ˆ ˆe 和 β 1 − t α ( n − 2)σ e / L xx , β 1 α xx 1− 1− 2 2
得结果:b = -16.0730 0.7194 stats = 0.9282 180.9531 0.0000 bint = -33.7071 0.6047 1.5612 0.8340
ˆ ˆ ˆ ˆ 即 β 0 = −16.073, β 1 = 0.7194 ; β 0 的置信区间为[-33.7017,1.5612], β 1 的置信区间为[0.6047,0.834];
2
称 Qe 为残差平方和 剩余平方和. 残差平方和或剩余平方和 残差平方和
ˆ2 σ 2 的无偏估计 的无偏估计为 σ e = Qe (n − 2)
ˆ ˆ ˆ 称 σ e 为剩余方差(残差的方差) σˆ e 分别与 β 0 、 β 1 独立 。 剩余方差(残差的方差) , 剩余方差