当前位置:文档之家› 回归分析(完整版)

回归分析(完整版)

45.86
x2,x3 x4 24.64
x1,x2 x3,, x4 25.39
引例2求解

y 186.11 3.09x 2 19.5176x3 stats1 : stats2 : stats3 : 0.9025 0.9028 0.9029 78.6381 49.5443 49.61
最佳回归方程
一元与多元
线性与非线性
任务:
估计回归模型中的未知参数; 检验模型假设的正确性; 分析影响试验指标y的因素,挑选重要因素; 应用——预测与控制;
返 回
知识简介
多元线性回归模型与任务
Y 0 1 x1 m xm 2 ~ N ( 0 , )
多元线性回归模型
任务:
• • • •
在回归模型中如何估计参数βi (i=0,1,…,m)和σ2?
模型的假设(线性)是否正确?
判断每个自变量xi (i=1,…,m)对Y的影响是否显著? 利用回归方程对试验指标 Y进行预测或控制?
多元线性回归分析
矩阵表达形式
ˆ ( X T X ) 1 X T Y β 1 x11 x1m X , 1 xn1 xnm
假设:1. 线性函数 ax+b 2. 正态性
. · . . . · · . . · · . E(Y|x0) · E(Y|x1)
0 x0 x1 x
引例:某建筑材料公司的销售量因素分析
某建材公司对某年20个地区的建材销售量
Y(千方)、推销开支、实际帐目数、同类商品竞
争数和地区销售潜力分别进行了统计。试分析
Ti
cii
Se2 n m 1 0 {| Ti | t (n k )}
1 2
任务四:应用
预测、控制……
返 回
MATLAB软件实现
使用命令regress实现一(多)元线性回归模型的计算
b = regress (Y, X) 或
默认值是
0.05
[b, bint, r, rint, stats] = regress(Y, X, alpha)
0 0 0
y 189.72 0.7048x1 3.1066x 2 19.584x3 y 187.882 3.149x 2 19.605x3 0.4173x 4
思考:如何进行预测?
restool(X,y,’model’)
Z
MATLAB 软件能否实现非线性回归分析?
一元非线性回归分析
引例2求解 输入:(jzhui.m)
x1=[5.5 2.5 8 3 ……8 6 4 7.5 7]’;(20维) x2=[31 55 67 …… 55 70 40 50 62 59]'; x3=[10 8 12 …… 11 11 9 9]'; x4=[8 6 9 16 …… 8 13 11]';
y=[79.3 200.1 …… 135.8 223.3 195]';
500 1000
1500
2000
2500
3000
3500
钢材消费量y与国民收入x的散点图
引例1:钢材消费量与国民收入的关系
回归分析是研究变量间相关关系的一种统计方法。 特点:试验指标(因变量)是随机变量。 Y a bx ; 一元线性回归模型: E (Y | X x) a bx 2 ~ N (0, ) y
一元非线性回归分析
计算y的拟合值: 输入:[Y,delta]=polyconf(p,x,S);Y
结果: Y= 22.5243 28.3186 27.0450 22.5243 26.0582 27.0450 24.1689
35
26.0582 24.1689 27.9896 19.6904
27.9896 19.6904 28.3186
推销开支、实际帐目数、同类商品竞争数和地
区销售潜力对建材销售量的影响作用。试建立
x4
x1
x2
x3
回归模型,且分析哪些是主要的影响因素。
统计数据
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
X= 1 1 1 1 . . . 1 1 1 1 1
x1
拟合效果图:
30
25
20
15 15
20
25
30
一元非线性回归分析 用polytool(x,y,2)还可以得到一个交互式画面。
Y a1 x a2 x a3 ; 2 ~ N ( 0 , )
2
Export Parameters Parameters CI Prediction Prediction CI Residuals All
Q
e
i 1 2 i
2 ˆ ( y y ) i i i 1
多元线性回归分析
任务二:模型检验
提出问题
H 0 : 0 1 m 0
2 2 ST Se2 SR
1)F-统计检验法
2 SR /m F 2 ~ F (m, n m 1) Se /(n m 1)
引例:某建筑材料公司的销售量因素分析
Z
① 数据能否可视 化?即通过散点图去 发现y与x1,x2…x4的函 数关系? ② 由一元回归模 型得到启示,我们是 否欲寻找关系: y = E(Y|x1,x2,x3,x4) 即 y = f(x1,x2,x3,x4) ?
一般的回归模型与任务
Y f ( x) ; 2 ~ N ( 0 , ) Y f ( x1 , x2 ,, xm ) ; 2 ~ N ( 0 , )
6
x 10
10Βιβλιοθήκη 5432
1
0
0
100
200
300
400
500
主要内容
两个引例 线性回归模型
MATLAB软件实现
400 300 200 100 0
1997199819992000
非线性回归模型及软件实现
实 验内容
引例1:钢材消费量与国民收入的关系
为了研究钢材消费量与国民收入之间的关 系,在统计年鉴上查得一组历史数据。
X=[ones(size(x1)),x1,x2,x3,x4]; [b,bint,r,rint,stats]=regress(y,X)
引例2求解
输出结果: b = 191.9158 -0.7719 β0 β1 β2 3.1725 -19.6811 -0.4501 β3 β4 3.3938]
bint = 103.1071 280.7245……(系数的置信区间) r =[ -6.3045 -4.2215 ……8.4422 23.4625 rint=(略) stats = 0.9034(R2) 35.0509(F) Q = r’*r σ2= Q/(n-2) = 537.2092 (近似) 0.0000(p)
2,Fx1 1 统计量和与 yχ 1 对应的概率p。 相关系数 R 回归系数 a , b 以及它们的置信区间 0 残差向量e=Y-Y及它们的置信区间
X , 1 x n
Y yn
残差及其置信区间可以用rcoplot(r,rint)画图。
年 份
消费(吨) 收入(亿) 1964 698 1097 1965 872 1284 1966 988 1502 …… …… …… 1978 1446 2948 1979 2736 3155 1980 2825 3372
试分析预测若1981年到1985年我国国民收 入以4.5%的速度递增,钢材消费量将达到什么 样的水平?
x4
8 6 9 16 15 17 8 10 4 16 7 12 6 4 4 14 6 8 13 11
y
79.3 200.1 163.2 200.1 146.0 177.7 30.9 291.9 160.0 339.4 159.6 86.3 237.5 107.2 155.0 201.4 100.2 135.8 223.3 195.0
x1=17:2:29;x=[x1,x1];
y=[20.48 25.13 26.15 30.0 26.1 20.3 19.35 24.35 28.11 26.3 31.4 26.92 25.7 21.3]; [p,S]=polyfit(x,y,2);p
注意: x,y向量的维数要一致。S是一个数据结构, 用于其它函数的计算。
一元非线性回归分析
32 30 28 26 24 22 20 18 15 20 25 30
一元非线性回归分析
Y a1 x 2 a2 x a3 ; 假设模型 2 ~ N ( 0 , ) 一元多项式回归在matlab 软件中用命令polyfit实
现。如前面的例子,具体计算如下: 输入: (phg1.m)
一元非线性回归分析
在工作空间中,输入yhat,回车,得到预测值。
返 回
多元非线性回归分析
例2:某物质的化学反应问题
<问题背景> 为了研究三种化学元素:氢、n戊烷和 异构戊烷与生成物的反应速度 Y(%)之间的关 系,经试验测定得到某些数据。试建立非线 性回归模型,并进行统计分析。
例2:某物质的化学反应问题
0 {F F1 (m, n m 1)}
2)相关系数 R检验法 2 SR 2 R 2 , 0 {| R | r1 (n k )}
ST
多元线性回归分析
任务三:因素分析
提出问题
检验方法
H 0 : i 0, ˆ
i
H1 : i 0
~ t (n m 1),
Z
年龄 17
如果从数据的散点图上发现y与x没有直线 关系,又如何计算?
相关主题