当前位置:
文档之家› 管理统计学多元线性回归分析,案例应用步骤解析及EXCEL操作详解
管理统计学多元线性回归分析,案例应用步骤解析及EXCEL操作详解
统计学
(第二版)
回归系数检验和推断
统计学
(第二版)
回归系数的检验
1. 对每一个自变量都要单独进行检验 2. 应用 t 检验统计量
统计学
(第二版)
1. 提出假设
回归系数的检验
(步骤)
H0: bi = 0 (自变量 xi 与 因变量 y 没有线性关系) H1: bi 0 (自变量 xi 与 因变量 y有线性关系)
一元回归结果
SS MS F Significance F 1 15.8713 15.8713 15.81458 0.004080177 8 8.028696 1.003587 9 23.9
Intercept Miles Traveled
Coefficients 标准误差 t Stat P-value Lower 95% Upper 95%下限 95.0%上限 95.0% 1.273913 1.400745 0.909454 0.389687 -1.95621171 4.504038 -1.95621 4.504038 0.067826 0.017056 3.976755 0.00408 0.028495691 0.107156 0.028496 0.107156
统计学
(第二版)
第8讲 多元线性回归
1 2 3 4 5 6
多元线性回归模型 回归方程的拟合优度 显著性检验 多重共线性 利用回归方程进行估计和预测 虚拟自变量的回归
统计学
(第二版)
1 多元线性回归模型
一. 多元回归模型与回归方程 二. 估计的多元回归方程 三. 参数的最小二乘估计
统计学
(第二版)
统计学
(第二版)
二元回归方程的直观解释
二元线性回归模型 y
y b 0 b1 x1 b 2 x2
(观察到的y)
b0
回归面
}
i
x2 (x1,x2) x1
E ( y) b 0 b1 x1 b 2 x2
统计学
(第二版)
估计的多元回归方程
统计学
估计的多元回归的方程
(第二版) (estimated multiple regression equation)
33
统计学
(第二版)
回归统计 Multiple R 0.74833 R Square 0.559998 Adjusted R0.546248 Square 标准误差 25022.71 观测值 100 方差分析 df 回归分析 残差 总计 3 96 99
三元回归结果
SSቤተ መጻሕፍቲ ባይዱ76501718347 60109046053 1.36611E+11
1. 描述因变量 y 的平均值或期望值如何依赖 于自变量 x1, x2 ,…,xp的方程 2. 多元线性回归方程的形式为 E( y ) = b0+ b1 x1 + b2 x2 +…+ bp xp
b1,b2,,bp称为偏回归系数
bi 表示假定其他变量不变,当 xi 每变 动一个单位时,y 的平均变动值
y b 0 b1 x1i b 2 x2i b p x pi i
b0 ,b1,b2 ,,bp是参数 是被称为误差项的随机变量 y 是x1,,x2 , ,xp 的线性函数加上误差项 包含在y里面但不能被p个自变量的线性关系 所解释的变异性
统计学
统计学
(第二版)
多重共线性及其产生的问题
统计学
(第二版)
多重共线性
(multicollinearity)
1. 回归模型中两个或两个以上的自变量彼此 相关 2. 多重共线性带来的问题有
可能会使回归的结果造成混乱,甚至会把分 析引入歧途
可能对参数估计值的正负号产生影响,特别 是各回归系数的正负号有可能同我们与其的 正负号相反
31
统计学
(第二版)
4 多重共线性
一. 多重共线性及其所产生的问题 二. 多重共线性的判别 三. 多重共线性问题的处理
统计学
(第二版)
例:房屋售价
一个房地产经纪人认为房屋的售价可由房屋的面积、卧室 的个数和潜在需求人数来预测。他随机选取了100座 房屋并收集数据如下:
Price 124100 218300 117800 . . Bedrooms 3 4 3 . . H Size 1290 2080 1250 . . demand 3900 6600 3750 . .
0.400575489 1.446275
统计学
(第二版)
回归系数的解释
ˆ y 0.8687 0.0611 Miles 0.9234Deliv
b1=0.0611 当送货次数不变时,行驶里程每 增加1英里,行驶时间期望的估计值增 加0.0611小时。 b2=0.9234 当行驶里程不变时,送货次数每 增加1次,行驶时间期望的估计值增加 0.9234小时。
ˆ ˆ ˆ ˆ b 0 , b1 , b 2 ,, b p是 估计值 ˆ y 是 y 的估计值
b 0 , b1 , b 2 ,, b p
统计学
(第二版)
参数的最小二乘估计
统计学
(第二版)
参数的最小二乘法
1. 使因变量的观察值与估计值之间的离差平方和 ˆ ˆ ˆ ˆ 达到最小来求得 b 0 , b1 , b 2 ,, b p 。即
(第二版)
例:巴特勒运输公司
巴特勒运输公司的主营业务地域为本地, 为了建立更好的工作日程表,经理们计划为 他们的驾驶员估计日常行驶时间。
26
统计学
(第二版)
Miles Number Travel Time Traveled of Deliveries (hours) 100 4 9.3 50 3 4.8 100 4 8.9 100 2 6.5 50 2 4.2 80 2 6.2 75 3 7.4 65 4 6.0 90 3 7.6 90 2 6.1
2. 计算检验的统计量 t
3. 确定显著性水平,并进行决策
t>t2,拒绝H0; t<t2,不拒绝H0
统计学
(第二版)
回归系数的推断
(置信区间)
回归系数在(1-)%置信水平下的置信区间为
ˆ b i t 2 (n p 1)s bˆ
回归系数的 抽样标准差
i
统计学
(第二版)
多元回归模型
(基本假定)
1. 误差项ε是一个期望值为0的随机变量,即 E()=0 2. 对于自变量x1 ,x2 ,…,xp 的所有值, 的 方差2都相同 3. 误差项ε是一个服从正态分布的随机变量, 即ε~N(0,2),且相互独立
统计学
(第二版)
多元回归方程
(multiple regression equation)
1. 对误差项的标准差的一个估计值 2. 衡量多元回归方的程拟合优度 3. 计算公式为
统计学
(第二版)
3 显著性检验
一. 线性关系检验 二. 回归系数检验和推断
统计学
(第二版)
线性关系检验
统计学
(第二版)
线性关系检验
1. 检验因变量与所有自变量之间的是否显著 2. 也被称为总体的显著性检验 3. 检验方法是将回归离差平方和(SSR)同剩余离 差平方和(SSE)加以比较,应用 F 检验来分 析二者之间的差别是否显著
2. 求解各回归参数的标准方程如下
Q b 0 Q b i 0
ˆ b0 b0
0
ˆ bi bi
(i 1,2, , p )
统计学
(第二版)
参数的最小二乘法
(例题分析)
【例】一家大型商业银行在多个地区设有分行, 为弄清楚不良贷款形成的原因,抽取了该银行 所属的25家分行2002年的有关业务数据。试建 立不良贷款(y)与贷款余额(x1)、累计应收贷款 (x2)、贷款项目个数(x3)和固定资产投资额(x4)的 线性回归方程,并解释各回归系数的含义
27
统计学
(第二版)
10.0
Travel time
8.0 6.0 4.0 2.0 0.0 0 20 40 60 80 Miles traveled 100 120
28
统计学
(第二版)
SUMMARY OUTPUT 回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 df 回归分析 残差 总计 0.814906 0.664071 0.62208 1.001792 10
ˆ ˆ ˆ ˆ 1. 用样本统计量 b 0 , b1 , b 2 ,, b p 估计回归方 程中的 参数 b 0 , b1 , b 2 ,, b p 时得到的方程 2. 由最小二乘法求得 3. 一般形式为
ˆ ˆ ˆ ˆ ˆ y b 0 b1 x1 b 2 x2 b p x p
如果是显著的,因变量与自变量之间存在线性 关系 如果不显著,因变量与自变量之间不存在线性 关系
统计学
(第二版)
1. 提出假设
线性关系检验
H0:b1b2bp=0 线性关系不显著 H1:b1,b2,,bp至少有一个不等于0
2. 计算检验统计量F
3. 确定显著性水平和分子自由度p、分母自由度np-1找出临界值F 4. 作出决策:若F>F ,拒绝H0
用Excel进行回归
统计学
(第二版)
2 回归方程的拟合优度
一. 多重判定系数 二. 估计标准误差
统计学
(第二版)
多重判定系数
统计学
多重判定系数
(第二版) (multiple coefficient of determination)