当前位置:文档之家› 三峡大学SPSS实验

三峡大学SPSS实验

2015-4-26
三峡大学
经济与管理学院
显著性水平值小于0.05,该项不会显著为 0;大于0.05,该项会显著为0。
回归方程为 y 0.716x
2015-4-26
三峡大学
经济与管理学院
第二节 多元线性回归(Linear过程)
主要功能和原理介绍 在实际问题中,因变量常受不只一个自变 量的影响。如:植物生长速度受温度、光照、 水分、营养等许多因素的影响;家庭消费支出 受可支配收入水平、以往消费水平、收入水平 的影响;汽车的需求量受人们的收入水平、汽 车价格、汽车使用费用的高低等影响。 多元线性回归就是研究某一个因变量和多 个自变量之间的相互关系的理论与方法。
y
2015-4-26
i
a b j x ji i
j 1
p
i 1, 2,.....n
三峡大学
经济与管理学院
多元线性回归方程中变量的选取
1.向后剔除法(Backward Elimination)
• (1)将所有的P个自变量全部选入回归模型,然后估计出 回归系数; • (2)检验回归系数是否为零; • (3)去掉在回归系数检验中没有通过的检验(即回归系 数为零)具有最小F值的变量,将剩余的P-1个自变量作回 归模型,再估计出回归系数,如果没有通过检验的变量较 多,将检验水平选的稍微大一点,如0.10; • (4)再对P-1个自变量作回归系数进行是否为零的检验, 如果还有变量的回归系数没有通过检验,再去掉在回归系 数检验中具有最小F值的变量,将剩余的P-2个自变量再作 回归模型估计出回归参数; • (5)依此进行下去直到所剩变量均通过检验。
60.00 45.00 62.00 88.00 92.00 99.00 75.00 98.00 18.00
40.00 30.00 42.00 60.00 65.00 70.00 53.00 78.00 15.00
三峡大学
经济与管理学院
【回归】—【线性】
2015-4-26
三峡大学
经济与管理学院
模型 1
1
1 2 3 4 5
2015-4-26
三峡大学
经济与管理学院
预测值转化为标准化形式。(预测值均值预测值)/预测值标准差 由于排除了特定个案而导致的回归 系数和预测值的变化
在特定个案从回归系数的计算中排出 的情况下,所有个案残差变化幅度的 测量。较大的COOK距离表明从回归 统计量的计算中排除个案后,系数会 发生根本变化。
2015-4-26
三峡大学
经济与管理学院
(3)回归系数的显著性检验(t检验) 回归方程的显著性检验只能检验所有回归系数是 否同时与零有显著性差异,它不能保证回归方程中不 包含不能较好解释说明因变量变化的自变量。因此, 可以通过回归系数显著性检验对每个回归系数进行考 察。 回归参数显著性检验的基本步骤: ① 提出假设; ② 计算回归系数的t统计量值; ③ 根据给定的显著水平α 确定临界值,或者计算 t值所对应的p值; ④ 作出判断(t对应的显著性水平小于0.05或0.1, 认为其对应的系数不会显著为0)。
2015-4-26
三峡大学
经济与管理学院
例一:已知10户居民家庭的月可支配收入和消费支出数据,试 采用一元线性回归分析方法,根据可支配收入的变化来分析 消费支出的变化情况?见第五讲例题一data5-1 单位:百元 编号 可支配收入 消费支出 1 18.00 15.00
2015-4-26
2 3 4 5 6 7 8 9 10
系数a
容差的倒数。值 越大说明共线性 问题越严重,大 于2被认为有共线 性问题。
标准系 非标准化系数 数 相关性 共线性统计量 标准 B Sig. 零阶 误差 试用版 t 偏 部分 容差 VIF 1 (常量) - 119.68 -1.270 .215 152.056 9 .664 .355 .104 1.868 .073 .495 .344 .091 .766 1.306 人均粮食占有 量 .248 .035 .848 7.101 .000 .964 .812 .346 .166 6.008 农作物总的耕 种面积 .054 .076 .073 .710 .484 .862 .138 .035 .225 4.453 有效灌溉面积 .069 .420 .011 .164 .871 .619 .032 .008 .536 1.864 化肥施用量
2015-4-26
三峡大学
经济与管理学院
第一节
一元线性回归
线性回归的统计原理: 两个定距变量的回归是用函数来分析的。我们最 常用的是一元线性回归方程:
y a bx
通过样本数据建立一个回归方程后,不能立即就 用于对某个实际问题的预测。因为,应用最小二乘法 求得的样本回归直线作为对总体回归直线的近似,这 种近似是否合理,必须对其作各种统计检验。具体统 计检验有:
度量某个点对回归拟合的影响。一 般情况下值大于0.06就要引起注意。
2015-4-26
三峡大学
经济与管理学院
练习:
数据data5-2是某企业1987~1998年的经济
效益、科研人员、科研经费的统计数据。假定 1999年该企业科研人员61名、科研经费40万元, 试预测1999年该企业的经济效益。
2015-4-26
2015-4-26
三峡大学
经济与管理学院
特征值越接近0,自变量间 的相关性越高,意味着数 据中微小变动引起预测值 的大变化。
模型 维数
大于15表示可能存在共线性问 题,大于30则表示有严重的多 重共线性问题。
共线性诊断a 方差比例 农作物总 人均粮食 的耕种面 有效灌溉 化肥施 特征值 条件索引 (常量) 占有量 积 面积 用量 4.275 1.000 .01 .01 .00 .00 .01 .396 3.287 .10 .10 .01 .01 .25 .202 4.599 .12 .00 .03 .14 .49 .091 6.841 .74 .76 .00 .07 .09 .035 11.012 .02 .13 .96 .77x指农作物总的播种面积 )
2015-4-26
三峡大学
经济与管理学院
2015-4-26
三峡大学
经济与管理学院
判定自变量对回归 模型的作用,值越 大,对模型的贡献 越大。
模型
该变量不能被其他变量解 释的变异百分比。值越小 被其他变量解释的变异百 分比越大,共线性问题越 严重。
2015-4-26
三峡大学
经济与管理学院
(1)拟合优度检验 回归方程的拟合优度检验就是要检验样本数据 聚集在样本回归直线周围的密集程度,从而判断回 归方程对样本数据的代表程度。
回归方程的拟合优度检验一般用判定系数
R
2
实现。该指标是建立在对总离差平方和进行分解的
基础之上。
2015-4-26
三峡大学
系数a 非标准化系数 标准系数 B 标准 误差 试用版 -152.056 119.689 .248 .035 .848 .664 .355 .104 .054 .076 .073 .069 .420 .011
t -1.270 7.101 1.868 .710 .164
Sig. .215 .000 .073 .484 .871
经济与管理学院
(2)回归方程的显著性检验(F检验) 回归方程的显著性检验是对因变量与所有自变 量之间的线性关系是否显著的一种假设检验。一般 采用F检验,利用方差分析的方法进行。 回归参数显著性检验的基本步骤: ① 提出假设; ② 计算回归方程的F统计量值; ③ 根据给定的显著水平α 确定临界值,或者计 算F值所对应的p值; ④ 作出判断(F对应的显著性水平小于0.05或 0.1,可以判断回归方程系数不会同时为0,回归方 程存在。)
4.删除法
强迫将所有不进入方程模型的备选变量一次剔除。
2015-4-26
三峡大学
经济与管理学院
例二: 已知全国各地区的粮食生产情况,给出了人均粮 食占有量(公斤)、粮食产量(万吨)、农作物总的 播种面积(千公顷)、有效灌溉面积(千公顷)以及 化肥施用量(万吨)。试以粮食产量为因变量。其他 变量为自变量进行多元线性回归分析,建立回归方程?
2015-4-26
三峡大学
经济与管理学院
Anovab 模型 1 回归 残差 总计 模型 1 (常量) 农作物总的耕种面积 人均粮食占有量 有效灌溉面积 化肥施用量 平方和 29241179.832 1922610.196 31163790.028 df 4 26 30 均方 7310294.958 73946.546 F 98.859 Sig. .000
三峡大学
经济与管理学院
第五讲 回归分析
在数量分析中,经常会看到变量与变量之 间存在着一定的联系。要了解变量之间如何发 生相互影响的,就需要利用相关分析和回归分 析。 本讲介绍回归分析基本概念、主要类型: 一元线性、多元线性、非线性回归分析、曲线 估计、时间序列的曲线估计、含虚拟自变量的 回归分析以及逻辑回归分析等。
2015-4-26
三峡大学
经济与管理学院
2015-4-26
三峡大学
经济与管理学院
模型 1
输入/移去的变量b 输入的变量 移去的变量 方法 .输入 化肥施用量, 人 均粮食占有量, 有效灌溉面积, 农作物总的耕种 面积a
模型汇总 模型 R 1 .969
标准 估计 R 方 调整 R 方 的误差 .938 .929 271.93114
2015-4-26
三峡大学
经济与管理学院
3.逐步回归法(Stepwise Regression)
是将向后剔除法和向前选择法结合起来用,基本步骤: (1)采用向前选择的方式选择第一个方程贡献最大的变量 ,若通不过显著性检验则终止选择; (2)对未引入过方程的自变量,分别考察它们对方程的贡 献; (3)从中找出最大的变量进行显著性检验,如果不显著计 算结束,如果显著则将该自变量正式引入方程; (4)除方程中刚引入的变量以外的其他变量,分别计算它 们对方程的贡献; (5)从中找出最小者进行显著性检验,如果显著则没有要 剔除的变量,回到第一步,否则剔除该变量,再回到第2步。
相关主题