当前位置:文档之家› 统计分析与SPSS的应用第五版课后练习答案第9章

统计分析与SPSS的应用第五版课后练习答案第9章

《统计分析与SPSS 的应用(第五版)》(薛薇)课后练习答案第9章SPSS 的线性回归分析1利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量, 利用SPSS提供的绘制散点图功能进行一元线性回归分析。

请绘制全部样本以及不同性别下两门课程 成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条 分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。

选择fore 和phy 两门成绩体系散点图步骤:图形 旧对话框 散点图 简单散点图 定义 将fore 导入Y 轴,将phy 导入X 轴,将 sex 导入设置标记确定。

00..00-OOO O O OOO60.00-□8 □□ooo°cPOOOODoOO40 W-OO° 0°o O 0oo o °° 0oOOO20.00- 0 ° 0接下来在SPSS俞出查看器中,双击上图,打开图表编辑'■-jfemalemale閒|匿恚層器-' * ;| !凹jW Array在图表编辑器中,选择“元素”菜单选择总计拟合线选择线性应用再选择元素菜单点击子组拟合线选择线性应用。

40.0050 006G.Q070.0000 0090.001Q0.00分析:如上图所示,通过散点图,被解释变量 y (即:fore )与解释变量phy 有一定的线性关系。

但回归直线的拟合效果都不是很好。

2、请说明线性回归分析与相关分析的关系是怎样的?相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。

相关分析需要依靠回归分析来表现变量之间数量相关的具体形式, 而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。

只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。

如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归” 。

与此同时,相关分析只研究变量之间相关 的方向和程度,不能推断变量之间相互关系的具体形式, 也无法从一个变量的变化来推测另 一个变量的变化情况,因此,在具体应用过程中, 只有把相关分析和回归分析结合起来,才 能达到研究和分析的目的。

线性回归分析是相关性回归分析的一种, 研究的是一个变量的增加或减少会不会引起另一个变量的增加或减少。

3、请说明为什么需要对线性回归方程进行统计检验? 一般需要对哪些方面进行检验? 检验其可信程度并找出哪些变量的影响显著、哪些不显著。

主要包括回归方程的拟合优度检验、显著性检验、回归系数的显著性检验、 残差分析等。

线性回归方程能够较好地反映被解释变量和解释变量之间的统计关系的前提是被解释 变量和解释变量之间确实存在显著的线性关系。

00.00^sexO female O male ■- female^maleFt 2 ^140-)-0182 female: R 2 . ' = 0.208 male: R 2 ^n-0.16S20.00-60.00-40.00-O OQ O回归方程的显著性检验正是要检验被解释变量和解释变量之间的线性关系是否显著, 用线性模型来描述他们之间的关系是否恰当。

一般包括回归系数的检验,残差分析等。

4、请说明SPSS多元线性回归分析中提供了哪几种解释变量筛选策略?向前、向后、逐步。

5、先收集到若干年粮食总产量以及播种面积、使用化肥量、农业劳动人数等数据,请利用建立多元线性回归方程,分析影响粮食总产量的主要因素。

数据文件名为粮食总产量.sav”。

方法:采用“前进“回归策略。

步骤:分析回归线性将粮食总产量导入因变量、其余变量导入自变量方法项选“前进”确定。

如下图:(也可向后、或逐步)模型摘要ANOV Aa.预测变量: (常量) ,施用化肥量 (kg/公顷)b.预测变量: (常量) ,施用化肥量 (kg/公顷),风灾面积比例(%)c.预测变量:(常量) ,施用化肥量(kg/公顷),风灾面积比例(%),份d.预测变量:(常量),施用化肥量(kg/公顷),风灾面积比例(%),份总播种面积万公顷) 年年2风灾面积比例(%)3年份4总播种面积(万 公顷)向前(准则:F-to-enter 的 概率 <=.050 ) 向前(准则:F-to-enter 的 概率 <=.050 ) 向前(准则:F-to-enter 的 概率 <=.050 )模型1 2 3 4.960 .975 .984 .994R 平方.922 .950 .969 .989调整后的R 平方 .919 .947 .966 .987标准估算的错误2203.30154 1785.90195 1428.73617 885.05221a.因变量:粮食总产量(y 万吨)a. 因变量:粮食总产量(y万吨b. 预测变量:(常量),施用化肥量(kg/公顷)C.预测变量:(常量) ,施用化肥量 (kg/公顷), 风灾面积比例 (%) d. 预测变量: (常量) ,施用化肥量 (kg/公顷), 风灾面积比例 (%), 年份e. 预测变量: (常量) ,施用化肥量(kg/公顷),风灾面积比例(%), 年份,总播种面积(万公顷)因变量:粮食总产量万吨结论:如上4个表所示,影响程度中大到小依次是: 施用化肥量(kg/公顷),风灾面积比例(%), 年份,总播种面积(万公顷)。

(排除农业劳动者人数 (百万人)和粮食播种面积(万公顷)对粮食 总产量的影响)易9除农业劳动者人数(百万人)和粮食播种面积(万公顷)后:步骤:分析 回归 线性 将粮食总产量导入因变量、 其余4个变量(施用化肥量(kg/公顷), 风灾面积比例(%),年份,总播种面积(万公顷))导入自变量 方法项选“输入” 确定。

如 下图:系数因变量:粮食总产量万吨粮食总产量回归方程:Y=-7.893X1+15.68X2+7.126X3+7.268X4-7.4566、一家产品销售公司在30个地区设有销售分公司。

为研究产品销售量(y)与该公司的销售价格(x1)、各地区的年人均收入(x2)、广告费用(x3)之间的关系,搜集到30个地区的有关数据。

进行多元线性回归分析所得的部分分析结果如下:1)将第一张表中的所缺数值补齐。

2)写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义。

3)检验回归方程的线性关系是否显著?4)检验各回归系数是否显著?5)计算判定系数,并解释它的实际意义。

6)计算回归方程的估计标准误差,并解释它的实际意义。

(1(2)Y=7589.1-117.886 X1+80.6X2+0.5X3(3)回归方程显著性检验:整体线性关系显著(4)回归系数显著性检验:各个回归系数检验均显著(5 )略(6 )略7、对参加SAT考试的同学成绩进行随机调查,获得他们阅读考试和数学考试的成绩以及性另麼据。

通常阅读能力和数学能力具有一定的线性相关性,请在排除性别差异的条件下,分析阅读成绩对数学成绩的线性影响是否显著。

方法:米用进入回归策略。

步骤:分析回归线性将MathSAT导入因变量、其余变量导入自变量确定。

结果如下:已输入/除去变量a模型已输入变量已除去变量方法1Gender, Verbal SA T输入a. 因变量:Math SATb. 已输入所有请求的变量。

模型RR 平方调整后的R 平方 标准估算的错误1a.710 .505 .499 69.495预测变量:(常量),ANOVA模型 平方和自由度 均方F 显著性1回归 782588.468 2 391294.23481.021.000 b残差767897.951 1594829.547总计1550486.420161a. 因变量:Math SATb. 预测变量:(常量),Gender, Verbal SAT系数些谨性回SVerbal SATIReadin... £> Gender M Sex-块(日)1的1下一页型)自变量(僅炉 verbal SAT (ReadmgS^T]Statistics.... __________ 绘團①、 _________ _____ /保??(S)… 送顼 样式;a …[ Boots trap..谕入确定EESI 11规则WLS 权重型:粘贴迟)重詈迟)]取湧 辛助令 Matti SAT [MathSAH页再双击上图“元素”菜单添加标记应用因变量:因概率P 值小于显著性水平(0.05),所以表明在控制了性别之后,阅读成绩对数学成绩有 显著的线性影响。

8、试根据 粮食总产量.sav 数据,利用SPSS 曲线估计方法选择恰当模型,对样本期外的粮食总产量进行外推预测,并对平均预测误差进行估计。

采用二次曲线步骤:图形旧对话框拆线图简单个案值定义将粮食总产量导入线的表征 确定结果如下:泓粮債总产接下来:分析回归曲线估计粮食总产量导入因变量、年份导入变量,点击年份模型中选择二次项、立方、幕点击“保存”按钮选择保存”预测值”继续确定。

曲线拟合附注03-MAY-2018 09:28:44 已创建输岀注释spss的应用输入数据薛薇《统计分析与(第五版)》第9章SPSS回归分析习题粮食总产量.sav活动数据集数据集1过滤器<无>宽度(W<无>拆分文件<无>工作数据文件中的行数35缺失值处理对缺失的定义用户定义的缺失值被视作缺失。

已使用的个案任何变量中带有缺失值的个案不用于分析。

语法CURVEFIT/VARIABLES=lscl WITH nf/CONSTANT/MODEL=LINEAR QUADRATIC CUBICPOWER/PRINT ANOVA/PLOT FIT/SAVE=PRED .资源处理器时间00:00:00.19用时00:00:00.25使用从 到第一个观测值 最后一个观测值预测从 使用周期后的第一观察到最后一个观测值变量已创建或已修改FIT_1 CURVEFIT 和 MOD_1 LINEAR 中具有 nf的Iscl 的拟合FIT_2CURVEFIT 和 MOD_1 QUADRATIC 中具有nf 的lscl 的拟合FIT_3CURVEFIT 和 MOD_1 CUBIC 中具有 nf的lscl 的拟合FIT_4CURVEFIT 和 MOD_1 POWER 中具有 nf的lscl 的拟合时间序列设置 仃SET)输出量PRINT = DEFAULT保存新变量NEWVAR = CURRENT自相关或偏自相关图中的最大MXAUTO = 16滞后数每个交叉相关图的最大延迟数MXCROSS = 7每个过程生成的最大新变量数MXNEWVAR = 4每个过程的最大新个案数MXPREDICT = 1000用户缺失值处理MISSING = EXCLUDE置信区间百分比值CIN = 95在回归方程中输入变量的容差TOLER = .0001最大迭代参数变化CNVERGE = .001计算标准的方法自相关的错误ACFSE = IND季节周期长度未指定值在绘图中标记观测值的变量未指定包括方程CONSTANTa.此模型需要所有非缺失值为正。

相关主题