SPSS统计练习题及答案一、选择题(选择类)(A)1、在数据中插入变量的操作要用到的菜单是:AInsertVariable; BInsert Case; C Go to Case; DWeightCases(C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是:A Sort Cases;B Select Cases;C Compute; DCategorizeVariables(C)3、Transpose菜单的功能是:A 对数据进行分类汇总;B 对数据进行加权处理;C对数据进行行列转置;D按某变量分割数据(A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=0.043,说明: A.按照0.05显著性水平,拒绝H0,说明三种城市的平均身高有差别;B.三种城市身高没有差别的可能性是0.043;C.三种城市身高有差别的可能性是0.043;D.说明城市不是身高的一个影响因素(B)5、下面的例子可以用Paired-Samples TTest过程进行分析的是:A家庭主妇和女大学生对同种商品喜好的差异;B服用某种药物前后病情的改变情况;C 服用药物和没有服用药物的病人身体状况的差异;D性别和年龄对雇员薪水的影响二、填空题(填空类)6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。
7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。
8、One-Samples TTest过程用于进行样本所在总体均数___与__已知总体均数_的比较。
三、名词解释(问答类)9、RepeatedMeasures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。
10、Chi-Squaretest:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。
比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。
四、简答题(问答类)11、用SPSS对数据进行分析的基本流程是什么?答:(1)、将数据输入SPSS,并保存;(2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法;(3)、按题目要求进行统计分析;(4)、保存和导出分析结果。
12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么?答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。
13、简述SPSS打开其它格式数据的几种方法?答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮;(2)、使用数据库查询打开:选择菜单File==>OpenDatabase==>New Query,根据向导打开数据;(3)、使用文本向导读入文本文件:选择菜单File==>Read TextData14、指定数据按某个变量进行排序需要用到哪个菜单?答:Date==>Sort Cases15、两因素以上的方差分析在SPSS中用什么来完成?答:这些方差分析一律可归入一般线性模型,所以在SPSS中都被归入了GeneralLineal Model子菜单。
16、简述Descriptive Statistics菜单的组成和功能。
答:描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。
SPSS中专门为该目的而设计的几个模块集中在DescriptiveStatistics菜单中,最常用的是列在最前面的四个过程:(1)、Frequencies过程的特色是产生频数表(2)、Descriptives过程进行一般性的统计描述;(3)、Explore过程用于对数据概况不清时的探索性分析;(4)、Crosstabs过程则完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的卡方检验也在其中完成。
17、简述在多元线性回归分析中,SPSS筛选自变量进入回归方程的四种方法。
答:这四种方法是:强迫法、逐步法、向前法、向后法。
(1)逐步回归法(stepwise),是运用甚为广泛的复回归分析方法之一,也是多元回归分析报告中出现几率最多的一种预测变量的方法。
它结合“向前法”(forward selection)和“向后法”(backwardelimination)二种方式的优点。
(2)向前法是自变量一个一个进入回归模式中,而向后法是先将所有的自变量纳入回归模式中,之后再逐一将对模式贡献最小的预测变量移除,直到所有的自变量均达到标准为止。
(3)强迫回归法(Enter)也是一种常见的方法,强迫所有变量有顺序进入回归方程。
18. 试说明多元线性回归分析中的“共线性”问题及判断标准。
答:多元回归分析中要留意“共线性”(collinarity)问题,它是指由于自变量间的相关太高,造成回归分析的情境困扰,使回归模式的参数不能完全被估计出来。
自变量间的共线性问题可由容忍度(tolerance)、变异数膨胀因素(VIF)和条件指针(condition index;CI)。
一般而言,容忍度越接近0、VIF越大或条件指针越大(大于15),则越有可能存在共线性问题。
19、下表是不同职业与工作满意感之间相关分析的结果,试判断不同职业与满意感之间是否有相关,如果有,相关系数是多少?答:由于显著性水平P=0.662>0.05,说明二者之间不存在显著性相关。
五、分析题(问答类)20、某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下:患者: 0.84 1.051.20 1.20 1.391.53 1.67 1.80 1.87 2.07 2.11健康:0.54 0.640.64 0.750.760.81 1.16 1.20 1.34 1.35 1.481.56 1.87 (1)将数据录入SPSS,保存为li1_1.sav;(2)分析该地克山病患者和健康人的血磷脂是否不同;(3)保存结果。
21、在数据li1_1.sav中生成新变量temp,当血磷值小于1.5时取值为1,1.5~2时取值为2,大于2时取值为3,并保存结果。
答:操作步骤如下:(1)、OutputVariable框:选入x;(2)、Output Variable Name框:键入temp,单击Change钮;(3)、选中x->temp:单击Old and New Values钮;(4)、Range:Lowest through*单选钮:键入1.5;NewV alueValue单选钮:键入1;单击Add钮;(5)、Range:*through*单选钮:两侧分别键入1.5、2;New ValueValue单选钮:键入2;单击Add钮; (6)、Range:All othervalues单选钮;New Value Value单选钮:键入3;单击Add钮;(7)、单击Continue;(8)、单击OK;22、数据li3_1.sav记录的是某班50名学生语、数、外三门科目的考试成绩,分别作出三科得分频数表、计算均数、标准差、中位数、P2.5和P97.5,并画出直方图。
答:操作步骤如下:(1).Analyze==>Descriptive Statistics==>Frequencies;(2).Variables框:选入变量engl(外)、chin(语)、math(数);(3).单击Statistics钮;(4).选中Mean、Std.deviation、Median复选框;(5).单击Percentiles:输入2.5:单击Add;输入97.5:单击Add;(6)单击Continue钮;(7).单击Charts钮;(8).选中Bar charts;(9).单击Continue钮;(10).单击OK;23、根据数据li3_1.sav分析该班男、女生在语、数、外三科得分上有无差异。
答:(1).Analyze==>CompareMeans==>Independent-SamplesT Test;(2)Test Variables框:选入变量engl(外)、chin(语)、math(数);(3)Grouping Variable框:选入变量gender;(3)单击Define Groups钮;(4)选择Usespecified Values,在group1中填1,在group2中填2;(5)单击Continue钮;(6)单击OK。
24、某驾校学校欲购进一批驾驶模拟训练器,为了知道它们的效果,进行了一次实验。
从新学员中随机抽取12名进行训练,训练前和训练后分别对学员驾驶技能进行测试,结果如下:训练前66.068.070.0 65.0 67.0 82.0 60.559.0 71.077.0 66.0 70.5 训练后62.585.070.0 73.065.0 63.560.5 76.075.5 65.0 62.5 72.0试问模拟器训练的效果如何?答:用Paired-SampleTTest分析(1)、录入数据:设变量x1,x2 分别代表训练前和训练后值,在SPSS 中输入数据。
(2)、统计分析:依次选择Analyze-Compare means-Paired samplesT test(配对t检验),弹出对话框,将变量x1、x2同时选入Paired Variables框(同时选中x1、x2)。
在Options子对话框中可定义可信区间和缺失值的处理。
单击OK键提交执行即可得结果。
25、美国国家计算机产品公司在亚特兰大、达拉斯以及西雅图都设有工厂,生产传真机与打印机。
为了确定这三个工厂的工人的产品质量管理意识水平,特意从每个工厂随机选取10个工人,对他们进行质量意识考试,员工考试的结果如下。
请问这三个工厂员工的质量管理意识水平有无显著差异?若有显著差异,根据统计结果直接观察,哪个工厂最低? 亚特兰大85 7582 767185 79 83 7478达拉斯7175 7374 6982 74 787668西雅图59 646269756766 62 69 70答:数据已经输好,分组变量为group,三组取值分别为1、2、3,结果变量为X。