SPSS课后作业第一章1-1、spss的运行方式有几种?分别是什么?答:SPSS的运行方式有三种,分别是批处理方式、完全窗口菜单运行方式、程序运行方式。
1-2、SPSS中“DataView”所对应的表格与一般的电子处理软件有什么区别?答:与一般电子表格处理软件相比,SPSS的“Data View”窗口还有以下一些特性:(1)一个列对应一个变量,即每一列代表一个变量(Variable)或一个被观测量的特征;(2)行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS中称为事件(Case);(3)单元包含值,即每个单元包括一个观测中的单个变量值;(4)数据文件是一张长方形的二维表。
第二章2-1、在SPSS中可以使用那些方法输入数据?答:SPSS中输入数据一般有以下三种方式:(1)通过手工录入数据;(2)可以将其他电子表格软件中的数据整列(行)的复制,然后粘贴到SPSS中;(3)通过读入其他格式文件数据的方式输入数据。
2-2、对于缺失值,如何利用SPSS进行科学替代?答:选择“Transform”菜单的Replace Missing Values命令,弹出Replace Missing Values 对话框。
先在变量名列中选择1个或多个存在缺失值的变量,使之添加到“New Variable(s)”框中,这时系统自动产生用于替代缺失值的新变量。
最后选择合适的替代方式即可。
2-3、在计算数据的加权平均数时,如何对变量进行加权?答:选择“Data”菜单中的Weight Cases命令,出现如图2-22所示的Weight Cases对话框。
其中, Do not weight cases项表示不做加权,这可用于取消加权;Weight cases by 项表示选择1个变量做加权。
2-4、如何对变量进行自动赋值?答:变量的自动赋值可以将字符型、数字型数值转变成连续的整数,并将结果保存在一个新的变量中。
具体操作的过程如下:选择“Transform”菜单中的Automatic Recode命令,在出现的对话框中,从左边的变量列表中选择需要自动赋值的变量,将它添加到Variable -> New Name框中,然后在下面New Name右边的文本框中输入新的变量名称,单击New Name 按钮,将新的变量名添加到上面的框中。
从Recode Starting from框中有两个选项中选择一个,然后单击OK按钮,即可完成自动赋值运算。
3-1、一组数据的分布特征可以从哪几个方面进行测度?答:一组数据的分布特征可以从平均数、中位数、众数、方差、百分位、频数、峰度、偏度等方面描述。
3-2、简述众数、中位数和均值的特点及应用场合。
答:均值是总体各单位某一数量标志的平均数。
平均数可应用于任何场合,比如在简单时序预测中可用一定观察期内预测目标的时间序列的均值作为下一期的预测值。
中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。
中位数的作用与算术平均数相近,也是作为所研究数据的代表值。
在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。
在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响。
众数是指一组数据中出现次数最多的那个数据。
它主要用于定类(品质标志)数据的集中趋势,当然也适用于作为定序(品质标志)数据以及定距和定比(数量标志)数据集中趋势的测度值。
3-3、(1)由题,用spss导出结果:Statistics日销售额N Valid 30Missing 0Mean 277.40Median 277.00Percentiles 25 256.0050 277.0075 301.00可知,该百货公司日销售额的均值为277.40万元,中位数为277万元,四分位数为256万元。
(2)由题,用spss导出结果:Statistics日销售额N Valid 30Missing 028.246Std.Deviation可知,日销售额的标准差为28.246万元。
3-4、(1)答:应采用方差、标准差来比较成年组和幼儿组的身高差异。
(2)由题,用spss导出结果:Statistics成人组身高幼儿组身高N Valid 10 10Missing 0 04.158 2.404Std.DeviationVariance 17.289 5.778可知,成人组方差及标准差都大于幼儿组,故成人组的身高差异较大。
4-1、如何检验某个单一样本某变量的总体均值和指定值之间是否存在显著差异?答:通过单一样本T检验可以检验某个单一样本某变量的总体均值与指定值之间是否存在显著差异。
4-2、如何对两个独立样本进行均值差异检验?答:对两个独立样本进行均值差异检验需要通过两步来完成:第一,利用F检验判断两总体的方差是否相同;第二,根据第一步的结果,决定T统计量和自由度计算公式,进而对T 检验的结论作出判断。
4-3、对两配对样本进行T检验的前提要求是什么?答:两配对样本T检验的前提要求是:两个样本应是配对的且样本来自的两个总体应服从正态分布。
4-4、(1)由题,用spss导出结果:Statistics用药前用药后N Valid 6 6Missing 0 0Mean 124.67 118.67Variance 175.467 331.867可知,治疗前这六名病人的均值为124.67,方差为175.467,用药后的均值为118.67,方差为331.867,可见治疗后均值降低,而方差变大。
(2)用配对样本T检验方法进行检验,导出数据:可知,伴随概率为0.337,大于显著性水平0.05,因而接受原假设,即治疗前后没有显著的变化。
4-5、用两独立样本T检验进行检验,导出数据:数学Equal variances assumed 3.006 13.2942.990 13.310Equal variances notassumed可知,甲乙两个班级学生的数学成绩方差无显著性差异,而这两个班级的学生数学成绩均值之间有差异,甲班成绩要高于乙班同学的数学成绩。
5-1、如何检验两个及两个以上样本均数之间是否存在显著差异?答:方差分析可以用来检验两个及两个以上样本均数之间是否存在显著差异。
5-2、进行多因素方差分析时为什么要将观察变量总的离差平方和分解为3个部分?答:因为多因素方差分析不仅需要分析多个控制变量独立作用对观察变量的影响,还要分析多个控制变量交互作用对观察变量的影响,及其他随机变量对结果的影响。
因此,它需要将观察变量总的离差平方和分解为3个部分。
5-3、什么是协方差分析?什么情况适于使用协方差分析?答:协方差分析是将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制因素进行评价。
当有一些很难控制的随机变量时,可以使用协方差分析将这些随机变量作为协变量。
5-4、用单因素方差检验进行检验,导出结果:Test of Homogeneity of Variances肺活量LeveneStatistic df1 df2 Sig..408 2 26 .669ANOVA肺活量Sum of Squares df Mean Square Between Groups (Combined) 10.919 2 5.460 Linear Term Unweighted 10.804 1 10.804Weighted 10.804 1 10.804Deviation .115 1 .115Within Groups 1.462 26 .056Total 12.381 28ANOVA肺活量F Sig.Between Groups (Combined) 97.103 .000Linear Term Unweighted 192.160 .000Weighted 192.160 .000Deviation 2.045 .165 Post Hoc TestsHomogeneous Subsets肺活量组别Subset for alpha = 0.05 N 1 2 3Student-Newman-Keuls a,,b病10 1.6900可疑9 2.2889非10 3.1600Sig. 1.000 1.000 1.000 Means for groups in homogeneous subsets are displayed.a. Uses Harmonic Mean Sample Size = 9.643.b. The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed.Means Plots由上可知,患者,可疑患者和非患者三个组的总体方差是相等的,也就具备了进行方差检验的条件,从单因素方差检验结果看,这三个组之间存在着显著差异。
5-5、主体间效应的检验因变量:治疗后的血压源III 型平方和df 均方 F Sig.校正模型603.203a 3 201.068 .831 .499截距2461.484 1 2461.484 10.174 .007治疗前的血压150.425 1 150.425 .622 .444组别551.519 2 275.759 1.140 .348误差3387.075 14 241.934总计314725.000 18校正的总计3990.278 17a. R 方 = .151(调整 R 方 = -.031)F值和相伴概率分别为1.140和0.348。
这说明不同的治疗方法没有对血压造成显著影响。
协变量作用部分:这里治疗前的血压的离差平方和150.425,均方为150.425。
F值和相伴概率分别为0.622和0.444,表明协变量没有对观察结果造成显著影响。
成对样本检验成对差分t df Sig. (双侧)均值标准差均值的标准误差分的 95% 置信区间下限上限对 1 治疗前的血压 - 治疗后的血压39.44424.064 5.672 27.478 51.411 6.95417 .0000.05,说明治疗前后血压值有了明显变化,治疗后的血压比治疗前的低。
综上:这三个组别的接受治疗的患者在接受治疗之前各组之间没有显着性差异,在接受治疗之后,三个组别之间仍然没有显着性差异。
但是通过配对样本的T检验得知,用这三种治疗方法进行治疗的患者在治疗前后血压都有有显着性差异,也即是说三种治疗方法都是有效的,并且彼此之间差别不显着。
6-1、什么是相关分析?常用的方法有哪些?答:衡量事物之间,或称变量之间线性相关程度的强弱并用适当的统计指标表示出来,这个过程就是相关分析。