当前位置:文档之家› SPSS实验报告

SPSS实验报告

第四章描述性统计分析一、实验目的通过计算诸如样本均值、中位数、样本方差等重要基本统计量,并辅助于SPSS提供的图形功能,能够使分析者把握数据的基本特征和数据的整体分布形态,对进一步的统计推断和数据建模工作起到重要作用。

并且,通过例子学习描述性统计分析及其在SPSS中的实现,包括统计量的定义及计算、频率分析、描述性分析、探索性分析、交叉表分析和多重响应分析,能够使分析者更好的掌握基本的统计分析,即单变量频数分布的编制、基本统计量的计算以及数据的探索性分析等。

二、实验内容1.打开数据文件data4-8.sav,完成以下统计分析。

(1)计算各科成绩的描述统计量:平均成绩、中位数、众数、标准差、方差、极差、最大值和最小值;①解决问题的原理:描述性分析②实验步骤:通过“分析-描述统计-描述”,打开“描述性”对话框,根据题目所需要的统计量进行设置。

③结果及分析:表中分析变量“成绩”的个案数、所有个案中的极大值、极小值、均值、标准差及方差。

(2)使用Recode命令生成一个新变量“成绩段”,其值为各科成绩的分段:90~100为1,80~89为2,70~79为3,60~69为4,60分以下为5,其值标签:1—优,2—良,3—中,4—及格,5—不及格。

分段以后进行频数分析,统计各分数段的人数,最后生成条形图和饼图。

①解决问题的原理:频率分析。

②实验步骤:通过“分析-描述统计-频率”,打开“频率”对话框,根据题目所需要的统计量进行设置。

③结果及分析:成绩频率百分比有效百分比累积百分比有效15 1 2.2 2.2 2.219 1 2.2 2.2 4.424 1 2.2 2.2 6.728 1 2.2 2.2 8.930 1 2.2 2.2 11.132 2 4.4 4.4 15.633 1 2.2 2.2 17.834 1 2.2 2.2 20.036 1 2.2 2.2 22.237 2 4.4 4.4 26.743 1 2.2 2.2 28.949 1 2.2 2.2 31.150 1 2.2 2.2 33.355 1 2.2 2.2 35.656 4 8.9 8.9 44.460 3 6.7 6.7 51.162 1 2.2 2.2 53.363 1 2.2 2.2 55.669 1 2.2 2.2 57.870 1 2.2 2.2 60.073 3 6.7 6.7 66.774 1 2.2 2.2 68.975 1 2.2 2.2 71.176 1 2.2 2.2 73.378 1 2.2 2.2 75.681 1 2.2 2.2 77.883 1 2.2 2.2 80.085 2 4.4 4.4 84.486 1 2.2 2.2 86.790 2 4.4 4.4 91.191 1 2.2 2.2 93.395 2 4.4 4.4 97.898 1 2.2 2.2 100.0合计45 100.0 100.0表中显示了变量“成绩段”在各个取值上出现的次数(频率)、其频率占所有个案中的百分比、有效百分比及累积百分比。

表中显示了变量“成绩段”的直方图,从图上可以看出不具备明显的正态分布。

表中显示了变量“成绩段”的饼图,从图上可以更好的看出“成绩段”的分布。

2.打开数据文件data4-9.sav ,完成以下统计分析。

(1)对身高进行考察,分析四分位数,计算上奇异值、上极端值、下奇异值和下极端值,并生成茎叶图和箱图; ①解决问题的原理:探索性分析②实验步骤:通过“分析-描述统计-探索”,打开“绘制”对话框,根据题目所需要的统计量进行设置。

③结果及分析:身高 Stem-and-Leaf PlotFrequency Stem & Leaf2.00 9 . 9916.00 10 . 000000122233334439.00 10 . 555555556666677778888888999999999999999 18.00 11 . 000000112222233344 13.00 11 . 5556667788999 7.00 12 . 0000002000 1.00 12 . 5Stem width: 10.0 Ea00ch leaf: 1 case(s)从上的茎叶图可以更加详细地分析身高数据。

表4.22 吸烟人群健康状况调查表 是 患病 43 是 健康 162 否 患病 13 否健康121从上的箱图可以分析变量“身高”的四分位数。

(2)考察身高、体重和胸围的正态性。

①解决问题的原理:运用频率分析、描述性分析、探索性分析。

②实验步骤:通过“分析-描述统计-交叉表”,打开“交叉表”对话框,根据题目所需要的统计量进行设置。

③结果及分析:从上的Q-Q图中可以看出,身高、体重、胸围三个变量都很好的服从正态分布。

3.表4.22是对吸烟与患气管炎的调查表,试分析吸烟与患气管炎之间的关系。

(用交叉列联表分析,参见数据文件:data4-10.sav。

)①解决问题的原理:运用交叉表分析。

②实验步骤:通过“分析-描述统计-交叉表”,打开“交叉表”对话框,根据题目所需要的统计量进行设置。

③结果及分析:表给出了数据基本信息,表中给出了参与分析的个案数、缺失信息等。

本例中,每个变量有4个个案参与分析,无缺失值。

是否患气管炎* 是否吸烟交叉制表计数是否吸烟是否合计是否患气管炎患病 1 1 2健康 1 1 2合计 2 2 4表给出了了数据的交叉表,与原始数据在形式上基本一致。

各组状况条形图相当于交叉表的直观表示,用图形表示可直观地得出各种情况的比较。

4.为分析某中学学生填报志愿的倾向,设计了一道问卷调查题,每位同学可填报3个志愿,请按顺序依次选择打算报考的大学:第一志愿第二志愿第三志愿①北京大学②清华大学③复旦大学④中国人民大学⑤北京交通大学⑥四川大学问卷调查的结果存放在SPSS数据文件data4-11.sav中,按如下要求进行统计分析。

(1)对第一、二、三志愿填报情况进行统计分析;(2)对各学校填报志愿的情况进行统计分析,包括人数、百分比等。

①解决问题的原理:运用频率分析、描述性分析、交叉表分析。

②实验步骤:通过“分析-描述统计-频率”,打开“频率”对话框,根据题目所需要的统计量进行设置。

通过“分析-描述统计-交叉表”,打开“交叉表”对话框,根据题目所需要的统计量进行设置。

③结果及分析:统计量志愿1 志愿2 志愿3N 有效100 100 100缺失0 0 0中值 3.00 3.00 3.00众数 3 3 4标准差 1.578 1.429 1.642方差 2.491 2.041 2.695极小值 1 1 1极大值 6 6 6百分位数25 2.00 2.00 2.0050 3.00 3.00 3.0075 4.00 4.00 5.00频率表志愿1频率百分比有效百分比累积百分比有效 1 20 20.0 20.0 20.02 17 17.0 17.0 37.03 26 26.0 26.0 63.04 14 14.0 14.0 77.05 14 14.0 14.0 91.06 9 9.0 9.0 100.0合计100 100.0 100.0志愿2频率百分比有效百分比累积百分比有效 1 20 20.0 20.0 20.02 24 24.0 24.0 44.03 26 26.0 26.0 70.04 15 15.0 15.0 85.05 10 10.0 10.0 95.06 5 5.0 5.0 100.0合计100 100.0 100.0志愿3频率百分比有效百分比累积百分比有效 1 14 14.0 14.0 14.02 19 19.0 19.0 33.03 18 18.0 18.0 51.04 21 21.0 21.0 72.05 12 12.0 12.0 84.06 16 16.0 16.0 100.0合计100 100.0 100.0表中显示了变量“志愿”在各个取值上出现的次数(频率)、其频率占所有个案中的百分比、有效百分比及累积百分比。

三、实验心得与体会通过本章例子学习描述性统计分析及其在SPSS中的实现,学会了基本描述性统计量的定义及计算、频率分析、描述性分析、探索性分析、交叉表分析。

深刻体会到了如何计算诸如样本均值等重要的基本统计量,并辅助于SPSS提供的图形功能来分析把握数据的基本特征和数据的整体分布形态。

同时加强了自己的操作能力。

第五章参数估计与假设检验一、实验目的如果掌握了所研究总体的全部数据,那么只需做一些简单的统计描述,就可得到有关总体的数据特征,如方差、总体均值等,但在现实情况中,很多时候不可能或者不必对总体中的每个单位进行测定,就需要从总体抽取一部分单位进行测定,通过样本提供的信息来对总体信息进行估计和推断。

而参数估计和假设检验就是通过样本分析总体,从样本的观察或试验结果的特征对总体的特征进行估计和推断。

表5.20 某班学生数学成绩单个样本统计量N 均值标准差均值的标准误成绩27 77.93 12.111 2.331表给出了单样本T检验的描述性统计量,包括样本数(N) 、均值、标准差、均值的标准差。

表是单样本T检验结果表,当置信区间为95%时,显著水平为0.05,从表中可以看出,双尾检测概率P值为0.02,小于0.05,故原假设不成立,也就是说,数学成绩与全国的平均成绩70分之间有显著性差异。

4.在某次测试中,随机抽取男女学生的成绩各10名,数据如下:男:99 79 59 89 79 89 99 82 80 85女:88 54 56 23 75 65 73 50 80 65假设样本总体服从正态分布,比较置信度为95%的情况下男女得分是否有显著性差异。

(参见数据文件:data5-17.sav。

)①解决问题的原理:独立样本T检验②实验步骤:通过“分析-比较均值-独立样本T检验(T)”, 打开“独立样本T检验”对话框,根据题目所需要的统计量进行设置。

③结果及分析:上表中是独立样本T检验的均值检验结果。

显著水平为0.05,从表中可以看出T统计量的概率P小于0.05,故拒绝原假设,所以男女得分有显著性差异。

5.某医疗机构为研究某种减肥药的疗效,对16位肥胖者进行为期半年的观察测试,测试指标为使用该药之前和之后的体重,数据如表5.21所示。

假设体重近似服从正态分布,试分析服药前后,体重是否有显著变化。

(参见数据文件:data5-18.sav。

)表①解决问题的原理:配对样本T检验②实验步骤:通过“分析-比较均值-配对样本T检验(P)”, 打开“配对样本T检验”对话框,根据题目所需要的统计量进行设置。

③结果及分析:从上表一及表二中可以看出,在显著水平为0.05时,概率P值明显小于0.05,拒绝原假设,可以认为减肥药前后的体重有明显的线性关系。

相关主题