描述性统计分析一、实验目的1.进一步了解掌握SPSS专业统计分析软件,能更好地使用其进行数据统计分析。
2.学习描述性统计分析及其在SPSS中的实现,内容具体包括基本描述性统计量的定义及计算﹑频率分析﹑描述性分析﹑探索性分析﹑交叉表分析等。
3.复习权重等前章的知识。
二﹑实验内容题目一打开数据文件“data4-5.sav”,完成以下统计分析:(1)计算各科成绩的描述统计量:平均成绩、中位数、众数、标准差、方差、极差、最大值和最小值;(2)使用“Recode”命令生成一个新变量“成绩段”,其值为各科成绩的分段:90~100为1,80~89为2,70~79为3,60~69为4,60分以下为5,其值标签设为:1-优,2-良,3-中,4-及格,5-不及格。
分段以后进行频数分析,统计各分数段的人数,最后生成条形图和饼图。
1.解决问题的原理因为问题涉及各科成绩,用描述性分析,第二问要先进行数据分段,其后利用频数分析描述统计量并可以生成条形图等。
2.实验步骤针对第一问第1步打开数据菜单选择:“文件→打开→数据”,将“data4-8.sav”导入。
第2步文件拆分菜单选择:“数据→拆分文件”,打开“分割文件”对话框,点击比较组按钮,将“科目”加入到“分组方式”列表框中,并确定。
第3步描述分析设置:(1)选择菜单:“分析→描述统计→描述”,打开“描述性”对话框,将“成绩””加入到“变量”列表框中。
打开“选项”对话框,选中如下图中的各项。
点击“继续”按钮。
(4)回到“描述性”对话框,点击确定。
针对第二问第1步频率分析设置:(1)选择菜单:“分析→描述统计→频率”,(2)打开“频率(F)”对话框,点击“合计”。
再点击“继续”按钮.(3)打开“图表”对话框,选中“条形”复选框,点击“继续”按钮。
(4)回到“频率(F)”对话框,点击确定。
(5)重复步骤(1)(2)把步骤(3)改成打开“图表”对话框,选中“饼图”复选框,点击“继续”按钮。
再回到“频率(F)”对话框,点击确定。
三、实验结果及分析描述统计量科目N 全距极小值极大值均值标准差方差统计量成绩语文N 有效15缺失0 均值67.87中值73.00众数60a标准差21.738方差472.552极小值19极大值98百分位数25 60.0050 73.0075 83.00 数学N 有效15缺失0 均值55.87中值49.00众数37标准差24.348方差592.838极小值24极大值95百分位数25 36.0050 49.0075 81.00 英语N 有效15缺失0 均值57.80中值56.00众数56标准差22.697方差515.171极小值15极大值91百分位数25 34.0050 56.0075 78.00a. 存在多个众数。
显示最小值成绩段科目频率百分比有效百分比累积百分比语文有效优 3 20.0 20.0 20.0 良 1 6.7 6.7 26.7中 4 26.7 26.7 53.3及格 4 26.7 26.7 80.0不及格 3 20.0 20.0 100.0合计15 100.0 100.0数学有效优 1 6.7 6.7 6.7 良 3 20.0 20.0 26.7中 2 13.3 13.3 40.0不及格9 60.0 60.0 100.0合计15 100.0 100.0英语有效优 2 13.3 13.3 13.3 良 1 6.7 6.7 20.0中 2 13.3 13.3 33.3及格 2 13.3 13.3 46.7不及格8 53.3 53.3 100.0合计15 100.0 100.0语文成绩的平均成绩为67.87,中位数是73、众数60、标准差21.738、方差472.552、极差98-19=79、最大值98和最小值19;各分数段人数:语文90~100为3,80~89为1,70~79为4,60~69为4,60分以下为3,数学90~100为1,80~89为3,70~79为2,60~69为0,60分以下为9,英语90~100为2,80~89为1,70~79为2,60~69为2,60分以下为9,生成条形图和饼图如截图所示题目二1.打开数据文件“data4-6.sav”,完成以下统计分析:(1)对身高进行考察,分析四分位数、计算上奇异值、上极端值、下奇异值和下极端值,并生成茎叶图和箱图;(2)考察身高、体重和胸围的正态性。
针对第一问1.解决问题的原理探索性分析第1步打开数据菜单选择:“文件→打开→数据”,将“data4-9.sav”导入。
第2步探索分析设置:(1)选择菜单“分析→ 描述统计→ 探索”,打开“探索”对话框,,将“身高”字段移入“因变量列表”。
(2)打开“统计量”对话框,选中“描述性”及“M-估计量”选项;(3)打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验的正态图”等选项。
打开“探索:选项”,选中“按列表排除个案”选项针对第二问与第一问的方法相似也可用探索性分析第1步探索分析设置:(1)选择菜单“分析→ 描述统计→ 探索”,打开“探索”对话框,,将“体重”字段移入“因变量列表”。
(2)打开“统计量”对话框,选中“描述性”及“M-估计量”选项;(3)打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验的正态图”等选项。
打开“探索:选项”,选中“按列表排除个案”选项第2步探索分析设置:(1)选择菜单“分析→ 描述统计→ 探索”,打开“探索”对话框,,将“胸围”字段移入“因变量列表”。
(2)打开“统计量”对话框,选中“描述性”及“M-估计量”选项;(3)打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验的正态图”等选项。
打开“探索:选项”,选中“按列表排除个案”选项3.结果及分析从上的茎叶图可以更加详细地分析身高数据。
从上的箱图可以分析变量“身高”的四分位数。
从上的Q-Q图中可以看出,身高、体重、胸围三个变量都很好的服从正态分布。
题目三表4.22是对吸烟与患气管炎的调查表,试分析吸烟与患气管炎之间的关系。
(用交叉列联表分析,参见数据文件:data4-10.sav。
)1.解决问题的原理:运用交叉表分析2.实验内容第1步打开数据菜单选择:“文件→打开→数据”,将“data4-10.sav”导入。
第2步加权设置:菜单选择:“数据→加权个案”,打开“加权个案”对话框,如图设置。
第3步交叉表分析设置:(1)选择菜单:“分析→描述统计→交叉表”,打开“交叉表”对话框,将“是否吸烟”及“是否换气管炎”字段分别加入“行(s)”及“列(c)”列表框中。
(2)打开“统计量”对话框,选中“卡方”选项。
(3)打开“单元显示”对话框,选中“观察值”及“四舍五入单元格计数”选项,二者都是缺省设置。
3实验结果及分析是否吸烟 * 是否患气管炎 CrosstabulationCount是否患气管炎Total患病健康是否吸烟是43 162 205否13 121 134 Total 56 283 339Chi-Square TestsValue df Asymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Pearson Chi-Square 7.469a 1 .006Continuity Correction b 6.674 1 .010Likelihood Ratio 7.925 1 .005Fisher's Exact Test .007 .004 Linear-by-LinearAssociation7.447 1 .006N of Valid Cases 339a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 22.14.b. Computed only for a 2x2 table综上所示,各种检验方法显著水平都远小于0.05,所以有理由拒绝“实验准备与评价结果是独立的”假设,即认为实验准备这一评价指标与评价结果是相关的。
三、实验心得与体会通过本章例子学习描述性统计分析及其在SPSS中的实现,学会了基本描述性统计量的定义及计算、频率分析、描述性分析、探索性分析、交叉表分析。
深刻体会到了如何计算诸如样本均值等重要的基本统计量,并辅助于SPSS提供的图形功能来分析把握数据的基本特征和数据的整体分布形态,对进一步的统计推断和数据建模工作起到了重要作用。
参数估计与假设检验一、实验目的4.进一步了解掌握SPSS专业统计分析软件,能更好地使用其进行数据统计分析。
2.通过样本提供的信息来对总体信息进行估计和推断,如参数估计和假设检验等,从样本的观察或试验结果的特征对总体的特征进行估计和推断。
二、实验内容题目一表5.20是某班学生的高考数学成绩,试分析该班的数学成绩与全国的平均成绩70分之间是否有显著性差异。
(参见数据文件:data5-16.sav。
)1.解决问题的原理:单样本T检验2.实验步骤第1步打开数据菜单选择:“文件→打开→数据”,将“data4-16.sav”导入。
第2步单样本T检验分析设置(1)选择菜单“分析→比较均值→单样本T检验(S)”,打开“单样本T检验”70。
表5.20 某班学生数学成绩序号成绩序号成绩序号成绩1 63 10 94 19 702 99 11 98 20 653 81 12 73 21 844 77 13 89 22 845 68 14 98 23 956 79 15 77 24 617 80 16 67 25 69(2)“单样本T检验:选项”对话框,设置置信区间为95%(缺省为95%),故此处可不设置,及默认。
3.实验结果及分析One-Sample StatisticsN Mean Std. Deviation Std. Error Mean成绩27 77.93 12.111 2.3310.02,小于0.05,故原假设不成立,也就是说,数学成绩与全国的平均成绩70分之间有显著性差异。
题目二在某次测试中,随机抽取男女学生的成绩各10名,数据如下:男:99 79 59 89 79 89 99 82 80 85女:88 54 56 23 75 65 73 50 80 65假设样本总体服从正态分布,比较置信度为95%的情况下男女得分是否有显著性差异。
(参见数据文件:data5-17.sav。
)1.解决问题的原理:独立样本T检验2.实验步骤第1步打开数据菜单选择:“文件→打开→数据”,将“data5-17.sav”导入。
第2步独立样本T检验设置:(1)选择菜单“选择→比较均值→独立样本T检验”,打开“独立样本T检验”对话框,将“成绩”作为要进行T检验的变量,将“性别”字段作为分组变量,定义分组变量的两个分组分别为“1”和“2”。