描述性统计分析一、实验目得1.进一步了解掌握SPSS专业统计分析软件,能更好地使用其进行数据统计分析。
2.学习描述性统计分析及其在SPSS中得实现,内容具体包括基本描述性统计量得定义及计算﹑频率分析﹑描述性分析﹑探索性分析﹑交叉表分析等。
3.复习权重等前章得知识。
二﹑实验内容题目一打开数据文件“data4-5、sav”,完成以下统计分析:(1)计算各科成绩得描述统计量:平均成绩、中位数、众数、标准差、方差、极差、最大值与最小值;(2)使用“Recode”命令生成一个新变量“成绩段”,其值为各科成绩得分段:90~100为1,80~89为2,70~79为3,60~69为4,60分以下为5,其值标签设为:1-优,2-良,3-中,4-及格,5-不及格。
分段以后进行频数分析,统计各分数段得人数,最后生成条形图与饼图。
1.解决问题得原理因为问题涉及各科成绩,用描述性分析,第二问要先进行数据分段,其后利用频数分析描述统计量并可以生成条形图等。
2、实验步骤针对第一问第1步打开数据菜单选择:“文件→打开→数据”,将“data4-8、sav”导入。
第2步文件拆分菜单选择:“数据→拆分文件”,打开“分割文件”对话框,点击比较组按钮,将“科目”加入到“分组方式”列表框中,并确定。
第3步描述分析设置:(1)选择菜单:“分析→描述统计→描述”,打开“描述性”对话框,将“成绩””加入到“变量”列表框中。
打开“选项”对话框,选中如下图中得各项。
点击“继续”按钮。
(4)回到“描述性”对话框,点击确定。
针对第二问第1步频率分析设置:(1)选择菜单:“分析→描述统计→频率”,(2)打开“频率(F)”对话框,点击“合计”。
再点击“继续”按钮、(3)打开“图表”对话框,选中“条形”复选框,点击“继续”按钮。
(4)回到“频率(F)”对话框,点击确定。
(5)重复步骤(1)(2)把步骤(3)改成打开“图表”对话框,选中“饼图”复选框,点击“继续”按钮。
再回到“频率(F)”对话框,点击确定。
三、实验结果及分析描述统计量科目N全距极小值极大值均值标准差方差语文成绩15 7919 9867、8721、738472、552 有效得N (列表状态) 15数学成绩15 71 2495 55、87 24、348592、838 有效得 N (列表状态)15英语成绩15 76 15 9157、8022、697 515、171 有效得N (列表状态)15统计量成绩语文N 有效15缺失0均值67、87中值73、00众数60a标准差21、738方差472、552极小值19极大值98百分位数2560、0050 73、0075 83、00数学N有效15缺失0均值55、87中值49、00众数37标准差24、348方差592、838极小值24极大值95百分位数25 36、0050 49、0075 81、00英语N 有效15缺失0均值57、80中值56、00众数56标准差22、697方差515、171极小值15极大值91百分位数25 34、0050 56、0075 78、00a、存在多个众数。
显示最小值成绩段科目频率百分比有效百分比累积百分比语文有效优320、020、0 20、0 良 1 6、7 6、7 26、7中 4 26、726、7 53、3及格 4 26、7 26、7 80、0不及格 3 20、0 20、0 100、0合计15 100、0 100、0数学有效优 1 6、7 6、7 6、7 良 3 20、0 20、0 26、7中 2 13、3 13、340、0不及格960、0 60、0 100、0合计15 100、0 100、0英语有效优 2 13、3 13、3 13、3 良 1 6、76、7 20、0中213、313、3 33、3及格 2 13、3 13、3 46、7不及格8 53、3 53、3100、0合计15 100、0 100、0语文成绩得平均成绩为67、87,中位数就是73、众数60、标准差21、738、方差472、552、极差98-19=79、最大值98与最小值19;各分数段人数:语文90~100为3,80~89为1,70~79为4,60~69为4,60分以下为3,数学90~100为1,80~89为3,70~79为2,60~69为0,60分以下为9,英语90~100为2,80~89为1,70~79为2,60~69为2,60分以下为9,生成条形图与饼图如截图所示题目二1.打开数据文件“data4-6、sav”,完成以下统计分析:(1)对身高进行考察,分析四分位数、计算上奇异值、上极端值、下奇异值与下极端值,并生成茎叶图与箱图;(2)考察身高、体重与胸围得正态性。
针对第一问1、解决问题得原理探索性分析第1步打开数据菜单选择:“文件→打开→数据”,将“data4-9、sav”导入。
第2步探索分析设置:(1)选择菜单“分析→描述统计→ 探索”,打开“探索”对话框,,将“身高”字段移入“因变量列表”。
(2)打开“统计量”对话框,选中“描述性”及“M-估计量”选项;(3)打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验得正态图”等选项。
打开“探索:选项”,选中“按列表排除个案”选项针对第二问与第一问得方法相似也可用探索性分析第1步探索分析设置:(1)选择菜单“分析→描述统计→ 探索”,打开“探索”对话框,,将“体重”字段移入“因变量列表”。
(2)打开“统计量”对话框,选中“描述性”及“M-估计量”选项;(3)打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验得正态图”等选项。
打开“探索:选项”,选中“按列表排除个案”选项第2步探索分析设置:(1)选择菜单“分析→ 描述统计→ 探索”,打开“探索”对话框,,将“胸围”字段移入“因变量列表”。
(2)打开“统计量”对话框,选中“描述性”及“M-估计量”选项;(3)打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验得正态图”等选项。
打开“探索:选项”,选中“按列表排除个案”选项3、结果及分析从上得茎叶图可以更加详细地分析身高数据。
从上得箱图可以分析变量“身高”得四分位数。
从上得Q-Q图中可以瞧出,身高、体重、胸围三个变量都很好得服从正态分布。
题目三表4、22就是对吸烟与患气管炎得调查表,试分析吸烟与患气管炎之间得关系。
(用交叉列联表分析,参见数据文件:data4-10、sav。
)1、解决问题得原理:运用交叉表分析2、实验内容第1步打开数据菜单选择:“文件→打开→数据”,将“data4-10、sav”导入。
第2步加权设置:菜单选择:“数据→加权个案”,打开“加权个案”对话框,如图设置。
第3步交叉表分析设置:(1)选择菜单:“分析→描述统计→交叉表”,打开“交叉表”对话框,将“就是否吸烟”及“就是否换气管炎”字段分别加入“行(s)”及“列(c)”列表框中。
(2)打开“统计量”对话框,选中“卡方”选项。
(3)打开“单元显示”对话框,选中“观察值”及“四舍五入单元格计数”选项,二者都就是缺省设置。
3实验结果及分析就是否吸烟 * 就是否患气管炎Crosstabulation综上所示,各种检验方法显著水平都远小于0、05,所以有理由拒绝“实验准备与评价结果就是独立得”假设,即认为实验准备这一评价指标与评价结果就是相关得。
三、实验心得与体会通过本章例子学习描述性统计分析及其在SPSS中得实现,学会了基本描述性统计量得定义及计算、频率分析、描述性分析、探索性分析、交叉表分析。
深刻体会到了如何计算诸如样本均值等重要得基本统计量,并辅助于SPSS提供得图形功能来分析把握数据得基本特征与数据得整体分布形态,对进一步得统计推断与数据建模工作起到了重要作用。
参数估计与假设检验一、实验目得4.进一步了解掌握SPSS专业统计分析软件,能更好地使用其进行数据统计分析。
2、通过样本提供得信息来对总体信息进行估计与推断,如参数估计与假设检验等,从样本得观察或试验结果得特征对总体得特征进行估计与推断。
二、实验内容题目一表5、20就是某班学生得高考数学成绩,试分析该班得数学成绩与全国得平均成绩70分之间就是否有显著性差异。
(参见数据文件:data5-16、sav。
)1.解决问题得原理:单样本T检验2、实验步骤第1步打开数据菜单选择:“文件→打开→数据”,将“data4-16、sa v”导入。
第2步单样本T检验分析设置(1)选择菜单“分析→比较均值→单样本T检验(S)”,打开“单样本T检验”对话框,将变量“成绩”移入“检验变量”列表框,并输入检验值70。
表5、20 某班学生数学成绩(2)“单样本T检验:选项”对话框,设置置信区间为95%(缺省为95%),故此处可不设置,及默认。
One-Sample StatisticsNMean Std、DeviationStd、 Error Mean成绩27 77、93 12、111 2、331One-Sample TestTest Value = 70tdfSig、(2-tailed)MeanDifference95% Confidence Interval ofthe DifferenceLowerUpper成绩3、4026 、002 7、926 3、13 12、72可得到,当置信区间为95%时,显著水平为0、05,从表中可以瞧出,双尾检测概率P值为0、02,小于0、05,故原假设不成立,也就就是说,数学成绩与全国得平均成绩70分之间有显著性差异。
题目二在某次测试中,随机抽取男女学生得成绩各10名,数据如下:男:99 79 59 89 79 89 99828085女:885456 237565 73 508065假设样本总体服从正态分布,比较置信度为95%得情况下男女得分就是否有显著性差异。
(参见数据文件:data5-17、sav。
)1.解决问题得原理:独立样本T检验2、实验步骤第1步打开数据菜单选择:“文件→打开→数据”,将“data5-17、sav”导入。
第2步独立样本T检验设置:(1)选择菜单“选择→比较均值→独立样本T检验”,打开“独立样本T检验”对话框,将“成绩”作为要进行T检验得变量,将“性别”字段作为分组变量,定义分组变量得两个分组分别为“1”与“2”。
(2)打开“独立样本T检验:选项”对话框,具体选项内容及设置与单样本T检验相同,即默认形式,不更改。
Group Statistics性别NMeanStd、 DeviationStd、 ErrorMean成绩男10 84、0000 11、527743、64539 女10 62、9000 18、453855、83562上表中就是独立样本T检验得均值检验结果。