当前位置:文档之家› spss教程常用的数据描述统计:频数分布表等统计学

spss教程常用的数据描述统计:频数分布表等统计学

第二节常用的数据描述统计本节拟讲述如何通过SPSS菜单或命令获得常用的统计量、频数分布表等。

1.数据这部分所用数据为第一章例1中学生成绩的数据,这里我们加入描述学生性别的变量“sex”和班级的变量“class”,前几个数据显示如下(图2-2),将数据保存到名为“2-6-1.sav”的文件中。

图2-2:数据输入格式示例1.Frequencies语句(1)操作打开数据文件“2-6-1.sav”,单击主菜单Analyze /Descriptive Statistics / F requencies…,出现频数分布表对话框如图2-3所示。

图2-3:Frequencies定义窗口把score变量从左边变量表列中选到右边,并请注意选中下方的Display frequency table复选框(要求显示频数分布表)。

如果您只要求得到一个频数分布表,那么就可以点OK按钮了。

如果您想同时获得一些统计量,及统计图表,还需要进一步设置。

①Statistics选项单击Statistics按钮,打开对话框,请按图2-4自行设置。

有关说明如下:(ⅰ)在定义百分位值(percentile value)的矩形框中,选择想要输出的各种分位数,SPSS提供的选项有:●Quartiles四分位数,即显示25%、50%、75%的百分位数。

●Cut points equal 把数据平均分为几份。

如本例中要求平均分为3份。

Percentile显示用户指定的百分位数,可重复多次操作。

本例中要求15%、50%、85%的百分位数。

(ⅱ) 在定义输出集中趋势(Central Tendency)的矩形框中,选择想要输出的集中统计量,常用的选项有:●Mean 算术平均数●Median 中数●Mode 众数●Sum 算术和(ⅲ)在定义输出离散统计量(Dispersion)的矩形框中,选择想要输出的离散统计量,常用的选项有:●Std. Deviation 标准差●Variance 方差●Range 全距●Minimum 最小值●Maximum 最大值●S.E. mean 平均数的标准误(ⅳ)描述数据分布(Distribution)的统计量●Skewness 偏度,非对称分布指数。

●Kurtosis 峰度,CASE围绕中心点的扩展程度。

另外,频数过程(Frequence)除了能够提供上面常用的统计量外,还可以对分组数据计算百分位数和中数(Values are group midpoints),即对于已经分组的数据,并且数据中的原始数据表示的是组中数的数据计算百分位数的值和中位数。

图2-4:次数分布统计量定义窗口图2-5:次数分布图形定义窗口在本例中,我们选择输出:四分位点的值,平均分为3等分的分位点的值和15%,50%,85%的分位点的值;对于集中趋势的度量,选择输出算术平均数、中数、众数和总和,对于离散程度的度量选择输出标准差和方差。

②Charts选项为了获得统计图表,单击主对话框中的Charts铵钮,打开它的对话框,如图2-5所示。

用户可以在图形类型(Chart Type)选择框中定义输出的图形类型,频数(Frequence)过程可以提供的输出选项有:●None 不显示图表●Bar charts 条形图●Pie charts 圆形图●Histograms 直方图另外,对于图形中纵坐标值的表示,可以有两种方式:●Frequencies 纵座标为变量值的频数●Percentages 纵座标为变量值的百分比在本例中,由于学生成绩可以看成是连续性的数据,所以这里选择输出直方图,并拟合正态曲线。

点击Continue返回主对话框。

③Format选项单击Format…,打开Format对话框,如图2-6所示。

在该对话框,可以选择数据输出显示的顺序(Order by),Frequencies提供的选项有:文档来自于网络搜索●Ascending values 在输出频数分布表时按变量值升序排列●Descending values 在输出频数分布表时按变量值降序排列●Ascending counts 输出频数分布表时按变量值频数的升序排列●Descending counts 输出频数表时按变量值频数的降序排列图2-6:定义输出显示格式对话框在Format 中我们一律使用默认选项。

点击Continue 返回主对话框,在主对话框中点击OK,可以得到次数分布的输出结果。

(2)结果及解释①学生成绩变量的Frequences 输出描述统计结果:StatisticsSCORE 100079.68079.75080.07.02649.3717968.072.07575.00076.50079.75082.50084.00087.000Valid MissingNMean Median ModeStd. Deviation Variance Sum152533.333333335066.666666677585Percentiles输出说明:N 后面的Valid 和Missing 分别用来描述有效值样本容量和缺失值的样本个数,在本例所用数据中,有100个有效数字,缺失值的个数为0。

Mean 、Median 、Mode 和Sum 分别用来描述算术平均数、中数、众数和数据的总和,本例所用数据的算术平均数为79.680,中数为79.75,众数为80,数据总和为7968.0。

Std. Deviation 和Variance 分别用来描述数据的标准差和方差,这里数据的标准差为7.026,方差为49.371。

Percentiles 后给出不同的百分位数对应的值,如15后面的数字72.075表示,15%的分位点的值为72.075,即小于72.075分的人数占总人数的15%。

(表中有两个无穷循环小数,是我们自定义的三等分的百分位数)②学生成绩的频数分布表:SCOREFrequency Percent Valid Percent Cumulative Percent Valid 62.0 1 1.0 1.0 1.065.0 1 1.0 1.0 2.066.0 1 1.0 1.0 3.067.0 1 1.0 1.0 4.068.0 1 1.0 1.0 5.068.5 1 1.0 1.0 6.069.0 1 1.0 1.0 7.070.0 1 1.0 1.0 8.070.5 1 1.0 1.0 9.071.0 3 3.0 3.0 12.071.5 1 1.0 1.0 13.072.0 2 2.0 2.0 15.072.5 1 1.0 1.0 16.073.0 2 2.0 2.0 18.073.5 2 2.0 2.0 20.074.0 2 2.0 2.0 22.074.5 2 2.0 2.0 24.075.0 3 3.0 3.0 27.075.5 2 2.0 2.0 29.076.0 3 3.0 3.0 32.076.5 2 2.0 2.0 34.077.0 2 2.0 2.0 36.077.5 2 2.0 2.0 38.078.0 3 3.0 3.0 41.078.5 2 2.0 2.0 43.079.0 4 4.0 4.0 47.079.5 3 3.0 3.0 50.080.0 5 5.0 5.0 55.080.5 3 3.0 3.0 58.081.0 3 3.0 3.0 61.081.5 2 2.0 2.0 63.082.0 3 3.0 3.0 66.082.5 2 2.0 2.0 68.083.0 4 4.0 4.0 72.083.5 2 2.0 2.0 74.084.0 3 3.0 3.0 77.084.5 1 1.0 1.0 78.085.0 1 1.0 1.0 79.085.5 1 1.0 1.0 80.086.0 3 3.0 3.0 83.086.5 1 1.0 1.0 84.087.0 2 2.0 2.0 86.087.5 1 1.0 1.0 87.088.0 1 1.0 1.0 88.088.5 1 1.0 1.0 89.089.0 2 2.0 2.0 91.089.5 1 1.0 1.0 92.090.0 1 1.0 1.0 93.090.5 1 1.0 1.0 94.091.0 1 1.0 1.0 95.092.5 1 1.0 1.0 96.093.0 1 1.0 1.0 97.094.0 1 1.0 1.0 98.096.0 1 1.0 1.0 99.098.0 1 1.0 1.0 100.0Total 100 100.0 100.0在输出的频数分布表中,第一列给出数据中出现的不同数值;第二列给出该数值对应的频数(Frequency);第三列给出对应数据在总数据中所占的百分比(Percent);第四列给出有效百分比(Valid percent)即去除缺失值后的百分比,由于在此例中不含有缺失值所以该列数据与第三列相同;最后一列给出累加百分比(Cumulative percent)。

如数据70,对应的频数为1,表示在这组数据中70出现了1次,所占比例和有效百分比都是1%,累计百分比8%表示小于等于70的人数占总人数的8%。

2.Descriptives仍以上面所用数据为例,简单说明另外一种常用的输出描述统计量的过程—Descriptive。

打开数据文件“2-6-1.sav”,(1)操作单击主菜单Analyze /Descriptive Statistics / Descriptives…,打开主对话框如图2-7所示:图2-7:Descriptives定义窗口将左边变量表列中的class、sex和scores变量选到右边的变量表列(Variable(s))中。

注意选中下方Save standardized values as variables复选框,即要求把该变量值的标准分存为一变量,并在数据窗口中显示(请注意在执行完操作后自行查看结果,新生成的变量名称分别为zclass、zsex和zscore)。

图2-8:Descriptives的options窗口①options选项单击options…按钮,打开描述统计过程的选择输出对话框(Descriptives:Options),设置如图2-8所示:请注意,这里所给出的一些统计量,与在Frequencies 中所给的相差无几。

所以,当我们需要用到这些描述统计量的时候,可以不受一种特殊方法的限制。

在此不再对这些统计量作过多说明,如有不解之处,请参阅Frequencies部分。

在图2-8的下方,提供了有关输出显示顺序(Display Order)的定义框:●Variable list 变量表列中变量的排列顺序为数据窗口中的顺序●Alphabetic 按字母顺序●Ascending means 按平均数的升序排列●Descending means 按平均数的降序排列定义完成后,点击Continue,返回主对话框,点击OK,可以得到的输出结果。

相关主题