描述性统计分析
【Display frequency tables复选框 tables复选框】确定是 复选框】 否在结果中输出频数 表。 Statistics钮 【Statistics钮】单击后 弹出Statistics对话框 对话框, 弹出Statistics对话框, 用于定义需要计算的 其他描述统计量。 其他描述统计量。
茎叶图,整数位为茎,小数位为叶。 这样可以非常直观的看出数据的分布范围及形态
frequencies过程 frequencies过程
频数分布表是描述性统计中最常用的方法 之一,Frequencies 之一,Frequencies 过程就是专门为产生频数 表而设计的,它不仅可以产生单变量详细 的频数表,显示文件中指定变量特定值发 生的频数,还可以获得某些描述统计量或 按要求给出某百分位点的数值以及常用的 条图、圆图等统计图。
选入需要描述的 变量,可选入多个
确定是否将原始数 据的标准正态变换 结果存为新变量。
变量列表顺序 字母顺序 均数升序 均数降序。
Descriptive Statistics 身身 Valid N (listwise) N Minimum Maximum 215 151 188 215 Mean Std. Deviation 166.67 7.668
Lowest
女
Highest
Lowest
a. Only a partial list of cases with the value 167 are shown in the table of lower extremes. b. Only a partial list of cases with the value 172 are shown in the table of upper extremes. c. Only a partial list of cases with the value 154 are shown in the table of lower extremes.
常用的描述统计量
集中趋势指标(central tendency):标准差(standard 集中趋势指标(central tendency):标准差(standard deviation),均数(means) 众数(mode),中位数 deviation),均数(means) 众数(mode),中位数 ( median),总和 (sum),标准误(S. E. mean) median),总和 sum),标准误(S. mean) 等。其中标准差方差只适用正态分布。标准误则反映 了样本均数的波动程度。 百分位数指标(percentile):包括四分位数,各个百 百分位数指标(percentile):包括四分位数,各个百 分位数等,适用于任何分布类型资料。 分布指标(distribution):偏度系数(Skewness)和峰度 分布指标(distribution):偏度系数(Skewness)和峰度 系数(Kurtosis),反映了数据偏离正态分布的程度 系数(Kurtosis),反映了数据偏离正态分布的程度 其它: 统计量(M-estimators)、极端值(outlier)等,主 其它:M统计量(M-estimators)、极端值(outlier)等,主 要用于对存在异常值的数据进行描述。
选入需要分析的变量
选入分组变量
选择一个变量,他的取值 将作为每条记录的标签 选择所需要的描述统计量 选缺失值的处理方式
选择所需要的统计图
Statistics对话框 Statistics对话框
Descriptives复选框:输出均数、中位数、众数、5% Descriptives复选框:输出均数、中位数、众数、5% 修正均数、标准误、方差、标准差、最小值、最大 值、全距、四分位全距、峰度系数、峰度系数的标 准误、偏度系数、偏度系数的标准误及指定的均数 可信区间。 M-estimators复选框:作中心趋势的粗略最大似然确 estimators复选框:作中心趋势的粗略最大似然确 定,该统计量是用哪个迭代法计算出来的,输出四 个(Huber, 个(Huber, Andrew, Hampel, Tukey)不同权重的最大 Tukey)不同权重的最大 似然确定数。 其中huber法适用于数据接近正态分布 其中huber法适用于数据接近正态分布 的情况,另三种适合数据中有许多异常值时。 Outliers复选框:输出五个最大值与五个最小值。 Outliers复选框:输出五个最大值与五个最小值。 Percentiles复选框:输出第5%、10%、25%、50%、 Percentiles复选框:输出第5%、10%、25%、50%、 75%、90%、95%位数。 75%、90%、95%位数。
一个典型的Descriptives 过程结果统计表 最上方为表格名称, 左下方为分析变量名,可见样本量N为215例; 均数:Mean=166.67, 最大值 :Maximum=188, 标准差 :STD=7.668, 最小值:Minimum=151。
Lower Bound Upper Bound
女
.289 .570 .430
Lower Bound Upper Bound
.201 .399
Extreme Values 身身 性性 男 Highest 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 Case Number 180 5 154 149 150 20 18 11 7 183 114 189 23 214 36 218 85 73 1 98 Value 188 186 186 184 183 159 165 165 165 167a 178 176 173 173 172b 151 152 152 152 154c
描述性统计分析
descriptive statistics菜单主要内容 statistics菜单主要内容
(1)频数分布表分析(Frequencies):其特色就是产生频 (1)频数分布表分析(Frequencies):其特色就是产生频 数表,对分类数据和定量资料都适用。 (2)统计描述分析(Descriptive)进行一般性描述,适用 (2)统计描述分析(Descriptive)进行一般性描述,适用 于服从正态分布的定量资料。 (3) Explore 过程:用于对数据分布状况不清楚时的探 过程:用于对数据分布状况不清楚时的探 索性分析,它会杂七杂八给出一大堆可能用到的统 计指标和统计图,让研究者参考。 (4)Crosstabs 过程则完成计数资料和等级资料的统计 描述和一般的统计检验我们常用的X2 描述和一般的统计检验我们常用的X2 检验也在其中 完成 (5)Ratio过程;用于对两个连续性变量计算相对比指 5)Ratio过程;用于对两个连续性变量计算相对比指 标,它可以计算出一系列非常专业的相对比描述指 标。
Case Processing Summary Cases Missing N Percent 3 4.2% 1 .7%
身身
性性 男 女
ห้องสมุดไป่ตู้
Valid N Percent 69 95.8% 146 99.3%
Total N 72 147 Percent 100.0% 100.0%
Descriptives 身身 性性 男 Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Statistic 174.71 173.37 176.05 174.70 175.00 31.062 5.573 159 188 29 8 -.034 .138 162.88 162.03 163.73 162.83 163.00 26.950 5.191 151 178 27 7 .157 -.203 Std. Error .671
身高 Stem-and-Leaf Plot for sex= 男 Frequency 1.00 .00 9.00 20.00 24.00 12.00 3.00 Stem & Leaf 15 . 9 16 . 16 . 555778999 17 . 00000000011112334444 17 . 555555555556677777788889 18 . 000000122234 18 . 668
身高 Stem-and-Leaf Plot for sex= 女 Frequency Stem & Leaf
Stem width: 10 Each leaf: 1 case(s)
1.00 15 . 1 3.00 15 . 222 6.00 15 . 445555 12.00 15 . 666677777777 18.00 15 . 888888888888899999 19.00 16 . 0000000000000011111 16.00 16 . 2222222233333333 30.00 16 . 444444444444444555555555555555 13.00 16 . 6666667777777 10.00 16 . 8888888889 9.00 17 . 000000000 7.00 17 . 2222233 .00 17 . 1.00 17 . 6 1.00 Extremes (>=178) Stem width: 10 Each leaf: 1 case(s)
Descriptives过程 Descriptives过程