当前位置:文档之家› 第四章 SPSS基本统计分析

第四章 SPSS基本统计分析


二、频数分析
• (一)频数的定义 频数就是一个变量在各个变量值上 取值的个案数,是描述性统计中最常用 的方法。 可编制频数分布表和绘制统计图, 把握数据分布的基本特征。
频数分析
• (二)频数分析的目的
通过频数分析能够了解变量取值 的状况,对把握数据的分布特征是 非常有用的。
频数分析
• (三)频数分析的功能 1.产生详细的频数表; 2.按要求给出某个分位点; 3.绘制常用的条图、饼图、直方图。 适用范围:更适用于对分类变量以及不服 从正态分布的连续性变量进行描述。
(三)应用举例
• 利用住房状况调查问卷数据, 对人均住房面积计算基本描 述统计量,并分别对本市户 口和外地户口家庭进行比较。 (首先进行数据拆分)
• 统计结果表明:本市户口家庭的人均住房面 积的均值是21.7平方米,低于外地户口家庭 26.7。无论是本市户口还是外地户口,人均住 房面积的分布均呈一定的右偏分布(两个偏 度统计量分别为2.18和1.43),且本市户口的 偏度更大些;同时,本市户口和外地户口家 庭人均住房面积均呈尖峰分布(两个峰度统 计量分别为8.3和2.1)。由此可见,本市户口 和外地户口中的大部分家庭的人均住房面积 都低于各自的平均水平,此时,仅用均值刻 画住房状况是不准确的。
分组后人均面积
• 接下来利用频数分析计算出所有样本的 人均住房面积的四分位数,然后,按照 户口状况对数据进行拆分,并重新计算 四分位数,分别得到本市户口和外地户 口的人均住房面积的四分位数。结果如 下:
表1
表2
• 表1表明:25%家庭的人均住房面积在 13.7平方米以下;有50%家庭的人均住 房面积在19.6平米以下。 • 表2表明:本市户口家庭2825户,人均 住房四分位数差是13;外地户口家庭 168户,人均住房面积的四分位数差是 21.6.可见外地户口家庭的人均住房面积 的离散程度高于本市户口,尤其在高数 值区。
第四章 基本统计分析
一、基本统计分析功能
基本统计分析功能包括: 1.报告分析(Report)(有兴趣的自学) 2.描述性统计分析(Descriptive Statistics)
描述性统计分析
(Descriptive Statistics) • • • • • 1. Frequencies 2. Descriptive 3. Explore 4. Crosstabs 5. Ratio 频数分析 描述性统计分析 探索分析 列联表分析 比率分析
Explore 主对话框
Statistics对话框
Explore 栏中Plots对话框
(三)例题:下表为30名10岁少儿的身高(cm)数据, 试对其进行探索分析。
编 号 1 2 3 4 5 身高 男 女
131.5 132.7 137.4 133.0 128.2 139.7 136.0 125.4 140.4 138.6
返回
探索分析
主要功能
调用此过程可检查数据是否有错误、考察样 本分布特征及对样本分布规律作初步考察。剔除 奇异值和错误数据。探索分析过程将提供在分组 和不分组的情况下常用的统计量与图形。
探索分析过程
按Analyze Descriptive Statistics Explore 顺序单击,打开 Explore 主对话框。
三、计算基本描述统计量
(一)功能: 对定距型变量进行描述性统计分析,计 算均值、标准差、全距和均值标准误差等, 并可将原始数据转换成Z分数。
(二)基本描述统计量
• 常见的基本描述统计量可以分为三大类: 1、集中趋势的描述统计量(均值、中位 值、众值); 2、离散程度的描述统计量(标准差、方 差、极差); 3、分布形态的描述统计量(偏度系数、 峰度系数)。
编 号
6 7 8 9 10
身高 男
135.5 121.4 129.2 135.4 135.8

137.5 141.4 138.8 120.9 137.5
编 号
11 12 13 14 15
身高 男
132.2 129.0 132.6 140.9 129.3

124.0 140.3 130.1 133.4 136.7
按频数的升序输出
控制频数表输出范围 类型的最大数目为
Format 对话框
某频次分析结果演示
统计量
统计量 兄弟姐妹的个数 N 有效 缺失 均值 中值 标准差 偏度 偏度的标准误 峰度 峰度的标准误 极小值 极大值 1505 12 3.93 3.00 3.047 1.468 .063 3.507 .126 0 26
直方图
频数分析的应用举例
• 案例: 利用住房状况问卷调查数据,分析 被调查家庭中户主的从业状况和目前所 住房屋的产权情况。
频数分析的操作步骤
结论
• 由从业状况表得到的分析结论如下:本次被 调查家庭的总数为2993户,户主的从业状况 是:人数最多的是国有企业,其次是行政事 业单位和私营企业,人数最少的是大专院校 科研单位。 • 由房屋产权表得出:近50%是多层商品房,无 产权和部分产权也占有一定比例,二手房的 比例较低,高层商品房的比例最少。
保存了z 分数的数据集
五、探索性分析
1. 概念
数据探索是统计分析中非常重要的一步,可以帮助我们决定选 择哪种统计方法进行数据分析,有如下三方面的考察: (1)考察数据的正确性 考察数据中的一些异常值,分析这些值产生的原因,判断其正确 性,再决定修改、删除或保留它们。 (2)考察数据的分布特征 考察数据的正态分布特征可以为以后进行统计分析时采用正确 的统计方法提供正确的依据。 (3)考察变量之间数据的相互关系 变量与变量之间相关性的考察、方差齐性的考察,是一些统计 分析过程必须事先了解的。
显示频数分布表 统计量
统计图形 频数输出的顺序
Frequences主对话框
Frequences主对话框
选择一个或多个 变量右移入 Variable(s)框。 显示频数 分布表 统计图 统计量
频数输出的顺序
输出统计量对话框
Chart 对话框
按变量值的升序输出
统计表中变量的各 项分析结果在一张 表并列显示 按各个变量组织输 出,输出结果将按 照每个变量一张表 的形式显示
2272 3503 4218 3418 3921 2669 3707 2310 2573 3881
操作步骤:
打开数据文件“婴儿体重.sav”。打开 Descriptives主对话框,选定变量t进入 Variable栏中。 选中Save standardized values as variables复选框,要求计算变量的z值,并 保存结果到当前数据集中。 单击Options按钮,选中Mean、 Std.Deviation、Minimum、Maximum 、 Variance 项。
频数分析的扩展功能
• 举例 应用住房状况调查问卷数据,分析 人均住房面积的分布情况,并对本地户 口和外地户口家庭进行比较。
分析思路
• 由于人均住房面积为定距型变量,直接 采用频数分析不利于其分布形态的把握, 因此考虑,依据我们上节课中学过的分 组功能对数据分组后再编制频数分布表。 频数分布表如下:
婴儿体重的描述统计量
Des cripti ve St atist ics N 婴儿体重 Valid N (listwise) 20 20 Minimum 2272.00 Maximum Mean 4654.00 3233.4500 Std. Deviation 653.2335
这时打开原数据集,可看到多了一列zt,这是t 的z 分数,如下图所示:
• 利用住房状况调查问卷数据,分析人均 住房面积是否存在不均衡现象。 (分析人均住房面积是否存在不均衡现象, 可以从分析住房面积是否有大量异常值 入手。)
(四)例题分析
已知20个初生婴儿的体重数据如下表,
对其进行描述统计。
2770 2915 2795 2995 2860 2970 3087 3126 3125 4654
观测量摘要表
M估计量表
少儿身高的分组描述统计量
少儿身高的极端叶。 茎是整数部分,叶是小数 部分,Stem width表示茎 宽。每行的茎和叶组成的 数字再乘以茎宽,即得到 实际数据的近似值,实际 数据中与该近似值靠近的 值的个数即为频数表示的 个数。
方形是箱式图的主体, 上下边为四分位数,中 心粗线为中位数,变量 的50%的观测值落在这 一区域中。 方形上下两条纵向直线 是触须线,触须线外的 两端线为本体的最大值 和最小值。本体指除奇 异值外的变量值。 奇异值用“O”标出,本 例中无奇异值。
步骤:
打开 Explore主对话框,打开数据文件“Explore分 析.sav”选变量身高进入因变量栏中,选性别变量进 入因子列表栏中; 在输出栏中选择 Both项;
打开统计量对话框,选中描述性 、M-估计量、 界 外值复选项,单击继续返回; 打开绘制对话框,选择箱图栏中的按因子水平分组 项,选择描述性栏内的 茎叶图复选项,选择Spread vs level with levene Test栏中的 Power estimation项, 单击 Continue 返回。单击OK
条形图
用宽度相同的条形的高度 或长短来表示频数分布变化的 图形,适用于定类和定序变量 的分析。
条形图
饼图
• 用圆形及圆内扇形的面积来表 示频数百分比变化的图形,有 利于研究事物内在结构组成等 问题。饼图中圆内扇形的面积 可以表示频数,也可以表示百 分比。
饼图(圆饼图)
直方图
• 用矩形的面积来表示频数分布 变化的图形,适用于定距型变 量的分析。
箱式图
150
140
130
120
HIGHT
110
N= 15 15
1
2
SEX
上机作业
相关主题