当前位置:
文档之家› SPSS第四章 基本统计分析
SPSS第四章 基本统计分析
职业 Frequency 54 35 35 34 24 18 18 17 15 15 10 4 3 282 Percent 19.1 12.4 12.4 12.1 8.5 6.4 6.4 6.0 5.3 5.3 3.5 1.4 1.1 100.0 Valid Percent 19.1 12.4 12.4 12.1 8.5 6.4 6.4 6.0 5.3 5.3 3.5 1.4 1.1 100.0 Cumulative Percent 19.1 31.6 44.0 56.0 64.5 70.9 77.3 83.3 88.7 94.0 97.5 98.9 100.0
列联表的例子:
本科 高级工 1 程师 工程师 1 文化程度 专科 高中 1 1 Total 初中
职称
3 4
3
1 3 3
助理工 2 程师 无技术 职称 Total 4
6 3
4
5
3
16
4.3.3 列联表行列变量间关系的分析
分析行变量和列变量的关系,是列联表分 析的第二个任务; 可以得到行变量和列变量是否有联系,联 系的紧密程度等更深层的信息; 这种关系,有时候是明显的,有时候是隐 藏的,可以通过卡方检验得到。
4.3.3.1 交叉列表的卡方检验
卡方检验属于假设检验的内容,主要步骤为:
建立零假设; 选择和计算检验统计量,这里选择的是皮尔逊卡方 统计量; 确立显著性水平和临界值; 结论和决策,卡方值越大,独立性存在的可能越小, 如果大于临界值,则认为不独立。
4.3.3.2 交叉列联表卡方检验的说明
1 n Kurtosis ( xi x ) 4 / S 4 3 n 1 i 1
4.2.2 计算基本描述统计量的基本操 作
1.
Analyze菜单 Descriptive Statistics
Discriptives
如下窗口
4.2.2 描述统计量的基本操作(续)
Variable (s)
列联表中不应该有期望频数小于1的单元 格,也不应该有大量期望频数小于5的单 元格; 样本量不宜过大。
4.3.4 交叉分组下频数分析的操作
1.
Analyze菜单 Descriptive Statistics
Crosstab
如下窗口
操作图
Row (s)
OK 行变量 Paste column (s) 列变量 Layer 1 of Reset Cancel Help
4.1.2 频数分析的基本操作(续)
Chart Type None
Continue
Cancel Help
Bar Chart
Pie Chart Histograms With normal curve
Chart Values Frequencies Percentages
4.1.2 频数分析的基本操作(续)
存 款金 额 Valid N (listwise)
a. 户 口 = 农 村户 口
Байду номын сангаас OUTPUT
3.00
2.00
4.3 交叉分组下的频数分析 4.3.1 目的和基本任务
目的:
分析多个变量不同取值下的分布; 掌握多变量的联合分布; 分析变量之间的相互影响和关系;
例子:居民储蓄问题的分析
目的和任务(续)
集中趋势是指一组数 据向某一中心值靠拢 的倾向; 表现集中趋势的统计 量主要有
均值:数学定义 中位数: 众数:
1 x xi n i 1
n
4.2 .1.2 刻画离散程度的描述统计量
离散程度是指一组数据远离其 中心值的程度; 刻画离散程度的常见统计量主 要有
样本标准差:数学定义 S 样本方差:数学定义 2 全距:样本最大最小值的差
S
1 2 n ( xi x ) 1 n 1 i 1
i 1 i
n
(x x n 1
4.2.1.3 刻画分布形态的描述统计量
分布形态是指数据分布是否对 称,偏斜程度,陡缓程度; 刻画分布形态的常见统计量主 要有 1 n 3 3 偏度:数学定义 Skewness ( xi x ) / S n 1 i 1 峰度:数学定义
引言(续):采用的常用方法
往往采用两种方式实现上述分析功能;
数值计算,通过数值准确的反映数据的统计 特征; 图形绘制,通过图形直观的反映数据的分布 特点;
数值计算和图形绘制使混合使用的,相辅 相成。
4.1 频数分析:4.1.1 目的和基本任 务
通过频数分析能够了解变量取值的状况,把握 分布特征; SPSS中的频数分布表;
引言:基本数据分析的重要地位和 作用
数据处理通常都是从基本统计分析入手的;
能够使分析者掌握数据的基本统计特征; 把握数据的整体分布形态; 对以后的分析起到重要的指导和参考作用。
引言(续):基本统计分析内容
编制单个变量频数分析表; 计算单个变量的描述统计量以及在不同分 组下的描述统计量; 编制多个变量的交叉频数分析表并分析各 变量关系; 其他探索性分析; 数据的多选项分析。
Continue
Min Max S.E.mean Cancel Help
4.2.3 描述统计量的基本操作举例
计算存(取)款金额的基本描述统计
量,并对城镇储户和农村储户进行比 较;
分析储户一次存(取)款数量是否存
在不均衡现象。
Descriptive Statisticsa N Statistic 200 200 Range Statistic 79999.00 Minimum Statistic 1.00 Maximum Statistic 80000.00 Mean Statistic 4956.935 Std. Deviation Statistic 9792.515 Skewness Statistic Std. Error 4.293 .172 Kurtosis Statistic Std. Error 23.208 .342
4.1.2 频数分析的基本操作
1.
Analyze菜单 Descriptive Statistics
Frequencies
如下窗口
4.1.2 频数分析的基本操作(续)
Variable (s)
OK Paste Reset Cancel Help
Display frequency tables Statistics… Charts… Format…
列联表分析的两大基本任务;
列联表分析的两大任务; 根据收集到的数据,产生二维或者多维的交 叉列联表; 在交叉列联表的基础上,对两两变量是否存 在相关性进行分析。
4.3.2 交叉列联表的主要内容
交叉列联表是两个或两个以上的变量交叉分 组后形成的频数分布表; 交叉列联表是由行列构成,行列分别代替一 个变量,分别代表行变量和列变量; 行列标题是两个变量的值,表格中是观测频 数和各种百分比; 行列还有边缘分布;
所有data数据中 的变量
Previous
Display clustered bar charts Suppress tables Exact…
频数即变量值落在某个区间中的次数; 百分比即各频数占总样本数的百分比; 有效百分比即各频数占总有效样本数的百分比; 累计百分比即各百分比逐级累加起来的结果。
4.1.1 目的和基本任务(续)
频数分析中的常用统计图,最为直接的数据刻 画方式;
条形图(Bar Chart):用条形的高度和长短表示频 数分布的图形,适用定序和定类变量的分析; 饼图(Pie Chart):用圆形和圆内扇形面积表示频 数百分比,圆内扇形既可以表示频数也可以表示百 分比; 直方图(Histograms):用矩形面积表示频数分布 变化,试用与定距变量的分析,可以附加正态曲线
Ascending Values Descending Values Ascending Counts Descending Counts Suppress tables with more than categories 18 Organize output by variables Multiple Variables Continue Compare variables Cancel
Help
格式的参数说明即操作
调整频数分布表中数据输出顺序(order by)
按值的升序或者降序输出; 按频数的升序或者降序输出;
压缩频数分布表
如果变量取值太多或者区间太多,就需要压缩 分布表; 系统默认大于10不输出,可以修改。
举例操作:居民储蓄调查数据频数 分析
分析户口和就业的基本情况;
OK Paste Reset Cancel Help
Save standardized values as variables
Options…
4.2.2 描述统计量的基本操作(续)
将需要计算的数值型变量选入Variable (s) 框中; 单击Option…按钮指定计算哪些基本统计量, 出现如下图对话框 指定输出顺序:
第4章 SPSS基本统计分析
制作人:夏怡凡
主要内容:
引言介绍基本统计分析的重要性和主要内容; 频数分析介绍如何对数据的频数分布进行把握; 计算基本描述统计量进一步描述更为精确的数据 分布特征; 列联表分析描述多个变量之间是否存在相关关系; 多选项分析对应处理问卷种多选的问题; 比率分析描述两变量间比率的变化(新增功能)。