当前位置:
文档之家› 第五章 基本统计分析2014-11-19
第五章 基本统计分析2014-11-19
、标准差、最大值和最小值。如需要其它 的参数可以自己选择。上述选项都确定以后, 单击Continue 按钮返回Descriptives 对话 框。 4.单击OK 按钮,提交运行。可在输出文件 的Output窗口看到输出的Descriptives 统 计表。
系统默认状态是按变量值的升序排序,多 个变量在同一个表中输出。用户可根据自 己需要作选择。上述选项都确定以后,单 击Continue 按钮返回频数分析对话框。 6.单击OK 按钮,提交运行。 用户可以在输出文件的Output 窗口看到输 出的频数分布表。
四、描述统计(Descriptives)
Descriptives 是对变量的统计描述,它既 适用于数值变量的统计描述。
单击Statistics(统计量)按钮,打开对话框。
(1)Percentile Values 是百分位数选项栏。 ①Quartiles 是四分位数,包括上四分位和下四分 位。 ②Cut points for equal groups 是每隔指定的百 分位间距输出一个百分位数的选项。 ③ Percentiles 是直接指定输出的百分位数。如指 定输出位于2.5%和97.5%的变量的值。
(4)Distribution 是分布特征选项栏 ①Skewness 是偏度系数。 ②Kurtosis 是峰度系数。 系统默认状态是不输出任何选项。如用 户需要,可在上述对话框中选择。上述选 项做完以后,单击Continue按钮返回频数 分析对话框。
4.确定生成的图形
单击“Charts”按钮,打开绘图对话框。在该对话 框中有两个选项栏。 (1)Chart type 统计图类型选项栏。
三、计量资料的统计描述
报告数据库aa1调查对象BMI水平的:
集中趋势
算术均数 中位数
离散趋势
������ ������ ������ 最小值和最大值 四分位数间距 标准差
三、计量资料的统计描述
将要分析的变量BMI选入变量列表
不要勾选“Display frequency tables”
单击Statistics(统计量)按钮,打开对话框。
(2)Chart values 是作图数据的选项栏。
如果选择了Bar chart或Pie chart。便激活 了Chart。
①Frequencies 是按频数作图。 ②Percentages 是按百分比作图。
系统默认状态是不输出图。可按自己的需要进行 选择。上述选项做完以后,单击Continue按钮返 回频数分析对话框。
其中有四种选择: ①None 是不生成图。这是系统默认选项。 ②Bar chart 是绘制条形图。 ③Pie chart 是绘制圆形图。 ④Histogram 是绘制直方图。对于直方图还可以选择是否加上 正态曲线(With normal curve)。 要选择了Histogram 选项,即可激活With normal curve 选项。
Descriptives 的功能是将描述统计的各 个统计部分作为分析结果输出。
1.打开描述统计对话框
执行下述操作: Analyze→Descriptive Statistics →Descriptives 打开Descriptives 对话框。 Save standardized values as variables 是将原 始数据的标准分存为新变量的选项。选择该项以后, 系统将以原始数据的标准分为变量内容生成一个新 变量。
三、计量资料(数值变量)的统计描述
菜单Analyze Descriptive Statistics ������ Frequencies…
注:具体操作
制作频数表
区间数据频数分段 1.用recode进行频数分组 2.用计算公式进行数据分组: 频数分组的标准计算公式: 频数分组结果变量=trunc(变量-最小组下 限)/组距 3.用可视化分组(visual bander)进行频数 分段(自学)
第五章 基本统计分析(1)
Descriptive statistics
流行病与卫生统计学科 范红敏
概述
• 统计学分析有两个方面:统计学描述和统 计学推断。 • 统计描述为统计分析打下基础。 • 统计描述有数据频数分布特征描述、集中 趋势值和离散趋势值的计算等。
数据分类
Spss变量分为三类:
• 名义变量(nominal):定性资料计数资料和
2.选择进行描述统计的变量
从左侧的源变量窗口中选择将要进行描 述统计的变量,使之进入到Variable(s) 窗口中。
3.选择描述统计的内容
单击0ptions 按钮,打开对话框。 该对话框中的大部分内容均在frequencies 中见过。只有 下方的Display order 选项栏是新的。 Display order 是确定输出统计结果排列顺序的选项栏。 当用户选择了多个变量进行描述时,在输出文件中如何排 列这些统计结果,有该栏中的选项来确定。 (1)Variable list 是将输出的统计结果按变量顺序列表, 这是系统默认的选项。 (2)Alphabetic 是将输出的统计结果按字母顺序列表。 (3)Ascending means 是将输出的统计结果按照平均值的 升序顺序列表。 (4)Descending means 是将输出的统计结果按照平均值 的降序顺序列表。
4.百分位数 (percentile)
常用的有4分位数(quartiles),指的是将数据 分为四等份,分别为25%,50%和75%处的分位数。
百分位数的优点是不受极端值的影响。
(二)描述离散趋势的统计量
1.样本方差 (variance):是描述样本离散趋势的 常用统计量。样本方差越大,表面样本值偏离样本 平均值的可能性越大。 2.样本标准差 (std. deviation):将样本方差开 方后统计量,也是度量样本离散程度的重要统计量。
比值描述:ratio
二、基本统计量的定义 分为三类: •描述集中趋势的统计量 •描述离散程度的统计量 •描述总体分布形态的统计量
(一)描述集中趋势的统计量
统计学中的集中趋势统计量是由样本值确 定的量,样本值有向这个数据集中的趋势。 测度集中趋势就是寻找数据一般水平的代 表值或中心值,不同类型的数据用不同的 集中趋势测度值,选择那种测度值取决于 数据的类型。
注意:descriptives过程的特点是有一个产生标准 化值的选项。
六、交叉列表 (Crosstabs) 分析的过程 交叉列表分析的过程是对两个变量之间关 系的分析方法。被分析的变量可以是分类 变量也可以是分类有序变量。系统是通过 生成交叉表对两个变量进行交叉列表分析 的。
1.打开交叉列表分析对话框
(4)Ordinal 是顺序变量选项栏 ①Gramma:Gramma 等级相关系数。 ②Somers’d:Somers 等级相关d 系数。 ③Kendall’s tau-b:肯得尔等级相关tau-b 系数。 ④Kendall’s tau-c:肯得尔等级相关tau-c 系数。
(5)Nominal by Interval 选项栏中的Eta 是当一个变量为名义变量,另一个变量为尺 度变量时,测量两个变量之间关系的相关比 率。 系统默认状态是不输出上述参数。如用户需 要可自行选择。上述选择做完以后,单击 Continue返回到Crosstabs 对话框。
无序分类资料
• 有序变量(ordinal):有序分类资料 • 尺度变量(scale):定量资料(计量资料)
一、统计分析子菜单
descriptive statistics 频数分布分析:frequencies 描述性统计分析:descriptives 探索性统计分析:explore
列联表资料分析:crosstabs
5.确定输出格式
单击format 按钮打开格式对话框。通过选择该对话 框中的选项可以定义输出频数表的格式。 (1)Order by 是定义频数表的排列次序选项栏。
①Ascending values 是按变量值的升序从小到大排列。这是 系统默认状态。 ②Descending values 是按变量值的降序从大到小排列。 ③Ascending counts 是按频数的升序从小到大排列。 ④Descending counts 是按频数的降序从大到小排列。
3.均值标准误(standard error of mean): 样本均值的标准差,是描述样本均值和总体 均值平均偏差程度的统计量。 4.极差 (range):是样本数中最大值和最 小值之差。 5.变异系数(coefficient of variation): 主要用于量纲不同的变量间,或均数差别较 大的变量间变异程度的比较。
(三)描述总体分布形态的统计量
1.偏度(skewness)是描述取值分布形态对称 性的统计量。 理论上总体偏度系数为0时,分布是对称的; 取正值时,分布为负偏锋; 取负值时分布为正 偏锋。 2.峰度(kutosis):描述变量取值分布形态扁 平程度的统计量。 峰度等于0时,表示数据分布的扁平程度适中, 即正态分布。 峰度大于0时,表示数据呈扁平分布; 峰度小于0时,表明数据呈尖峰分布。
(3)Nominal 是名义变量选项栏。
①Contingency coefficient:列联相关的C 系数,由卡方系数修正而得。 ② Phi and Cramer's V:列联相关的V 系数, 由卡方系数修正而得。 ③Lambda:λ系数。 ④Uncertainty Coefficient:不定系数。
(2)Central Tendency 是集中趋势选项栏 ①Mean 是平均数。 ②Median 是中位数。 ③Mode 是众数。 ④Sum 是总和或合计。
(3)Dispersion 是离散趋势选项栏
①Std.deviation 是标准差。 ②Variance 是方差。 ③Range 是全距。 ④Minimum 是最小值。 ⑤Maximum 是最大值。 ⑥S.E.mean 是标准误。