当前位置:文档之家› 描述性统计分析

描述性统计分析


.
20
例4-3 已知有某地城市和农村各55名10岁女生身高数 据,数据见文件4-2-1.sav,请利用Explore过程分组分 析。
.
21
4.4 列联表分析
通过频数分析能够掌握单个变量的数据分布情况。 在实际分析过程中,不仅要了解单变量的分布特征,还 要分析多个变量不同取值下的分布,掌握多变量的联合 分布特征,进而分析变量之间的相互影响和关系。当问 题涉及多个变量时,采用单纯的频数分析方法显然不 够,这时,我们需要借助交叉分组下的频数分析,又称 为列联表分析。
.
16
【界面介绍】
⑴ 选 择 菜 单 【Analyze】→【Descriptive Statistics】→ 【Explore】,进入探索性分析界面,出现如图所示的 窗口。
.
17
(2)单击【Statistics】按钮,弹出Statistics子对话框,如图 所示。该项用于选择所需要的描述统计量。
描述性统计分析
【学习提要】
对数据进行统计描述是统计分析中最基本的工作。对于 整理好的数据,通过描述性统计分析,可以挖掘出很多统计 量的特征。SPSS软件中,描述性统计分析功能主要集中在 “Descriptive Statistics”菜单。具体包括5个过程: Frequencies过程、Descriptives过程、Explore过程、 Crosstabs过程和Ratio过程。
.
26
指标的具体含义如下:
加权比例均值(Weighted mean ) • 加权比例均值属于集中趋势描述指标,是两变量均值的
比。
平均绝对离差(AAD,Average Absolute Dispersion) • AAD用于对比率变量离散程度的描述。
n
Ri M
ADD i1 n
• 式中,R i 是比率数, M 是比率变量的中位数。
.
27
离散系数(COD,Coefficient of Dispersion) • COD也用于对比率变量离散程度的描述,其数学定义为:
n
Ri M
i 1
COD= n 相关价格微分(PRD,PriceM-related Differential)
• PRD也用于对比率变量离散程度的描述,是比率均值与 加权比率均值的比。
标准差Std.deviation:描述变量关于均值的偏离程度 方差Variance:标准差的平方 极大值Maximum:某变量所有取值的最大值 极小值Minimum:某变量所有取值的最小值 全距Range:某变量极大值与极小值之差 均值的标准误差S.E.mean:均值的标准误差
.
5
在描述性统计分析中,Descriptives过程是连 续资料统计描述应用最多的一个过程,他可对变 量进行描述性统计分析,计算并列出一系列相应 的统计指标。
⑷ 将分组变量选入Group Variable框中。选择Sort by group variables选项表示选择分组变量的排序方式。选择Display result选 项表示显示结果。选择Save result.s to external file选项表示将分31 析 结果存入外部文件。
• ⑸ 单击【Statistics】按钮,弹出Statistics子对话框。该对 话框主要由以下几个部分组成。
.
22
列联表分析的主要任务有两个:
• 第一,根据收集到的样本数据,产生二维或多维交叉 列联表。交叉列联表是两个或多个以上变量交叉分组 后形成的频数分布表。
• 第二,在交叉列联表的基础上,分析两两变量之间是 否具有独立性或一定的相关性。对交叉列联表中的行 变量和列变量之间关系进行分析是列联表分析的第二 个任务。在列联表基础上做进一步分析,可以得到行 变量和列变量之间是否有联系、联系的紧密程度如何 等更深层次的信息。
.
25
4.5 相对比描述
相对比描述用于对两变量间变量值对比变化的 描述分析,适用于定距型变量。在实际问题中,研究 者有时除了希望了解变量自身的统计特征外,还希望 得到两个变量相对比之间的统计描述。通常,这可以 通过对两个变量做除法形成一个新变量,然后分析新 变量的统计特征来得到(如均值、中位数、标准差、 全距等)。SPSS的Ratio过程除了能够完成上述分析 外,还提供了其他相对比描述指标,大致属于集中趋 势描述指标(Central Tendency)和离散程度描述指标 (Dispersion)的范畴。
.
18
(3)单击【Plots】按钮,弹出Plots子对话框。该项用于选择 所需要的统计图。
.
19
(4 )单击【Options】按钮,在弹出的子对话框中选择对 缺失值的处理方式,可以是不分析有任一缺失值的记录 (Exclude cases listwise)、不分析计算某统计量时有缺 失值的记录(Exclude cases pairwise),或报告缺失值 (Report values)。
COV
n
(Ri M )2
i 1
n
M
.
29
【界面介绍】
• ⑴ 选择菜单【Analyze】→【Descriptive Statistics】→【Ratio】,进入比率分析界面,出 现所示的窗口。
.
30
⑵ 将相对比中作分子的变量选入Numerator框中。
⑶ 将相对比中作分母的变量选入Denominator框中。
.
23
【界面介绍】
⑴ 选 择 菜 单 【Analyze】→【Descriptive Statistics】→ 【Crosstabs】,进入列联表分析界面。
.
24
【实验案例】
例4-4 调查339名45岁以上吸烟习惯与患肺癌的关系,数 据见4-4-1.sav。试问吸烟者与不吸烟者患肺癌的概率是 否有所不同。
.
8
【实验案例】 例4-1 测量20台液晶显示器的重量,数据见4-1-1.sav,对其进行 描述性统计分析。
.
9
4.2 频数分布表分析
频数分析统计的是每一组中观测点的个数,而不是 考虑其实际取值。
通过频数分析能够了解变量取值的情况,对于把握 数据的分布特征非常有用。当某变量的自然取值是局限 在有限的几个数值中,则频数分析就是统计该变量在各 个取值点的个数分布情况;如果某变量的取值是在某范 围内的离散值,则需要将其取值区域划分为几个取值区 间,频数分析就是统计该变量在各个取值区间观测点个 数的分布情况。
.
3
描述变量分布情况的统计量
偏度Skewness:描述变量分布的对称程度和方 向。偏度为0表示对称,大于0表示右偏,小于0表 示左偏
峰度Kurtosis:描述变量分布的陡峭程度。峰度为 0表示陡峭程度和正态分布相同,大于0表示比正 态分布陡峭,小于0表示比正态分布平缓
.
4
描述变量离散程度的统计量
.
10
【界面介绍】 ⑴ 选择菜单【Ana来自yze】→【Descriptive Statistics】→ 【Frequencies】,进入频数分析的分析界面,出现如图所 示的窗口。
⑵ 将若干频数分析变量选择到Variables(s)框中;选择Display frequency tables复项表示在结果中输出频数表。
.
1
4.1 描述统计量
常见的描述性统计量主要包括以下3类: 描述变量集中趋势的统计量、描述变量分布 情况的统计量、描述变量离散程度的统计 量。
通常,综合这三类统计量就能够极为准 确和清晰的把握数据的分布特点。
.
2
描述变量集中趋势的统计量:
均值Mean:表示变量值的平均水平 中位数Median:一组数据中处于最中间位置的数 众数Mode:一组数据中出现次数最多的数 和Sum:某变量的所有变量值之和
.
11
⑶ 单击【Statistics】按钮后弹出Statistics子对话框。
.
12
⑷ 单击【Charts】按钮后弹出Charts子对话框。
.
13
⑸ 单击【Format】按钮,弹出Format子对话框。该对话框 用于定义输出频数表的格式,在实际中,我们一般采用 默认格式。
.
14
• 例4-2 已知有某地110名10岁女生身高数据,数据见文 件4-2-1.sav ,请编制频数表。
.
15
4.3 探索性分析
Explore过程可对变量进行更为深入详尽的描述性统 计分析,主要用于对资料的性质、分布特点等完全不清楚 时,故又称之为探索性分析。
它在一般描述性统计指标的基础上,增加有关数据其他 特征的文字与图形描述,如茎叶图、箱图等,显得更加详 细、全面,有助于用户制定继续分析的方案。
.
28
变异系数(COV,Coefficient of Variation)
• COV用于对比率变量离散程度的描述,分为基于均值 的变异系数(Mean centered COV)和基于中位数的变异 系数(Median centered COV)。基于均值的变异系数是通 常意义下的变异系数,是标准差除以均值;基于中位数的 变异系数数学定义为:
.
6
【界面介绍】
⑴ 选 择 菜 单 【Analyze】→【Descriptive Statistics】→ 【Descriptives】,进入基本描述性统计量的分析界面, 出现如图所示的窗口。
.
7
⑵ 在Variables(s)框定义要分析的数值型变量,可同时选择多 个变量。 ⑶ 若需将原始数据的标准正态评分存为新变量,则选择Save standardized values as variables选项。 ⑷ 单击【Options】按钮指定计算哪些基本描述性统计量,出 现如图所示的窗口。
.
32
【实验案例】
例4-5 已知有2005年各省城乡居民消费水平数据,数据见4-51.sav。试按地区对各省城乡消费水平之比进行分析,并比 较不同地区城乡消费水平是否有较大差异。
相关主题