当前位置：文档之家› 描述性统计分析

描述性统计分析

.
20
例4-3 已知有某地城市和农村各55名10岁女生身高数据，数据见文件4-2-1.sav，请利用Explore过程分组分析。
.
21
4.4 列联表分析
通过频数分析能够掌握单个变量的数据分布情况。在实际分析过程中，不仅要了解单变量的分布特征，还要分析多个变量不同取值下的分布，掌握多变量的联合分布特征，进而分析变量之间的相互影响和关系。当问题涉及多个变量时，采用单纯的频数分析方法显然不够，这时，我们需要借助交叉分组下的频数分析，又称为列联表分析。
.
16
【界面介绍】
⑴ 选择菜单【Analyze】→【Descriptive Statistics】→ 【Explore】，进入探索性分析界面，出现如图所示的窗口。
.
17
(2)单击【Statistics】按钮，弹出Statistics子对话框，如图所示。该项用于选择所需要的描述统计量。
描述性统计分析
【学习提要】
对数据进行统计描述是统计分析中最基本的工作。对于整理好的数据，通过描述性统计分析，可以挖掘出很多统计量的特征。SPSS软件中，描述性统计分析功能主要集中在 “Descriptive Statistics”菜单。具体包括5个过程： Frequencies过程、Descriptives过程、Explore过程、 Crosstabs过程和Ratio过程。
.
26
指标的具体含义如下：
加权比例均值(Weighted mean ) • 加权比例均值属于集中趋势描述指标，是两变量均值的
比。
平均绝对离差(AAD，Average Absolute Dispersion) • AAD用于对比率变量离散程度的描述。
n
Ri M
ADD i1 n
• 式中，R i 是比率数， M 是比率变量的中位数。
.
27
离散系数(COD，Coefficient of Dispersion) • COD也用于对比率变量离散程度的描述，其数学定义为：
n
Ri M
i 1
COD= n 相关价格微分(PRD，PriceM-related Differential)
• PRD也用于对比率变量离散程度的描述，是比率均值与加权比率均值的比。
标准差Std.deviation：描述变量关于均值的偏离程度方差Variance：标准差的平方极大值Maximum：某变量所有取值的最大值极小值Minimum：某变量所有取值的最小值全距Range：某变量极大值与极小值之差均值的标准误差S.E.mean：均值的标准误差
.
5
在描述性统计分析中，Descriptives过程是连续资料统计描述应用最多的一个过程，他可对变量进行描述性统计分析，计算并列出一系列相应的统计指标。
⑷ 将分组变量选入Group Variable框中。选择Sort by group variables选项表示选择分组变量的排序方式。选择Display result选项表示显示结果。选择Save result.s to external file选项表示将分31 析结果存入外部文件。
• ⑸ 单击【Statistics】按钮，弹出Statistics子对话框。该对话框主要由以下几个部分组成。
.
22
列联表分析的主要任务有两个：
• 第一，根据收集到的样本数据，产生二维或多维交叉列联表。交叉列联表是两个或多个以上变量交叉分组后形成的频数分布表。
• 第二，在交叉列联表的基础上，分析两两变量之间是否具有独立性或一定的相关性。对交叉列联表中的行变量和列变量之间关系进行分析是列联表分析的第二个任务。在列联表基础上做进一步分析，可以得到行变量和列变量之间是否有联系、联系的紧密程度如何等更深层次的信息。
.
25
4.5 相对比描述
相对比描述用于对两变量间变量值对比变化的描述分析，适用于定距型变量。在实际问题中，研究者有时除了希望了解变量自身的统计特征外，还希望得到两个变量相对比之间的统计描述。通常，这可以通过对两个变量做除法形成一个新变量，然后分析新变量的统计特征来得到(如均值、中位数、标准差、全距等)。SPSS的Ratio过程除了能够完成上述分析外，还提供了其他相对比描述指标，大致属于集中趋势描述指标(Central Tendency)和离散程度描述指标 (Dispersion)的范畴。
.
18
(3)单击【Plots】按钮，弹出Plots子对话框。该项用于选择所需要的统计图。
.
19
(4 )单击【Options】按钮，在弹出的子对话框中选择对缺失值的处理方式，可以是不分析有任一缺失值的记录（Exclude cases listwise）、不分析计算某统计量时有缺失值的记录（Exclude cases pairwise），或报告缺失值（Report values）。
COV
n
(Ri M )2
i 1
n
M
.
29
【界面介绍】
• ⑴ 选择菜单【Analyze】→【Descriptive Statistics】→【Ratio】，进入比率分析界面，出现所示的窗口。
.
30
⑵ 将相对比中作分子的变量选入Numerator框中。
⑶ 将相对比中作分母的变量选入Denominator框中。
.
23
【界面介绍】
⑴ 选择菜单【Analyze】→【Descriptive Statistics】→ 【Crosstabs】，进入列联表分析界面。
.
24
【实验案例】
例4-4 调查339名45岁以上吸烟习惯与患肺癌的关系，数据见4-4-1.sav。试问吸烟者与不吸烟者患肺癌的概率是否有所不同。
.
8
【实验案例】例4-1 测量20台液晶显示器的重量，数据见4-1-1.sav，对其进行描述性统计分析。
.
9
4.2 频数分布表分析
频数分析统计的是每一组中观测点的个数，而不是考虑其实际取值。
通过频数分析能够了解变量取值的情况，对于把握数据的分布特征非常有用。当某变量的自然取值是局限在有限的几个数值中，则频数分析就是统计该变量在各个取值点的个数分布情况；如果某变量的取值是在某范围内的离散值，则需要将其取值区域划分为几个取值区间，频数分析就是统计该变量在各个取值区间观测点个数的分布情况。
.
3
描述变量分布情况的统计量
偏度Skewness：描述变量分布的对称程度和方向。偏度为0表示对称，大于0表示右偏，小于0表示左偏
峰度Kurtosis：描述变量分布的陡峭程度。峰度为 0表示陡峭程度和正态分布相同，大于0表示比正态分布陡峭，小于0表示比正态分布平缓
.
4
描述变量离散程度的统计量
.
10
【界面介绍】 ⑴ 选择菜单【Ana来自yze】→【Descriptive Statistics】→ 【Frequencies】，进入频数分析的分析界面，出现如图所示的窗口。
⑵ 将若干频数分析变量选择到Variables(s)框中；选择Display frequency tables复项表示在结果中输出频数表。
.
1
4.1 描述统计量
常见的描述性统计量主要包括以下3类：描述变量集中趋势的统计量、描述变量分布情况的统计量、描述变量离散程度的统计量。
通常，综合这三类统计量就能够极为准确和清晰的把握数据的分布特点。
.
2
描述变量集中趋势的统计量：
均值Mean：表示变量值的平均水平中位数Median：一组数据中处于最中间位置的数众数Mode：一组数据中出现次数最多的数和Sum：某变量的所有变量值之和
.
11
⑶ 单击【Statistics】按钮后弹出Statistics子对话框。
.
12
⑷ 单击【Charts】按钮后弹出Charts子对话框。
.
13
⑸ 单击【Format】按钮，弹出Format子对话框。该对话框用于定义输出频数表的格式，在实际中，我们一般采用默认格式。
.
14
• 例4-2 已知有某地110名10岁女生身高数据，数据见文件4-2-1.sav ，请编制频数表。
.
15
4.3 探索性分析
Explore过程可对变量进行更为深入详尽的描述性统计分析，主要用于对资料的性质、分布特点等完全不清楚时，故又称之为探索性分析。
它在一般描述性统计指标的基础上，增加有关数据其他特征的文字与图形描述，如茎叶图、箱图等，显得更加详细、全面，有助于用户制定继续分析的方案。
.
28
变异系数(COV，Coefficient of Variation)
• COV用于对比率变量离散程度的描述，分为基于均值的变异系数(Mean centered COV)和基于中位数的变异系数(Median centered COV)。基于均值的变异系数是通常意义下的变异系数，是标准差除以均值；基于中位数的变异系数数学定义为：
.
6
【界面介绍】
⑴ 选择菜单【Analyze】→【Descriptive Statistics】→ 【Descriptives】，进入基本描述性统计量的分析界面，出现如图所示的窗口。
.
7
⑵ 在Variables(s)框定义要分析的数值型变量，可同时选择多个变量。 ⑶ 若需将原始数据的标准正态评分存为新变量，则选择Save standardized values as variables选项。 ⑷ 单击【Options】按钮指定计算哪些基本描述性统计量，出现如图所示的窗口。
.
32
【实验案例】
例4-5 已知有2005年各省城乡居民消费水平数据，数据见4-51.sav。试按地区对各省城乡消费水平之比进行分析，并比较不同地区城乡消费水平是否有较大差异。

e商务文档

描述性统计分析

相关文档推荐：