当前位置:文档之家› 描述性统计

描述性统计


57
1.对“行业”变量进行描述性统计 输出频数统计表 输出饼图

58
操作如下: Analysis Descriptive Statistics Frequencies 打开频数分析对话框

59
60

选中“行业”之后,点击箭头,使该变量进 入右端框中。点击“Charts”按钮。
描述性统计
1
第一节
分布特征
2
数据分布的特征
集中趋势 (位置) 离中趋势 (分散程度) 偏态和峰度 (形状)
3
数据分布的特征和测度
数据的特征和测度
集中趋势
众 数 中位数 均 值
离散程度
全距 方差 标准差
分布的形状
偏 度
峰 度
4
一、集中趋势

一组数据向其中心值靠拢的倾向和程度 测度集中趋势就是寻找数据一般水平的代表 值或中心值
18
特点:
信息利用充分 易受极端值的影响 仅适用定距数据和定比数据,不能用于定类 数据和定序数据

19
众数、中位数和均值的关系
均值 中位数 众数
均值 = 中位数 = 众数
众数 中位数 均值
左偏分布
对称分布
右偏分布
20
二、离散程度的测度
21
离中趋势


数据分布的另一个重要特征 离中趋势的各测度值是对数据离散程度所作的描述 反映各变量值远离其中心值的程度,因此也称为离 中趋势 从另一个侧面说明了集中趋势测度值的代表程度
例:

有99人参加英语六级考试,将这99人考试成 绩由低到高排序:
24人
第25名
24人
第50名
24人
第75名
24人
分数Biblioteka 第一四分位数第三四分位数
16
特点
不受极端值的影响 能粗略描绘分布的形态,如是否具有对称性 适用于定序数据、定距数据和定比数据,但 不能用于定类数据

17
均值

最常用的集中趋势的测度值之一
47
二、描述统计分析
(Descriptives)
48
(一)基本功能
与Frequencies功能基本相同 均值、标准差、方差、极差 最大值、最小值 峰度、偏度 对变量值进行标准化 zk=(Xk- X)/S 并产生一个新变量,其变量名是 原变量名前加Z
49
(二) 基本操作方法
单击Analyze菜单 选择Summarize 中的Descriptives项 对Descriptives对话框进行设置
条形图Bar chart 饼图(Pie chart) 直方图Histogram 其中直方图还可以选择是否加上正态曲
线(With normal curve)
Chart Values 单选钮组定义是按照频数还是按百分比 作图(即影响纵坐标刻度)
46
Format 按钮
用于定义输出频数表的格式(用处不大)。
6 5
8 5
多于一个众数 原始数据: 25 28 28 36 42 42
9
定类数据的众数
表3-1 某城市居民关注广告类型的频数分布 广告类型 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告 合计 人数(人) 112 51 9 16 10 2 200 比例 0.560 0.255 0.045 0.080 0.050 0.010 1 频率(%) 56.0 25.5 4.5 8.0 5.0 1.0 100
左偏分布
扁平分布
与标准正态 分布比较!
右偏分布
尖峰分布
31
偏度

数据分布偏斜程度的测度
偏度系数=0为对称分布 偏度系数> 0为右偏分布 偏度系数< 0为左偏分布
32
SK--偏度系数
Mo
x
Mo
x
x
Mo
SK=0
对称分布
SK>0
右偏
SK<0
左偏
33
峰度
(概念要点)


数据分布扁平程度的测度

50
三、数据考察
(Explore)
51
(一)主要功能
检查数据是否存在异常值 对异常数据应辨明原因 进而决定应否对其剔除 分析变量值的分布状态 分析数据是否服从正态分布

52
(二) 相关概念简介
53
箱图(Boxplot)
最大值(以星号标示,可多个) 异常值(以O标示) 正常值中的最大值 第三四分位数 第二四分位数(中位数) 第一四分位数 最小值(可多个) Case Number

74

点击“Graphs”主菜单, 在下拉菜单中,选择 “Scatter/Dot”。
75

点击:“Define”
76
将“资产负债率”选入“X Axis” 将“资产报酬率”选入“Y Axis” 点击“OK”

77

出 结 果: 散 点 图
78
4.计算主要描述性统计指标
对“资产负债率”计算以下指标: 均值、中位数、众数、标准差、极差、最大 值、最小值、峰度、偏度、四分位数。
最小值(Minimum) 最大值(Maximum)
均值标准误差(S.E.mean)
44
Distribution 复选框组用于定义描述分布特征 的两个指标
偏度系数(Skewness) 峰度系数(Kurtosis)
45
Charts 按钮
用于设定所做的统计图 Chart type 单选钮组定义统计图
61

选中“Bar charts”,并点击“Continue”

返回后, 点击“OK”即 可得到输出结 果。
如果希望以百分 比形式输出条 形图,选择: “Percentages”
62
输出结果:频数分布表
行 业 Cumulative Percent .9 45.6 48.2 50.0 55.3 59.6 71.9 79.8 83.3 84.2 100.0
Percent .9 44.7 2.6 1.8 5.3 4.4 12.3 7.9 3.5 .9 15.8 100.0
Valid Percent .9 44.7 2.6 1.8 5.3 4.4 12.3 7.9 3.5 .9 15.8 100.0
输出结果:条形图(频数)
64
输出结果:条形图(百分比)
65
饼图的绘制

操作与条形图的绘制基本相同,不同之处如 下:
66

选中“Pie charts”,并点击“Continue”
67
输出结果:饼图
68
2.直方图的绘制

绘制“资产负债率”的直方图。
69
操作如下: Analysis Descriptive Statistics Frequencies 打开频数分析对话框

79

在频数分析对话框中,将“资产负债率”选 入右端方框中,然后单击“Statistics”按钮。
5
集中趋势的测度
一.
众数 二. 中位数和分位数 三. 均值
6
众数
概念:出现次数最多的变量值
7
特点:
1. 2.
不受极端值的影响 可能没有众数或有几个众数
3.
可用于:定类数据、定序数据、定距数据 和定比数据。
8
例:众数的不唯一性
无众数 原始数据: 一个众数 原始数据:
10 6
5 5
9 12 9 8

70
将“资产负债率”选入右端框中。 点击“Charts”按钮。

71
选中“Histograms”和“With normal curve” “Continue”

返回后, 点击“OK”即 可得到输出结 果。
72
输出结果:直方图
73
3.散点图的绘制
绘制“资产负债率”与“资产报酬率”之间 的散点图。 要求,前者作为横轴,后者作为纵轴。
峰度系数=0扁平程度适中 偏态系数<0为扁平分布 偏态系数>0为尖峰分布
34
第二节
描述性统计分析 的 SPSS操作
35

Descriptive Statistics (描述性统计)模块
Frequencies(频数分析) Descriptive(描述统计) Explore(数据考察)
36
一、频数分析
25
样本方差和标准差的计算公式
方差的计算公式 标准差的计算公式
S n21
( xi x ) 2
i 1
n
n 1
S n 1
(x
i 1
n
i
x)
2
n 1
26
例:样本方差与标准差的计算

原始数据: 10
5
2
9
13
6
8
S
2 n 1

i 1
( xi x )
n
n 1 2 2 2 (10 8.5) (5 8.5) (8 8.5) 6 1 8.3
不受极端值的影响 适用于定序数据、定距数据和定比数据,但 不能用于定类数据
12
例:样本容量为单数据的中位数算


原始数据: 排 序: 位 置:
24 20 1
22 21 2
21 22 3
26 24 4
20 26 5
N 1 5 1 位置 3 2 2
中位数 22
13
例:样本容量为双数据的中位数算
Central Tendency 复选框组用于定义描述集 中趋势的一组指标
相关主题