当前位置：文档之家› 统计学原理第二章：数据的描述(3)

统计学原理第二章：数据的描述(3)

50%
• • • Me 不受极端值的影响
50%
主要用于顺序数据，也可用数值型数据，但不能用于分类数据各变量值与中位数的离差绝对值之和最小，即
x M
i 1 i
n
e
min
2.中位数
n 1 位置确定中位数位置 2
x n 1 2 Me 1 x n x n 1 2 2 2 n为奇数
M
i 1
k
i
fi
n
总体加权平均
M
i 1
k
i
fi
N
例题分析---加权平均数
某电脑公司销售量数据分组表
按销售量分组 140~150 150~160 160~170 170~180 180~190 190~200 200~210 210~220 220~230 230~240 合计组中值(Mi) 145 155 165 175 185 195 205 215 225 235 — 频数(fi) 4 9 16 27 20 17 10 8 4 5 120 Mi fi 580 1395 2640 4725 3700 3315 2050 1720 900 1175 22200
第二章
统计数据的描述
陕西科技大学管理学院会计教研室---王化中

LOGO
目录
2.1 数据的收集
2.2 数据的整理 2.3 数据的描述
2.4 数据的计算机处理
2.3 统计数据的描述
一组数据经过分组整理后，形成了次数分配。将次数分配用直方图或曲线图画出来，我们可直观了解该组数据的变化规律。然而，进一步的推断、决策等研究不仅要求我们对其分布变化的规律有直观的了解，而且要求我们用几个最简洁又最能充分描述其分布数量特征的统计量将其分布变化的规律性表示出来。这些统计量包括:数据集中趋势的测度、离散程度的测度、偏态程度的测度及峰度的测度。位置和尺度
人数
（人） 3 11 34 24 11 83
比重
（%） 3.61 13.25 40.96 28.92 13.25 100.00
总计
1 Mo L d 1 2
23 M o 160 5 163 .48 23 10
2.中位数
(median)
排序后处于中间位置上的值
1 3 5 9 10 12 14 26 33 41 45
164 165 166 167 168 169 170 171 172 174
总计
3 8 5 3 7 1 5 2 3 1 83
48 56 61 64 71 72 77 79 82 83
（3）由组距数列求中位数。确定中位数位置后利用公式计算下限公式：Ｍ＝Ｌ﹢（ ∑ｆ∕ 2 －Ｓｍ－1 ∕ｆ）× ｄ上限公式：Ｍ＝Ｕ－（∑ｆ∕ 2 －Ｓｍ﹢1 ∕ｆ）× ｄ
身高
人数
身高人数
（CM）（人） 164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1 总计 83
（CM）（人） 152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4
3.四分位数
(quartile)
排序后处于25%和75%位置上的值
25%
QL
25%
25%
QM
25%
QU
• 不受极端值的影响 • 计算公式
n QL 位置 4 Q 位置 3n U 4
例题分析---顺序数据的四分位数
甲城市家庭对住房状况评价的频数分布
解：QL位置= (300)/4 =75 QU位置 =(3× 300)/4 =225 从累计频数看， QL 在 “不满意”这一组别中； QU在 “一般”这一组别中四分位数为 QL = 不满意 QU = 一般
73.4
x 5512%6524%7538%8520%956% 73.4
算术平均数的性质
各标志值与算术平均数离差之和等于零; 各标志值与算术平均数离差平方之和最小; 各标志值同时减去一个常数 (不等于零),计算的平均数再加上一与原平均数相等; 将每个标志值同时除以常数 D(D 不等于零) 之后，计算的平均数乘以 D,等于原来的平均数; 将每个标志值同时减去常数一再除以常数 D(A,D 不等于零) 得新变量值,新变量值的平均数乘以 D 再加上一之后与原变量平均值相等。注意 A,D 的选择: A:最接近变量平均数的值, D:最大公约数。
甲城市回答类别非常不满意不满意一般满意非常满意合计
户数 (户)
24 108 93 45 30 300
累计频数
24 132 225 270 300 —
例题分析---数值数据的四分位数
【例】：9个家庭的人均月收入数据(4种方法计算)
原始数据: 排序: 位置: 1500 750 780 1080 850 960 2000 1250 1630 750 780 850 960 1080 1250 1500 1630 2000
N
i
4.2加权平均数
(Weighted mean)
设各组的组中值为：M1 ，M2 ，… ，Mk 相应的频数为： f1 ， f2 ，… ，fk 样本加权平均
M 1 f1 M 2 f 2 M k f k x f1 f 2 f k M 1 f1 M 2 f 2 M k f k f1 f 2 f k
数值确定
n为偶数
例题分析---顺序数据的中位数
甲城市家庭对住房状况评价的频数分布回答类别非常不满意不满意一般满意非常满意合计甲城市户数 (户) 24 108 93 45 30 300 累计频数 24 132 225 270 300 —
解：中位数的位置为
(300+1)/2＝150.5 从累计频数看，中位数在“一般”这一组别中中位数为
某年级83名女生身高资料
身高
（CM） 150-155 155-160 160-165 165-170 170以上
人数
（人） 3 11 34ቤተ መጻሕፍቲ ባይዱ24 11 83
累计人数
3 14 48 72 83
f
Me L 2
S m 1 fm
d
总计
83 14 M e 160 2 5 164.04 34
1
2
9 QL 位置 2.25 4

3
4
6 7 8 9 3 9 QU 位置 6.75 4
5
QL 780 (850 780) 0.25 QU 1250 (1500 1250) 0.75 1437.5 797.5
4.平均数
(mean)
也称为均值集中趋势的最常用测度值一组数据的均衡点所在 x 体现了数据的必然性特征易受极端值的影响有简单平均数和加权平均数之分根据总体数据计算的，称为平均数，记为；根据样本数据计算的，称为样本平均数，记为x
中位数 1080
例题分析---顺序数据的中位数
【例】：10个家庭的人均月收入数据
排位序: 置: 660 750 780 850 960 1080 1250 1500 1630 2000
1 2
3
4
5
6
7
8
9
10

n 1 10 1 位置 5 .5 2 2
960 1080 中位数 1020 2
Me=一般
例题分析---数值数据的中位数
【例】
原始数据: 排序:
9个家庭的人均月收入数据
1500 750 780 1080 850 960 2000 1250 1630 750 780 850 960 1080 1250 1500 1630 2000
位
置:
1
2
3
4
5
6
7
8
9

n 1 9 1 位置 5 2 2

x
M
i 1
k
i
fi
n 22200 185 120
成绩（分） 60以下 60~70 70~80 80~90 90~100 合计
人数（人） 6 12 19 10 3 50
比重（%） 12 24 38 20 6 100
组中值（M） 55 65 75 85 95 －
556651275198510953 x＝ 61219103
（3）由组距数列求众数。先根
据各组次数确定众数组，再利用公式计算。
众数的计算公式有上限公式和下
限公式
下限公式：
Ｍ＝Ｌ﹢△1∕
（ △1﹢ △2）×
ｄ
上限公式：Ｍ＝Ｕ－△2∕（△1﹢
MO
△2）×ｄ
某年级83名女生身高资料
身高
（CM） 150-155 155-160 160-165 165-170 170以上
Mo＝可口可乐
可口可乐旭日升冰茶百事可乐汇源果汁露露合计
15 11 9 6 9 50
0.30 0.22 0.18 0.12 0.18 1
30 22 18 12 18 100
例题分析---顺序数据的众数
甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户) 百分比 (%)
解：这里的数据为顺序数据。变量为“回答类别” 甲城市中对住房表示不满意的户数最多，为 108户，因此众数为“不满意”这一类别，即
例释
这是一个印度男孩

e商务文档

统计学原理第二章：数据的描述(3)

相关文档推荐：