当前位置:
文档之家› 统计学原理第二章:数据的描述(3)
统计学原理第二章:数据的描述(3)
50%
• • • Me 不受极端值的影响
50%
主要用于顺序数据,也可用数值型数据,但不能用于分 类数据 各变量值与中位数的离差绝对值之和最小,即
x M
i 1 i
n
e
min
2.中位数
n 1 位置确定 中位数位置 2
x n 1 2 Me 1 x n x n 1 2 2 2 n为奇数
M
i 1
k
i
fi
n
总体加权平均
M
i 1
k
i
fi
N
例题分析---加权平均数
某电脑公司销售量数据分组表
按销售量分组 140~150 150~160 160~170 170~180 180~190 190~200 200~210 210~220 220~230 230~240 合计 组中值(Mi) 145 155 165 175 185 195 205 215 225 235 — 频数(fi) 4 9 16 27 20 17 10 8 4 5 120 Mi fi 580 1395 2640 4725 3700 3315 2050 1720 900 1175 22200
第二章
统计数据的描述
陕西科技大学管理学院会计教研室---王化中
LOGO
目 录
2.1 数据的收集
2.2 数据的整理 2.3 数据的描述
2.4 数据的计算机处理
2.3 统计数据的描述
一组数据经过分组整理后,形成了次数分配。将次数 分配用直方图或曲线图画出来,我们可直观了解该组数据的 变化规律。然而,进一步的推断、决策等研究不仅要求我们 对其分布变化的规律有直观的了解,而且要求我们用几个最 简洁又最能充分描述其分布数量特征的统计量将其分布变化 的规律性表示出来。这些统计量包括:数据集中趋势的测度 、离散程度的测度、偏态程度的测度及峰度的测度。 位置和尺度
人数
(人) 3 11 34 24 11 83
比重
(%) 3.61 13.25 40.96 28.92 13.25 100.00
总计
1 Mo L d 1 2
23 M o 160 5 163 .48 23 10
2.中位数
(median)
排序后处于中间位置上的值
1 3 5 9 10 12 14 26 33 41 45
164 165 166 167 168 169 170 171 172 174
总计
3 8 5 3 7 1 5 2 3 1 83
48 56 61 64 71 72 77 79 82 83
(3)由组距数列求中位数。确定中 位数位置后利用公式计算 下限公式: M=L﹢( ∑f∕ 2 -Sm-1 ∕f)× d 上限公式: M=U-(∑f∕ 2 -Sm﹢1 ∕f)× d
身高
人数
身高 人数
(CM) (人) 164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1 总计 83
(CM) (人) 152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4
3.四分位数
(quartile)
排序后处于25%和75%位置上的值
25%
QL
25%
25%
QM
25%
QU
• 不受极端值的影响 • 计算公式
n QL 位置 4 Q 位置 3n U 4
例题分析---顺序数据的四分位数
甲城市家庭对住房状况评价的频数分布
解:QL位置= (300)/4 =75 QU位置 =(3× 300)/4 =225 从 累 计 频 数 看 , QL 在 “不 满意”这一组别中; QU在 “一般”这一组别中 四分位数为 QL = 不满意 QU = 一般
73.4
x 5512%6524%7538%8520%956% 73.4
算术平均数的性质
各标志值与算术平均数离差之和等于零; 各标志值与算术平均数离差平方之和最小; 各标志值同时减去一个常数 (不等于零),计算的平均 数再加上一与原平均数相等; 将每个标志值同时除以常数 D(D 不等于零) 之后,计 算的平均数乘以 D,等于原来的平均数; 将每个标志值同时减去常数一再除以常数 D(A,D 不等 于零) 得新变量值,新变量值的平均数乘以 D 再加上 一之后与原变量平均值相等。 注意 A,D 的选择: A:最接近变量平均数的值, D:最大公约数。
甲城市 回答类别 非常不满意 不满意 一般 满意 非常满意 合计
户数 (户)
24 108 93 45 30 300
累计频数
24 132 225 270 300 —
例题分析---数值数据的四分位数
【例】:9个家庭的人均月收入数据(4种方法计 算)
原始数据: 排 序: 位 置: 1500 750 780 1080 850 960 2000 1250 1630 750 780 850 960 1080 1250 1500 1630 2000
N
i
4.2加权平均数
(Weighted mean)
设各组的组中值为:M1 ,M2 ,… ,Mk 相应的频数为: f1 , f2 ,… ,fk 样本加权平均
M 1 f1 M 2 f 2 M k f k x f1 f 2 f k M 1 f1 M 2 f 2 M k f k f1 f 2 f k
数值确定
n为偶数
例题分析---顺序数据的中位数
甲城市家庭对住房状况评价的频数分布 回答类别 非常不满意 不满意 一般 满意 非常满意 合计 甲城市 户数 (户) 24 108 93 45 30 300 累计频数 24 132 225 270 300 —
解:中位数的位置为
(300+1)/2=150.5 从累计频数看, 中位数在“一般”这 一组别中 中位数为
某年级83名女生身高资料
身高
(CM) 150-155 155-160 160-165 165-170 170以上
人数
(人) 3 11 34ቤተ መጻሕፍቲ ባይዱ24 11 83
累计 人数
3 14 48 72 83
f
Me L 2
S m 1 fm
d
总计
83 14 M e 160 2 5 164.04 34
1
2
9 QL 位置 2.25 4
3
4
6 7 8 9 3 9 QU 位置 6.75 4
5
QL 780 (850 780) 0.25 QU 1250 (1500 1250) 0.75 1437.5 797.5
4.平均数
(mean)
也称为均值 集中趋势的最常用测度值 一组数据的均衡点所在 x 体现了数据的必然性特征 易受极端值的影响 有简单平均数和加权平均数之分 根据总体数据计算的,称为平均数,记为;根据 样本数据计算的,称为样本平均数,记为x
中位数 1080
例题分析---顺序数据的中位数
【例】:10个家庭的人均月收入数据
排 位 序: 置: 660 750 780 850 960 1080 1250 1500 1630 2000
1 2
3
4
5
6
7
8
9
10
n 1 10 1 位置 5 .5 2 2
960 1080 中位数 1020 2
Me=一般
例题分析---数值数据的中位数
【例】
原始数据: 排 序:
9个家庭的人均月收入数据
1500 750 780 1080 850 960 2000 1250 1630 750 780 850 960 1080 1250 1500 1630 2000
位
置:
1
2
3
4
5
6
7
8
9
n 1 9 1 位置 5 2 2
x
M
i 1
k
i
fi
n 22200 185 120
成绩(分) 60以下 60~70 70~80 80~90 90~100 合 计
人数(人) 6 12 19 10 3 50
比重(%) 12 24 38 20 6 100
组中值 (M) 55 65 75 85 95 -
556651275198510953 x= 61219103
(3)由组距数列求众数。先根
据各组次数确定众数组,再利用公 式计算。
众数的计算公式有上限公式和下
限公式
下限公式:
M=L﹢△1∕
( △1﹢ △2)×
d
上限公式: M=U-△2∕(△1﹢
MO
△2)×d
某年级83名女生身高资料
身高
(CM) 150-155 155-160 160-165 165-170 170以上
Mo=可口可乐
可口可乐 旭日升冰茶 百事可乐 汇源果汁 露露 合计
15 11 9 6 9 50
0.30 0.22 0.18 0.12 0.18 1
30 22 18 12 18 100
例题分析---顺序数据的众数
甲城市家庭对住房状况评价的频数分布 回答类别 甲城市 户数 (户) 百分比 (%)
解:这里的数据为顺 序数据。变量为“回 答类别” 甲城市中对住房 表示不满意的户数最 多 , 为 108户 , 因 此 众数为“不满意”这 一类别,即
例释
这 是 一 个 印 度 男 孩