当前位置:文档之家› 统计学案例分析

统计学案例分析


61.3
81.5
X
X
n
=1699/238=7.14(μmol∕kg)
89.1
标准差为
95.8
98.3 98.7
S S2
(X - X)2
n -1
2614.92 3.32(μmol∕kg) 238-1
98.7
因此该研究着认为该企业工人发汞的平均 水平和变异程度为(7.14﹢/﹣3.23)
100
μmol∕kg
过渡页
Transition Page
概念汇总
案例讨论四
案例讨论一
案例讨论三
案例讨论二
*
4
1.1集中趋势的统计描述
概概念念 汇汇总总
案例讨 案例讨 案例讨 案例讨 论一 论二 论三 论四
1.均数(average):
适用:对称分布或偏度不大的资料,尤其适合正态分布。 1、算术均数(mean):X X
概概念念 汇汇总总
案例讨 案例讨 案例讨 案例讨 论一 论二 论三 论四
1.极差(range,R):即全距。粗略。适用于任何分布。
2.四分位数间距(quartile,Q):一组观察值按大小排序后,分成四个数目相等的段落,每个段落观察
值的数目占总例数的25%。去掉两端含有极端数值的25%,取中间的50%的观察值的数据范围即为~。 越大则数据变异越大。适用于偏态分布。
n
2、加权均数:X f X
n
3、几何均数:G lg1 lg X
n
2.中位数(median):观察值按照从小到大排列时,居中心位置的数值。
适用于1、分布明显成偏态时,2、频数分布的一端或两端无确切数值时。不便于统计计算。
Pj LM
(0.5n f fM
L ) i
M:中位数;LM:M所在组的上限;f L:M所在组之前积累的频数;fM:M所在组的频数;i:组距。
案例讨论二 某单位1993年对1191名全体职工进行冠心病普查,按职业年龄分组统计,结果见下表,作 者认为:该单位干部、工人的冠心病发病率均随年龄的增加而下降,发病率高峰都在40-50岁这一组,这 与其他资料的结果不符。你同意上述分析么?请说明理由
职业
40~
50~
60~70
发病人数
发病率(%)
发病人数
6
概念 汇总
案例讨 案例讨 案例讨 案例讨 论一 论二 论三 论四
过渡页
Transition Page
概念汇总
案例讨论四
案例讨论一
案例讨论三
案例讨论二
*
7
概念 案案例例讨 案例讨 案例讨 案例讨 汇总 论论一一 论二 论三 论四
案例讨论一 某年某课题组检测了某企业238名无工作也接触史工人的发汞含量(μmol∕kg),整理结果见 下表,适对该企业工人发功水平进行统计描述。
1
封面 封底
案例 分析
概念 汇总
案例讨 案例讨 案例讨 案例讨 论一 论二 论三 论四
统计学
案例分析
2
概念 汇总
案例讨 案例讨 案例讨 案例讨 论一 论二 论三 论四
目录页
Contents Page
概念汇总
案例讨论四
案例讨论一
案例讨论三
案例讨论二
*
3
概念 汇总
案例讨 案例讨 案例讨 案例讨 论一 论二 论三 论四
频率(%)
8.4 27.7 25.2 20.2 7.6 6.7 2.5 0.4
0
1.3
100
累计频数
20 86 146 194 212 228 234 235 235
238

累计频率(%) 为描述该企业工人发汞含量的平均水平和
8.4
变异程度,某研究者采用算术平均数和标 准差两个统计指标。
36.1
按照频率表法计算算术均数为
发病率(%)
发病人数
发病率(%)
发病人数 合计
干部
21
60
9
25.7
5
14.3
35
工人
12
70.6
4
23.5
1
5.9
17
合计
33
63.5
3
25
6
11.5
52
12
概念 汇总
案例讨 案案例例讨 案例讨 案例讨 论一 论论二二 论三 论四
构成比
某组成部分的观察单位 各组成部分的观察单位
数 数
*100 %
你认为这样统计描述恰当么?为什么?

x 8
概念 案案例例讨 案例讨 案例讨 案例讨 汇总 论论一一 论二 论三 论四
经案例分析可知该发汞结果测定为偏态分布,因为均数(average) 适用于对称分布或偏度不大的资料,尤其适合正态分布。标准差 (standard deviations)同样适用于近似正态分布。所以不能选用均数与 标准差来计算该企业法功的平均水平与变异程度。
Q=P75 - P25=8.85-4.70=4.15(μmol∕kg)
10
概念 汇总
案例讨 案例讨 案例讨 案例讨 论一 论二 论三 论四
过渡页
Transition Page
概念汇总
案例讨论四
案例讨论一
案例讨论三
案例讨论二
*
11
概念 汇总
案例讨 案案例例讨 案例讨 案例讨 论一 论论二二 论三 论四
Q=P75 - P25
4.方差(variance):
样本方差 S2 SS (X - X)2
Hale Waihona Puke n-1总体方差 S2 SS (X - X)2
N
5.标准差(standard deviations):
适用于近似正态分布。
S S2 SS
p.s.1、可用于合并资料的直接计算
2、与均数结合可以完整概括一个正态分布。
因此通过统计描述类型的选择,中位数与四分位数间距更适合于描 述变量值的平均水平与变异程度。
P50 LM
(0.5n f fM
L ) i
Q=P75 - P25
9
概念 案案例例讨 案例讨 案例讨 案例讨 汇总 论论一一 论二 论三 论四
综上所述:
P50 LM
(0.5n f fM
L ) i
=5.5+2/60(238*50%-86)=6.6(μmol∕kg)
组段(μmol∕kg) 组中值X0
1.5~ 3.5~ 5.5~ 7.5~~ 9.5~ 11.5~ 13.5~ 15.5~ 17.5~
2.5 4.5 6.5 8.5 10.5 12.5 14.5 16.5 18.5
19.5~21.5
20.5
合计

人数f
20 66 60 48 18 16 6 1 0
3
238

发生某事件的观察单位 数 可能发生某事件的观察 单位总数
*100 %
3.百分位数(percentile):Px。在一组中找到这样一个数值P,全部观察值的x%小于P。P75、
P25描述资料离散程度。
PX
Lx
(n x% f fx
L ) i
4.众数:一组观察值中,出现频率最高的那个观察值。若为分组资料,则为频率最高组的组中值。适用
于大样本,但粗糙。
5 1.2 离散程度的统计描述
相关主题