当前位置:文档之家› 统计学案例分析 ppt

统计学案例分析 ppt


概概念念 汇汇总总
案例讨 案例讨 案例讨 案例讨 论一 论二 论三 论四
1.极差(range,R):即全距。粗略。适用于任何分布。
2.四分位数间距(quartile,Q):一组观察值按大小排序后,分成四个数目相等的段落,每个段落观察
值的数目占总例数的25%。去掉两端含有极端数值的25%,取中间的50%的观察值的数据范围即为~。 越大则数据变异越大。适用于偏态分布。
61.3
81.5
X
X
n
=1699/238=7.14(μmol∕kg)
89.1
标准差为
95.8
98.3 98.7
S S2
(X-X)2
n-1
261.4923.32(μmol∕kg) 238-1
因此该研究着认为该企业工人发汞的平均
98.7
水平和变异程度为(7.14﹢/﹣3.23)
100
μmol∕kg
你认为这样统计描述恰当么?为什么?
n
2、加权均数:X f X
n
3、几何均数:Glg1
lg X n
2.中位数(median):观察值按照从小到大排列时,居中心位置的数值。
适用于1、分布明显成偏态时,2、频数分布的一端或两端无确切数值时。不便于统计计算。
Pj LM(0.5nfM f L) i
M:中位数;LM:M所在组的上限;f L:M所在组之前积累的频数;fM:M所在组的频数;i:组距。
3.百分位数(percentile):Px。在一组中找到这样一个数值P,全部观察值的x%小于P。P75
、P25描述资料离散程度。 PXLx( nxfx % fL) i
4.众数:一组观察值中,出现频率最高的那个观察值。若为分组资料,则为频率最高组的组中值。适用
于大样本,但粗糙。
5 1.2 离散程度的统计描述
1
封面 封底
案例 分析
概念 汇总
案例讨 案例讨 案例讨 案例讨 论一 论二 论三 论四
统计学
案例分析
2
概念 汇总
案例讨 案例讨 案例讨 案例讨 论一 论二 论三 论四
目录页
Contents Page
概念汇总
案例讨论四
案例讨论一
案例讨论三
案例讨论二
*
3
概念 汇总
案例讨 案例讨 案例讨 案例讨 论一 论二 论三 论四
过渡页
Transition Page
概念汇总
案例讨论四
案例讨论一
案例讨论三
案例讨论二
*
4
1.1集中趋势的统计描述
概概念念 汇汇总总
案例讨 案例讨 案例讨 案例讨 论一 论二 论三 论四
1.均数(average):
适用:对称分布或偏度不大的资料,尤其适合正态分布。
1、算术均数(mean):X X
因此通过统计描述类型的选择,中位数与四分位数间距更适合于描 述变量值的平均水平与变异程度。
P50LM ( 0.5nfM fL) i Q=P75 - P25
9
概念 案案例例讨 案例讨 案例讨 案例讨 汇总 论论一一 论二 论三 论四
综上所述:
P50LM ( 0.5nfM fL) i=5.5+2/60(238*50%-86)=6.6(μmol∕kg)
概念 汇总
案例讨 案例讨 案例讨 案例讨 论一 论二 论三 论四
过渡页
ition Page
概念汇总
案例讨论四
案例讨论一
案例讨论三
案例讨论二
*
7
概念 案案例例讨 案例讨 案例讨 案例讨 汇总 论论一一 论二 论三 论四
案例讨论一 某年某课题组检测了某企业238名无工作也接触史工人的发汞含量(μmol∕kg),整理结果见 下表,适对该企业工人发功水平进行统计描述。
组段(μmol∕kg) 组中值X0
1.5~ 3.5~ 5.5~ 7.5~~ 9.5~ 11.5~ 13.5~ 15.5~ 17.5~
2.5 4.5 6.5 8.5 10.5 12.5 14.5 16.5 18.5
19.5~21.5
20.5
合计

人数f
20 66 60 48 18 16 6 1 0
3
238
率可发 能生 发某 生事 某件 事的 件 单观 的 数 位察 观 总单 *察 1数0位 % 0
发病率 同期观内察可期能内发新生发 平 该病 均 病的 人 的例 *数 K数
Q=P75 - P25=8.85-4.70=4.15(μmol∕kg)
10
概念 汇总
案例讨 案例讨 案例讨 案例讨 论一 论二 论三 论四
过渡页
Transition Page
概念汇总
案例讨论四
案例讨论一
案例讨论三
案例讨论二
*
11
概念 汇总
案例讨 案案例例讨 案例讨 案例讨 论一 论论二二 论三 论四
发病率(%)
发病人数
发病率(%)
发病人数 合计
干部
21
60
9
25.7
5
14.3
35
工人
12
70.6
4
23.5
1
5.9
17
合计
33
63.5
3
25
6
11.5
52
12
概念 汇总
案例讨 案案例例讨 案例讨 案例讨 论一 论论二二 论三 论四
构成比 各 某组 组成 成部 部分 分的 的观 观数 数 察 察*1单 单00% 位 位
案例讨论二 某单位1993年对1191名全体职工进行冠心病普查,按职业年龄分组统计,结果见下表,作 者认为:该单位干部、工人的冠心病发病率均随年龄的增加而下降,发病率高峰都在40-50岁这一组,这 与其他资料的结果不符。你同意上述分析么?请说明理由
职业
40~
50~
60~70
发病人数
发病率(%)
发病人数
频率(%)
8.4 27.7 25.2 20.2 7.6 6.7 2.5 0.4
0
1.3
100
累计频数
20 86 146 194 212 228 234 235 235
238

累计频率(%) 为描述该企业工人发汞含量的平均水平和
变异程度,某研究者采用算术平均数和标
8.4
准差两个统计指标。
36.1
按照频率表法计算算术均数为
Q=P75 - P25
4.方差(variance):
样本方差 S2 SS(X-X) 2
n-1
总体方差 S2 SS(X-X) 2
N
5.标准差(standard deviations):
适用于近似正态分布。
S S2 SS
p.s.1、可用于合并资料的直接计算
2、与均数结合可以完整概括一个正态分布。
6

x
8
概念 案案例例讨 案例讨 案例讨 案例讨 汇总 论论一一 论二 论三 论四
经案例分析可知该发汞结果测定为偏态分布,因为均数(average) 适用于对称分布或偏度不大的资料,尤其适合正态分布。标准差( standard deviations)同样适用于近似正态分布。所以不能选用均数与标 准差来计算该企业法功的平均水平与变异程度。
相关主题