第2章 定量资料的统计描述
案例2-1(P27)
答:该资料为一正常人群发汞值的检测结果,已整理成频率分布表(P27)。
统计描述时应首先考察资料的分布规律,通过频率(频数)分布表(表2-9 P27)和直方图(图2-3 P14)可以看出,此238人发汞值的频数分布呈正偏态分布,即观察值绝大多数集中在发汞值较小的组段。
对偏态分布,选用算术均数和标准差进行统计描述是不恰当的。
应选用中位数描述该市居民发汞平均水平,选用四分位间距描述居民发汞值变异度,计算如下:
25507523.5(23825%20) 4.7(mol/kg)
6625.5(23850%86) 6.6(mol/kg)
602
7.5(23875%146)8.9(mol/kg)
48(%)
x x L x i
P L n x f f P u P u P u =+?==+?==+?==+?S
离散程度指标:
四分位间距=P75-P25=8.9-4.7=4.2umol/kg。
故该市居民发汞平均水平为6.6 umol/kg,离散度为4.2umol/kg,
思考与练习(P31)
1.
答:
(1)
某年某地120例6-7岁正常男童胸围测量结果(cm)的频数分布
Group Frequency Percent Cumulative Percent
49.0- 1 .8 .8
50.0- 4 3.3 4.2
51.0- 8 6.7 10.8
52.0- 6 5.0 15.8
53.0- 19 15.8 31.7
54.0- 18 15.0 46.7
55.0- 14 11.7 58.3
56.0- 26 21.7 80.0
57.0- 10 8.3 88.3
58.0- 9 7.5 95.8
59.0- 4 3.3 99.2
61.0-62.0 1 .8 100.0
Total 120 100.0
(2)
(3) 利用频数分布表数据计算均数和标准差
0149.5161.56623.01112055.19(cm)
fX X f
∑=
∑⋯⨯++⨯==
⋯++=
(4)………..
S 2.33(cm)=
2550751
53.0(12025%19)53.58(cm)191
55.0(12050%56)55.29(cm)141
56.0(12075%70)56.77((cm)
26%)x x L x i P L n f f P x P P ==+?==+?==+?=+?S
2.
答:该资料最大值为一不确定值,根据此特点,宜用中位数和四分位间距进行统计描述.
M=16.5(天) P25=15(天) P75=20(天) Q=20-15=5(天)
3.
答:根据资料中血凝抑制抗体滴度指标呈等比数列变化的特点,计算其平均滴度应选用几何均数,由于是频数表资料,故用加权法计算几何均数。
lg 1lg 2lg86lg161lg5121lg 301lg 1.68581.68581048.5
f X G f ⎛⎫∑-= ⎪∑⎝⎭
⨯+⨯++⨯⎛⎫-= ⎪
⎝⎭-==≈
四、综合分析题(P393)
第一题
176名燃煤型砷中毒患者尿砷含量(ug/L)的频数分布Frequency Percent Cumulative Percent
0.01- 84 47.7 47.7
0.06- 41 23.3 71.0
0.11- 25 14.2 85.2
0.16-
4 2.3 87.5
0.21- 7 4.0
91.5
0.26-
5 2.8 94.3 0.31-
2 1.1 95.5 0.36-
3 1.7 97.2 0.41- 2 1.1 98.3
0.51-
1 .6 98.9
0.56-0.61 2 1.1 100.0
Total 176 100.0
由上图可见,该资料集中位置偏向左侧,为正偏态分布,可考虑作对数变换: Y=lg(尿总砷)
Tests of Normality(正态性的检验)
a Lilliefors Significance Correction
Descriptive Statistics
结果中的Mean表示尿总砷对数值的均数为-1.1831,求其反对数,得几何均数G=0.0656(ug/L)。
第二题
解:
(1) 已知健康人的血清胆固醇服从正态分布,故采用正
态分布法制定95%的参考值范围。
下限:
上限:
故该市45-55岁健康男性居民的血清胆固醇的95%的参考值范围为(2.96mmol/L, 6.72mmol/L)
1.96 4.84 1.960.96
2.96(/)X S mmol L -=-⨯=1.96 4.84 1.960.96 6.72(/)
X S mmol L +=+⨯=
(2) 45-55岁健康男性居民的血清胆固醇的分布为正态分
布,且仅知样本均数和样本标准差,则先按下式求得z 值,再查附表二的标准正态分布下的面积求得曲线下某区间的面积。
查标准正态分布曲线下的面积表(附表2)得:
1122
3.25
4.84 1.660.96
5.25 4.840.430.96X X Z S X X Z S --===---===1
2()(1.66)0.0485
()(0.43)1(0.43)z z ΦΦΦΦΦ=-===--
即该市45-55岁健康男性居民中,血清胆固醇在
3.25-5.25mmol/L 范围内的比例为61.79%。
(3)
即该市45-55岁健康男性居民中,血清胆固醇低于3.80mmol/L 所占的比例为14.01%。
3.80
4.84 1.080.96X X Z S --===-()(1.08)0.140114.01%z ΦΦ=-==
第三题
Group Frequency Percent Cumulative Percent 50- 3 2.5 2.5
3 2.5 5.0
60-
3 2.5 7.5
70-
80- 9 7.5 15.0
90- 12 10.0 25.0
100- 9 7.5 32.5
110- 27 22.5 55.0
21 17.5 72.5
120-
23 19.2 91.7 130-
10 8.3 100.0 140-
120 100.0
Total。