当前位置:文档之家› 第二章 定量数据的统计描述

第二章 定量数据的统计描述

段必须包括最大值,各组段不能重叠。除最末 一个组段需同时写出上下限外,其余组段只写 出其下限。
4. 归组计数,整理成表
用计算机或手工划记法汇总,得到各组段观察 单位个数,绘制成频数分布表。
表2-1 2006年某市120名10岁男孩身高(cm)的频数表
身高 (1)
频数 (2)
频率(%) (3)
累计频数 累计频率(%)
4
3.3
8
6.7
16
13.3
28
23.3
45
37.5
66
55.0
86
71.7
100
83.3
110
91.7
116
96.7
119
99.2
120
100.0


(二)频数分布表的用途
1. 揭示频数分布特征 2. 揭示频数分布类型 3. 便于发现特大或特小的可疑值 4. 便于进一步计算统计指标和进行统
计分析
【问题2-1】 该资料为何种类型资料? 如何对该资料进行描述?
第一节 频数表和频数图 第二节 集中趋势的描述 第三节 离散趋势的描述 第四节 正态分布及其应用
频数表和频数图
由于个体变异的存在,医学研究中某指标在各个 体上的观察结果不是恒定不变的,但也不是杂乱 无章的,而是有一定规律的,呈一定的分布 (distribution)。
偏态分布(skewed distribution):集中位 置偏向一侧,两侧频数分布不对称。 正偏态(positive skew) 负偏态(negative skew)
20
对称分布
频 数
10
30
频 数
20
10
0 0.0
0 2.25 2.50 2.75 3.00 3.25 3.50 3.75 4.00 4.25 4.50 4.75 5.00 5.25 5.50 5.75
大家好
第二章 定量数据的统计描述
【例2-1】2006年某市120名10岁男孩的身高(cm)资料如下
135.4 139.8 144.0 147.3 146.3 142.5 138.1 143.6 141.6 152.6 132.1 144.7 143.6 146.8 144.2 141.3 137.5 142.8 140.6 150.4 145.9 140.2 144.5 148.2 146.4 142.4 138.5 148.9 146.2 155.4 134.2 139.2 143.5 141.6 143.5 142.3 148.9 143.6 141.5 151.1 132.5 138.7 149.6 146.9 148.7 141.5 137.8 142.7 144.6 151.8 136.4 140.0 144.3 147.5 145.6 142.5 138.5 143.7 149.5 153.6 130.2 138.9 143.7 146.5 138.8 141.7 136.9 142.0 140.5 150.3 135.7 145.7 144.2 147.8 145.8 142.6 138.6 143.8 141.3 153.9 133.4 139.6 143.7 147.5 144.8 148.0 137.4 142.1 140.8 141.8 134.5 139.4 142.9 147.5 144.7 141.8 136.9 143.5 140.7 151.4 145.6 147.3 143.9 141.9 151.6 145.6 148.9 144.3 139.1 145.8 145.6 145.3 147.6 148.6 145.5 137.3 146.5 140.3 148.4 136.5
将原始数据按照一定的标准划分为若干个组,合 计各组的频数,得到频数分布表;也可再将频数 表绘制成频数分布图。
一、频数分布表
频数(frequency):一组资料中各观察值或不
同组段内观察值出现的频繁程度(次数)。
频数分布表(frequency table):由变量值及
其频数编制而成的表。
(一)频数表的编制
1. 求极差(range): 极差又称全距,是指全部观察值中最 大值与最小值之差,用符号R表示。 R=xmax-xmin
R 1 5 5 .4 1 3 0 .2 2 5 .2 c m
2. 确定组数和组距
(1) 根据样本含量的大小及研究目的确定组数: 一般设8~15个组。 (n<50,5~8;n>50, 9~15)。
(4)
(5)
130~
1
132~
3
134~
4
136~
8
138~
12
140~
17
142~
21
144~
20
146~
14
148~
10
150~
6
152~
3
154~156
1
合计
120
0.8 2.5 3.3 6.7 10.0 14.2 17.5 16.7 11.7 8.3 5.0 2.5 0.8
100.0
1
0.8
血 清 总 胆 固 醇 (mmol/L)
人数
正(右)偏态
12
频 10 负(左)偏态

8
6
4
250.0
500.0
750.0
抗体滴度
1000.0
1250.0
2
Std. Dev = 10.75
Mean = 27.1
0 0.0
5.0 10.0 15.0 20.0 25.0 30.0 35.0 40.0 45.0
(2)确定组距(class interval):相邻两个组 段下限之差为组距,一般采用等距分组。 i=R/组数,为了方便资料整理汇总,组距 一般取整数。
i 2 5 .21 0 2 .5 2 2 .0 0 c m
3. 确定组段
组段起点称为下限(lower limit) 组段终点称为上限(upper limit) 注意:第一组段必须包含最小值,最后一个组
N = 91.00
2.5 7.5 12.5 17.5 22.5 27.5 32.5 37(μg/ml)
二、频数分布图
频数分布图(graph of frequency)是以变 量值为横坐标、频数(或频率)为纵坐标 (不等距分组时以频率/组距=频率密度为 纵坐标),以每个等宽的距形面积表示每 组的频数(或频率)。
频数分布的两个特征 集中趋势(central tendency):指一组数 据向某个位置聚集或集中的倾向。 离散趋势(dispersion tendency):指一组 数据的分散性或变异度。
频数分布的类型 对称分布(symmetric distribution) :集中 位置在中间,左右两侧频数基本对称。
相关主题