第二章 集中趋势的统计描述
n
xi
一步作统计分析。
2020/7/28
12
2、揭示计量资料的分布特征
正偏态分布 右偏态分布
频数分布类型
正态分布
负偏态分布 左偏态分布
2020/7/28
13
25
20
15
频 10 数
5
正态分布
0
2.3 2.6 2.9 3.2 3.5 3.8 4.1 4.4 4.7 5.0 5.3 5.6 5.9
血清总 胆固醇
原始数据
4.76 5.26 5.61 5.00 4.73 4.47 5.24 4.97 4.71 ....... ....... 4.81 4.54 3.82 ....... .......
5.95 4.46 4.57 . 5.34 4.70 4.81 . 4.44 4.94 5.05 . ........ ........ 4.01 4.89 4.62. ........ ........
101名正常成年女性血清总胆固醇频数分布
2020/7/28
14
25 人 数 20
15
10 5 0
14 17 20 23 26 29 32 35 38 41 44 47
血清转氨酶(mmol/L)
115名正常成年女子血清转氨酶的频数分布
2020/7/28
15
25 20 15 10
5 0
0 5 10 15 20 25 30 35 40 45 50 血清肌红蛋白(μg / m L)
红细胞数(×1012 /L) 划记
3.80~ 4.00~ 4.20~ 4.40~ 4.60~ 4.80~ 5.00~ 5.20~ 5.40~ 5.60~ 5.80~6.00 合计
组中值 频数
3.90
2
4.10
6
4.30
11
4.50
25
4.70
32
4.90
27
5.10
17
5.30
13
5.50
4
5.70
i R k
最小组段包括最小值,最大组段包括最大值; 每个组段包含下限,不包含上限
• 列表划记
2020/7/28
7
例1.1 某地140名正常成年男子红细胞数P8
原始数据
4.76 5.26 5.61 5.95 4.46 4.57 . 5.00 4.73 4.47 5.34 4.70 4.81 . 5.24 4.97 4.71 4.44 4.94 5.05 . ............... ............... 4.81 4.54 3.82 4.01 4.89 4.62. .............. . ...............
2
5.90
1
140
频率(%)
1.4 4.3 7.9 17.9 22.9 29.3 12.1 9.3 2.9 1.4 0.7 100.00
2020/7/28
10
图2-1 140名正常男子红细胞计数的直方图
2020/7/28
11
Hale Waihona Puke (三)频数表与频数分布图的用途
1、 作为陈述资料的形式: 简单明了或直观形象,便于进
频数分布表
组段
3.80~ 4.00~ 4.20~ 4.40~ 4.60~ 4.80~ 5.00~ 5.20~ 5.40~ 5.60~ 5.80~6.00 合计
频数 频率
2020/7/28
6
(二)频数表的制作方法
• 计算极差(R)
R X max X min
• 决定组数(k)、组段和组距(i)
k 8 ~ 13根据样本含量而定
101名正常人血清肌红蛋白的频数分布
2020/7/28
16
3、描述资料的集中趋势与离散趋势
频数分布特征
集中趋势
指频数分布集中分布于 某些组段趋势
离散趋势
指频数分布从集中位置 逐渐向两侧递减的趋势
2020/7/28
17
4. 便于发现一些特大或特小的可疑值
组段 (1)
2.30~ 2.60~ 2.90~ 3.20~ 3.50~ 3.80~ 4.10~ 4.40~ 4.70~ 5.00~ 5.30~ 5.60~5.90 合计
Xmin 3.82, Xmax 5.95
2020/7/28
8
解题步骤:
极差: 组数: 组距: 组段:
R 5.95 3.82 2.13 k 10 i 2.13 /10 0.21 3.80 ~;4.00 ~;4.20 ~;...5.80 ~ 6.00
2020/7/28
9
某地 140 名正常成人男子红细胞数(×1012 /L)
指标描述
集中趋势 离散趋势
统计分析
统计描述
图表描述
用少量几个统计指标刻画出原始数 据的特征称为统计描述。
统计推断
参数估计
用样本信息推论总体特征的 过程称为统计推断 。
假设检验
2020/7/28
1
描述资料的集中趋势与离散趋势
集中趋势:观察值的平均水平或集 中位置,用平均数反映
离散趋势:观察值的变异程度或离 散程度,用变异指标反映
频数 f
(2)
1
可疑值
0
0
0
17
20
17
12
9
0
0
8
可疑值
84
2020/7/28
18
二、集中趋势指标 statistics of location
算术平均数 Arithmetic mean
平均数 average
几何平均数 geometric mean
中位数 median
• 平均数(average) 是一类用描述数值变量资料集中趋 势(即平均水平)的指标.
2020/7/28
19
平均数的表示符号
1) 算术平均数
总体算术平均数(数学期望)表示符
X 样本算术平均数表示符 2) 几何平均数 G 几何平均数表示符 3) 中位数 M 中位数表示符
2020/7/28
20
1. 算术平均数
意义:一组性质相同的观察值在数量上的平均水平。
• 样本算术平均数的计算公式:
2020/7/28
4
(一)频数分布表 frequency distribution table
• 对观察到的计量资料,按变量的取值范围进行 分段,统计变量值出现在每一个段中的次数 (即频数,frequency),以表格的形式列出各个 段及其对应的频数.此类表格称为频数分布表.
2020/7/28
5
频数分布表
2020/7/28
2
第二章 计量资料的集中趋势
一、计量资料的频数分布
二、集中趋势指标*
1. 了解统计描述的基本概念,频数分布表的编制、 类型及用途,连续型变量的频数分布图。
2. 掌握算术平均数、几何平均数、中位数的计算及适 用范围。
2020/7/28
3
一、计量资料的频数分布
• 频数分布表的概念 • 频数分布表的制作 • 频数分布表在统计分析中的作用