当前位置:文档之家› 第2章定量资料的统计描述

第2章定量资料的统计描述

用于描述一组对称分布数据在数量上的平均水平。 样本均数用 X 表示,总体均数用希腊字母µ表示。
1、计算方法 (1)直接法:当样本含量较小时,用直接法。公 式:
X
X
n
例2.3 测得8只正常大鼠血清磷 酸酶含量(U/L)为4.20,6.43, 2.08,3.45,2.26,4.04,5.42, 3.38。试求其算术均数。
10
5
0
0
1
2
3
4
检查次数
某地96名产妇产前检查次率分布
频数
5
>5
>5
二、连续型定量变量的频数分布
例2.2 某地120名18~35岁健康男性居民血清铁含量 (umol/L),编制频数表。
7.42 8.65 23.02 21.31 21.46 9.97 22.73 14.94 20.18 21.62 23.07 20.38 8.04 17.32 29.64 19.69 23.90 17.45 19.08 20.52 24.14 23.77 18.36 23.04 24.22 24.13 21.53 11.09 18.89 18.26 23.29 17.67 15.38 18.61 14.27 17.40 22.55 17.55 16.10 17.98 20.13 21.00 14.56 19.89 19.82 17.48 14.89 18.37 19.50 17.08 18.12 26.02 11.34 13.81 10.25 15.94 15.83 18.54 24.52 19.26 26.13 16.99 18.89 18.46 20.87 17.51 13.12 11.75 17.40 21.36 17.14 13.77 12.50 20.40 20.30 19.38 23.11 12.67 23.02 24.36 25.61 19.53 14.77 14.37 24.75 12.73 17.25 19.09 16.79 17.19 19.32 19.59 19.12 15.31 21.75 19.47 15.51 10.86 27.81 21.65 16.32 20.75 22.11 13.17 17.55 19.26 12.65 18.48 19.83 23.12 19.22 19.22 16.72 27.90 11.74 24.66 14.18 16.52
表2.2 120名正常成年男子血清铁含量(umol/L)频数分布表
组段
6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~30 合计
频数
1 3 6 8 12 20 27 18 12 8 4 1 120
频率 (%)
0.83 2.50 5.00 6.67 10.00 16.67 22.50 15.00 10.00 6.67 3.33 0.83
(一)编制频数表 1.编制频数表的步骤
(1)求极差R
R=Xmax - Xmin (2)划分组段
➢两端组段分别包含 最大值或最小值;
➢尽量取较整齐的数 值作为组段的端点;
➢组距以相等为宜。
确定组数:一般分10~15组;
确定组距i :可相等,可不等 ;
确定各组段的上、下限。
(3) 划计归组:按照x大于或等于下限小于上 限的原则确定每一例数据应归属的组段,依 次清点频数、计算频率、累计频数、累计频 率。
(2)加权法:当相同观察值较多时,用加权法。 适用于频数表资料。公式:
X fX0 fX0
f
n
X0为各组的组中值,f为各组的频数。
组段
6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~30 合计
频率密度
120例健康成年男子血清铁含量分布图
12 108 6 4 源自 06 7 91011 113415 117819 212223 252627 2930 血清铁(umol/L)
频率密度
120例健康成年男子血清铁含量分布图
(三)连续型变量频数分布的类型
正态分布:集中位置居中
频数分布
频数多的组段 集中在左侧
检查次数 频数 频率(%) 累计人数 累计频率(%)
0
4
4.2
1
7
7.3
2
11
11.5
3
13
13.5
4
26
27.1
5
23
24.0
>5
12
12.5
4
4.2
11
11.5
22
22.9
35
36.5
61
63.5
84
87.5
96
100.0
合计
96 100
频率(%)
某地96名妇女产前检查次率分布
30
25
20
15
2.频数分布表的用途 (1)揭示资料的分布类型; (2)可看出频数分布的两个特征:集中趋势、离 散趋势; (3)便于发现特大或特小的可疑值; (4)便于进一步作统计处理。
(二)绘制直方图 直方图也称频率直方图。
横轴为所研究的变量(即组段的上下限),纵轴 为频率密度。
频率密度=频率/组距,直条面积等于相应组段的 频率。
100.00
累计频数
1 4 10 18 30 50 77 95 107 115 119 120
累计频率 (%)
0.83 3.33 8.33 15.00 25.00 41.67 64.17 79.17 89.17 95.83 99.17 100.00
例2.2资料频数表的编制步骤 1. 求极差R=29.64- 7.42=22.22(cm) 2. 划分组段 若组数为12;组距i=22.22/12≈1.85,取i=2; 确定第一组段的下限:Xmin=7.42,故第一组段的下 限取值为6,上限值为8。 3.统计各组段内数据的频数、频率等,即得频数表。
正偏态(左偏态)
偏态分布
负偏态(右偏态)
频数多的组段集 中在右侧
第二节 定量变量的特征数
描述集中趋势的统计指标
算术均数(mean) 几何均数(geometric mean) 中位数(median) 众数(mode) 调和均数(harmonic mean,H)
描述离散趋势的特征数
(一)算术均数(arithmetic mean)
第二章 定量资料的统计描述
频数与频数分布 定量变量的特征数 常用统计图表
第一节 频数与频数分布
离散型定量变量的频数分布 连续型定量变量的频数分布
一、离散型定量变量的频数分布
例2.1 0,1,5,6,3,2,4,1,0,6,5,1,3, 3,…,4,7 请描述其频数的分布状况。
表2.1 1998年某地96名妇女产前检查次数分布表
相关主题