当前位置:文档之家› 定量资料的统计描述

定量资料的统计描述

定量资料的统计描述
LOREM IPSUM DOLOR
主要内容
频数分布 集中趋势 离散趋势
被平均
中国人公共假期每年已有115天; 中国全国家庭平均住房面积116.4㎡; 北京平均月薪9227元; 中国男性平均身高174.2厘米; 中国人平均生育1.18个孩子; 中国家庭资产平均为121.69万元,城市家庭平均为
( kg )原始 数据如下, 试编制频数
表。
25.2 34.9 34.3 38.1 41.3 27.8 33.8 37.7 28.4 33.5 47.3 34.8 30.5 36.2 51.0 38.0 43.8 40.9 37.5 36.6 33.4 47.4 36.4 41.4 36.5 42.5 33.7 29.3 39.6 37.5 39.6 33.2 32.1 29.9 43.7 33.8 35.1 37.8 32.4 38.5 28.2 36.5 23.4 35.8 34.1 27.6 42.6 23.1 37.1 44.0 35.6 44.5 46.5 35.0 31.8 36.4 36.2 47.9 38.7 20.5 37.1 29.2 38.2 41.1 36.2 43.5 32.8 36.3 31.8 30.6 38.5 39.6 28.7 33.7 35.1 42.9 20.1 35.4 26.5 42.0 39.6 38.7 35.4 51.2 31.4 34.1 25.3 29.6 38.2 43.7 33.8 24.5 29.2 45.9 32.5 23.5 36.8 27.2 34.0 34.7 44.4 41.2 35.3 42.6 34.1 30.0 31.4 40.8 27.3 48.6 35.8 29.7 45.6 41.8 33.0 28.3 33.3 35.1 40.6 38.2 37.6 25.5 37.3 37.5 41.5 38.4 44.2 43.2 31.5 40.2 34.5 37.4
有些离散型数据的描述要参照分类资料处理,如龋齿个数、 流产次数、尿失禁次数、交通事故死亡人数。
分类资料
分类资料、也称为定性资料、计数资料,是将观察 单位按某种属性分组计数的定性观察结果。
分类资料的变量值只能代表事物的某些属性或分类, 表现为无不相容的类别或属性。
各观察单位之间没有量的区别,但有质的不同。
整数作为第一组的下限,但是第一组的下限值一般 不能等于最小值; 各组段既不重叠,也不能留空隙; 最后一个组段应该包括最大值,并且封口。
计算各组段的频数、 频率
本例最小值为20.1,故取20为第一组的下限。 第二组下限即20+3=23,余类推。 最后一个组段为50~53,包括最大值51.2。 列表划记,统计各组段频数。 计算频率与累计频率。
等级资料的各个类别之间存在着大小和程度上的不 同,但是不能精确地测量相邻的两个变量值之间的 差别。
疗效:痊愈、有效、无效和恶化; 文化程度:小学、中学、大学和研究生; 抑郁症的程度:轻度、中度和重度。
随机变量和研究资 料的类型
收缩压
脉搏数 产次
文化程度 ABO血型
定量 定性 等级 连续型 离散型 资料 资料 资料 资料 资料
定量资料的各个观察值之间有量的区别,没有性质 的不同。
连续型资料和离散型 资料
连续型资料(continuous data)
任何两个连续型数据之间都有无穷多个数据; 只要测量仪器足够精确,连续型数据可以精确到小数点后
无限位。
离散型资料(discrete data)
是一种计数(count data),只能是0和正整数,不会是 负数,也没有小数点,如心率、血小板数。
150名12岁男童体重(kg)频数分布表
组段
20~ 23~ 26~ 29~ 32~ 35~ 38~ 41~ 44~ 47~ 50~53 合计
分类资料
二分类资料
如男或女;阳性或阴性;生存或死亡等。
多分类资料
无序多分类资料
血型:A型、B型、O型和AB型; 肺癌类型:腺癌、鳞癌、未分化癌、类癌等。
有序多分类资料:即等级资料
等级资料
等级资料、也称为有序多分类资料,是介于定量资 料和定性资料之间的半定量观察结果。
247.60万元,农村家庭平均为37.70万元。变量和研 Nhomakorabea资料的类 型
数值变量、定量资料、计量资料
分类变量、定性资料、计数资料
顺序变量、有序分类变量、等级资料
定量资料
定量资料是指每个观察单位某个变量用测量或其他 定量方法观察结果,一般有计量单位。
定量资料、数值资料、计量资料(measurement data,quantitative data,numeric data)
频数分布表
当观察值很多时,直接从原始数据很难得出概括的 印象,为了解资料的分布特征,可通过资料的整理, 编制频数分布表,来显示数据分布的范围、数据最 集中的区间和分布的形态。
定量资料的频数分布 表
编制频数表就是把资料的取值范围分割成若干个互 不相交的组段,统计每个组段内的观察值个数作为 对应的频数,由各个组段的范围及其频数构成最基 本的频数分布表。
本例初步确定为10个组。
按极差大小决定组段 数和组距
相邻组段下限值之差称为组距,一般分组时取组距 相等。
组距≈极差/组数,常取整数作组距,以方便资料的 整理汇总。
本例组距=31.1/10= 3.11≈3。
确定组段的上下限
每个组段的起点称“下限”,终点称“上限”; 第一组段必须包括最小值,一般取略小于最小值的
找出最大值和最小值, 计算极差。
极差(R)也叫全距,它是一组变量值中最大值与 最小值之差。
最大值为51.2kg, 最小值为20.1kg, 极差R=51.2-20.1=31.1kg。
按极差大小决定组段 数和组距
经验划分:组段数的多少一般根据观察单位的多少 来确定,过多或过少均不能更好地反映资料的分布 特征,以能够反映频数分布的特点为宜,一般分为 8~15组。
相关主题