当前位置:文档之家› 定性资料统计描述

定性资料统计描述

定性资料的统计描述
Statistical description of qualitative data
实习目的
掌握 定性资料常用描述指标 等相对数; 率 构成比 相对比
应用相对数应该注意的问题 熟悉 常用动态数列指标,率的标准化
理论复习
常用相对数及其应用:
率(frequency) 构成比 (proportion)
相对比 (ratio)
率(frequency):
概念:是指某种现象在一定条件下,实际发生的观察单位 数与可能发生该现象的总观察单位数之比,用以说明某种 现象发生的频率大小或强度。 分类:频率和速率 (分母的观察单位总数是否引入时间因素) 计算公式:
频率 同时期实际发生某现象的观察单位数 K 某时期可能发生某现象的观察单位总数
构成比
27.27 24.24 16.67 16.67
胃肠道感染
其他 合计
4
6 66
6.06
9.09 100.00
相 对 比 (ratio)
概念:是指两个有关联的指标之比值,用以说明一个指标是另 一指标的几倍或几分之几。 计算公式:
相对比 甲指标 (或 100%) 乙指标
如:男女性别比、CV等
Dispersion:离散程度统计量 Std. deviation:标准差 Variance:方差 Distribution:分布指标 Skewness:偏度系数
Kurtosis:峰度系数
Frequencies....
绘制统计图对话框: Bar charts:条图 Pie charts:饼图
Histograms:直方图
输出结果:
Crosstables过程
Crosstabs过程主要功能:
产生二维至n维列联表(交叉表作用)
计算百分数指标、期望频数、汇总指标等 计算度量行、列变量关联度的指标及其检验 成组、配对、分层卡方检验 计算任意维列联表的确切概率值
Crosstables…
操作提示: Analyze →Descriptive Statistics →Crosstables…
2 年死亡率= 100%=0.8% 125 2
构成比 (proportion)
概念:也叫构成指标,是指一事物内部某一组成部分的观察单 位数与该事物各组成部分的观察单位总数之比,用以说明某一事 物内部各组成部分所占的比重或分布。 计算公式: 某一组成部分的观察单 位数
构成比
构成比具有以下特点: • 分子是分母的一部分,各组成部分构成比数值之和等于1或 100 • 事物内部各组成部分之间呈此消彼长关系,当其中某一组成部 分构成比数值增大,其他组成部分的构成比数值必然会减少。
率和构成比的区别
构成比 率
1.各部分可直接相加
各率不可相加
2.各部分之和等于100或1
总率不一定等于各率之和
3.某部分变化,其他部分随着变化
某率的变化,不影响其他各率
4.是说明比重和分布的,反映事物内部各 个部分之间的比例关系。
表示某现象发生的频率和强度
应用相对数时的注意事项:
分析时不能以构成比代替率(重点) 计算相对数应有足够的观察单位数:分母不能太小 应分别将分子和分母合计求合计率 相对数的比较应注意其可比性 两个样本率比较时应进行假设检验 某些情况下只能使用绝对数:传染病疫情描述,突 发事件的描述
Counts:频数 Observed:实际频数
Expected:理论频数
Percentages:百分比 Row:行百分比 Column:列百分比 Total:总百分比
例题2:
研究者希望知道不同性别和血型的交叉频数分布表, 以及不同性别和教学背景的交叉频数分布表,各种百分 比的情况,用Crosstable过程输出列联表(student.sav)
With normal curve:输出正态曲 线 Chart values:绘图指标 Frequencies:频数 Percentages:百分比
例题1:
某项调查中,研究者希望了解调查人数中一共有多少学 生,男生和女生各自为多少;各种血型的人数有多少? 可以使用Frequencies过程输出频数表描述 (student.sav)
练习题:
1.山东省两所学校的高三毕业生的升学情况。试据 此对两所学校的升学情况进行列联表分析。(数据 练习1date.save )
课堂作业:
1.数据Employee data.sav,纪录的是不同性别的工人的学历、生日、工种、 工资等信息。 分析要求: (1)、分别统计不同性别(gender)、不同工种(jobcat)的人数;
100% 同一事物各组成部分的 观察单位总数
构成比例感染的流行病学调查发 现66例感染,感染者的感染部位分布情况见表5.3所示。
表5.3 66例感染者的感染部位分布情况
感染部位
手术创伤感染 呼吸道感染 泌尿道感染 皮肤感染
感染例数
18 16 11 11
定性资料统计描述:SPSS操作
Frequencies过程:对单个变量输出频数表,给出统计量以及绘制 条图和饼图 Crosstabs过程:对两个或多个分类变量联合描述,产生多维列联 表,还可进行分类资料的统计推断;
常用的统计表
菜单介绍:
Analyze →Descriptive Statistics →Frequencies
速率
观察时段内某现象的发生数 K 可能发生某现象的观察人时数
频率的计算
(书上例5.1) 利用2008年泸州市健康城市调查数据,对吸烟与 慢性阻塞性肺部疾病(COPD)的关系分析,结果见表5.1。试
计算该资料中吸烟者与不吸烟者患COPD的患病率。
表5.1 吸烟和不吸烟人群患COPD的情况
患COPD人数
(2)、输出关于不同性别(gender)、不同工种(jobcat)的交叉列联表; 2. 完成描述练习 题.save格式提交) 习题中的作业。( Word 版 作业要求, 做完以后以习
小结
定性资料频数描述---- Frequencies 过程 可以产生相应的条图,圆图
可以产生频数分布表
分类变量的描述—交叉列联表输出→Crosstables

注意:1. 甲乙指标可以相同,也可以不同 2.甲乙指标可以是绝对数,也可以是 相对数或 平均数
案例辨析题:
某地1965年和1970年几种主要急性传染病发病情况如下。某 医生根据此资料中痢疾与乙脑由1965年的44.2%与3.4%分别增加 到1970年的51.9%和5.2%,认为该地1970年痢疾与乙脑的发病率 升高,该结论是否正确为什么?
Frequencies....
Percentile Values:百分位数 Quartiles:四分位数
Cut points for equal groups:分成相等的M 组
Percentile(s):输入需计算的百分位数 Central Tendency:集中趋势统计量 Mean:算术均数
Median:中位数
动态数列,率的标准化
动态数列:一系列按照时间顺序排列起来的统计指标,用以反映事物或现 象在时间上的变化和发展趋势。常用的动态数列有 绝对增长量、发展速度与 增长速度、平均发展速度与平均增长速度。 率的标准化:标准化的意义,直接和间接标准化法的应用。 标准化:在对合计率进行比较时,如果各组观察对象内部构成不同,应考 虑对合计率进行标准化。标准化法就是采用统一的标准构成,消除因混杂因 素构成不同对总指标的影响。 直接法:已知被标化组的年龄别死亡率; 间接法:只给年龄别人口数和死亡总数;
输出结果:
率的标准化:
• (书 29页练习3)表5-4 资料分析比较甲乙两厂职工 的高血压患病率。
SPSS操作
1.数据录 入
2.分析:要生成变量 transform→compute variable... target variable: 键入 sp numeric expression:键入p1+p2 ok transform→compute variable... target variable: 键入 sp1 numeric expression:键入c1/p1*sp ok transform→compute variable... target variable: 键入 sp2 numeric expression:键入c2/p2*sp ok
2.分析:要分析的变量 Analyze→descriptive statistics→descriptive ... Variable(s): sp sp1 sp2 点击options.......选择sum continue ok
3.输出结果: 将spss输出的结果sp1之和除以sp的和,得到甲厂职工高血压标 准化患病率,sp2之和除以sp的和,得到乙厂职工高血压标准化 患病率。
未患COPD人数
合计
吸烟 不吸烟
136 161 297
2635 5409
2771 5570 8341
合计
316
计算结果:
吸烟者COPD的患病率=4.91%
不吸烟者COPD的患病率=2.89%
吸烟者COPD的患病率比不吸烟者COPD的患病率高2.02%。
速率的计算: (书上例5.2) 在一项随访研究中,对125人追踪随访了2年, 结果有2人发生了死亡,则由公式可得:
相关主题