第五讲 定性资料的统计分析
2
行×列ቤተ መጻሕፍቲ ባይዱ资料的 χ 检验
2
四格表资料卡方检验
进行比较, 一定是两组进行比较,实验结果是两个对 立的结果。 四格表资料表格
_____________________________________ + 合计 _____________________________________ a b a+b 第一组 c d c+d _____________________________ a+b b+d a+b+c+d 合计 ______________________________________ 第二组
A χ = n(Σ −1) nRnC
2
2
ν = (行数−1)(列数−1)
配对设计资料的两样本检验
配对设计是医学研究中常用的设计方法之一, 配对设计是医学研究中常用的设计方法之一, 配对研究常用于比较两种检验方法 二分类结果资料的配对研究常用于比较两种检验方法、 二分类结果资料的配对研究常用于比较两种检验方法、 两种培养方法、两种提取方法等的差别。 两种培养方法、两种提取方法等的差别。 配对四格表资料表格 甲种属性
用药史 曾服该药 未服该药 合计 不敏感 180 73 253 敏感 215 106 321 合计 395 179 574 耐药率( ) 耐药率(%) 45.57 40.78 44.08
Public health school, Xuzhou medical college
建立数据文件
Dose 表示服该药情况 1 2 Sensi 表示敏感情况 1 2 Weight 表示相应的频数 表示不敏感 表示敏感 表示曾服该药 表示未曾服该药
+ a c a+c
乙种属性
- b d b+d
合计
a+b c+d a+b+c+d
合计
+ -
Public health school, Xuzhou medical college
b + c > 40, b + c ≤ 40,
(b − c) χ =
2
2
χ
2
( b −c −1) =
b+c
b+c
2
ν =1
例乳腺癌患者治疗后5年存活率的比较 表3 131例乳腺癌患者治疗后 年存活率的比较 例乳腺癌患者治疗后 处理 联合治疗 单纯治疗 合计 不敏感 39 57 96 敏感 8 27 35
Public health school, Xuzhou medical college
4. 为研究静脉曲张是否与肥胖有关 观察 为研究静脉曲张是否与肥胖有关,观察 观察122对 对 同胞兄弟,每对同胞兄弟中有一个属于肥胖 每对同胞兄弟中有一个属于肥胖,另 同胞兄弟 每对同胞兄弟中有一个属于肥胖 另 一个属于正常体重, 一个属于正常体重 记录得静脉曲张发生情况 见下表,试作相关分析 试作相关分析。 见下表 试作相关分析。
Public health school, Xuzhou medical college
二、主要内容
Analyze Descriptive Statistics Crosstabs...
Public health school, Xuzhou medical college
SPSS操作过程: 操作过程: 操作过程
表4
正常体重
122对同胞兄弟静脉曲张发生情况 对同胞兄弟静脉曲张发生情况
肥胖
发生 19 12 31
未发生 5 86 91
合计 24 98 122
发生 未发生 合计
1) Weight cases Data Weight Cases... 2) analyze Analyze Descriptive Statistics Crosstabs...
某药品检验所随机抽取574名成年人, 574名成年人 例1 某药品检验所随机抽取574名成年人,研究某抗生 素的耐药性。其中179例未曾用过该抗生素, 179例未曾用过该抗生素 素的耐药性。其中179例未曾用过该抗生素,其耐药率 40.78%; 395例曾用过该药的人群中 例曾用过该药的人群中, 为40.78%;在395例曾用过该药的人群中,耐药率为 45.57%,结果见下表。 45.57%,结果见下表。 试问两种人群的耐药率是否一样? 试问两种人群的耐药率是否一样? 表8-11 某抗生素的人群耐药性情况
例2 某研究人员收集了亚洲、欧洲和北美洲人的A、B、 某研究人员收集了亚洲、欧洲和北美洲人的 、 、 AB、O血型资料,结果见下表,其目的是研究不同地 血型资料, 、 血型资料 结果见下表, 区的人群血型分类构成比是否一样。 区的人群血型分类构成比是否一样。 表8-1
地区 亚洲 欧洲 北美洲 合计
Public health school, Xuzhou medical college
定性资料假设检验的正确应用
两个率的比较: 两个率的比较: 1)当n≥40,所有 ) ,所有T>5时,用普通的卡方 时 检验公式; 检验公式; 2)当n≥40,但有理论频数 ) ,但有理论频数1≤T<5时,用 < 时 校正的卡方检验公式; 校正的卡方检验公式; 3) n<40或有 ) 或有T<1时或 时或P≈α时,用确切概 或有 时或 时 率法。 率法。
连续性校正公式: 连续性校正公式:
χ =∑
2 c
2
( A−T − 0.5) T
n 2 2
2
(| ad - bc | - ) n χc = (a +b)(c+ d )(a + c)(b+ d )
行×列表资料卡方检验
可用于检验多个样本率或构成比以推断多个总 可用于检验多个样本率或构成比以推断多个总 多个样本率 体率或构成比是否相等。 体率或构成比是否相等。
卡方检验的基本公式: 卡方检验的基本公式:
( A − T )2 χ2 = ∑ ,自由度ν = ( 行数-1)( 列数-1) T
ν =1
卡方检验的四格表专用公式: 卡方检验的四格表专用公式:
χ
2=
(ad−bc) n ν =1 (a+b)(a+c)(b+d)(c+d)
2
Public health school, Xuzhou medical college
Public health school, Xuzhou medical college
第五讲 定性资料的统计分析
Public health school, Xuzhou medical college
计量资料
每个观察单位某个变量用测量或其他定量方法 获得的定量观察结果,一般有计量单位。 体 重(kg) : 20 35 42 60 mm 皮试直径(mm): 18 16 21 28 年 龄(岁) : 25 32 65 45
计数资料
将观察单位按某种属性分组计数的定性观察结 果。 二分类: 性别:男 ,女 多分类: 民族:汉,满,回… 血型:A,B,AB,O 痰培养:阴性, 阳性
Public health school, Xuzhou medical college
等级资料
将观察单位按某种属性的不同程度或次序分成 等级后分组计数的观察结果,特点是具有半定量性 质。 痰 涂 片:阴性,可疑,阳性 血清反应:阴性,若阳性,阳性,强阳性
area 表示不同地区 1 2 3 bloodtype 表示不同血型 1 2 3 4 Weight 表示A型 表示 型 表示B型 表示 型 表示AB型 表示 型 表示O型 表示 型 表示亚洲 表示欧洲 表示北美洲
表示相应的频数
现有198份痰标本,每份标本分别用 、B两种培养 份痰标本, 例3 现有 份痰标本 每份标本分别用A、 两种培养 基培养结核菌,结果如下表, 培养基的阳性培养率为 基培养结核菌,结果如下表,A培养基的阳性培养率为 36.36%, B培养基的阳性培养率为 培养基的阳性培养率为34.34%, 试问 、 B , 培养基的阳性培养率为 , 试问A、 两种培养基的阳性培养率是否相等? 两种培养基的阳性培养率是否相等?
计数资料的统计分析
率 统计描述 构成比 相对比
点估计 统计推断 参数估计 区间估计 卡方检验
假设检验
χ 检验
2
是一种用途广泛的统计方法,主要用于: 是一种用途广泛的统计方法,主要用于: 推断两个或多个总体率(或构成比) 推断两个或多个总体率(或构成比)之间有无 差别。 差别。 四格表资料 χ2检验 四格表配对资料 χ 检验
Public health school, Xuzhou medical college
定性资料假设检验的正确应用
多个率的比较: 多个率的比较:
表中不宜有1/5以上格子的理论数小于 , 表中不宜有 以上格子的理论数小于5,或不 以上格子的理论数小于 宜有个一理论数小于1。 宜有个一理论数小于 。 不满足条件的解决方案: 不满足条件的解决方案: (a)增加样本例数 增加样本例数; 增加样本例数 (b)删去上述理论频数太小的行或列 删去上述理论频数太小的行或列; 删去上述理论频数太小的行或列 (c)将太小理论频数相邻行或列合并,但应合理。 将太小理论频数相邻行或列合并,但应合理。 将太小理论频数相邻行或列合并
表1 两种检验方法结果比较
常规培养法 荧光抗体法
+ 160 5 165
26 48 74
合计 186 53 239
+ 合计
2. 某地调查了1995-1998四个年度中小学女生的贫血状 某地调查了 四个年度中小学女生的贫血状 见下表,问各年度间学生贫血率有无差别 况,见下表 问各年度间学生贫血率有无差别 见下表 问各年度间学生贫血率有无差别?