当前位置:
文档之家› 中国医科大学研究生医学统计学 第五讲 计数资料及卡方检验2
中国医科大学研究生医学统计学 第五讲 计数资料及卡方检验2
(四)注意资料的可比性 用以比较的资料应是同质的,除 了要比较的处理因素外,其它条件应 基本相同。对于不同时期、地区、条 件下的资料应注意是否齐同。
• (五)对比不同时期资料应注意客观 条件是否相同 例如,疾病报告制度完善和资料完整 的地区或年份,发病率可以“升高”; 居民因医疗普及,就诊机会增加,或诊 断技术提高,也会引起发病率“升高” 。因此在分析讨论时,应根据各方面情 形全面考虑,慎重对待。
2 ( A T ) 2 RC RC TRC
=
[b- (b+c)/2]2
+
[c- (b+c)/2]2
(b+c)/2 [(c- b)/2]2 (b+c)/2
(b+c)/2
= [ (b-c)/2]2 +
(b+c)/2
= (b-c)2/2
(b+c)/2
(b c) 2 bc
H0:总体B = C H1:总体B≠C α= 0.05 b + c = 12 + 2 = 14 < 40。
本资料若不校正时,X2=4.35,P<0.05,结 论与之相反。
最小理论频数TRC的判断: R行与C列中,行合计数中的最小 值与列合计数中的最小值所对应
格子的理论频数最小。
如本例,第2行与第2列所对应的格子 理论频数最小(4.67)。
第二节 配对设计的四格表资料的χ2检验
(一)配对四格表形式 B 甲种属性 + 合计 A乙种属性 + 合计 a b a+b c d c+d a+c b+d n=a+b+c+d
无效 b d b+d
合计 a+b c+d n= a+b+c+d
n1. n.1 (a c ) T11 (a b) n n
• 表7-1两组降低颅内压有效率的比较
χ2 值的含义: 反映了实际频数与理论 频数的吻合程度。 χ2值理论上是非负值。(即χ2≥0) χ2检验判别准则: 若 χ2<χ20.05(ν) , 则 P>0.05, 不拒绝无 效假设H0; 若 χ2≥χ20.05(ν) , 则 P<0.05, 拒绝无效假 设H0,接受H1 。
二、两个或多个构成比的比较(例7-7)
三、双向无序分类资料的关联性检验
(例7-8)
对一个样本(或称一组观察对象)按照 两种分类变量的取值,排列成二维的表, χ2检验可用于分析两分类变量的关系。
一、多个样本率的比较
例7-6 某医师研究物理疗法、药物治疗 和外用膏药三种疗法治疗周围性面神经 麻痹的疗效,资料见表7-8。问三种疗 法的有效率有无差别?
(六)样本率(或构成比)的抽样误差 不能仅凭数字表面相差大小下结 论,而应进行样本率 ( 或构成比 ) 差别 的假设检验。
2 χ 检验
χ2检验在分类资料中的应用:
( 1) 推断两个(或多个)总体率或构成比 之间有无差别 (2)多个样本率间多重比较 (3)两个分类变量之间有无关联性 (4)多维列联表的分析 (5)频数分布拟合优度的χ2检验
(三)正确计算合计率
不能简单地由各组率相加或平均而得, 而应用合计的有关实际数字进行计算。 例如用某疗法治疗肝炎,甲医院治疗150 人,治愈 30 人,治愈率为 20 %;乙医院 治疗100人,治愈30人,治愈率为30%。 两个医院合计治愈率应该是 [(30+30) / (150+100)]×100 % =24 % 。 若 算 为 20 % +30 %。 50 %或 (20 % +30 % ) / 2=25 %, 则是错的。
表7-8 三种疗法有效率的比较
H0:π 1=π 2=π 3, 即三种疗法治疗周围 性面神经麻痹的有效率相等
H1: 三种疗法治疗周围性面神经麻痹 的有效率不全相等 α = 0.05
2=21.04, =2, 查 2界值表得P<0.005。
按α=0.05 水准, 拒绝H0, 接受H1, 可认 为三种疗法治疗周围性面神经麻痹的 有效率有差别。
特点: (1)同一事物的各个组成部分的 构成比之和应为100%。 (2)事物内部各组成部分之间呈 此消彼长的关系。
三、相对比
相对比(ratio),是两个有关的指标之 比,用以描述两者的对比水平。两个指标 可以是绝对数、相对数或平均数;可以 性质相同,也可以性质不同。
甲指标 相对比 乙指标
第二节
第一节
2 四格表资料的χ 检验
• χ2检验的基本思想:是检验实际 频数和理论频数的差别是否由抽样 误差所引起的。
一、χ2检验的统计量基本公式为:
2
( ARC TRC ) TRC
2
应用条件:n≥40,且T ≥ 5, 其中
TRC
n R nC n
处理 A B 合计
有效 a c a+c
常用的相对数指标有比、比例和率三种。 1.两个有关指标之比称为比(ratio),或称相 对比; 2. 当比的分子是分母的一部分时,称为比 例(proportion),或称结构相对数。
3. 当比例与时间有关系时称为率(rate),或 称为强度相对数。
第一节 常用相对数 一、率(强度相对数 ) 率( rate )是表示某种现象发生的 频率和强度,常以百分率(%),千分 率(‰),万分率(1/万),十万分率 (1/10万)等表示,计算公式为:
率 某事物或现象发生的实 际数 比例基数 某事物或现象发生的所 有可能数
例1 • 某企业2003年有2839名职工,该企业 每年都对职工进行体检,这一年新发 生高血压患者5例,高血压发病率为: 5/2839×1000‰=1.76‰。 比例基数的选择 主要依据习惯用法或使计算结果保留 一位或二位整数,以便阅读。
际应用中常用它作为四格表资料假设检验的补充
2.适用条件:(1)n<40 (2)T<1 (3)P≈α
第四节
行×列表资料的χ2检验
行×列表资料的χ2检验用于:多个 样本率的比较、两个或多个构成比的 比较、以及双向无序分类资料的关联 性检验
A n( 1) nR nC
2
2
一、多个样本率的比较(例7-6)
二、构成比(结构相对数 )
构成比(Constituent ratio)表示事物内 部各个组成部分所占整体的比重,通常以 100%为比例基数,以百分比表示,计算公 式如下 :
构成比 某事物内部某一组成部分观察单位数 100% 同一事物各组成部分的观察单位总数
• 例2 某医院1990年和1998年住院病人 死于五种疾病的人数见下表。
a, d: 两法观察结果一致的两种情况,
b, c: 两法观察结果不一致的两种情况。
若两种处理方法无差别, 总体: B = C。 因抽样误差不可避免, 样本往往b≠c, 需进行假设检验 ( McNemar test ), 检验统计量为 。
2
例7-3 某实验室分别用乳胶凝集法和
免疫荧光法对58名可疑系统红斑狼疮
第五讲 分类资料的统计描述与χ2检验
• 计数资料常见的数据形式是绝对数,如 某病的出院人数、治愈人数、死亡人数 等。 绝对数:只能表示某事物在某时、某地 发生的实际水平。 相对数:便于相互比较与分析。
例:甲、乙两地麻疹流行,
甲地发病300人 绝对数 乙地发病250人 甲>乙 但不能据此确定甲地麻疹流行较为严重,需考 虑易感人数。若甲地易感人数3000人 乙地易感人数1000人 则甲地麻疹发病率=300/3000=10% 乙地麻疹发病率=250/1000=25% 相对数
见表7-3。问两种方法的检测结果有
无差别?
表7-3
两种方法的检测结果
(二)计算公式 1. b+c≥40 时
(b c) bc
2
2
2. b+c<40时
(| b c | 1) bc
2
2
H0:总体B = C = (b+c)/2 H1:总体B≠C
=96×174/200
表7-1内只有4个数
是该表的
基本数据,其余数据都是由这4
个基本数据推算出来的,称为
四格表(fourfold table)资料。
χ2检验的检验步骤
H 0: π 1= π 2 H 1: π 1≠π 2
2
α =0.05;
( ARC TRC ) 2 TRC
以υ=1查χ2界值表得P<0.05。按α=0.05检验水准拒绝 Ho,接受H1,可以认为两组降低颅内压总体有效率 不等。
2 =1, 查 界值表得P<0.05。按α= 0.05检
验水准, 拒绝H0 , 接受H1 , 可以认为两种方法的检
测结果不同。
第三节 四格表的Fisher确切概率法
1. R.A.Fisher提出直接计算有利于拒绝H0的概 率,以作出检验判断。 Fisher确切概率法并非χ2检验的范畴。但在实
两个无序分类变量的行×列表资料, 称双向无 序R×C表资料。
2 行×列表资料 检验:推断两个无序分类变
量之间有无关系/关联。
若有关系,想进一步分析关系的密切程度,可 计算Pearson列联系数C。
表7-10 某地5801人的血型
2:行×列表资料的 2值
n:样本含量
Pearson列联系数 C : 0~1 0 完全独立;1 完全相关;
二、 四格表资料χ2检验专用公式: (n≥40且所有的T≥5)
(ad bc) n (a b)(c d )(a c)(b d )
2 2
l
三、四格表资料χ2检验的连续性校正: (n≥40 且某一个理论数1≤T<5) 校正公式分别为: