列联表独立性分析案例
未感冒 使用血清 未使用血清 合计 258 216 474
感冒 242 284 526
2
合计 500 500 1000
解:设H0:感冒与是否使用该血清没有关系。
1000 258 284 242 216 2 c 7 .075 474 526 500 500 因当H0成立时,χ2≥6.635的概率约为0.01,故有99%的把握认 为该血清能起到预防感冒的作用。
2
99.9%把握认 为A与B有关
99%把握认 为A与B有关 90%把握认 10%把握认为 2 c 2.706 为A与B有关 A与B无关 没有充分的依据显示A与B有关 2 c 2.706 ,但也不能显示A与B无关
2
1%把握为A与B c 6.635 无关
独立性检验 解:H0: 吸烟和患病之间没有关系 患病 不患病 总计
其中X表示“是否吸烟”,Y表示“是否患肺癌 ”。
X Y 吸烟 ( A) 不吸烟( A ) 总计 患病( B ) a c a+c 不患病( B ) b d b+d 总计 a+b c+d n
称类似的表格为列联表; 称X,Y为两个因素,称“吸烟”和“不吸烟”为X的两个水平 称“患肺癌”和“不患肺癌”为Y的两个水平
39 可见,在 54个吸烟的人中有 39人患肺癌,患者占 72.22 % 54 21 在不吸烟的 46人中,有 21人患肺癌烟者中患肺癌的 比例高出
通过数据和图表分析,得到结论是:吸烟与患病有关
结论的可靠 程度如何?
独立性检验
步骤:
2
合计 98 95 193
解:设H0:药的效果与给药方式没有关系。
2
193 58 31 64 40 c 1 .3896 <2.072 122 71 98 95 因当H0成立时,χ2≥1.3896的概率大于15%,故不能否定假设 H0,即不能作出药的效果与给药方式有关的结论。
故有99%的把握认为H0不成立,即有99%的把 握认为“患病与吸烟有关系”。
例 1. 在 500人身上试验某种血清预防感冒作用,把他们 P(c2 ≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 一年中的感冒记录与另外 500名未用血清的人的感冒记 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 x0 录作比较,结果如表所示。问:该种血清能否起到预防 感冒的作用?
例3:气管炎是一种常见的呼吸道疾病,医药研究人 P(χ≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 员对两种中草药治疗慢性气管炎的疗效进行对比, 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 x0 所得数据如表所示,问:它们的疗效有无差异?
P(c2 ≥x0) 0.50 0.40 0.25 0.15 x0
0.10
0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
例如 0.1%把握认为A c 10.828 与B无关
n ad bc
2
其中n a b c d
第四步:查对临界值表,作出判断。
P(c2 ≥x0) 0.50 0.40 0.25 0.15 x0 0.10 0.05 0.025 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
案例 患肺癌与吸烟是否有关? 肺癌与吸烟的调查数据
X
吸烟
不吸烟 不吸烟 总计 总计 吸烟
Y
患病 n11 =39 39
n21 =21 21
=60 n160
患肺癌
未患肺癌
不患病 n12 =15 15
总计 n1 =54 54
n2 =46 46
=100 n100
总计
n22 =25 25
=40 n2 40
吸烟 不吸烟 总计
通过公式计算
39 21 60
15 25 40
54 46 100
100 39 25 15 21 c 7.307 54 46 60 40
2 2
已知在 H 0 成立的情况下,
P ( c 6.635) 0.010
2
2 c 即在 H 0 成立的情况下, 大于6.635概率非常 小,近似为0.010 2 c 现在的 =7.307的观测值远大于6.635,出 现这样的观测值的概率不超过0.010。
4.3列联表独立性 分析案例
高二数学 选修1-2
2018/11/25 郑平正 制作
第四章
统计案例
在许多实际问题中,外面需要考察两种因素的 关系。例如:数学解题能力是否与性别有关;高 考升学率是否与补课有关。 为了分析这些问题,外面需要获取一些数据, 并对数据进行分析处理。 例如,为了了解患肺癌是否与吸烟有关,就需 要调查其他条件都基本相同的n个人。将调查结 果列成表的形式。
用χ2统计量研究 这类问题的方法
第一步:先假设 H0: X,Y 独立。即假设吸烟和 患病之间没有关系 第二步:列出2×2列联表
吸烟 不吸烟 总计 患病 a c a+c 不患病 b d b+d 总计 a+b c+d a+b+c+d
第三步:引入一个随机变量:卡方统计量
k
2
a b c d a c b d
例 2:为研究不同的给药方式(口服与注射)和药的效 P(χ≥x 0.10 0.05 0.025 0.010 0.005 0.001 0) 0.50 0.40 0.25 0.15 果(有效与无效)是否有关,进行了相应的抽样调查, 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 x0 调查的结果列在表中,根据所选择的193个病人的数 据,能否作出药的效果和给药方式有关的结论? 口服 注射 合计 有效 58 64 122 无效 40 31 71