当前位置:文档之家› 独立性检验分析

独立性检验分析

1
推出矛盾,意味着结 推出有利于H1成立的小概率事件 发生,意味着 H1成立的可能性 论A成立 很大 没有找到矛盾,不能对 推出有利于H1 成立的小概率事 H A下任何结论,即反 件不发生,接受原假设 证不成功
0
例 1. 在 500 人身上试验某种血清预防感冒作用,把他们 P(χ≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 一年中的感冒记录与另外 500 名未用血清的人的感冒记 x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 录作比较,结果如表所示。问:该种血清能否起到预防 感冒的作用? 未感冒 感冒 合计
99.9%把握认 为A与B有关
99%把握认 6.635 为A与B有关 90%把握认 10%把握认为 2 2.706 为A与B有关 A与B无关 没有充分的依据显示A与B有关, 2 2.706 但也不能显示A与B无关
2
解:H0: 吸烟和患肺癌之间没有关系
患肺癌 不患肺癌 吸烟 15 患肺 不患 39 总计 癌 肺癌 21 不吸烟 25
P(x2≥k) k 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
10.828
2
0.1%把握认 为A与B无关 1%把握认为 A与B无关
3、计算
a bc d a 2 c b d
nad bc a bc d a c b d
2
4、把 的值与临界值进行比较,确定X,Y有关系 的程度或无关系
作业: 数学同步导学P64-65


用A表示:吸烟,用B表示:患肺癌
P(A)=0.54 P(B)=0.6

P(AB)=0.39 P(AB)=0.39
P(A)P(B) =0.324

从上面数据和事件的独立性显然是可 以断定吸烟和患肺癌有关
我们能够有多大的把握认 为“吸烟与患肺癌有关”?
独立性检验
第一步:假设 H0:吸烟与患肺癌没有关系 第二步:列出2× 2列联表
练习1:为了探究患气管炎是否与吸烟有关, 调查了409名50岁以上的人,现已将得到的数 2 =12.34 ,则下列说法 据进行计算得 中正确的是( D ) A.50岁以上的人,患慢性气管炎与吸烟无关
B.在100个50岁以上的患慢性气管炎的人中, 一定有95人有吸烟习惯 C.在100个50岁以上的患慢性气管炎的人中, 一定有995人有吸烟习惯 D.我们有99%的把握认为50岁以上的人患慢 性气管炎与吸烟习惯有关
现在的 =7.31的观测值大于6.635,出现 这样的观测值的概率不超过0.01。
2
故有99%的把握认为H0不成立,即有99%的把 握认为“患肺癌与吸烟有关系”。
反证法原理与独立性(假设)检验原理 反证法
要证明结论A 在A不成立的前提下 进行推理
假设检验
1 A与B有关系) 要证明假设 H(
假设H ( 0 A与B没有关系)成 H 立的条件下进行推理
吸烟 不吸 烟2 总计
总计 54 46 100
总计
39
15
60
54
40
通过公式计算
100(39 25 15 21) 7.31 60 40 54 46
2
21 60
25 40
46
100
已知在 H 0成立的情况下,
P(
2
6.635) 0.01
2 即在 H 0 成立的情况下, 大于6.635概率非常小, 近似为0.01
分类变量Y1 分类变量Y2 总计
分类变量X1 a c a+c
分类变量X2 b d b+d
总计 a+b c+d a+b+c+d
第三步:引入一个随机变量:卡方统计量
nad bc (n=a+b+c+d) a bc d a c b d
2 2
第四 122
无效 40 31 71
2
合计 98 95 193
解:设H0:药的效果与给药方式没有关系。
19358 31 64 40 2 1.3896 122 71 98 95 因当H0成立时,χ2≥1.3896的概率大于15%,故不能否定假设 H0,即不能作出药的效果与给药方式有关的结论。
练习 3 :为研究学生数学课堂上听课效率是否与吃早餐 有关,现在随机对20位水平相当的同学某天的课堂小测 进行调查,结果如下: 成绩<=80 成绩>80 合计
没吃早餐 有吃早餐 合计 4 3 7 1 12 13 5 15 20
试问有多大把握认为听课效率与吃早餐有关?
P(2 ≥x0) 0.50 0.40 0.25 0.15 x0 0.10 0.05 0.025 0.010 0.005 0.001
21 60
54
不 45.65% 在不吸烟中患肺癌的比例是 吸 21 25 46 烟 在吸烟中患肺癌的比例是 72.22% 总 60 40 100 计
事件A与事件B相互独立 P(AB)= P(A)P(B)
吸烟 不吸烟 总计
患肺癌 39 21 60 不患肺癌 15 25 40 总计 54 46 100
列联表独立性分析案例
对于性别变量,其取值为男和女两种.
对于血型变量,其取值可分为 O型、A型、B型、AB型等.
这种变量的不同“值”表 示个体所属的不同类别,像 这类变量称为分类变量.
生活中的分类变量
是否吸烟,宗教信仰,国籍„
两个分类变量之间是否有关系? 吸烟 患肺癌
周恩来不抽烟不喝酒,活到 78岁;毛泽东只抽烟不喝酒, 活到83岁;邓小平又抽烟又 喝酒,活到98岁——孩子规 劝父母戒烟戒酒,竟得到如 此回答。
练习 2:为研究不同的给药方式(口服与注射)和药的 P(χ≥x 0.10 0.05 0.025 0.010 0.005 0.001 0) 0.50 0.40 0.25 0.15 效果(有效与无效)是否有关,进行了相应的抽样调 x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 查,调查的结果列在表中,根据所选择的193个病人 的数据,能否作出药的效果和给药方式有关的结论?
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
课堂小节:
一.分类变量的定义
二.2×2列联表
三.利用独立性检验来考虑两个分类变量是否相关
2
1、假设两个分类变量X,Y独立
K
2
2、列n2 × 2列联表 ad bc
2
问题1:吸烟与患肺癌有关系吗?
问题2:你有多大程度把握吸烟与患肺癌有关系?
为了调查吸烟是否对患肺癌有影响?某医疗研究 所随机地调查了100人,得到如下结果 2×2列联表
未患 患肺 患肺癌 肺 总计 癌 39 吸烟 癌
不吸烟 吸 39 烟 总计
不患肺癌 15 25 40
总计 54 46 100
15
使用血清 未使用血清
合计
258 216
474
242 284
526
2
500 500
1000
解:设H0:感冒与是否使用该血清没有关系。
1000258 284 242 216 2 7.075 474 526 500 500 因当H0成立时,χ2≥6.635的概率约为0.01,故有99%的把握认 为该血清能起到预防感冒的作用。
相关主题