当前位置:文档之家› 独立性检验课件

独立性检验课件


三、例题分析
例1 某医院,因为患心脏病而住院的 665名男性病人中,有214人晕厥 ;而 另外772名不是因为患心脏病而住院的男性病人中有 175人晕厥 。利用独立 性检验方法判断秃顶与患心脏病是否有关系?
解:根据题目所给数据得到如下列2×2联表:
晕厥 不晕厥 总计 患心脏病 214 451 665 不患心脏病 175 597 772 总计 389 1048 1437
f.如果k>2.706,就有90%的把握认为“X与Y有关系”; g.如果k<=2.706,就认为没有充分的证据显示“X与Y有关系”.
有一个颠扑不破的真理,那就是当我们 不能确定什么是真的时,我们就应该去探求什 么是最可能的。
笛卡尔
根据这些数据能否断定:患病与吸烟有关吗? 2、为了研究这个问题,我们将上述问题用下表表示:
患病 吸烟 不吸烟 总计 37 21 58 不患病 183 274 457 总计 220 295 515
注.从列2×2联表分别计算患病在两类中的频率。 在不吸烟者中患病的比重是 在吸烟者中患病的比重是 7.12% 16.82%
根据列联表的数据,得到
2 1437 (214 597 175 451) 2 K 16.373 6.635. 389 1048 665 772
所以有99%的把握认为“晕厥与患心脏病有关”。
三、例题分析
例2.性别与喜欢数学课 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城 市的某校高中生中随机抽取300名学生,得到如下联表:
课堂小结:
一、独立性检验
定量变量:数值可以连续变化的不同值,如身高。 1、变量: 分类变量:数值只可以取两种情况,如性别、是否吸烟。
{
2、利用随机变量K2来确定是否能以一定的把握认为“两个 变量有关系”的方法,称为两个分类变量的独立性检验。 二、独立性检验的步骤 (1)列出2×2列联表(2)计算K2的观测值k(3)查表得结论
男 女 总计
喜欢数学课程 37 35 72
不喜欢数学课程 85 143 228
总计 122 178 300
由表中数据计算K2的观测值k=4.513。在多大程度上可以认 为高中生的性别与是否喜欢数学课程之间有关系?为什么? 解:在假设“性别与是否喜欢数学课程之间没有关系”的前提 下K2应该很小,并且 P( K 2 3.841) 0.05, 而我们所得到的K2的观测值k=4.513超过3.841,这就意味着 “性别与是否喜欢数学课程之间有关系”这一结论错误的可能 性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程 之间有关系”。
2、研究两个变量的相关关系:
定量变量——回归分析(画散点图、相关系数r、 变量 相关指数R 2、残差分析) 分类变量—— 独立性检验
二、独立性检验
1、问题:某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次 抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人, 调查结果是:吸烟的220人中37人患病, 183人不患病;不吸烟的295人 中21人患病, 274人不患病。
二、独立性检验
1、列出2×2列联表
患病 吸烟 不吸烟 a c 不患病 b d 总计 a+b c+d
2、引入一个随机变量,

卡方统计量:
总计
a+c
b+d
a+b+c+d
K
2
a b c d a c b d
n ad bc
2
3、由观测数据计算得到随机变量K2的观测值k; 4、以1-P(K2≥k)×100%的把握认为“X与Y有关系”;否则就 说样本观测数据没有提供“X与Y有关系”的充分证据.
P( K 2 k ) 0.50
0.40
0.5
0.15 0.10 0.05 0.025 0.010 0.005 0.001
k
0.445 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.83
a.如果k>2.706,就有90%的把握认为“X与Y有关系”; b.如果k>3.841,就有95%的把握认为“X与Y有关系”; c.如果k>6.635,就有99%的把握认为“X与Y有关系”;
数学选修1--2
1.会列2×2列联表,
2.会从2×2列联表,直观粗略的判断出两个分 类变量之间是否有关?
3.了解独立性检验的基本思想和步骤
弋阳二中 2011.11.4
一、两种变量及对应处理的问题
1、两种变量:
定量变量:体重、身高、温度、考试成绩等等。 变量 分类变量:性别、是否吸烟、是否患肺癌、 宗教信仰、国籍等等。
a.如果k>10.828,就有99.9%的把握认为“X与Y有关系”; b.如果k>7.879,就有99.5%的把握认为“X与Y有关系”; c.如果k>6.635,就有99%的把握认为“X与Y有关系”; d.如果k>5.024,就有97.5%的把握认为“X与Y有关系”; e.果k>3.841,就有95%的把握认为“X与Y有关系”;
相关主题