当前位置:文档之家› 独立性检验PPT课件

独立性检验PPT课件


第三步:引入一个随机变量:卡方统计量 K 2ab c n a d d a b c c 2bd
第四步:查对临界值表(教材P13),作出判断。
利用独立性检验来考察两个分类变量是否有关系,
能较精确地给出这种判断的可靠程度. 具体作法是:
(1)根据实际问题需要的可信程度确定临界值k0; (2)由观测数据计算得到随机变量K2的观测值k; (3)如果k>6.635,就以 1-P(K2≥6.635)×100%的 把握认为“X与Y有关系”;否则就说样本观测数据没 有提供“X与Y有关系”的充分证据.
变 量 分 类 变 量 — — 独独立立性性检检验相 验关 指 数 R2、 残 差 分 析 )
本节研究的是两个分类变量的独立性检验问题。
某医疗机构为了了解呼吸道疾病与吸 烟是否有关,进行了一次抽样调查,共调 查了515个成年人,其中吸烟者220人,不 吸烟者295人,调查结果是:吸烟的220人 中37人患病, 183人不患病;不吸烟的 295人中21人患病, 274人不患病。
根据这些数据能否断定:患病与 吸烟有关吗?
为了研究这个问题,我们将上述列问2题×用2列下表联表表示:
患病 不患病 总计
吸烟
37
不吸烟
21
183
220
274
295
总计
58
457
515
两个分类变量之间是否有关系?
1.从列联表分别计算患病在两类中的频率。
在不吸烟者中患病的比重是 7.12% 在吸烟者中患病的比重是 16.82% 上述结论能说明吸烟与患病有关吗?
(2)利用图形判断性别与是否喜爱看《新 还珠格格》有关?
有一个颠扑不破的真理,那就是当 我们不能确定什么是真的时,我们就 应该去探求什么是最可能的。
能否用数量来刻画“有关”程度
笛卡尔
3.“有关”的可信程度是多少?即有“多少把 握认为有关”呢?——两个分类变量的独立性
检验
患病
不患病
总计
不吸烟
a
b
a+b
2.画出列联表的等高条形图
不患病 比例
患病 比例
吸烟者与不吸烟者患病的可能性存在差异。
例1:随着《新还珠格格》的热播,又掀起了一 场“还珠热”。为了了解喜爱看《新还珠格格》 是 否与性别有关,小欣随机抽查了140名男性和 160名女性,调查发现,男性和女性中分别有80 人和120人喜爱看,其余人不喜爱看。 (1)根据以上数据建立一个2×2的列联表;
为高中生的性别与是否喜欢数学课程之间有关系?为什么?
解:在假设“性别与是否喜欢数学课程之间没有关系”的前提
下K2应该很小,并且 P (K 23.841)0.05,
而我们所得到的K2的观测值k 4.513超过3.841,这就意味着
“性别与是否喜欢数学课程之间有关系”这一结论错误的可能
性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程 之间有关系”。
所以有99%的把握认为“秃顶与患心脏病有关”。
例3.性别与喜欢数学课
为考察高中生的性别与是否喜欢数学课程之间的 关系,在某城市的某校高中生中随机抽取300名学生, 得到如下联表:
男 女 总计
喜欢数学课程 不喜欢数学课程
37
85
35
143
72
228
总计 122 174.513。在多大程度上可以认
吸烟
c
d
c+d
总计
a+c
b+d a+b+c+d
利用随机变量K2来确定是否能以一定的把
握认为“两个变量有关系”的方法,称为两个 分
类变量的独立性检验。
独立性检验
第一步:H0: 吸烟和患病之间没有关系 第二步:列出2×2列联表
吸烟 不吸烟
总计
患病 a c
a+c
不患病 b d
b+d
总计 a+b c+d a+b+c+d
课堂小结:独立性检验的步骤
(1)列出2×2列联表 (2)计算K2的观测值k (3)查表得结论(表1—11)
变 量 分 类 变 量 : 性 别 、 是 否 吸 烟 、 是 否 患 肺 癌 、

宗 教 信 仰 、 国 籍 等 等 。
在日常生活中,我们常常关心分类变量的之间是否有关系
研 究 两 个 变 量 的 相 关 关 系 :
定 量 变 量 — — 回 归 分 析 ( 画 散 点 图 、 相 关 系 数 r、
不患心脏病 175 597 772
总计 389 1048 1437
根据列联表的数据,得到
K 2 1 4 3 7 ( 2 1 4 5 9 7 1 7 5 4 5 1 ) 2 1 6 .3 7 3 6 .6 3 5 . 3 8 9 1 0 4 8 6 6 5 7 7 2
“X与Y有关系”.
例2 在某医院,因为患心脏病而住院的665名男性病人中,有214 人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有 175人秃顶。利用独立性检验方法判断秃顶与患心脏病是否有关 系?你所得的结论在什么范围内有效?
解:根据题目所给数据得到如下列联表:
秃顶 不秃顶
总计
患心脏病 214 451 665
临界值
P(K2 k) 0.50 0.40 0.5 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.445 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
(1)如果k>10.828,就有99.9%的把握认为“X与Y有关系” (2)如果k>7.879,就有99.5%的把握认为“X与Y有关系”; (3)如果k>6.635,就有99%的把握认为“X与Y有关系”; (4)如果k>5.024,就有97.5%的把握认为“X与Y有关系”; (5)如果k>3.841,就有95%的把握认为“X与Y有关系”; (6)如果k>2.706,就有90%的把握认为“X与Y有关系”; (7)如果k<=2.706,就认为没有充分的证据显示
独立性检验课 件
(第一课时)
数学选修1--2
学习目标
1.会列2×2列联表,会画等高条形图 2.会从2×2列联表,等高条形图中直观 的判断出两个分类变量之间是否有关? 3.了解独立性检验的基本思想和步骤
两种变量:
定 量 变 量 : 体 重 、 身 高 、 温 度 、 考 试 成 绩 等 等 。
相关主题