当前位置：文档之家› 第十二章卡方检验

第十二章卡方检验

• 2.校正公式：当有一格的理论次数小于5且 n>40时。
χ =
2
N ( ad − bc − N / 2)
2
•
(a + b)(c + d )(a + c)(b + d )
（二）相关四格表的χ2检验相关四格表的χ
• 1一般计算公式为：一般计算公式为：
( A − D )2 χ2 =
A+ D A、D为前后两次实验或调查中
N 理论次数： f e = k N 为总数， k 为分类数或组数
χ =∑
2
k
( f0 − fe )
fe
2
例题10-1（P302） 10-2 10-4
• 2.与正态分布有无差异的配合度检验 2.与正态分布有无差异的配合度检验
• （1）非连续变量的配合度检验） • 理论次数的计算步骤理论次数的计算步骤： • 假设6个标准差包括了全体，每个等级所占的标准差为：6σ÷k(k为等级数)； • 依据各等级所占的标准差，查正态分布表，即得各个等级所占的概率；（例题10-3P303）
四、χ2检验所隐含的假设 χ
• • • • 1.不同的分类应具有独立性；不同的分类应具有独立性；不同的分类应具有独立性 2.观测数据相互独立；观测数据相互独立；观测数据相互独立 3.期望次数应尽量大；期望次数应尽量大；期望次数应尽量大有些认为应大于5，有些认为应大于10；有些认为应大于，有些认为应大于；当理论次数过小时，应尽量避免使用χ 当理论次数过小时，应尽量避免使用χ2 检验。检验。
f e = p * N ( p 各等级所占的概率
)
（2）连续变量分布的假设检验
• 对于连续随机变量分布的假设检验，其关键步骤是：计算理论次数计算理论次数（fe）与确定计算理论次数自由度（df）。自由பைடு நூலகம் • 计算理论次数计算理论次数是根据所选理论分布函数，按实际分布的统计量带入函数式计算各分组区间的理论频率，然后乘以总数即为各分组区间的理论次数。 • 确定自由度确定自由度是将分组的数目减去计算理论次数时所用统计量的数目。
fe = p × N
(1) − X
(1) (2) (3)
(1) − X
S
根据Z查正态分布表
(4)
(5)
(6)
(7)
(8)
？
• 3.比率或百分数的配合度检验（例题10-6P307） 3.比率或百分数的配合度检验
理论次数 ( 率 )： f e = k 为分类数或组数 100 k
χ =
2
∑
k
( f0 − fe )
• 3.确定自由度 3.确定自由度 • df=(R-1)(C-1) • 4.选择检验方法 4.选择检验方法
χ2 =
∑
( f0 −
fe
fe )
2
简便计算公式为：
χ2
f 02i ∑ = N − 1 f xi f yi
5.结果与解释 5.结果与解释
通过比较两个卡方值的大小作出决断 χ2值与值的对应关系，通过查附表 χ2α,υ界值表值与P值的对应关系通过查附表12 值的对应关系，得到，详见教材得到，详见教材474页。页
fe
2
三、二项分类的配合度检验与比率显著性检验的一致性
假设p = q, x = f 0 , µ = f e , 当np > 5时，比率显著性检验的公式为： p − pe x−µ f0 − fe Z= = = p0 q0 np0 q0 1 fe • 2 n 而χ 2 = Z 2 = ∑ x−µ =∑ σ
第十二章χ2检验
• 掌握 • 卡方检验的基本公式 • 理论次数的计算技巧
本章考研知识点（2011）
• • 1．拟合度检验 2．独立性检验
• • • • •
第一节χ 第一节χ2检验概述第二节配合度检验第三节独立性检验第四节同质性检验与数据合并第五节相关源分析
第一节χ 第一节χ2检验概述
方法一
• 根据概率计算的方法和乘法定理可以算出a、 b、c、d四格的理论次数理论次数 • fa=(a+b)(a+c)/N fb=(a+b)(b+d)/N • fc=(a+c)(c+d)/N fd=(c+d)(b+d)/N • 确定自由度df＝（2-1）*（2-1）＝1，因为计算理论次数涉及总数总数
六、应用χ2检验应注意抽样设计应用χ
统计分析在依据样本的信息对总体进行推论时，统计分析在依据样本的信息对总体进行推论时，样本的代表性和对最根本的一个环节是确保样本的代表性和对实验的最根本的一个环节是确保样本的代表性和对实验的良好的控制。良好的控制 • 在心理与教育研究中，所收集到的数据有些是属于定性的。获得这些数据的方式是通过调查访问和问定性卷，所收集到的数据仅仅是回顾性研究，多数情况下难于对被试进行控制。又由于各种限制可能会遇到有严重缺陷的样本，所以一定要注意取样的代表性尽量避免出现有偏样本，在进行统计推论时要特别小心。 •
• 关于本书（P306）例题的说明说明
• （1）为了计算理论次数必须根据正态曲线下某一组别所占的概率，然后用概率乘以总数（P×N）才能求得各组的理论次数。 • （2）计算步骤是：确定组上限，计算离差，利用公式（Z＝X-X/S）求出标准分数，根据标准分数求概率，用概率乘以总数得理论次数。 • （3）自由度df＝11－3（是因为求理论次数时用到了总数、标准差和平均数这三个约束条件）
计算得到的查表得到的
χ ≥ χα ,υ
2
2
;P ≤α ;P >α
χ < χα ,υ
2
2
三、四格表（2×2列联表）的独立性检验四格表（列联表）
因素B B1
因素 B
边缘小计
A1 a A2 c a+c
B2 b d
a+b c+d
边缘小计
b+d N=a+b+c+d
• (一)独立样本的四格表的χ2检验 • 1.有三种计算方法（例题10-10P316）
三、χ2检验的类型 χ
• 配合度检验配合度检验：检验一个因素一个因素多项分类的实际观一个因素察数与某理论次数是否一致的问题。当对连续数据的正态检验时，亦称正态吻合性检验 • 独立性检验独立性检验：检验两个或两个以上因素两个以上因素的多项两个以上因素分类之间是否有关联是否具有独立性是否有关联是否具有独立性是否有关联或是否具有独立性的问题。 • 同质性检验同质性检验：检验不同的总体不同的总体在某一变量上的不同的总体反应是否有差异。无差异则表明两总体同质；有差异则表明两总体异质。
χ =∑
2
k
( f0 − fe )
fe
2
方法二
• 直接用实计数计算卡方值
N(ad−bc) χ = (a +b)(c + d)(a + c)(b + d)
2 2
• 方法三
Z=
ˆ ˆ p1 − p2 ˆ ˆ ˆ ˆ (n1 p1 + n2 p2 )(n1q1 + n2 q2 ) n1n2 (n1 + n2 )
二、 χ2检验的基本公式
χ =∑
2 k
( f0 − fe )
fe
2
• 即实计次数与理论次数的差的平方和除以理论次数是与χ2分布非常近似的次数分布。 χ • 式中k为组数，f0为实际观察数（实计数），fe为理论次数。 • 该公式是根据皮尔逊的配合度的理论公式推导而来，该分布属于近似卡方分布，近似程度随自由度而变化。
• （3）理论次数的计算：根据概率和经验计算 • （4）计算χ2值
• （5）作出推断
χ =∑
2
k
( f0 − f e )
fe
2
• 注意： χ2检验的概率是双侧概率，当计算的χ2> 注意： χ2.05或χ2.01时拒绝0假设。
二、配合度检验的应用
• 1.与常规有无差异的配合度检验与常规有无差异的配合度检验
五、期望次数的计算
• 期望次数期望次数：无差假设成立时的数值或者使某一理论假设成立时的数值。
• 如：男女的性别比的期望值为：1：1； • 调查时的同意与不同意的期望值为：1：1； • 调查时的同意与不同意与不置可否的期望值为： 1：1：1； • 正态分布的期望值与正态分布的概率相同。
• • • • • • •
p = b (x , p 0 , n n 为总的个案数 x 为较少的个案数 p 0 为无差比率
)
• 2.Yates校正公式（计算简单） 2.Yates校正公式计算简单）校正公式（
χ =∑
2
(f
0
− f e − 1 / 2) fe
2
• 根据卡方值和自由度查表求概率
第三节独立性检验
• 一、概念 • 独立性检验主要是检验指两个或两个以上因独立性检验两个或两个以上因计数资料是独立还是相关的问素多项分类的计数素多项分类计数题。 • 其零假设其零假设为：两项或多项分类是独立无关的（分类无显著性差异） • 研究假设研究假设为：两项或多项分类是有关联的（分类存在显著性差异） • 独立性检验一般的数据资料采用2*2或2*k，及R*C的表格形式呈现。
改变了或不一致的实计数
2
( f 0 − f e )2
1 fe • 2
= 2•∑
( f 0 − f e )2
fe
若p ≠ q, 则χ 2 = ∑
( f0 − fe )
fe
2
四、 χ2的连续性校正

e商务文档

第十二章卡方检验

相关文档推荐：