第十二章卡方检验
• 2.校正公式:当有一格的理论次数小于5且 n>40时。
χ =
2
N ( ad − bc − N / 2)
2
•
(a + b)(c + d )(a + c)(b + d )
(二)相关四格表的χ2检验 相关四格表的χ
• 1一般计算公式为: 一般计算公式为:
( A − D )2 χ2 =
A+ D A、D为前后两次实验或调查 中
N 理论次数: f e = k N 为总数, k 为分类数或组数
χ =∑
2
k
( f0 − fe )
fe
2
例题10-1(P302) 10-2 10-4
• 2.与正态分布有无差异的配合度检验 2.与正态分布有无差异的配合度检验
• (1)非连续变量的配合度检验 ) • 理论次数的计算步骤 理论次数的计算步骤: • 假设6个标准差包括了全体,每个等级所占的 标准差为:6σ÷k(k为等级数); • 依据各等级所占的标准差,查正态分布表,即 得各个等级所占的概率;(例题10-3P303)
四、χ2检验所隐含的假设 χ
• • • • 1.不同的分类应具有独立性; 不同的分类应具有独立性; 不同的分类应具有独立性 2.观测数据相互独立; 观测数据相互独立; 观测数据相互独立 3.期望次数应尽量大; 期望次数应尽量大; 期望次数应尽量大 有些认为应大于5,有些认为应大于10; 有些认为应大于 ,有些认为应大于 ; 当理论次数过小时,应尽量避免使用χ 当理论次数过小时,应尽量避免使用χ2 检验。 检验。
f e = p * N ( p 各等级所占的概率
)
(2)连续变量分布的假设检验
• 对于连续随机变量分布的假设检验,其 关键步骤是:计算理论次数 计算理论次数(fe)与确定 计算理论次数 自由度(df)。 自由பைடு நூலகம் • 计算理论次数 计算理论次数是根据所选理论分布函数, 按实际分布的统计量带入函数式计算各 分组区间的理论频率,然后乘以总数即 为各分组区间的理论次数。 • 确定自由度 确定自由度是将分组的数目减去计算理 论次数时所用统计量的数目。
fe = p × N
(1) − X
(1) (2) (3)
(1) − X
S
根据Z查正态分布表
(4)
(5)
(6)
(7)
(8)
?
• 3.比率或百分数的配合度检验(例题10-6P307) 3.比率或百分数的配合度检验
理论次数 ( 率 ): f e = k 为分类数或组数 100 k
χ =
2
∑
k
( f0 − fe )
• 3.确定自由度 3.确定自由度 • df=(R-1)(C-1) • 4.选择检验方法 4.选择检验方法
χ2 =
∑
( f0 −
fe
fe )
2
简便计算公式为:
χ2
f 02i ∑ = N − 1 f xi f yi
5.结果与解释 5.结果与解释
通过比较两个卡方值的大小作出决断 χ2值与 值的对应关系,通过查附表 χ2α,υ界值表 值与P值的对应关系 通过查附表12 值的对应关系, 得到,详见教材 得到,详见教材474页。 页
fe
2
三、二项分类的配合度检验与比 率显著性检验的一致性
假设p = q, x = f 0 , µ = f e , 当np > 5时,比率显著性检验的 公式为: p − pe x−µ f0 − fe Z= = = p0 q0 np0 q0 1 fe • 2 n 而χ 2 = Z 2 = ∑ x−µ =∑ σ
第十二 章χ2检验
• 掌握 • 卡方检验的基本公式 • 理论次数的计算技巧
本章考研知识点(2011)
• • 1.拟合度检验 2.独立性检验
• • • • •
第一节χ 第一节χ2检验概述 第二节 配合度检验 第三节独立性检验 第四节同质性检验与数据合并 第五节 相关源分析
第一节χ 第一节χ2检验概述
方法一
• 根据概率计算的方法和乘法定理可以算出a、 b、c、d四格的理论次数 理论次数 • fa=(a+b)(a+c)/N fb=(a+b)(b+d)/N • fc=(a+c)(c+d)/N fd=(c+d)(b+d)/N • 确定自由度df=(2-1)*(2-1)=1,因为 计算理论次数涉及总数 总数
六、应用χ2检验应注意抽样设计 应用χ
统计分析在依据样本的信息对总体进行推论时, 统计分析在依据样本的信息对总体进行推论时, 样本的代表性和对 最根本的一个环节是确保样本的代表性和对实验的 最根本的一个环节是确保样本的代表性和对实验的 良好的控制。 良好的控制 • 在心理与教育研究中,所收集到的数据有些是属于 定性的。获得这些数据的方式是通过调查访问和问 定性 卷,所收集到的数据仅仅是回顾性研究,多数情况 下难于对被试进行控制。又由于各种限制可能会遇 到有严重缺陷的样本,所以一定要注意取样的代表 性尽量避免出现有偏样本,在进行统计推论时要特 别小心。 •
• 关于本书(P306)例题的说明 说明
• (1)为了计算理论次数必须根据正态曲 线下某一组别所占的概率,然后用概率乘 以总数(P×N)才能求得各组的理论次数。 • (2)计算步骤是:确定组上限,计算离 差,利用公式(Z=X-X/S)求出标准分数, 根据标准分数求概率,用概率乘以总数得 理论次数。 • (3)自由度df=11-3(是因为求理论次 数时用到了总数、标准差和平均数这三个 约束条件)
计算得到的 查表得到的
χ ≥ χα ,υ
2
2
;P ≤α ;P >α
χ < χα ,υ
2
2
三、四格表(2×2列联表)的独立性检验 四格表( 列联表)
因素B B1
因 素 B
边缘小计
A1 a A2 c a+c
B2 b d
a+b c+d
边缘小计
b+d N=a+b+c+d
• (一)独立样本的四格表的χ2检验 • 1.有三种计算方法(例题10-10P316)
三、χ2检验的类型 χ
• 配合度检验 配合度检验:检验一个因素 一个因素多项分类的实际观 一个因素 察数与某理论次数是否一致的问题。当对连续 数据的正态检验时,亦称正态吻合性检验 • 独立性检验 独立性检验:检验两个或两个以上因素 两个以上因素的多项 两个以上因素 分类之间是否有关联 是否具有独立性 是否有关联 是否具有独立性 是否有关联或是否具有独立性的问题。 • 同质性检验 同质性检验:检验不同的总体 不同的总体在某一变量上的 不同的总体 反应是否有差异。无差异则表明两总体同质; 有差异则表明两总体异质。
χ =∑
2
k
( f0 − fe )
fe
2
方法二
• 直接用实计数计算卡方值
N(ad−bc) χ = (a +b)(c + d)(a + c)(b + d)
2 2
• 方法三
Z=
ˆ ˆ p1 − p2 ˆ ˆ ˆ ˆ (n1 p1 + n2 p2 )(n1q1 + n2 q2 ) n1n2 (n1 + n2 )
二、 χ2检验的基本公式
χ =∑
2 k
( f0 − fe )
fe
2
• 即实计次数与理论次数的差的平方和除以理论次数 是与χ2分布非常近似的次数分布。 χ • 式中k为组数,f0为实际观察数(实计数),fe为理 论次数。 • 该公式是根据皮尔逊的配合度的理论公式推导而来, 该分布属于近似卡方分布,近似程度随自由度而变 化。
• (3)理论次数的计算:根据概率和经验计算 • (4)计算χ2值
• (5)作出推断
χ =∑
2
k
( f0 − f e )
fe
2
• 注意: χ2检验的概率是双侧概率,当计算的χ2> 注意: χ2.05或χ2.01时拒绝0假设。
二、配合度检验的应用
• 1.与常规有无差异的配合度检验 与常规有无差异的配合度检验
五、期望次数的计算
• 期望次数 期望次数:无差假设成立时的数值或者 使某一理论假设成立时的数值。
• 如:男女的性别比的期望值为:1:1; • 调查时的同意与不同意的期望值为:1:1; • 调查时的同意与不同意与不置可否的期望值为: 1:1:1; • 正态分布的期望值与正态分布的概率相同。
• • • • • • •
p = b (x , p 0 , n n 为总的个案数 x 为较少的个案数 p 0 为无差比率
)
• 2.Yates校正公式(计算简单) 2.Yates校正公式 计算简单) 校正公式(
χ =∑
2
(f
0
− f e − 1 / 2) fe
2
• 根据卡方值和自由度查表求概率
第三节独立性检验
• 一、概念 • 独立性检验主要是检验指两个或两个以上因 独立性检验 两个或两个以上因 计数资料是独立还是相关的问 素多项分类的计数 素多项分类 计数 题。 • 其零假设 其零假设为:两项或多项分类是独立无关的 (分类无显著性差异) • 研究假设 研究假设为:两项或多项分类是有关联的 (分类存在显著性差异) • 独立性检验一般的数据资料采用2*2或2*k, 及R*C的表格形式呈现。
改变了或不一致的实计 数
2
( f 0 − f e )2
1 fe • 2
= 2•∑
( f 0 − f e )2
fe
若p ≠ q, 则χ 2 = ∑
( f0 − fe )
fe
2
四、 χ2的连续性校正