统计学-卡方检验
总数
289
289
0
1.2560
H0:大豆花色 2分离符合 大豆花色F 分离符合3∶1比率;HA:不符合 比率; 不符合3∶1比率。 比率。 比率 比率 显著水平
α 。由于该资料只有 ν =0.05。由于该资料只有k=组, = k − 1 = 1 , ,
值时需作连续性矫正。 故在计算 χ 2 值时需作连续性矫正。
上述计算的χ2统计量只是近似地服从连续型随 机变量χ2分布。在对次数资料进行χ2检验利用 连续型随机变量χ2分布计算概率时,常常偏低,
特别是当自由度为1时偏差较大,需要作连续 性矫正。 Yates(1934)提出了一个矫正公式,矫正后的 2 χ2值记为 χc :
( O − E − 0.5) χ =∑ E
ν =k-1
χ2统计量是度量实际观察频数与理论频数偏离程度的 一个统计量, χ2越小,表明实际观察频数与理论频数 越接近; χ2 =0,表示两者完全吻合; χ2越大,表示
两者相差越大。 对于本例,可算得
(O − E)2 χ =∑ E 74.062 (−63.31)2 (−49.31 2 39.562 ) = + + + = 92.696 417.94 139.31 139.31 46.44 ν = 4 −1 = 3
(|O − E| − 1/ 2) 2 2 可得: 由 χC = ∑ 可得: E (|-8.75|-0.5) 2 (|8.75|-0.5) 2 2 χC = + = 0.3140 + 0.9420 = 1.2560 216.75 72.25
2 2 查附表, 查附表, χ 2 = 3.84 现 χ C = 1.2560 < χ 0.05,1 故应接受 。 0 .05, 1 H0,说明大豆花色这对性状是符合 说明大豆花色这对性状是符合3∶1比率,即符合一对等 比率, 比率
首先, 首先,按9∶3∶3∶1的理论比率算得各种表现型的理 的理论比率算得各种表现型的理 论次数E, 论次数 , 如稃尖有色非糯稻 E=743×(9/16)=417.94, , 稃尖有色糯稻 E=743×(3/16)=139.31,…。 。
H0:稃尖和糯性性状在 2的分离符合 稃尖和糯性性状在F 的分离符合9∶3∶3∶1; ; HA:不符合9∶3∶3∶1。 不符合 。 显著水平: 显著水平: =0.05。 。 α 然后计算 χ 2值
[例4] 表4为不同灌溉方式下水稻叶片衰老情况的调查 例 为不同灌溉方式下水稻叶片衰老情况的调查 资料。试测验稻叶衰老情况是否与灌溉方式有关。 资料。试测验稻叶衰老情况是否与灌溉方式有关。
表4 水稻在不同灌溉方式下叶片的衰老情况
灌溉方式 深 水 浅 水 湿 润 总 计 绿叶数 146 (140.69) 183 (180.26) 152 (160.04) 481 黄叶数 7 (8.78) 8 (11.24) 14 (9.98) 30 枯叶数 7 (10.53) 13 (13.49) 16 (11.98) 36 总 计 160 205 182 547
位基因的表型分离比例。 位基因的表型分离比例。
[例2]
两对等位基因遗传试验,如基因为独立分配, 两对等位基因遗传试验,如基因为独立分配,
代的四种表现型在理论上应有9∶3∶3∶1的比率。有 的比率。 则F2代的四种表现型在理论上应有 的比率 一水稻遗传试验, 一水稻遗传试验,以稃尖有色非糯品种与稃尖无色糯性品 种杂交, 代得表2结果。 种杂交,其F2代得表2结果。试检查实际结果是否符合 9∶3∶3∶1的理论比率。 的理论比率。 的理论比率
0.05的临界值 α=0.05的临界值 7.81 12.59
6
9 12 卡方值
15
18
单侧临界值
2 χ 2 分布曲线图下,χ α ,ν 右方 在自由度为 ν 的 2 χ α ,ν 为自由度为 ν 的 χ 2 的面积为 α ,则称
分布概率为 α 的单侧临界值。可查表。
α
0
χ2
χα ,ν
2
χ2统计量的连续性矫正
H0:稻叶衰老情况与灌溉方式无关;HA:稻叶衰老情 稻叶衰老情况与灌溉方式无关; 况与灌溉方式有关。 况与灌溉方式有关。 取 。 α =0.05。
根据H 的假定,计算各组格观察次数的相应理论次数: 根据 0的假定,计算各组格观察次数的相应理论次数: 如与146相应的 相应的E=(481×160)/547=140.69, 如与 相应的 , 与183相应的 相应的E=(481×205)/547=180.26,……, 相应的 , , 所得结果填于表4括号内。 所得结果填于表 括号内。 括号内
2 现 χ 2 = 5.62 < χ 0 .05,4 ,P>0.05,故应接受 0,即不同灌 ,故应接受H
溉方式对水稻叶片的衰老情况没有显著影响。 溉方式对水稻叶片的衰老情况没有显著影响。
73.06 2 (−63.31) 2 (−49.31) 2 39.562 χ2 = + + + = 92.696 417.94 139.31 139.31 46.44
因本例共有k=4组,故 ν =k-1=3。查附表, 组 因本例共有 。查附表,
2 所以否定 否定H χ 0.05,3 = 7.815,现实得 χ 2 = 92.696 > χ 02.05,3 ,所以否定 0,
假设H 两变数相互独立, 假设 0:两变数相互独立,即种子灭菌与否和散黑穗病 病穗多少无关; 两变数彼此相关。 病穗多少无关;HA:两变数彼此相关。 显著水平 α=0.05。 。 根据两变数相互独立的假定,算得各组格的理论次数。 根据两变数相互独立的假定,算得各组格的理论次数。 如种子灭菌项的发病穗数O 如种子灭菌项的发病穗数 1=26,其理论次数 , E1=(210×76)/460=34.7,即该组格的横行总和乘以纵行总和 , 再除以观察总次数(下同) 再除以观察总次数(下同);同样可算得 O2=50 的 E2=(250×76)/460=41.3; ; O3=184的E3=(210×384)/460=175.3; 的 ; O4=200的E4=(250×384)/460=208.7。 的 。 以上各个E值填于表3括号内。 以上各个 值填于表3括号内。 值填于表
表2 F2代表型的观察次数和根据9∶3∶3∶1算出的理论次数
表现型 观察次数(O) 理论次数(E) O-E 稃尖有色非 糯 491 417.94 73.06 稃尖有色 糯稻 76 139.31 -63.31 稃尖无色非 糯 90 139.31 -49.31 稃尖无色糯 稻 86 46.44 39.56 总数 743 743 0
接受HA,即该水稻稃尖和糯性性状在 2的实际结果不符 即该水稻稃尖和糯性性状在F 接受 的理论比率。 合9∶3∶3∶1的理论比率。 的理论比率 这一情况表明,该两对等位基因并非独立遗传, 这一情况表明,该两对等位基因并非独立遗传, 而可能为连锁遗传。 而可能为连锁遗传。
Section 6.3 Independence Test 独立性检验
(|O − E| − 1/ 2) 2 以上各个E值代入 2 以上各个 值代入 χ C = .5) 2 (|50 − 41.3| − 0.5) 2 2 χC = + 34.7 41.3 (|184 − 175.3| − 0.5) 2 (|200 − 208.7| − 0.5) 2 + + = 4.267 175.3 208.7
2
χ2分布
上述计算的χ2统计量近似地服从统计学中一种 连续型随机变量的概率分布χ2分布
分布(chidistribution) χ2分布(chi-square distribution)
0.5 0.4 0.3 0.2 0.1 0.0 0 3
3.84
纵 高
自由度=1 自由度=2 自由度=3 自由度=6
2 c
2
Section 6.2 Fit Test 适合性检验
[例1] 大豆花色一对等位基因的遗传研究,在F2获得表 例 大豆花色一对等位基因的遗传研究, 获得表1 所列分离株数。问这一资料的实际观察比例是否符合于3∶1 所列分离株数。问这一资料的实际观察比例是否符合于 的理论比值。 的理论比值。
[例3] 调查经过种子灭菌处理与未经种子灭菌处理的 小麦发生散黑穗病的穗数,得相依表3 小麦发生散黑穗病的穗数,得相依表3,试分析种子灭菌 与否和散黑穗病穗多少是否有关。 与否和散黑穗病穗多少是否有关。
表3 防治小麦散黑穗病的观察结果
处 理 项 目 种子灭菌 种子未灭菌 总 数 发 病 穗 数 26( 34.7) 184(175.3) 210 未发病穗数 50( 41.3) 200(208.7) 250 总 76 384 460 数
稃尖有 稃尖有 稃尖无 稃尖无 色非糯 色糯稻 色非糯 色糯稻 观察频数(O) 491 76 90 86 理论频数(E) 417.94 139.31 139.31 46.44 O-E 73.06 -63.31 -49.31 39.56 表现型 总数 743 743 0
χ2统计量
(O − E)2 χ2 = ∑ E
第6章 χ2检验
2 Test χ
Section 6.1
2 χ
Statistic and Distribution 2统计量与χ2分布 χ
2 χ
一个例子
有一水稻遗传试验,以稃尖有色非糯品种与稃 尖无色糯性品种杂交,其F2代如下表。试检查 实际结果是否符合9:3:3:1的理论比率。 F2代表型的观察频数和根据9:3:3:1 算出的理论频数
(O − E ) 2 根据 χ 2 = ∑ 可得 i E (146 − 140.69) 2 (7 − 8.78) 2 (16 − 11.98) 2 χ2 = + +L+ = 5.62 140.69 8.78 11.98
χ2 本例 ν =(3-1)(3-1)=4,查附表 , 0 .05,4 = 9.49 , ,