当前位置:文档之家› 9第七章次数资料分析—X2检验

9第七章次数资料分析—X2检验


å
(2)当df 勾1时(R C列联表)用一般公式计算X 2值: x2 =
å
( A - T )2 T
(3) 进行X2检验,根据df=(c-1)(r-1), 查临界 2值: 20.05、 20.01 值;
将所计算得的 2或 进行比较,得出结论。
2
c值与临界值
A 若2 (或2c)<20.05,P>0.05, 表明实际观察次数与理论次数差异不显著,可 以认为两个因子相互独立; B 若20.05≤2 (或2c)<20.01,0.01<P≤0.05, 表明实际观察次数与理论次数差异显著,可以 认为两个因子之间是显著相关的. C 若2 ( 或2c)≥20.01,P≤0.01, 表明实际观察次数与理论次数差异极显著 ,可 以认为两个因子之间是极显著相关的.
三、独立性检验的方法
(一)2×2列联表的独立性检验 2×2列联表的一般形式p167;
自由度df=(c-1)(r-1)=(2-1)(2-1)=1, 在进行2检验时,需作连续性矫正,应计

2 c
值。
表7—10 2×2列联表的一般形式
其中Aij为实际观察次数,Tij为理论次数。
【例7.7】 某猪场用80头猪检验某种疫苗是否有预防
与连续型随机变量 2分布相近似 ,这时, 可不作连续性矫正 ,但要求各组内的理论
次数不小于5。若某组的理论次数小于5,
则应把它与其相邻的一组或几组合并,直
到理论次数大于5为止。
c
2
=
å
( A- T ) T
2
x
2 c
=
å
( A - T - 0.5) T
2

X2检验:是次数资料显著性检验的方法, 它通过提出某种假设,用理论次数(T) 与观察次数(A)进行比较,从而确定 两者符合程度。
2 c
表7—2 2c计算表
2 cC = S
(| A - T | - 0.5) 2 (| 79 - 65 | - 0.5) 2 65
=
T (|181- 195 | - 0.5) 2 195
+
= 3.739
(五)查临界2值,作出统计推断
当自由度 df=1 时, 查 得 , 20.05(1) =3.84
一、独立性检验的概述
1、定义:是次数资料相关性的研究。 通过比较理论次数(T)和观察次数 (A),研究两类试验因子之间是相 互独立的还是有影响的。 2、H0:两类因子是相互独立的
3、观察数据(A)的给出用以因子划分 的两向列联表给出(p167) 根据两因子属性类别数的不同而构成 2×2、2×c、r×c列联表(r为行因子 的属性类别数, c 为列因子的属性类 别数)。
物的治愈头数和未治愈头数。
(1)分析药物种类与疗效是否相关,若两者 彼此相关,表明疗效因药物不同而异,即两种 药物疗效不相同;
(2)若两者相互独立,表明两种药物疗效相
同。
这种根据次数资料判断两类因子彼此相关或相
互独立的假设检验就是独立性检验。独立性检 验实际上是基于次数资料对因子间相关性的研 究。
二 适合性检验的步骤
T=总观察次数×类别比例
(1)当df = 1时,用校正公式计算X 2值: X 2c =
å
( A - T - 0.5) 2 T
(2)当df ¹ 1时,用一般公式计算X 2值: X2 =
å
( A - T )2 T
(3) 进行X2检验,根据df=k-1,查临界 2值: 20.05、 20.01 值;
表7-1 羔羊性别实际观察次数与理论次数
问题:
实际观察次数与理论次数存在一定的差异,
这里公、母各相差10只。这个差异是属于抽样
误差?还是羔羊性别比例发生了实质性的变化?
要回答这个问题,首先需要确定一个统计量
用以表示实际观察次数与理论次数偏离的程度;
然后判断这一偏离程度是否属于抽样误差,
即进行显著性检验。
2
+
10
2
438
= 0.4566
表明实际观察次数与理论次数是比较接近的。
回顾:2 (chi-square)分布

定义(P156)

设有n个随机变量X1, X2, , Xn,彼此独立且 都服从标准正态分布 N(0, 1),则称随机变量
Y=
å
2
X
2 i
服从自由度为n 的 2 分布,记为
Y ~ (n)
T =0.5444+1.6333+1.6333+0.9 =4.711
X =
2
å
( A- T )
2
(五)查临界2值,作出统计推断 当df=3时,20.05(3)=7.81,因 2<2005(3) ,
P>0.05,不能否定H0 ,
表明实际观察次数与理论次数差异不显著,
可以认为毛色与角的有无两对性状杂 交 二 代
的 分 离 现 象 符 合 孟 德 尔遗传规律中
9∶3∶3∶1的遗传比例。
第三节 独立性检验
一、独立性检验的概述
对次数资料,除进行适合性检验外,有时需 要分析两类因子是相互独立还是彼此相关。 如研究两类药物对家畜某种疾病治疗效果的 好坏,先将病畜分为两组,一组用第一种药物治
疗,另一组用第二种药物治疗,然后统计每种药
计算的2c<20.05(1),P>0.05,不能否定H0; 表明实际观察次数与理论次数差异不显著,可
以认为白色羊与黑色羊的比率符合孟德尔遗传分
离定律3∶1的理论比例。
【例7.2】 在研究牛的毛色和角的有无两对相对性状
分离现象时 ,用黑色无角牛和红色有角牛杂交 ,子二 代出现黑色无角牛192头,黑色有角牛78头,红色无角牛
二独立性检验检验的步骤
(1)提出假设
H0:两类因子之间是相互独立的 HA:两类因子之间是有关联的 (2)在H0成立的条件下,计算理论次数T和X2值
理论次数 =
横行总和´ 纵列总和 总观察次数
=
Zr ´ Zc T
二 独立性检验的步骤
T=总观察次数×类别比例
(1)当df = 1时(2 2列联表)用校正公式计算X 2值: x 2c = ( A - T - 0.5) 2 T
1 2≥0 , 即 2 的 取 值 范 围 是[0,+∞;
2 2分布密度曲线是随自由度不同而改变的一组曲线。
随自由度的增大, 曲线由偏斜渐趋于对称;
3 df≥30时, 2c 2接 近 平均数为
布。
2df - 1 的正态分
不同自由度的 2概率分布密度曲线:
2 分布曲线
三、连续性矫正
效果。结果是注射疫苗的44头中有 12 头发病,32头未
发病;未注射的36头中有22头发病,14头未发病,问 该疫苗是否有预防效果? 1、 先将资料整理成列联表
表7—11 2×2列联表
2、 提出无效假设与备择假设 H0:发病与否和注射疫苗无关,即二因子相 互独立。 HA:发病与否和注射疫苗有关,即二因子彼 此相关。 3、 计算理论次数 根据二因子相互独立的假设,由样本数据计 算出各个理论次数。 二因子相互独立,就是说注射疫苗与否不影 响发病率。也就是说注射组与未注射组的理论 发病率应当相同,均应等于总发病率 34/80=0.425=42.5%。依此计算出各个理论次数 如下:
二 适合性检验的步骤
【例7.1】 在进行山羊群体遗传检测时,观 察了 260只白色羊与黑色羊杂交的子二代毛色, 其中181只为白色,79只为黑色,问此毛色的比 率是否符合孟德尔遗传分离定律的3∶1比例?
检验步骤如下:
(一)提出无效假设与备择假设
H0:子二代分离现象符合3∶1的理论比例。
HA:子二代分离现象不符合3∶1的理论比例。
计算的 2只是近似地服从连续型随机变量2 分布。在对次数资料进行 2检验利用连续型随 机变量 2分布计算概率时,常常偏低,特别是 当自由度为1时偏差较大。 Yates(1934)提出了一个矫正公式,矫正后的
2值记为:
x
2 c
=
å
( A - T - 0.5) T
2
(7-4)
当自由度大于1时,(7-1)式的 2分布
(二)选择计算公式 由于本例是涉及到两组毛色(白色与黑色),属 性类别分类数k=2,自由度df=k-1=2-1=1,须使用
2 (7—4)式来计算 c
(三)计算理论次数
根据理论比率3∶1求理论次数: 白色理论次数:T1=260×3/4=195
黑色理论次数:T2=260×1/4=65
或 T2=260-T1=260-195=65 (四)计算
第二节 适合性检验
4、数据(A)的给出形式:从单向分出不 同的质性类别及给出相应的观察次数。 5、进行X2检验:df=k-1,k为质性类别数; 6、应用: (1)检验或验证遗传规律:1:1、3:1、 9:3:3:1 (2)资料分布类型的适合性检验(p162)
第二节 适合性检验
二 适合性检验的步骤 (1)提出假设 H0:观察次数(A)与理论次数(T)相 符某性状比例符合某理论比例,A—T之间 的差异是误差造成的。 HA:A—T不相符 (2)据已知的理论比例计算出理论次数,进 一步计算X2值
Biostatistics and Experimental Design
畜牧、兽医专业
生物统计 附 试验设计
第七章 次数资料分析 2检验 ——
本章将分别介绍对次数资料、等级
资料进行统计分析的方法。
第一节 2统计量与 2分布
一、
2
统计量的意义
根据遗传学理论,动物的性别比例是1:1。 统计某羊场一年所产的876只羔羊中,有公 羔428只,母羔448只。按1:1的性别比例计算, 公、母羔均应为438只。 以A表示实际观察次数,T 表示理论次数, 可将上述情况列成表7-1。
相关主题