当前位置:文档之家› 生物统计学教案(7)

生物统计学教案(7)

生物统计学教案
第七章拟合优度检验
教学时间:2学时
教学方法:课堂板书讲授
教学目的:重点掌握二项分布的检验、正态性的检验,掌握独立性检验,了解X2的可加性。

讲授难点:正态性的检验、二项分布的检验
7.1 拟合优度检验的一般原理
7.1.1 什么是拟合优度检验
用来检验实际观测数与依照某种假设或模型计算出来的理论数之间的一致性的方法。

可分为两种类型:
(1)拟合优度检验:检验观测数与理论数之间的一致性。

(2)独立性检验:通过检验实际观测数与理论数之间的一致性来判断事件之间的独立性。

7.1.2 拟合优度检验的统计量
例黄圆豌豆与绿皱豌豆杂交,第二代分离数目如下:
黄圆黄皱绿圆绿皱总计
实测数(O i) 315(O1) 101(O2)108(O3) 32(O4) 556
理论数(T i) 312.75(T1) 104.25(T2) 104.25(T3) 34.75(T4) 556
拟合优度的一般做法是:
(1)将观测值分为k种不同类别,如四种类型豌豆。

(2)共获得n个独立观测值,第i类观测值的数目为O i。

如O1-O4,他们的和等于n。

(3)第i类的概率为p i,如上述四类豌豆的概率分别为9/16、3/16、3/16、1/16,概率之和等于1。

(4)第i类的理论数T i = np i, k个理论数之和等于n。

如上例中的T1-T4,它们的和等于n。

(5)O i与T i不符合程度的计算:
①求k个O i-T i之和,显然它们恒等于0。

②求k个(O i-T i)2之和,得不出相对的不符合程度。

O i=9、T i=6,O i-T i=3;O i=49、T i=46,O i-T i=3。

前者的不符合程度远大于后者。

③求k个[(O i-T i)/T i]2之和,但仍有问题。

如:O i=8、T i=5以及O i=80、T i=50时O i -T i/T i都等于0.6。

④ 为了解决上述问题,以T i 为权求加权值。

由上式所定义的统计量也称为χ2。

近似服从χ2分布,可由χ2分布表中查出临界值。

⑤ 条件:当理论数小于5和df =1时,上式与χ2分布偏离较大,因此:1) 当理论数小于5时,应与相邻项合并直到5。

2)当df =1时应做连续型矫正,矫正方法如下:
⑥χ2的自由度为:df =k -1-a
当理论数已经给定或计算理论数时所用的参数已知时a =0。

若总体参数没有给出,需由样本数据估计,这时a ≠ 0,a 为需由样本估计的参数的个数。

7.2 拟合优度检验
7.2.1 一般程序
1、对数据进行分组
2、根据总体参数计算理论数T i 。

这时df =k -1
3、由样本数据估计参数并理论数T i 。

这时df =k -1-a 。

a 为所估计参数的个数。

4、合并理论数小于5的各组,记合并后的组数为k 。

5、零假设是观测数与理论数符合,拟合优度χ2检验为非参数统计,零假设可形象地记为:H 0:O -T =0。

6、计算出χ2值,与临界值比较,当χ2>χα2时拒绝H 0。

7.2.2 参数φ已知时,二项分布的检验
例 检验上一节给出的例子。

理论数均大于5,df >1,φ已知,H 0:O -T = 0,α=0.05。

将数据代入公式。

从附表中查出χ23, 0.05=7.815,χ2<χ20.05。

结论是接受H 0,杂交结果符合9:3:3:1的分离比。

例 用正常翅的野生型果蝇与残翅果蝇杂交,F 1代均表现为正常翅。

F 1代自交,在F 2代中
()∑∑==-=⎪⎪⎭⎫ ⎝⎛-k i i i k i i i i i T T O T T O T 12
1()∑=--=k i i i i T T O 12
25.0χ()∑=-=k i i
i i T T O 122χ()()()()470.0218
.0135.0101.0016.075
.3475.343225.10425.10410825
.10425.10410175.31275.31231522222=+++=-+-+-+-=χ
包含311个正常翅,和81个残翅。

问这一分离比是否符合孟德尔3∶1的理论比?

正常翅残翅总数
实际观测数311 81 392
理论数294 98 392
O-T(未矫正)17 17
(O-T)2289 289
(O-T)2/T0.983 2.949
χ2 = 0.983+2.949 = 3.932
H0:O-T=0,α=0.05,df=1,χ20.05=3.841,χ2>χ20.05
结论:正常翅与残翅的分离比不符合3∶1
以上的计算是在df=1但未作矫正时所得结果,下面计算矫正后的χ2。


正常翅残翅
|O-T|-0.516.5 16.5
(|O-T|-0.5)2272.25 272.25
(|O-T|-0.5)2/T0.926 2.778
χ2 = 0.926+2.778 = 3.704
H0:O-T=0,α=0.05,df=1,χ20.05=3.841,χ2<χ20.05
结论:正常翅与残翅的分离比符合3∶1
从以上的结果可以看出,同一个问题矫正与不矫正所得结论不同。

因为矫正后的结果比矫正前的低,若未矫正已经接受了H0,可以不再矫正;若未矫正时拒绝H0,则一定要矫正。

7.3 独立性检验
7.3.1 列联表χ2检验
列联表χ2检验属独立性检验。

例下表给出不同给药方式与给药效果
给药方式有效(A)无效(A)总数有效率
口服(B) 58 40 98 59.2%
注射(B) 64 31 95 67.4%
总数122 71 193
列联表χ2检验的原理
现在要考虑的是给药方式与给药效果有无关联,如果有关联,即不同的给药方式产生不同的效果;反之,如果无关联,即不同的给药方式的治疗效果没有不同。

从另一个角度讲,我们要考虑的是不同的给药方式与给药效果之间是否相互独立,因此列联表χ2检验又称为独立性检验。

上表中没有理论数,需要由实测数推出。

计算理论数的前提是假设给药方式与给药效果并无关联。

在无关联的假设下,计算出理论数,然后比较实测数与理论数之间是否吻合。

如果吻合,说明不同给药方式与给药效果是无关联的,不同的给药方式并不影响治疗效果。

如果不吻合,说明不同的给药方式,其治疗效果不同。

列联表χ2检验的步骤
1、提出零假设:假设实测数与给药方式和给药效果并无关联的前提下所计算出的理论数之间无差异。

即H 0:O -T =0。

2、计算理论数:若事件A 和事件B 是相互独立的,则P (AB )=P (A )P (B )。

在给药方式和效果之间是相互独立的前提下,计算口服(事件B )有效(事件A )的概率P (BA )=P (B )P (A ) = (98/193) (122/193)。

其理论数T 1=(98/193)(122/193)(193) = (98)(122)/93 = 61.15。

以类似的方法可以计算出另外三个理论数。

3、计算χ2值:如同吻合度检验那样计算χ2值,若χ2<χ2α,则
则接受H 0;若χ2>χ2α,则拒绝H 0。

与吻合度检验一样,理论数不得小于5,当理论数小于5时应使用另外的方法。

4、确定自由度:因为每一行的各理论数受该行总数约束,每一列的各理论数受该列总数约束,所以自由度df =(r -1)(c -1)。

上例的计算结果如下:
有 效 无 效 总 数
口服 O 1=58 O 2=40 98
T 1=(98)(122)/193=61.95 T 2=(98)(71)/193=36.05
注射 O 3=64 O 4=31 95
T 3=(95)(122)/193=60.05 T 4=(95)(71)/193=34.95
总数 122 71 193
()()()()()95.3495.343105.6005.606405
.3605.364095.6195.615822224122-+-+-+-=-=∑=i i
i i T T O χ
结论:接受H 0,不同给药方式的治疗效果没有显著不同。

本例的df =1应当矫正,矫正后的χ2值更小,不会影响结论,可以不再矫正。

5、r ×c 列联表:上面的例子称为2×2列联表,对于行、列大于2的情况称为r ×c 列联表。

其理论数的计算与2×2列联表相同:T ij =(i 行总数)(j 列总数)/总数。

df =(r -1)(c -1)。

推断过程也类似,不再举例。

精品文档word 文档可以编辑!谢谢下载!
()()205.02205.00,
841.3,
11212,05.0,0:χχχα<==--===-df T O H。

相关主题