当前位置:文档之家› 统计学原理在遗传学中的应用

统计学原理在遗传学中的应用

1.5 统计学原理在遗传学中的应用
1.5.1 概率的概念
概率(probability)又称几率(chance):是指某事件未
发生前人们对该事件出现的可能性进行的一种估计。
P(A)=lim(nA/n)
频率:指某一事件已发生的情况。如人口出生率 的统计,升学率的统计等等。但某事件以往发生的 频率也可以作为对未来事件发生的可能性的估计。
2

0.10
2.71 4.61 6.25 7.78 9.24 15.99
差异显著 性标准
差异极显 著性标准
0.95 0.50
0.15 1.39 2.37 3.36 4.35 9.34
0.05
3.84
5.99 7.82 9.49 11.07
0.02
5.41
7.82 9.84 11.67 13.39
0.01
1/16 YYRR 2/16 YYRr 1/16 YYrr
2/16 YyRR 4/16 YyRr 2/16 Yyrr 1/16 yyRR 2/16 yyRr 1/16 yyrr
2/4
Yy
¼ yy
表型及其比例分枝图
Yy×Yy
¾ 黄色
Rr×Rr
¾ 圆形
后代表型及其比例
9/16 黄圆 3/16 黄皱 3/16 绿圆 1/16 绿皱
2

0.10
2.71 4.61 6.25 7.78 9.24 15.99
差异显著 性标准
差异极显 著性标准
0.95 0.50
0.15 1.39 2.37 3.36 4.35 9.34
0.05
3.84
5.99 7.82 9.49 11.07
0.02
5.41
7.82 9.84 11.67 13.39
0.01
第一个孩子 正常 正常 患儿 患儿 第二个孩子 正常 患儿 正常 患儿 概率 3/4 ×1/4=3/16 1/4 ×3/4=3/16 分布
3/4 ×3/4=9/16 P(pp)=9/16
2P(pq)=6/16
1/4 ×1/4=1/16 P(qq)=1/16
二项式公式的应用:
(p+q)n=pn+npn-1q+ n(n-1) n(n-1)(n-2) n Pn-2q2+ Pn-3q3+ ……+q 2! 3! P:某一事件出现的概率 q:另一事件出现的概率 n:估测其出现概率的事件数 P+q=1
1.5.5 2测验(chi-square method) 2 =(O-E)2/E
O:实际观测值 E:理论值
2:观测值偏离理论值的一个估值
统计的标准
P> 0.05,结果与理论数无显著差异,实得值符合 理论值;
P< 0.05,结果与理论数有显著差异,实得值不符 合理论值;
P< 0.01,结果与理论数有极显著差异,实得值非 常不符合理论值。
3)计算单项概率
若我们研究的不是其全部,而是某一项的概率,则 可用如下通式:
n!
r!(n-r)!
prqn-r
r:某事件(基因型或表现型)出现的次数 n-r:另一事件(基因型或表现型)出现的次数
例:白化基因携带者结婚生育的4个孩子中白化的频率分布 p为正常表型的概率=3/4,q为白化的概率=1/4,n为孩 子总数=4,(n—r)则为患儿数。
¼ 皱缩 ¾ 圆形
¼ 绿色 ¼ 皱缩
3) 多对基因杂交概率的计算
五对基因的杂交组合AABbccDDEe ×AaBbCCddEe,求 后代中基因型为AABBCcDdee和表型为ABCDe的概率。 P AA×Aa Bb×Bb cc×CC DD×dd Ee×Ee BB Cc Dd ee
基因型 AA
概率P= 1/2 ×
n!
r!(n-r)!
Prqn-r
实例应用:

例3:AaCc与aaCc杂交,产生五个后代, 其中三个A-C-, 两个aacc的概率是多少? 已知: n=5 r=3 n-r=2 P=? q=?
Prqn-r r!(n-r)!
n!
AaCc × aaCc
3/4C1/2A-
3/8A-C-
1/4cc
3/4C1/2aa 1/4cc 1/8aac 15.09
3
4 5 10
18.31
21.16
23.21
自由度:在各项预期值决定后,实得数中能自由变动的项数。 df= n-1(分离组数-1)
2P(pq)=2/4
P(qq)=1/4
(p+q)2=p2+2pq+q2=1/4+1/2+1/4,分布是对称的。若研 究n个子女的家庭,则为:(p+q)n 分布也是对称的。
2)不对称分布
若一对性状各自发生的概率pq,则二项式分布不对称。 如隐性遗传病半乳糖血症,两个携带者婚配,只生两个子 女,表型正常和患病的分布是:
举例1:
P ♀圆 × 皱♂
F1


F2 圆 (5474株) 2.96 : 皱 (1850株) 1
约为3:1
第一步:计算2 值
O1=5474 O2=1850 E1=(5474+1850) ×3/4= E2=(5474+1850) ×1/4= 2 =(O-E)2/E =(O1- E1)2/ E1+(O2- E2)2/ E2=2.6
表型 A
1/4 × 1
B C
×
1 × 1/4=1/32
D e
概率P= 1 ×
3/4 × 1
×
1 × 1/4=3/16
1.5.4 二项分布和二项展开法
1)对称分布 即一对性状各自发生的概率p和q相等。
以两个孩子的家庭为例,性别分布可有以下几种情况。
第一个孩子 男 男 女 女 第二个孩子 男 女 男 女 概率 1/2 ×1/2=1/4 1/2 ×1/2=1/4 1/2 ×1/2=1/4 1/2 ×1/2=1/4 分布 P(pp)=1/4
1.5.2 概率原理
1) 乘法定律(Sum Rule)
独立事件A和B同时发生的概率等于各个事件发生 概率之乘积。
P (A· =P (A) ×P (B) B) 2) 加法定律(Product Rule) 两个互斥事件同时发生的概率是各个事件各自发 生的概率之和。 P (A或B)=P (A) +P (B)
6.64
9.21 11.35 13.28 15.09
3
4 5 10
18.31
21.16
23.21
自由度:在各项预期值决定后,实得数中能自由变动的项数。 df= n-1(分离组数-1)
举例2:
如番茄紫茎缺刻叶(AACC)和绿茎马铃薯叶(aacc)杂交后产 生的F2代出现如下分离,其是否符合9:3:3:1的理论值?

第二步:根据自由度查表并判断
当df=1时,p=0.05, 20.05=3.84 (df=3时,p=0.05, 20.05=7.82)
2﹤ 20.05 2﹥ 20.05
观测值与理论值差异不显著 (符合理论比例)
观测值与理论值差异显著 (不符合理论比例)
x
P 0.99 df
1 2
0.0201 0.115 0.297 0.554 2.558 0.00016 0.0039 0.103 0.352 0.711 1.145 3.940
实例应用:

例1:在两对基因杂种YyRr的F2群体中, 试问三显性和一隐性基因个体出现的概 率是多少? 已知: n=4 r=3 n-r=1 p=1/2 q=1/2
n!
r!(n-r)!
Prqn-r
实例应用:

例2:在三对基因杂种YyRrCc的F2群体中, 试问两显性性状和一隐性性状个体出现 的概率是多少? 已知: n=3 r=2 n-r=1 p=3/4 q=1/4
1.5.3 概率的计算和应用
1) 棋盘法(punnet square)


1/4YR
1/4Yr
1/4yR 1/16YyRR
1/4yr 1/16YyRr
YR 1/4 yR 1/4 Yr 1/4 yr 1/4
1/16YYRR 1/16YYRr
1/16YyRR 1/16YYRr 1/16YyRr
1/16YyRr
1/16yyRR 1/16YyRr 1/16yyRr
1/16yyRr 1/16Yyrr 1/16yyrr
1/16YYrr
1/16Yyrr
2) 分枝法(branching process)
Yy×Yy ¼YY Rr×Rr ¼ RR 2/4 Rr ¼ rr ¼ RR 2/4 Rr ¼ rr ¼ RR 2/4 Rr ¼ rr 后代基因型及其比例
紫、缺 247 紫、马 90 绿、缺 83 绿、马 34 总计 454
O E
(O-E)2
255.4
0.28
85.1
0.28
85.1
0.05
28.4
1.10
454
E
1.71
df =4-1=3查2表知p>0.05,统计学上认为在5% 显著水准上差异不显著。
x
P 0.99 df
1 2
0.0201 0.115 0.297 0.554 2.558 0.00016 0.0039 0.103 0.352 0.711 1.145 3.940
正常
4 3 2 1 0
白化
0 1 2 3 4
n ! prqn-r r ! (n-r) !
P
81/256 108/256 54/256 12/256 1/256
1×(3/4)4×(1/4)0 4×(3/4)3×(1/4)1 6×(3/4)2×(1/4)2 4×(3/4)1×(1/4)3 1×(3/4)0×(1/4)4
相关主题