当前位置:文档之家› 基因组选择

基因组选择


标记辅助选择(MAS)
基因
表型数据
选择
(黑箱) 黑箱)
分子遗传学
遗传评估 基因信息
主效基因 /QTL
特点: 特点:利用表型和部分基因的信息进行遗传评估
基因辅助选择(GAS)
• 氟烷基因
y = Xg + e
连锁不平衡标记辅助选择(LD-MAS) 连锁不平衡标记辅助选择(LD-MAS)
MA-BLUP: 遗传评估技术 - MA-BLUP:
y = X β + Mg + Zu + e
y:表型信息 A:系谱信息 M: 标记信息 g:可作为固定和随机效应
标记辅助选择(MAS) 标记辅助选择(MAS)
• 应用现状 – 实际应用不多 – 应用效果不显著 – 主要原因: 主要原因:
• 已被证实具有显著效应的基因或标记有限
– (发现并证实一个有效的基因需要很长的时间和 很高的成本) 很高的成本)
– 可以捕获所有的遗传变异 – 无需表型信息即可进行遗传评估,极大地缩短 无需表型信息即可进行遗传评估, 世代间隔和育种成本
基因组选择
• 利用覆盖全基因组的高密度标记(SNP)进 行个体遗传评估
基因 黑箱) (黑箱)
标记信息
新的标 记(黑 箱)
估计基因组育种值
全基因组SNP芯片 全基因组SNP芯片 SNP
假设所有染色体片段具有相同的效应方差! 假设所有染色体片段具有相同的效应方差
ˆ W′X f W′y WW X′W X′X + Iλ = X′y ˆ g
How to chose ?
2 σg
2 λ = σ e2 σ g
BLUP方法2
BLUP method (2)
1000111220020012111011112111101111001121100020122002220111 1202101200211122110021112001111001011011010220011002201101 1200201101020222121122102010011100011220221222112021120120 2010020220200002110001120201122111211102201111000021220200 0221012020002211220111012100111211102112110020102100022000 2201000201100002202211022112101121110122220012112122200200 0200202020122211002222222002212111121002111120011011101120 0202220001112011010211121211102022100211201211001111102111 2110211122000101101110202200221110102011121111011202102102 1211011022122001211011211012022011002220021002110001110021 1021101110002220020221212110002220102002222121221121112002 0110202001222222112212021211210110012110110200220002001002 0001111011001211021212111201010121202210101011111021102112 2111111212111210110120011111021111011111220121012121101022 202021211222120222002121210121210201100111222121101
Bayes' theorem with continuous prior and posterior distributions
to get the posterior probability distribution, multiply the prior probability distribution by the likelihood function and then normalize.
基因组时代的 动物遗传评估技术
遗传评估
• • • 评估和比较动物个体在遗传上的优劣 为选择优秀种用个体提供依据 动物育种的中心工作
表现型=基因型+ 表现型=基因型+环境
常规遗传评估技术
选择
基因 黑箱) (黑箱)
表型
遗传评估
环境
亲属的表型
特点: 特点:利用表型进行遗传评估
常规遗传评估技术
• BLUP方法是常规遗传评估技术的核心 方法是常规遗传评估技术的核心
标记效应的估计方法
最小二乘法 BLUP 贝叶斯方法
BayesA, B, C
其他方法
半参数、 半参数、非参数 机器学习、 机器学习、主成份分析
最小二乘法
对标记效应分布无任何假设 1: 对每个标记作单点回归分析
y = µ1n + Xg + e
选择效应值最大的m个点放入模型中, 2: 选择效应值最大的m个点放入模型中,同时对其 进行估计
y = Xβ + Zu + e
ˆ X 'Z X ' X β X ' y Z ' X Z ' Z + σ 2 σ 2 A−1 = Z ' y ˆ e a u y:表型信息
A:系谱信息
常规遗传评估技术
• 对很多重要经济性状十分有效
12
First lactation yield (1000 kg)
Year
Human Poultry Bovine Pig Sheep 2008 2005 2007 2008 2007
No. SNP
3,000,000 2,800,000 ~2,000,000 ~2,000,000 -
Chips
1000k 60K 54k 60k 50k
用于遗传评估的数据
用于遗传评估的数据
p
设计矩阵
染色体片断效应

基因组育种值
Chr 1
+ 40 + 20
Chr 2
Chr 3
...... Chr n
SNP effect
- 00 - 20 - 40
Known SNPs
ˆ gEBV = ∑ Xi gi
i =1
n
Number of SNPs SNP allele effect
1 + 1 - 1 - 1 + 1 + 25 - 1 + 1 - 1 - 1 - 1 + 42 + 1 - 1 - 1 - 1 - 1 - 22 - 1 + 1 1 - 1 = +38
BLUP method (4)
y = Wf + Za + e
2 Var (a) = Gσ a
Genomic relationship matrix
ˆ W′Z f W′y W′W Z′W Z′Z + Gk = Z′y ˆ a
Genotype Pedigree
Milk yield in US Holsteins 美国荷斯坦奶牛产奶量表型及遗传进展
11 10
加拿大猪100kg体重日龄遗传进展
Phenotypic
9 8 7 6 1960
Genetic
1970
1980
Birth year
1990
2000
பைடு நூலகம்
常规遗传评估技术
• 局限性
– 当性状表型难以获取或遗传力低时,遗传评估 当性状表型难以获取或遗传力低时, 可靠性不高 – 不能进行早期遗传评估
Bayesian inference
refers to the use of a prior probability over hypotheses to determine the likelihood of a particular hypothesis given some observed evidence; that is, the likelihood that a particular hypothesis is true sogiven some observed evidence (the so-called posterior probability of the hypothesis) comes from a combination of probability) the inherent likelihood (or prior probability) of the hypothesis and the compatibility of the observed evidence with the hypothesis (or likelihood of the evidence).
y = Wf + Za + ∑ X j g j + e
j =1 n
a = residual polygenic effect
2 Var (a) = Aσ a
W′Z W′W Z′W Z′Z + A −1k X′W X′Z
ˆ W′X f W′y a = Z′y Z′X ˆ X′X + Iλ g X′y ˆ
Function
σ 2 = σ 2 ×1 j
σ 2 =σ 2 × sj ˆ j
σ = σ ×1.12
2 j 2 sj ˆ sj ˆ
σ = σ ×1.25
相关主题