植物育种全基因组选择
X 是分子标记数据的设计矩阵 y 是观测的表型数据 λ是一个惩罚因子,目的是使本没有唯一解
的方程组有唯一解
举例
分子标记设计矩阵 Design Matrix in Bold 表现型数据
Mixed Model Equation
解方程组
举例
需要预测的基因型
分子标记设计矩阵 Design Matrix in Bold 无表现型数据
选择
数量遗传性状黑箱 h2
基因
表现型
环境
现代的选择策略
数量遗传性状黑箱
h2
基因
表现型
环境 BLUP: Best Linear Unbiased Prediction
选择 育种值估计
具有亲缘关系 的基因型的表
型数据
美国玉米育种的成功
数据来源 Richard Johnson, Illinois Corn Breeders School, March 1-2, 2010
全基因组选择策略
在植物育种中的应用
Digital Breeding Ltd. Eurasian Plate, Earth Solar System, Milky Way Galaxy info@
经典的选择策略
杂交1
杂交2
杂交3
杂交4
MAS应用受限制的原因
分子标记的数量过少 分子标记只能解释非常少的遗传方差分量 基因分型的成本过高 分子标记/数量性状位点(QTL)的贡献量估计值
不稳定
贡献量大的位点倾向于被高估 分子标记贡献量之在家系和控制试验中有意义 分子标记/QTL的贡献量与遗传背景 和(或者) 环境的
1964
2010
Yield/acre
80 bu
180 bu
Product price
$1.10/bu
$3.85/bu
Seed corn price $10/Unit
$350/Unit
1蒲式耳 (bu)玉米=56磅(約25.40公斤)
70年代分子遗传学的承诺
平均产量 kg
GQ
600
G等位 基因的 贡献为
+50
550
500
GQ GQ Aq Aq Aq
目标:
找到主要基因或者 和主要基因联系紧 密的分子标记
用分子标记辅助选 择育种 MAS
Marker-Assisted Selection
分子辅助选择策略
数量遗传性状黑箱
基因
数量遗传性状灰箱
重要基因 分子标记 数量位点QTL
表现型数据 分子数据
分子辅助选择
海量的基因型 海量的SNP分子标记 海量的表现型数据
统计分析 寻找数量性状位点/估计分子标记贡献量
用贡献量显著的 分子标记进行MAS
可以找到更多的 LD 分子标记 但是所有的显著的分子标记也
只能解释很少遗传方差。大量
的微小贡献率被忽略
解决方案:全基因组选择
利用全部的SNPs 同时估计50000个SNPs的贡献量 解大型线形方程组
交互作用显著 分子标记与QTL的Linkage Disequilibrium 只存在于独立
群体
2000年开始的分子技术革命
SNP:Single Nucleotide Polymophisms
玉米 50000 SNPs
全基因组 选择 Meuwissen
et al. (2001).
高密度SNP数据的应用
设计矩阵与分子标 记贡献量估计值相 乘,得出基于全基 因组的育种值估计
Inbred
选择的准确度
Accuracy (r) = 选择标准与真实育种值的相关系 数
当选择基于表现型值时r = h (Hertitability) 遗传力h越高,选择带来的影响Renpose就越大 选择带来的影响
选择的准确度
利用表型数据和分子数据的组合,减少田间试验 数量,提高育种效率
利用MAS的潜在优势
Meuwissen & Goddard, 1996 (GSE)
三种不同类型的分子标记
直接的标记 功能性 的变异- 已知的基因
LD 标记
分子标记与数量性状位点的关联 存在于整个群体当中
LE 标记 分子标记与数量性状位点的关联 不存在于整个群体当ˆk 量的估计值
利用分子标记 贡献量的估计 值估计其他基 因型的表现型
GEBV ˆk gik
The infinitesimal model (Fischer 1918) vs. The finite loci model
统计方法
Ridge Regression
ˆ X ' X I 1 X ' y
选择的准确度