基因组选择
的随机残差向量
材料方法
3、STMT和MTGM分别进行10次重复 4、基因组选择评价
(1)计算 GEBV与真实育种值TBV间的相关系数,代表其准确性,其平方称 为可靠性 (2) 计算TBV对EBV、GEBV的回归系数 ,评价EBV、 GEBV的无偏性 (3) t 检验 判断验证群的 GEBV差异
结果结论
文献阅读
1、关于GBLUP的文献
文献阅读
2、关于BLUP|GA的文献
BLUP|GA是在TABLUP的基础上加入了GWAS的信息。
单性状模型的计算
1、在实验室已有的单性状模型GBLUP程序基础上,修 改代码,读入表型数据和基因型数据,进行计算。
2、选了鸡的1日龄体重、7日龄体重和14日龄体重3个性 状进行计算,初步得到准确性分别是0.685、0.569和0.520。
的GEBV可靠性比STGM的高,这点在实际育种方案中非常重要。
对于遗传力高或者表型数据完整的性状, MTGM的GEBV优势不 明显。
本试验结果显示,GEBV的可靠性明显高于EBV,表明与基于EBV
的选择,基因组选择更有益于低遗传力的性状或者表现数据少的 性状,更易于改良功能性状和生产性状。
结果结论
GEBV尺度调整之前,回归系数大于1,性状2更突出。 GEBV尺度调整之后, EBV_m为反应变量时,回归系数在 0.832到1.002之间,平均为0.907; EBV_s为反应变量时, 回 归系数在0.964到1.069之间,平均为1.021,它们差别不大。
结果结论
2、讨论
MTGM的优势在于能利用遗传相关性状的信息。 本研究表明对于低遗传力的性状或者表型数据少的性状,MTGM
研究背景
5、GEBV预测中,广泛运用的反应变量:
EBV:通过表型值和个体间的亲缘关系来对育种值进行估计,由此得 到的估计值称为EBV
DYD :女儿产量方差是经过固定效应和女儿母亲的遗传贡献率校正后得出来 的女儿平均表型值
DRP:来源于EBV,是EBV的一种回归
6、单性状的基因组选择是目前许多研究的重点 7、近来,一些文献报道了基因组选择的多性状模型,并且表明多 性状模型的准确性比单性状模型高
材料方法
2、统计模型
单性状模型( STMT )
y 1μ Zg e
Y是反应变量(本研究用传统EBV);1是n维单位向量;μ是总体均 值; z 是 关系矩阵; g 是 基因组育种值向量; e 是随机残差向量;假设 g ~N(0,G σg2), σg2 是加性遗传方差,G是标记关系矩阵;e~N(0, σe2), σe2 是残差方差,I是单位矩阵。
EBV_m 为反应变量的GEBV可靠性比EBV_s 为反应变量的高,也被
认为MTGM比STGM更好,原因是MTGM不单止间接利用了相关性 状的信息,还直接通过性状间的协方差利用相关性状的信息。
本研究用于估计EBV的表型记录是模拟的、可靠的,并且数据缺
失是通过掩盖EBV而产生的数据缺失,而不是直接生成的,且相关 性状的数据量大,因此GEBV的可靠性会比现实育种的高。
可以缩短世代间隔,加速遗传进展,节约成本,特别有利于低遗传力的 性状、限性性状、以及表型难以测定或测定成本较高的性状的选择
4、基因组选择的方法优劣
许多文献报道Bayes方法胜过GBLUP 也有文献报道受大量微效应QTL影响的性状,GBLUP胜过Bayes方法
GBLUP的优点是需要的计算时间较Bayes少,这对于实际应用非常重要
多性状 模型
矩阵构建、程序调试
GBLUP BayesB
BayesA
矩阵构建、程序调试
交叉验证试验, 结果分析,效果对比
数据整理
1、完成表型数据的整理 生长性状23个、胴体性状31个,对非正态分布的表 型记录进行校正,剔除异常值 2、对基因型数据质控 质控标准:剔除小等位基因频率小于1%、检出率小 于95%的SNP标记 3、性状间遗传相关的计算 是否可以借用文献报道的性状间遗传相关??
下个月计划
1、整理鸡的GWAS信息 2、完成单性状BLUP|GA的计算
读书报告
报告人 :张海斌
2014.11.03
文献
汇报内容
研究背景
研究目的
材料方法 结果结论
研究背景
1、2001年,Muwissen等提出基因组选择 2、基于基因组估计育种值(GEBV)的选择称为基因组选择 3、基因组选择的优点:
研究目的
1、对比传统单性状模型与多性状模型估计的EBV的可靠性 2、用传统的估计育种值(EBV)作为反应变量比较单性状
基因组预测模型(STGM)与多性状基因组预测模型(MTGM)的
可靠性性 3、模拟不同遗传力、记录缺失以及具有遗传相关的两个性
状的数据,对比单性状基因组预测模型(STGM)与多性状基
结果结论
(3) Result of Hotelling- Williams t test
记录缺失的性状中, EBV_m为反应变量估计的GEBV可靠性比EBV_s为反应 变量估计的GEBV可靠性高。 记录完整的性状中,可靠性没有显著差异。
结果结论
(4) Regression of TBV on GEBV
课题进展汇报
汇 报 人 :张海斌
09.23~10.14
汇报内容
数据整理 文献阅读 单性状模型的计算
上个月计划
1、完成数据的整理和性状的挑选 2、单性状基因组选择的计算
技术路线
杏花鸡X隐性白羽洛克鸡 F2代真实数据集 数据整理 (基因型填充、 系谱校正,性状 挑选)
BLUP| GA
单性状 模型
材料方法
多性状模型(MTGM)
y1 Ι10 μ1 Z1 g1 e1 y 2 0Ι μ 2 0Z2 g 2 e2
y1 μ1 是 性状 1 和 2 表型向量, I 和 I 是单位向量; 1 2 y 2 μ 2 是性状1和2总体均值; g1 e1 是两性状 Z1和Z2 性状1、2关系矩阵; 是性状 1 、 2 基因组育种值向量; e2 g 2
1、结果
(1)Reliability of EBV and regression coefficient of TBV on EBV
多性状模型中,性状1的EBV的可靠性没有得到提高,性状2EBV的 准确性得到了显著提高。 多性状模型提高了性状2 EBV的无偏性
结果结论
(2)Reliability of GEBV
因组预测模型(MTGM)的效果。
材料方法
1、模拟奶牛数据
两个性状:性状1、性状2的遗传力分别为0.3和0.05,遗传相关为0.5 数据组成:G1~G4,每个世代1000公牛和200000母牛,5000个SNP标记均 匀分布于全基因组,300个QTL随机分布 参考群:G1~G3 验证群:G4 ,3组反应变量,一组数据两个性状记录完整,二组数据性 状1记录完整、性状2记录随机缺失90%,三组数据性状2记录完 整、性状1记录随10.15~11.28
汇报内容
数据整理
文献阅读
单性状模型的计算
结果结论
3、结论
MTGM可以提高基因组预测的可靠性,特别是对于低遗传力的性状或者 表型数据少的性状。 EBV_s 和EBV_m为反应变量对数据完整的性状GEBV可靠性影响较小。 对于数据缺失的性状, EBV_m 为反应变量的GEBV可靠性比EBV_s 为反 应变量的高。 EBV_m 为反应变量,MTGM的GEBV可靠性比STGM的高。
在相同模型、相同性状中,记录完整准确性比记录缺失的高。 记录完整的性状1, EBV_s 和EBV_m为反应变量,单性状模型和多性状模型的GEBV可靠性一样;记 录完整的性状2, EBV_m为反应变量时,MTGM比STGM的GEBV可靠性高0.007; EBV_s为反应变量, MTGM比STGM的GEBV可靠性高0.033。 记录缺失的性状1, EBV_m为反应变量时, MTGM比STGM的GEBV可靠性高0.142; EBV_s为反应变 量, MTGM比STGM的GEBV可靠性高0.111;记录缺失的性状1, EBV_m为反应变量时, MTGM比 STGM的GEBV可靠性高0.181; EBV_s为反应变量, MTGM比STGM的GEBV可靠性高0.211。