当前位置:
文档之家› 家畜育种学07种畜的遗传评估(三):BLUP育种值估计
家畜育种学07种畜的遗传评估(三):BLUP育种值估计
第一节 线性模型基础知识 第二节 BLUP的基本原理 第三节 BLUP的计算技术 第四节 育种值估计模型 第五节 多性状BLUP 法的基本原理 第六节 BLUP育种值估计举例 第七节 BLUP育种值估计软件
随着数理统计学与线性模型理论、计算机科学与 互联网络技术的迅速发展,家畜育种值估计的方
l tt 1 l ti
2 i 1 p
p t 1
0 . 75 0 . 25 f p
个体的父母已知为 p 或 q ,假设 p q
0 . 5 ( l pi l qi ) l ti 0 . 5 l qi 0 i 1、
,这时:
2、 p q t 1
y 是所有观察值构成的向量
, , ,
b 是所有固定效应(包括)构成的向量
X 是固定效应的关联矩阵 u 是所有随机效应构成的向量 Z 是随机效应的关联矩阵 e 是随机残差向量 随机变量的数学期望: E ( b ) b E ( u ) 0 E ( e ) 0 E ( y ) Xb
方差-协方差矩阵结构:
/jcyzx/index.htm
因子
离散型
• • 通常表现为若干个有限的等级或水平 固定因子 ——有意识地抽取若干个特定的水平, 目的是对这些水平的效应进行估计或进行比较 , 如年效应 随机因子——因子的若干水平可看作是来自该因 子的所有水平所构成的总体的随机样本,目的是 要通过该样本去推断总体,如个体的遗传效应。
的父母未知时:
a ti a it 0
a ti a it 0 .5 a ip
i 1、 2、 t 1
个体 t 的父或母为 p 时 :
i 1、 2、 t 1
个体 t 的父母已知为 p 或 q 时:
a tt 1 0 . 5 a pq
i 1、 2、
a ti a it 0 . 5( a ip a iq )
2 2 2
/jcyzx/index.htm
混合模型方程组的度量
ˆ b C xx Var u 0 ˆ G C zz 0 C xz C zz
( u d a e ) / u
殊情形。
随着计算机技术的高速发展,使这一方法的实际应用成为可能,目前 BLUP法已成为世界各国(尤其是发达国家)家畜遗传评定的规范方
法 。
/jcyzx/index.htm
第二节
BLUP的基本原理
y Xb Zu e
一般混合模型可表示为:
BLUP 估计一般方程
ˆ b ( X V
X) X V y 1 ˆ ˆ u G Z V (y X b )
1 1
BLUP法前提条件
1. 所用的表型信息必须真实可靠,系谱资料必须正确完
整 2. 所用的模型是真实模型;
3. 模型中的随机效应的方差组分或方差组分的比值已知
1
•
如果个体父或母已知 p 为:
要加入的数值
0 .5 a ii
0 . 25 a ii
A 中的位置 ( p , i ), ( i , p ), ( q , i ), ( i , q ) ( p , p ), ( p , q ), ( q , p ), ( q , q )
/jcyzx/index.htm
法发生了根本的变化。
以Henderson为代表所发展起来的BLUP(Best
Linear Unbiased Prediction)育种值估计法,
将畜禽遗传育种的理论与实践带入了一个新的发 展阶段。
/jcyzx/index.htm
第一节
线性模型基础知识
也允许出现平方或立方项。 一个线性模型应由3个部分组成: 1. 数学方程式 2. 方程式中随机变量的期望和方差及协方差 3. 假设、约束和限制条件
/jcyzx/index.htm
线性模型举例
母牛的乳脂量生产成绩表(Schaeffer L R,1993)
对固定效应和随机效应的任意线性可估函数 ( K b M u )进行估计和预测,要求同时满足预测的 无偏性和预测误差方差最小(最佳)两个条件,由此得
u 到 b 的最佳线性无偏估计值(BLUE), 的最佳线性无
偏预测值(BLUP)。
/jcyzx/index.htm
分子亲缘矩阵逆矩阵的计算
3. 令 D 为 L 对角线元素组成的对角阵,让 A 1 ( D 1 ) 2 4. 按以下规则加入已知父母的个体的有关元素构建 A 1 • 如果双亲已知为 p 和 q :
要加入的数值
0 .5 a ii
0 . 25 a ii
A 中的位置 ( p , i ), ( i , p ), ( q , i ), ( i , q ) ( p , p ), ( p , q ), ( q , p ), ( q , q )
•
连续型
• 它呈现连续性变异,通常是作为影响观察值的协 变量(回归变量)
/jcyzx/index.htm
线性模型(Linear model)
线性模型是指在模型中所包含的各个因子是 以相加的形式影响观察值,即它们与观察值
的关系为线性关系,但对于连续性的协变量
u G Var e 0
0 R
/jcyzx/index.htm
BLUP 的统计特性
可估函数: b M u K
预测函数:L y
预测误差:K b M u L y
BLUP分析的实质是利用观察值的一个线性函数( L y )
/jcyzx/index.htm
经典的迭代方法
高斯-赛德尔迭代法 (gauss-seidel)
x
(k ) i
( ri c ij x
j 1 n
i 1
(k ) j
j i 1
c ij x j
n
( k 1 )
) c ii
雅可比迭代法(jacobi)
/jcyzx/index.htm
混合模型方程组的一般形式
X R 1 X Z R 1 X ˆ b X R 1 y 1 1 Z R 1 y ˆ Z R Z G u X R Z
分组 1 产 犊 季 节 初产年龄(等级) 1 114 150 109 2 163 117 103 2 143 3 145
数学方程式: y ijk a i b j eijk 期望和方差:E ( y ijk ) a i b j E ( eijk ) 0 2 假设和约束条件: V ( y ijk ) V ( e ijk ) i 所有母牛都来自同一品种 所有母牛都在相同的环境下以相同的饲养方式饲养 所有的母牛都来自同一公牛 所有的母牛的母亲对母牛的乳脂量无影响
x
(k ) i
( ri
c ij x j
( k 1 )
) c ii x i
( k 1 )
j 1
松弛迭代法(relaxation)
xiቤተ መጻሕፍቲ ባይዱ
( improved )
xi
(k )
( xi
(k )
xi
( k 1 )
)
收敛标准(convergence criteria)
一般标准 max x ( t ) x ( t 1) i i 改进标准
第三节
BLUP的计算技术
混合模型方程组的求解 经典解法
• 先求出方程组的系数矩阵和等式右边的向量,建立 方程组,然后迭代求解 • 缺点:混合模型方程组往往很大,容易受计算机内 存的限制,实际应用范围不广
间接解法
• 不需建立方程组,直接构建观测数据迭代公式,每 次迭代读入原始数据包括性状观测值和系谱记录, 并同时计算该次迭代的解 • 通用性不强,需要构建特定的数据迭代公式
t 1
/jcyzx/index.htm
分子亲缘矩阵逆矩阵的计算
1. 构造所有个体的系谱列表 ,父母亲号先于个体号 2. 构建三角矩阵 L
个体 t 的父母未知时: l tt 1 i 1、 2、 t 1 l ti 0 个体 t 的父或母为 p 时: i 1、 2、 0 . 5 l pi l ti i p 1、 p 2、 0
i p 1、 p 2、 i q 1、 q 2、
q 2
l tt
1 0 . 5 l pj l qj l ti
i 1 i 1
p
/jcyzx/index.htm
0 . 5 0 . 25 ( f p f q )
模型(Model)
模型是描述观察值与影响观察值变异性的各因子之间
的关系的数学方程式 分类
• 真实模型——非常准确地模拟观察值的变异性,
模型中不含有未知成分 • 理想模型——根据研究者所掌握的专业知识建立 的尽可能接近真实模型的模型 • 操作模型——用于实际统计分析的模型,它通常
是理想模型的简化形式
2 2 2
i
ˆ b C xx Var u u C ˆ zx
ru uˆ
i i
ˆ Cov ( u i , u i )
u uˆ
i
1 du k
i
i
k e u
2
i
2
d u 为 C zz 中与 i 个体对应的对角线元素
/jcyzx/index.htm
混合模型 (mixed model)
• 若模型中除了总平均数和随机误差之外,既含有固定
效应,也含有随机效应,则称之为混合模型