当前位置:
文档之家› SNP、单倍型与连锁不平衡分析
SNP、单倍型与连锁不平衡分析
SNP、单倍型与连锁不平衡分析
SNP
• 指染色体DNA序列中的某个位点由于单核 苷酸的变化而引起的多态性,在群体中的 频率>1%
SNP的基本类型
• 转换与颠换 • 转换:颠换=2:1
SNPs分析:基于实验的方法
SNPs分析:基于实验的方法
• 利用数据库中的大量序列信息,采用生物 信息学软件
• NCBI dbSNP /snp/
Expectation-Maximization(EM)算法进行样本 单体型频率的最大似然估计
连锁不平衡
连锁不平衡
LD的定义式:D=fAB- fA*fB
LD产生的原因
• LD是由突变或重组形成的。在染色体某一 SNP附近有新的突变产生时,则LD出现
– 重组的生:两位点间LD程度低。
• 理论上,LD强度与2个SNP间的距离有关
• Ensembl /index.html
单倍型
标签SNP
单倍型推断
• Phase(贝叶斯算法):根据自然人群中的 理论值预测单倍型的类型
/software.html #fastphase • Haploview(最大似然算法),采用
– 距离越小:发生重组机会越小— LD强 – 距离越大:发生重组机会越大— LD 弱
• 实际上,也有距离很近不存在LD,而距离 相当远(超过100kb)存在LD
LD的度量
• LD的度量一般不直接使用LD定义式,而对D 进行归一化后,用LD系数D’和r2进行检验
• 取值范围:0(无LD)—1(完全LD)
– /software/LDsoftware.shtml
Haplotypes median-joining network
D’的意义
D’值的95%可信区间(95%CI)
R2的意义
D’=0,r2=0
D’=1,r2=1
D’=1,r2=0.33
影响LD的因素
影响LD的因素
LD分析
• Haploview • A Compilation of Some Available Software
for Linkage Disequilibrium Analysis