当前位置:文档之家› 基因家族分析套路

基因家族分析套路

基因家族分析套路(一)
近年来,测序价格的下降,导致越来越多的基因组完成了测序,在数据库中
形成了大量的可用资源。如何利用这些资源呢?今天小编带你认识一下不测序也
能发文章的思路--全基因组基因家族成员鉴定与分析(现在这一领域可是很热
奥);

一、基本分析内容
 数据库检索与成员鉴定
 进化树构建
 保守domain和motif分析.
 基因结构分析.
 转录组或荧光定量表达分析.

二、数据库检索与成员鉴定
1、数据库检索
1)首先了解数据库用法,学会下载你要分析物种的基因组相关数据。一般也就
是下面这些数据库了

 Brachypodiumdb:
 TAIR:

 Rice Genome Annotation Project :.
 Phytozome:
 Ensemble:

 NCBI基因组数据库:

2)已鉴定的家族成员获取。
如何获得其他物种已发表某个基因家族的所有成员呢,最简单的就是下载
该物种蛋白序列文件(可以从上述数据库中下载),然后按照文章中的ID,找
到对应成员。对于没有全基因组鉴定的,可以下列数据库中找:

a. NCBI: nucleotide and protein db.
b. EBI: .
c. UniProtKB:
2、比对工具。一般使用blast和hmmer,具体使用命令如下:
 Local BLAST
formatdb–i db.fas–p F/T;
blastall–p blastp(orelse) –i known.fas–d db.fas–m 8 –b 2(or else) e 1e-5 –
o alignresult.txt.

-b:output two different members in subject sequences (db).
 Hmmer (hidden Markov Model) search. Thesame as PSI-BLAST in function. It h
as a higher sensitivity, but the speed islower.

Command:
hmmbuild--informatafaknown.hmmalignknown.fa;
hmmsearchknown.hmmdb.fas>align.out.
3、过滤。

 Identity: 至少50%.
 Cover region: 也要超过50%或者蛋白结构域的长度.

相关主题