Gblocks使用说明书(by florawz)
1.首先打开软件,进入主页面
2.输入O ,然后回车,对话框显示输入一个文件或路径
此时将比对好的(.fas)文件拖入对话框。
对话框即出现该文件的路径(如图)
按回车,即导入该序列。
对话框上部出现下列信息
3.快速比对:输入G,然后回车。
在原比对文件所在文件夹内即可出现Gblocks 已经处理好的文件
.fas-gb文件可用Bioedit和DNAMAN打开。
打开.htm文件,可查看可视化的处理结果(如图)
4.主菜单:
t. 指定的序列类型(可以是蛋白质,DNA或者密码子)。
输入一个t,回车。
序列类型改为Condons
再输入一个t,回车。
序列类型改为DNA(如此循环修改)
o. 打开一个文件。
必须为 NBRF/PIR 或 FASTA 格式 ,序列长度不限。
打开 NBRF/PIR-格式的序列时,在序列备注第一行要注明序列类型
如:
>P1;byflorawz
------MEYLLQEYLPILVFLGMASALAIVLILAAAVIAVRN--PDPEKVSAYECGFNAF
D-DARMKFDVRFYLVSILFIIFDLEVAFLFPWAVSFASLS-DVAFWGLMVFLAVLTVGFA YEWKKGALEWA----------------------*
(fas格式则不需要,第一行直接为>byflorawz即可)
注意:在使用Glocks分析前,序列缺口必须先消除。
在将比对文件拖进改软件时,要去路径掉末尾的空格。
打开多个文件 :必须建立一个path文件。
输入各个相关文件的路径,在安装好的文件包内可以看到一个"paths"范例,用word打开此文件,即可看到各个文件的所在路径(如图)
多条比对序列的处理:如果所有的比对文件的路径都在一个paths文件,且各个比对文件的序列条数,以及物种的顺序都是相同的,那么这些比对文件在最后的结果中可以连接起来。
如果各个比对文件的序列条数不同,那么也可以一起处理,但是最后不能连接。
b. 显示 Block 限制性参数 (详情见下页).
s. 显示保存菜单(详情见下页).
g. 处理计算
q. 退出
5.限定性参数菜单
1.设置保守区域内的保守序列的至少数量, 必须大于序列个数一半,数值越大,所挑选的保守位点越少
7个序列设置参数为5
7个序列设置参数为4
7个序列设置参数为6
2.设置保守区域两侧位置的保守序列的最少数量,必须大于或等于1所设置的值,这个值越大,所选择的保守位点越少
7个序列设置参数为6
7个序列设置参数为5
3.保守区内一段非保守区的最大范围,数值越大,选择的保守位点越多。
设置为4时(5-6-4-10)
设置为5时(5-5-5-10)
(5-5-6-10)
4. 设置清除空隙后的模块的最小长度。
在去除间隙后,保守模块的长度不能小于这个值,值越大,挑选的保守模块越少
(5-6-4-3)
(5-6-4-10)
5. 3种处理缺口的方式
None: 最后的比对中不能有缺口. 一条序列中出现缺口即被淘汰,相邻的非保守区也会被消除
With Half: 50%或者以上的序列个数有缺口的,会被淘汰。
All: 所有的缺口都会被保留下来
r. 恢复默认设置
g. 进行数据处理
z. 显示其他选项菜单
m. 回到主菜单
选择Z,显示其他选项菜单
6.处理数据时是否使用相似模型
e. 设置文件保存位置,最多5个。
保存菜单
s. 是否保存选择模块,反复输入s来选择保存,不保存
p. 是否输出结果,反复输入p来选择输出,不输出
e. 输入自定义的保存路径,最多5个
z. 显示其他选项
m. 回主菜单
输入Z,显示其他选项
v. 设置输出结果中每一行的字符数
n. 在输出的NBRF/PIR 或 FASTA是否保存为挑选的非保守区 u. 当有一个序列有缺口时,在输出文件中是否保留此缺口 k. 是否保存SeqPup软件格式的文件
d. 是否保存具有图表形式说明的输出文件.、
如果输入的是一个paths路径,包含有多个比对文件的数据包,则会出现另外的几个选项
a.是否保存各个比对文件所挑选保守模块的相连文件“ paths-g
b.seq ”
c. 是否保存所有比对序列的相连后的文件“ paths.seq ”
w. 是否保存所有比对文件相连后,去掉间隙的文件“paths--.seq ”
WARNING. 多个比对文件,批量处理,并连接时,必须保证每个比对文件中所包含的序列条数,和物种顺序相同,否则会使连接后的输出结果混乱,不可靠。
如有描述不当之处欢迎修正与交流
floralin@。