内部使用Mapmaker3.0 winQTLCart2.0简单中文教程和举例胡磊(新疆农业大学农学院棉花遗传育种2006级研究生)本文是笔者自己的试验方法记录里得来的,尽量使用通俗易懂的语言,配合截图,基本上看过的人都可以学会使用。
但是由于时间紧促,难免存在疏漏和错误的地方,欢迎指正!此资料仅供参考,因此引起的后果概不负责,特此声明。
一、前期数据准备1 数据调查和采样数据调查:我们把群体中的每个材料种成行,比如3m 一行,在这一行里选取10株做调查,已果枝始节为例,调查10株,并记录在记录本或者电脑里备用。
采 样:在上面说的3m 一行的里取指甲盖大小的叶片,回实验室提NDA ,跑电泳,和读带。
2 数据输入 2.1 大田数据先把你的田间调查数据输入excel ,以f2代果枝始节调查数据为例。
在最后一列算出平均数。
注意!我们需要用的就是这个平均数!数据输入的时候,材料编号那里不能出错。
2.2 实验室数据然后就是我们采回来的叶片跑的电泳记录,这里的叶片都是大田里取来的,全部需要提取DNA 和跑电泳。
最后在所跑出来的电泳条带上读取数据,读取数据的方法如下:如图所示,此图显示的是凝胶上的带型。
内部使用共显性标记:母本带型记为“B ”,父本带型记为“A ”,杂合带型记为“H ”。
显性标记记载有两种情况:若母本等位基因为显性,则父本带型记为“A ”,杂种带型记为“D ”;若父本等位基因为显性,则母本带型记为“B ”,杂种带型记为“C ”。
无论在显性标记还是共显性标记中,由于某些原因造成的带型不清或数据缺失均用“–”表示。
而我们在读取的时候一般用数字表示,即:1=A 2=B 3=H 4=C 5=D 。
在读带后的数据输入也要注意编号,编号一定不能出错。
3 数据处理 3.1 数据核对将DNA 的编号和大田数据进行对比,如果DNA 里有的编号,在材料编号里没有,就把那一行数据用“-”表示,单元格下移。
如果材料编号里有的数据,而DNA 里没有。
那就把材料编号和平均数数据一起删除,原则是以DNA 数据为主,同时和大田调查的农艺性状数据一一对应。
如图:3.2 检验数据调查的数据如果不符合正态分布是不能引用的,数据是否符合正态分布可以用EXCEL内部使用来检验,操作步骤为:选中你要带入处理的数据,例如平均结铃数。
注意,因为这里面还有前面处理时加入的“-”,要将“-”去除,用内部使用3.3数据标准化数据标准化有很多方法,比如用dps 软件将数据标准化,方法如下:将要标准化的数据复制到dps 里,注意,数据用原始的那个数据,不是排序后的数据。
而且数据里面的“-”要用0代替。
否则出来的数据对不齐,这个数据还要和原始数据一一对应,然后把0再用“-”替代回来。
在按钮栏里可以看见一个数据标准化,我们选择下拉菜单里的数据取平方根,然后把平方根后的数据粘贴会EXCEL ,再用 描述统计 分析一下,这次数据就符合正态分布了。
3.4 数据输出数据输出时注意,因为我们前面的数据是列,而输出的数据要求是行,所以,需要转置一下。
选择这个列平均数,选择复制,在另一个sheet 里选择“选择性粘贴”,并勾上 数值 和下面的 转置。
这样粘贴的数据就成了“行”,将这行数据另存为“文本文件(制表符分隔)*.txt ”。
保存过后将文件后缀改成raw 。
内部使用最后再将dna 数据和标准化后的数据放到一个raw 文件里,表头照着输入就行了,注意,里面的153表示 株数,124表示 标记数,2 表示 农艺性状数,这几个数字需要根据实际情况改动。
而数据里面的“*”也需要自己添加,就只是在第一列有“*”。
数据里只能有字母、数字、“*”、“-”。
二、mapmaker 3.0的使用首先要说明,mapmaker 这个软件不是很稳定,如果在运行着其他大程序的时候在用这个软件很容易使软件自动退出,所以,在使用前,关闭不不要的软件。
而且这个软件运行时,不能操作以前内容,需准备一张纸和一支笔以便记载,主要是记载自己做到那一个group 。
注意,以下命令前面的编号(如1、)不是软件里面的命令步骤,如果输错命令,软件会有提示,重新输入即可。
以下内容,红色字体是说明,软件运行时不需要输入1、prepare date h h 就是你的以raw 后缀结尾数据文件,命令意思为,准备一个用于分析的数据,运行显示如图片所示。
(prepare date 可以简写为pd )内部使用2、error detection3、cent kosa4、sequence all5、group6、make chromosome c1 c2 c3 c4 c5 c6 c7 c8 c9 c10 c11 c12 c13 c14 c15 c16 c17 这个命令只能输到这里,再多了显示不下内部使用7、make chromosome c18 c19 c20 c21 c22 c23 c248、sequence group 1 从这里开始演示第一个group 的操作9、anchorc110、sequence{ 1 40 78 }11、compare12、sequence 1 40 7813、map14、framework c1 到这里第一个group 就处理完成了15、sequence group 2 从这里继续演示第二个group 操作,看出它的规律内部使用16、anchor c217、sequence { 3 73 85 101 111}18、compare19、sequence 3 73 101 85 11120、map21、framework c2 到这里,第二个group 就处理完成内部使用22、sequence group 3 这里开始第三个group 的操作,从第一二个group 操作已经可以看出它的规律了,从这里就是开始重复前面的步骤,不再举例,剩下的就是处理完24个group 。
anchor c3sequence { 4 22 116} comparesequence 4 22 116 mapframework c3 sequence group 4 anchor c4sequence { 6 14 18 58 } mapcomparesequence 18 14 6 58 mapframework c4sequence group 5 由于这个group 中要用到try 命令,所以单独挑出来演示 sequence 可以缩写为 s anchor c5sequence { 7 33 53 59 86 99 } 这个命令一次只能处理6个,所以不能把114和117输入到{}中,如果输入,将会造成程序退出!用纸记住114和117,以免忘记!同时记住自己做到哪一步了 comparesequence 59 7 86 53 33 99 try 114内部使用sequence{114 59 7 86 53 33 99} Compare 等待运算完成sequence 114 59 7 86 53 33 99 try 117sequence{ 117 114 59 7 86 53 33 99 } compare 等待运算完成sequence 117 114 59 7 86 53 33 99 mapframework c5 sequence group 6 anchor c6sequence { 10 80 89 95} comparesequence 10 80 89 95 mapframework c6 sequence group 7 anchor c7sequence { 12 38 47 48} comparesequence 38 47 48 12 mapframework c7 sequence group 8 anchor c8sequence { 13 36 105} comparesequence 36 13 105 mapframework c8内部使用sequence group 9anchor c9sequence { 16 45 64}comparesequence 45 64 16mapframework c9以下省略操作步骤,显示序列,以便核对sequence group 10 (17 90 102)sequence group 11 (21 37) 这一组由于只有两个,所以可以直接用map 命令anchor c11mapsequence group 12 (29 91 67 69 23)sequence group 13 (24 25 26)sequence group 14 (28 27 88)sequence group 15 (30 77)sequence group 16 (35 34 98)sequence group 17 (50 65)sequence group 18 (52 103)sequence group 19 (68 72 54 60)sequence group 20 (55 121)sequence group 21 (57 79)sequence group 22 (70 62 123)sequence group 23 (71 74)sequence group 24 (76 108)quit 最后的退出命令yes退出后会生成后缀map 结尾文件。
三 winQTLCart2.01. 绘图这个软件运行时间比较长,最好不要在运算同时运行其他大型程序,可能引起死机。
打开点击内部使用下一步点击内部使用这个检验估计要5小时这个检验完了就可以看见图了,点击打开软件生成的qrt 文件,就可以看见曲线图,图上lod 值大于2.0就是qtl 位点。
内部使用图上所示,按下坐标显示的按钮,将鼠标移动到一个LOD 值大于2.0的位置,图标会显示出相关的信息,如第几条染色体,lod 值,距离。
3. 制图制图可以用系统自带的画图工具,也可以用photoshop ,因个人而已。
我们绘图就是注释某个性状在骨架图上的位置。
这一步也最简单了,只要根据上一步确定染色体位置,用方框,三角,圆圈……不同图形表示不同性状,在骨架图上对应的染色体标注上就可以了。
致谢感谢我的导师王沛政博士,在百忙之中给我们讲解软件的使用,注意事项,以及一些细节上的问题。
感谢我的同学史丽芳(新疆农业大学农学院棉花遗传育种2006级研究生),她的笔记在mapmaker 里占了主要份额,以及在软件使用上的解释和探讨。
感谢我的学弟董国蛟(科学技术学院生物科学042 jezimc@ ),这篇教程的部分图片效果和数据整理是由他完成的。
感谢我的父母,你们的养育之恩难以回报,你们的健康是我最大的心愿,你们的支持是我最大的动力。