第十章 多重序列比對 Vector NTI的多重序列比對程式和其他的比對軟體比較起來非常的方便實用,操作介面也很簡單,比對的結果可以存取和輸出。
NTI有兩種序列比對程式,一種為AlignX,可以用在核酸序列和蛋白質序列比對;另一種為AlignX Blocks,只能用在蛋白質序列比對。
如何開始進行序列比對?使用者可以從程式集開啟檔案(圖10.1):圖10.1 由程式集開啟AlignX 或者是從主程式中開啟(圖10.2):圖10.2 由主程式開啟AlignX 使用者也可以在主程式(圖10.3)具有操作序列的情況下開啟AlignX-Align Selected Molecules,使用者的序列會直接載入到AlignX中:圖10.3 在操作序列的情況下開啟AlignX的方法 開啟AlignX之後,使用者會見到圖10.4的畫面:圖10.4在操作序列的情況下開啟AlignX首先使用者要把序列載入Vector NTI程式中,可以點選或者從左上方的Project→Add Files把序列檔案載入,請注意檔案名不可以過長,檔名過長會造成程式進行比對時無法完全顯示檔名(圖10.5):圖10.5 輸入的檔名注意不可過長 選取檔案後按下開啟就可以載入程式中,若比對的序列很多時可以用滑鼠圈選欲分析的序列後選擇開啟。
序列檔案載入的時候程式會詢問該序列為核酸序列或是蛋白質序列,點選好以後再點選Import就可以了(圖10.6):圖10.6 載入時,會詢問序列的性質,核酸序列或蛋白質序列接下來程式的左上方會出現使用者載入的序列(圖10.7),序列載入完成以後就可以開始進行比對的操作:圖10.7 成功載入序列的畫面進行比對前,先把欲比對的序列用滑鼠進行圈選(圖10.8):圖10.8 選取欲比對之序列只要按下或是從上方Align→Align Selected Sequence(圖10.9)就會進行比對運算:圖10.9按下Align→Align Selected Sequence進行比對運算好以後就會出現下面的畫面(圖10.10);圖10.10 比對完的結果 分析完成後畫面(圖10.11)會出現比對的相關結果,最下方是序列比對的圖形,左邊中間的區塊所顯示的圖形為導引樹(Guide tree),用來表示序列之間的關連性。
右邊的圖形則是表示序列比對的計算分數和分佈範圍的關係。
右邊的區塊分成三個部分:最上面的圖形是所有序列比對的相似度(Similarity)分析;中間的圖形是所有序列的相同度(Identity)分析;下方的圖形是表示序列和所有序列之間的共有序列(Consensus sequence)的分析。
圖形的縱軸是計算的分數,橫軸是序列的長度,相似度和相同度越高則分數越高,圖形的值就會越大。
圖形可以用滑鼠去選擇特定的範圍,下方的序列顯示就會跳到該選擇範圍:圖10.11下方為序列比對的圖形,左邊中間為圖形的導引樹,右邊為序列比對的計算分數和分佈範圍和BLAST的分析一樣,使用者可以設定圖形表示的方式。
把游標移到圖形上方按下滑鼠右鍵點選Plot Setup:圖10.12 設定圖形表示的方式使用者就可以根據自己的喜好設定圖形的表示方式(圖10.12-13):圖10.13 設定完圖形表示方法後的結果 圖形要進行輸出的時候,只要把游標移到圖形上方,按下滑鼠右鍵選擇Camera 就可以複製圖形到其他檔案中。
在導引樹(Guide tree)的欄位部分,使用者可以看到NTI程式根據比對的結果將序列分群。
以圖10.14為例,使用者可以看到Guide tree將ABC和斑馬魚海大基因歸為同一群,這表示ABC和斑馬魚海大基因是具有比較親近的關係。
圖10.14 導引樹序列名稱後面括號中的數值是表示tree的長度,正負號表示方向。
數值越大長度就會越長。
Guide tree也可以進行輸出,只要把游標移動到guide tree上方,按下滑鼠右鍵點選Camera就可以進行輸出,也可以選擇最下方的Export Guide tree輸出成特定的檔案再用相關軟體打開。
Note:Guide tree不是演化樹(Phylogenetic tree)。
這兩種樹的計算方式不同,不能混為一談。
如果要進行演化樹的分析必須使用其相關軟體,NTI不支援畫演化樹的功能。
在程式下方的比對圖形可以用滑鼠拉動下方的捲軸移動,程式會根據序列相似度及相同度的程度不同給予不同的顏色(圖10.15),下方Consensus的部分也會依相似度及相同度的程度來表示。
想要更改顏色跟Consensus的設定只要從程式上方選取View →Display Setup進入設定畫面:圖10.15 設定序列片段不同顏色如此使用者就可以根據自己的喜好來設定顯示的條件。
若程式分析的結果不是很滿意,使用者可以進行手動排列(圖10.16)。
只要將游標移到排列的結果上方,按下滑鼠右鍵選擇Edit Alignment,或者從上方從程式上方選View→Edit Alignment進入:圖10.16 手動排列比對使用者只要利用滑鼠反白標記想要移動的序列區段後,就可以使用下方的綠色箭頭按鈕進行前後移動(圖10.17):圖10.17 選取要編輯設定區塊也可以在反白的部分按下滑鼠右鍵,點選最下方的選項插入Gap進行調整(圖10.18):圖10.18 點選最下方的選項插入Gap進行調整調整完畢後按下OK鍵或者是Apply鍵就完成重新排比,如下圖所示,圖10.19是調整前的結果,圖10.20則是調整後的結果:圖10.19 調整前的結果圖10.20 調整後的結果序列排列的前後順序可以手動移動,將要移動的序列用滑鼠點選拖曳就可進行移動(圖10.21):圖10.21 選取序列利用拖曳方式進行移動如果想要把某一序列從比對中移除(圖10.22),可以點選序列後按滑鼠右鍵,選擇第二個項目後按確定移除:圖10.22 選擇Remove移除序列如果想要加入其他序列進行重新比對,可以將欲加入的序列反白,接著點選或者從Align→Add Selected To Alignment將序列加入比對(圖10.23):圖10.23 選擇Add Selected To Alignment增加序列想要將某一序列從程式中完全移除的話可以將序列反白後,按滑鼠右鍵選擇第二個項目:圖10.24將序列從程式中完全移除,選擇Delete使用者想要將序列比對輸出,可以先點滑鼠右鍵後,選擇Camera(圖10.25):圖10.25 利用Camera 將序列輸出在這個Camera選項中,Format有兩種格式可以選擇,第一個是Metafile,選擇此格式序列會以圖形檔的形式輸出,注意Metafile不會一次輸出全部的序列比對結果,只會輸出螢幕中顯示的部分(有點像Print Screen的快照功能),想要將所有比對輸出必須多次的使用Metafile輸出,圖10.26是使用兩次Metafile格式輸出的結果,第一次輸出序列1到109,第二次是110到218:圖10.26 使用兩次Metafile格式輸出的結果如果選擇Text的格式輸出,使用者可以在Range的項目中選擇所有比對的結果,或者是輸出特定的比對區域。
Wrap sequences可以設定換行的長度,預設值是50,表示每50個acid將會自動換行,Exclude consensus選項可以選擇是否將Consensus Sequence輸出。
注意輸出後會因為NTI格式的問題造成排列顯示不整齊,使用者必須將字型大小和格式進行調整,非常麻煩,不建議使用此格式輸出。
圖10.27是以每100個nucleotide換行做輸出的結果,排列顯示既不整齊也不美觀。
圖10.27 以每100個nucleotide換行做輸出 另外一種輸出的方式是使用列印功能(圖10.28),使用者可以按下滑鼠右鍵選擇Print Preview,在列印預覽畫面中程式會詢問是否選擇顯示Consensus Sequence,確定後按下OK:圖10.28 使用列印的方式輸出接者按下左上方Print鍵:圖10.29 在列印的選項中,選擇Adobe PDF 輸出電子圖在印表機的選項(圖10.29)選擇用Adobe PDF或者是其他形式,按下確定就可以輸出成電子圖檔,如此一來就可以一次將全部比對的結果輸出,並兼顧到畫面美觀。
序列比對完成後使用者可以將比對結果儲存:從程式左上方Project→Save或是Save As 的選項儲存。
Import /Export MSF:序列比對的檔案可以MSF的格式輸出(圖10.30),此格式的檔案可以用其他的序列比對軟體進行後續的修改,也可將既有的MSF格式的檔案輸入到AlignX,程式就會自動比對。
要進行輸入或是輸出只要從程式左上方Project→Export /Import MSF Format中進行操作即可:圖10.30 輸出MSF格式Align Selected Using Profile:如果按下或是上方Align→Align Selected Using Profile的選項時,程式會要求使用者選擇一條序列作為基準序列進行後續的比對動作(圖10.31):圖10.31 使用Align Selected Using Profile,要先選擇一條序列作為基準進行比對以這個操作為例選擇EF527821的話,比對完以後EF527821會變成比對序列中的第一條序列(圖10.32):圖10.32其他分析操作皆和Align Selected Sequence是一樣的。
Identity Table:從程式上方Align→Show Identity Table使用者可以看到一個表(圖10.33):圖10.33 使用Identity Table作序列的比較這個圖表將各序列之間的Identity做了一個整理,只要交叉對照就可以知道序列之間的Identity,其單位為百分比。
EF527821和ABC的Identity為45%;ABC和DQ30513的Identity為85%。
除了Identity之外,使用者還可以改成其他的表示方式,可以選擇左上方的圖示:表示顯示Consensus(只是用於蛋白質序列);表示顯示guide tree 的distance。
這個圖表可以利用右上方的做列印或者點選進行輸出。
Alignment Setup:想要調整序列比對的計算條件跟參數可以從或是Align→Alignment Setup進行更改(圖10.34):圖10.34 使用Alignment Setup,調整序列比對的計算條件跟參數使用者可以在這個視窗內更改設定和參數,除非對Alignment的計算方式有特殊需求,在此不建議擅自更改任何參數和設定。