时间:2019-09-20 11:49:57 作者:无名 浏览量:63
今天小编就为大家带来基础工具Clustalx的使用方法。CLUSTALX-是CLUSTAL多重序列比对程序的Windows版本。
Clustal是一种利用渐近法(progressive alignment)进行多条序列比对的软件。即先将多个序列两两比较构建距离矩阵,反应序列之间两两关系;然后根据距离矩阵计算产生系统进化指导树;然后从多条序列中最相似(距离近期)的两条序列开始比对,按照各个序列在引导树上的位置,由近及远的逐步引入其它序列重新构建比对,直到所有序列都被加入形成最终的比对结果为止(Figure 1)。
clustal 算法:
Clustal软件有两个版本,其中clustalw采用命令行的形式在DOS/Linux下运行的, Clustalx是可视化界面的程序,可在window电脑运行,我们今天学习Clustalx的使用。
1 安装clustalx:
下载clustalx软件,按照默认安装到自己的电脑上。
2 准备要比对的序列:
将上节课搜索到的同源核酸fasta文件,全部粘贴到一个文本文件中,所有的蛋白质序列存入另一个文本文件。
基础工具Clustalx的使用方法图二
3 载入序列:
点击开始-程序-clustalX2-clustalX2。
点主菜单File,选择Load Sequence-选择刚保存的序列文件,点打开。
注意:ClustalX程序无法识别汉字、带空位的文件夹名,如my document。
载入序列后在左侧窗口里是fasta格式序列的标识号,取自序列第一行“>”后的字符。
4 比对参数的设置:
比对前先要设置两条序列比对的参数和多条序列比对的参数。
a.两条序列比对的参数
点击Alilgnment菜单,选择Alignment Parameters,再选择Pairwise Alignment Parameters,如Figure 3,首先可以选择比对的效果,是slow/accurate 还是fast/approximate。第一种模式采用的是动态规划算法进行比对的,第二种模式采用的是启发式的算法。除非序列非常长,一般采用第一种模式。可以选择空位罚分系统,DNA或蛋白质替换矩阵,也可以自己上传某个替换矩阵进行比对。
b.多条序列比对参数
点击Alilgnment菜单,选择Alignment Parameters,再选择Multiple Alignment Parameters,如Figure4.
Delay divergent sequence是指当两条序列的差异大于某个值(百分比)时,这两条序列的比对将推迟进行,程序先比对相似序列,对于相似度不够高的序列,晚些时候进行比对,加入到最终的多条序列比对结果时也要迟些。DNA transition Weight等于0的时候,程序将转换当作错配(mismatch)看待,等于1的时候,将转换和匹配同等看待。当参与比对的序列差异较大时,DNA transition Weight应该选择的小些(接近0),如果参与比对的序列差异较小时,DNA transition Weight可选择的大些(接近1)。
基础工具Clustalx的使用方法图三
5 设置输出格式:
点击Alignment菜单,选择Output Format Options,页面如Figure 5。
默认的是输出clustal format,如果需要其它格式,可在复选框里打勾。如PHYLIP格式是利用PHYLIP软件进行建树时,需要输入的格式
6 进行比对:
点击Alignment菜单,选择Do Complete Alignment.此时出现一个对话框,提示比对结果保存的位置,上一步选择了多少种输出格式,这里就需要给出多少个文件的路径。选择好了点OK即可。