【絮语】
一提到多重序列比对,很多人禁不住就想到ClustalW(Clustalx为ClustalW的GUI版),其实有一款多重序列比对软件-MAFFT,不论从比对速度(Muscle>MAFFT>ClustalW>T-Coffee),还是比对准确性(MAFFT>Muscle>T-Coffee>ClustalW)来说,其相比于ClustalW(或ClustalX)有过之而无不及,所以这里强烈推荐使用MAFFT这款多重比对软件。
PS: 不同比对软件的比较,有兴趣的童鞋可以下载这篇文章看看:Alignment uncertainty and genomic analysis. Science, 2008
MAFFT官方网站:http://mafft.cbrc.jp/alignment/software/
支持平台:Mac OS X 、Linux、Windows
Windows 32位版本:http://mafft.cbrc.jp/alignment/software/mafft-7.037-win32.zip
64位版本:http://mafft.cbrc.jp/alignment/software/mafft-7.037-win64.zip
请根据自己操作系统选择相应版本下载
简明操作流程:
1.载入序列文件 将FASTA格式的待比对序列文件(如:TMV.fas) 复制MAFFT的根目录下(当然也可以放任意位置,只有找得到),双击“mafft.bat”启动MAFFT,此时提示输入文件(Input file?),在@后面输入示例的TMV.fas,也可以直接将文件拖入窗口(注意有个+,说明当前是拖放状态),如下图所示:
加载后回车,当显示“OK”时说明载入文件成功。
2.设置输出信息
输出文件名称自定义,扩展名任意,这里保留原扩展名,输出文件名为TMV-out.fas,确定后回车。
输出文件格式,建议用3或4,这里在@后输入4后回车,此时出现 MAFFT三种主要比对策略的5个选项,如下图:
当你无法确定时候,建议用第1种的--auto模式,让MAFFT根据序列的特点自动选择相应的比对策略,输入1后回车。
当不需要附带参数时,直接回车。
3.开始多重比对
一切设置完毕,输入“Y”回车,程序自动开始比对。
当出现输出文件名,说明比对完成。
4.后续着色美化 详见附录,不再赘述
附:多重序列比对的后期着色渲染
(1) Boxshade (黑白着色),在线网址:http://www.ch.embnet.org/software/BOX_form.html相关使用教程,请网上搜索高老师写的《序列着色软件Boxshade图解教程(by raindy)》;
(2) ESPript 彩色着色,在线网址:http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi,效果图:
(3)TeXShade 自定义着色,详见日志: http://user.qzone.qq.com/58001704/blog/1367885081
原文引自:http://user.qzone.qq.com/58001704/2?ptlang=2052