构建进化树可以用DNA序列,也可以用protein序列。本文就如何利用蛋白序列进行进化树的构建步骤进行详细解析:
一、利用phylip进行蛋白序列进化树分析步骤
1. 运行Clustalw,得到protein.phy文件;
2. 运行seqboot,输入protein.phy文件,输出protein_1.outfile。R选择1000,seed number: 3,然后选择Y。将得到的protein_1.outfile改名为protein_2.infile。
3. 运行protpars,输入protein_2.infile,输出protein_2.outfile和protein_2.outtree。J选择3(seed number),5(jumple number),M值选择D,然后输入1000 (sets)。最后选择Y。将得到的protein_2.outtree改为protein_3.intree.
4. 运行consense,输入protein_3.intree,选择Y。得到protein_3.outfile和protein_3.outtree
到此为止,利用seqboot计算的bootstrap值已经完成,但是protein_3.outtree构建的tree没有branch length数据,无法直观的显示序列之间的差异。此时,应该利用tree-puzzle来计算branch length。http://java.com/en/download/index.jsp )
Tree-puzzle使用说明
利用tree-puzzle计算branch length步骤:
1. Windows下,进入tree-puzzle所在src文件夹,双击Puzzle,弹出对话框,输入文件。文件为clustalW运行的protein.phy文件。
2. 然后依次选择K、W、C,输入4,最后输入Y确定。
3. 输入consense操作得到的文件protein_3.outtree。将要生成的文件改名为protein.complz。
4. 点击enter运行。
5. 将得到的consense文件protein_3.outtree和protein.complz文件同时拷出到新文件夹。
6. 利用eATV进行bootstrap和branchlength的显示,输出PDF文件。
7. 将相应的bootstrap值,算成百分比,通过Adobe illustrator 加到puzzle计算的树上。
8. Done
eATV是一个java应用程序,需要先安装java运行环境程序(http://java.com/en/download/index.jsp )
利用DNA序列建进化树的步骤与上面大同小异,参照phylip documentation文件。(http://evolution.genetics.washington.edu/phylip/phylip.html )
这些步骤均可在windows下完成。但是如果序列较大,建议在linux系统下操作。其中protpars步骤特别耗时,经常需要过夜运行,请一定要耐心等待。祝大家顺利!
Phylip 下载:http://evolution.genetics.washington.edu/phylip/getme.html
Tree-puzzle下载:http://www.tree-puzzle.de/#download
eATV下载:http://www.softpedia.com/get/Science-CAD/ATV.shtml (rather small: 93kb)
原文来自:http://blog.163.com/ifanfan_1981/blog/static/4404736420104555438864/