1. Gblocks 简介
Gblocks用于从多序列比对结果中提取保守位点,以利于下一步的进化分析。
在线说明文档:http://molevol.cmima.csic.es/castresana/Gblocks/Gblocks_documentation.html
在线服务网站:http://molevol.cmima.csic.es/castresana/Gblocks_server.html
2. Gblocks 安装
$ wget http://molevol.cmima.csic.es/castresana/Gblocks/Gblocks_Linux64_0.91b.tar.Z $ sudo yum install -y ncompress $ tar Zxf Gblocks_Linux64_0.91b.tar.Z -C /opt/biosoft/ $ echo 'PATH=$PATH:/opt/biosoft/Gblocks_0.91b/' >> ~/.bashrc $ source ~/.bashrc
3. Gblocks 使用
Gblosk 有两种使用方式,第一种是交互式的方式(按提示输入文件改变参数),第二种是命令行式(在命令行中输入参数)。
命令行式的常用例子:
使用默认的设置:
$ Gblocks proteins.fasta -t=p
必须是 fasta 文件在前,参数在后。若没有参数,则进入交互式界面。
得到更长的序列:
$ Gblocks proteins.fasta -b4=5 -b5=h
命令行式的常用参数:
-t= default:p
设置序列的类型,可选的值是 p,d,c 分别代表 protein, DNA, Codons 。
-b1= default:( 序列条数的 50% + 1 )
设定保守性位点必须有 >= 该值的序列数。该参数后接一个 integer 数,默认下比序列条数的 50% 大 1.
-b2= default: 序列条数的 85%
确定保守位点的侧翼位点时,其位点必须有 >= 该值的序列数。该值必须要比 -b1 的值要大。
-b3= default: 8
最大连续非保守位点的长度。
-b4= default: 10
保守位点区块的最小长度。该值必须 >=2 。
-b5= default: n
设置允许含有 Gap 位点。可选的值有 n,h,a 分别代表 None, With Half, All 。 当为 h 时,表示
-e= default: -gb
设置输出结果的后缀。
原文来自:http://www.chenlianfu.com/?p=2213