利用k-mer组装的基因组的软件现在已经很多了,例如soapdenovo,velvet等等。PLoB上已经有不少关于velvet的软件的介绍,今天再次谈谈velvet这个软件,主要是推荐一些velvet配套的其他软件。
1、VAGUE
这是一个基于velvet的但是带有图形化界面的基因组组装软件。目前该软件支持linux和mac。关于VAGUE的介绍可以读读下面的英文信息。
VAGUE is a vague acronym for "Velvet Assembler Graphical Front End", which means it is a GUI for the Velvet de novo assembler. The command line version of Velvet can be complicated for beginners to use, but VAGUE makes it clear and simple.
上面是软件的使用截图,更多软件的信息请访问:http://www.vicbioinformatics.com/software.vague.shtml
2、VelvetK
利用基于K-mer组装的软件的时候我们常常关心一个问题,K-mer值设置多少比较好呢?于是乎,我们常做的一件事情就是把很多个K-mer值都拿来试一下,看看哪个K-mer比较好。这不失为一种好办法,但是当数据量很大的时候确实有点浪费时间。
我记得之前在velvet的manual里面作者推荐了一个经验公式(如下文),该公式推荐的K-mer与reads覆盖度和reads长度相关。
All coverage values in Velvet are provided in k-mer coverage, i.e. how many times has a k-mer been seen among the reads. The relation between k-mer coverage Ck and standard (nucleotide-wise) coverage C is Ck = C (L−k +1)/L where k is your hash length, and L you read length
这个经验公式也是一个定性的公式了。今天这里我们给大家推荐的另外一个软件VelvetK,这个软件可以告诉你k-mer选择多少比较合适。
下面是作者对velvetK的描述介绍:
VelvetK can estimate the best k-mer size to use for your Velvet de novo assembly. It needs two inputs: the estimated genome size, and all your sequence read files. The genome size can be supplied as as a number (eg. 3.5M) or as a FASTA file of a closely related genome. The reads can be FASTA or FASTQ, and may optionally be compressed with GZIP or BZIP2.
了解更多信息可以从这里进入:http://www.vicbioinformatics.com/software.velvetk.shtml
下面是velvetK的使用参数:
Synopsis: List suitable k-mer sizes given target genome and reads Author: Torsten Seemann (torsten@seemann.id.au) Usage: velvetk.pl [--size X | --genome F] [options] <readfile[.gz][.bz2] ...> Options: --help This help. --verbose! Verbose output (default '0'). --size=s Target genome size in bp (can use k/M/G suffix) (default '0'). --genome=s Target genome (FASTA) (default ''). --cov=i Target k-mer coverage (default '25'). --range=i Print target +/- this range (default '10'). --best! Just print best k-mer to stdout (default '0').
3、VelvetOptimiser
上面介绍了在使用velvet过程中K-mer的参数如何设置,这只是一部分。下面给大家推荐另一款软件,VelvetOptimiser。这款软件的作用是,帮助你优化velvet的参数,针对你的数据,提供一个合理的参数,这些参数包括,K, -exp_cov, -cov_cutoff。
下面是该软件的描述:
VelvetOptimiser is a multi-threaded Perl script for automatically optimising the three primary parameter options (K, -exp_cov, -cov_cutoff) for the Velvet de novo sequence assembler.
想知道更多关于VelvetOptimiser的资料和介绍,请从这里进入:http://www.vicbioinformatics.com/software.velvetoptimiser.shtml
以上就是这次推荐的三款软件,希望跟对大家有所帮助。