基因组组装软件velvet以及参数优化

评论8,517

利用k-mer组装的基因组的软件现在已经很多了,例如soapdenovo,velvet等等。PLoB上已经有不少关于velvet的软件的介绍,今天再次谈谈velvet这个软件,主要是推荐一些velvet配套的其他软件。

1、VAGUE

这是一个基于velvet的但是带有图形化界面的基因组组装软件。目前该软件支持linux和mac。关于VAGUE的介绍可以读读下面的英文信息。

VAGUE is a vague acronym for "Velvet Assembler Graphical Front End", which means it is a GUI for the Velvet de novo assembler. The command line version of Velvet can be complicated for beginners to use, but VAGUE makes it clear and simple.

基因组组装软件velvet以及参数优化

上面是软件的使用截图,更多软件的信息请访问:http://www.vicbioinformatics.com/software.vague.shtml

2、VelvetK

利用基于K-mer组装的软件的时候我们常常关心一个问题,K-mer值设置多少比较好呢?于是乎,我们常做的一件事情就是把很多个K-mer值都拿来试一下,看看哪个K-mer比较好。这不失为一种好办法,但是当数据量很大的时候确实有点浪费时间。

我记得之前在velvet的manual里面作者推荐了一个经验公式(如下文),该公式推荐的K-mer与reads覆盖度和reads长度相关。

All coverage values in Velvet are provided in k-mer coverage, i.e. how many times has a k-mer been seen among the reads. The relation between k-mer coverage Ck and standard (nucleotide-wise) coverage C is Ck = C  (L−k +1)/L where k is your hash length, and L you read length

这个经验公式也是一个定性的公式了。今天这里我们给大家推荐的另外一个软件VelvetK,这个软件可以告诉你k-mer选择多少比较合适。

下面是作者对velvetK的描述介绍:

VelvetK can estimate the best k-mer size to use for your Velvet de novo assembly. It needs two inputs: the estimated genome size, and all your sequence read files. The genome size can be supplied as as a number (eg. 3.5M) or as a FASTA file of a closely related genome. The reads can be FASTA or FASTQ, and may optionally be compressed with GZIP or BZIP2.

了解更多信息可以从这里进入:http://www.vicbioinformatics.com/software.velvetk.shtml

下面是velvetK的使用参数:

Synopsis:
  List suitable k-mer sizes given target genome and reads
Author:
  Torsten Seemann (torsten@seemann.id.au)
Usage:
  velvetk.pl [--size X | --genome F] [options] <readfile[.gz][.bz2] ...>
Options:
  --help          This help.
  --verbose!      Verbose output (default '0').
  --size=s        Target genome size in bp (can use k/M/G suffix) (default '0').
  --genome=s      Target genome (FASTA) (default '').
  --cov=i         Target k-mer coverage (default '25').
  --range=i       Print target +/- this range (default '10').
  --best!         Just print best k-mer to stdout (default '0').

3、VelvetOptimiser

上面介绍了在使用velvet过程中K-mer的参数如何设置,这只是一部分。下面给大家推荐另一款软件,VelvetOptimiser。这款软件的作用是,帮助你优化velvet的参数,针对你的数据,提供一个合理的参数,这些参数包括,K, -exp_cov, -cov_cutoff。

下面是该软件的描述:

VelvetOptimiser is a multi-threaded Perl script for automatically optimising the three primary parameter options (K, -exp_cov, -cov_cutoff) for the Velvet de novo sequence assembler.

想知道更多关于VelvetOptimiser的资料和介绍,请从这里进入:http://www.vicbioinformatics.com/software.velvetoptimiser.shtml

以上就是这次推荐的三款软件,希望跟对大家有所帮助。

发表评论

匿名网友