bwa的使用方法

2011/03/06评论29,465

bwa的使用需要两中输入文件：

Reference genome data（fasta格式 .fa, .fasta, .fna）
Short reads data (fastaq格式 .fastaq, .fq)

step 1: 建立 Index
根据reference genome data(e.g. reference.fa) 建立 Index File
[code lang="bash"]
bwa index -a bwtsw reference.fa
[/code]

bwa index 指令更多的用法及 options，通过以下的命令来查看
[code lang="bash"]
bwa index
[/code]

step 2: 寻找 SA coordinates
如果是pair-end 数据（leftRead.fastq和rightRead.fastq）两个文件分别处理
[code lang="bash"]
bwa aln reference.fa leftRead.fastq > leftRead.sai
bwa aln reference.fa rightRead.fastq > rightRead.sai
bwa aln reference.fa singleRead.fastq > singleRead.sai
[/code]

如果希望多线程运行，在其中加入 -t这个参数，另外-f这个参数可以指定结果输出文件，如:
[code lang="bash"]
bwa aln -c -t 3 -f leftreads.sai reference.fa leftreads.fastq
[/code]

step 3:转换SA coordinates输出为sam
如果是pair-end数据
[code lang="bash"]
bwa sampe -f pair-end.sam reference.fa leftRead.sai rightRead.sai leftRead.fastq rightread.fastq
[/code]
如果是single reads数据
[code lang="bash"]
bwa samse -f single.sam reference.fa single.sai single.fastq
[/code]

值此Reads的mapping工作已经完成，关于bwa更详细的用法以及输出结果SAM文件的格式说明，可以参考官方文档.
http://bio-bwa.sourceforge.net/bwa.shtml

发表评论