使用Trimmonmatic进行NGS reads的过滤与修剪

1. Trimmomatic

Trimmomatic使用JAVA运行,速度快。同时该软件进行reads QC的原理非常好。因此,最推荐使用此软件进行NGS reads的QC。
参考文献:Lohse M, Bolger AM, Nagel A, Fernie AR, Lunn JE, Stitt M, Usadel B. RobiNA: a user-friendly, integrated software solution for RNA-Seq-based transcriptomics. Nucleic Acids Res. 2012 Jul;40(Web Server issue):W622-7.

2. 常用例子

  1. java -jar /opt/biosoft/Trimmomatic-0.30/trimmomatic-0.30.jar PE \ -threads 20 -phred33 reads1.fastq reads2.fastq \ reads1.clean.fastq reads1.unpaired.fastq reads2.clean.fastq reads2.unpaired.fastq \ ILLUMINACLIP:/opt/biosoft/Trimmomatic-0.30/adapters/TruSeq3-PE.fa:2:30:10 \ LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:50

3. 使用参数

有关该软件的详细使用方法,见: Trimmomatic: A flexible read trimming tool for Illumina NGS data

  1. PE/SE
  2. 设定对Paired-EndSingle-Endreads进行处理,其输入和输出参数稍有不一样。
  3. -threads
  4. 设置多线程运行数
  5. -phred33
  6. 设置碱基的质量格式,可选pred64
  7. ILLUMINACLIP:TruSeq3-PE.fa:2:30:10
  8. 切除adapter序列。参数后面分别接adapter序列的fasta文件:允许的最大mismatch
  9. 数:palindrome模式下匹配碱基数阈值:simple模式下的匹配碱基数阈值。
  10. LEADING:3
  11. 切除首端碱基质量小于3的碱基
  12. TRAILING:3
  13. 切除尾端碱基质量小于3的碱基
  14. SLIDINGWINDOW:4:15
  15. Perform a sliding window trimmingWindowssize4个碱基,其平均碱基
  16. 质量小于15,则切除。
  17. MINLEN:50
  18. 最小的reads长度
  19. CROP:<length>
  20. 保留reads到指定的长度
  21. HEADCROP:<length>
  22. reads的首端切除指定的长度
  23. TOPHRED33
  24. 将碱基质量转换为pred33格式
  25. TOPHRED64
  26. 将碱基质量转换为pred64格式

软件的详细使用方法请参考使用手册:http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/TrimmomaticManual_V0.30.pdf

原文来自:http://www.chenlianfu.com/?p=1948

发表评论

匿名网友

拖动滑块以完成验证
加载失败