Next generation sequencing (NGS)
常使用的工具列表
- 质量控制Quality Control:FastQC、Fastx-toolkit
- 拼接Aligner:BWA,Bowtie, Tophat, SOAP2
- Mapper:Tophat, Cufflinks
- 基因定量 Gene Quantification: Cufflinks, Avadis NGS
- 质量改进 Quality improvement: Genome Analysis Toolkit(GATK)
- SNP: Unified Genotyper,Glfmultiple, SAMtools, Avadis NGS
- CNV: CNVnator
- Indel: Pindel, Dindel, Unified Genotyper, Avadis NGS
- Mapping to a gene: Cufflinks, Rsamtools, Genomic Features
相关的数据格式
- FASTQ:
- SAM: A generic nucleotide alignment format
- BAM: binary format
- VCF
数据处理的流程
RNAseq数据不容易分析的原因:
- 差异大,0~几万
- 基因多
- 巨大的变异
- 样本量小
鉴定SNP可供借鉴的经验
如果一个基因中SNP数目超过3个,10个碱基中SNP数目超过2个,这样的SNP就需要怀疑;
通过RNAseq、DNAseq鉴定SNP,有什么区别?
本质没有区别,但是RNAseq时,需要注意可变剪接造成的SNP。
原文来自:博耘生物 http://boyun.sh.cn/bio/?p=1862