1. PHI-base数据库简介 PHI-base数据库从文献中收集经过实验验证了的致病基因和效应基因的序列。目前(20190411)数据库版本为4.6版本,从3011篇文献中收集了263种致病菌(细...
SRA、SAM以及Fastq文件高速下载方法
NCBI-SRA和EBI-ENA数据库 SRA数据库: Sequence Read Archive:隶属NCBI (National Center for Biotechnology I...
利用Homer进行motif分析–从实战到原理
一、不求甚解系列 软件下载及配置 conda安装: conda install -c bioconda homer 使用configureHomer.pl完成HOMER软件的配置 # 下载配置文件 w...
最权威人类HLA专题数据库:IPD-IMGT/HLA数据库使用指南
01 IPD-IMGT/HLA数据库简介 MHC是所有有颌脊椎动物基因组中的一个区域,编码免疫系统的核心成分。在人类中,它编码HLA。在HLA领域内,术语“等位基因”指的是点突变、插入和删失的组合,因...
使用FGAP进行补洞
1. FGAP简介 FGAP利用BLAST将contigs序列比对到基因组草图序列上,寻找重叠到gap区间的最优序列,从而进行补洞。其参考文献:Piro, Vitor C., et al. “FGAP...
使用 GCE 进行基因组大小评估
1. GCE 简介 GCE(Genome Characteristics Estimation) 是华大基因用于基因组评估的软件,其参考文献为:Estimation of genomic charac...
通过WIG格式将转录组数据展示到Gbrowse2中
1. WIG格式介绍 WIG格式(Wiggle Track Format),可用于将转录组数据进行可视化展示。bigWig格式则是WIG格式的二进制方式,可以使用wigToBigWig将WIG格式转换...
blast进行重复序列屏蔽
1. 构建数据库的时候屏蔽参考序列的重复 segmasker 屏蔽氨基酸的低复杂序列 dustmasker 屏蔽核算序列的低复杂序列 windowmasker 按照序列重复的次数来屏蔽 convert...
FPKM/RPKM之外的那些标准化方法
目录 1. 标准化 1.1. House-keeping gene(s) 1.2. spike-in 1.3. CPM 1.4. TCS 1.5. Quantile 1.6. Median of Ra...
使用SignalP对蛋白序列进行信号肽预测
1. 信号肽简介 信号肽是蛋白质N-末端一段编码长度为5-30的疏水性氨基酸序列,用于引导新合成蛋白质向通路转移的短肽链。信号肽存在于分泌蛋白、跨膜蛋白和真核生物细胞器内的蛋白中。 信号肽指引蛋白质转...