使用EBI的InterPro数据库,能对蛋白序列通过结构域方法进行基因家族分类注释。InterPro数据库整合了13个基因家族、结构域和功能位点的数据库,包括Pfam和CDD等。此外,InterPro...
生物信息常见文件的格式以及查看方式
生信分析过程中,会与很多不同格式的文件打交道,除了原始测序数据fastq之外,还需要准备基因组文件fasta格式和基因注释文件gtf格式。在分析的过程中还会有众多中间文件的生成,如bed、bed12、...
ggplot2 – 二维数据密度图
地理课上,我们经常会看到等高线。在ggplot2中,也有实现一个和等高线差不多的利器 stat_density2d() 看个例子先 # The base plot p <- ggplot(fai...