做生信的基本上都跟NCBI-SRA打过交道,尤其是fastq-dump大家肯定不陌生.NCBI的fastq-dump软件一直被大家归为目前网上文档做的最差的软件之一",而我用默认参数到现在基本也没有出...
使用ComplexHeatmap包绘制热图
加载所需R包 library(ComplexHeatmap) require(circlize) # 设置工作路径 setwd("/Users/Davey/Desktop/") # 清除当前环境中的变...
ComplexHeatmap绘制全基因组突变景观图
ComplexHeatmap R包是Zuguang Gu编写的,也是现在文章中利用的较多的R包。这个包能实现的功能很强大,今天给大家介绍一下利用ComplexHeatmap R包中的oncoprint...
多元分类(Multi-label classification)性能评价之宏平均(macro-average)与微平均(micro-average)
通常,我们在评价classifier的性能时使用的是accuracy,考虑在多类分类的背景下 accuracy = (分类正确的样本个数) / (分类的所有样本个数) 这样做其实看上去也挺不错的,不过...
bowtie结果sam文件解读
sam文件解读 @HD VN:1.0 SO:unsorted @SQ SN:chr1 LN:249250621 @SQ SN:chr2 LN:243199373 @PG ID:Bowtie VN:1....
ggtree美化进化树
研究基因功能的人建个树,需要找近缘物种、外类群十几至几十个物种,费N天的劲才能做个树。而宏基因组领域的人不用去收集其它物种,因为研究的对像本身就有几百到几千的物种,为了方便阅读或展示主要信息,我们反而...
QIIME2官方帮助文档的中文版
声明:本文为QIIME2官方帮助文档的中文版,由中科院遗传发育所刘永鑫博士翻译并亲测有效,文档翻译己获QIIME2团队官方授权。由于QIIME2更新频繁,如使用中遇到问题请访问QIIME2官方论坛阅读...
三维基因组常用分析工具汇总
Hi-C技术主要将空间结构临近的DNA片段进行交联,并将交联的DNA片段富集,然后进行高通量测序,对测序数据进行分析即可揭示全基因组范围内的染色体片段间的交互作用。利用Hi-C技术可以揭示基因组的一般...
利用ggplot2从0开始绘制PCA图
PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法。在数据分析以及生信分析中会经常用到。 本文利用R语言的ggplot2包,从头带您绘...
主成分分析(PCA)原理
主成分分析(Principal components analysis,以下简称PCA)是最重要的降维方法之一。在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用。一般我们提到降维最容易想到...