1 Rle(Run Length Encoding,行程编码) 1.1 Rle类和Rle对象 序列或基因最终要定位到染色体上。序列往往数量非常巨大,但染色体数量很少,如果每条序列的染色体定位都显式标注...
R/BioC序列处理之四:BSgenome简介
一、BSgenome和BSgenome数据包 Bioconductor提供了某些物种的全基因组序列数据包,这些数据包是基于Biostrings构建的,称为BSgenome数据包。不同物种的BSgeno...
R/BioC序列处理之三:Biostrings模式匹配和序列比对
Biostrings最后一节,介绍模式匹配和序列比对的相关函数和操作。 下面我们使用拟南芥基因转录起始点上游1kb的序列进行分析。序列文件可以从TAIR网站(http://www.arabidopsi...
R/BioC序列处理之二:Biostrings序列的基本操作
还是先获取随机DNA序列和其他序列对象: library(Biostrings) rndSeq <- function(dict, n) { paste(sample(dict, n, repl...
R/BioC序列处理之一:Biostrings常量与序列容器
序列说到底就是文本/字符串类型的数据,你完全可以用纯纯的R base函数来处理,只是太麻烦,而且效率很低。BioC的IRanges包从数据结构和运算规则等角度对生物序列做了很细致的定义,是使用R高效处...