作者:牛登科 学过生物学的人可能都知道乳糖操纵子。在大肠杆菌基因组中,乳糖分解、运输的三个基因连在一起,由前端共同的Promoter区域调节三个基因的表达。这三个基因,就像俗话中一根绳上的蚂蚱。操纵子...
生物学重复与技术重复
在利用基因芯片或者RNA-seq做基因表达分析的时候,经常听说生物学重复和技术重复,这篇文章我们就来简单介绍二者的含义。 首先利用一张示意图对二者做一个简单介绍: 使用同一个抽提的RNA...
各种PCR介绍
PCR可以说是目前分子生物学实验中应用最为广泛的一种技术。从最初的在几个水浴锅里把试管放来放去,到现在各种先进的PCR仪, 到REAL TIME PCR。 设备是越来越先进,方法是越来越多,但基本的原...
PacBio Sequences的HDF5格式
HDF5 is a data format designed by National Center for Supercomputing Applications at UIUC to rapidly...
什么是selective sweep?
最近看到的几篇涉及进化的文章里面都提到selective sweep,特地对这个词进行了了解,搜到了一些资料与大家分享一下。 先贴上维基百科上的介绍: A selective sweep is the...
Pacific Bio Sequences
Pacific bio sequences fall at other extreme from Illumina Solexa data. The reads are very long (~5kB...
直系同源与旁系同源
Homologous sequences. Orthologs and Paralogs are two types of homologous sequences. Orthology descri...
高通量测序技术相关的名词解释
高通量测序技术是对传统测序一次革命性的改变,一次对几十万到几百万条DNA分子进行序列测定,因此在有些文献中称其为下一代测序技术(next generation sequencing)足见其划时代的改变...
基因组拼接中常见的名词解释
Read:高通量测序平台产生的序列就称为reads。 Contig:拼接软件基于reads之间的overlap区,拼接获得的序列称为Contig(重叠群)。 Scaffold:基因组de novo测序...
GFF格式说明
gff格式是Sanger研究所定义,是一种简单的、方便的对于DNA、RNA以及蛋白质序列的特征进行描述的一种数据格式,比如序列的那里到那里是基因,已经成为序列注释的通用格式,比如基因组的基因预测,许多...