一般成熟的miRNA长度在22nt左右,在过去miRNA主要是从已知的基因组序列中来预测,但是遗憾的是并不是所有的生物都有全基因组序列。现在随着新一代高通量测序技术的发展,即使没有全基因组序列我们也能从分离的RNA中直接测序,并且可以分析miRNA的表达丰度。
但是在测序过程中给我们往往会遇到的如下两个方面的问题:
1)miRNA太短了(22nt),现在的测序仪譬如solexa或者hiseq基本都能测到75-110nt;
2)现在高通量测序的产出譬如hiseq一道能产生30G左右的数据,但是对于一个样品,我们不需要测这么多的数据是不是太浪费了。
当有了接头序列,以上的问题都引刃而解了。
下面列出在构建文库时的miRNA与接头链接示意图:
如上所示,对于某一个样品中miRNA,都接上同一种接头(linker)。一般接头序列长度大约74nt,同时带一个ploy-A的尾巴。这样算上miRNA,linker+miRNA连在一起的长度约96nt,这样刚好可以用于测序。
同时为了充分利用新一代测序的高通量特性,可以将不同样品中的miRNA加上不同接头,然后混在一起测序。不同的接头序列在接头中间位置,有一个可变区域。上级测得的混合数据,就可以利用这个可变区域以及其两侧固定的序列,将来自不同样品中的miRNA数据分开。
为了让大家更清楚地理解接头序列,下面附上几个纯接头序列的alignment结果图:
参考原文:http://www.homolog.us/blogs/2012/07/18/sequencing-mirnas-with-ngs-technology/