不同长度mate-pair在组装上之差异

有时候会遇到使用者询问,为什么做不同长度的mate-pair呢? 这是因为contig间的距离不同,为了将这些不同距离的contig 组装起来,得到更完整的组装信息,所以才需要使用不同长度的mate-pair。

以下就用一个简化的例子来说明不同 mate-pair 在组装效果上的差异:

假设我们有三个contig,这三个contig在genome上的距离如下:

不同长度mate-pair在组装上之差异-图片1

假如我们使用的是距离1k的mate-pair,那么我们可以得到contig 1 和contig 2之间的关系。

不同长度mate-pair在组装上之差异-图片2

但是contig 2 和 contig 3 呢? 无论是从contig 2 向右连

不同长度mate-pair在组装上之差异-图片3

或是从 contig 3向左连

不同长度mate-pair在组装上之差异-图片4

我们都无法得到 contig 2 和 contig 3 相对位置的信息。

倘若我们所使用的是距离 4K 的mate-paired 呢?

那我们只能得到 contig 1 与 contig 3相对位置的信息

不同长度mate-pair在组装上之差异-图片5

却缺少了 contig 1 与 contig 2 的信息。

因此,搭配不同长度的 mate-pair,我们才比较容易得到 contig 间较完整的信息,而得到较好的组装效果。

发表评论

匿名网友

拖动滑块以完成验证