第二代测序技术中Solexa以及它的升级版Hiseq,目前使用最多。为了帮助PLoB网友进一步了解Solexa相关的概念。与大家分享一篇网上看到的文章《Solexa测序技术中常见术语解释》,文章后面有参考来源链接。更多相关信息欢迎加入PLoB 2000人的生物信息QQ群(群号:235461986)来讨论,有相关测序以及生物信息学问题需要解答欢迎前来。下面直接附上相关的解释。大家同时可以结合上面的示意图,了解Solexa与Hiseq的基本结构。
SBS:边合成边测序反应,每次SBS会延伸一个碱基,大约耗时70分钟。
Run:单次上机测序反应,可以产生4G-75G测序通量不等。
Lane:单泳道,每条泳道可以直接物理区分测序样品,1次run最多可以同时上样8条Lane。
Channel:Lane的同义词。
Tile:小区,每条Lane中排有2列tile,合计120个小区。每个小区上分布数目繁多的簇结合位点。
Cluster:簇,在Solexa测序技术中会采用桥式PCR方式生产DNA簇,每个DNA簇才能产生亮度达到CCD可以分辨的荧光点。
Index:标签,在Solexa多重测序(Multiplexed Sequencing)过程中会使用Index来区分样品,并在常规测序完成后,针对Index部分额外进行7个循环的测序,通过Index的识别,可以在1条Lane中区分12种不同的样品。
Barcode: Index同义词
Fasta:一种序列存储格式。一个序列文件若以FASTA格式存储,则每一条序列的第一行以“>”开头,而跟随“>”的是序列的ID号(即唯一的标识符)及对该序列的描述信息;第二行开始是序列内容,序列短于61nt的,则一行排列完;序列长于61nt的,则每行存储61nt,最后剩下小于61nt的,在最后一行排列完;第二条序列另起一行,仍然由“>”和序列的ID号开始,以此类推。
Fastq:Fastq是Solexa测序技术中一种反映测序序列的碱基质量的文件格式。第一行以“@”符号开头,后面紧跟一个序列的描述信息;第二行是该序列的内容;第三行以“+”符号开头,后面紧跟的内容与第一行一样,同样是该序列的描述信息;而第四行是第二行中的序列内容每个碱基所对应的测序质量值。
PF%:PF%是指符合测序质量标准的簇的百分比(Multiplexed Sequencing),与测序的通量相关联。
Read:Solexa是成簇反应的,每个簇对应一条DNA序列片段,成为一个read。
名词解释与图片的参考来源:http://www.igenomics.com.cn:7001/ajgene/jsp/ajweb/News.jsp?cid=C47825F27EC00001B8BF8B8D11C01D10