摘要:自1953年,剑桥大学科学家弗朗西斯.克里克(Francis crick)和博士詹姆斯华生(Jamers waston)发现DNA双螺旋结构以来,已经走过近60年。在这期间,有关DNA的研究如火如荼。DNA碱基排列顺序中存在生物的遗传信息,为了的到DNA碱基顺序,研究者先后研发出不同的测序技术获得碱基信息。从1953年至今,碱基测序技术可以划分为三代,下面主要介绍第一代、第二代测序原理及其存在的优劣。
关键词:cDNA sanger测序法 焦磷酸测序法 第二代测序法
1、1977第一代—sanger测序法及Maxam-Gilbert化学裂解法。
1.1sanger测序法
1977年英国的F.sanger设计了 Sanger双脱氧链终止法[1],其原理:双脱氧链末端终止法通过使用链终止剂—类似于正常dNTP的2’,3’-双脱氧核苷三磷酸ddATP、ddTTP、ddCTP、ddGTP,将延伸的DNA链特异性地终止。其反应体系也包括单链模板、引物、4种dNTP和DNA聚合酶。共分四组,每组按一定比例加入一种ddNTP,它能随机渗入合成的DNA链,一旦渗入合成即终止,于是各种不同大小片段的末端核苷酸必定为该种核苷酸,再通过电泳分离,可以从放射自显影带上直接阅读DNA的核苷酸序列。
由于放射性同位素标记对实验人员的身体有害及准确性低等原因,又对sanger测序法进行了技术上的改进,采用荧光素标记、毛细管电泳的全自动测序技术。
1.2 Maxam-Gilbert化学裂解法
1977年,A.M.Maxam和W.Gilbert首先建立了DNA片段序列的测定方法—Gilbert化学裂解法原理:将待测DNA片段的5’端磷酸基团作放射性标记,再分别采用不同的化学方法对特定碱基进行化学修饰并在该位置打断核苷酸链,从而产生一系列长度不一且分别以不同碱基结尾的DNA片段,这些以特定碱基结尾的片段群通过并列点样(Lane-
by-lane)的方式用凝胶电泳进行分离,再经放射自显影技术,即可读出目的DNA的碱基序列。由于sanger测序法测定碱基序列长度在Kb-Mb数量级而Gilbert化学裂解法测定的长度大约250个bp左右并且准确性方面高于Gilbert化学裂解法,所以在第一代测序法中,应用最为广泛的就是Sanger测序法。尽管第一代测序法远不如第二代测序法,但是其(Sanger测序法)为科学研究作出的贡献功不可没:
(1)1996年第一次完成对单细胞真核生物(酿酒酵母)的基因组测序。
(2)1998年第一次对多细胞真核生物(线虫)基因组的测序。
(3)2000年完成第一个植物基因组(拟南芥)的测序。
(4)1990-2003年人类基因组计划(HGP)。
1.3 焦磷酸测序技术
焦磷酸测序技术是由Ronaghi [2-3]等在1987年发展的另一种DNA测序技术。其核心是四种酶[DNA聚合酶(DNAPolymerase)、ATP、硫酸化酶(ATP sulfurylase)、荧光素酶(iuciferase)和双磷酸酶]催化的同一反应体系中的酶级联反应。焦磷酸测序的基本原理与过程:
首先制备待测序的DNA模板(通过PCR),PCR的引物之一是用生物素标记。PCR产物和偶联素的微珠孵育,DNA双链经碱变性分开,纯化得到含生物素标记引物的待测序单链,并和测序引物结合成杂交体,测序反应的过程为:第一步:将测序引物杂交到PCR扩增的模板上,加入DNA聚合酶、ATP硫酸化酶、荧光素酶、双磷酸酶及其反应底物:5’-磷酰硫酸(APS)、荧光素组成一个反应体系共孵育。第二步:在每一轮测序反应中, 只能加入4 种dNTP(dATPαS、dTTP、dCTP、dGTP)之一,如该dNTP与待测模板配对,聚合酶就可以催化该dNTP掺入到引物链中,并释放出等摩尔数的焦磷酸基团(PPi)。注意的是,反应中不能加入dATP,因为其能被荧光素酶分解,对后面的荧光强度测定影响很大,而dATPαS(S原子取代了dATP分子αP=O上O原子)对荧光素酶分析的影响比dATP低500倍,因此用dATPαS来替代自然状态下的dNTP。第三步:硫酸化酶催化APS和PPi形成等摩尔数的ATP。ATP驱动荧光素酶介导的荧光素向氧化荧光素(oxyluciferin)转化,氧化荧光素发出与ATP量成正比的可见光信号。光信号由CCD摄影机检测并由Pyrogram反应为峰。峰的高度(光信号强度)与反应中掺入的核苷酸数目成正比。第四步:ATP和未掺入的dNTP由双磷酸酶降解,淬灭光信号,并再生反应体系。然后就可以加入下一种dNTP。然后就可以加入下一种dNTP。第五步:上述过程的循环,互补DNA链合成,DNA序列由Pyrogram的信号峰确定,通过信号峰的有无判断碱基的种类,用信号峰的高低确定碱基数目[4]。
焦磷酸测序技术与Sanger测序技术相比,前者脱离凝胶电泳等步骤,是边合成边测序的一种,工作效率大大提高,测序成本也大大降低,为第二代某些碱基测序技术的基础。
2、第二代测序法—三大测序公司(Illumina、454、ABI)的测序仪主导市场
2.1. Illumina Solex技术的基本原理及过程:
(1)文库制备
将基因组DNA打成几百个碱基(或更短)的小片段,在片段的两个末端加上接头(adapter)。
(2)产生DNA簇
利用专利的芯片,其表面连接有一层单链引物,DNA片段变成单链后通过与芯片表面的引物碱基互补被一端“固定”在芯片上。另外一端(5’或3’)随机和附近的另外一个引物互补,也被“固定”住,形成“桥 (bridge)“。反复30轮扩增,每个单分子得到了1000倍扩增,成为单克隆DNA簇。DNA簇产生之后,扩增子被线性化,测序引物随后杂交在目标区域一侧的通用序列上。
(3)测序—边合成边测序(Sequencing By Synthesis)的原理:
加入改造过的DNA聚合酶和带有4种荧光标记的dNTP。这些核苷酸是“可逆终止子”,因为3’羟基末端带有可化学切割的部分,它只容许每个循环掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复3'端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的序列。目前的配对末端读长可达到2×50 bp,更长的读长也能实现,但错误率会增高。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割。
(4)数据分析
自动读取碱基,数据被转移到自动分析通道进行二次分析。
2.2. ROCH-454技术的基本原理及过程[5]:
(1)样品输入并片段化
样品来源,如基因组DNA、PCR产物、RNA等小序列片段,若样品碱基的数量级在Kb以上,则要打断为300-800bp左右;对于小分子的非编码RNA或者PCR扩增产物,这一步则不需要。短的PCR产物则可以直接跳到步骤(3)。
(2)文库制备
借助一系列标准的分子生物学技术,将A和B接头(3’和5’端具有特异性)连接到DNA片段上。接头也将用于后续的纯化,扩增和测序步骤。具有A、B接头的单链DNA片段组成了样品文库。
(3)单链DNA文库被固定在特别设计的DNA捕获磁珠上。每一个磁珠携带了一个独特的单链DNA片段。磁珠结合的文库被扩增试剂乳化,形成油包水的混合物,这样就形成了只包含一个磁珠和一个独特片段的微反应器。
(4)乳液PCR扩增
独特片段在微反应器复制,没有竞争及污染序列的影响。乳液被打破后,上百万拷贝序列仍结合在磁珠上。
(5)携带DNA的捕获磁珠随后放入PTP板中进行后继的测序。然后将PTP板放入测序仪中,含有四种碱基的四个单独的试剂瓶,根据A、T、C、G的顺序依次循环进入PTP板中,然后根据焦磷酸测序技术,利用软件分析数据,确定碱基的顺序。
2.3 ABI测序原理及其过程:
ABI测序与其它第二代测序技术最大不同点在于前者使用的是DNA连接酶,而不是DNA聚合酶且使用了荧光探针。
(1)文库制备
基因组DNA打断,两头接上接头,制成文库,若是转录组测序,也可以反转录成cDNA,然后制成文库。
(2) 乳液PCR/微珠富集
在PCR反应前,将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴,这就构成了独立的PCR反应空间。理想状态下,每个小水滴只含一个DNA模板和一个P1磁珠,由于水相中的P2引物和磁珠表面的P1引物所介导的PCR反应且拷贝数量级呈指数增长,PCR反应结束后,P1磁珠表面就固定有拷贝数目巨大的同来源DNA模板扩增产物。
(3) 微珠沉积
3’修饰的微珠沉积在一块玻片上。在微珠上样的过程中,沉积小室将每张玻片分成1个、4个或8个测序区域。SOLiD系统最大的优点就是每张玻片能容纳更高密度的微珠,在同一系统中轻松实现更高的通量。
(4) 连接测序
SOLiD连接反应的底物是8碱基单链荧光探针混合物,探针的5’末端分别标记了6-FAM、CY5、CY3、Texas Red这4种颜色的荧光染料;探针3’端1~5位为随机碱基,其中第1、2位构成的碱基对是表征探针染料类型的编码区,而3~5位的“n”表示随机碱基,6~8位的“z”指的是可以和任何碱基配对的特殊碱基。单向SOLiD测序包括五轮测序反应,每轮测序反应含有多次连接反应。第一轮测序的第一次连接反应由连接引物“n”介导,由于每个磁珠只含有均质单链DNA模板,所以这次连接反应掺入一种8碱基荧光探针,SOLiD测序仪记录下探针第1、2位编码区颜色信息,随后的化学处理断裂探针3’端第5、6位碱基间的化学键,并除去6~8位碱基及5’末端荧光基团,暴露探针第5位碱基5’磷酸,为下一次连接反应作准备。第一轮的第一次反应,模板链增加了5个碱基,1、2位上的碱基根据荧光颜色可以确定是哪几种,所以第二次反应,从6-10位,又增加5个碱基,6、7位碱基可以根据荧光颜色读取,以此类推可以知道11位、12位、16位、17位……
第二轮连接引物n-1比第一轮错开一位,可以得到0、1位起始的若干碱基颜色信息,五轮测序反应反应后,按照第0、1位,第1、2位... …的顺序把对应于模板序列的颜色信息连起来,就得到由“0,1,2,3…”组成的SOLiD原始颜色序列。
(5) 数据分析
测序完成后,获得了由颜色编码组成的SOLiD原始序列。根据双碱基编码对应的颜色,可以推断出碱基的种类。
3、第一代与第二代测序技术的比较
第一代测序技术凭借其在读长和准确率方面的优势,适合对新物种进行基因组长距离框架构建和后期Gap的填补,以及测序长度为kb—Mb级别的小规模项目,但在处理大批量测序任务和微量DNA样品测序时,成本高、速度慢、通量低,且需要大量专业技术人员全程操作。1990年启动的人类基因组计划,耗资30亿美元,耗时13年完成,而第二代测序技术对人类基因组计划的完成,只需要几天时间、几千美元。
第二代测序技术相比于第一代测序技术的整体优势在于高通量、耗资少。另外,不同原理的测序产品各有所长,如,SOLID 4 HQ package将使每次运行产生300GB可定位的序列数据,其每个碱基需要测序两次,所以带来了99.99%的准确率[6];在新一代测序技术中454的读长仍最具优势,目前已增至400bp以上[7];Solexa较454具有读长相对较短、通量高、成本低的特点,适合于microRNA、转录组等小片段核苷酸的测序[8]。
小结
从1977年第一代测序法的问世到2011年高通量测序法的广泛应用,陆续揭秘了海量的遗传信息。碱基测序整体趋势向着快速、高通量、耗资少、准确率高的方向发展。在第2代测序平台不断完善和广泛应用的当今,第3代测序技术已经初现端倪,其中比较被大家所看好的主要有Helico BioScience、Pacific的单分子测序技术和基于纳米孔的测序技术[9-10]。2008年,Helicos Biosciences公司的HeliScope遗传分析系统上市,利用这个技术.美国斯坦福大学的科学家,仅花费约5万美元,历时4周,便成功地完成了人的基因组测序[11]。相信不久的将来,测序技术上的革新会对生物学和生物医学研究领域带了新的突破与发现。
参考文献
[1]Sanger F,Nicklen S,Coulson AR.DNA sequencing with chain•terminating inhibitors[J].Proc Natl Acad Sci U S A 1977;74:5463—7.
[2]Ronaghi M ,Karamohamed S , Pettersson B ,et al. Real-time DNA sequencing using detection of pyrophosphate release.Anal Biochem ,1996 ,242 (1):84289.
[3]Nyren P , Karamohamed S ,Ronaghi M. Detection of single-base changes using a bioluminometric primer extension as-say. Anal Biochem ,1997 ,244 (2) :3672373.
[4]倪红兵,等.焦磷酸测序技术及其应用进展.[J].国外医学临床生物化学与检验学分册.2005,9,26(9):600-605
[5]许冠东.Genome Sequencer FLX引领快速基因组测序时代的到[J].
微生物学通报.2008,35(1):149-151.
[6]Clark MJ,Homer N,O’Connor BD,Chen Z,Eskin A,Lee H,et a1.U87MG decoded:the genomic sequence of a cytogenetically aberrant human cancer cell line[J].PloS Genet:6:e1000832.
[7]Steuemagel B,Taudien S,Gundlach H,Seidel M,Ariya—dasa R,Schuhe D,et a1.De novo 454 sequencing of bar—coded BAC pools for comprehensive gene survey and genome analysis in the complex genome of barley[J].BMC Genomics 2009;10:547.
[8]李庆岗.高通量测序技术及其在生命科学中的应用[J].畜牧与饲料科学.2012,33(2):25-28
[9]Shendure J,Ji H.Next—generation DNA sequencing[J].Nat Biotechnol 2008;26:1135—45.
[10]Schuster SC.Next—generation sequencing transforms today’s biology[J].Nat Methods 2008;5:16—8.
[11]莫德林,赵晓,李安宁,等.应用深度测序技术对脂肪型猪和瘦肉型猪的不同发育时期的骨骼肌进行比较转录谱研究[C],/第十六次全国动物遗传育种学术讨论会论文集.北京: 中国畜牧兽医学会动物遗传育种学分会,2011:340.