picbio三代测序原理

picbio三代测序原理
picbio三代测序原理

三代测序之PacBio SMRT技术全解析

2017-05-11 11:29 来源:基因谷技术

气温回升,天气渐暖,

花儿开了一簇又一簇~

在这美好的季节里,

我们准备聊点新话题。

今天小编要来和你分享:

PacBio SMRT测序那些事儿~

测序技术在近几年中又有里程碑的发展,Pacific Biosciences公司成功推出商业化的第三代测序仪平台,让三代测序正式走入我们的视线。与前两代相比,第三代测序有什么不同呢?今天小编带大家详细了解测序界新宠-PacBio SMRT测序平台。

PacBio SMRT测序原理

Pacific Biosciences公司研发的单分子实时测序系统(Single Molecule Real Time,SMRT)应用了边合成边测序的原理,并以SMRT芯片为测序载体。基本原理如下:

聚合酶捕获文库DNA序列,锚定在零模波导孔底部

4种不同荧光标记的dNTP随机进入零模波导孔底部

荧光dNTP被激光照射,发出荧光,检测荧光

荧光dNTP与DNA模板的碱基匹配,在酶的作用下合成一个碱基

统计荧光信号存在时间长短,区分匹配碱基与游离碱基,获得DNA序列

酶反应过程中,一方面使链延伸,另一方面使dNTP上的荧光基团脱落

聚合反应持续进行,测序同时持续进行

PacBio SMRT测序原理

PacBio SMRT的单分子测序和超长读长是如何实现的?我们重点看一下该技术的两点关键创新:分别是零模波导孔(zero-mode waveguides, ZMWs)和荧光标记在核苷酸焦磷酸链上(Phospholinked nucleotides)。

SMRT Cell含有纳米级的零模波导孔,每个ZMW都能够包含一个DNA聚合酶及一条DNA样品链进行单分子测序,并实时检测插入碱基的荧光信号。ZMW是一个直径只有10~50 nm的孔,当激光打在ZMW底部时,只能照亮很小的区域,

DNA聚合酶就被固定在这个区域。只有在这个区域内,碱基携带的荧光基团被激活从而被检测到,大幅地降低了背景荧光干扰。

SMRT Cell和ZMWs

将荧光染料标记在核苷酸的磷酸链而不是碱基上,当核苷酸掺入到新生的链中,标记基团就会自动脱落,减少了DNA合成的空间位阻,维持DNA链连续合成,延长了测序读长。SMRT测序最大限度地保持了聚合酶的活性,是最接近天然状态的聚合酶反应体系。

荧光标记在焦磷酸链上的核苷酸

PacBio SMRT测序送样要求

PacBio SMRT测序建库流程

DNA打断之后,经过末端修复、接头连接、片段筛选、杂交测序引物和聚合酶绑定,即可出库准备上机测序,建库过程无PCR反应。

PacBio SMRT建库流程

PacBio SMRT技术特点

PacBio SMRT技术有两种测序平台,RSⅡ和Sequel,应该如何选择?小编已将二者的对比表准备好啦~

表3 RSⅡ和Sequel测序平台比较

Sequel平台与RSII平台相比具有很大的优势,Sequel平台测序通量高、单Gb数据成本低、周期短。

1.第三代基因测序技术又被为"Single Molecule Real Time (SMRT?) DNA Sequencin

g"(单分子实时DNA测序技术),该方法基于纳米孔的单分子读取技术,不需要扩增即可快速读取序列。目前,Pacific Biosciences公司已经成功推出了商业化的第三代测序仪PacBio RS平台,使得第三代测序正式走入人们的视角。

PacBio RS II是Pacific Biosciences公司研发的单分子实时测序系统(Single M olecule Real Time, SMRT),其专利的SMRT Cell含有15,000个纳米级的零模波导孔(zero-mode waveguides, ZMWs),每个ZMW都能够包含一个DNA聚合酶及一条DNA样品链进行单分子测序,并实时检测插入碱基的荧光信号。

2. 2

?技术特点

ü??利用测序过程聚合酶反应的动力学变化,首次实现对碱基修饰进行直接测序。

ü??超长的读长:平均测序读长能达到7,000-8,000bp,最长读长能达到3,0000bp;

ü??准确率高:对基因组组装和基因组变异检测,可以最多达到99.999%的准确率;

ü??敏感性强:可以检测频率在0.1%的minor variants;

ü??无PCR扩增偏好性:样本不需要进行PCR扩增,避免了覆盖度不均一和PCR art ifacts;

ü??最小的GC偏好性(GC bias):在极端高GC和极端低GC区域,可以轻松测定,从而保证序列的均匀覆盖度。

3. 3

数据产出

试剂盒 ? ? ? ? ? ? ? ? ? ??平均读长 ? ??数据量/SMRT Cell

P4-C2 Chemistry ??5.5-6Kb ? ? ??~200Mb

P5-C3 Chemistry ? ?8-10Kb ? ? ??~250Mb

4. 4

应用领域

(1)全基因组de novo测序

与二代测序最高不超过1kb的读长相比,PacBio RS II的长读长将有效解决短序列数据的拼接难题。同时,与二代测序的模板样品需要扩增相比,PacBio RS II无需扩增可直接对单个分子进行测序,有效避免了PCR扩增偏好性和GC偏好性,PacBi o RS II可轻松跨越GC含量异常(过高或过低)及高度序列重复的区域,实现序列覆盖的完整性和均一性。

(2)基因组草图的优化或基因组完成图绘制

对前期已开展测序的动植物、微生物基因组结合三代长读长测序数据进行完善和提升。针对前期已经开展全基因组测序,获得基因组草图的动植物、微生物等,可以

结合PacBio RS II平台长读长reads进行补充,从而快速获得前期没有测得的信息及提升基因组的完整度。另外还可以针对前期没有检测获得的结构变异信息(stru ctural-variation events)、串联重复序列信息(tandem duplication)、易位信息(Inversion)等。尤其在微生物基因组完成图的绘制中,可在一天之内、成本低于$1,000即可将基因组完善获得0 gap contig。

(3)全长转录本测序

PacBio RS II的长读长可实现全长转录本测序,并使基因可变剪接形式的识别成为可能,因此可以对新基因及其isoform进行更全面的研究。同时,长读长不再需要对RNA-Seq的reads进行组装,因此可以更完整的对基因模型和转录的基因进行更全面的注释,用以改进参考基因组中的基因注释信息。

(4)宏基因组测序

长读长reads能够更为精准地鉴定水体、土壤、肠道等生境中微生物的种类的鉴定,能够更加快捷地获得更多微生物种的全基因组序列。

(5)16S rDNA全长测序

PacBio RS II的平均读长为8-10Kb,而16S rDNA长度大约为1540bp,因此结合该平台测序可以成功测序获得16S的全长序列。

(6)细胞器基因组测序

叶绿体基因组和线粒体基因组序列都包含重复序列、反向重复序列等复杂结构,Pa cBio RS II的长读长可直接跨越这些区域获得这些细胞器的全基因组序列信息等,基因组组装不依赖于是否有近缘物种的线粒体和叶绿体基因组信息等、重测序能够检测到全面的SNPs及indel信息。

(7)全基因组重测序&稀有变异鉴定

PacBio RS II长读长测序reads无GC偏号,能够全面获得基因组的遗传变异,包括SNPs的鉴定到CNV、SV结构变异等,可运用至人类癌症基因组重测序等。PacBi o RS II平台测序周期在10 hours小时即可完成测序,可应用至需要快速反馈的临床检测中,如细菌感染疾病中细菌的鉴定、病毒的鉴定等,取样开展重测序和目前已有的细菌、病毒基因组数据库进行比对鉴定即可。

(8)表观遗传学

PacBio RS II利用测序过程聚合酶反应的动力学变化,首次实现对碱基修饰进行直接测序。当碱基有额外修饰时,DNA聚合酶的合成速度会减慢,对应的信号会被检测出来。每种碱基修饰事件都会使聚合酶的“停顿模式”PacBio RS II产生微小差异,最终反映到荧光脉冲信号的间隔上。除了甲基化修饰,还可以检测5-hC、5-hm U、5-hU、1-mA、6-mA、8-oxoA、BPDE、6-mT、6-mG等碱基修饰,甚至可以鉴别传统亚硫酸氢盐测序法无法区分的甲基化修饰和羟甲基化修饰。PacBio平台可以在测序的同时即可检测表观遗传学修饰信息,只需对测序数据选择合适的软件即可分析碱基修饰信息。

5. 5

6.

相关主题
相关文档
最新文档