高通量测序技术的发展及其在生命科学中的应用

高通量测序技术的发展及其在生命科学中的应用
高通量测序技术的发展及其在生命科学中的应用

高通量测序技术的发展及其在生命科学中的应用

杜玲1,2,刘刚2,陆健2,3

,刘丑生2,哈福1

(1.云南农业大学动物科技学院,云南昆明 650000;2.全国畜牧总站畜禽遗传资源保存利用中心,北京 100193;

3.中国农业大学动物科学技术学院,北京100193

)摘要:DNA测序技术从以Sanger法为代表的第一代测序技术到如今的高通量测序(HTS)技术,经历了漫长而曲折的发展过程,

如今该技术在动植物基因组的研究中获得了很大的成功,它的问世可以使人们以更低廉的价格,更全面、更深入地对全基因组进行分析。作者阐述了几种关于HTS的测序技术平台:Roche/454测序技术、ABI/SOLID测序技术、Illumina/Sol-exa测序技术、单分子测序技术及Ion Torrent测序技术,并且还归纳了HTS在基因组学、转录组学及表观基因组学等方面的应用。

关键词:高通量测序技术;基因组学;转录组学;应用

中图分类号:Q78 文献标识码:A 文章编号:1671-7236(2014)12-0109-

07收稿日期:2014-06-

05作者简介:杜玲(1990-)

,女,河南人,硕士,研究方向:动物遗传育种与繁殖。

通信作者:刘丑生(1964-)

,男,甘肃人,研究员,博士,主要从事动物遗传资源保护和利用研究。E-mail:liuchousheng@s

ina.com哈福(1972-),男,宁夏人,副教授,主要从事动物繁殖学研究。E-mail:hafu@sina.vip

.com基金项目:物种资源保护畜禽种质资源保护项目资金(农财发

[2014]35号)

;家养动物种质资源平台运行服务项目(2014);中央高校基本科研业务费专项资金([2014]BH005

)。 三十多年前,Sang

er首次建立了DNA双脱氧测序技术,完成了第一个完整基因组图谱的绘制(Sanger等,1978)。时至今日,由于DNA测序技术的改进(Schuster,2008),测序的规模也从以往每天只能测定几千个碱基序列发展到了如今的一次进行成千上万个序列精确测定的水平,同时该技术的发展也使得对一个物种的基因组和转录组进行全面的分析成为可能(Shendure等,2008),基因方面的研究逐步进入了基因组和后基因组时代(Pan等,2008)。这种以一次并行对几十万到几百万条DNA分子的序列测定和一般读长较短等为标志的技术称为高通量测序技术(high-throughput sequencing,HTS),其中主要包括以Illumina/Solexa、Roche

/454、ABI/SOLID为代表的第2代测序技术,单分子测序为代表的第3代测序技术及Ion Torrent测序技术(Metzker,2010)。HTS有诸多优点,该技术的诞生使得更多的科学家意识到测序技术在生命科学中的应用前景,并已将其广泛应用于动植物基因组学、转录组学及表观组学等方面的研究(Holt等,

2008

)。但是对于哺乳类动物,由于其基因组的的复杂性,测序仍是一个很大的挑战(Morozova等,2008)。作者将对HTS在这些方面的研究进行一些具体的阐述。

1 HTS的技术平台

1.1 Roche/454 Roche公司于2005年推出基于焦磷酸测序原理(Margulies等,2005)和微流体技术整合的超高通量基因组测序系统。这是一种依靠生物发光进行DNA序列分析的新技术。在DNA聚合酶、ATP硫酸化酶、荧光素酶和双磷酸酶的协同作用下,将引物上每一个dNTP的聚合与一次荧光信号释放偶联起来。通过检测荧光信号释放的有无和强度,就可以实时测定DNA序列(Tawfik等,1998)。与其他的测序平台相比,454测序的突出优

势是读长(Buggs等,2012),而且不需要荧光标记的引物或核酸探针,也不需要进行电泳,具有分析结果准确、快速、灵敏度较高等优点。它的缺点是无法准确测量同聚物的长度,

以及在测序过程中引入插入和缺失的测序错误(Mardis等,2008a)。目前,该技术在基因组从头测序、转录组分析等领域有着广泛的应用。

1.2 ABI/SOLID 2007年ABI推出了SOLID测

序平台。该技术是基于双碱基编码的原理,通过寡核苷酸连接和检测进行测序,以四色荧光标记寡核苷酸的连续连接合成为基础,对单拷贝DNA片段进行大规模扩增和高通量并行测序,且SOLID系统通过荧光染料标记不同的荧光基团,从而达到检测序列的目的(Mardis等,2008b)。该技术是玻片式的结构,能使得平台快速升级到更高的通量,而不需

·

901·中国畜牧兽医 2014年第41卷第12期生物技术

要对基础的技术和配置进行很大改变。SOLID系统最大的优点就是每张玻片能容纳比454更高密度的微珠,在相同系统中轻松实现高通量。但在荧光解码阶段,鉴于其是双碱基确定一个荧光信号,因而一旦发生错误就容易产生连锁的解码错误。目前该技术在基因组重测序(Ashelford等,2011)、基因型分析、基因表达分析、小分子RNA、表观组学测序(染色质免疫共沉淀和DNA甲基化)等领域应用较多(Bennett,2004)。

1.3 Illumina/Solexa 该技术利用单分子阵列在小型芯片(flow cell)上进行桥式PCR反应(Mardis等,2008a),是对合成测序技术的发展和延伸。由于采用新的可逆阻断技术,现在可以实现每次只合成一个碱基,并标记荧光集团,捕获激发光,因此可以读取碱基信息。

Illumina/Solexa测序在人、动植物和微生物领域均有相关研究报道。在不需要知道模式物种的基因组序列、不需要合成探针的前提下就可以直接进行全基因组表达研究,此外,不需要实验室假设支持就可以检测到单拷贝分子的变化情况。该技术还优化了传统测序方法的不足,所以Illumina/Solexa测序具有高通量、高灵敏度、高准确性及低运行成本等诸多优势。最重要的是该技术综合考虑了通量、运行时间和样品量,所以高质量数据、简单的流程、低样品需求及其灵活性的应用让它从其他高通量测序技术中脱颖而出。目前,该技术在基因组从头测序、重测序、转录组测序及表观遗传学等方面应用范围较广(Edwards等,2010)。

1.4 单分子测序技术 近年来,以单分子测序技术(SMS)为代表的第3代测序技术也开始发展起来(Harris等,2008)。它的突出特点是单分子测序,不需要任何PCR的过程,能有效避免因PCR偏向性而导致的系统错误,同时提高读长,并保持高通量、低成本的优点(Chan等,2012)。最具代表性的是Heliscope单分子测序技术、单分子实时合成测序技术(SMRT)、纳米孔单分子测序技术。

Heliscope单分子测序基于合成测序原理,因其荧光基团的光稳定性、高水溶性和高荧光效率及其灵敏的监测系统而直接记录单个碱基的荧光,所以克服了其他方法要同时测数千个相同基因片段以增加信号亮度的缺陷。SMRT是基于边合成边测序的理论,以SMRT芯片为载体进行的测序反应。该技术测序时所需要的样品量和所消耗的试剂都很少,而且测序过程中无需扫描和洗涤,因此测序所需时间较短。纳米孔单分子测序技术是基于半导体的纳米孔为原理,它的主要特点是:读长很长,约在几十kb,甚至100kb(Timp等,2010);错误率为1%~4%,且都是随机错误,而不是聚集在读取的两端;数据可实时读取;通量很高;起始DNA在测序过程中不被破坏及样品制备简单又便宜。理论上,它也能直接测序RNA。它的缺点是采用水解测序法,不能进行重复测序,所以测序精确度不是很高。

1.5 Ion Torrent Ion Torrent是基于半导体芯片的新一代革命性测序技术。利用一种布满小孔的高密度半导体芯片,一个小孔就是一个测序反应池。当DNA聚合酶把核苷酸聚合到延伸中的DNA链上时,会释放出1个H+,反应池中的pH发生改变,位于池下的离子感受器感受到H+离子信号,H+离子信号再直接转化为数字信号,从而读出DNA序列(Radford等,2012)。该技术是利用流体体系、微体系机械设计和半导体这3种技术的组合,使研究人员能够在很短时间获取高精确度序列。与前面介绍的几种测序技术相比,Ion Torrent测序技术更加简单、快速、廉价(Liu等,2012)。不过整个芯片的通量并不高,目前是10G左右,比较适合小基因组和外显子测序。

在决定使用哪个高通量测序技术时,最终应取决于具体的试验计划,测序成本、读长和通量都是需要考量的因素。在这些因素中,测序是大多数研究者首要考虑的因素。Roche/454平台虽较昂贵,但读长是它的突出优势。单分子测序技术平台更适合直接RNA测序。Ion Torrent通量不高,更适合于小基因组和外显子测序。综合其他研究者的经验,ABI/SOLID、Illumina/Solexa技术平台能够在价格、精确性及RNA-Seq通量上提供较为均衡的选择(Radford等,2012)。

2 HTS在基因组学研究中的应用

2.1 全基因组从头测序 全基因组从头测序(de-novo sequencing)是指不需要已知的参考基因序列,就可以对某个物种的全基因组序列进行测序,利用生物信息学分析方法对序列进行拼接、组装,从而获得该物种的全基因组图谱。因此,获得一个物种的全基因组序列是加快对此物种了解的重要捷径。随着新一代测序技术的不断完善,全基因组测序的成本和时间较传统技术都有大幅度的下降,因此,基因组学研究也迎来新的发展契机和革命性突破。目前,在许多的科研工作中,常结合Illumina/Solexa、ABI/SOLID技术的高通量和Roche/454技术或传

·

·生物技术中国畜牧兽医 2014年第41卷第12期

统Sanger的较长读长的优势来共同完成从头测序工作,利用这种多测序平台就可以大大降低测序成本,提高测序速度,保证测序结果准确性(闫绍鹏等,2012)。Huang等(2009)完成了黄瓜全基因组测序,结合了传统的Sanger测序技术和第2代Illumi-na/Solexa测序技术获得72.2倍基因组覆盖率。结果表明,黄瓜基因组的测序为瓜类蔬菜的生物研究和育种提供了一个宝贵的新资源。结果还表明,结合传统Sanger测序,下一代DNA测序技术可以有效地用于植物基因组的从头测序,从而能够对其他重要的植物物种进行快速、低成本的测序。Dalloul等(2010)利用Roche/454和Illumina/Solexa技术完成了火鸡基因组的从头测序,其中,Roche/454技术进行5倍测序深度,Illumina/Solexa技术进行20倍测序深度。火鸡基因组的测序为进一步了解脊椎动物基因组的进化和家禽重要经济性状相关的遗传变异提供重要的资源。

2.2 全基因组重测序 全基因组重测序是对基因组序列已知的不同个体进行基因组测序,并在此基础上对个体或群体进行差异性分析的方法(Bent-ley,2006)。随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围。因而,通过构建不同长度的插入片段文库和短序列、双末端测序相结合的方法进行高通量测序(Goffeau等,1997;International Human GenomeSequencing Consortium,2004),并且在全基因组水平上检测疾病关联时发现大量单核苷酸多态性位点(SNP)、插入/缺失(INDELs)、结构变异位点(SV)及拷贝数变异(CNV)。同时还发掘重要基因组区段和等位基因,实现未来育种目标,为全基因组分子育种设计提供依据,通过对核心种质资源进行重测序,揭示它们之间的进化关系,进行单体型预测、全基因组关联分析(GWAS)。全基因组重测序的产生,使得越来越多的物种基因组信息得到公布(Li等,2009)。Rubin等(2010)利用SOLID技术完成了家禽的全基因组重测序。其中,开发了7000000个SNPs和将近1300个缺失,并且其多态性区域包含有甲状腺受体基因、参与生长、代谢、食欲等相关基因区段。Zhan等(2011)利用高通量基因分型和全基因组重测序对牛的基因变异进行全面评估,结果产生41G数据量,基因组覆盖度达98.3%。Subbaiyan等(2012)利用Illumina测序技术完成了水稻的全基因组测序,其结果产生了338000000个75bp的Reads和85.4%的覆盖度,还发现2495052

个SNPs、160478个insertions和163556个dele-tions。从该水稻自交系中发现,SNPs和INDELs不仅能丰富分子育种的SNP资源,还能使全基因组的综合性能变异得以研究。Lai等(2010)对6个玉米杂交组合进行了重测序,这次结果检测到了100多万个SNP和3万多个INDELs。还有101个低序列的多样性染色体存在于玉米的基因组中,在这些几百个完整基因的重测序中还发现了插入和缺失,其高密度的SNP和INDELs多样性标记的报道将为未来的基因研究和育种提供有价值的资源。

3 HTS在转录组学研究中的应用

3.1 转录组测序 转录组测序(RNA-Seq)是基于第2代测序技术研究特定组织或细胞在某个时期转录出来的所有mRNA。转录组研究能够从整体水平研究基因功能及基因结构,揭示特定生物学过程中的分子机理,目前在分子育种、临床诊断和药物研发等领域广泛应用。转录组不同于基因组,其定义中包含了时间和空间的限定,同一细胞在不同生长时期及不同环境其基因表达情况是不完全相同的。该测序的优势不仅可以检测已知转录本的表达,还可预测新的转录本。在未知物种基因或基因组信息时,就能够直接对任何物种进行最全面的转录组分析。转录组测序主要应用于以下领域:

3.1.1 差异基因表达分析 Riedmaier等(2012)用RNA-Seq方法筛选候选基因来鉴定牛是否滥用类固醇激素,结果表明,对牛肝脏组织进行类固醇激素处理后,差异基因中筛选到40个候选基因,通过RT-PCR技术鉴定,最后确定20个候选基因可作为生物标记分子,主要用于鉴定牛是否滥用类固醇激素。另外,王滔(2013)利用RNA-Seq方法鉴定新的mRNA转录本、可变剪切、SNVs和INDELs,通过差异分析筛出猪脂肪组织中差异表达的基因,结果测定3个组织的转录组,共获得263M测序数据,测序读长为75bp的双末端序列,产生约19.7Gb的数据,共鉴定出15004个表达转录本,其中HLB中有13325个、GOM中有13120个、MAD中有13484个,并在HLB、GOM和MAD中分别发现了4654、4583和4765个新转录本;还分析了3个转录文库的序列变异共发现2585个可变剪切、16559个SNVs和1481个INDELs变异;差异基因分析筛选出183个差异表达的基因。以上结果可为研究相关疾病的发生机理提供科学依据,为临床治疗提供理论指导。

3.1.2 开发SNP标记 SNP是指在基因组上单

·

·

中国畜牧兽医 2014年第41卷第12期生物技术

个核苷酸的变异形成的遗传标记,其数量很多,多态性很丰富,在基因组中分布相当广泛,其变异主要包括置换、颠换、缺失和插入。目前,SNP标记在分子遗传育种、药物遗传学、法医学及疾病的诊断和治疗等方面发挥着重要作用。如Canovas等(2010)利用Illumina/Solexa技术取7个荷斯坦奶牛的奶样进行测序,检测到了19175个基因和100734个SNPs,其中,33045个SNPs具有多态性,用于后续的分子标记辅助育种。并通过Sanger法对42个候选基因测序比较了RNA-Seq发掘SNP的准确性;81%的SNPs两者都检测到。该研究结果证实,使用RNA分析转录组来确定转录区的SNP是一种最经济有效的方法。Shu等(2011)对不同大豆的全基因组序列进行转录组测序,结果开发了3899个SNPs,在这些SNP中置换的发生率高于颠换,这些SNP广泛分布于大豆基因中,并涉及其生理生化的过程,有着很重要的影响。

3.1.3 发现新基因完善基因组注释 Li等(2011a)利用转录组测序从黄瓜的10个组织中发现23248个编码蛋白基因,并检测到了5285个新基因,证明了RNA测序大大提高了重组黄瓜基因组中编码蛋白基因的准确性,这些基因组之间的比较也表明,利用RNA测序来完善基因组注释或更少的基因组研究是可行的。朱晓攀(2013)采用Illu-mina/Solexa高通量测序技术对济宁青山羊和莱芜黑山羊发情后卵巢组织转录组进行测序和功能分析,重点分析新发现的未注释的基因,分别检测了处于自然发情期济宁青山羊和莱芜黑山羊卵巢组织的基因表达情况,以期找出调控山羊高繁多胎基因,探讨多胎的遗传机制,结果共获得高质量约4G的测序数据,其中包括莱芜黑山羊9732297个Reads,济宁青山羊9613952个Reads;发现未预测到的新基因,其中莱芜黑山羊有3060个,济宁青山羊有3348个。陈梅丽(2013)利用RNA-Seq技术测序了大熊猫的肝脏、骨骼肌、大脑皮层、垂体、舌头、胃、小肠、结肠、睾丸、卵巢、黑皮和白皮12个不同组织样本的转录组,用于发现大熊猫有转录表达的新基因,结果共发现3类有转录表达的全长新基因:①1076个基于同源的新基因;②10494个未知的新基因,这类基因有同源的EST序列,但是没有同源蛋白或同源cDNA序列;③12575个推测的新基因,这类新基因有完整的开放阅读框,但是没有任何同源序列。这些新基因可以修复基因组的注释,是对基因组自动注释系统的有效补充。完整的基因组注释可为后续的比较基因组学、重测序和转录组学研究提供更可靠的信息。

3.1.4 开发SSR标记 鹰嘴豆是一种重要的食用豆类作物,但基因组资源的可用性滞后。Garg等(2011)对鹰嘴豆在苗期的根和茎组织还有成年植株的叶、花芽、豆荚进行了转录组分析,结果检测到了34760条转录本,平均长度在1020bp,并且开发了4000多个SSR(simple sequence repeat),最后开发了一个Web资源,建立了一个Unigene数据库,利于该物种的育种或有关基因组学的研究。Zeng等(2010)使用Roche/454测序技术在淫羊藿的转录本中开发了32个SSR,其中16个属于高度多态性。Zhang等(2012)通过RNA-Seq方法在芝麻的转录组中开发了2164个SSR,32个多态位点在F2代中得到验证,有18个在父母代表现出多态性,还有14个SSR已经整合到9个连锁群中。上述的这些数据资源都为以后的分子育种提供了很宝贵的资料。孙雪莲(2013)利用磁珠富集法开发了18770对豌豆基因组SSR标记,用亲本材料对其中的6287对二核苷酸重复类型的SSR标记进行了多态性筛选鉴定,2974对SSR标记有扩增条带,其中2505对SSR标记扩增产物为单带,469对SSR标记扩增产物有多态性。最后对筛选的分子标记进行豌豆遗传连锁图谱的构建。

3.2 Small RNA Small RNA(miRNAs、siRNAs和piRNAs)是生命活动中重要的调控因子,在基因表达调控、生物个体发育、代谢及疾病的发生等生理过程中起着重要的作用。自从1993年在秀丽线虫第一次发现后,人们越来越认识到Small RNA的重要性(Lee等,1993)。通过高通量测序技术能够对细胞或者组织中的全部Small RNA进行深度测序及定量分析等研究,并且通过对Small RNA大规模测序分析,可以从中获得物种全基因组水平的miR-NA图谱,实现新miRNA分子的挖掘、作用靶基因的预测和鉴定、样品间差异表达分析等科学应用。Li等(2011b)利用Illumina/Solexa技术对生长10d的肉鸡、蛋鸡的鸡脯取样后进行miRNA表达,结果表明,测序后分别得到了2700003和2567562的Reads,与基因组比对,鉴定189个miRNA,而使用miRDeep程序预测了33个新miRNA;通过靶基因预测并功能注释,发现ACVR2B参与调节鸡肉生长。本研究是首次检测鸡骨骼肌miRNA的转录,并通过识别在蛋鸡和肉鸡之间的差异表达miRNA来评估骨骼肌发育过程中miRNA的功能。罗宗刚

·

·生物技术中国畜牧兽医 2014年第41卷第12期

(2011)对不同发育阶段猪的miRNA转录组进行了研究,利用高通量测序技术对30胚龄到180日龄间的10个发育阶段的混合组织Small RNA文库进行了测定,基于已知的哺乳动物的miRNAs序列信息,猪的全基因组序列和EST信息为基础,发现了867个猪miRNA前体(其中623个具有基因组位置),这些前体编码1004个成熟miRNA,其中777个miRNA是特异的。以上研究详细提供了猪miRNA转录组的末端序列变异、miRNA在染色体中的具体分布、miRNA表达的发育阶段特异性及猪miRNA在不同物种间的保守性等大量信息,为后续深入研究提供了基础资料。

4 HTS在表观基因组学研究中的应用

表观遗传学是指在基因组DNA序列没有改变的情况下,基因的表达调控和性状发生了可遗传的变化。以新一代高通量测序平台为基础,结合表观遗传学测序及研究方法(Bibikova等,2006),可以在全基因组水平进行基因调控机制研究,即表观基因组学研究。近年来,高通量测序技术已经深入到表观遗传研究的很多方面,作者主要从DNA甲基化和组蛋白修饰来阐述HTS在表观遗传学上的应用。

4.1 DNA甲基化 目前,研究DNA甲基化的高通量测序方法有很多种,下面主要介绍两种方法:全基因组Bisulfite测序(全基因组重亚硫酸氢盐测序)和甲基化DNA免疫共沉淀测序(MeDIP-Seq)。4.1.1 全基因组Bisulfite测序 DNA甲基化是真核生物表观遗传学重要的机制之一。近年来,全基因组DNA甲基化在动植物遗传育种领域的研究引起了人们广泛的关注。DNA甲基化能准确获得全基因组范围内所有C位点的甲基化水平数据,在表观遗传学的时空特异性研究中起到很重要的作用。以高通量测序平台为基础,结合全基因组Bisulfite处理和生物信息数据分析技术,进行低成本、高效率及高准确度的全基因组DNA甲基化的图谱绘制。Bisulfite测序是研究DNA甲基化的一个强有力的技术,而该技术被公认为是DNA甲基化检测的“金标准”。亚硫酸氢盐测序是运用巢式PCR对处理后的DNA进行扩增,其扩增产物通过琼脂糖凝胶电泳检测盒单克隆测序进行分析。(Xi等,2009)。该方法适用于绘制单碱基分辨率的全基因组DNA甲基化图谱,能明确每一个CpG位点的甲基化状态,其精确度和可靠性较高,但需要大量的克隆测序(朱燕,2005)。因此,该方法的缺陷是过程繁琐和价格昂贵。2009年,Lister等(2009)利用全基因组Bisulfite测序结合HTS技术发表了首篇关于人类的全基因组甲基化图谱,随后该技术在人类疾病中应用,为以后人类疾病的研究提供了很好的基础。储成风等(2007)应用亚硫酸氢盐测序技术,以昆明小白鼠几种不同时期体内胚为研究对象,对其单拷贝基因Oct4启动子区进行甲基化检测。基因组经低熔点琼脂糖包埋、亚硫酸氢盐修饰后,运用巢式PCR对处理后的DNA进行两轮扩增。结果表明,亚硫酸氢盐测序法是一项敏感而有效的DNA甲基化检测手段。

4.1.2 MeDIP-Seq DNA甲基化主要发生在哺乳动物的CpG岛,还是一种常见的表观遗传学标记。MeDIP-Seq是基于特异性识别5-甲基胞嘧啶(5-mC)的抗体原理为基础富集基因组DNA甲基化片段后,利用高通量测序技术在全基因组水平上对CpG岛富集的甲基化区域进行研究(Nair等,2011),并且还以较小的数据量,快速、高效地寻找基因组上的甲基化区域,从而比较不同细胞和组织的DNA甲基化修饰模式的差异,目前广泛用于大样本量的疾病和分子育种研究。但是其缺点就是不能精确到单碱基分辨率,只知道一段区域的甲基化程度。Li等(2011c)利用MeDIP-Seq技术测定了鸡的全基因组甲基化修饰,绘制了第一个关于鸟类的全基因组甲基化图谱。研究发现,在鸡的基因组中大多数CpG岛都是以未甲基化状态存在。启动子甲基化区域与基因表达水平呈负相关,这说明其在调节基因转录过程中起抑制作用。张小丽(2013)利用MeDIP-Seq技术对3头210日龄的长白母猪背部浅层和背部深层脂肪组织全基因组甲基化水平及其功能进行研究,从构建的MeDIP-Seq DNA文库中获得了与猪基因组高度匹配的32.91Gb序列;从该序列成功鉴定出猪不同组织中差异甲基化区域(DMRs),分布在外显子区域的DMRs内CpG所占百分率明显大于启动子区域、内含子区域、转录起始位点上游2kb及基因间区域;证实了启动子区域甲基化可抑制基因的转录。以上结果为深入探讨猪及其他动物不同部位脂肪组织功能提供了表观遗传基础数据。

4.2 组蛋白修饰 组蛋白修饰包括甲基化、乙酰化、磷酸化及泛素化等,近年来主要集中在甲基化和乙酰化修饰等研究。而染色质免疫共沉淀测序(ChIP-Seq)是在体内环境中研究蛋白质与DNA相互作用的经典试验方法,广泛应用于组蛋白修饰等

·

·

中国畜牧兽医 2014年第41卷第12期生物技术

相关领域。随着新一代测序技术的发展和成熟,染色质免疫沉淀与高通量测序技术相结合(Whiting-ton等,2011),可在全基因组范围对蛋白结合位点进行高效而准确的筛选与鉴定。该技术与ChIP-Chip相比,具有定位分辨率高、成本不断降低及通量迅速增高,且不受生物芯片预先设定的基因组区域限制等优势(李敏俐等,2010)。Sun等(2011)用ChIP-Seq技术对小鼠组织的RNA Pol-Ⅱ启动子进行了研究,结果发现在小鼠组织中检测到了38639个Pol-Ⅱ启动子,其中12270个是新的启动子包括编码蛋白和非编码蛋白。通过识别这些组织中的每一个注释基因的Pol-Ⅱ启动子,发现在小鼠组织中37%的蛋白编码基因都是使用选择性启动子。

5 结语

从第一代Sanger测序法的问世到如今高通量测序法的广泛应用,陆续揭秘了海量的遗传信息(李庆岗等,2012),且测序趋势一直向着快速、高通量、耗资少、准确率高的方向发展。高通量测序技术所带来的影响是很深远的,由于该技术的开发,促进了许多先前无法想象的科学成就的顺利完成及更多生物信息技术的进步。目前,高通量测序技术在人和动植物基因组学研究领域已经成为最热门的话题,与传统Sanger测序方法相比,它的优势是非常显著的。尽管该技术有诸多的优势,但是新的测序技术在继续不断开发的同时,同样会面临一些困难,如何解决这些困难将是未来科学家们要着重解决的问题之一。相信在不久的将来,测序技术上的革新会给生物学和生物医学研究领域带来新的突破与发现。

参考文献

1 王滔.猪皮下与内脏脂肪组织mRNA转录组鉴定和差异分析[D].雅安:四川农业大学,2013.

2 李敏俐,王薇,陆祖宏.ChIP技术及其在基因组水平上分析DNA与蛋白质相互作用[J].遗传,2010,32(3):219~228.

3 李庆岗,陶立.高通量测序技术及其在生命科学中的应用[J].畜牧与饲料科学,2012,33(2):25~28.

4 朱燕.DNA甲基化的分析与状态检测[J].现代预防医学,2005,9:1070~1073.

5 朱晓攀.基于高通量测序的济宁青山羊和莱芜黑山羊卵巢转录组研究[D].北京:中国农业科学院,2013.

6 孙雪莲.豌豆SSR标记开发及遗传连锁图谱构建[D].北京:中国农业科学院,2013.

7 闫绍鹏,杨瑞,冷淑华,等.高通量测序技术及其在农业科学研究中的应用[J].中国农学通报,2012,28(30):171~176.

8 陈梅丽.转录组学研究人肿瘤细胞的表达调控机制和大熊猫基因组重注释[D].北京:中国科学院,2013.9 罗宗刚.猪不同发育阶段microRNA转录组的鉴定[D].雅安:四川农业大学,2011.

10张小丽.猪背部浅层和背部深层脂肪组织全基因组甲基化研究[D].雅安:四川农业大学,2013.

11储成风,汪存利,习海涛,等,亚硫酸氢盐测序法检测小鼠胚胎Oct4启动子区甲基化[J].安徽农业大学学报,2007,34(4):577~580.

12Ashelford K,Eriksson M E,Allen C M,et al.Full genome re-sequencing reveals a novel circadian clock mutation in Arabidop-sis[J].Genome Biol,2011,12(3):R28.

13Bennett S.Solexa Ltd[J].Pharmacogenomics,2004,5(4):433~438.

14Bentley D R.Whole-genome re-sequencing[J].Current Opinionin Genetics &Development,2006,16(6):545~552.

15Bibikova M,Lin Z,Zhou L,et al.High-throughput DNA meth-ylation profiling using universal bead arrays[J].Genome Res,2006,16(3):383~393.

16Buggs R J,Renny-Byfield S,Chester M,et al.Next-generationsequencing and genome evolution in allopolyploids[J].Am JBot,2012,99(2):372~382.

17Canovas A,Rincon G,Islas-Treio A,et al.SNP discovery in thebovine milk transcriptome using RNA-Seq technology[J].Mam-malian Genome,2010,21(11~12):592~598.

18Chan J Z,Pallen M J,Oppenheim B,et al.Genome sequencingin clinical microbiology[J].Nat Biotechnol,2012,30(11):1068~1071.

19Dalloul R A,Long J A,Zimin A V,et al.Multi-platform next-generation sequencing of the domestic turkey(Meleagris gallo-pavo):Genome assembly and analysis[J].PLoS Biology,2010,8(9):e1000475.

20Edwards D,Batley J.Plant genome sequencing:Applications forcrop improvement[J].Plant Biotechnol J,2010,8(1):2~9.21Garg R,Patel R K,Jhanwar S,et al.Gene discovery and tissue-specific transcriptome analysis in chickpea with massively parallelpyrosequencing and web resource development[J].Plant Physi-ology,2011,156(4):1661~1678.

22Goffeau A,Ramezani R M,Rasmussen S W,et al.The yeastgenome directory[J].Nature,1997,387(6632):5~6.

23Harris T D,Buzby P R,Babcock H,et al.Single-molecule DNAsequencing of a viral genome[J].Science,2008,320(5872):106~109.

24Holt R A,Jones S J.The new paradigm of flow cell sequencing[J].Genome Res,2008,18(6):839~846.

25Huang S,Li R,Zhang Z,et al.The genome of the cucumber,Cucumis sativus L.[J].Nat Genet,2009,41(12):1275~1281.26International Human Genome Sequencing Consortium.Finishingthe euchromatic sequence of the human genome[J].Nature,2004,431(7011):931~945.

27Lai J,Li R,Xu X,et al.Genome-wide patterns of genetic varia-tion among elite maize inbred lines[J].Nat Genet,2010,42(11):1027~1030.

28Lee R C,Feinbaum R L,Ambros V.The C.elegans hetero-

·

·生物技术中国畜牧兽医 2014年第41卷第12期

chronic gene lin-4encodes small RNAs with antisense comple-mentarity to lin-14[J].Cell,1993,75(5):843~854.29Li R,Fan W,Tian G,et al.The sequence and de novo assembly

of the giant panda genome[J].Nature,2009,463(7279):311~317.

30Li Z,Zhang Z,Yan P,et al.RNA-Seq 

improves annotation ofprotein-coding genes in the cucumber genome[J].BMC Genom-ics,2011a,12(1):540.

31Li Q,Li N,Hu X,et al.Genome-wide mapping 

of DNA methy-lation in chicken[J].PLoS One,2011b,6(5):e19428.32Li T,Wu R,Zhang 

D,et al.A systematic analysis of the skele-tal muscle miRNA transcriptome of chicken varieties with diver-gent skeletal muscle growth identifies novel miRNAs and differ-entially expressed miRNAs[J].BMC Genomics,2011c,12(1):186.

33Lister R,Ecker J R.Finding 

the fifth base:Genome-wide se-quencing of cytosine methylation[J].Genome Res,2009,19(6):959~966.

34Liu L,Li Y,Li S,et al.Comparison of next-generation seq

uen-cing systems[J].J Biomed Biotechnol,2012,2012:251364.35Metzker M L.Sequencing 

technologies———The next generation[J].Nature Reviews 

Genetics,2010,11(1):31~46.36Morozova O,Marra M A.Applications of next-g

eneration se-quencing technologies in functional genomics[J].Genomics,2008,92(5):255~264.

37Margulies M,Eqhoim M,Altman W E,et al.Genome seq

uen-cing in microfabricated high-density picolitre reactors[J].Na-ture,2005,437(7057):376~380.

38Mardis E R.Next-generation DNA sequencing 

methods[J].An-nu Rev Genomics 

Hum Genet,2008a,9:387~402.39Mardis E R.The impact of next-generation sequencing 

technolo-gy on genetics[J].Trends in Genetics,2008b,24(3):133~141.

40Nair S S,Coolen M W,Stizaker C,et al.Comparison of methy

l-DNA immunoprecipitation(MeDIP)and methyl-CpG binding do-main(MBD)protein capture for genome-wide DNA methylationanalysis reveal CpG sequence coverage bias[J].Epigenetics,2011,6(1):34~44.

41Pan Q,Shai O,Lee L J,et al.Deep surveying 

of alternativesplicing complexity in the human transcriptome by high-through-p

ut sequencing[J].Nat Genet,2008,40(12):1413~1415.42Radford A D,Chapman D,Dixon L,et al.App

lication of next-generation sequencing technologies in virology[J].J Gen Virol,2012,93(9):1853~1868.

43Riedmaier I,Benes V,Blake J,et al.RNA-Sequencing 

as usefulscreening tool in the combat against the misuse of anabolicagents[J].Analytical Chemistry,2012,84(15):6863~6868.44Rubin C J,Zody 

M C,Eriksson J,et al.Whole-genome resequencingreveals loci under selection during chicken domestication[J].Nature,2010,464(7288):587~591.

45Sang

er F,Coulson A R,Friedmann T,et al.The nucleotide se-quence of bacteriophage phiX174[J].J Mol Biol,1978,125(2):225~246.

46Schuster S C.Next-generation sequencing 

transforms today’s bi-ology

[J].Nat Methods,2008,5(1):16~18.47Shendure J,Ji H.Next-g

eneration DNA sequencing[J].NatBiotechnol,2008,26(10):1135~1145.

48Shu Y,Li Y,Zhu Z,et al.SNPs discovery 

and CAPS markerconversion in soybean[J].Molecular Biology Reports,2011,38(3):1841~1846.

49Subbaiyan G K,Waters D L,Katiy

ar S K,et al.Genome-wideDNA polymorphisms in elite indica rice inbreds discovered bywhole-genome sequencing[J].Plant Biotechnology Journal,2012,10(6):623~634.

50Sun H,Wu J,Wickramasinghe P,et al.Genome-wide mapping

of RNA Pol-Ⅱpromoter usage in mouse tissues by ChIP-Seq[J].Nucleic Acids 

Res,2011,39(1):190~201.51Tawfik D S,Griffiths A D.Man-made cell-like comp

artments formolecular evolution[J].Nat Biotechnol,1998,16(7):652~656.

52Timp W,Mirsaidov U M,Wang 

D,et al.Nanopore sequencing:Electrical measurements of the code of life[J].IEEE TransNanotechnol,2010,9(3):281~294.

53Whitington T,Frith M C,Johnson J,et al.Inferring 

transcrip-tion factor complexes from ChIP-Seq data[J].Nucleic AcidsRes

,2011,39(15):e98.54Xi Y,Li W.BSMAP:Whole genome bisulfite seq

uence MAP-ping program[J].BMC Bioinformatics,2009,10(1):232.55Zeng 

S,Xiao G,Guo J,et al.Development of a EST dataset andcharacterization of EST-SSRs in a traditional Chinese medicinalplant,Epimedium sagittatum(Sieb.Et Zucc.)Maxim[J].BMC 

Genomics,2010,11(1):94.56Zhan B,Fadista J,Thomsen B,et al.Global assessment of g

e-nomic variation in cattle by genome resequencing and high-throughput genotyping[J].BMC Genomics,2011,12(1):557.57Zhang 

H,Wei L,Miao H,et al.Development and validation ofgenic-SSR markers in sesame by RNA-Seq[J].BMC Genomics,2012,13:316.

Development of High-throughput Sequencing 

Technologyand its App

lication in BioscienceDU Ling1,

2,LIU Gang2,LU Jian2,

3,LIU Chou-sheng2,

HA Fu1

(1.Faculty of Animal Science and Technology,Yunnan Agricultural University,Kunming 

650000,China;2.National Center for Preservation and Utilization of Animal Genetic 

Resources,·

511·中国畜牧兽医 2014年第41卷第12期

生物技术

宏基因组学在动物胃肠道微生物研究中的应用

范忠原,李光玉,刘晗璐

(中国农业科学院特产研究所,吉林长春 130112

)摘要:实验室条件下可培养的微生物约占自然界中微生物总数的1%,这限制了人们对环境微生物的了解和利用。宏基因组学绕开传统纯培养方法,提供了一种探知微生物多样性和功能基因组的新方法。作者简述了宏基因组学的概念、基本方法,

着重介绍了宏基因组学在动物胃肠道微生物研究中的应用和取得的成果,并对宏基因组学的发展做了简要分析。关键词:胃肠道微生物;宏基因组学;应用

中图分类号:S852.6 文献标识码:A 文章编号:1671-7236(2014)12-0116-

06 动物胃肠道内存在大量微生物,它们并不是孤立存在的,这些微生物与微生物、微生物与宿主之间存在着一种既相互共生又相互竞争的动态平衡且复杂的关系(Roderick等,1999)。通过刺激免疫系统,

为宿主提供颉颃和营养物质,影响宿主健康状况(Hoop

er等,2001),组成了最复杂的微生物生态系统。在人们通过首次观察到细菌细胞之后近300年的时间里,人们对于微生物的研究主要是建立在纯培养基础上,然而实验室条件下可培养的微生物约占自然界中微生物总数的1%,但研究表明这些未培养微生物是可以被开发和利用的,未被纯培养的微生物才是环境微生物的主体(Pace等,1986;Ols-en等,1985;Torsvik等,2002)

,这限制了人们对环境微生物的了解和利用。宏基因组学(metagenom-ics)

避免了传统纯培养方法的缺陷,提供了一种新收稿日期:2014-04-

24作者简介:范忠原(1989―)

,男,吉林人,硕士,研究方向:特种经济动物养殖。

通信作者:李光玉,研究员,研究方向:特种经济动物饲养与营养。E-mail:tcslgy

@126.com基金项目:吉林省科技发展计划项目(20121810

)。方法。宏基因组技术最初用于从特定环境微生物样品中获取新的生物活性物质,随着新一代测序技术的发展,使研究者们可以对微生物群落进行大规模分析,研究特定环境的微生物群落多样性以及评估其代谢功能(Kennedy等,2008;Simon等,2011)。该技术最初提出将未培养的微生物区系和远古的DNA调查作为宏基因组学研究的主要目标,

但是目前该技术已应用于研究各种环境微生物的多样性,如深海水生微生物和人类与动物的消化道生态系统(赵静雯,2013)。宏基因组学正改变着人们对动物胃肠道复杂的微生物生态系统的认识。作者在介绍宏基因组研究方法的同时,结合最新的研究成果,重点介绍宏基因组学新技术在动物胃肠道微生物中的应用现状,

展望未来的发展趋势。1 宏基因组学概念及研究方法

宏基因组学最早是由Handelsman等(1998)提出的,是指环境中全部微生物基因组的总和。通过直接从环境样品中提取DNA,构建宏基因组文库,分析复杂环境微生物群落的结构和代谢活动,以及鉴定新的生物活性物质。宏基因组学的研究方法为:采集样品并尽可能完全提取样品中的DNA櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅

National Animal Husbandry Service,Beijing 

100193,China;3.College of Animal Science and Technology,China Agricultural University,Beijing 

100193,China)Abstract:The DNA sequencing technology,developing from the first generation to high-throughput sequencing(HTS)technology,has experienced a long and tortuous process amazing progress now.The technology has been used widely in the an-imal and plant genome with a great success.In addition,its also makes us to investigate the whole genome with lower cost,more in-depth.In this study,we had elaborated sequencing plaforms of HTS,such as Roche/454sequencing,ABI/SOLID se-quencing,Illumina/Solexa sequencing,single molecule sequencing and Ion Torrent sequencing technology.And we also hadsummarized the application of HTS in the genomics,transcriptomes,and epig

enetics.Key 

words:high-throughput sequencing;genomics;transcriptomes;application(责任编辑 晋大鹏)

·

611·生物技术

中国畜牧兽医 2014年第41卷第12期

DNA测序技术的发展和其最新进展

DNA测序技术的发展及其最新进展 摘要:自从诺贝尔奖得主桑格于1977年发明了第一代DN测序技术以来,DNA测序技术已经作为重要的实验技术广泛的应用于现代生物学研究当中。经过了几十年的发展,DNA测序技术日臻成熟,并且以单分子测序为特点的第三代测序技术也已经诞生。本文主要就每一代测序技术原理和特点及其最新进展做简要介绍。 关键词:DNA测序技术;第三代DNA测序技术;最新进展 The Development and New Progress of DNA Sequencing Technology Abstract: Since Nobel Prize Winner Sanger have founded the first generation of DNA Sequence technology in 1977, DNA sequencing technology has been widely used in modern biological researches as an important experimental. Over decades of year’s development, DNA sequence technology mature gradually and the third generation sequencing technologies characterized by single-molecule sequencing have also emerged. The mechanisms and features of each generation of sequencing technology and their latest progress will be discussed here. Key Words: DNA Sequence technology ; third generation DNA sequencing ;latest development 1.引言 DNA测序技术是分子生物学研究中最常用的技术,它的出现极大地推动了生物学的发展。自从1953年Watson和Crick发现DNA双螺旋结构后[1],人类就开始了对DNA序列的探索,在世界各地掀起了DNA测序技术的热潮。1977年Maxam和Gilbert报道了通过化学降解测定DNA序列的方法[2]。同一时期,Sanger发明了双脱氧链终止法[3]。20世纪90年代初出现的荧光自动测序技术将DNA测序带入自动化测序的时代。这些技术统称为第一代DNA测序技术。最近几年发展起来的第二代DNA测序技术则使得DNA测序进入了高通量、低成本的时代。目前,基于单分子读取技术的第三代测序技术已经出现,该技术测定DNA序列更快,并有望进一步降低测序成本,推进相关领域生物学研究。本文主要介绍DNA测序技术的发展历史及不同发展阶段各种主要测序技术的特点,并针对目前新一代DNA测序技术及目前国际DNA测序最新进展做简要综述。

Roche_454(GS_FLX_Titanium_System)超高通量测序技术原理

Roche 454(GS FLX Titanium System)超高通量测序技术原理 2005年底,454公司推出了革命性的基于焦磷酸测序法的超高通量基因组测序系统——Genome Sequencer 20 System,被《Nature》杂志以里程碑事件报道,开创了边合成边测序(sequencing-by-synthesis)的先河。之后,454公司被罗氏诊断公司以1.55亿美元收购。2007年,他们又推出了性能更优的第二代基因组测序系统—— Genome Sequencer FLX System (GS FLX)。2008年10月,454推出了全新的GS FLX Titanium系列试剂和软件,让GS FLX的通量一下子提高了5倍,准确性和读长也进一步提升。 想当年,GS 20的出现,揭开了测序历史上崭新的一页。Jonathan Rothberg博士就是大规模并行测序的发明者,同时也是454的创始人。上世纪90年代,很多学者也都想到了大规模并行测序,他们试图将Sanger测序移到芯片上,但都以失败告终,因为这项技术没有可扩展性。1999年,Rothberg的儿子出世,他放了两个星期的陪产假。小家伙出生后被送入婴儿特护病房,Rothberg非常担心,甚至想获取儿子的基因组信息。这段担惊受怕的经历给了他灵感,他突然意识到焦磷酸测序(pyrosequencing)不仅简单,而且具有可扩展性。两个星期之后,Rothberg就开始设计芯片和流动室,让测序在更小的反应室中进行,并同时进行几百万个反应。 硬件的设计和制造也只是成功的一半,在样品制备上还有同样漫长的路要走。Rothberg摒弃了传统的细菌克隆与挑选,将DNA打断成随机片段,并寻找一种方法来克隆每个片段。受到其他学者乳液实验的启发,他也想将DNA放入油包水的乳液中,这样就省去了反应管。一个好汉三个帮。在Joel Bader等人的帮助下,Rothberg验证了这些想法的可行性,并利用了炸药中的表面活性剂来维持乳液的热稳定性。就这样,乳液PCR终于诞生了。 对细菌的16S rDNA的V6/V3可变区进行测序分析,不需进行克隆筛选,测序的通量高,获得的数据量大,周期短,能更加全面的反映微生物群体的物种组成,真实的物种分布及丰度信息。 GS FLX 测序原理 GS FLX系统的测序原理和GS 20一样,也是一种依靠生物发光进行DNA序列分析的新技术;在DNA聚合酶,ATP硫酸化酶,荧光素酶和双磷酸酶的协同作用下,将引物上每一个dNTP 的聚合与一次荧光信号释放偶联起来(图 1)。通过检测荧光信号释放的有无和强度,就可以达到实时测定DNA序列的目的。此技术不需要荧光标记的引物或核酸探针,也不需要进行电泳;具有分析结果快速、准确、灵敏度高和自动化的特点。 Roche GS FLX System是一种基于焦磷酸测序原理而建立起来的高通量基因组测序系统。在测序时,使用了一种叫做“Pico TiterPlate”(PTP)的平板,它含有160多万个由光纤组成的孔,孔中载有化学发光反应所需的各种酶和底物。测序开始时,放置在四个单独的试剂瓶里的四种碱基,依照T、A、C、G的顺序依次循环进入PTP板,每次只进入一个碱基。如果发生碱基配对,就会释放一个焦磷酸。这个焦磷酸在各种酶的作用下,经过一个合成反应和一个化学发光反应,最终将荧光素氧化成氧化荧光素,同时释放出光信号。此反应释放出的光信号实时被仪器配置的高灵敏度CCD捕获到。有一个碱基和测序模板进行配对,就会捕获到一分子的光信号;由此一一对应,就可以准确、快速地确定待测模板的碱基序列。

转录组测序技术的应用及发展综述

转录组测序技术的应用及发展综述 摘要:转录组测序(RNA-Seq)作为一种新的高效、快捷的转录组研究手段正在改变着人们对转录组的认识。RNA-Seq利用高通量测序技术对组织或细胞中所有RNA 反转录而成cDNA文库进行测序,通过统计相关读段(reads)数计算出不同RNA的表达量,发现新的转录本;如果有基因组参考序列,可以把转录本映射回基因组,确定转录本位置、剪切情况等更为全面的遗传信息,已广泛应用于生物学研究、医学研究、临床研究和药物研发等。文章主要比较近年来转录组研究的几种方法和几种RNA-Seq的研究平台,着重介绍RNA-Seq的原理、用途、步骤和生物信息学分析,并就RNA-Seq技术面临的挑战和未来发展前景进行了讨论及在相关领域的应用等内容,为今后该技术的研究与应用提供参考。 关键词: RNA-Seq;原理应用;方法;挑战;发展前景 Abstract:Transcriptome sequencing (RNA-Seq) is a kind of high efficiency, quick transcriptome research methods are changing our understanding of transcriptome. RNA-Seq to use high-throughput sequencing of tissues or cells of all RNA reverse transcription into cDNA library were sequenced, through statistical correlation read paragraph (reads) numbers were calculated from the expression of different RNA transcripts, find new; if the genome reference sequence, the transcripts mapped to genomic, determine the position of the transcription shear condition, more genetic information, has been widely used in biological research, medical research, clinical research and drug development. This paper compared several methods of platform transcriptome studies and several kinds of RNA-Seq in recent years, RNA-Seq focuses on the principle, purpose, steps and bioinformatics analysis, and discusses the RNA-Seq technology challenges and future development prospect and the application in related field and other content, provide the reference for the research and application of the technology future. Key word:RNA-Seq ;application; principle; method; challenge; development prospects

三代测序原理技术比较

导读从1977年第一代DNA测序技术(Sanger法)1,发展至今三十多年时间,测序技术已取得了相当大的发展,从第一代到第三代乃至第四代,测序读长从长到短,再从短到长。 摘要:从1977年第一代DNA测序技术(Sanger法)1,发展至今三十多年时间,测序 技术已取得了相当大的发展,从第一代到第三代乃至第四代,测序读长从长到短,再从短到长。虽然就当前形势看来第二代短读长测序技术在全球测序市场上仍然占有着绝对的优势位置,但第三和第四代测序技术也已在这一两年的时间中快速发展着。测序技术的每一次变革,也都对基因组研究,疾病医疗研究,药物研发,育种等领域产生巨大的推动作用。在这里我主要对当前的测序技术以及它们的测序原理做一个简单的小结。 图1:测序技术的发展历程 生命体遗传信息的快速获得对于生命科学的研究有着十分重要的意义。以上(图1)所描述的是自沃森和克里克在1953年建立DNA双螺旋结构以来,整个测序技术的发展历程。 第一代测序技术 第一代DNA测序技术用的是1975年由桑格(Sanger)和考尔森(Coulson)开创的链终止法或者是1976-1977年由马克西姆(Maxam)和吉尔伯特(Gilbert)发明的化学法(链降解). 并在1977年,桑格测定了第一个基因组序列,是噬菌体X174的,全长5375个碱基1。自此,人类获得了窥探生命遗传差异本质的能力,并以此为开端步入基因组学时代。研究人员在Sanger法的多年实践之中不断对其进行改进。在2001年,完成的首个人类基因组图谱就是以改进了的Sanger法为其测序基础,Sanger法核心原理是:由于ddNTP的2’和3’都不含羟基,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断DNA 合成反应,在4个DNA合成反应体系中分别加入一定比例带有放射性同位素标记的ddNTP(分为:ddATP,ddCTP,ddGTP和ddTTP),通过凝胶电泳和放射自显影后可以根据电泳带的位置确定待测分子的DNA序列(图2)。这个网址为 sanger测序法制作了一个小短片,形象而生动。 值得注意的是,就在测序技术起步发展的这一时期中,除了Sanger法之外还出现了一些其他的测序技术,如焦磷酸测序法、链接酶法等。其中,焦磷酸测序法是后来Roche公司454技术所使用的测序方法2–4,而连接酶测序法是后来ABI公司SOLID技术使用的测序方法2,4,但他们的共同核心手段都是利用了Sanger1中的可中断DNA合成反应的dNTP。

基因测序技术的优缺点及应用

基因测序技术的优缺点及应用 随着人类基因组计划的完成,人类对自身遗传信息的了解和掌握有了前所未有的进步。与此同时,分子水平的基因检测技术平台不断发展和完善,使得基因检测技术得到了迅猛发展,基因检测效率不断提高。从最初第一代以 Sanger 测序为代表的直接检测技术和以连锁分析为代表的间接测序技术,到 2005 年,以Illumina 公司的 Solexa技术和 ABI 公司的 SOLiD 技术为标志的新一代测序 (next-generation sequencing,NGS) 的相继出现,测序效率明显提升,时间明显缩短,费用明显降低,基因检测手段有了革命性的变化。其技术正向着大规模、工业化的方向发展,极大地提高了基因检测的检出率,并扩展了疾病在基因水平的研究范围。2009 年 3 月,约翰霍普金斯大学的研究人员在《Science》杂志上发表了通过 NGS外显子测序技术,发现了一个新的遗传性胰腺癌的致病基因PALB2,标志着 NGS 测序技术成功应用于致病基因的鉴定研究。同年,《Nature》发表了采用 NGS 技术发现罕见弗里曼谢尔登综合征MYH3 致病基因突变和《Nat Genet》发表了遗传疾病米勒综合征致病基因。此后,通过 NGS 技术,与遗传相关的致病基因不断被发现,NGS 技术已成为里程碑式的进步。2010 年,《Science》杂志将这一技术评选为当年“十大科学进展”。 近两年,基因检测成为临床诊断和科学研究的热点,得到了突飞猛进和日新月异的发展,越来越多的临床和科研成果不断涌现出来。同时,基因检测已经从单一的遗传疾病专业范畴扩展到复杂疾病和个体化应用更加广阔的领域,其临床检测范围包括高危疾病的新生儿筛查、遗传疾病的诊断和基因携带的检测以及基因药物检测用于指导个体化用药剂量、选择和药物反应等诸多方面的研究。目前,基因检测在临床诊断和医学研究的应用正越来越受到医生的普遍重视和引起研究人员的极大的兴趣。 本文介绍了几种 DNA 水平基因检测常见的方法,比较其优缺点和在临床诊断和科学研究中的应用,对指导研究生和临床医生课外学习,推进临床科研工作和提升科研教学水平有着指导意义。 1、第一代测序 1.1 Sanger 测序采用的是直接测序法。1977年,Frederick Sanger 等发明了双脱氧链末端终止法,这一技术随后成为最为常用的基因测序技术。2001 年,Allan Maxam 和 Walter Gibert 发明了 Sanger 测序法,并在此后的 10 年里成为基因检测的金标准。其基本原理即双脱氧核苷三磷酸(dideoxyribonucleoside triphosphate,ddNTP) 缺乏PCR 延伸所需的 3'-OH,因此每当 DNA 链加入分子 ddNTP,延伸便终止。每一次 DNA 测序是由 4个独立的反应组成,将模板、引物和 4 种含有不同的放射性同位素标记的核苷酸的ddNTP 分别与DNA 聚合酶混合形成长短不一的片段,大量起始点相同、终止点不同的 DNA 片段存在于反应体系中,具有单个碱基差别的 DNA 序列可以被聚丙烯酰胺变性凝胶电泳分离出来,得到放射性同位素自显影条带。依据电泳条带读取DNA 双链的碱基序列。 人类基因组的测序正是基于该技术完成的。Sanger 测序这种直接测序方法具有高度的准确性和简单、快捷等特点。目前,依然对于一些临床上小样本遗传疾病基因的鉴定具有很高的实用价值。例如,临床上采用 Sanger 直接测序 FGFR 2 基因证实单基因 Apert 综合征和直接测序 TCOF1 基因可以检出多达 90% 的

焦磷酸测序技术的原理

Pyrosequencing技术的原理 Pyrosequencing是一项全新的DNA测序技术,可以快速、准确地测定一段较短的目标片段。其基本原理如下: 第1步:1个特异性的测序引物和单链DNA模板结合,然后加入酶混合物(包括DNA Polymerase、ATP Sulfurylase、Luciferase和Apyrase)和底物混合物(包括APS和Luciferin)。 第2步:向反应体系中加入1种dNTP,如果它刚好能和DNA模板的下一个碱基配对,则会在DNA 聚合酶的作用下,添加到测序引物的3‘末端,同时释放出一个分子的焦磷酸(PPi)。 第2步图示(图片来自互联网) 第3步:在ATP硫酸化酶的作用下,生成的PPi可以和APS结合形成ATP;在荧光素酶的催化下,生成的ATP又可以和荧光素结合形成氧化荧光素,同时产生可见光。通过CCD光学系统即可获得一个特异的检测峰,峰值的高低则和相匹配的碱基数成正比。 第3步图示(图片来自互联网) 第4步:反应体系中剩余的dNTP和残留的少量ATP在Apyrase的作用下发生降解。 第4步图示(图片来自互联网) 第5步:加入另一种dNTP,使第2-4步反应重复进行,根据获得的峰值图即可读取准确的DNA序列信息。

第4步图示(图片来自互联网) Pyrosequecing技术操作简单,结果准确可靠,可应用于SNP位点检测、等位基因频率测定、细菌和病毒分型等领域。 →如果您认为本词条还有待完善,请编辑词条 上一篇SNP(单核苷酸多态性)下一篇阅读质粒图谱 具体事例 【摘要】建立了一种将序列标记反转录聚合酶链反应(PCR)与焦磷酸测序技术结合的相对基因表达量测定法(简称“SRPP”)。先用来源特异性引物对不同来源的同一基因通过反转录标记上特异性标签,PCR后用焦磷酸测序法对扩增产物进行序列解码,使得测序结果中的序列代表基因的来源,峰高代表基因在不同来源中的相对表达量。用实时荧光定量PCR法对本方法的准确性进行了验证,结果表明,SRPP可以同时准确测定同一基因在3个不同来源中的表达量,并实际测定了Egr1基因在糖尿病、肥胖和正常小鼠肝中的表达量差异。 【关键词】序列标记反转录, 聚合物链反应,焦磷酸测序,基因表达 1 引言 差异表达基因与疾病密切相关,深入研究可在基因水平揭示疾病的发病机制。目前,用于检测基因表达水平的技术主要有SAGE法[1]、实时荧光定量PCR法[2,3]和基因芯片法[4]等。但这些方法存在仪器设备昂贵、定量性能差以及同时测定基因表达量的来源数目受限等缺点。 焦磷酸测序技术是新近发展起来的一种基于酶催化化学反应的测序技术[5~8],不需要使用荧光标记,定量性能好。目前,焦磷酸测序技术多用于单核苷酸多态性(SNP)分析、微生物分型和基因甲基化分析等。本研究将焦磷酸测序技术用于基因表达量差异的比较分析,考察了其可行性和准确性,并将其应用于检测Egr1基因在糖尿病、肥胖症和正常小鼠中的差异表达。 2 实验部分 仪器、试剂与材料

高通量测序技术

高通量测序技术(High-throughput sequencing)又称“下一代”测序技术 ("Next-generation" sequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。 根据发展历史、影响力、测序原理和技术不同等,主要有以下几种:大规模平行签名测序(Massively Parallel Signature Sequencing, MPSS)、聚合酶克隆(Polony Sequencing)、454焦磷酸测序(454 pyrosequencing)、Illumina (Solexa) sequencing、ABI SOLiD sequencing、离子半导体测序(Ion semiconductor sequencing)、DNA 纳米球测序(DNA nanoball sequencing)等。 高通量测序技术是对传统测序一次革命性的改变,一次对几十万到几百万条DNA分子进行序列测定,因此在有些文献中称其为下一代测序技术(next generation sequencing)足见其划时代的改变,同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(deep sequencing)。 实验过程 1.样本准备(sample fragmentation) 2.文库构建(library preparation) 3.测序反应(sequencing reaction) 4.数据分析(data analysis) 测序平台 自从2005年454 Life Sciences公司(2007年该公司被Roche正式收购)推出了454 FLX焦磷酸测序平台(454 FLX pyrosequencing platform)以来,因为他们的拳头产品毛细管阵列电泳测序仪系列(series capillary array electrophoresis sequencing machines)遇到了两个强有力的竞争对手,曾推出过3730xl DNA测序仪(3730xl DNA Analyzer)的Applied BioSystem(ABI)这家一直占据着测序市场最大份额的公司的领先地位就开始动摇了,一个就是罗氏公司(Roche)的454 测序仪(Roch GS FLX sequencer),,另一个就是2006年美国Illumina公司推出的Solexa基因组分析平台(Genome Analyzer platform),为此,2007年ABI公司推出了自主研发的SOLiD 测序仪(ABI SOLiD sequencer)。这三个测序平台即为目前高通量测序平台的代表。(见表一) 公司名称技术原理技术开发者 Apply Biosystems(ABI) 基于磁珠的大规模并行克隆连接 DNA测序法 美国Agencourt私人基因组学公司(APG) Illumina 合成测序法英国Solexa公司首席科学家David Bentley Roche 大规模并行焦磷酸合成测序法 美国454 Life Sciences公司的创始人Jonathan Rothberg Helicos 大规模并行单分子合成测序法美国斯坦福大学生物工程学家Stephen Quake Complete Genomics DNA纳米阵列与组合探针锚定连接 测序法 美国Complete Genomics公司首席科学家radoje drmanac 表一:主流测序平台一览 Roche 454焦磷酸测序 (pyrophosphate sequencing) Illumina Solexa 合成测序 (sequence by synthesize) Illumina Genome AnalyzerIIx测序原理 Illumina公司的新一代测序仪Hiseq 2000和Hiseq 2500具有高准确性,高通量,高灵敏度,和低运行成本等突出优势,可以同时完成传统基因组学研究(测序和注释)以及功能基因组学(基因表达及调控,基因功能,蛋白/核酸相互作用)研究。Hiseq是一种基于单分子簇的边合成边测序技术,基于专有的可逆终止化学反应原理。测序时将基因组DNA的随机片段附着到光学透明

测序技术的发展历程

测序技术的发展历程 随着1953年沃森和克里克发现了DNA的双螺旋结构,到2001年,首个人类基因组图谱的绘制完成,人们越来越多的认识到测序在生物医学中的重要作用。 测序技术的发展历史 Sanger测序技术 1975年由桑格和考尔森开创的链终止法测序技术标志着人类第一代DNA测序技术的诞生。1977年,人类历史上第一个基因组序列噬菌体X174由桑格团队测序完成。自此,人类获得了窥探生命遗传差异本质的能力,并以此为开端步入基因组学时代。 SangerJ.D. Waston、F.Crick

虽然第一代测序技术的测序读长可达1000bp,准确性高达99.999%,但其测序成本高,通量低等方面的缺点,严重影响了其真正大规模的应用。因而第一代测序技术并不是最理想的测序方法。从那时起人们开始了二代测序技术的探索。 第二代测序技术 第二代测序技术的核心思想是边合成边测序(Sequencing by Synthesis),在Sanger等测序方法的基础上,通过技术创新,用不同颜色的荧光标记四种不同的dNTP,当DNA聚合酶合成互补链时,每添加一种dNTP就会释放出不同的荧光,根据捕捉的荧光信号并经过特定的计算机软件处理,从而获得待测DNA的序列信息。 现有的技术平台主要包括Roche/454 FLX(已宣布停产)、Illumina Hiseq Miseq等系列和Applied Biosystems SOLID system。 Roche/454 FLX Illumina Hiseq 2500 AB SOLID 第三代测序技术 第二代测序技术虽然较Sanger测序有了巨大的突破,但是其测序的理论基础仍然建立在PCR扩增的基础之上。为了有效的避免测序过程中由于PCR扩增带来的偏差,科学家们积极投身到第三代单分子测序仪研究当中。目前最具代表性的包括Heliscope单分子实时合成测序法,纳米孔测序技术等。

高通量测序:第二代测序技术详细介绍

在过去几年里,新一代DNA 测序技术平台在那些大型测序实验室中迅猛发展,各种新技术犹如雨后春笋般涌现。之所以将它们称之为新一代测序技术(next-generation sequencing),是相对于传统Sanger 测序而言的。Sanger 测序法一直以来因可靠、准确,可以产生长的读长而被广泛应用,但是它的致命缺陷是相当慢。十三年,一个人类基因组,这显然不是理想的速度,我们需要更高通量的测序平台。此时,新一代测序技术应运而生,它们利用大量并行处理的能力读取多个短DNA 片段,然后拼接成一幅完整的图画。 Sanger 测序大家都比较了解,是先将基因组DNA 片断化,然后克隆到质粒载体上,再转化大肠杆菌。对于每个测序反应,挑出单克隆,并纯化质粒DNA。每个循环测序反应产生以ddNTP 终止的,荧光标记的产物梯度,在测序仪的96或384 毛细管中进行高分辨率的电泳分离。当不同分子量的荧光标记片断通过检测器时,四通道发射光谱就构成了测序轨迹。 在新一代测序技术中,片断化的基因组DNA 两侧连上接头,随后运用不同的步骤来产生几百万个空间固定的PCR 克隆阵列(polony)。每个克隆由单个文库片段的多个拷贝组成。之后进行引物杂交和酶延伸反应。由于所有的克隆都是系在同一平面上,这些反应就能够大规模平行进行。同样地,每个延伸所掺入的荧光标记的成像检测也能同时进行,来获取测序数据。酶拷问和成像的持续反复构成了相邻的测序阅读片段。

Solexa高通量测序原理

--采用大规模并行合成测序法(SBS,Sequencing-By-Synthesis)和可逆性末端终结技术(ReversibleTerminatorChemistry) --可减少因二级结构造成的一段区域的缺失。 --具有高精确度、高通量、高灵敏度和低成本等突出优势 --可以同时完成传统基因组学研究(测序和注释)以及功能基因组学(基因表达及调控,基因功能,蛋白/核酸相互作用)研究 ----将接头连接到片段上,经PCR扩增后制成Library。 ----随后在含有接头(单链引物)的芯片(flowcell)上将已加入接头的DNA片段变成单链后通过与单链引物互补配对绑定在芯片上,另一端和附近的另外一个引物互补也被固定,形成“桥” ----经30伦扩增反应,形成单克隆DNA簇 ----边合成边测序(Sequencing By Synthesis)的原理,加入改造过的DNA 聚合酶和带有4 种荧光标记的dNTP。这些dNTP是“可逆终止子”,其3’羟 基末端带有可化学切割的基团,使得每个循环只能掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复3'端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,统计每轮收集到的荧光信号结果,就可以得知每个模板DNA 片段的序列。目前的配对末端读长可达到2×50 bp,更长的读长也能实现,但错误率会增高。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割。 Roche 454 测序技术 “一个片段= 一个磁珠= 一条读长(One fragment =One bead = One read)”1)样品输入并片段化:GS FLX 系统支持各种不同来源的样品,包括基因组DNA、PCR 产物、BAC、cDNA、小分子RNA 等等。大的样品例如基因组DNA 或者BAC 等被打断成300-800 bp 的片段;对于小分子的非编码RNA 或者PCR 扩增产物,这一步则不需要。短的PCR 产物则可以直接跳到步骤3)。 2)文库制备:借助一系列标准的分子生物学技术,将A 和B 接头(3’和5’端具有特异性)连接到DNA 片段上。接头也将用于后续的纯化,扩增和测序步

新一代高通量测序技术SOLiD简介

新一代高通量测序技术SOLiD简介 目前市场上有四种高通量测序仪,分别是Solexa,454 (GS-FLX),SOLiD和Polonator。根据测序原理,它们可以被分为两大类:使用合成法测序(Sequencing by Synthesis)的Solexa和454,及使用连接法测序(Sequencing by Ligation)的Polonator和SOLiD。这些高通量测序仪的共同点是不需要大肠杆菌系统进行DNA模板扩增,且测序所得序列较短:其中的454序列最长,为200~300个碱基,其余三种序列都只有几十个碱基。测序原理及序列长度的差异决定了各种高通量测序仪具有不同的应用领域。这就要求我们在熟悉各种高通量测序仪内在技术特点的基础上进行选择。 基因组所引进的SOLiD (Sequencing by Oligonucleotide Ligation and Detection)是ABI(Applied Biosystems)公司生产的高通量测序仪。目前这台SOLiD运行稳定,SOLiD实验及数据分析小组也可以为大家提供专业的技术服务。所以接下来的关键是如何把SOLiD测序仪应用到符合其技术特点的科研项目中。本短文将简单介绍SOLiD测序流程,双碱基编码原理及数据分析原理,以帮助大家了解SOLiD测序仪的技术特点和应用范围。 1.SOLiD关键技术及其原理 SOLiD使用连接法测序获得基于“双碱基编码原理”的SOLiD颜色编码序列,随后的数据分析比较原始颜色序列与转换成颜色编码的reference序列,把SOLiD颜色序列定位到reference上,同时校正测序错误,并可结合原始颜色序列的质量信息发现潜在SNP位点。 1.1. SOLiD文库构建 使用SOLiD测序时,可根据实际需要,制备片段文库(fragment library)或末端配对文库(mate-paired library)。简单地说,制备片段文库就是在短DNA片段(60~110 bp)两端加上SOLiD 接头(P1、P2 adapter)。而制备末端配对文库,先通过DNA环化、Ecop15I酶切等步骤截取长DNA片段(600bp到10kb)两末端各25 bp进行连接,然后在该连接产物两端加上SOLiD接头。两种文库的最终产物都是两端分别带有P1、P2 adapter的DNA双链,插入片段及测序接头总长为120~180 bp。 1.2:油包水PCR 我们知道,文库制备得到大量末端带P1、P2 adapter但内部插入序列不同的DNA双链模板。和普通PCR一样,油包水PCR也是在水溶液进行反应,该水相含PCR所需试剂,DNA模板及可分别与P1、P2 adapter结合的P1、P2 PCR引物。但与普通PCR不同的是,P1引物固定在P1磁珠球形表面(SOLiD将这种表面固定着大量P1引物的磁珠称为P1磁珠)。PCR反应过程中磁珠表面的P1引物可以和变性模板的P1 adapter负链结合,引导模板合成,这样一来,P1引物引导合成的DNA链也就被固定到P1磁珠表面了。 油包水PCR最大的特点是可以形成数目庞大的独立反应空间以进行DNA扩增。其关键技术是“注水到油”,基本过程是在PCR反应前,将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR 反应空间。理想状态下,每个小水滴只含一个DNA模板和一个P1磁珠,由于水相中的P2引物和磁珠表面的P1引物所介导的PCR反应,这个DNA模板的拷贝数量呈指数级增加,PCR反应结束后,P1磁珠表面就固定有拷贝数目巨大的同来源DNA模板扩增产物。A BI公司提供的SOLiD 实验手册已经把小水滴体积及水相中DNA模板和磁珠的个数比等重要参数进行了技术优化和流程固定,尽可能提高“优质小水滴”(水滴中只含一个DNA模板一个P1磁珠)的数量,为后续SOLiD 测序提供只含有一种DNA模板扩增产物的高质量P1磁珠。

三代测序原理技术比较

导从1977年第一代DNA测序技术(Sanger法)1,发展至今三十多年时间,测导序技术已取得了相当大的发展,从第一代到第三代乃至第四代,测序读长从读长到短,再从短到长。 摘要:从1977年第一代DNA测序技术(Sanger法)1,发展至今三十多年时间,测序技术已取得了相当大的发展,从第一代到第三代乃至第四代,测序读长从长到短,再从短到 长。虽然就当前形势看来第二代短读长测序技术在全球测序市场上仍然占有着绝对的优势 位置,但第三和第四代测序技术也已在这一两年的时间中快速发展着。测序技术的每一次变 革,也都对基因组研究,疾病医疗研究,药物研发,育种等领域产生巨大的推动作用。在 这里我主要对当前的测序技术以及它们的测序原理做一个简单的小结。 图1 :测序技术的发展历程 生命体遗传信息的快速获得对于生命科学的研究有着十分重要的意义。以上(图1)所描述的是自沃森和克里克在1953年建立DNA双螺旋结构以来,整个测序技术的发展历程。 第一代测序技术 第一代DNA测序技术用的是1975年由桑格(Sanger)和考尔森(Coulson )开创的链终止法或者是1976-1977年由马克西姆(Maxam和吉尔伯特(Gilbert )发明的化学法(链降解)?并在1977年,桑格测定了第一个基因组序列,是噬菌体X174的,全长5375个碱 基1。自此,人类获得了窥探生命遗传差异本质的能力,并以此为开端步入基因组学时代。 研究人员在Sanger法的多年实践之中不断对其进行改进。在2001年,完成的首个人类基 因组图谱就是以改进了的Sanger法为其测序基础,Sanger法核心原理是:由于ddNTP的2' 和3'都不含羟基,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断DNA 合成反应,在4个DNA合成反应体系中分别加入一定比例带有放射性同位素标记的ddNTP分为:ddATP,ddCTP,ddGTP和ddTTP),通过凝胶电泳和放射自显影后可以根据电泳带的位置确定待测分子的DNA序列(图2)。这个网址为san ger测序法制作了一个小短片,形象而生动。 值得注意的是,就在测序技术起步发展的这一时期中,除了San ger法之外还出现了一 些其他的测序技术,如焦磷酸测序法、链接酶法等。其中,焦磷酸测序法是后来Roche公司454技术所使用的测序方法2 - 4,而连接酶测序法是后来ABI公司SOLID技术使用的测序方 法2,4,但他们的共同核心手段都是利用了Sanger1中的可中断DNA合成反应的dNTP 图2: Sanger法测序原理

高通量测序领域常用名词解释大全

高通量测序领域常用名词解释大全 什么是高通量测序? 高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术(next generation sequencing,NGS )足见其划时代的改变, 同时高通量测序使得对一个物种的转录组和基因组进行 细致全貌的分析成为可能, 所以又被称为深度测序(Deep sequencing)。 什么是Sanger法测序(一代测序) Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。直到掺入一种链终止核苷酸为止。每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。由于ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止。终止点由反应中相应的双脱氧而定。每一种dNTPs和ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。 什么是基因组重测序(Genome Re-sequencing) 全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围。通过构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序,实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重大的科研和产业价值。 什么是de novo测序 de novo测序也称为从头测序:其不需要任何现有的序列资料就可以对某个物种进行测序,利用生物信息学分析手段对序列进行拼接,组装,从而获得该物种的基因组图谱。获得一个物种的全基因组序列是加快对此物种了解的重要捷径。随着新一代测序技术的飞速发展,基因组测序所需的成本和时间较传统技术都大

三代基因组测序技术简介及其原理整理.

三代基因组测序技术简介及其原理整理 第一代测序技术 第一代DNA测序技术用的是1975年由桑格(Sanger)和考尔森(Coulson)开创的链终止法以及1976-1977年由马克西姆(Maxam)和吉尔伯特(Gilbert)发明的化学法(链降解)。 1977年,桑格测定了第一个基因组序列——噬菌体X174,全长5375个碱基。自此,人类获得了窥探生命遗传差异本质的能力,并以此为开端步入基因组学时代。研究人员在Sanger法的多年实践之中不断对其进行改进。在2001年,完成的首个人类基因组图谱就是以改进了的Sanger法为其测序基础。 Sanger法原理: 1)在模板指导下,DNA聚合酶不断将dNTP(N=A/G/T/ C)加到引物的3’- OH末端,合成出新的互补链。在4个DNA合成反应体系中分别加入一定比例带有放射性同位素标记的ddNTP,在互补链在DNA聚合酶作用下延伸时,一旦连接上ddNTP,由于双脱氧核糖的2’和3’都不含羟基,故不能同后续的dNTP形成磷酸二酯键而终止反应,随即形成一系列不同长度的、以同样引物为起始、以同一碱基终止的短片段混合物。 2)双脱氧核苷酸在每个DNA分子中掺入的位置不同,采用聚丙烯酰胺凝胶电泳区分长度差一个核苷酸的单链DNA,从而读取DNA核苷酸序列。 化学裂解法原理: 与Sanger法类似,将DNA模板分成4个反应。在每个反应中,先在模板5’端进行放射性标记,再加入能特异性在其中一种碱基处切开DNA的化学试剂。反应进行时,平均一个DNA分子只在随机位点产生一次裂解。接着,通过凝胶电泳和放射自显影后可以根据电泳带的位置确定待测分子的DNA序列。 第二代测序技术 第一代测序技术的主要特点是测序读长可达1000bp,准确性高达99.999%,但其测序成本高,通量低等方面的缺点,严重影响了其真正大规模的应用。因而第一代测序技术并不是最理想的测序方法。经过不

310型DNA测序仪的测序原理和操作规程

310型DNA测序仪的测序原理和操作规程ABI 310型DNA测序仪的测序原理和操作规程 DNA序列测定分手工测序和自动测序,手工测序包括Sanger双脱氧链终止法和Maxam-Gilbert化学降解法。自动化测序实际上已成为当今DNA序列分析的主流。美国PE ABI公司已生产出373型、377型、310型、3700和3100型等DNA测序仪,其中310型是临床检测实验室中使用最多的一种型号。本实验介绍的是ABI PRISM 310型DNA测序仪的测序原理和操作规程。 【原理】 ABI PRISM 310型基因分析仪(即DNA测序仪),采用毛细管电泳技术取代传统的聚丙烯酰胺平板电泳,应用该公司专利的四色荧光染料标记的ddNTP(标记终止物法),因此通过单引物PCR测序反应,生成的PCR产物则是相差1个碱基的3''''末端为4种不同荧光染料的单链DNA混合物,使得四种荧光染料的测序PCR产物可在一根毛细管内电泳,从而避免了泳道间迁移率差异的影响,大大提高了测序的精确度。由于分子大小不同,在毛细管电泳中的迁移率也不同,当其通过毛细管读数窗口段时,激光检测器窗口中的CCD(charge-coupled device)摄影机检测器就可对荧光分子逐个进行检测,激发的荧光经光栅分光,以区分代表不同碱基信息的不同颜色的荧光,并在CCD摄影机上同步成像,分析软件可自动将不同荧光转变为DNA序列,从而达到DNA测序的目的。分析结果能以凝胶电泳图谱、荧光吸收峰图或碱基排列顺序等多种形式输出。 它是一台能自动灌胶、自动进样、自动数据收集分析等全自动电脑控制的测定DNA片段的碱基顺序或大小和定量的高档精密仪器。PE公司还提供凝胶高分子聚合物,包括DNA测序胶(POP 6)和GeneScan胶(POP 4)。这些凝胶颗粒孔径均一,避免了配胶条件不一致对测序精度的影响。它主要由毛细管电泳装置、Macintosh电

高通量测序技术及原理介绍

高通量测序技术及原理介绍 高通量测序技术(High-throughput sequencing)又称“下一代”测序技术(“Next-generation”sequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。 高通量测序技术应用测序技术推进科学研究的发展。随着第二代测序技术的迅猛发展,科学界也开始越来越多地应用第二代测序技术来解决生物学问题。比如在基因组水平上对还没有参考序列的物种进行从头测序(de novo sequencing),获得该物种的参考序列,为后续研究和分子育种奠定基础;对有参考序列的物种,进行全基因组重测序(resequencing),在全基因组水平上扫描并检测突变位点,发现个体差异的分子基础。在转录组水平上进行全转录组测序(whole transcriptome resequencing),从而开展可变剪接、编码序列单核苷酸多态性(cSNP)等研究;或者进行小分子RNA测序(small RNA sequencing),通过分离特定大小的RNA分子进行测序,从而发现新的microRNA分子。在转录组水平上,与染色质免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技术相结合,从而检测出与特定转录因子结合的DNA区域和基因组上的甲基化位点。 这边需要特别指出的是第二代测序结合微阵列技术而衍生出来的应用--目标序列捕获测序技术(Targeted Resequencing)。这项技术首先利用微阵列技术合成大量寡核苷酸探针,这些寡核苷酸探针能够与基因组上的特定区域互补结合,从而富集到特定区段,然后用第二代测序技术对这些区段进行测序。目前提供序列捕获的厂家有Agilent和Nimblegen ,应用最多的是人全外显子组捕获测序。科学家们目前认为外显子组测序比全基因组重测序更有优势,不仅仅是费用较低,更是因为外显子组测序的数据分析计算量较小,与生物学表型结合更为直接。 目前,高通量测序开始广泛应用于寻找疾病的候选基因上。内梅亨大学的研究人员使用这种方法鉴定出Schinzel-Giedion 综合征中的致病突变,Schinzel-Giedion综合征是一种导致严重的智力缺陷、肿瘤高发以及多种先天性畸形的罕见病。他们使用Agilent SureSelect序列捕获和SOLiD对四位患者的外显子组进行测序,平均覆盖度为43倍,读长为50 nt,每

相关文档
最新文档