基因组学技术与原理v2

基因组学技术与原理v2
基因组学技术与原理v2

第2代测序技术

共同点:1、首先也是将基因组DNA随机切割成小片段DNA分子,然后在体外给这些小片段分子的末端连接上接头制成文库,也可以使用配对标签(mate-paired tag)制成跨步文库(jumping libraries)。2、通过原位polon、微乳液PCR(emulsion PCR)或桥式PCR(bridge PCR)等方法获得测序模板。这些方法有一个共同点,那就是任何一个小片段DNA分子的PCR扩增产物都是在空间上聚集的:原位polony法和桥式PCR法中所有的产物都集中在平板的某处,在微乳液PCR法(emulsion PCR)中所有的产物都集中在微珠的表面。3、真正的测序反应本身和传统测序法一样,是由重复的聚合酶促反应和最后的荧光读取分析反应组

一、ABI SOLiD技术平台

SOLiD使用连接法测序获得基于“双碱基编码原理”的SOLiD颜色编码序列,随后的数据分析比较原始颜色序列与转换成颜色编码的参考序列,把SOLiD颜色序列定位到reference上,同时校正测序错误,并可结合原始颜色序列的质量信息发现潜在SNP位点。

(1) 测序实验流程:

1、文库制备:随机片段文库、末端配对文库

2、模板磁珠制备:油包水微型反应体系; DNA片段在磁珠上扩增

3、磁珠固定:磁珠随机固定在测序玻片表面;可增大每个测序玻片上的磁珠密度

4、边连接边测序:四色荧光标记寡核苷酸;边连接边测序

5、测序引物重置:每一个模板选用5个引物进行连接反应测序

(2) 技术特点:

高通量,SOLiD 4.0每个测序反应能够获得50G的数据量;

高准确性,每个DNA碱基检测2次,增加了序列读取的准确性;

高稳定性,测序时采用连接反应,有效地解决了多聚核苷酸序列难读取的问题;

系统中两个独立控制的流动池和条码标定技术运用可以在单个测序中做很多不同的样品。

(3)详细过程

1. SOLiD文库构建

使用SOLiD测序时,可根据实际需要,制备片段文库(fragment library)或末端配对文库(mate-paired library)。制备片段文库就是在短DNA片段(60~110 bp)两端加上SOLiD接头(P1、P2 adapter)。而制备末端配对文库,先通过DNA环化、Ecop15I酶切等步骤截取长DNA片段(600bp到10kb)两末端各25 bp进行连接,然后在该连接产物两端加上SOLiD接头。两种文库的最终产物都是两端分别带有P1、P2 adapter的DNA双链,插入片段及测序接头总长为120~180 bp。

2 油包水PCR

文库制备得到大量末端带P1、P2 adapter但内部插入序列不同的DNA双链模板。和普通PCR一样,油包水PCR 也是在水溶液进行反应,该水相含PCR所需试剂,DNA模板及可分别与P1、P2 adapter结合的P1、P2 PCR引物。但与普通PCR不同的是,P1引物固定在P1磁珠球形表面 (SOLiD将这种表面固定着大量P1引物的磁珠称为P1磁珠)。PCR反应过程中磁珠表面的P1引物可以和变性模板的P1 adapter负链结合,引导模板合成,这样一来,P1引物引导合成的DNA链也就被固定到P1磁珠表面了。

油包水PCR最大的特点是可以形成数目庞大的独立反应空间以进行DNA扩增。其关键技术是“注水到油”,基本过程是在PCR反应前,将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR反应空间。理想状态下,每个小水滴只含一个DNA模板和一个P1磁珠,由于水相中的P2引物和磁珠表面的P1引物所介导的PCR反应,这个DNA模板的拷贝数量呈指数级增加,PCR反应结束后,P1磁珠表面就固定有拷贝数目巨大的同来源DNA模板扩增产物。

3. 含DNA模板P1磁珠的固定

SOLiD测序反应在SOLiD玻片表面进行。含有DNA模板的P1磁珠共价结合在SOLiD玻片表面。磁珠是SOLiD测序的最小单元。每个磁珠SOLiD测序后形成一条序列。

4. SOLiD双碱基编码原理及测序流程

SOLiD“双碱基编码原理”实质上是阐明了荧光探针的颜色类型与探针编码区碱基对的对应关系。SOLiD连接反应的底物是8碱基单链荧光探针混合物。连接反应中,这些探针按照碱基互补规则与单链DNA模板链配对。探针5’末端可分别标记“CY5,Texas Red,CY3,6-FAMTM”4种颜色的荧光染料,并且这四种颜色用数字“3,2,1,0”示

意;探针3’端1~5位为随机碱基,可以是“A,T,C,G”四种碱基中的任何一种碱基,其中第1、2位构成的碱基对是表征探针染料类型的编码区,“双碱基编码矩阵”规定了该编码区16种碱基对和4种探针颜色的对应关系,而3~5位的“n”表示随机碱基,6~8位的“z”指的是可以和任何碱基配对的特殊碱基,由上可知,SOLiD连接反应底物中共有45 种底物探针。

单向SOLiD测序包括五轮测序反应。每轮测序反应含有多次连接反应(一般情况下,片段文库是7次,mate-paired 文库是5次,所以片段文库共有35个连接反应,而末端配对文库共有25次连接反应)。每轮测序反应的第一次连接反应由与P1引物区域互补的“连接引物”介导。这五种连接引物长度相同,但在P1引物区域的位置相差一个碱基(分别用n,n-1,n-2,n-3,n-4表示),都含有5’端磷酸,所以可以介导连接反应的进行。

5. 数据分析原理

SOLiD测序完成后,获得了由颜色编码组成的SOLiD原始序列。理论上来说,按照“双碱基编码矩阵”,只要知道所测DNA序列中任何一个位置的碱基类型,就可以将SOLiD原始颜色序列“解码”成碱基序列。但由于双碱基编码规则中双碱基与颜色信息的兼并特性(一种颜色对应4种碱基对),前面碱基的颜色编码直接影响紧跟其后碱基的解码,所以一个错误颜色编码就会引起“连锁解码错误”,改变错误颜色编码之后的所有碱基。

和所有其它测序仪一样,测序错误在所难免,关键是对测序错误的评价和后续处理。为避免“连锁解码错误”的发生SOLiD数据分析软件不直接将SOLiD原始颜色序列解码成碱基序列,而是依靠reference序列进行后续数据分析。SOLiD序列分析软件首先根据“双碱基编码矩阵”把reference碱基序列转换成颜色编码序列,然后与SOLiD 原始颜色序列进行比较,来获得SOLiD原始颜色序列在reference的位置,及两者的匹配性信息。Reference转换而成的颜色编码序列和SOLiD原始序列的不完全匹配主要有两种情况:“单颜色不匹配”和“两连续颜色不匹配”。由于每个碱基都被独立地检测两次,且SNP位点将改变连续的两个颜色编码,所以一般情况下SOLiD将单颜色不匹配处理成测序错误,这样一来,SOLiD分析软件就完成了该测序错误的自动校正;而连续两颜色不匹配也可能是连续的两次测序错误,SOLiD分析软件将综合考虑该位置颜色序列的一致性及质量值来判断该位点是否为SNP。

二、Illumina Solexa技术平台

(1)Solexa 技术的基本原理:

1、基因组DNA 被随机打断成为小的DNA 片断;并在DNA 片断的两端连上接头 (adapter);

2、Solexa 测序专用的测序芯片(flow cell)表面连接有一层单链引物,单链状态的DNA 片断与芯片表面的引物通过碱基互补被一端“锚定”在芯片上;

3、通过扩增反应使得单链DNA 成为双链DNA;

4、双链再次变性后成为单链,其一端“锚定”在测序芯片上,另外一端(5’或3’)随机和附近的另外一个引物互补,被“锚定”住,形成“桥“(bridge);

5、在测序芯片上同时有上千万DNA 单分子发生以上的反应;

6、4中形成的单链桥,以周围的引物为扩增引物,在测序芯片表面再次进行扩增,形成双链;

7、双链经变性成单链,再次形成桥,成为下一轮扩增的模板继续扩增反应;

8、在反复进行30 轮扩增,每个单分子得到了1000 倍扩增,成为单克隆“DNA 簇群”;

9、“DNA 簇群”在Solexa 测序仪上进行序列分析;

10、测序反应:“可逆性末端终结反应”,提高碱基合成来进行测序。四种碱基分别标记四种不同荧光,每个碱基末端被保护基团封闭,单次反应只能加入一个碱基,经过扫描,读取该次反应颜色后,该保护基团被除去,下一个反应可继续进行,如此反复,得出碱基的精确序列;

(2)技术特色突出表现在:

1、每张测序芯片有8 个通道,每个通道可单独运行一个样品,也可以把多个样品混合在一起检测;

2、一次实验可读取大于15 亿个碱基/芯片;

3、可精确读取重复序列如:AAAAAAAAAAAAAAAAA,TTTTTTTTTTTTT;

4、实验费用低,测序成本为传统测序方法的1/100;

5、无需建库,自动化样品制备,简单,成本低;

6、样本使用效率极高,所以对少量样本也可以极灵敏精确地检测;

7、可以进行35 碱基长度的末端双向测序反应;

三、Roche 454技术平台

(1)454 GS FLX原理

基于pyrosequencing(焦磷酸测序)的原理,DNA Polymerase在将一个dNTP聚合到模板上的时候,释放出一个PPi(焦磷酸分子);在ATP-Sulfurylase(ATP硫酸化酶)催化下,PPi与APS生成一个ATP分子;ATP分子在Luciferase (荧光素酶)的作用下,将luciferin(荧光素)氧化成oxy luciferin,同时产生的可见光被CCD光学系统捕获,获得一个特异的检测信号,信号强度与相应的碱基数目成正比。

(2)454 FLX的工作流程

1样品的准备:样品可以是gDNA、cDNA、BACs和PCR产物等,用物理方法破碎成300-800bp的DNA片段

2文库的制备:将特异性接头(A和B)连接到DNA片段的3’端和5’端,然后将DNA片段变性成单链模板

3固定到磁珠:将单链模板文库中的DNA片段固定到DNA捕获磁珠上,每一个磁珠只携带唯一一个单链模板

4emPCR扩增:用emPCR扩增试剂,将磁珠乳化成一个个油包水的PCR微反应体系,然后进行emPCR扩增

5加载到PTP板:将emPCR扩增好的磁珠加载到PTP板,板上有上百万个微孔,每个微孔只能容纳一个磁珠

6上机测序:将PTP板,连同测序反应的酶和底物,一起放在GS FLX Titanium上进行大规模平行测序

7数据的处理:系统自带GS Assembler Software等软件,会对测序得到的序列进行的聚类和组装等处理。

DNA甲基化测序DNA甲基化——表观遗传学的重要组成部分

表观遗传的分子机制可以通过DNA和组蛋白的共价修饰, 以及包装DNA的蛋白起作用的。这些DNA和组蛋白的共价修饰决定了特定的基因表达形式。

组蛋白有着众多的共价修饰形式, 包括甲基化、乙酰化、泛素化以及磷酸化等。根据修饰的种类, 位点以及修饰的个数不同, 这些修饰可引发不同的效果, 或者引起基因沉默, 或者引起基因激活。

包含有:RNA干扰、DNA的共价修饰, 可引起基因失活以及转座子沉默

DNA甲基化的重要作用:维持细胞正常功能、生长发育、遗传印记、疾病

DNA甲基化与疾病:

甲基化将导致如染色体的不稳定、可移动遗传因子的激活、致病基因的表达,抑病基因的不表达。肿瘤如:神经胶质瘤细胞的7种肿瘤基因甲基化;胰岛素样生长因子-2(IGF-2)基因印记丢失,致癌;抑脑肿瘤基因启动子高甲基化……(老年痴呆抑制老年痴呆症的基因被甲基化而失活、红斑狼疮DNA甲基化减少、脐疝-巨舌-巨人症综合症11号染色体上两个印记基因错表达、衰老)

DNA甲基化是指DNA碱基上特定位置的碳被添加甲基的过程。其主要形式有N5-mC(胞嘧啶)、N6-mA(腺嘌呤)、N7-mG (鸟嘌呤)。一般DNA甲基化不做特殊说明是指在甲基化转移酶的作用下,胞嘧啶形成5-甲基胞嘧啶的过程

CpG岛:DNA甲基化是个动态过程,如在衰老的过程中,整体甲基化水平降低,局部甲基化水平增高。哺乳动物基因组,CpG 仅1%,但有些区域CpG的密度很高,均值5倍以上,哺乳动物约4万个CpG岛。多数甲基化位点不在CpG岛,CpG 岛甲基化,启动子区CpG岛。

甲基化和去甲基化

DNA甲基化转移酶

1) DNM T1:持续性DNA 甲基转移酶,作用于仅有一条链甲基化的DNA 双链, 使其完全甲基化, 可参与DNA 复制双链中的新合成链的甲基化;

2) DNM T3a、DNM T3b:从头甲基转移酶, 它们可甲基化CpG, 使其半甲基化, 继而全甲基化。从头甲基转移酶可能参与细胞生长分化调控, 其中DNM T3b在肿瘤基因甲基化中起重要作用。

DNA 去甲基化有两种方式:

1) 被动途径: 由于核因子N F 粘附甲基化的DNA , 使粘附点附近的DNA不能被完全甲基化, 从而阻断DNM T1 的作用;

2) 主动途径: 是由去甲基酶的作用, 将甲基集团移去的过程。

重亚硫酸盐(Bisulfite)处理结合测序分析是研究甲基化最常用也是最准确的方法。基于重亚硫酸盐高效处理结合新一代高通量测序技术Illumina Hiseq 2000使得基因组整体水平高精度的甲基化检测成为现实。

该技术主要流程:先将基因组DNA或大片段DNA随机打断,加上特定接头后用重亚硫酸盐高效处理,对处理好的DNA文库在基因组水平上进行大规模测序,然后进行全基因组范围内高精度的甲基化状况分析。

文库制备的整个过程需要3天,CT转换率达到98%以上。该技术可在全基因组水平上最大限度的、完整的获取甲基化状态信息和与基因表达调控的多重关系,可高效精确完成全基因组甲基化测序及高分辨DNA甲基化谱式绘制,并可对发现的靶点区进行甲基化特异性PCR验证。

重亚硫酸盐建库测序

实验流程:基因组DNA随机打断↓ DNA片段的末端修复↓将‘A’碱基加入到 DNA片段的3’末端↓DNA片段末端加上特别处理的甲基化接头↓重亚硫酸盐处理↓去盐处理↓PCR扩增连上接头的DNA片段↓文库检测↓DNA 在cBot上的成簇扩增↓Illumina Hiseq 2000上的测序↓生物信息学分析

转录组测序

转录组测序(RNA-seq)技术

转录组是某个物种或者特定细胞类型产生的所有转录本的集合。转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理,已广泛应用于基础研究、临床诊断和药物研发等领域。基于Illumina高通量测序平台的转录组测序技术使能够在单核苷酸水平对任意物种的整体转录活动进行检测,在分析转录本的结构和表达水平的同时,还能发现未知转录本和稀有转录本,精确地识别可变剪切位点以及cSNP(编码序列单核苷酸多态性),提供最全面的转录组信息。相对于传统的芯片杂交平台,转录组测序无需预先针对已知序列设计探针,即可对任意物种的整体转录活动进行检测,提供更精确的数字化信号,更高的检测通量以及更广泛的检测范围,是目前深入研究转录组复杂性的强大工具。

技术优势:

数字化信号:直接测定每个转录本片段序列,单核苷酸分辨率的精确度,同时不存在传统微阵列杂交的荧光模拟信号带来的交叉反应和背景噪音问题。

高灵敏度:能够检测到细胞中少至几个拷贝的稀有转录本。

任意物种的全基因组分析:无需预先设计特异性探针,因此无需了解物种基因信息,能够直接对任何物种进行转录组分析。同时能够检测未知基因,发现新的转录本,并精确地识别可变剪切位点及cSNP,UTR区域。

更广的检测范围:高于6个数量级的动态检测范围,能够同时鉴定和定量稀有转录本和正常转录本。

应用领域:转录本结构研究(基因边界鉴定、可变剪切研究等),转录本变异研究(如基因融合、编码区SNP研究),非编码区域功能研究(Non-coding RNA研究、microRNA前体研究等),基因表达水平研究以及全新转录本发现。RNA-seq技术服务实验流程:

1. 样品RNA准备

2. 测序文库构建使用oligo dT微珠纯化mRNA > RNA片段化处理反转录反应合成合成双链cDNA > 双链DNA末端修

复及3’末端加‘A’ > 使用特定的测序接头连接DNA片段两端 >高保真聚合酶扩增构建成功的测序文库

3. DNA成簇(Cluster)扩增

4. 高通量测序(Illumina Genome Analyzer IIx)

5. 数据分析原始数据读取与数据库比对并进行注释深层次数据分析

6. 提供实验报告

原始数据报告(Fasta-Q格式),包含所有测序序列信息,碱基读取质量评估

基本数据分析报告(Excel表格),包含有效序列的序列信息、与参考基因组比对后的注释信息等。

高级数据分析,如基因覆盖率和测序深度分

析,基因表达差异分析,基因结构分析,鉴定选择性

剪切现象,发现新基因,鉴定基因融合现象。

基因转录组测定和分析

一.大规模表达序列标签(EST)测定及分析

ESTs(Expressed Sequence tags )是从已建好的cDNA

库中随机取出一个克隆,从5’末端或3’末端对插入

的cDNA片段进行一轮单向自动测序,所获得的约

60-500bp的一段cDNA序列。

EST相关数据库

储存EST原始数据的一级数据库:EMBL,GenBank

(dbEST),DDBJ

对EST进行聚类拼接的二级数据库:UniGene,TIGR

Gene Indices ,STACK

EST的应用:

1.ESTs与基因识别

ESTs已经被广泛的应用于基因识别,因为ESTs的数

目比GenBank中其它的核苷酸序列多,研究人员更容

易在EST库中搜寻到新的基因(Boguski et al.,

1994). 在同一物种中搜寻基因家族的新成员

(paralogs)。

2.ESTs与基因图谱的绘制

EST可以借助于序列标签位点(sequence-tagged sites)用于基因图谱的构建. STS本身是从人类基因组中随机选择出来的长度在200-300bp左右的经PCR检测的基因组中唯一的一段序列。来自mRNA的3’非翻译区的ESTs更适合做为STSs,用于基因图谱的绘制。其优点主要包括:

由于没有内含子的存在,因此在cDNA及基因组模板中其PCR产物的大小相同;

与编码区具有很强的保守性不同,3’UTRs序列的保守性较差,因此很容易将单个基因与编码序列关系非常紧密的相似基因家族成员分开。(James Sikela等,1991年)

3.ESTs与基因预测

由于EST来源于cDNA,因此每一条EST均代表了文库建立时所采样品特定发育时期和生理状态下的一个基因的部分序列。使用合适的比对参数,大于90%的已经注释的基因都能在EST库中检测到(Bailey et al., 1998)。ESTs可以做为其它基因预测算法的补充,因为它们对预测基因的交替剪切和3‘非翻译区很有效。

4.ESTs与SNPs

来自不同个体的冗余的ESTs可用于发现基因组中转录区域存在的SNPs。最近的许多研究都证明对ESTs数据的分析可以发现基因相关的SNPs 。应注意区别真正的SNPs和由于测序错误( ESTs为单向测序得来,错误率可达2%)而引起的本身不存在的SNPs。解决这一问题可以通过:提高ESTs分析的准确性,对所发现的SNPs进行实验验证。

5.利用ESTs大规模分析基因表达水平

因为EST序列是从某以特定的组织的cDNA文库中随机测序而得到,所以可以用利用未经标准化和差减杂交的cDNA 文库EST分析特定组织的基因表达谱。标准化的cDNA文库和经过差减杂交的cDNA文库则不能反应基因表达的水平。基因表达系列分析(Serial Analysis of Gene Expression, SAGE)分析流程

SAGE文库的构建:

NlaIII(锚定酶)酶切,该酶能够识别CATG位点并在其3′端进行酶切;

链霉素包被的磁珠进行亲和纯化;

将cDNA分为A和B两部分,分别连接接头A或接头B,每一种接头都含有CATG四碱基突出端、限制性内切酶BsmFI的识别序列和一个PCR引物序列(引物A或B);

用标签酶BsmFI酶切,该酶在其识别位点3′端下游的14-17bp处进行酶切,产生连有接头的短cDNA片段;

混合并连接两个短cDNA片段,构成双标签(ditag)后,用引物A和B进行PCR扩增;

锚定酶NlaIII切割扩增产物,抽提SAGE双标签片段;并用T4 DNA连接酶连接成多聚体(concaterner);

选择合适的片断长度,克隆进载体;得到的克隆插入序列由一系列的20-22bp长的SAGE双标签组成,每两个双标签中间由4bp的NlaIII酶切位点分隔开。

●SAGE文库的测序:单向测序。

●在双标签多聚体序列中定位NlaIII酶切位点(即CATG);

●提取CATG位点之间的20-22bp长的双标签序列;

●去除重复出现的双标签序列,包括反向互补方向上重复的双标签序列;

●截取每个双标签序列最靠近两头末端的10个碱基,即为标签序列;

●去除与接头序列相对应的标签(即TCCCCGTACA和TCCCTATTAA),同时去除含有不确定碱基(即除A、C、T、

G四种碱基以外的碱基)的标签;

●计算每个标签的出重复次数,以列表的形式给出一个包含每个标签及其表达丰度的报告。

基因表达系列分析是一种用于定量,高通量基因表达分析的实验方法(Velculescu et al., 1995)。SAGE的原理就是分离每个转录本的特定位置的较短的单一的序列标签(约9-14个碱基对),这些短的序列被连接、克隆和测序,特定的序列标签的出现次数就反应了对应的基因的表达丰度。

DNA微阵列或基因芯片的研究

高密度寡核苷酸cDNA 芯片或cDNA微阵列是一种新的大规模检测基因表达的技术,具有高通量分析的优点。在许多情况下,cDNA芯片的探针来源于3'EST (Duggan et al., 1999),所以EST序列的分析有助于芯片探针的设计。

几种大规模分析基因表达水平的方法的比较:

ESTs数据的不足

ESTs很短,没有给出完整的表达序列;低丰度表达基因不易获得。

由于只是一轮测序结果,出错率达2%-5%;

有时有载体序列和核外mRNA来源的cDNA污染或是基因组DNA的污染;

有时出现镶嵌克隆;序列的冗余,导致所需要处理的数据量很大

cDNA文库构建

非标准化的cDNA文库的构建。(可用于基因表达量的分析)

经标准化或扣除杂交处理的cDNA文库。(富集表达丰度较低的基因)

Oligo d(T) cDNA文库。(非翻译区由于不含有编码序列,与编码区保守序列相比所受到的选择压力比较小,因而其多态性程度比较高,便于多态性位点的选择以用于遗传图谱的构建。)

随机引物cDNA文库。(所获得的EST在基因功能的鉴定时具有更多的信息含量,并且在构建EST数据库时更有优势,同时有利于利用EST数据库聚类完整的基因和阅读框的寻找,便于利用更敏感的蛋白质比较来寻找同源基因。)cDNA文库构建常见问题RNA得率低mRNA分离效率低cDNA产物少

原因:多糖、多酚、内源性核酸蛋白酶、 miRNA等

●多糖-糖蛋白(核酸蛋白酶,植物血凝素等)、多酚类等次生代谢产物在RNA分离时,经常与RNA共沉降,导

致RNA 丢失。或导致分离后的RNA严重不纯,影响mRNA分离的得率。

●内源性核酸酶存在较多的情况下,可降解双链DNA、RNA或者DNA-RNA杂合体,致使RNA易降解,转录后的

DNA接头无法连接,是cDNA得率低的原因之一。

●miRNA的存在导致mRNA的降解

测序方向的选择

根据不同的实验目的选择不同的测序方向:

◆ 5’端 5’上游非翻译区较短且含有较多的调控信息。一般在寻找新基因或研究基因差异表达时用5’端EST 较好,大部分EST计划都是选用5’端进行测序的,而且从5’端测序有利于将EST拼接成较长的基因序列。

◆ 3’端 3’端mRNA有一20-200bp的plyA结构,同时靠近plyA又有特异性的非编码区,所以从3’端测得

EST含有编码的信息较少.但研究也表明,10%的mRNA3’端有重复序列,这可以作为SSR标记;非编码区有品种的特异性,可以作为STS标记.

◆两端测序获得更全面的信息。

序列测定及数据分析

序列前处理---随机挑取克隆进行5’或3’端测序-----聚类和拼接---基因注释及功能分类----后续分析

序列前处理 (pre-processing)

1. 去除低质量的序列(Phred)

2. 应用BLAST、RepeatMasker或Crossmatch遮蔽数据组中不属于表达的基因的赝象序列(artifactual sequences)。

●载体序列(ftp://https://www.360docs.net/doc/5512329913.html,/repository/vector)

●重复序列(RepBase,https://www.360docs.net/doc/5512329913.html,)

●污染序列 (如核糖体RNA、细菌或其它物种的基因组DNA等)

3. 去除其中的镶嵌克隆。

4. 最后去除长度小于100bp的序列。

ESTs的聚类和拼接

聚类的目的就是将来自同一个基因或同一个转录本的具有重叠部分(over-lapping)的ESTs整合至单一的簇(cluster)中。

聚类作用:

产生较长的一致性序列(consensus sequence),用于注释。

降低数据的冗余,纠正错误数据。

可以用于检测选择性剪切。

基因表达谱分析

不严格的和严格的聚类(loose and

stringent clustering)

◆ loose clustering

●产生的一致性序列比较长

●表达基因ESTs数据的覆盖率高

●含有同一基因不同的转录形式,如各种选

择性剪接体

●每一类中可能包含旁系同源基因

(paralogous expressed gene)的转录本

●序列的保真度低

◆ stringent clustering

●产生的一致性序列比较短

●表达基因ESTs数据的覆盖率低

●因此所含有的同一基因的不同转录形式少

●序列保真度高

有参照的和无参照的聚类 (Supervised and unsupervised clustering)

◆ Supervised clustering根据已知的参考序列(如全长mRNA、已拼接好的一致性序列) 聚类。

◆ Unsupervised clustering 没有根据参考序列进行分类。

ESTs聚类的数据库主要有三个: UniGene、TIGR Gene Indices、 STACK

常用的拼接软件:◆ Phrap、 CAP3、 TIGR_Assember

基因注释及功能分类:

注释:◆序列联配: Blastn, Blastx ◆蛋白质功能域搜索(二结构比对):Pfam、Interproscan

RNA-seq技术与芯片技术的比较

RNA-seq的挑战

●文库构建过程中大片段的RNA必须经过片段化处理,会引入一定的偏倚。

●PCR会造成表达量的变化。

●海量短序列数据的比对或拼接情况复杂,对重复序列和多匹配序列的精确定位存在明显问题。

●高等真核生物可变剪接和反式剪接的鉴定仍有相当的误差。

●测序深度的确定因物种、器官、组织、时期而变,很难有统一公式直接计算。

微生物基因组学

2.微生物基因组研究概况: 研究现况及内容:

二微生物基因组的特点

1.特点

原核生物基因组的大小

原核生物基因组的编码序列(CDS/ORF)

原核生物染色体结构

GC 含量

重复序列

DNA链组成的非对称性

最小基因组

微生物基因组的特点

ORF:占原核生物基因组总序列的90%,基因的平均大小为1kb

基因组编码序列的注释:

确定编码序列:序列同源性比较,如BLAST 概率型方法,基于隐马尔可夫模型的GENSCAN

基因的功能注释:已知功能的蛋白质基因的序列

已知功能蛋白质的motif/domain

有同源序列的未知基因

无同源序列的疑是基因

3.原核生物染色体结构

大多数原核生物:一条环状闭合双链DNA

Brucellasuis1330:两条环状闭合双链DNA2,107,792 bp(ChrI1,207,381bp(ChrII)

Vibriocholerae: 两条环状闭合双链DNA

Treponemapallidum:一条环状闭合双链DNA

4.GC 含量

原核生物基因组GC含量为:25.5-67.9 %

嗜温菌基因组GC含量与rRNA、tRNA的GC含量成正比

嗜热菌rRNA、tRNA的GC含量与基因组GC含量不成正比,但与OGT(最适生长温度)成正比

tRNAGC含量总是大于rRNA的GC含量

基因组非编码区序列的注释:非编码区的注释(各类重复序列,基因表达的调控序列,信号序列等)

5. DNA链组成的非对称性

前导链含有较多的G(A)而后随链含有较多的C(T)

?计算公式为(nG-nC)/(nG+nC)

(nA-nT)/(nA+nT)

?累计skew (cumulative skew)

?用于复制起点和终点的定位

密码子使用偏好(codonusage bias):先导链和后随链密码子的不同

在先导链,以G或T开头或结尾的密码子显著地多于后随链,常见的有GTG、GCG和GAG;在后随链以C或A开头或结尾的密码子多于先导链,如CTC、GCC、CCC、ATC和ACC

基因密度和密码子使用的差别:

高度表达基因: 核蛋白体蛋白基因,与翻译和转录有关的因子基因,分子伴侣基因和与主要的能量代谢相关的基因?大多编码于前导链

?通常都有密码子偏好(核蛋白体蛋白基因密码子的第三位多为G )

?快速生长的细菌(大肠杆菌、霍乱弧菌、枯草芽孢杆菌和流感嗜血杆菌)主要的糖酵解和三羧酸循环基因为高度表

达基因

?产甲烷菌,与甲烷代谢有关的基因为高度表达基

?高度表达基因: 那些在密码子使用上与一般基

因相差很大,与核蛋白体蛋白基因,翻译和转录

相关基因,伴侣-降解蛋白基因等在密码子使用上

高度相似的基因为高度表达基因。

三.微生物测序及分析流程图

数据分析软件

?序列拼接组装

Phred/Phrap/ConsedPhred/Consed, ,

OligoOligo6

?基因组注释Glimmer, BLAST, tRNAscantRNAscan--SESE

?比较基因组分析BLAST, MUMmerMUMmer, ACT, , perlperlscript, script,ClustalClustalW

Finishing阶段

Blastn或Blastp参照序列

确定Contigs之间关系利用基因order信息

设计引物,PCR,测序

数据添加至原有的数据

四.微生物基因组研究的意义

1.基因组研究在医学的应用致病相关基因的鉴定设计特异的实验诊断方法疫苗的研究新型抗生素的开发

1.基因组研究的生物技术应用生物降解作用酶工业食品生物技术抗生物质

微生物的进化

基于16S rDNA的系统进化,单个基因的进化并不等同于物种的进化-基因的水平转移

A.致病相关基因的鉴定-通过基因组比较鉴定病原相关基因

1.致病物质多为病原体细胞壁成分、表面蛋白和一些分泌性蛋白质

2. 功能相同的蛋白质往往相邻并受共同的调控序列调控--operon

3. 同一菌种的致病菌株与非致病菌株的基因组进行比较

B.设计特异的实验诊断方法

寻找高度特异的核酸序列:

实验技术:PCR、杂交技术(Microarray,DNAchip)

应用:鉴定病原种类进行临床诊断

病原分型的流行病学研究

预测疾病进展及临床疗效

C. 疫苗的研究

通过全基因组序列的同源性比较,寻找致病菌的属特异、群特异、种特异、型特异、甚至亚型特异的抗原

Pizza等和Tettelin等对血清型B脑膜炎奈瑟菌近350种抗原的研究

Wizemann等对肺炎链球菌的基因组的抗原性蛋白研究

D. 新型抗生素的开发

1.药靶的特征:药靶应是病原生物必需的,在进化上是保守的,可作为药靶的微生物基因或蛋白质: 毒力基因、必需基因、菌种专一基因、独特酶类、膜转运蛋白等

毒力基因作为靶位:毒力基因的发现:非致病菌(E.coliK12)与致病菌(E.coliO157, 沙门氏菌,耶尔森氏菌)基因组的比较

致病岛(Pathogenicityislands)编码的功能已知蛋白作为药靶

必需基因作为药靶:

寻找必需基因的方法:比较基因组:在不同进化阶段保守的基因往往是必需基因

缺失致死或转座子插入--

转座子插入+PCR寻找流感嗜血杆菌,

肺炎链球菌必需基因

致病菌特殊且必需的蛋白作为靶位

菌种专一基因作为药靶:

寻找菌种专一基因的方法:比较基因组方法--病原生物基因组中存在但

近缘种属中缺少的基因可能是致病关键基因,eg 幽门螺杆菌(与大肠杆菌和流感杆菌比较)找

到594个特有基因,73个编码种专一蛋白,如丙酮酸:铁氧还蛋白氧化还原酶,可作为靶位

独特酶类作为药靶:所有细菌独特酶类均可作为靶位,如:参与细胞壁合成的酶类、叶酸合成酶类、核酸合成酶类膜转运蛋白作为靶位:衣原体和立克次体的ATP/ADP转位酶是致病菌必需,而只有植物叶绿体、线粒体具有类似酶,细菌多药运输蛋白(泵)

2. 药靶的种类共有药靶菌种或某菌种的致病菌株的特异性药靶某一部位常见致病菌的共同药靶

E.基因的水平转移的意义: 研究微生物的进化史研究菌种新功能的来源研究微生物的生命过程预测基因功能基因水平转移的方式:

转化接合转导

鉴定基因水平转移的方法:

鉴定基因组区段的组成

比较不同基因的系统发生

最大相似性分析

基因在生物的分布谱

易被水平转移的基因:

难被转移的基因:informational genes 进化核心基因

易被转移的基因:operational genes 氨酰-tRNA合成酶基因剪切因子重组酶DNA聚合酶

功能基因组学在益生菌的应用

对于乳酸菌的研究已经从最初的形态学研究,发展为细胞水平和分子水平的研究。自2001年完成第一株乳酸菌即乳酸乳球菌IL1403的全基因组测序以来,目前已经公布的测序完成的乳酸菌包括: 嗜酸乳杆菌NCFM /ATCC 700396; 乳酸乳球菌IL1403、长双歧杆菌NCC 2705、植物乳杆菌WCSF1、约氏乳杆菌NCC533以及等。许多与工业生产相关的性状都是由质粒编码的,比如说: 乳糖代谢酶类、蛋白水解酶类、摄取柠檬酸盐的酶、噬菌体抗性、细菌素的生成、多糖的合成、金属离子抗性以及抗生素抗性。 乳酸菌基因组学(比较基因组学和功能基因组学) 在乳品发酵菌种及益生菌方面的应用: (1) 筛选具有特定胞外多糖特性(如短结构,拉丝状) 及数量的嗜热链球菌; (2) 对于益生菌来说,其基因组的分析可以将它们的基因特点和益生功能联系起来在分子水平上筛选具特定功效的益生菌菌株; (3) 进一步探索噬菌体的分子进化规律,阐明乳酸菌抗噬菌体的机制。例如嗜热链球菌对CR ISPR ( clustered regularly interspaced short palin2dromic repeats 呈一定顺序反复规律性出现的基因丛簇) 编码的获得与其抗噬菌体的关系的发现。 基因研究与筛选不同特性的“胞外多糖EPS”相关的嗜热链球菌 研究发现,在酸奶菌种中的嗜热链球菌中都含有一个基因簇: EPS基因簇,它与一种胞外多糖(EPS) 的合成相关,因此被称为EPS基因簇。而对于35株嗜热链球菌的EPS基因簇分析发现:在低“拉丝”结构和短EPS基因之间似乎存在某种特定的联系; 这将为酸奶产黏菌种的筛选和开发提供了理论依据及从分子水平上大规模筛选提供了简单快捷和直观的方法。 乳酸菌的功能基因组学与益生菌菌种特定功效的筛选 功能基因组学Functional genomics的研究又被称为后基因组学,是利用结构

第八章分子生物学常用技术的原理及其应用及人类基因组学

第八章分子生物学常用技术的原理及其应用及人类基因组学 测试题 一、名词解释 1.分子杂交 2.Southernblotting 3.Northernblotting 4.Westernblotting 5.dotblotting 6.DNA芯片技术 7.PCR 8.功能性克隆 9.转基因技术 二、填空题 1.Southernblotting用于研究、Northernblotting用于研究,Westernblotting用于研究。 2.PCR的基本反应步骤包括、和三步。 3.在PCR反应体系中,除了DNA模板外,还需加入、、和。 4.Sange法测序的基本步骤包括、、和。 5.目前克隆致病相关基因的主要策略有、、。 6.血友病第Ⅷ因子基因的首次克隆成功所采用的克隆策略是,而DMD致病基因的克隆所采用的克隆策略是。 三、选择题 A型题 1.经电泳分离后将RNA转移到硝酸纤维素(NC)膜上的技术是: A.SouthernblottingB.Northernblotting

C.WesternblottingD.dotblotting E.insituhybridization 2.不经电泳分离直接将样品点在NC膜上的技术是 A.SouthernblottingB.Northernblotting C.WesternblottingD.Dotblotting E.insituhybridization 3.经电泳分离后将蛋白质转移到NC膜上的技术是 A.SouthernblottingB.Northernblotting C.WesternblottingD.dotblotting E.insituhybridization 4.经电泳后将DNA转移至NC膜上的技术是A.SouthernblottingB.Northernblotting C.WesternblottingD.Easternblotting E.insituhybridization 5.PCR的特点不包括 A.时间短,只需数小时B.扩增产物量大 C.只需微量模板D.用途非常广泛 E.底物必须标记 6.用于PCR的DNA聚合酶必须 A.耐热B.耐高压C.耐酸D.耐碱E.耐低温7.PCR反应过程中,模板DNA变性所需温度一般是A.95?CB.85?CC.75?CD.65?CE.55?C 8.PCR反应过程中,退火温度一般是 A.72?CB.85?CC.75?CD.65?CE.55?C 9.PCR反应过程中,引物延伸所需温度一般是A.95?CB.82?CC.72?CD.62?CE.55?C

转录组学主要技术与应用研究

转录组学主要技术及其应用研究 姓名:梁迪 专业:微生物学 年级:2013 学号:3130179 二零一四年六月十五日

转录学主要技术及其应用研究 摘要:转录组(transcriptome)是特定组织或细胞在某一发育阶段或功能状态下转录出来的所有RNA的集合。转录组学研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理。目前,转录组学研究技术主要包括两种:基于杂交技术的微阵列技术(microarray)和基于测序技术的转录组测序技术,包括表达序列标签技术(Expression Sequence Tags Technology,EST)、基因表达系列分析技术(Serial analysis of gene expression,SAGE)、大规模平行测序技术(Massively parallel signature sequencing,MPSS)、以及RNA 测序技术(RNA sequencing,RNA-seq)。文章主要介绍了以上转录组学主要研究技术的原理、技术特点及其应用,并就这些技术面临的挑战和未来发展前景进行了讨论,为其今后的研究与应用提供参考。 关键词:转录组学;微阵列技术;转录组测序技术;应用 Study on the main technologies of transcriptomics and their application Abstract: The transcriptome is the complete set of transcripts for certain type of cells or tissues in a specific developmental stage or physiological condition. Transcriptome analysis can provide a comprehensive understanding of molecularmechanisms involved in specific biological processes and diseases from the information on gene structure and function. Currently, transcriptomics technology mainly includes microarry -based on hybridization technology and transcriptome sequencing-based on sequencing technology, involving Expression sequence tags technology, Serial analysis of gene expression, Massively parallel signature sequencing and RNA sequencing. The detailed principles, technical characteristics and applications of the main transcriptomics technologies are reviewed here, and the challenges and application potentials of these technologies in the future are also discussed. This will present the useful information for other researchers. Keywords: transcriptomics ; microarray ; transcriptome sequencing; application 随着后基因组时代的到来,转录组学、蛋白质组学、代谢组学等各种组学技术相继出现,其中转 录组学是率先发展起来以及应用最广泛的技术[1]。

宏基因组学的研究进展

宏基因组学的研究状况及其发展 摘要:宏基因组学是近年来发展起来的一门新兴学科,主要技术包括从环境样品中提取微生物混合基因组DNA、利用可培养的宿主菌建立宏基因组文库及筛 选目的基因。该技术可以克服传统培养技术的不足,是研究未培养微生物、寻找新功能基因和开发获得新资源的重要新途径。目前宏基因组学已广泛应用于各个领域,并在医药、农业、能源开发、环境修复、生物技术、生物防御等方面有了较深入的研究。 关键词:宏基因组学、宏基因组、基因组文库构建、文库筛选、未培养微生物、研究进展 随着微生物学的发展,微生物基因组全序列测定计划正在全球被快速地推行,但现有技术条件下,自然界存在的可培养微生物不到总数的1%,阻碍了该计划 的发展,使得绝大多数的微生物资源不能被开发和利用。21世纪初,随着测序能力的提高和基因组学的发展,科学家提出了一种研究不可培养微生物基因组的新思路——直接对含有各种不可培养的微生物的群体进行基因组序列的测定。这类研究称为Metagenomics,前缀“Meta”源于希腊语。意思是“超越”。科学家选择它来表示这种基因组研究超越了传统意义上分析单一物种的基因组学,将研究对象定为由种类众多的微生物组成的整个菌落。国内的研究者也据此将该术语翻译为“宏基因组学”。 1 宏基因组的概念 宏基因组 (也称微生物环境基因组、宏基因组学、元基因组学、生态基因组学) 是由Handelsman等1998年提出的新名词, 其定义为“the genomes of the total microbiota found in nature”,即生境中全部微小生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因, 目前主要指环境样品中的细菌 和真菌的基因组总和。而所谓宏基因组学就是一种以环境样品中的微生物群体基因组为研究对象, 以功能基因筛选和测序分析为研究手段, 以微生物多样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间的关系为研究目的的新的微生物研究方法。一般包括从环境样品中提取基因组 DNA, 克隆DNA到合适 的载体,导入宿主菌体,筛选目的转化子等工作。宏基因组文库既包含了可培养的又包含了不能培养的微生物基因,避开了微生物分离培养的问题,极大地扩展了微生物资源的利用空间,增加了获得新的生物活性物质的机会,为新的医药产业和发现新的生物技术提供丰富的基因文库,并利于环境微生物有机群体的分布和功能的研究。 2 宏基因组学的研究过程 2.1 宏基因组文库的构建 宏基因组文库的构建沿用了分子克隆的基本原理和技术方法,并根据具体环境样品的特点和建库目的采用了一些特殊的步骤和策略。一般包括样品总DNA的 提取、与载体连接和克隆到宿主中。 2.1.1样品总DNA的提取 宏基因组文库构建的关键之一是获得高质量的目的样品的总DNA。目的样品 的采集是第一步,除了需严格遵循取样规则外,取样中应尽量避免对样品的干扰,缩短保存和运输的时间,使样品能更好地代表自然状态下的微生物原貌。 根据提取样品总DNA前是否分离细胞,提取方法可以分为原位裂解法和异位 裂解法。原位裂解法主要是通过去污剂处理(如SDS)、酶解法(如蛋白酶K)、机械

基因组学的研究内容

基因组学的研究内容 结构基因组学: 基因定位;基因组作图;测定核苷酸序列 功能基因组学:又称后基因组学(postgenomics基因的识别、鉴定、克隆;基因结构、功能及其相互关系;基因表达调控的研究 蛋白质组学: 鉴定蛋白质的产生过程、结构、功能和相互作用方式 遗传图谱 (genetic map)采用遗传分析的方法将基因或其它dNA序列标定在染色体上构建连锁图。 遗传标记: 有可以识别的标记,才能确定目标的方位及彼此之间的相对位置。 构建遗传图谱 就是寻找基因组不同位置上的特征标记。包括: 形态标记; 细胞学标记; 生化标记;DNA 分子标记 所有的标记都必须具有多态性!所有多态性都是基因突变的结果! 形态标记: 形态性状:株高、颜色、白化症等,又称表型标记。 数量少,很多突变是致死的,受环境、生育期等因素的影响 控制性状的其实是基因,所以形态标记实质上就是基因标记。

细胞学标记 明确显示遗传多态性的染色体结构特征和数量特征 :染色体的核型、染色体的带型、染色 体的结构变异、染色体的数目变异。优点:不受环境影响。缺点:数量少、费力、费时、对生物体的生长发育不利 生化标记 又称蛋白质标记 就是利用蛋白质的多态性作为遗传标记。 如:同工酶、贮藏蛋白 优点: 数量较多,受环境影响小 ?

缺点: 受发育时间的影响、有组织特异性、只反映基因编码区的信息 DNA 分子标记: 简称分子标记以 DNA 序列的多态性作为遗传标记 优点: ? 不受时间和环境的限制 ? 遍布整个基因组,数量无限 ?

不影响性状表达 ? 自然存在的变异丰富,多态性好 ? 共显性,能鉴别纯合体和杂合体 限制性片段长度多态性(restriction fragment length polymorphism , RFLP ) DNA 序列能或不能被某一酶酶切,

基因组学(结构基因组学和功能基因组学).

问:基因组学、转录组学、蛋白质组学、结构基因组学、功能基因组学、比较基因组学研究有哪些特点? 答:人类基因组计划完成后生物科学进入了人类后基因组时代,即大规模开展基因组生物学功能研究和应用研究的时代。在这个时代,生命科学的主要研究对象是功能基因组学,包括结构基因组研究和蛋白质组研究等。以功能基因组学为代表的后基因组时代主要为利用基因组学提供的信息。 基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(struc tural genomics和以基因功能鉴定为目标的功能基因组学(functional genomics。结构基因组学代表基因组分析的早期阶段,以建立生物体高分辨率遗传、物理和转录图谱为主。功能基因组学代表基因分析的新阶段,是利用结构基因组学提供的信息系统地研究基因功能,它以高通量、大规模实验方法以及统计与计算机分析为特征。 功能基因组学(functional genomics又往往被称为后基因组学(postgenomics,它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。 基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等采用的手段包括经典的减法杂交,差示筛选,cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系统的分析。新的技术应运而生,包括基因表达的系统分析,cDNA微阵列,DNA芯片等。鉴定基因功能最有效的方法是观察基因表达被阻断或增加后在细胞和整体水平所产生的表型变异,因此需要建立模式生物体。 功能基因组学

植物功能基因组学及其研究技术_崔兴国

第9卷 第1期2007年3月 衡水学院学报 J o u r n a l o f H e n g s h u i U n i v e r s i t y V o l.9,N o.1 Ma r.2007植物功能基因组学及其研究技术 崔兴国 (衡水学院 生命科学系,河北 衡水053000) 摘 要:植物基因组的研究已经由以全基因组测序为目标的结构基因组学转向以基因功能鉴定为目标的功能基因组学研究.植物功能基因组学研究是利用结构基因组学积累的数据,从中得到有价值的信息,阐述D N A序列的功能,从而对所有基因如何行使其职能并控制各种生命现象的问题作出回答.近年来植物功能基因组学的研究技术主要包括表达序列标签、基因表达的系列分析、D N A微阵列和反向遗传学等.对植物功能基因组学的研究将有利于我们对基因功能的理解和对植物形状的定性改造和利用. 关键词:植物;功能基因组学;研究技术 中图分类号:Q3-3 文献标识码:A 文章编号:1673-2065(2007)01-0023-04 基因是细胞的遗传物质,决定细胞的生物学形状,细胞的生物学功能最终是由大量的基因表达完成的.随着人类基因组“工作框架图”的完成,生命科学研究的重点已经从结构基因组学转移到了功能基因组学的研究,特别是模式植物拟南芥(A r a b i d o p-s i s t h a l i a n a)和水稻(O r y z a s a t i v a)基因组测序的完成,公共数据库中已经积累了大量基因序列信息,获得了许多与植物发育相关的功能基因,在此基础上应用实验分析方法并结合统计和计算机分析来研究基因的表达、调控与功能,并相应诞生和发展了一批新的研究技术,为功能基因组学的研究提供了必要而有效的技术支撑.功能基因组学研究的最终目标是解析所有基因的功能,即从基因水平上大规模批量鉴定基因的功能,进而全面研究控制植物生长发育及响应环境变化的遗传机制,在基因组序列与细胞学行为之间起到桥梁作用,共同承担起从整体水平上解析生命现象的重任. 1 植物功能基因组学研究 植物的生长和发育是一个有机体或有机体的一部分形态建成和功能按一定次序而进行的一系列生化代谢反应的总合,反应在分子水平上,它要求相应的遗传代谢途径必须按照特定的时空次序严格进行以保证正常发育.植物功能基因组研究就是要利用植物全基因组序列的信息,通过发展和应用系统基因组水平的实验方法来研究和鉴别基因组序列的作用;研究基因组的结构、组织与植物功能在细胞、有机体和进化上的关系以及基因与基因间的调控关系;从表达时间、表达部位和表达水平3个方面对目的基因在植物中的精细调控进行系统研究.当前植物功能基因组学研究主要集中于一年生的拟南芥与水稻两个物种上,这主要是由于它们的遗传背景清楚,基因组较小,基因结构简单而且易于进行分子生物学操作.拟南芥研究组“2010计划”的宏伟目标是充分利用拟南芥基因组计划获得的序列信息并结合功能基因组研究技术来获知其25000个基因的全部功能,例如开花的诱导过程是植物生活周期中最奇妙的过程,目前从拟南芥中鉴定了提早开花和延迟开花的多种突变体,显示植物开花受多个遗传基因的控制,如延迟开花的两个突变体是由等位基因 C O(C O N S T A N S)和L D(C O L D L U M I N I D E P E N- D E N S)突变引起,这两个基因均已被克隆,并使其在转基因植物的叶片中进行表达,将C O基因转移到拟南芥中,高效表达C O蛋白的转基因植株即使处于短日照条件下也会开花,这说明C O基因具有激活开花基因的作用.对模式植物功能基因组的研究将有助于整个植物基因组学的研究. 目前的功能基因组研究主要包括以下几个方面:(1)c D N A全长克隆与测序;(2)获得D N A芯片 ①收稿日期:2006-10-12 作者简介:崔兴国(1963-),女,河北冀州市人,衡水学院生命科学系副教授.

进化基因组学研究进展

进化基因组学研究进展 刘超 (山东大学生命科学学院济南250100) 摘要:进化基因组学是利用基因组数据研究差异基因功能、生物系统演化、从 基因在水平探索生物进化的学科。随着近年来基因组数据的不断增加,进化基因组学得到了长足的发展。进化基因组学主要包括从基因组水平理解和诠释生物进 化和新基因分析研究探索两方面的内容。本文介绍了进化基因组学研究的主要内容和较为常用的方法,以及近年来在细菌、酵母、果蝇进化基因组学方面的研究进展。 关键词:进化基因组学系统进化比较基因组学新基因 前言 随着基因测序技术的不断进步以及基因组学的飞速的发展,人们积累了大量的基因组学数据,利用所得的大量的基因组数据与进化生物学相结合,在基因组水平研究生物进化机制,随即产生了进化基因组学(Evolutional Genomics)。 近年来进化基因组学取得了长足的进展,在研究差异基因功能、生物系统演化、从基因在水平探索生物进化的终极方式等方面有重大突破,对人类理解生命现象和过程有重要作用。 1进化基因组学研究内容 研究系统进化学通常包括两个关键步骤:一方面,在不同物种中鉴定同源性特佂,另一方面利用构建系统进化树的方法比较这些特征,进而重新构建这些物种的进化历史[1]。针对这两个关键步骤,传统系统进化学,常采用基于形态学 数据和单个基因研究的同源性状鉴定和重建系统进化树(常包括距离法、最大简约法、概率法)[1]的方法来研究。在目前拥有丰富基因组数据的条件下,我们 可以分析基因组数据,利用进化基因组学研究系统进化。

目前进化基因组学的研究内容主要集中于两个方面:(1)在比较不同生物的基因数据的基础上,从基因组水平理解和诠释生物进化;(2)通过对新基因的分析研究探索基因进化过程的规律两个方面[2](如图1)。在进行全基因组进化分析方面,进化基因组学主要集中于构建系统进化树、研究基因组进化策略、研究生物功能变化和进化机制、进化和生态功能基因组学[2]、基因注释的等方面;在新基因方面主要分析基因产生机制和新基因固定及其动力学研究。 图1 进化基因组学主要研究内容 目前进化基因组学的研究有力的解决了一些基础性的进化问题,但也出现了一些未来需要急需解决的挑战。例如生物进化的本质和目前重建系统进化树方法 的限制[1]。 2研究进化基因组学的方法 研究进化基因组学的方法主要包括利用基因组数据分析和研究新基因的产 生和演化两种。 2.1利用基因组数据进行系统进化分析 利用基因组数据进行系统进化分析,常有基于基因序列的方法和基于全基因特征的方法。(如图2)

基因组学技术与原理v2

第2代测序技术 共同点:1、首先也是将基因组DNA随机切割成小片段DNA分子,然后在体外给这些小片段分子的末端连接上接头制成文库,也可以使用配对标签(mate-paired tag)制成跨步文库(jumping libraries)。2、通过原位polon、微乳液PCR(emulsion PCR)或桥式PCR(bridge PCR)等方法获得测序模板。这些方法有一个共同点,那就是任何一个小片段DNA分子的PCR扩增产物都是在空间上聚集的:原位polony法和桥式PCR法中所有的产物都集中在平板的某处,在微乳液PCR法(emulsion PCR)中所有的产物都集中在微珠的表面。3、真正的测序反应本身和传统测序法一样,是由重复的聚合酶促反应和最后的荧光读取分析反应组 一、ABI SOLiD技术平台 SOLiD使用连接法测序获得基于“双碱基编码原理”的SOLiD颜色编码序列,随后的数据分析比较原始颜色序列与转换成颜色编码的参考序列,把SOLiD颜色序列定位到reference上,同时校正测序错误,并可结合原始颜色序列的质量信息发现潜在SNP位点。 (1) 测序实验流程: 1、文库制备:随机片段文库、末端配对文库 2、模板磁珠制备:油包水微型反应体系; DNA片段在磁珠上扩增 3、磁珠固定:磁珠随机固定在测序玻片表面;可增大每个测序玻片上的磁珠密度 4、边连接边测序:四色荧光标记寡核苷酸;边连接边测序 5、测序引物重置:每一个模板选用5个引物进行连接反应测序 (2) 技术特点: 高通量,SOLiD 4.0每个测序反应能够获得50G的数据量; 高准确性,每个DNA碱基检测2次,增加了序列读取的准确性; 高稳定性,测序时采用连接反应,有效地解决了多聚核苷酸序列难读取的问题; 系统中两个独立控制的流动池和条码标定技术运用可以在单个测序中做很多不同的样品。 (3)详细过程 1. SOLiD文库构建 使用SOLiD测序时,可根据实际需要,制备片段文库(fragment library)或末端配对文库(mate-paired library)。制备片段文库就是在短DNA片段(60~110 bp)两端加上SOLiD接头(P1、P2 adapter)。而制备末端配对文库,先通过DNA环化、Ecop15I酶切等步骤截取长DNA片段(600bp到10kb)两末端各25 bp进行连接,然后在该连接产物两端加上SOLiD接头。两种文库的最终产物都是两端分别带有P1、P2 adapter的DNA双链,插入片段及测序接头总长为120~180 bp。 2 油包水PCR 文库制备得到大量末端带P1、P2 adapter但内部插入序列不同的DNA双链模板。和普通PCR一样,油包水PCR 也是在水溶液进行反应,该水相含PCR所需试剂,DNA模板及可分别与P1、P2 adapter结合的P1、P2 PCR引物。但与普通PCR不同的是,P1引物固定在P1磁珠球形表面 (SOLiD将这种表面固定着大量P1引物的磁珠称为P1磁珠)。PCR反应过程中磁珠表面的P1引物可以和变性模板的P1 adapter负链结合,引导模板合成,这样一来,P1引物引导合成的DNA链也就被固定到P1磁珠表面了。 油包水PCR最大的特点是可以形成数目庞大的独立反应空间以进行DNA扩增。其关键技术是“注水到油”,基本过程是在PCR反应前,将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR反应空间。理想状态下,每个小水滴只含一个DNA模板和一个P1磁珠,由于水相中的P2引物和磁珠表面的P1引物所介导的PCR反应,这个DNA模板的拷贝数量呈指数级增加,PCR反应结束后,P1磁珠表面就固定有拷贝数目巨大的同来源DNA模板扩增产物。 3. 含DNA模板P1磁珠的固定 SOLiD测序反应在SOLiD玻片表面进行。含有DNA模板的P1磁珠共价结合在SOLiD玻片表面。磁珠是SOLiD测序的最小单元。每个磁珠SOLiD测序后形成一条序列。 4. SOLiD双碱基编码原理及测序流程 SOLiD“双碱基编码原理”实质上是阐明了荧光探针的颜色类型与探针编码区碱基对的对应关系。SOLiD连接反应的底物是8碱基单链荧光探针混合物。连接反应中,这些探针按照碱基互补规则与单链DNA模板链配对。探针5’末端可分别标记“CY5,Texas Red,CY3,6-FAMTM”4种颜色的荧光染料,并且这四种颜色用数字“3,2,1,0”示

豆科比较功能基因组学研究

豆科比较功能基因组学研究 豆科(Leguminosae)为被子植物中仅次于菊科和兰科的三个最大的科之一,约650属,18000种。豆科分为3个亚科:含羞草亚科(Mimosaceae)、云实亚科(Caesalpiniacae)和蝶形花亚科(Papilionaceae)。豆科作物的经济地位仅次于禾本科,但豆科作物是许多发展中国家老百姓主要的蛋白质来源。同时,随着人们对植物来源油脂、蛋白质对人体的健康价值认识的深入,发达国家以及发展中国家中的富裕人群,对豆类食品的需求量正快速增长。但是,豆科经济作物一般基因组较大、且复杂,如大豆为古异源四倍体,单倍体基因组大小为1115 Mb,豌豆的基因组为4300Mb等等;同时,豆科经济作物种类均缺乏有效的遗传操作系统,所有这些对在豆科作物中开展构建物理图谱、图位克隆基因、分子标记辅助育种、基因功能等研究的开展造成严重的障碍。 我国是大豆的起源中心,拥有丰富的资源优势。如何充分挖掘我国已有的3万余份大豆资源中具有重要农艺价值的基因资源,是目前迅速提升我国大豆育种水平停滞不前的一个重要途径;同时研究植物的重要功能基因与农艺性状之间的关系,也是世界各国所普遍关注的一个研究领域。近十几年来,基因组研究方面的进展,已经并正在继续改变整个生命科学领域的面貌。同时有两个模式物种(蒺藜苜蓿(Medicago truncatula),百脉根(Lotus japonicus)正在开展全基因组测序,这是豆科植物科学研究得天独厚的优越条件,加上已经完成全基因组测序工作的拟南芥(Arabidopsis thaliana)、水稻(Oryza sativa)的基因组信息,为深入开展大豆优异基因资源的研究提供了很好的契机。 在自然科学基金重大项目、“863”等项目的支助下,通过国内外合作,初步建成了比较功能基因学研究的平台,包括:大规模突变体库的构建与筛选、基因定位与克隆、穿梭Marker构建、基于温度梯度凝胶电泳(TTGE)的高通量SNP检测、豆科基因组信息库、生物信息学分析平台等关键技术。为开展对重要农艺性状的农作物比较基因组研究打下基础。 依托现有的平台,我们实验室已获得以下阶段性成果: (1)已获得了34个跨5个豆科物种的穿梭Marker (2)成功地在大豆中克隆了6个花型发育的关键调控基因 (3)利用百脉根与豌豆的共线性关系,在豌豆中克隆了花型(腹背性)控制基因。 关键词:大豆豆科模式物种比较功能基因组

基因组编辑三大技术

基因组编辑三大技术:CRISPR、TALEN和ZFN[创新技巧] 摘要: 最近出现的新工具让研究人员能够在几乎任何物种中实现精确的修饰,有着核苷酸水平的精确度,也有着令人难以置信的速度。大部分是在特定的位置引入双链DNA断裂,然后由细胞进行修复。区别在于如何引入断裂,以及新序列靶定的难易程度。 在过去,如果你想在模式生物中进行复杂的基因组修饰,你几乎只能选择小鼠。 首先,你要设计一个打靶载体,将其引入小鼠胚胎干细胞,并将这些经过修饰的细胞注射到小鼠囊胚。接着是孕育、出生、筛选,等待所需的幼崽成长到性成熟,交配和杂交,之后是更多孕育、更多筛选,一直下去。 复杂的项目也许需要一年或更长时间才能完成。它几乎只对小鼠起作用。原因还不是很清楚,也许小鼠胚胎干细胞有着特别活跃的同源重组系统。大鼠和人类则不是这样。 不过好消息是,最近出现的新工具让研究人员能够在几乎任何物种中实现精确的修饰,有着核苷酸水平的精确度,也有着令人难以置信的速度。大部分是在特定的位置引入双链DNA 断裂,然后由细胞进行修复。区别在于如何引入断裂,以及新序列靶定的难易程度。 锌指核酸酶(ZFN) 第一个使用定制DNA核酸内切酶的基因组编辑策略就是锌指核酸酶(zinc-finger nucleases,简称ZFN)。 锌指蛋白是转录因子;每个指模块识别3-4个碱基的序列,将这些模块混合搭配,研究人员或多或少能靶定他们希望的任何序列。Sigma-Aldrich公司将ZFN技术商业化,推出CompoZr ZFN试剂平台。 ZFN是异源二聚体,其中每个亚基含有一个锌指结构域和一个FokI核酸内切酶结构域。FokI 结构域必须二聚化才有活性,确保必须存在两个相邻的DNA结合事件才能实现双链断裂,从而增加了目标特异性。 切割事件使得大部分基因组编辑技术得以实现。在双链断裂后,细胞试图修复它。最简单的方法是非同源末端接合(NHEJ),其中细胞基本上磨平断裂DNA的两端,再将其彼此拉近,这往往产生移码。另一种方法是同源定向修复(HDR)。细胞试图利用另一条染色体上对应的DNA序列作为模板来修复断裂。通过提供自己的模板,用户可促使系统在不经意间插入所需的序列。 ZFN技术由Sangamo生物科学公司所拥有,被用来开发治疗产品。不过,对于科研方面的应用,Sangamo则授权给了Sigma-Aldrich。

宏基因组学的一般研究策略

宏基因组学的一般研究策略 摘要: 宏基因组学是目前微生物基因工程的一个重要方向与热点。它把微生物的总群体特性与基因组学实验手段结合了起来,包括从环境样品中提取总DNA、再用可培养的宿主微生物建立文库及筛选目的克隆和基因。该法是研究不可培养微生物、寻找新的基因和开发新活性产物的重要新途径。它避开了微生物分离、纯化和培养的步骤,大大扩展了微生物资源的利用范围。本文旨在介绍宏基因组学的一般研究方法并结合我们的实验情况,对这一崭新领域中的最新研究策略进行了简要综述。 关键词: 宏基因组学, 不可培养微生物, 文库构建, 文库筛选,研究策略 Strategies for accessing metagenomics for desired applications Abstract: Metagenomics is a new field of microbial genetic engineering. It has the characteristics of microbial ecology and the methodology of genomics. Metagenomics includes genomic DNA isolation, library construction and screening strategies, and can be used in the discovery of new gene and biocatalysts and in the study of uncultured microorganism. Metagenomics can overcome the advantages of isolation and cultivation procedures in traditional microbial method, and thus greatly broaden the space of microbial resource utilization. In this paper, we mainly reviewed the metagenomic methodology, together with the latest advances and novel strategy in this research field. Keywords:Metagenomics; Uncultured microorganism;Library construction;Library screening Research strategies 大自然中蕴藏着无数具有重要价值的微生物及其活性产物,也是新基因及生物学资源的重要源泉,对其进行研究成为微生物学和分子生物学研究的一个重要方向。然而人们现在能够培养与利用的不到环境中总微生物的1%[1]。宏基因组学(metagenomics)是直接从环境样品中提取全部微生物的总DNA, 避开了分离、纯化和培养微生物的过程来构建宏基因组文库,用基因组学的研究策略来研究环境样品中的总微生物的组成及其在群落中的功能等。现在,宏基因组学技术方法已在微生物多样性,微生物细胞间的相互作用,新基因和新型生物催化剂的开发,新的抗生素的开发及环境生态等方面得到了广泛应用[2]。本文旨在介绍宏基因组学的一般实验方法并结合我们的研究情况,对这一崭新领域中的最新研究策略进行了简要综述。深化了我们对这一学科的认识,促进了该学科的进步。 1 宏基因组学研究策略 1.1宏基因组学概要 宏基因组学是Handelsman等于1998年提出的[3], 可见是一门很新的学科,其随着基因组实验手段,生物信息学和测序技术等的日新月异也迅猛发展了起来,这个新学科是以环境样品的总微生物基因组为实验对象,通过测序分析、文库评价、产活性物质及其基因的克隆的获取和基因功能的鉴别,对微生物种群组成与生物量、生态学关系、生物化学关系与环境关系以及功能活性进行研究[4]。其主要过程包括样品和基因的富集和提取; 宏基因组文库的构建; 目的基因的筛选; 目的基因活性产物的表达(图1)。 1.2 微生物及其基因的富集 在文库筛选过程中由于目的基因比例较小, 对环境中微生物的富集不但可提高基因总量,有利于基因的提取,还可增加目的基因的比例,如Kouker 等用橄榄油富集产脂肪酶的微生物收到了很好的效果[5 ],橄榄油不仅可作为底物,还可诱导脂肪酶的合成。目前富集技术主要分为细胞水平和基因水平。其中细胞水平主要是用选择培养基来富集某些微生物, 常

分子生物学技术原理

生物分子类实验室常用实验技术原理汇总 一、GST pull-down实验 基本原理:将靶蛋白-GST融合蛋白亲和固化在谷胱甘肽亲和树脂上,作为与目的蛋白亲和的支撑物,充当一种“诱饵蛋白”,目的蛋白溶液过柱,可从中捕获与之相互作用的“捕获蛋白”(目的蛋白),洗脱结合物后通过SDS-PAGE电泳分析,从而证实两种蛋白间的相互作用或筛选相应的目的蛋白,“诱饵蛋白”和“捕获蛋白”均可通过细胞裂解物、纯化的蛋白、表达系统以及体外转录翻译系统等方法获得。此方法简单易行,操作方便。注:GST即谷胱甘肽巯基转移酶(glutathione S-transferase) 二、足印法(Footprinting) 足印法(Footprinting)是一种用来测定DNA-蛋白质专一性结合的方法,用于检测目的DNA 序列与特定蛋白质的结合,也可展示蛋白质因子同特定DNA片段之间的结合。其原理为:DNA 和蛋白质结合后,DNA与蛋白的结合区域不能被DNase(脱氧核糖核酸酶)分解,在对目的DNA序列进行检测时便出现了一段无DNA序列的空白区(即蛋白质结合区),从而了解与蛋白质结合部位的核苷酸数目及其核苷酸序列。 三、染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP) 染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP)是研究体内蛋白质与DNA 相互作用的有力工具,利用该技术不仅可以检测体内反式因子与DNA的动态作用,还可以用来研究组蛋白的各种共价修饰以及转录因子与基因表达的关系。 染色质免疫沉淀技术的原理是:在生理状态下把细胞内的DNA与蛋白质交联在一起,通过超声或酶处理将染色质切为小片段后,利用抗原抗体的特异性识别 反应,将与目的蛋白相结合的DNA片段沉淀下来。染色质免疫沉淀技术一般包括细胞固定,染色质断裂,染色质免疫沉淀,交联反应的逆转,DNA的纯化及鉴定。 四、基因芯片(又称 DNA 芯片、生物芯片)技术 基因芯片指将大量探针分子固定于支持物上后与标记的样品分子进行杂交,通过检测每个探针分子的杂交信号强度进而获取样品分子的数量和序列信息。通俗地说,就是通过微加工技术 ,将数以万计、乃至百万计的特定序列的DNA片段(基因探针),有规律地排列固定于2cm2 的硅片、玻片等支持物上,构成的一个二维DNA探针阵列,被称为基因芯片。基因芯片主要用于基因检测工作 。 基因芯片的测序原理是杂交测序方法,即通过与一组已知序列的核酸探针杂交进行核酸序列测定的方法,在一块基片表面固定了序列已知的八核苷酸的探针。当溶液中带有荧光标记的核酸序列TATGCAATCTAG,与基因芯片上对应位置的核酸探针产生互补匹配时,通过确定荧光强度最强的探针位置,获得一组序列完全互补的探针序列。据此可重组出靶核酸的序列。

浅析功能基因组学和蛋白质组学的概念及应用

【摘要】基因组相对较稳定,而且各种细胞或生物体的基因组结构有许多基本相似的特征;蛋白质组是动态的,随内外界刺激而变化。对蛋白质组的研究可以使我们更容易接近对生命过程的认识。蛋白质组学是在细胞的整体蛋白质水平上进行研究、从蛋白质整体活动的角度来认识生命活动规律的一门新学科,简要介绍功能基因组学和蛋白质组学的科学背景、概念及其应用。 【关键词】基因组;功能基因组学;蛋白质组学; 一、基因组及基因组学的概念 基因组(genome)一词系由德国汉堡大学H.威克勒教授于1920年首创,用以表示真核生物从其亲代所继承的单套染色体,或称染色体组。更准确地说,基因组是指生物的整套染色体所含有的全部DNA序列。由于在真核细胞的线粒体和植物的叶绿体中也发现存在遗传物质,因此又将线粒体或叶绿体所携带的遗传物质称为线粒体基因组或叶绿体基因组。原核生物基因组则包括细胞内的染色体和质粒DNA。此外非独立生命形态的病毒颗粒也携带遗传物质,称为病毒基因组。所有生命都具有指令其生长与发育,维持其结构与功能所必需的遗传信息,本书中将生物所具有的携带遗传信息的遗传物质总和称为基因组。[1] 基因组学(genomic)一词系由T.罗德里克(T.Roderick)于1986年首创,用于概括涉及基因组作图、测序和整个基因组功能分析的遗传学学科分支,并已用来命名一个学术刊物Genomics。基因组学是伴随人类基因组计划的实施而形成的一个全新的生命科学领域。[1] 基因组学与传统遗传学其他学科的差别在于,基因组学是在全基因组范围研究基因的结构、组成、功能及其进化,因而涉及大范围高通量收集和分析有关基因组DNA的序列组成,染色体分子水平的结构特征,全基因组的基因数目、功能和分类,基因组水平的基因表达与调控以及不同物种之间基因组的进化关系。基因组学的研究方法、技术和路线有许多不同于传统遗传学的特点,各相关领域的研究仍处于迅速发展和不断完善的过程中。 基因组学的主要工具和方法包括:生物信息学,遗传分析,基因表达测量和基因功能鉴定。 二、功能基因组学的概念及应用

基因组学

课程名称基因组学 硕士课程论文 题目:基因枪技术在植物学研究中的应用 学科专业: 植物学 年级: 2012 学号: 2012210632 研究生:侯敏指导教师:查笑君 论文提交时间: 2012 年 12 月 11 日 基因枪技术在植物学研究中的应用

摘要基因枪是当今研究中一种重要的基因转移方法,在各个应用领域都显示出了其独特的优越性,因而广受重视;与此同时,基因枪技术本身也在实践中不断发展和完善。本文在回顾和总结基因枪技术使用原理的基础上,综述了基因枪在植物学研究中的应用。 关键词基因枪;植物学;基因转移;应用 Appl ication of Particle Bombardment in the Research of Botany Abstract As an important means of gene delivery , gene gun technology has showed its superiority in many application fields of gene engineering , and so has gained wide attention. At the same time , gene gun technology is also evolving in practice. Upon the retrospection and of the gene gun principles , the application of the gene gun in the Botanical Research was summaried. Key words Gene gun ; botany ; gene delivery ;application 1 基因枪技术的转化原理与发展 近年来转基因技术以前所未有的速度进步人们已经不再满足于单个基因成功插入原有生物的基因组中而是把目光放在插入基因的成功表达和产。然而自然界的生物体是十分复杂的有机整体许多的功能性状并不是单个基因可简单调控的即使像海藻一样简单的双糖在酵母中的代谢途径也需要个基因产物的直接参与。目前进行多基因转化研究的主要技术手段有两种一种是单质粒载体的转化即几个目的基因和标记基因在同一载体质粒上另一种是目的基因和标记基因位于不同的载体上的共转化研究后者的主要优点在于能在分离的世代中把在生产中没有意义的基因分离同时也可以转入更多的外源基因基因枪转化方法则是实现其转化的主要途径。 基因枪技术( Particle gun) ,又称生物弹或生物发射法(Biolistic process) 、粒子轰击技术( Particle bombardment) 和高速微粒子发射技术( High - velocity microprojectile) 。其原理是利用高速飞行的微米或亚微米级惰性粒子(钨或金粉) ,将包被其外的目的基因直接导入受体细胞,并释放出外源DNA ,使DNA 在受体细胞中整合表达,从而实现对受体细胞的转化。根据动力来源不同,基因枪可大体分为火药式( Gunpowder )、放电式( Elect ric discharge) 和气动式(Pneumatic) 3 种类型。1987 年美国康乃尔大学的J . C. Santord 等设计制造的火药式基因枪是最初的基因枪。到目前为止还有以化学推进剂为动力(弹药枪) 和以放电为动力(电子枪) 用于粒子轰击细胞的新工具,特点是能转化有细胞壁的植物细胞,并能直接向细胞器中输入DNA ,或用来转化花粉以避开组织培养的操作。在全面推广粒子枪之前还要进行开发和改良,更有效的电子枪会取代弹药枪。 2 基因枪法在禾谷类作物遗传转化中的应用 2.1 转化目的基因改良作物性状在用基因枪法转化禾谷类作物的研究中,转化的目的基因主要有抗除草剂基因、抗虫基因、抗病基因、雄性不育基因等。 2.1.1 转化抗除草剂基因 抗除草剂基因既可用作选择标记基因建立遗传转化系统,又能作为目的基因,使转基因作物在生长期间可使用除草剂除草,从而免去人工除草工作,节省了大量劳力。常用的抗除草剂基因是PPT 乙酰转移酶基因(又称bar 基因) ,抗除草剂bialaphos。用基因枪法将bar 基因转化小麦[、水稻、玉米、高粱,均获得了抗除草剂植株。 2.1.2 转化抗虫基因 在禾谷类作物中,用基因枪法转化的抗虫基因主要是苏云金芽孢杆菌的晶体蛋白基因(Bt 基因) ,而且在玉米中报道得较多,王国英等用基因枪法将Bt 基因转化玉米胚性愈伤组织,获得了转Bt 基因的植株,对一个转Bt 基因植株的杂交后代进行了玉米螟抗性的田间鉴定,抗虫和感虫植株的比例接近1∶1 ,符合孟德尔单显性基因的遗传规律。在水稻中,用改良的苏云金杆菌δ—内毒素[cryIA(b) ]基因经基因枪法转化,获得了能育的抗黄茎钻蛀虫转基因粳稻植株。 2.1.3 转化抗病基因 简玉瑜等用基因枪法将抗菌肽B(cecropin B) 基因导入水稻得到了转基因植株,对T3 代抗白叶枯

相关文档
最新文档