引物设计原则

引物设计原则
引物设计原则

引物设计

一、软件使用:

●推荐软件:Primer Premier 5.0

●优点:操作简单、显示各种参数改变和可能的二聚体、异二聚体、发夹结构等

●缺点:没有明显缺点

●本地同类软件:DNAClub;Oligo 6.22;Vector NTI Suit;Dnasis;Omiga;Dnastar;

DNAMAN (Lynnon Biosoft, Quebec, Canada).

●网上同类软件:Primer3(Whitehead Institute 开发);JaMBW(European Molecular

Biology Laboratory of Heidelberg 开发)。http://210.72.11.60网站已引进并调试好

这两种软件。独特之处在于:对全基因组PCR的引物设计,可以将设计好的引物

对后台核酸数据库进行比对,发现并排除引发错配的引物。因此建议经常做全基

因组PCR的用户试用。

二、推荐操作:

●引物搜索:Primer Premier 5.0

●引物评价:Oligo 6.22

三、引物设计的原则:

首先引物要跟模板紧密结合,其次引物与引物之间不能有稳定的二聚体或发夹结构存在,再次引物不能在别的非目的位点引起DNA聚合反应(即错配)。围绕这几条基本原则,设计引物需要考虑诸多因素,如引物长度(primer length)、产物长度(product length)、序列Tm值(melting temperature)、ΔG值(internal stability)、引物二聚体及发夹结构(duplex formation and hairpin)、错误引发位点(false priming site)、引物及产物GC 含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。以使用Oligo 软件分析设计引物为例,笔者总结出以下的要点:

1.引物的长度一般为15-30bp,常用的是18-27bp,但不能大于38,因为过长会导致其

延伸温度大于74℃,即Taq 酶的最适温度。

2.引物3’端的序列要比5’端重要。引物3’端的碱基一般不用A(3’端碱基序列最好是G、

C、CG、GC),因为A在错误引发位点的引发效率相对比较高。另外引物间3’端的

互补、二聚体或发夹结构也可能导致PCR反应失败。5’端序列对PCR 影响不大,因此常用来引进修饰位点或标记物。

3.引物的GC含量一般为40-60%,以45-55%为宜,过高或过低都不利于引发反应。有

一些模板本身的GC 含量偏低或偏高,导致引物的GC含量不能在上述范围内,这时应尽量使上下游引物的GC 含量以及Tm 值保持接近(上下游引物的GC含量不能相差太大),以有利于退火温度的选择。如果G-C比例超出,则在引物的5’端增加As 或Ts;而如果A-T比例过高,则同样在5’端增加Gs或Cs。但也有认为:原来普遍认为PCR引物应当有50%的GC/AT比率的观点其实是不对的,以人基因组DNA为模板,用81%AT的引物可以产生单一的、专一的、长250 bp,含有70% AT的产物。完全没有必要复杂地去计算产物和引物的解链温度,PCR引物的GC/A T比率应当等于或高于所要放大的模板的GC/A T比。

4.引物所对应模板序列的Tm 值最好在72℃左右。(Tm 值曲线以选取72 度附近为佳,

5’到3’的下降形状也有利于引物引发聚合反应),至少要在55-80℃之间

5.ΔG值(自由能)反映了引物与模板结合的强弱程度。一般情况下,引物的ΔG值最好

呈正弦曲线形状,即5’端和中间ΔG值较高,而3’端ΔG值相对较低,且不要超过9(ΔG值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。

3′末端双链的ΔG是0~-2 kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%、到-8时少于20%、而-10时接近于0。6.可能的错误引发位点决定于引物序列组成与模板序列组成的相似性,相似性高则错

误引发率高,错误引发的引发率一般不要高过100,如此可保证不出非目的产物的假带。但对于特定的模板序列,还应结合比较其在正确位点的引发效率。如果两者相差很大,比如在正确位点的引发效率为450 以上,而在错误位点的引发效率为130,并且不好找其他更合适的引物,那么这对引物也是可以接受的。

7.Frq 曲线为Oligo6新引进的一个指标,揭示了序列片断存在的重复机率大小。选取

引物时,宜选用Frq 值相对较低的片断。

8.引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带而且会

降低引物浓度从而导致PCR 正常反应不能进行,与二聚体相关的一个参数是碱基的

分布,3’端的连续GGG 或CCC 会导致错误引发。二聚体形成的能值越高越稳定,越不符合要求。与二聚体相同,发夹结构的能值越低越好。虽然有些带有发夹环,其ΔG为-3 kcal/mol的自身互补引物也可以得到不错的结果,但是如果它的3′末端被发夹环占据时就很麻烦,即会引发引物内部的延伸反应,减少了参与正式反应引物的数量。当然,如果发夹环在5′末端对反应就没有多大的影响了。

9.以公式(4×G/C + 2×A/T–5)计算Tm值,即退火温度。选择较低Tm值的引物的退火

温度为反应的退火温度。4-6℃的差别似乎对PCR产量影响不大。最好,保证每个引物的Tm值相匹配,且在70-75℃范围内

10.要知道,更重要的因素是模板与稳定性较小的引物之间解链温度的差异。差异越小,

PCR的效率越高。因为DNA的解链温度也取决于它的长度,所以有的研究者喜欢设计很长,而不求它很稳定的引物。可是,引物太长就难以避免形成二聚体和自身互补,因此,一般还是不用为好。如果期待的产物长度等于或小于500 bp,选用短的(16~18 mer)的引物:若产物长5 kb,则用24 mer的引物。有人用20~23 mer引物得到40 kb的产物。

11.在DNA测序和PCR中最好用5′末端稳定(如GC含量较多),而3′末端不太稳定(如AT含

量较多)的引物,这种引物的结构可以有效地消除假引发反应。这就是基于引物内部稳定性的经验之谈。其3′末端稳定性低的引物在这些反应中能起好作用的原因在于,接近或在3′末端上的碱基与非靶位点碱基所形成的配对的稳定程度还不足以引发DNA合成,所以不会产生假产物。因此,为了有效地引发反应,引物的5′末端和中央部分必须与靶DNA也形成双链。与此相反,带有稳定的、GC丰富的3′末端的寡核苷酸不需要其所有的核苷酸序列都与靶序列配对,只凭借其3′末端与靶序列任何位点的牢固配合就可以引发反应,产生非专一产物。无论如何,寡核苷酸3′末端最后5个核苷酸的稳定性小于-9 kcal/mol的,通常就是专一性的探针或引物。寡核苷酸3′末端越不稳定,假引发的可能性越低。

12.如果用3′末端低稳定性的引物,反应的最适退火温度范围会不寻常的宽。这就可以

不经过事先的最佳化实验就能在最佳条件下进行反应。

13.引物的唯一性:为了放大单个的、专一性DNA片段,选用的引物序列就应当是唯一

的,即在模板中没有重复序列。如果用哺乳动物基因组序列作为模板,可以用Alu 序列或其他短重复元件来核对想用的引物的互补性。由此也可知,应当避免使用同寡聚物(如—AAAAAA—)和二核苷酸重复(如—ATATAT—)。

14.引物和产物的Tm值不要相差太大,20摄氏度范围内较好。定下引物的Tm值范围之

后即可定下引物的长度范围。

15.对引物的修饰一般是增加酶切位点,应参考载体的限制酶识别序列确定,常常对上

下游引物修饰的序列选用不同限制酶的识别序列,以有利于以后的工作。

16.值得一提的是,各种模板的引物设计难度不一。有的模板本身条件较差,比如GC

含量偏高或偏低,导致找不到各种指标都十分合适的引物;有时PCR产物要作为克

隆对象插入到载体中表达,因此PCR引物设计的可选择度很低。遇到这种情况只能

退而求其次,尽量去满足条件,这时,使用自动搜索引物及正确地评价引物可使研

究人员对实验心中有数。

17.在设计克隆PCR引物时,引物两端一般都添加酶切点,必然存在发夹结构,而且能

值不会太低,这种PCR需要灵活调控退火温度以达到最好效果,对引物的发夹结构

的检测就不应要求太高。

18.如扩增出多条带(引发错配所致),不出目的带或出目的带很弱(引物引发效率低

下)

四、Oligo 6.22使用技巧

1.Oligo的主要功能集中在Analyze 菜单里,只要把它弄懂了,其他的就很简单了

2.Frq为6.22的新功能,为邻近6-7个碱基组成的亚单位在一个指定数据库文件中的出

现频率。该频率高则可增加错误引发的可能性

3.因为分析要涉及多个指标,起动窗口的cascade 排列方式不太方便,可从windows 菜

单改为tili 方式

4.当结束检测,按Alt+P键就出来PCR窗口,其中总结性地给出该引物的位置、产物大

小、Tm值等参数,最有用的是还给出了推荐的最佳退火温度和简单的评价。

五、ΔG概念:

用于估测可能形成DNA或RNA双链的稳定性:在一个双链结构中,碱基对的相对稳定性是由其邻近碱基决定的。在热动力学中,这样的性质以双链形成时的自由能(ΔG)来表示。现在大多采用Breslauer等人提出的以最接近的相邻核苷酸的动力学数值(自由能)来预测双链稳定性的方法。为简化起见,所有的计算都在25 ℃条件下进行。此时,最接近的相邻核苷酸的自由能是:

第一个(5′)核苷酸第二个核苷酸

dA dC dG dT

dA -1.9 -1.3 -1.6 -1.5

dC -1.9 -3.1 -3.6 -1.6

dG -1.6 -3.1 -3.1 -1.3

dT -1.0 -1.6 -1.9 -1.9

ΔG(kcal/mol)

如:双链d(ACGG/CCGT)的ΔG是:

ΔG(ACGG)=ΔG(AC)+ΔG(CG)+ΔG(GG)=-(1.3+3.6+3.1)=-8.0 kcal/mol

此计算方法特别适用于测定其3′末端会形成双链的引物的相容性。也可以用来计算发夹环结构的ΔG。不过,这时需要根据环区内核苷酸的数量添加一定的数值。如3个核苷酸时为5.2 kcal/mol;4个时为4.5;5个为4.4;6个是4.3;7和8个为4.1 kcal/mo1。

六、按照氨基酸序列设计寡核苷酸:

按照多肽的氨基酸序列来设计PCR引物或杂交探针是最常用的实验手段,尤其是在试图“钓取”一个蛋白质的基因时。此时要注意的问题有:

(1) 宁可用简并引物,也不用猜测的引物。氨基酸密码子的简并性给予引物设计以可塑性,这比用猜测的密码子要好得多。有人用1 024个简并引物得到很好的结果。但是,应当避免在一个区域内有很高的简并性。但也有简并性低使引物不工作的报道。

(2) 引物与模板的错配。一般认为,所用引物与模板有15%~20%的错配,PCR的效果还能接受。但是,引物3′末端的错配比同样错配率的5′末端错配会引起更严重的问题。在最后4个碱基中有2个错配的引物,其PCR产量急剧下降。但是,当核苷酸浓度高时,3′末端有错配的引物还能被Tag聚合酶很好地利用。在0.8mmol/L时,大多数3′末端错配引物可以接受,虽然非专一产物比较多,DNA合成的忠实性也下降。即使在低核苷浓度下,还会有少量从错配碱基出发的合成,因此,在开始的PCR循环中把退火时间增加到3~5分钟,比之于用标准退火时间和高浓度核苷酸能够产生质量更好的所求产物。

(3) 在用唯一性引物时,建议用0.2 mmol/L或更低的总核苷酸浓度,因为高浓度会增加错误参入的比率。

(4) 简并寡核苷酸时,PCR应当在比较高的引物浓度下进行,即1~3 μmol/L而不是0.2 μmol/L,因为在反应混合物中的大多数寡聚物并不是被用来引发专一的反应,而只是产生高的背景而已。

七、复杂模板的扩增体系:

所谓复杂模板,是指体系中的DNA种类和数量较多,不能以此引物对所有的模板一一比较来计算其异位引发的可能性的情形。此情形下与简单模板扩增相比较,还需要遵循下面一些原则以尽可能的避免异位扩增。

1.引物3’末端的稳定性。引物3’末端的稳定性由引物3’末端的碱基组成决定,一般考虑末

端5个碱基的ΔG。此值的大小对扩增有较大的影响,负值大,则3’末端稳定性高,扩增效率更高,同时也更易于异位引发。因此在复杂模板的扩增体系中,3’末端5聚体的ΔG应大于-9.0kcal/mol。

2.碱基组成应尽量随机分布,避免单一碱基的聚集。这样可避免引物在模板的单一碱基

富集区引发扩增反应。

3.引物3’末端应尽量避免T,相较而言,3’末端的T对于此处的错配更为宽容。

八、测序引物设计时的注意点:

1.对特异性的标准掌握更严格一些,也比普通PCR引物设计时更优先考虑特异性。因为

如果在测序反应中,如果引物与模板在非预期位置退火并引发链延伸,会对结果对来很大的干扰甚至造成结果无法识读。

2.Tm值适当高一些。现在大部分测序反应均选用耐热的测序级DNA聚合酶来催化,并采

用PCR的热循环程序。选用Tm值稍高一些,甚至退火温度接近酶的最佳延伸温度的引物,有助于使反应顺利跨过待测模板的二级结构区,也有助于降低非特异反应。

九、关于引物5’端引入限制性内切酶位点:

自从发现Taq 酶具有非模板依赖的在新生成DNA链的3’末端加上一个A的特性以来,在引物5’端引入酶切位点从而方便后续克隆步骤的方法的应用大大减少,取而代之的是利用带T载体的粘端连接来包装PCR产物。若实验需要在引物5’端引入相关酶切位点时,除了需要清楚所选用的酶的识别序列之外,还需要了解此酶是否有位点优势效应,即酶的活性是否因为识别位点在序列的不同位置而不同,并根据此点来选择5’末端的保护碱基。此外保护碱基的另外一个作用就是保护酶切位点不被Taq 酶具有的微弱的5’→3’外切酶活性破坏。

十、简并引物的设计:

●概念:简并引物的出现是出于遗传密码的简并性。有时需要根据一段氨基酸的保守序列反

推到DNA 水平设计引物。众所周知,大多数氨基酸(二十种常见结构氨基酸中的十八种)的遗传密码不只一种,因此,由氨基酸序列反推DNA 序列时,就遇到部分碱基的不确定性。这种不确定性因物种或细胞亚结构的不同而异,比如在线粒体内的遗传密码与细胞核是不一样的,甚至植物线粒体与无脊椎动物线粒体以及无脊椎动物线粒体的遗传密码都不尽相同。Premier 可以针对各种不同的遗传密码规律设定不同的DNA 和氨基酸的相互转换,这取决于被分析序列的出处。这样设计出来的引物实际上是多种序列的混和物,在某些位点有所变化,但大部分还是相同的,称之为简并引物。Primier 软件给出八种生物亚结构的不同遗传密码规则供用户选择,有纤毛虫大核(Ciliate Macronuclear),无脊椎动物线粒体(Invertebrate Mitochondrion),支原体(Mycoplasma),植物线粒体(Plant Mitochondrion),原生动物线粒体(Protozoan Mitochondrion),一般标准(Standard),脊椎动物线粒体(Vertebrate Mitochondrion),和酵母线粒体(Yeast Mitochondrion)。●概念:简并引物是根据某些特定的目的而选用的一组混合物,指在寡核甘酸的某一位置(一

个简并位)上有多个碱基存在于不同的寡核甘酸分子中,如一组简并引物中有N1,N2,N3三个简并位,在N1上有三个碱基简并,N2二个,N3 四个,则此简并引物中共有3*2*4=24种寡核甘酸分子。

●简并引物常用的几个方面:

(1)从已知蛋白到相关核酸分子的研究;(2)用一组引物扩增一类分子。

●在上述两个主要应用中,需要注意的几个主要问题:

◆从蛋白到核酸,应注意:

1)尽量选择简并度低的氨基酸区域为引物设计区。如蛋氨酸和色氨酸均只有一

个密码子。

2)充分注意物种对于密码子的偏好性,选择该物种使用频率高的密码子,以降

低引物的简并性。

3)引物不要终止于简并碱基,对于大多数氨基酸残基来说,意味着引物3’末端

不要位于密码子的第三位。

4)在简并度高的位置,可用次黄嘌呤(dI)代替简并碱基。

5)以上几点,遵循的总的原则为:尽量降低引物的简并度,尤其在3’末端或近

3’末端。

◆用一对简并引物扩增一类DNA分子时,同样遵循上述总的原则,即尽量降低引

物的简并度,尤其在3’末端或近3’末端。在此种应用中,应先利用工具软件(多

序列对准比较软件)或其它工具找到这些分子的保守区,然后根据共有序列,应

用上面所述的一些原则来设计所需要的引物。

Degenerate Primers

For amplification of cognate sequences from different organisms, or for "evolutionary PCR", one may increase the chances of getting product by designing "degenerate" primers:these would in fact be a set of primers which have a number of options at several positions in the sequence so as to allow annealing to and amplification of a variety of related sequences. For example, Compton (1990) describes using 14-mer primer sets with 4 and 5 degeneracies as forward and reverse primers, respectively, for the amplification of glycoprotein B (gB) from related herpesviruses. The reverse primer sequence was as follows:

TCGAATTCNCCYAAYTGNCCNT

where Y = T + C, and N = A + G + C + T, and the 8-base 5'-terminal extension comprises a Eco RI site(underlined) and flanking spacer to ensure the restriction enzyme can cut the product (the New England Biolabs catalogue gives a good list of which enzymes require how long a flanking sequence in order to cut stub ends). Degeneracies obviously reduce the specificity of the primer(s), meaning mismatch opportunities are greater, and background noise increases; also, increased degeneracy means concentration of the individual primers decreases; thus, greater than 512-fold degeneracy should be avoided. However, I have used

primers with as high as 256- and 1024-fold degeneracy for the successful amplification and subsequent direct sequencing of a wide range of Mastreviruses against a background of maize genomic DNA (Rybicki and Hughes, 1990).

Primer sequences were derived from multiple sequence alignments; the mismatch positions were used as 4-base degeneracies for the primers (shown as stars; 5 in F and 4 in R), as shown above. Despite their degeneracy, the primers could be used to amplify a 250 bp sequence from viruses differing in sequence by as much as 50% over the target sequence, and 60% overall. They could also be used to very sensitively detect the presence of Maize streak virus DNA against a background of maize genomic DNA, at dilutions as low as 1/109 infected sap / healthy sap (see below).

Some groups use deoxyinosine (dI) at degenerate positions rather than use mixed oligos: this base-pairs with any other base, effectively giving a four-fold degeneracy at any postion in the oligo where it is present. This lessens problems to do with depletion of specific single oligos in a highly degenerate mixture, but may result in too high a degeneracy where there are 4 or more dIs in an oligo.

十一、克隆PCR引物的设计

General guidelines on the primer design for PCR cloning

https://www.360docs.net/doc/5618086151.html,plementary sequence of 18-20 bases is sufficient in most cases if you don't bother to

calculate Tm (see links below if you want to calculate Tm).

2.If your protein is not fused to anything, you should add a start codon (A TG) immediately

in front of your gene in the forward primer, and the complement of a stop codon (TAA/TGA/TAG - TAA is preferred) immediately after in your reverse primer.

3.Introduce one or more restriction sites depending on how you wish to ligate the gene into

the expression vector - e.g. if you use pET 21b, use Nde I (conveniently containing the start codon) for the forward primer, and Xho I for the reverse primer if you wish to fuse the protein to a C-terminal His-tag. Make sure that the restriction sites chosen are absent in the gene.

4.Put in extra bases at the 5'end to allow for efficient digest by restriction enzymes -

consult NEB catalog . 8-10 are more than sufficient in most if not all cases (it's actually a bit of overkill as 3-4 are suitable for most). These extra bases are unnecessary if you are

doing TA cloning.

5.Two or more of these extra bases can form a GC clamp at the 5'end.

6.Avoid too many G or C at the 3'end.

7.Avoid long runs of single nucleotide.

8.Make sure the forward and reverse primer don't form primer dimer (esp. no

complementary sequences at the 3' end) or form significant secondary structure. See Alkami Biosystem Primer Design online for primer design sites.

9.It may be useful (though normally unnecessary) to check sequences of gene or vector for

homology of 70% or more with the primer to avoid multiple PCR products.

The above guidelines should be sufficient in most cases, but if you'd like more details, see tips on primer design , notes on primer design, Tavi's PCR guide, and Primer design workshop. There are also a number of web-sites for primer design at Alkami Biosystems and at BioGuide.

Example

N can be any of the 4 nucleotides, therefore

Forward oligo

5' GGCGCAATACATATGAGAGACAGTGGGACCGTCTG 3'

Reverse oligo

5' GGCCGAACTCGAGTTACTCTAGAATCCTCAAGTCCA 3'

(sequence complement to the sense strand)

Note:

1) If the N-terminus of your protein is not fused to any fusion partner or peptide, it is often useful to change wherever possible G or C to A or T for the first few codon. This will help reduce secondary structure on the translation initiation site and therefore improve expression.

2) Although we need not consider designing degenerate primer, but should the need arise, see degenerate PCR for guidance.

十二、巢式PCR引物

This gel photo shows the effect of nested PCR amplification on the detectability of Chicken anaemia virus (CAV) DNA in a dilution series: the PCR1 just detects 1000 template molecules; PCR2 amplifies 1 template molecule (Soin?C, Watson SK, Rybicki EP, Lucio B, Nordgren RM, Parrish CR, Schat KA (1993) Avian Dis 37: 467-476).

十三、cDNA PCR

A very useful primer for cDNA synthesis and cDNA PCR comes from a sequencing strategy described by Thweatt et al. (1990): this utilised a mixture of three 21-mer primers consisting of 20 T residues with 3'-terminal A, G or C, respectively, to sequence inside the poly(A) region of cDNA clones of mRNA from eukaryotic origin. I have used it to amplify discrete bands from a variety of poly(A)+ virus RNAs, with only a single specific degenerate primer upstream: the T-primer may anneal anywhere in the poly(A) region, but only molecules which anneal at the beginning of the poly(A) tail, and whose 3'-most base is complementary to the base next to the beginning of the tail, will be extended.

eg: 5'-TTTTTTTTTTTTTTTTTTTTTTTTT(A,G,C)-3' works for amplification of Potyvirus RNA, and eukaryotic mRNA

十四、PCR部分注意事项

A more rigorous treatment of Ta is given by Rychlik et al. (1990): they maintain that if the

Ta is increased by 1o C every other cycle, specificity of amplification and yield of products <1kb in length are both increased.

Plasmid and biopsy sample DNA templates were amplified at

different annealing temperatures as shown: note that while plasmid

is amplified from 37 to 55o C, HPV DNA is only specifically

amplified at 50o C.

●Primer concentrations should not go above 1uM unless there is a high degree of

degeneracy; 0.2uM is sufficient for homologous primers.

●Nucleotide concentration need not be above 50uM each: long products may require more,

however.

十五、Helix Destabilisers / Additives

With NAs of high (G+C) content, it may be necessary to use harsher denaturation conditions. For example, one may incorporate up to 10% (w or v/v) :

?dimethyl sulphoxide (DMSO),

?dimethyl formamide (DMF),

?urea

?or formamide

in the reaction mix: these additives are presumed to lower the Tm of the target NA, although DMSO at 10% and higher is known to decrease the activity of Taq by up to 50% (Innis and Gelfand, 1990; Gelfand and White, 1990).

Additives may also be necessary in the amplification of long target sequences:DMSO often helps in amplifying products of >1kb. Formamide can apparently dramatically improve the specificity of PCR (Sarkar et al., 1990), while glycerol improves the amplification of high (G+C) templates (Smith et al., 1990).

Polyethylene glycol (PEG) may be a useful additive when DNA template concentration is very low: it promotes macromolecular association by solvent exclusion, meaning the pol can find the DNA

十六、链接

Return to PCR Contents Page

Return to Molecular Biology Methods Manual

引物设计原则(必看)

mi引物设计原则 1. 引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于Taq DNA聚合酶进行反应。 2. 引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错配。引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增加。 3. 引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应当避免在引物的3’端使用碱基A。另外,引物二聚体或发夹结构也可能导致PCR反应失败。5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物。 4. 引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。 5. 引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。Tm值的计算有多种方法,如按公式Tm=4(G+C)+2(A+T),在Oligo软件中使用的是最邻近法(the nearest neighbor method)。 6. ΔG值是指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。应当选用3’端ΔG值较低(绝对值不超过9),而5’端和中间ΔG 值相对较高的引物。引物的3’端的ΔG值过高,容易在错配位点形成双链结构并引发DNA聚合反应。 7. 引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行。 8. 对引物的修饰一般是在5’端增加酶切位点,应根据下一步实验中要插入PCR 产物的载体的相应序列而确定。 引物序列应该都是写成5-3方向的, Tm之间的差异最好控制在1度之内, 另外我觉得扩增长度大一些比较好,500bp左右。 要设计引物首先要找到DNA序列的保守区。同时应预测将要扩增的片段单链是否形成二级结构。如这个区域单链能形成二级结构,就要避开它。如这一段不能

引物设计原则(含Realtime引物)

1.引物最好在模板cDNA的保守区内设计。 DNA序列的保守区是通过物种间相似序列的比较确定的。在NCBI上搜索不同物种的同一基因,通过序列分析软件(比如DNAman)比对(Alignment),各基因相同的序列就是该基因的保守区。 2.引物长度一般在15~30碱基之间。 引物长度(primer length)常用的是18-27 bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于Taq DNA 聚合酶进行反应。 3.引物GC含量在40%~60%之间,Tm值最好接近72℃。 GC含量(composition)过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。另外,上下游引物的Tm值(melting temperature)是寡核苷酸的解链温度,即在一定盐浓度条件下,50%寡核苷酸双链解链的温度。有效启动温度,一般高于Tm值5~10℃。若按公式Tm= 4(G+C)+2(A+T)估计引物的Tm值,则有效引物的Tm为55~80℃,其Tm 值最好接近72℃以使复性条件最佳。 4.引物3′端要避开密码子的第3位。 如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增的特异性与效率。 5.引物3′端不能选择A,最好选择T。 引物3′端错配时,不同碱基引发效率存在着很大的差异,当末位的碱基为A时,即使在错配的情况下,也能有引发链的合成,而当末位链为T时,错配的引发效率大大降低,G、C 错配的引发效率介于A、T之间,所以3′端最好选择T。 6. 碱基要随机分布。 引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错误引发(False priming)。降低引物与模板相似性的一种方法是,引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3′端不应超过3个连续的G或C,因这样会使引物在GC富集序列区错误引发。 7. 引物自身及引物之间不应存在互补序列。 引物自身不应存在互补序列,否则引物自身会折叠成发夹结构(Hairpin)使引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。引物自身不能有连续4个碱基的互补。 两引物之间也不应具有互补性,尤其应避免3′ 端的互补重叠以防止引物二聚体(Dimer与Cross dimer)的形成。引物之间不能有连续4个碱基的互补。 引物二聚体及发夹结构如果不可避免的话,应尽量使其△G值不要过高(应小于4.5kcal/mol)。否则易导致产生引物二聚体带,并且降低引物有效浓度而使PCR 反应不能正常进行。 8. 引物5′ 端和中间△G值应该相对较高,而3′ 端△G值较低。 △G值是指DNA 双链形成所需的自由能,它反映了双链结构内部碱基对的相对稳定性,△G 值越大,则双链越稳定。应当选用5′ 端和中间△G值相对较高,而3′ 端△G值较低(绝对值不超过9)的引物。引物3′ 端的△G 值过高,容易在错配位点形成双链结构并引发DNA 聚合反应。(不同位置的△G值可以用Oligo 6软件进行分析) 9.引物的5′端可以修饰,而3′端不可修饰。 引物的5′ 端决定着PCR产物的长度,它对扩增特异性影响不大。因此,可以被修饰而不影响扩增的特异性。引物5′ 端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合DNA序列;引入点突变、插入突变、缺失突变序列;引入启动子序列等。引物的延伸是从3′ 端开始的,不能进行任何修饰。3′ 端也不能有形成任何二级结构可能。 10. 扩增产物的单链不能形成二级结构。

荧光定量PCR引物设计原则.

1.引物应用核酸系列保守区内设计并具有特异性。最好位于编码区5’端的300-400bp区域 内,可以用DNAman,Alignment 软件看看结果。 2. 产物不能形成二级结构(自由能小于58.61KJ/mol)。 3.引物长度一般在17-25碱基之间,上下游引物不能相差太大。 4.G+C含量在40%~60%之间,45-55%最佳。 5.碱基要随机分布,尽量均匀。 6.引物自身不能有连续4个碱基的互补。 7.引物之间不能有连续4个碱基的互补。 8.引物5′端可以修饰。 9.3′端不可修饰,而且要避开AT,GC rich的区域,避开T/C,A/G连续结构(2-3个)。 10. 引物3′端要避开密码子的第3位。 11.引物整体设计自由能分布5‘端大于3’端,且3‘端自由能最好小于9KJ/mol。 可用oligo 6 软件进行比对看结果的情况。 12.做荧光定量产物长度80-150bp最好,最长是300bp. 13.引物设计避免DNA污染,最好跨外显子接头区。 14.引物与非特异性扩增序列的同源性最好小于70%或者有8个互补碱基同源。 15.查看有无假基因的存在。假基因就是无功能的DNA序列,与需要扩增的目的片段长 度相似。 16.TM值在58-62度之间。 17.引物设计的软件Primer 5.0 有专门针对荧光的。 设计的目的是在两个目标间取得平衡:扩增特异性和扩增效率。引物分析软件将试图通过使用每一引物设计变化的预定值在这两个目标间取得平衡。设计引用有一些需要注意的基本原理: ①引物长度 一般引物长度为18~30碱基。总的说来,决定引物退火温度(Tm值)最重要的因素就是引物的长度。有以下公式可以用于粗略计算引物的退火温度。 在引物长度小于20bp时:[4(G+C)+2(A+T)]-5℃ 在引物长度大于20bp时:62.3℃+0.41℃(%G-C)-500/length-5℃ 另外有许多软件也可以对退火温度进行计算,其计算原理会各有不同,因此有时计算出的数值可能会有少量差距。为了优化PCR反应,使用确保退火温度不低于54℃的最短的引物可获得最好的效率和特异性。

简并引物设计原则

The central role of UDPGDH played in capsule and other polysaccharides synthesis. KPS, capsule polysaccharide; LPS,lipopolysaccharide 简并引物设计方法 (1)利用NCBI搜索不同物种中同一目的基因的蛋白质或cDNA编码的氨基酸序列因为密码子的关系,不同的核苷酸序列可能表达的氨基酸序列是相同的,所以氨基酸序列才是真正保守的。首先利用NCBI的Entrez检索系统,查找到一条相关序列即可。随后利用这一序列使用BLASTP(通过蛋白查蛋白),在整个NR数据库中查找与之相似的氨基酸序列。 (2)对所有的序列进行多序列比对将搜索到的同一基因的不同氨基酸序列进行多序列比对,可选工具有Clustal W/X,也可在线分析。所有序列的共有部分将会显示出来。“*”表示保守,“:”表示次保守。 (3)确定合适的保守区域设计简并引物至少需要上下游各有一个保守区域,且两个保守区域相距50~400个氨基酸残基为宜,使得PCR产物在150~1200bp 之间,最重要的是每一个保守区域至少有6个氨基酸的保守区,因为每条引物至少18bp左右。 若比对结果保守性不是很强很可能找不到6个氨基酸序列的保守区,这时可以根据物种的亲缘关系,选择亲缘关系近的物种进行二次比对,若保守性仍达不到要求,则需进行三次比对,总之,究竟要选多少序列来比对,要根据前一次的结果反复调整。最终目的就是有两个6个氨基酸且两者间距离合适的保守区域。 (4)利用软件设计引物当得到保守区域后,就可以利用专业的软件来设计引物了,其中Primer 5.0 支持简并引物的设计,将参与多序列比对的序列中的任一条导入Primer 5.0 中,将其翻译成核苷酸序列,该序列群可用一条有简并性的核苷酸链来表示(其中R=A/G,Y=C/T,M=A/C,K=G/T,S=C/G,W=A/C/T,B=C/G/T,V=A/C/G,D=A/G/T,N=A/C/G/T,该具有简并性的核苷酸链必然包含上一步中找到的氨基酸保守区域的对应部分,在Primer 5.0 中修改参数,令其在两个距离合适的保守的nt区域内寻找引物对,总之要保证上下游引物都落在该简并链的保守区域内,结果会有数对,分数越高越好。 (5)对引物的修饰若得到的引物为: 5-NAGSGNGCDTTANCABK-3 则简并度=4×2×4×3×4×3×2=2304,很明显该条引物的简并度很高不利于PCR,可以通过次黄嘌呤代替N(因为次黄嘌呤可以很好的和4种碱基配对)和根据物种密码子偏好这两种方法来降低简并度。 这样设计出来的简并引物对,适用于比对的氨基酸序列所属物种及与这些物种分类地位相同的其他物种。 简并引物设计原则

PCR引物设计原则

PCR引物设计原则 引物(Primer)是人工合成的两段寡核苷酸序列。 1、引物的长度一般为15-30bp,常用的是18-27bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于Taq DNA聚合酶进行反应。 2、G十C含量:应在40%-60%之间,PCR扩增中的复性温度一般是较低Tm 值引物的Tm值减去5-10度。引物长度小于20时,其Tm恒等于4(G十C)十2(A十T)。 3、碱基分布的随机性:应避免连续出现4个以上的单一碱基。尤其是不应在其3’端出现超过3个的连续G或C,否则会使引物在G十C富集序列区错误引发. 4、引物自身:不能含有自身互补序列,否则会形成发夹样二级结构. 5、引物之间:两个引物之间不应有多于4个的互补或同源碱基,不然会形成引物二聚体,尤应避免3’端的互补重叠。引物3’端最好选T,错配的几率与A 相比大大的降低了。G、C之间错配的概率小于A、T. 6、引物的5’端可以修饰,而3’端不能进行修饰。5’端的修饰包括:加酶切位点,标记生物素,荧光,地高辛、Eu3+等,引入蛋白质结合的DNA序列,引入点突变,插入突变、缺失突变序列、引入启动子序列。因为引物的延伸是从3’端开始的,因而3’端不能进行任何修饰,另外3’端也不能有形成任何二

级结构的可能。 如何设计引物 不同的核苷酸序列表达的氨基酸氨基酸序列是相同的,所以氨基酸序列才是真正保守的。 引物最好在模板cDNA的保守区域内设计(DNA的保守区是通过物种间相似序列的比较确定的,在NCBI上搜索不同物种的同一基因,通过序列分析软件比对(Alignment),各基因相同的序列就是该基因的保守区)。 PCR引物设计 PCR反应中有两条引物,即5′端引物和3′引物。设计引物时以一条DNA单链为基准(常以信息链为基准),5′端引物与位于待扩增片段5′端上的一小段DNA序列相同;3′端引物与位于待扩增片段3′端的一小段DNA序列互补。 引物设计软件 Primer Premier5.0 (自动搜索)* vOligo6 (引物评价) vVector NTI Suit vDNAsis vOmiga vDNAstar vPrimer3 (在线服务)

引物设计原则必看

mi引物设计原则 1、引物的长度一般为15-30 bp,常用的就是18-27 bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于Taq DNA聚合酶进行反应。 2、引物序列在模板内应当没有相似性较高,尤其就是3’端相似性较高的序列,否则容易导致错配。引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增加。 3、引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其她3个碱基,因此应当避免在引物的3’端使用碱基A。另外,引物二聚体或发夹结构也可能导致PCR反应失败。5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物。 4、引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。 5、引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。Tm值的计算有多种方法,如按公式Tm=4(G+C)+2(A+T),在Oligo软件中使用的就是最邻近法(the nearest neighbor method)。 6、ΔG值就是指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。应当选用3’端ΔG值较低(绝对值不超过9),而5’端与中间ΔG值相对较高的引物。引物的3’端的ΔG值过高,容易在错配位点形成双链结构并引发DNA聚合反应。 7、引物二聚体及发夹结构的能值过高(超过4、5kcal/mol)易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行。 8、对引物的修饰一般就是在5’端增加酶切位点,应根据下一步实验中要插入PCR产物的载体的相应序列而确定。 引物序列应该都就是写成5-3方向的, Tm之间的差异最好控制在1度之内, 另外我觉得扩增长度大一些比较好,500bp左右。 要设计引物首先要找到DNA序列的保守区。同时应预测将要扩增的片段单链就是否形成二级结构。如这个区域单链能形成二级结构,就要避开它。如这一段不

PCR引物设计原理及原则

PCR引物设计原理及原则 PCR引物设计原理 PCR引物设计的目的是为了找到一对合适的核苷酸片段,使其能有效地扩增模板DNA序列。因此,引物的优劣直接关系到PCR的特异性与成功与否。 要设计引物首先要找到DNA序列的保守区。同时应预测将要扩增的片段单链是否形成二级结构。如这个区域单链能形成二级结构,就要避开它。如这一段不能形成二级结构,那就可以在这一区域设计引物。 现在可以在这一保守区域里设计一对引物。一般引物长度为15~30碱基,扩增片段长度为100~600碱基对。 让我们先看看P1引物。一般引物序列中G+C含量一般为40%~60%。而且四种碱基的分布最好随机。不要有聚嘌呤或聚嘧啶存在。否则P1引物设计的就不合理。应重新寻找区域设计引物。 同时引物之间也不能有互补性,一般一对引物间不应多于4个连续碱基的互补。 引物确定以后,可以对引物进行必要的修饰,例如可以在引物的5′端加酶切位点序列;标记生物素、荧光素、地高辛等,这对扩增的特异性影响不大。但3′端绝对不能进行任何修饰,因为引物的延伸是从3′端开始的。这里还需提醒的是3′端不要终止于密码子的第3位,因为密码子第3位易发生简并,会影响扩增的特异性与效率。 PCR引物的设计原则: ①引物应用核酸系列保守区内设计并具有特异性。 ②产物不能形成二级结构。 ③引物长度一般在15~30碱基之间。 ④G+C含量在40%~60%之间。 ⑤碱基要随机分布。 ⑥引物自身不能有连续4个碱基的互补。 ⑦引物之间不能有连续4个碱基的互补。 ⑧引物5′端可以修饰。 ⑨引物3′端不可修饰。 ⑩引物3′端要避开密码子的第3位。 PCR引物设计的目的是找到一对合适的核苷酸片段,使其能有效地扩增模板DNA序列。如前述,引物的优劣直接关系到PCR的特异性与成功与否。对引物的设计不可能有一种包罗万象的规则确保PCR的成功,但遵循某些原则,则有助于引物的设计。 1.引物的特异性 引物与非特异扩增序列的同源性不要超过70%或有连续8个互补碱基同源。 2.避开产物的二级结构区 某些引物无效的主要原因是引物重复区DNA二级结构的影响,选择扩增片段时最好避开二级结构区域。用有关计算机软件可以预测估计mRNA的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能(△G°)小于58.6lkJ/mol时,扩增往往不能成功。若不能避开这一区域时,用7-deaza-2′-脱氧GTP取代dGTP对扩增的成功是有帮助的。 3.长度 寡核苷酸引物长度为15~30bp,一般为20~27mer。引物的有效长度:Ln=2(G+C)+(A+T+,Ln值不能大于38,因为>38时,最适延伸温度会超过Taq DNA聚合酶的最适温度(74℃),不能保证产物的特异性。 4.G+C含量

PCR引物的设计原则

PCR引物的设计原则: ①引物应用核酸系列保守区内设计并具有特异性。 ②产物不能形成二级结构。 ③引物长度一般在15~30碱基之间。 ④G+C含量在40%~60%之间。 ⑤碱基要随机分布。 ⑥引物自身不能有连续4个碱基的互补。 ⑦引物之间不能有连续4个碱基的互补。 ⑧引物5′端可以修饰。 ⑨引物3′端不可修饰。 ⑩引物3′端要避开密码子的第3位。 1.引物的特异性 引物与非特异扩增序列的同源性不要超过70%或有连续8个互补碱基同源。 2.避开产物的二级结构区 某些引物无效的主要原因是引物重复区DNA二级结构的影响,选择扩增片段时最好避开二级结构区域。用有关计算机软件可以预测估计mRNA 的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能(△G°)小于58.6lkJ/mol时,扩增往往不能成功。若不能避开这一区域时,用7-deaza-2′-脱氧GTP取代dGTP对扩增的成功是有帮助的。 3.长度

寡核苷酸引物长度为15~30bp,一般为18~27mer。引物的有效长度:Ln=2(G+C)+(A+T),Ln值不能大于38,因为>38时,最适延伸温度会超过Taq DNA聚合酶的最适温度(74℃),不能保证产物的特异性。 4.G+C含量 G+C含量一般为40%~60%。其Tm值是寡核苷酸的解链温度,即在一定盐浓度条件下,50%寡核苷酸双链解链的温度,有效启动温度,一般高于Tm值5~10℃。若按公式Tm=4(G+C)+2(A+T)估计引物的Tm 值,则有效引物的Tm为55~80℃,其Tm值最好接近72℃以使复性条件最佳。上下游引物的GC含量不能相差太大。 5.碱基随机分布 引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3′端不应超过3个连续的G或C,因这样会使引物在G+C富集序列区错误引发。 6.引物自身 引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。若用人工判断,引物自身连续互补碱基不能大于3bp。 7.引物之间 两引物之间不应具有互补性,尤应避免3′端的互补重叠以防引物二聚体的形成。一对引物间不应多于4个连续碱基的同源性或互补性。

引物设计的原理与方法

引物设计的原理与方法 The latest revision on November 22, 2020

PCR引物设计的原理及方法 阎振鑫S111666(四川大学生命科学学院细胞生物学成都 610014) 摘要:自20世纪后期发展了PCR技术以来,PCR已经改变了整个生物学研究的进程。而PCR反应的第一步就是设计引物,引物设计的好坏直接关系到PCR的成败。PCR引物设计有许多的原则必须要遵循:引物与引物之间避免形成稳定的二聚体或发夹结构,引物与模板的序列要紧密互补。引物不能在模板的非目的位点引发DNA聚合反应等。另外,引物的设计方法也越来越多,出现了许多专门的设计软件和网站,如:PrimerPremier5.0等。 关键词:PCR 引物原理方法 NCBI PrimerPremier5.0 PCR primer design principle and method YanZhenxin (sichuan Univercity, Life science college cell biology chengdu 610014 ) Abstract: When PCR technology was find, PCR has changed all of the program in research of biology. The design of primer is the frist step of PCR. It is relation to the fate of PCR. There are some principals must be obey: dipolymer and hairpin structure must be avoid between different primers. The DNA polymerization reaction should not be triggered at the wrong site. Therefore, there are more and more methods of design primer, include the professional softwares and professional web site. Key word: PCR primer principle NCBI PrimerPremier5.0 聚合酶链式反应(Polymerase chain reaction。PCR)是20世纪后期发展起来的 一种体外扩增特异DNA片断的技术。具有快速、简便及高度敏感等优点,能极大地缩短目的基因扩增时间[1]。因此,其一直是生物学者们致力于构建cDNA文库、基因克隆以及表达调控研究的必要前提和基础[2]。PCR的第一步就是引物设计。引物设计的好坏,直接影响了PCR的结果,因此这一步很关键。成功的PCR反应既要高效,又要特异性扩增产物,因此对引物设计提出了较高的要求。引物设计需要注意的地方很多,在大多数情况下,我们都是在知道已知模板序列时进行PCR扩增的。在某些情况比如构建文库的时候也会在不知道模板序列的情况下进行设计。这个时候随机核苷酸序列

引物设计原则

引物设计原则: 引物的3’端决定着PCR反应产物的特异性,而5’端限定着PCR产物的长度。 (1)引物序列应位于基因组DNA的高度保守区,且与非扩增区无同源序列。这样可以减少引物与基因组的非特异结合,提高反应的特异性。 在模板内最好具有单一性,也就是说在模板内部没有错配,特别是3’ 端,一定要避免连续4个以上的碱基互补错配。 (2)引物的长度一般为15-30 bp,最好在18~24 bp,因为太短易形成错配,降低特异性,而太长也会降低特异性,并且影响PCR反应效率。 引物之间也不能有互补性,一般一对引物间不应多于4个连续碱基的 互补。 (3)引物的碱基应尽可能随机分布,避免出现数个嘌呤或嘧啶的连续排列,G+C含量在40%~75%之间,且上下游引物序列GC含量的差异不要 太大,3’端最后5个碱基最好不要富含GC,特别是连续3个的G或 C。DNA双链形成所需的自由能AG,应该以5’端向3’端递减 (4)引物的内部应避免形成稳定的引物二聚体和发夹结构,特别是引物的末端应无回文结构。上下游引物不应有互补序列,特别是3’端应避免 互补,以免形成引物二聚体。 (5)如果以DNA为模板设计引物,产物长度在100—600 bp比较理想。 而以mRNA为模板设计引物时,产物长度在150—300 bp比较理想。(6)5’ 端对PCR影响不太大,可以引进修饰位点和标记物。 (7)引物3’端的头1~2个碱基会影响T aqDNA聚合酶的延伸效率,从而影响PCR反应的扩增效率及特异性。一般的PCR反应中,引物3’末端 的碱基最好选T、C、G而不选A,A错配时会影响合成效率。 (8)引物3’端应为保守氨基酸序列,即采用简并密码子少的氨基酸如Met、Trp,且避免三联体密码第三个碱基的摆动未知位于引物的3’端。3’ 端不应终止于密码子的简并碱基。

引物设计原则(最全汇总)

引物设计原则(汇总) 普通引物设计(适用于从载体上扩增模板): 1. 普通引物长度一般在20-30bp之间,常用24-28bp左右以保证基因特异性; 2. 下载基因序列到Vector NTI; 3. 找到所需安装载体序列; 4. 将基因序列的CDS高亮标记; 5. 寻找载体序列中常用酶切位点,一般为EcoRI、BamHI、HindIII、XhoI等等,比对检测基因序列中是否有这些位点,有的话舍弃,最后选择两个酶切位点,最好离得远一点,并且最好buffer用一样的。酶切位点一般是6bp的回文序列; 6. 从基因ATG开始往后选择10-20bp均可(我的习惯是27bp-6bp酶切位点-2bp保护碱基-xbp 补齐序列),但最好保证最后两个是G或者C,以减少错配率; 7. 将上游酶切位点序列补在A TG前方,并根据载体对框情况补足两者之间的空缺,再根据序列的GC含量和TM值在酶切位点前补足保护碱基,以保证GC和AT的含量不能过高。注意,所有的补齐不能用到终止密码子; 8. 检测上游序列的结构情况,理论上不要太多二级结构以及3’端匹配即可;不过重复的序列也不能太多,以免移码; 9. 从下游终止密码子开始向前选择10-20bp均可,但最好保证最后两个是G或者C,以减少错配率; 10. 选择complementary sequence,在N端补齐下游酶切位点,如果tag在C端(即下游),则在第9点中应该从终止密码子前开始选择(即舍弃终止密码子),并且下游引物也要对框,如果tag在N端,则下游引物不需要对框,只要在N端加上下游酶切位点,再根据情况加上2个保护碱基,然后检测二级结构,原则上3’端部匹配即可。不过重复的序列也不能太多,以免移码; 11. 将设计好的上下游引物放在一起检测二级结构,原则上3’端部匹配即可。不过重复的序列也不能太多,以免移码; 12. 最后在NCBI的primer Blast网站上比对引物序列,看是否基因特异性的。 2011年10月18日左洁 1. 引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于Taq DNA聚合酶进行反应。 2. 引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错配。引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增加。 3. 引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应当避免在引物的3’端使用碱基A。另外,引物二聚体或发夹结构也可能导致PCR反应失败。5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物。 4. 引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。 5. 引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。Tm值的计算有多种方法,如按公式Tm=4(G+C)+2(A+T),在Oligo软件中使用的是最邻近法(the nearest neighbor method)。

引物设计原则

引物设计 一、软件使用: ●推荐软件:Primer Premier 5.0 ●优点:操作简单、显示各种参数改变和可能的二聚体、异二聚体、发夹结构等 ●缺点:没有明显缺点 ●本地同类软件:DNAClub;Oligo 6.22;Vector NTI Suit;Dnasis;Omiga;Dnastar; DNAMAN (Lynnon Biosoft, Quebec, Canada). ●网上同类软件:Primer3(Whitehead Institute 开发);JaMBW(European Molecular Biology Laboratory of Heidelberg 开发)。http://210.72.11.60网站已引进并调试好 这两种软件。独特之处在于:对全基因组PCR的引物设计,可以将设计好的引物 对后台核酸数据库进行比对,发现并排除引发错配的引物。因此建议经常做全基 因组PCR的用户试用。 二、推荐操作: ●引物搜索:Primer Premier 5.0 ●引物评价:Oligo 6.22 三、引物设计的原则: 首先引物要跟模板紧密结合,其次引物与引物之间不能有稳定的二聚体或发夹结构存在,再次引物不能在别的非目的位点引起DNA聚合反应(即错配)。围绕这几条基本原则,设计引物需要考虑诸多因素,如引物长度(primer length)、产物长度(product length)、序列Tm值(melting temperature)、ΔG值(internal stability)、引物二聚体及发夹结构(duplex formation and hairpin)、错误引发位点(false priming site)、引物及产物GC 含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。以使用Oligo 软件分析设计引物为例,笔者总结出以下的要点:

引物设计的详细步骤

一、引物设计step by step 1、在NCBI上搜索到目的基因,找到该基因的mRNA,在CDS选项中,找到编码区所在位置,在下面的origin中,Copy该编码序列作为软件查询序列的候选对象。 2、用Primer Premier5搜索引物 ①打开Primer Premier5,点击File-New-DNA sequence,出现输入序列窗口,Copy目的序列在输入框内(选择As),此窗口内,序列也可以直接翻译成蛋白。点击Primer,进入引物窗口。 ②此窗口可以链接到“引物搜索”、“引物编辑”以及“搜索结果”选项,点击Search按钮,进入引物搜索框,选择“PCR primers”,“Pairs”,设定搜索区域和引物长度和产物长度。在Search Parameters里面,可以设定相应参数。一般若无特殊需要,参数选择默认即可,但产物长度可以适当变化,因为100~200bp的产物电泳跑得较散,所以可以选择300~500bp. ③点击OK,软件即开始自动搜索引物,搜索完成后,会自动跳出结果窗口,搜索结果默认按照评分(Rating)排序,点击其中任一个搜索结果,可以在“引物窗口”中,显示出该引物的综合情况,包括上游引物和下游引物的序列和位置,引物的各种信息等。 ④对于引物的序列,可以简单查看一下,避免出现下列情况:3’不要出现连续的3个碱基相连的情况,比如GGG或CCC,否则容易引起错配。此窗口中需要着重查看的包括:T m应该在55~70度之间,GC%应该在45%~55%间,上游引物和下游引物的T m值最好不要相差太多,大概在2度以下较好。该窗口的最下面列出了两条引物的二级结构信息,包括,发卡,二聚体,引物间交叉二聚体和错误引发位置。若按钮显示为红色,表示存在该二级结构,点击该红色按钮,即可看到相应二级结构位置图示。最理想的引物,应该都不存在这些二级结构,即这几个按钮都显示为“None”为好。但有时很难找到各个条件都满足的引物,所以要求可以适当放宽,比如引物存在错配的话,可以就具体情况考察该错配的效率如何,是否会明显影响产物。对于引物具体详细的评价需要借助于Oligo 来完成,Oligo自身虽然带有引物搜索功能,但其搜索出的引物质量感觉不如Primer5. ⑤在Primer5窗口中,若觉得某一对引物合适,可以在搜索结果窗口中,点击该引物,然后在菜单栏,选择File-Print-Current pair,使用PDF虚拟打印机,即可转换为Pdf文档,里面有该引物的详细信息。 3、用Oligo验证评估引物 ①在Oligo软件界面,File菜单下,选择Open,定位到目的cDNA序列(在primer中,该序列已经被保存为Seq文件),会跳出来两个窗口,分别为Internal Stability(Delta G)窗口和Tm窗口。在Tm窗口中,点击最左下角的按钮,会出来引物定位对话框,输入候选的上游引物序列位置(Primer5已经给出)即可,而引物长度可以通过点击Change-Current oligo length来改变。定位后,点击Tm 窗口的Upper按钮,确定上游引物,同样方法定位下游引物位置,点击Lower按钮,确定下游引物。引物确定后,即可以充分利用Analyze菜单中各种强大的引物分析功能了。 ②Analyze中,第一项为Key info,点击Selected primers,会给出两条引物的概括性信息,其中包括引物的T m值,此值Oligo是采用nearest neighbor method计算,会比Primer5中引物的Tm值略高,此窗口中还给出引物的Delta G和3’端的Delta G.3’端的Delta G过高,会在错配位点形成双链结构并引起DNA聚合反应,因此此项绝对值应该小些,最好不要超过9。 ③Analyze中第二项为Duplex Formation,即二聚体形成分析,可以选择上游引物或下游引物,分析上游引物间二聚体形成情况和下游引物间的二聚体情况,还可以选择Upper/Lower ,即上下游引物之间的二聚体形成情况。引物二聚体是影响PCR反应异常的重要因素,因此应该避免设计的引物存在二聚体,至少也要使设计的引物形成的二聚体是不稳定的,即其Delta G值应该偏低,一般不要使其超过4.5kcal/mol,结合碱基对不要超过3个。Oligo此项的分析窗口中分别给出了3’端和整个引物的二聚体图示和Delta G值。 ④Analyze中第三项为Hairpin Formation,即发夹结构分析。可以选择上游或者下游引物,同样,Delta G值不要超过4.5kcal/mol,碱基对不要超过3个。 Analyze中第四项为Composition and T m,会给出上游引物、下游引物和产物的各个碱基的组成比例和Tm值。上下游引物的GC%需要控制在40%~60%,而且上下游引物之间的GC%不要相差太大。Tm值共有3个,分别采用三种方法计算出来,包括nearest neighbor method、%GC method和2(A+T)+4(G+C)method,最后一种应该是Primer5所采用的方法,T m值可以控制在50~70度之间。 第五项为False Priming Sites,即错误引发位点,在Primer5中虽然也有False priming分析,但不如oligo详细,并且oligo会给我正确引发效率和错误引发效率,一般的原则要使误引发效率在100以

引物设计需要注意事项

引物设计需要注意事项 一、PCR引物设计的11条黄金法则 1.引物最好在模板cDNA的保守区内设计。DNA序列的保守区是通过物种间相似序列的比较确定的。在NCBI上搜索不同物种的同一基因,通过序列分析软件(比如DNAman)比对(Alignment),各基因相同的序列就是该基因的保守区。 2.引物长度一般在15~30碱基之间。引物长度(primer length)常用的是18-27 bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于Taq DNA 聚合酶进行反应。 3.引物GC含量在40%~60%之间,Tm值最好接近72℃。GC含量(composition)过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。另外,上下游引物的Tm值(melting temperature)是寡核苷酸的解链温度,即在一定盐浓度条件下,50%寡核苷酸双链解链的温度。有效启动温度,一般高于Tm值5~10℃。若按公式Tm= 4(G+C)+2(A+T)估计引物的Tm值,则有效引物的Tm为55~80℃,其Tm值最好接近72℃以使复性条件最佳。 4.引物3′端要避开密码子的第3位。如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增的特异性与效率。 5.引物3′端不能选择A,最好选择T。引物3′端错配时,不同碱基引发效率存在着很大的差异,当末位的碱基为A时,即使在错配的情况下,也能有引发链的合成,而当末位链为T时,错配的引发效率大大降低,G、C错配的引发效率介于A、T之间,所以3′端最好选择T。 6.碱基要随机分布。引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错误引发(False priming)。降低引物与模板相似性的一种方法是,引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3′端不应超过3个连续的G或C,因这样会使引物在GC富集序列区错误引发。 7.引物自身及引物之间不应存在互补序列。引物自身不应存在互补序列,否则引物自身会折叠成发夹结构(Hairpin)使引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。引物自身不能有连续4个碱基的互补。两引物之间也不应具有互补性,尤其应避免3′端的互补重叠以防止引物二聚体(Dimer与Cross dimer)的形成。引物之间不能有连续4个碱基的互补。引物二聚体及发夹结构如果不可避免的话,应尽量使其△G值不要过高(应小于4.5kcal/mol)。否则易导致产生引物二聚体带,并且降低引物有效浓度而使PCR 反应不能正常进行。

简并引物设计过程及原则

简并引物设计过程及原则 简并引物常用于从已知蛋白到相关核酸分子的研究及用于一组引物扩增一类分子。 简并引物设计过程 (1)利用NCBI搜索不同物种中同一目的基因的蛋白质或cDNA编码的氨基酸序列因为密码子的关系,不同的核苷酸序列可能表达的氨基酸序列是相同的,所以氨基酸序列才是真正保守的。首先利用NCBI的Entrez检索系统,查找到一条相关序列即可。随后利用这一序列使用BLASTP(通过蛋白查蛋白),在整个NR数据库中查找与之相似的氨基酸序列。 (2)对所有的序列进行多序列比对将搜索到的同一基因的不同氨基酸序列进行多序列比对,可选工具有Clustal W/X, 也可在线分析。所有序列的共有部分将会显示出来。“*”表示保守,“:”表示次保守。 (3)确定合适的保守区域设计简并引物至少需要上下游各有一个保守区域,且两个保守区域相距50~400个氨基酸残基为宜,使得PCR产物在150~1200bp之间,最重要的是每一个保守区域至少有6个氨基酸的保守区,因为每条引物至少18bp左右。若比对结果保守性不是很强很可能找不到6个氨基酸序列的保守区,这时可以根据物种的亲缘关系,选择亲缘关系近的物种进行二次比对,若保守性仍达不到要求,则需进行三次比对,总之,究竟要选多少序列来比对,要根据前一次的结果反复调整。最终目的就是有两个6个氨基酸且两者间距离合适的保守区域。 (4)利用软件设计引物当得到保守区域后,就可以利用专业的软件来设计引物了,其中Primer 5.0 支持简并引物的设计,将参与多序列比对的序列中的任一条导入Primer 5.0 中,将其翻译成核苷酸序列,该序列群可用一条有简并性的核苷酸链来表示(其中R=A/G,Y=C/T,M=A/C, K=G/T, S=C/G, W=A/C/T, B=C/G/T,V=A/C/G, D=A/G/T, N=A/C/G/T, 该具有简并性的核苷酸链必然包含上一步中找到的氨基酸保守区域的对应部分,在Primer 5.0 中修改参数,令其在两个距离合适的保守的nt 区域内寻找引物对,总之要保证上下游引物都落在该简并链的保守区域内,结果会有数对,分数越高越好。 (5)对引物的修饰若得到的引物为: 5-NAGSGNGCDTTANCABK-3 则简并度=4×2×4×3×4×3×2=2304,很明显该条引物的简并度很高不利于PCR,可以通过次黄嘌呤代替N(因为次黄嘌呤可以很好的和4种

引物设计原则及酶切位点选择和设计

引物设计原则及酶切位点选择和设计 [整理]:最初的时候,由于害怕设计酶切位点最后且不开,所以经常采用最通用的方法,用T载体克隆解决问题,但后来发现她也有问题,就是浓度提不上去,你需要体大量的载体来酶切,所以感到还是直接扩增好一点。但这就需要你仔细设计引物。连入质粒中的重要目的就是进行酶切和连接,当然首先就是在想要合成或者是进行PCR扩增出靶基因的时候在核酸的两端接入酶切位点,酶切位点是与你的质粒的特点相关的,可以在质粒的图谱说明书上找取相应的位点,进行设计。 (一)设计引物前应做的准备工作: 准备载体图谱,大致准备把片断插在那个部分 对片断进行酶切分析,确定一下那些酶切位点不能用 准备一本所买公司的酶的商品目录,便于查酶的各种数据及两种酶是否可以配用 (二)设计引物所要考虑的问题 两个位点应是载体上的,,所连接片断上没有这两个位点,且距离不能太近,往往导致两个酶都切不好。因此,紧挨在一起,只能切一个,除非恰好是与上面两个酶在一起的酶切位点。我看promega的说明书上说,最好隔四个。还有一种情况是:不能有碱基的交叉,比如AGATCTTAAG,这样的位点比较难切。 两个酶切点最好不要是同尾酶(切下来的残基不要互补),否则效果相当于单酶切。 最好使用酶切效率高的。 最好使用双酶切有共同buffer的酶。 最好使用较常用的酶(如hind3,bamh1,ecor1等),最好使用自己实验室有的酶,这样可以省钱。 Tm的计算,关于Tm的问题,很多的战友都有疑惑。其实园子里有很多的解释了。 Tm叫溶解温度(melting temperature, Tm),即是DNA双链溶解所需的温度。大家可以理解,这个温度是由互补的DNA区域决定的,而不互补的区域对DNA的溶解是没有作用的。因此,对于引物的Tm,只有和模板互补的区域对Tm才有贡献。计算Tm时,只计算互补的区域(除非你的酶切位点也与模板互补)。不少战友设计的引物都Tm过低,是因为他们误把保护碱基和酶切位点都计算到Tm里了,最后的结果是导致了PCR反应的诸多困难。所以,设计引物的时候,先不管5'端的修饰序列,把互补区的Tm控制在55度以上(我喜欢控制在58以上,具体根据PCR的具体情况,对于困难的PCR,需要适当提高Tm),再加上酶切位点和保护碱基,这样的引物通常都是可用的,即使有小的问题,也可以挽回。Tm温度高的引物就比较容易克服3‘发卡、二聚体及3'非特异结合等问题。简单的计算公式可以用2+4的公式。若你计算的Tm值达到了快90 ,不包括酶切位点。引物公司给你发的单子是包括酶切位点的。自己可以再估计一下。如你设计了带酶切位点的引物,总长分别为29、33个碱基,去掉酶切位点和保护碱基,分别为17、21个碱基。引物公司给的单子是70多度,实际用的只有50度,用55度扩的结果也差不多。 其它关于Tm值的计算,有用PP5.0进行评价的,需要考虑的参数包括:base number、GC%、Tm、hairpin、dimer、false priming、cross dimer。退一般退火温度为Tm-5度,退火温度的计算可以不把加入的酶切位点及保护碱基考虑进去,如上所言,PCR几个循环后,引物外侧的序列已经参入了扩增片断中,所以你可以在预变性后多加几步,温度比你Tm值低些(这样可能会增加非特异性),Tm值是你包括酶切位点及保护碱基的Primer计算出来的。1.一般在5'端加保护碱基,如果你扩增后把目的条带做胶回收转入T-VECTOR或者其它的载体的话,酶切时可以不需加保护碱基2.有人的经验加入酶切位点的引物可以和未加入时使用相同的退火温度,结果也还是令人满意。

相关文档
最新文档