蛋白质一级结构分析

蛋白质一级结构分析
蛋白质一级结构分析

ProtParam

User-provided sequence:

10 20 30 40 50 60 MLKKQEKFYY GGDYNPEQWD ESVWKEDMRL MKKAGVNYVS INIFSWARLQ PDEETYDFST

70 80 90 100 110 120 LDKIMDMLAE NGIGADLATA TAAPPAWLSR KYPDSLPVDK DGARFLPGSR QHYCPNSKDY

130 140 150 160 170 180 ARLAAKLVRK IAERYKNHPA LVMWHVNNEY GCHIAECYCD NCKKAFQTWL KEKYSTIENL

190 200 210 220 230 240 NKSWSTDFWS QRYYEWEEIC LPGKTPTFAN PMQQLDYKAF MDDSLLALYK MERDILKAYT

250 260 270 280 290 300 PDVPVMTNLM GLHKPVDGFH WAKEMDLVTW DAYPDPFDRI PYAQFMAHDL MRSLKKQPFL

310 320 330 340 350 360 LMEQAAGAVN WRAQNAVKTP GQMRLWSYEA AAHGADGIMF FQWRASQGGA EKFHSGMVPH

370 380 390 400 410 420 SGDEESRNFR EVVQLGNELK NLEKVTGSAY AADVAIVFDW KNWWALELDS KPSSLVTYIK

430 440 450 460 470 480 QLLPFYKVLH TRNIGVDFIH PDEAMDRYKV VFAPASYRVT KAFADKVKDY VEKGGYFVSN

490 500 510 520 530 540 FFSGIADEND RVYLGGYPGA YRDILGIYVE EFAPMKKGAV HQIRTGYGDA AIRVWEEKIH

550 560 570 580 590 600 LKGAEALAWF KDGYLAGSPA VTAHHCGKGK AYYIGTQPDE QYLSSLLKDI LQEADVRPAL

610 620 630 640 650 660 DAPRGVEVVV RKNGNEKYLF LLNHTDQVQF VNAGGTYLEL INGDTESETV RLSPRDVKIL

QVIEK

References and documentation are available.

Number of amino acids: 665

Molecular weight: 76089.5

Theoretical pI: 6.06

Amino acid composition:

Ala (A) 63 9.5%

Arg (R) 29 4.4%

Asn (N) 27 4.1%

Asp (D) 47 7.1%

Cys (C) 7 1.1%

Gln (Q) 24 3.6%

Glu (E) 42 6.3%

Gly (G) 43 6.5%

His (H) 17 2.6%

Ile (I) 26 3.9%

Leu (L) 54 8.1%

Lys (K) 51 7.7%

Met (M) 20 3.0%

Phe (F) 28 4.2%

Pro (P) 32 4.8%

Ser (S) 31 4.7%

Thr (T) 24 3.6%

Trp (W) 19 2.9%

Tyr (Y) 38 5.7%

Val (V) 43 6.5%

Pyl (O) 0 0.0%

Sec (U) 0 0.0%

(B) 0 0.0%

(Z) 0 0.0%

(X) 0 0.0%

Total number of negatively charged residues (Asp + Glu): 89Total number of positively charged residues (Arg + Lys): 80

Atomic composition:

Carbon C 3451

Hydrogen H 5221

Nitrogen N 907

Oxygen O 988

Sulfur S 27

Formula: C

3451H

5221

N

907

O

988

S

27

Total number of atoms: 10594

Extinction coefficients:

Extinction coefficients are in units of M-1 cm-1, at 280 nm measured in water.

Ext. coefficient 161495

Abs 0.1% (=1 g/l) 2.122, assuming all pairs of Cys residues form cystines

Ext. coefficient 161120

Abs 0.1% (=1 g/l) 2.118, assuming all Cys residues are reduced Estimated half-life:

The N-terminal of the sequence considered is M (Met).

The estimated half-life is: 30 hours (mammalian reticulocytes, in vitro). >20 hours (yeast, in vivo).

>10 hours (Escherichia coli, in vivo).

Instability index:

The instability index (II) is computed to be 29.16

This classifies the protein as stable.

Aliphatic index: 75.14

Grand average of hydropathicity (GRAVY): -0.451

EXPASY ——protparam

蛋白质结构解析的方法对比综述 (1)

蛋白质结构解析的方法对比综述 工程硕士李瑾 摘要:到目前为止,蛋白质结构解析的方法主要是两种,x射线衍射法和NMR法,这两种方法各有优点和不足。 关键词:x射线衍射法 NMR法 到目前为止,蛋白质结构解析的方法主要是两种,x射线衍射法和NMR法。其中X射线的方法产生的更早,也更加的成熟,解析的数量也更多,第一个解析的蛋白的结构,就是用x晶体衍射的方法解析的。而NMR方法则是在90年代才成熟并发展起来的。这两种方法各有优点和不足[1]。 首先是X射线晶体衍射法。该方法的前提是要得到蛋白质的晶体。通常是将表达目的蛋白的基因经PCR扩增后克隆到一种表达载体中,然后转入大肠杆菌中诱导表达,目的蛋白提纯之后摸索结晶条件,等拿到晶体之后,将晶体进行x射线衍射,收集衍射图谱,通过一系列的计算,得到蛋白质的原子结构[2]。 x射线晶体衍射法的优点是:速度快,通常只要拿到晶体,最快当天就能得出结构,另外不受肽链大小限制,无论是多大分子量的蛋白质或者RNA、DNA,甚至是结合多种小分子的复合体,只要能够结晶就能够得到其原子结构。所以x射线方法解析蛋白的关键是摸索蛋白结晶的条件。该方法得到的是蛋白质分子在晶体状态下的空间结构,这种结构与蛋白质分子在生物细胞内的本来结构有较大的差别。晶体中的蛋白质分子相互间是有规律地、紧密地排列在一起的,运动性较差;而自然界的生物细胞中的蛋白质分子则是处于一种溶液状态,周围是水分子和其他的生物分子,具有很好的运动性。而且,有些蛋白质只能稳定地存在于溶液状态,无法结晶[2]。 核磁共振NMR(nuclear magnetic resonance)现象很早就被科研人员观察到了,但将这种方法用来解析蛋白质结构,却是近一二十年的事情。NMR法具体原理是对水溶液中的蛋白质样品测定一系列不同的二维核磁共振图谱,然后根据已确定的蛋白质分子的一级结构,通过对各种二维核磁共振图谱的比较和解析,在图谱上找到各个序列号氨基酸上的各种氢原子所对应的峰。有了这些被指认的峰,就可以根据这些峰在核磁共振谱图上所呈现的相互之间的关系得到它们所对应的氢原子之间的距离。[3]可以想象,正是因为蛋白质分子具有空间结构,在序列上相差甚远的两个氨基酸有可能在空间距离上是很近的,它们所含的氢原子所对应的NMR峰之间就会有相关信号出现[4] 。通常,如果两个氢原子之间距离小于0.5纳米的话,它们之间就会有相关信号出现。一个由几十个氨基酸残基组成的蛋白质分子可以得到几百个甚至几千个这样与距离有关的信号,按照信号的强弱把它们转换成对应的氢原子之间的距离,然后运用计算机程序根据所得到的距离条件模拟出该蛋白质分子的空间结构。该结构既要满足从核磁共振图谱上得到的所有距离条件,还要满足化学上有关原子与原子结合的一些基本限制条件,如原子间的化学键长、键角和原子半径等[4]。 NMR解析蛋白结构常规步骤如下:首先通过基因工程的方法,得到提纯的目的蛋白,在蛋白质稳定的条件下,将未聚合,而且折叠良好的蛋白样品(通常是1mM-3mM,500ul,PH6-7的PBS)装入核磁管中,放入核磁谱仪中,然后由写好的程序控制谱仪,发出一系列的电磁波,激发蛋白中的H、13N、13C原子,等电磁波发射完毕,再收集受激发的原子所放出的“能量”,通过收集数据、谱图处理、电脑计算从而得到蛋白的原子结构[5] [6]。 用NMR研究蛋白质结构的方法,可以在溶液状态进行研究,得到的是蛋白质分子在溶液中的结构,这更接近于蛋白质在生物细胞中的自然状态[7]。此外,通过改变溶液的性质,还可以模拟出生物细胞内的各种生理条件,即蛋白质分子所处的各种环境,以观察这些周围环境的变化对蛋白质分子空间结构的影响。在溶液环境中,蛋白质分子具有与自然环境中类

蛋白质四级结构及其检测方法

论述一、二、三、四级蛋白质结构及其检测方法? 蛋白质定义:由一条或多条多肽链以特殊方式结合而成的生物大分子,通常是将分子量在6000道尔顿以上的多肽称为蛋白质。 一、蛋白质一级结构: (一)定义:蛋白质的一级结构又称为共价结构或化学结构,它是指蛋白质中的氨基酸按照特定的排列顺序通过肽键连接起来的多肽链结构。氨基酸残基主要通过肽键连接,有些蛋白质中含有二硫键。 (二)检测方法: 二硝基氟苯(DNFB)法、丹磺酰氯法、氨肽酶法、C-末端氨基酸测定(肼解法、还原法、羧肽酶法) 二、蛋白质二级结构: (一)定义:蛋白质分子中某一段肽链的局部空间结构,即该段肽链主链骨架原子的相对空间位置,只涉及肽链主链的构象及链内或链间形成的氢键。并不涉及氨基酸残基侧链的构象。主要的化学键为氢键。 (二)检测方法: 构象的研究方法:X射线衍射法、核磁共振光谱法、圆二色谱CD、紫外-可见差光谱、荧光探针法、激光拉曼光谱法、红外光谱法、关联规则与遗传算法。 三、蛋白质三级结构: (一)定义:整条肽链中全部氨基酸残基的相对空间位置。即肽链中所有原子在三维空间的排布位置。主要的化学键:疏水键、离子键、二硫键、氢键和配位键稳定维系三级结构的作用。 (二)检测方法: 同源建模(比较建模SWISS-MODEL)法、穿针引线方法(折叠识别方法)、从头预测法、最速下降法、牛顿法、共轭梯度法、遗传算法、分解-结合法、离散化方法、分子动力学法、混合预测方法、粒子群优化算法(PSO)。 四、蛋白质四级结构: (一)定义:有些蛋白质分子含有二条或多条多肽链,每一条多肽链都有完整的三级结构,称为蛋白质的亚基。蛋白质分子中各亚基的空间排布及亚基接触部位的布局和相互作用,称为蛋白质的四级结构。亚基之间的结合力主要是疏水作用,其次是氢键和离子键。 (二)检测方法: 线性降维法:Swiss-Prot数据库中抽取数据集进行四级结构预测。 Quat-PRE方法:综合运用mRMR方法和SVM的wrapper方法进行四级结构预测。 最近邻居算法:从蛋白质一级序列出发,利用蛋白质序列氨基酸组成、二肽组成以及混合组成方法对蛋白质单聚体、二聚体、三聚体、四聚体、五聚体、六聚体和八聚体进行分类研究。

蛋白质结构分析原理及工具-文献综述

蛋白质结构分析原理及工具 (南京农业大学生命科学学院生命基地111班) 摘要:本文主要从相似性检测、一级结构、二级结构、三维结构、跨膜域等方面从原理到方法再到工具,系统地介绍了蛋白质结构分析的常用方法。文章侧重于工具的列举,并没有对原理和方法做详细的介绍。文章还列举了蛋白质分析中常用的数据库。 关键词:蛋白质;结构预测;跨膜域;保守结构域 1 蛋白质相似性检测 蛋白质数据库。由一个物种分化而来的不同序列倾向于有相似的结构和功能。物种分化后形成的同源序列称直系同源,它们通常具有相似的功能;由基因复制而来的序列称为旁系同源,它们通常有不同的功能[1]。因此,推测全新蛋白质功能的第一步是将它的序列与进化上相关的已知结构和功能的蛋白质序列比较。表一列出了常用的蛋白质序列数据库和它们的特点。 表一常用蛋白质数据库 网址可能有更新 氨基酸替代模型。进化过程中,一种氨基酸残基会有向另一种氨基酸残基变化的倾向。氨基酸替代模型可用来估计氨基酸替换的速率。目前常用的替代模型有Point Accepted Mutation (PAM)矩阵、BLOck SUbstitution Matrix (BLOSUM)矩阵[2]、JTT模型[3]。 序列相似性搜索工具。序列相似性搜索又分为成对序列相似性搜索和多序列相似性搜索。成对序列相似性搜索通过搜索序列数据库从而找到与查询序列相似的序列。分为局部联配和全局联配。常用的局部联配工具有BLAST和SSEARCH,它们使用了Smith-Waterman 算法。全局联配工具有FASTA和GGSEARCH,基于Needleman-Wunsch算法。多序列相似性搜索常用于构建系统发育树,这里不阐述。表二列举了常用的成对序列相似性比对搜索工具

蛋白质的一级结构(共价结构)

1.蛋白质的一级结构(共价结构) 蛋白质的一级结构也称共价结构、主链结构。 1.蛋白质结构层次 一级结构(氨基酸顺序、共价结构、主链结构) ↓是指蛋白质分子中氨基酸残基的排列顺序 二级结构 ↓ 超二级结构 ↓ 构象(高级结构)结构域 ↓ 三级结构(球状结构) ↓ 四级结构(多亚基聚集体) 1.一级结构的要点 . 1.蛋白质测序的一般步骤 祥见 P116 (1)测定蛋白质分子中多肽链的数目。 (2)拆分蛋白质分子中的多肽链。 (3)测定多肽链的氨基酸组成。 (4)断裂链内二硫键。 (5)分析多肽链的N末端和C末端。 (6)多肽链部分裂解成肽段。 (7)测定各个肽段的氨基酸顺序 (8)确定肽段在多肽链中的顺序。 (9)确定多肽链中二硫键的位置。 1.蛋白质测序的基本策略 对于一个纯蛋白质,理想方法是从N端直接测至C端,但目前只能测60个N端氨基酸。 1.直接法(测蛋白质的序列) 两种以上特异性裂解法 N C A 法裂解 A1 A2 A3 A4 B 法裂解 B1 B2 B3 B4 用两种不同的裂解方法,产生两组切点不同的肽段,分离纯化每一个肽段,分离测定两个肽段的氨基酸序列,拼接成一条完整的肽链。

1. 间接法(测核酸序列推断氨基酸序列) 核酸测序,一次可测600-800bp 1. 测序前的准备工作 1. 蛋白质的纯度鉴定 纯度要求,97%以上,且均一,纯度鉴定方法。(两种以上才可靠) ⑴聚丙烯酰胺凝胶电泳(PAGE)要求一条带 ⑵DNS —cl (二甲氨基萘磺酰氯)法测N 端氨基酸 1. 测定分子量 用于估算氨基酸残基n= 方法:凝胶过滤法、沉降系数法 1. 确定亚基种类及数目 多亚基蛋白的亚基间有两种结合方式: ⑴非共价键结合 8mol/L 尿素,SDS SDS-PAGE 测分子量 ⑵二硫键结合 过甲酸氧化: —S —S —+HCOOOH → SO 3H β巯基乙醇还原: 举例:: 血红蛋白 (α2β2) (注意,人的血红蛋白α和β的N 端相同。) 分子量: M 拆亚基: M 1 、M 2 两条带 拆二硫键: M 1 、M 2 两条带 分子量关系: M = 2M 1 + 2M 2 1. 测定氨基酸组成 主要是酸水解,同时辅以碱水解。氨基酸分析仪自动进行。 确定肽链中各种a.a 出现的频率,便于选择裂解方法及试剂。 ①Trp 测定 对二甲基氨基苯甲醛 590nm 。 ②Cys 测定 5、5/一二硫代双(—2—硝基苯甲酸)DTNB ,412nm 1. 端基分析 ①N 端分析 DNS-cl 法:最常用,黄色荧光,灵敏度极高,DNS-多肽水解后的DNS-氨基酸不需要提取。 DNFB 法:Sanger 试剂,DNP-多肽,酸水解,黄色DNP-氨基酸,有机溶剂(乙酸乙酯) 抽提分离,纸层析、薄层层析、液相等 PITC 法:Edman 法,逐步切下。无色PTH-氨基酸,有机溶剂抽提,层析。 ②C 端分析 110mw

蛋白质一级结构与高级结构关系

蛋白质一级结构与高级结构关系 蛋白质分子是由氨基酸首尾相连而成的共价多肽链,天然蛋白质分子有自己特有的空间结构,称为蛋白质构象。 蛋白质结构的不同组织层次:一级结构指多肽链的氨基酸序列。二级结构是指多肽链借助氢键排列成特有的α螺旋和β折叠片段。三级结构是指多肽链借助各种非共价键弯曲、折叠成具有特定走向的紧密球状构象。球状构象给出最低的表面积和体积之比,因而使蛋白质与周围环境的相互作用降到最小。四级结构是指寡居蛋白质中各亚基之间在空间上的相互关系和结合方式。二、三、四级结构为蛋白质的高级结构。蛋白质的天然折叠结构决定于3个因素:1。与溶剂分子(一般是水)的相互作用。2。溶剂的PH值和离子组成。3。蛋白质的氨基酸序列。后一个是最重要的因素。 (一)蛋白质折叠的热力学假说 蛋白质的高级结构由其一级结构决定的学说最初由Christian B. Anfinsen于1954年提出。在1950年之前,Anfinsen一直从事蛋白质结构方面的研究。在进入美国国立卫生研究所(NIH)以后,继续从事这方面的研究。Anfinsen和两个博士后Michael Sela、 Fred White在研究中发现,使用高浓度的巯基试剂——β- 巯基乙醇(β- mercaptoethanol)可将二硫键还原成自由的巯基,如果再加入尿素,进一步破坏已被还原的核糖核酸酶分子内部的次级键,则该酶将去折叠转变成无任何活性的无规卷曲。对还原的核糖核酸酶的物理性质进行分析的结果清楚地表明了它的确采取的是无规卷曲的形状。 在成功得到一种去折叠的核糖核酸酶以后,Anfinsen 着手开始研究它的重折叠过程。考虑到被还原的核糖核酸酶要在已被还原的8个Cys残基上重建4对二硫键共有105 种不同的组合,但只有一种是正确的形式,如果决定蛋白质构象的信息一直存在于氨基酸序列之中,那么,最后重折叠得到的总是那种正确的形式。否则,重折叠将是随机的,最后只能得到少量的正确形式。Anfinsen 的重折叠实验还是比较顺利的,他通过透析的方法除去了导致酶去折叠的尿素和巯基乙醇,再将没有活性的酶转移到其生理缓冲溶液之中,在有氧气的情况下于室温放置,以使巯基能重新氧化成二硫键。经过一段时间以后,发现核糖核酸酶活性得以恢复,这意味着它原来的构象恢复了。由于上述过程没有细胞内任何其他成分的参与,完全是一种自发的过程,因此,有理由相信此蛋白质正确折叠所需要的所有信息全部存在于它的一级结构之中。在此基础上,Anfinsen提出了蛋白质折叠的热力学假说(thermodynamic hypothesis)。根据此假说,一个蛋白质的天然三维构象对应于在生理条件下其所处的热力学最稳定的状态。热力学稳定性由组成的氨基酸残基之间的相互作用决定,于是蛋白质的三维构象直接由它的一级结构决定。 (二)蛋白质高级结构对高级结构形成的影响

三种分析蛋白结构域的方法

三种分析蛋白结构域(Domains)的方法 1,SMART入门,蛋白结构和功能分析 SMART介绍 SMART (a Simple Modular Architecture Research Tool) allows the identification and annotation of genetically mobile domains and the analysis of domain architectures. More than 500 domain families found in signalling, extracellular and chromatin-associated proteins are detectable. These domains are extensively annotated with respect to phyletic distributions, functional class, tertiary structures and functionally important residues. Each domain found in a non-redundant protein database as well as search parameters and taxonomic information are stored in a relational database system. User interfaces to this database allow searches for proteins containing specific combinations of domains in defined taxa. For all the details, please refer to the publications on SMART. SMART(,可以说是蛋白结构预测和功能分析的工具集合。简单点说,就是集合了一些工具,可以预测蛋白的一些二级结构。如跨膜区(Transmembrane segments),复合螺旋区(coiled coil regions),信号肽(Signal peptides),蛋白结构域(PFAM domains)等。 SMART前该知道的 1,SMART有两种不同的模式:normal 或genomic 主要是用的数据库不一样。Normal SMART, 用的数据库 Swiss-Prot, SP-TrEMBL 和 stable Ensembl proteomes。Genomic SMART, 用全基因组序列。详细列表:,一些名词解释 进行时 可以直接用各个数据库蛋白的ID。如Uniprot/Ensembl??ID / Accession number (ACC)。或是直接蛋白序列。运行SMART也可选择signal peptides、PFAM domains等的预测,勾上就是。看下图 SMART结果 运行后的结果用图表表示。其实运行后的结果都有明确的解释。详细请看下面。

蛋白质一级结构与高级结构关系

蛋白质分子是由氨基酸首尾相连而成的共价多肽链,天然蛋白质分子有自己特有的空间结构,称为蛋白质构象。 蛋白质结构的不同组织层次:一级结构指多肽链的氨基酸序列。二级结构是指多肽链借助氢键排列成特有的α螺旋和β折叠片段。三级结构是指多肽链借助各种非共价键弯曲、折叠成具有特定走向的紧密球状构象。球状构象给出最低的表面积和体积之比,因而使蛋白质与周围环境的相互作用降到最小。四级结构是指寡居蛋白质中各亚基之间在空间上的相互关系和结合方式。二、三、四级结构为蛋白质的高级结构。蛋白质的天然折叠结构决定于3个因素:1。与溶剂分子(一般是水)的相互作用。2。溶剂的PH值和离子组成。3。蛋白质的氨基酸序列。后一个是最重要的因素。 (一)蛋白质折叠的热力学假说 蛋白质的高级结构由其一级结构决定的学说最初由Christian B. Anfinsen于1954年提出。在1950年之前,Anfinsen一直从事蛋白质结构方面的研究。在进入美国国立卫生研究所(NIH)以后,继续从事这方面的研究。Anfinsen和两个博士后Michael Sela、 Fred White在研究中发现,使用高浓度的巯基试剂——β- 巯基乙醇(β- mercaptoethanol)可将二硫键还原成自由的巯基,如果再加入尿素,进一步破坏已被还原的核糖核酸酶分子内部的次级键,则该酶将去折叠转变成无任何活性的无规卷曲。对还原的核糖核酸酶的物理性质进行分析的结果清楚地表明了它的确采取的是无规卷曲的形状。 在成功得到一种去折叠的核糖核酸酶以后,Anfinsen 着手开始研究它的重折叠过程。考虑到被还原的核糖核酸酶要在已被还原的8个Cys残基上重建4对二硫键共有105 种不同的组合,但只有一种是正确的形式,如果决定蛋白质构象的信息一直存在于氨基酸序列之中,那么,最后重折叠得到的总是那种正确的形式。否则,重折叠将是随机的,最后只能得到少量的正确形式。Anfinsen 的重折叠实验还是比较顺利的,他通过透析的方法除去了导致酶去折叠的尿素和巯基乙醇,再将没有活性的酶转移到其生理缓冲溶液之中,在有氧气的情况下于室温放置,以使巯基能重新氧化成二硫键。经过一段时间以后,发现核糖核酸酶活性得以恢复,这意味着它原来的构象恢复了。由于上述过程没有细胞内任何其他成分的参与,完全是一种自发的过程,因此,有理由相信此蛋白质正确折叠所需要的所有信息全部存在于它的一级结构之中。在此基础上,Anfinsen提出了蛋白质折叠的热力学假说(thermodynamic hypothesis)。根据此假说,一个蛋白质的天然三维构象对应于在生理条件下其所处的热力学最稳定的状态。热力学稳定性由组成的氨基酸残基之间的相互作用决定,于是蛋白质的三维构象直接由它的一级结构决定。 (二)蛋白质高级结构对高级结构形成的影响 1.二级结构 蛋白质的二级结构由氢键维持。包括α螺旋、β折叠、β转角和无规卷等。α螺旋是一种重复性结构,螺旋中每个α-碳的Φ和Ψ分别为-57o和-47o附近。

蛋白质一级结构与高级结构关系

蛋白质一级结构与高级结构关系 蛋白质分子就是由氨基酸首尾相连而成得共价多肽链,天然蛋白质分子有自己特有得空间结构,称为蛋白质构象。 蛋白质结构得不同组织层次:一级结构指多肽链得氨基酸序列。二级结构就是指多肽链借助氢键排列成特有得α螺旋与β折叠片段。三级结构就是指多肽链借助各种非共价键弯曲、折叠成具有特定走向得紧密球状构象。球状构象给出最低得表面积与体积之比,因而使蛋白质与周围环境得相互作用降到最小。四级结构就是指寡居蛋白质中各亚基之间在空间上得相互关系与结合方式。二、三、四级结构为蛋白质得高级结构。蛋白质得天然折叠结构决定于3个因素:1。与溶剂分子(一般就是水)得相互作用。2。溶剂得PH值与离子组成。3。蛋白质得氨基酸序列。后一个就是最重要得因素。 (一)蛋白质折叠得热力学假说 蛋白质得高级结构由其一级结构决定得学说最初由Christian B、 Anfinsen于1954年提出。在1950年之前,Anfinsen一直从事蛋白质结构方面得研究。在进入美国国立卫生研究所(NIH)以后,继续从事这方面得研究。Anfinsen与两个博士后Michael Sela、 Fred White在研究中发现,使用高浓度得巯基试剂——β- 巯基乙醇(β- mercaptoethanol)可将二硫键还原成自由得巯基,如果再加入尿素,进一步破坏已被还原得核糖核酸酶分子内部得次级键,则该酶将去折叠转变成无任何活性得无规卷曲。对还原得核糖核酸酶得物理性质进行分析得结果清楚地表明了它得确采取得就是无规卷曲得形状。 在成功得到一种去折叠得核糖核酸酶以后,Anfinsen 着手开始研究它得重折叠过程。考虑到被还原得核糖核酸酶要在已被还原得8个Cys残基上重建4对二硫键共有105 种不同得组合,但只有一种就是正确得形式,如果决定蛋白质构象得信息一直存在于氨基酸序列之中,那么,最后重折叠得到得总就是那种正确得形式。否则,重折叠将就是随机得,最后只能得到少量得正确形式。Anfinsen 得重折叠实验还就是比较顺利得,她通过透析得方法除去了导致酶去折叠得尿素与巯基乙醇,再将没有活性得酶转移到其生理缓冲溶液之中,在有氧气得情况下于室温放置,以使巯基能重新氧化成二硫键。经过一段时间以后,发现核糖核酸酶活性得以恢复,这意味着它原来得构象恢复了。由于上述过程没有细胞内任何其她成分得参与,完全就是一种自发得过程,因此,有理由相信此蛋白质正确折叠所需要得所有信息全部存在于它得一级结构之中。在此基础上,Anfinsen提出了蛋白质折叠得热力学假说(thermodynamic hypothesis)。根据此假说,一个蛋白质得天然三维构象对应于在生理条件下其所处得热力学最稳定得状态。热力学稳定性由组成得氨基酸残基之间得相互作用决定,于就是蛋白质得三维构象直接由它得一级结构决定。 (二)蛋白质高级结构对高级结构形成得影响

蛋白质一级结构的测定方法

蛋白质一级结构的测定 1.测定蛋白质分子中多肽链的数目:N-末端和C-末端残基的摩尔数和蛋白质的相对分子质量 2.拆分蛋白质分子的多肽链 非共价相互作用缔合的寡聚蛋白:用变性剂尿素盐酸胍 共价二硫桥:氧化剂或还原剂 3.断开多肽链内的二硫桥 过甲酸氧化法常用试剂过甲酸 巯基化合物还原法:过量的巯基乙醇处理,ph8-9室温,系统中放尿素和盐酸胍,烷基化试剂保护常用试剂β巯基乙醇,巯基乙酸 4.分析每一多肽链的氨基酸组成:完全水解 酸水解:常用hcl,水解后除去 碱水解:用于测定色氨酸含量。很多氨基酸遭到破坏,色氨酸定量回收。 5.鉴定多肽链的N-末端和C-末端 N-末端分析: ①二硝基氟苯DNFB ②丹磺酰氯DNS:强烈荧光,灵敏度高 ③苯异硫氰酸酯PITC:多肽或蛋白质的末端氨基和氨基酸的α氨基一样与PITC反应生成PTC-多肽,在酸性有机溶剂中加热,N-末端的PTC-氨基酸发生环化 ④氨肽酶:肽链外切酶/外肽酶,从多肽链的N-末端逐个向里切。常用亮氨酸氨肽酶(水解以Leu为N-末端的肽链速度为最大) C-末端分析: ①肼解法:蛋白质多肽与无水肼加热发生肼解。反应中除C-末端氨基酸以游离形式存在外,其他氨基酸都转变为相应的氨基酸酰肼化物。肼解中,Gln,Asn,Cys被破坏不易测出,C末端的Arg转变成鸟氨酸 ②还原法:硼氢化锂还原成α-氨基醇 ③羧肽酶法:肽链外切酶,专一地从肽链C末端逐个降解。羧肽酶A能释放除Pro,Arg和Lys之外的所有C-末端残基的肽键,B只能释放精氨酸和赖氨酸,AB的混合物能释放除Pro 外任一C末端残基的肽键。Y可以作用于任何一个C末端残基 6.裂解多肽链成较小的片段:用几种不同的断裂方法将每条多肽样品降解成几套 ①酶裂解法:肽链内切酶。胰蛋白酶,嗜热菌蛋白酶,胃蛋白酶 胰蛋白酶只断裂赖氨酸或精氨酸残基的羧基参与形成的肽键 胰凝乳蛋白酶能断裂赖氨酸、酪氨酸、甘氨酸残基的羧基参与形成的肽键 ②化学裂解法:测定相对分子质量大的蛋白质序列。溴化氰:断裂由Met残基的羧基参加形成的肽键羟胺断裂肽段的分离纯化 7.测定各肽段的氨基酸序列 Edman化学降解法:PITC与多肽链的游离氨基作用,测定任何非封闭的多肽蛋白质序列仪酶降解法:利用外肽酶(氨肽酶和羧肽酶)逐个向里切 质谱法,气质联用法 根据核苷酸序列的推定法 8.重建完整多肽链的一级结构 9.确定半胱氨酸残基之间形成的S-S交联桥的位置 采用胃蛋白酶水解原来的含二硫桥的蛋白质,所得的肽段混合物用对角线电泳进行分离,用茚三酮反应鉴定

蛋白质结构解析

晶体结构解析过程1 1:分子置换法 使用condition:目标蛋白A有同源1蛋白结构B,同源性30%以上。 用到的软件及程序:HKL2000,CCP4,COOT,Phenix,CNS。 解析过程:收集数据(X-RAY)--> hkl2000 处理数据--> 置换前数据处理分子置换(ccp4Molecular Replacement--MR)-->COOT手工修正,氨基酸序列调换-->phenix refine--coot 手工修正phenix refine。。。__拉氏构象图上outlier为0为之,且R-free,R-work达到足够低的值。-->phenix 加水refine(溶剂平滑)。。。(若修正过程中有bias 最好也用CNS修正一下) 2:同晶置换法--硒代蛋白 使用condition:目标蛋白没有同源结构。 用到的软件及程序:HKL2000,CCP4,COOT,Phenix,CNS。 解析过程:收集数据(X-ray 硒代蛋白及母体蛋白)--> hkl2000处理数据-->ccp4 程序包搜索搜索硒信号(gap),相位确定-->搭模--->以硒代数据得到的pdb为模型和母体高分辨数据得到的mtz进行分子置换--> 后面修正过程与分子置换相似。 各步骤介绍: (1)hkl2000:将x-ray 收集的图像编译转化为数字信息,得到的关键文件有.sca和.log ,log文件会给出hkl2000 处理的过程记录,sca文件是最终处理的输出文件。sca文件包含晶体的空间群等信息。带有可以被转化为电子密度图的信息。评价hkl2000处理是否成功的参数有数据完整度,最高分辨率等,一般希望处理出在完整度允许的情况下最高分辨率的数据。 分子置换前处理:ccp4 软件包 a. data reduction,即将sca文件转换为mtz文件。用imported integrated data。 b. cell content analysis 这个是晶体中蛋白聚集体数的分析,通过分析晶体含水量得到一个晶胞内的蛋白分子数。用mtz文件进行。含水量在40%-60%之间时对应得n即为正确值。这个聚集体数会在mr中使用。

蛋白质结构分析方法

蛋白质结构分析方法:X射线晶体衍射分析和核磁共振 x 射线衍射法的分辨率可达到原子的水平,使它可以测定亚基的空间结构、各亚基间的相对拓扑布局,还可清楚的描述配体存在与否对蛋白质的影响。多维核磁共振波谱技术已成为确定蛋白质和核酸等生物分子溶液三维结构的唯一有效手段。NM R技术最大的优点不在于它的分辨率,而在于它能对溶液中和非晶态的蛋白质进行测量。 蛋白质的序列结构测定: 1.到目前为止,最经典的蛋白质的氨基酸序列分析方法是,sarI等人基于Edman降解原理研制的液相蛋白质序列仪,及后来发展的固相和气相的蛋白质序列分析仪。 2.质谱:早期的质谱电离的方式主要是电子轰击电离(EI),它要求样品的挥发性好,一般与气相色谱联用。但使用G C/M S分析,肽的长度受到限制,只能分析小的肽段。近年来,在离子化的技术及仪器方面取得了突破性进展,使得质谱所能测定的分子量的范围大大超出了10k u。因此,软离子化技术、基质辅助的激光解吸/离子化(MALDI)和电喷雾离子化(E SI)显得尤为有前途。通过串联质谱技术(MS/MS)和源后衰减基质辅助的激光解吸/离子化(PSD—MAIDI—MS),人们就可以从质谱分析中获得肽及蛋白质的结构信息。 蛋白质三维结构的研究: 1.X射线单晶衍射分析 2.核磁共振分析 3.蛋白质的二维晶体与三级重构: 蛋白质二维结晶及其电子晶体学的结构分析是目前结构生物学最活跃的领域之一。此法既适用于水溶性蛋白质,也适用于脂溶性膜蛋白的研究。电子晶体学的结构分析源于早期的电子衍射分析。与X射线衍射方法类似,电子衍射数据的实验分析得到的只是结构因子的振幅部分,丢掉了相位信息。但从剑桥MRC分子生物学实验室的Klug和DeRo sier建立了三维重构的方法开始,电子晶体学才真正发展成为一种独立的空间结构的分析方法,并从传统的X射线晶体学中脱胎出来。所谓电镜图像的三维重构是指由样品的一个或多个投影图得到样品中各成分之间的三维关系。这一方法的基本思路是电子显微图像含有振幅和相位的信息,二者可通过数字图像处理的傅立叶变换方法提取出来。蛋白质溶液构想的光谱技术: 紫外-可见差光谱:紫外一可见差光谱也是电子光谱,由电子跃迁产生。而蛋白质在紫外区的光吸收是由于芳香族氨基酸侧链吸收光引起的。可见区的研究则限于蛋白质一蛋白质、酶一辅酶、酶一底物的相互作用等,有时还需引人生色团才能进行。差光谱的产生是基于生色团经受一定的环境变化时,吸收峰发生位移,吸光度和谱带半宽度也有改变。生色团经受的这种环境变化称为微扰作用,变化后和变化前的光谱差称为差光谱。根据差光谱的光谱参数,可以推断这些生色团在大分子中是隐藏的半暴露的还是暴露的。 荧光探针法:荧光光谱法是研究蛋白质分子构象的一种有效方法,它能提供包括激发光谱、发射光谱、斯托克斯位移,荧光强度、总荧光量、量子产率、荧光偏振和荧光寿命等参数,这些参数从各个角度反映了分子的成键和结构情况。通过这些参数的测定,不但可以做一般的定量分析,而且还可以推断蛋白质分子在各种环境下的构象变化,从而阐明蛋白质分子在各种环境下的构象变化,进而阐明蛋白质结构与功能之间的关系。 圆二色谱:圆二色性和旋光色散都可用于测定分子的立体结构。旋光色散利用不对称分子对左、右圆偏振光折射的不同进行结构分析,而圆二色性则利用不对称分子对左、右圆偏振光吸收的不同进行结构分析。在蛋白质分子中,每个氨基酸残基的a碳是不对称碳,再加上主链构象也是不对称结构,因而蛋白质分子具有光学活性。通过圆二色的测定和计算可以了解蛋白质分子在溶液状态下的二级结构。圆二色对构象变化敏感,故它可灵敏的检测一些反应引起的构象变化,特别是用于观测蛋白质的变性是最方便的.

蛋白质一级结构的测定方法

蛋白质一级结构的测定方法 研究蛋白质的一级结构从确定组成蛋白质的单元结构氨基酸算起,已有150年的悠久历史,直到1955年,Sanger首次阐明胰岛素的氨基酸排列顺序,为研究蛋白质的一级结构开辟了道路, 这在分子生物学的发展进程中是一个重要突破。目前关于核酸的一级结构研究,由于Sanger等发明了加减法,可以得到了突飞猛进的发展。对此之下,关于蛋白质的一级结构研究进展不如核酸迅速。但随着Edman液相自动顺序分析仪和固相顺序分析仪以及气相色谱、质谱等方法的相继出现,结构分析的速度也显著加快,至今已完成近千种蛋白质的一级结构分析。目前不仅样品用量减少,而且工作人员也大大减少。当年Sanger分析胰岛素用了整整十年的时间,今天运用自动化仪器,分析一个分子量在10万左右的蛋白质只需要几天,可见新技术的应用和发展对科学发展起的促进作用,蛋白质一级结构测定方法的综述及专著文献较多,这里只扼要加以概述。 蛋白质分子的一级结构测定,概括起来包含多肽链的分离、降解、肽段的分离和顺序分析以及-S-S-定位等。 1.多肽链的分离 在测定一个蛋白质的结构以前,首先必须保证被测蛋白质的纯度,使结果准确可靠。其次要了解它的分子量和亚基数,按照其亚基数将蛋白质分成几个多肽链。 1)肽链的拆开 蛋白质分子多肽链的连接有共价结合和非共价结合两种。要拆开以共价结合的-S-S-连接的多肽链,必须采用的化学处理方法常有: ①过甲酸氧化 用氧化剂过甲酸断裂-S-S-。这个反应一般在0℃下进行2小时左右,两个S就全部能转变成磺酸基,这样被氧化的半胱氨酸称为磺基丙氨酸。 如果蛋白质分子中同时存在半胱胺酸,那么也会被氧化成磺基丙氨酸。此外甲硫氨酸和色氨酸也可被氧化,从而增加分析的复杂性。 ②巯基乙醇还原 利用还原剂巯基乙醇亦可使蛋白质的-S-S-断裂。当高浓度的巯基乙醇在pH8?条件下室温保温几小时后,可以使-S-S-定量还原为桽H。与此同时反应系统中还需要有8摩尔脲或6摩尔盐酸胍使蛋白质变性,多肽链松散成为无规则的构型,此时还原剂就可作用于-S-S-。此反应是可逆的,因此要使反应完全,疏基乙醇的浓度必需在0.1-0.5摩尔。 ③Cleland试剂的还原作用 Cleland′s指出二硫赤苏糖醇(dithioerythriotol)及二硫苏糖醇(dithiothriotol)在氧化还原能力上是比较强的试剂,只要0.01摩尔就能使蛋白质的-S-S-还原,反应基本与疏基乙醇相似,且在许多球蛋白反应中,可以不用变性剂。 Cleland试剂首先与蛋白质-S-S-形成中间物,反应终了,还原剂被氧化形成一个稳定的六环化合物,蛋白质则被还原。 还原蛋白不稳定,SH基极易氧化重新生成-S-S-键。稳定SH基的方法有: (A)烷基化试剂使SH基转变为稳定的硫醚衍生物。

必备蛋白质的结构分析流程教程

https://www.360docs.net/doc/c58546812.html,/html/201009/2396082.html 蛋白质结构预测一般流程见下图: 内容目录: ?相关实验数据 ?序列数据和初步分析 ?搜索序列数据库 ?识别结构域 ?多序列比对 ?比较或同源建模

?二级结构预测 ?折叠的识别 ?折叠分析与二级结构比对 ?序列与结构的比对 举报删除此信息广告 cnlics(站内联系TA) 实验数据 许多实验数据可以辅助结构预测过程,包括: ?二硫键,固定了半胱氨酸的空间位置 ?光谱数据,可以提供蛋白的二级结构内容 ?定位突变研究,可以发现活性或结合位点的残基 ?蛋白酶切割位点,翻译后修饰如磷酸化或糖基化提示了残基必须是暴露的 ?其他 预测时,必须清楚所有的数据。必须时刻考虑:预测与实验结果是否一致?如果不是,就有 必要修改做法。 cnlics(站内联系TA) 蛋白序列数据 对蛋白序列的初步分析有一定价值。例如,如果蛋白是直接来自基因预测,就可能包含多个结构域。更严重的是,可能会包含不太可能是球形或可溶性的区域。此流程图假设你的蛋白是可溶的,可能是一个结构域并不包含非球形结构域。 需要考虑以下方面: ?是跨膜蛋白或者包含跨膜片段吗?有许多方法预测这些片段,包括: o TMAP (EMBL) o PredictProtein (EMBL/Columbia) o TMHMM (CBS, Denmark) o TMpred (Baylor College) o DAS (Stockholm) ?如果包含卷曲(coiled-coils)可以在COILS server 预测coiled coils 或者下载COILS 程序

蛋白质一级结构的测定方法

1.测定蛋白质分子中多肽链的数目:N-末端和C-末端残基的摩尔数和蛋白质的相对分子质量 2.拆分蛋白质分子的多肽链 非共价相互作用缔合的寡聚蛋白:用变性剂尿素盐酸胍 共价二硫桥:氧化剂或还原剂 3.断开多肽链内的二硫桥 过甲酸氧化法常用试剂过甲酸 巯基化合物还原法:过量的巯基乙醇处理,ph8-9室温,系统中放尿素和盐酸胍,烷基化试剂保护常用试剂β巯基乙醇,巯基乙酸 4.分析每一多肽链的氨基酸组成:完全水解 酸水解:常用hcl,水解后除去 碱水解:用于测定色氨酸含量。很多氨基酸遭到破坏,色氨酸定量回收。 5.鉴定多肽链的N-末端和C-末端 N-末端分析: ①二硝基氟苯DNFB ②丹磺酰氯DNS:强烈荧光,灵敏度高 ③苯异硫氰酸酯PITC:多肽或蛋白质的末端氨基和氨基酸的α氨基一样与PITC反应生成PTC-多肽,在酸性有机溶剂中加热,N-末端的PTC-氨基酸发生环化 ④氨肽酶:肽链外切酶/外肽酶,从多肽链的N-末端逐个向里切。常用亮氨酸氨肽酶(水解以Leu为N-末端的肽链速度为最大) C-末端分析: ①肼解法:蛋白质多肽与无水肼加热发生肼解。反应中除C-末端氨基酸以游离形式存在外,其他氨基酸都转变为相应的氨基酸酰肼化物。肼解中,Gln,Asn,Cys被破坏不易测出,C末端的Arg转变成鸟氨酸 ②还原法:硼氢化锂还原成α-氨基醇 ③羧肽酶法:肽链外切酶,专一地从肽链C末端逐个降解。羧肽酶A能释放除Pro,Arg和Lys之外的所有C-末端残基的肽键,B只能释放精氨酸和赖氨酸,AB的混合物能释放除Pro 外任一C末端残基的肽键。Y可以作用于任何一个C末端残基 6.裂解多肽链成较小的片段:用几种不同的断裂方法将每条多肽样品降解成几套 ①酶裂解法:肽链内切酶。胰蛋白酶,嗜热菌蛋白酶,胃蛋白酶 胰蛋白酶只断裂赖氨酸或精氨酸残基的羧基参与形成的肽键 胰凝乳蛋白酶能断裂赖氨酸、酪氨酸、甘氨酸残基的羧基参与形成的肽键 ②化学裂解法:测定相对分子质量大的蛋白质序列。溴化氰:断裂由Met残基的羧基参加形成的肽键羟胺断裂肽段的分离纯化 7.测定各肽段的氨基酸序列 Edman化学降解法:PITC与多肽链的游离氨基作用,测定任何非封闭的多肽蛋白质序列仪酶降解法:利用外肽酶(氨肽酶和羧肽酶)逐个向里切 质谱法,气质联用法 根据核苷酸序列的推定法 8.重建完整多肽链的一级结构 9.确定半胱氨酸残基之间形成的S-S交联桥的位置 采用胃蛋白酶水解原来的含二硫桥的蛋白质,所得的肽段混合物用对角线电泳进行分离,用茚三酮反应鉴定

蛋白质一级结构分析

ProtParam User-provided sequence: 10 20 30 40 50 60 MLKKQEKFYY GGDYNPEQWD ESVWKEDMRL MKKAGVNYVS INIFSWARLQ PDEETYDFST 70 80 90 100 110 120 LDKIMDMLAE NGIGADLATA TAAPPAWLSR KYPDSLPVDK DGARFLPGSR QHYCPNSKDY 130 140 150 160 170 180 ARLAAKLVRK IAERYKNHPA LVMWHVNNEY GCHIAECYCD NCKKAFQTWL KEKYSTIENL 190 200 210 220 230 240 NKSWSTDFWS QRYYEWEEIC LPGKTPTFAN PMQQLDYKAF MDDSLLALYK MERDILKAYT 250 260 270 280 290 300 PDVPVMTNLM GLHKPVDGFH WAKEMDLVTW DAYPDPFDRI PYAQFMAHDL MRSLKKQPFL 310 320 330 340 350 360 LMEQAAGAVN WRAQNAVKTP GQMRLWSYEA AAHGADGIMF FQWRASQGGA EKFHSGMVPH 370 380 390 400 410 420 SGDEESRNFR EVVQLGNELK NLEKVTGSAY AADVAIVFDW KNWWALELDS KPSSLVTYIK 430 440 450 460 470 480 QLLPFYKVLH TRNIGVDFIH PDEAMDRYKV VFAPASYRVT KAFADKVKDY VEKGGYFVSN 490 500 510 520 530 540 FFSGIADEND RVYLGGYPGA YRDILGIYVE EFAPMKKGAV HQIRTGYGDA AIRVWEEKIH 550 560 570 580 590 600 LKGAEALAWF KDGYLAGSPA VTAHHCGKGK AYYIGTQPDE QYLSSLLKDI LQEADVRPAL 610 620 630 640 650 660 DAPRGVEVVV RKNGNEKYLF LLNHTDQVQF VNAGGTYLEL INGDTESETV RLSPRDVKIL QVIEK References and documentation are available. Number of amino acids: 665 Molecular weight: 76089.5

相关文档
最新文档