用多样性增量特征选择技术识别 蛋白质磷酸化位点

用多样性增量特征选择技术识别 蛋白质磷酸化位点
用多样性增量特征选择技术识别 蛋白质磷酸化位点

Hans Journal of Computational Biology 计算生物学, 2018, 8(1), 24-32

Published Online March 2018 in Hans. https://www.360docs.net/doc/7813334379.html,/journal/hjcb

https://https://www.360docs.net/doc/7813334379.html,/10.12677/hjcb.2018.81004

Identification of Protein Phosphorylation

Sites by Diversity Increment Feature

Selection Technique

Shisai Hu, Zhen Liang, Yuxiang Chen, Ying Zhang*, Jun Lv*

College of Science, Inner Mongolia University of Technology, Hohhot Inner Mongolia

Received: Apr. 25th, 2018; accepted: May 15th, 2018; published: May 22nd, 2018

Abstract

Phosphorylation is one of the most important protein post-translational modifications and plays important roles in numerous biological processes by significantly affecting proteins’ structure and dynamics. The development of computational biological methods for the accurate identification of phosphorylation sites helps to our understanding of key signal transduction mechanisms. In this paper, a kinase independent phosphorylation site identification model was presented, called FSID_PhSite. The model is featured by component of k-spaced amino acid pairs and the position conservation of residues surrounding the phosphorylation sites. Applying diversity incremental feature selection technique to feature selection and inputting the selected features into the sup-port vector machine algorithm for recognition, when the ratio of positive and negative samples is 1:1, on independent testing dataset validation, the accuracy of identification for serine, threonine and tyrosine sites is 84.34%, 82.32% and 68.89%, respectively. The results were superior to the existing kinase independent phosphorylation sites identification model.

Keywords

Protein Phosphorylation Site, Feature Selection Based on Increment of Diversity, Support Vector Machine

用多样性增量特征选择技术识别

蛋白质磷酸化位点

胡世赛,梁珍,陈宇翔,张颖*,吕军*

内蒙古工业大学理学院,内蒙古呼和浩特

*通讯作者。

胡世赛 等

收稿日期:2018年4月25日;录用日期:2018年5月15日;发布日期:2018年5月22日

磷酸化是最重要的蛋白质翻译后修饰之一,在许多细胞过程中扮演重要角色。发展磷酸化位点精确识别的计算生物学方法,有助于对磷酸化信号转导机制的理解。本文给出一种激酶无关的磷酸化位点识别模型,称为FSID_PhSite 。模型以k 间隔氨基酸对组分和位置保守氨基酸组分为特征,应用多样性增量特征选择技术进行特征筛选,将选出的特征输入到支持向量机算法进行识别。在正负样本数之比为1:1的情形下,对磷酸化丝氨酸、苏氨酸和酪氨酸在独立测试集检验,识别精度分别达到84.34%、82.32%和68.89%。结果优于现有的激酶无关磷酸化位点识别模型。

关键词

蛋白质磷酸化位点,多样性增量特征选择,支持向量机

Copyright ? 2018 by authors and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY). https://www.360docs.net/doc/7813334379.html,/licenses/by/4.0/

1. 引言

磷酸化是最常见的真核生物蛋白质翻译后修饰之一,是一个能量依赖的化学过程。在广泛的细胞过程中,磷酸化参与了转录调控、DNA 修复、代谢、免疫反应、环境应激反应和细胞运动等。磷酸化过程是在特异的磷酸激酶的催化下,高能磷酸盐供体ATP/GTP 等的末端磷酸基团加到特异蛋白链的特异受体氨基酸分子底物上,特异氨基酸的磷酸化改变了这一蛋白的酶活性。一条蛋白质链的磷酸化一般只发生在丝氨酸(serine, S),苏氨酸(threonine, T)或酪氨酸(tyrosine, Y)这三个残基上。约30%~50%的真核蛋白质要经历磷酸化过程[1]。磷酸化/去磷酸化在不同细胞组织存在的广泛性,以及它与疾病的密切相关性,使得蛋白质磷酸化问题成为分子生物学研究的重要课题。

近年来,随着实验技术的不断提升,蛋白质翻译后修饰位点数据不断扩充,极大地推动了蛋白质翻译后修饰的研究进展。然而实验方法往往费时费力,成本较高,因此大大推动了高效、精准预测翻译后修饰位点的计算方法的发展。对磷酸化位点预测的计算生物学模型大体可分为三类,一是激酶特异模型[2] [3] [4] [5],二是物种或组织特异模型[6] [7] [8],三是物种和激酶无关的模型[9] [10] [11] [12] [13]。特征信息来源一般是,底物序列片段的残基位置保守性,给定窗口残基组分或关联组分,进化保守性等。最近,Audagnotto 和Dal Peraro [14]对蛋白质翻译后修饰的生物信息学预测工具进行了一个综述,给出了这些模型的Web 服务器链接,方便研究者查询。由于一个蛋白质中,被修饰的位点是少数,与非修饰位点数相比相差悬殊,因此多数模型的预测精度均是在设定正负集样本数之比为1:1情形下给出的。现有模型普遍存在输入特征维数高的缺点,进而致使模型出现严重的过学习情况。尤其是物种和激酶无关的模型,输入特征偏多且预测精度偏低[9] [10] [11] [12] [13]。

随着被研究问题的复杂性的增加,特征向量的维数越来越高,以期获得更高的预测精度。但是,高维特征将导致对样本的过拟合进而导致结果的泛化能力降低。因此,应用特征选择技术进行数据分析和特征优化越来越受到人们的关注。Drotár 等[15]在8个二分类的生物医学数据集上,比较了10个最先进

Open Access

胡世赛等

的特征选择方法,发现基于熵的特征选择方法(information gain, IG) [16]具有最高的稳定性,而最小冗余最大相关(Minimal Redundancy Maximal Relevance, mRMR)方法[17]具有最高的预测精度。2016年,Zou 等提出称为最大相关最大距离(Max-Relevance-Max-Distance, MRMD)的特征选择方法[18]。在2017年,我们提出了一个新的特征选择方法——多样性增量特征选择(Feature Selection based on Increment of Di-versity, FSID) [19]。我们将该方法应用于蛋白质柔性/刚性分类预测[19]问题中,发现FSID方法具有高效的特征降维能力,优于IG和MRMD方法。

蛋白质磷酸化位点识别是一个典型的高维特征问题。因此,采用特征选择技术实现特征降维,是实现精确识别磷酸化位点的可行路线之一。

在本文中,我们提出一个新的与激酶无关的磷酸化位点识别模型FSID_PhSite。在一个较大的蛋白质磷酸化位点注释数据集上,我们以k间隔氨基酸对组分和磷酸化底物片段位置保守残基组分为特征源,采用FSID方法进行特征选择,并结合支持向量机算法进行识别,获得了较高的识别精度。

2. 材料与方法

2.1. 数据集

本文数据集分为两部分:训练集和独立检验集。两部分数据均来自Zhao等文献[12]的补充材料。其中训练集中的正样本,即实验上确定的磷酸化位点,来源于Phospho.ELM数据库8.1版本(2008年8月12日发布) [20]。训练集包括5725个蛋白质,其中磷酸化丝氨酸(serine, S)位点12373个、磷酸化苏氨酸(threonine, T)位点2525个,磷酸化酪氨酸(tyrosine, Y)位点1826个,这些位点组成训练集的正集。训练集中的负样本也来源于这5725个蛋白质。一个蛋白质序列中除磷酸化位点外,其余与任一磷酸化位点间距在50个氨基酸以上的S/T/Y残基,均被认为是非磷酸化位点,该负样本选取方案也被Biswas等[11]所采用。由于非磷酸化位点数远大于磷酸化位点数,Zhao等[12]采取分别选择了十组与磷酸化位点等量的非磷酸化位点作为负集。也即,一个训练正集对十个等量的训练负集。

为了公平地比较不同预测模型的性能,Zhao等[12]还收集到一个新的独立检验集。该独立检验集取自Phospho.ELM数据库2008年8月12日之后的新增数据。经去冗余处理后,将独立检验集中的蛋白质序列相似性降低到40%以下。最后,在独立检验集中包含837个蛋白质,其中磷酸化丝氨酸位点1450个、磷酸化苏氨酸位点835个、磷酸化酪氨酸位点286个。独立检验集中负集的提取方式与训练集中负集的提取方式一致。

2.2. 特征提取方法

2.2.1. k间隔氨基酸对组分

以S/T/Y位点为中心两侧各截取13个残基,得到由27个残基组成的信息富含片段。其中正集片段第14位为磷酸化S/T/Y残基,而负集片段第14位为非磷酸化S/T/Y残基。对于处于蛋白质N端或C端的S/T/Y残基,当两侧不足13个残基时,用符号“O”补齐。显然,我们期望这个由27个残基组成片段,能够成为识别中心残基是否被磷酸化的充足信息源。

k间隔氨基酸对组分,反映出待测位点附近一对残基间的关联特征,随着k值的由小到大改变,分别表现出近程到远程的关联。k间隔氨基酸对组分是对一个蛋白质序列较充分的表示,尤其对于短的片段。k间隔氨基酸对组分的序列信息编码方案,已成功用于多个蛋白质功能位点识别模型中,诸如磷酸化位点预测[12],柔性位点预测[19]等等。

对于每个k的取值(本文取k = 0, 1, 2, 3, 4, 5;k是一对氨基酸中间间隔的残基数),由长度为27的残基片段,可提取441种(AA, AC, AD, …, OO)氨基酸对组分。显然,k值越大,所考虑的关联情形就越多,对序列片段的表示也就越充分,但随之而来的特征维数也大幅增高。本文中,我们考虑取k值最大到5

胡世赛 等

时,特征向量的总维数达到2646维。不难推断,这2646个特征中的绝大部分应该是类别无关的和冗余的。如果将这些特征均输入分类器用于分类,一来将降低分类器的灵敏度,二来将出现严重的过学习现象。因此,我们需应用特征选择技术对这些特征进行筛选,从中选出少数类别相关的关键特征。 2.2.2. 位置保守的氨基酸组分

k 间隔氨基酸对组分经特征筛选后,必然丢失部分信息,选出少数特征已不再是序列片段的充分表示。为了能够尽可能地弥补丢失信息,我们进一步提取磷酸化底物片段的残基保守性特征作为补充。以S/T/Y 所在位置为0点,上游选取?5:?1位置,下游选取+1:+5位置,共10个位点。以每个位点上的氨基酸组分为特征,构建21 × 10 = 210维特征向量。显然,这些特征中仍存在大量与类别无关的特征,采用同样的特征选择方法对这些特征进行筛选。将选出的位置保守氨基酸组分特征,加入到选出的k 间隔氨基酸对组分特征中,共同作为识别算法的输入。

2.3. 特征选择方法

特征选择的思想是在尽量少损失精度的前提下,尽可能减少特征数。这有点类似于计算机科学中的文件压缩,压缩比越大,失真率越高,好的压缩算法是最小失真和最大压缩的最佳平衡。近些年,众多新的特征选择技术得以发展[15] [16] [17] [18]。最近,我们研究组发展了一种新的特征选择技术,称为多样性增量特征选择(feature selection based on incremental of diversity, FSID) [19]。FSID 方法是我们在研究蛋白质柔性/刚性分类问题时被提出的[19]。

对于一个两类分类问题C i (I = 1, 2),特征X 出现在类别C 1的频次记为n ,除特征X 以外的其它特征出现在类别C 1的频次记为n ;类似地,特征X 出现在类别C 2的频次记为m ,其它特征出现在类别C 2的频次记为m 。则特征X 在C 1类别中的多样性量定义为

()()()()()1,C ln ln ln D X n n n n n n n n =++?? (1)

同样地,特征X 在C 2类别中的多样性量D (X , C 2),以及在混合系统C 1 + C 2中的多样性量D (X , C 1 + C 2)可以用同样的方式分别定义为

()()()()()2,C ln ln ln D X m m m m m m m m =++?? (2)

()()()()()()()

12,C C ln ln ln D X n m n m n m n m n m n m n m n m +=++++++?++?++ (3)

特征X 在C 1和C 2类别之间的多样性增量(increment of diversity, ID)定义为

()()()()1212,C C ,C ,C ID X D X D X D X =+?? (4)

容易证明,ID (X )满足相似性度量的两个基本条件,非负性和对称性。由多样性增量的定义看出,当某个特征X 在C 1和C 2两个类别中出现的频次差异越大时,

ID (X )的值越大,相反,频次差异越小时,ID (X )的值越小。如果特征X 是类别无关的,那么一般特征X 在两个类别中出现的频次应几乎无差别,此时ID(X )的值接近0。因此,ID (X )就可作为特征X 是否与类别相关的度量,或者,ID (X )是针对特征X 对两个类别C 1和C 2的相似度的度量。这就是说,如果ID (X ) > ID (Y ),表明特征X 与类别相关性要强于特征Y 。当这种类别相关性的强度达到我们的预期(ID 0)时,即当ID (X ) > ID 0,特征X 被选择,ID 0为特征选择阈值。这个特征选择方案被我们称为多样性增量特征选择技术(FSID)。

胡世赛 等

2.4. 分类识别算法

本文分类识别算法采用支持向量机。支持向量机是一种二类分类器,其基本型定义为特征空间上的分类超平面与支持向量间隔最大的线性分类器,采用核函数技术,支持向量机可将原特征空间的非线性分类问题,隐映射到高维空间转换为线性可分问题。本文支持向量机算法的实现采用R 语言“e1071”包中的svm [21]函数完成。核函数采用径向核函数,参数c 和γ分别采用默认值。

2.5. 分类识别性能评价指标

分类性能采用如下四个指标度量,分别是敏感性(Sensitivity, Sn),特异性(Specificity, Sp),总精度(Accuracy, ACC)和马氏相关系数(Matthews correlation coefficient, MCC)。这些量定义如下

TP TN TP TN

Sn

,Sp ,ACC ,TP FN TN FP TP FN TN FP

MCC +===+++++=

(5)

这里分别为TP 表示真阳性(真实磷酸化位点被预测为磷酸化位点的数目),TN 表示真阴性(真实非磷酸化位点被预测为非磷酸化位点的数目),FP 表示假阳性(真实非磷酸化位点被预测为磷酸化位点的数目),FN 表示假阴性(真实磷酸化位点被预测为非磷酸化位点的数目)。

上面四个分类性能评价指标分别表明了一个预报器的四个不同方面的性能。Sn 是在全体正样本中能够被正确预测为正样本的频率,它用来衡量一个预报器识别正样本的能力。类似地,Sp 是用来衡量一个预报器识别负样本的能力。ACC 测度正确识别全部样本的能力。MCC 是预测性能的一个最佳平衡测度。MCC 的取值范围是[?1, +1]。MCC = 0表明预报器实际执行了一个随机猜测,也即它的预测结果与样本的真实分类标签不相关。MCC = ±1表明预报器是完美的。同时给出一个预报器的四个性能指标,可以较全面地反映出预报器的输出性能。

3. 结果与讨论

3.1. FSID 特征选择结果

所有的特征选择过程均在训练集上完成。一个训练正集分别对十个等量的训练负集,组成10组训练集。如果某个特征在10组训练集上所得ID 值均大于阈值ID 0,则该特征被选出,被选出的特征输入到SVM 中进行磷酸化/非磷酸化位点的分类识别。阈值ID 0由识别总精度最大化定出。

经上述操作后,对于k 间隔氨基酸对组分特征,分别选出用于识别丝氨酸的特征72个,识别苏氨酸的特征14个,识别酪氨酸的特征14个。对于位置保守氨基酸组分特征,分别选出用于识别丝氨酸的特征34个,识别苏氨酸的特征27个,识别酪氨酸的特征26个。这样,最后得到磷酸化丝氨酸的识别特征共72 + 34 = 106个,苏氨酸的识别特征共14 + 27 = 41个,酪氨酸的识别特征共14 + 26 = 40个。表1给出了三类磷酸化残基对应选出的位置保守氨基酸组分特征。

由表1可见,磷酸化丝氨酸位点附近的位置保守片段为RXR[RS]DS[PSD][ES][ES]SS ,磷酸化苏氨酸位点附近的位置保守片段为R[CS]R[PS]XTP[PT]TTP ,磷酸化酪氨酸位点附近的位置保守片段为XD[DE][DP]DY[EY]Y[PVY]YY 。

这三个位置保守片段有一个显著的共同特点:磷酸化丝氨酸位点的紧邻下游连续保守地出现多个丝氨酸,磷酸化苏氨酸位点的紧邻下游连续保守地出现多个苏氨酸,磷酸化酪氨酸位点的紧邻下游也连续保守地出现多个酪氨酸。据此我们推测,这可能是磷酸化过程的一个有效的容错机制。也即,每个磷酸

胡世赛等Table 1. Features of the position conservation selected by the FSID method

表1. 由FSID方法选择的位点保守性特征

位点?5 ?4 ?3 ?2 ?1 1 2 3 4 5

保守氨基酸*丝氨酸

R R R D P E E S S

S S S O O O

L D L S

H F V

K L

L

N

A

C

T

苏氨酸

R C R P P P T T P

S S C T O O O

G O W T

K L L

L F

A

T

酪氨酸

D D D D

E Y P Y Y

L E P Y O V O O

I K Y I

L P O L

L

*注:加粗显示的为磷酸化位点保守性氨基酸残基,其他为非磷酸化位点保守性氨基酸残基。

化位点的紧邻下游均会出现同一种氨基酸,作为替补磷酸化位点,在特异的磷酸激酶的催化下,高能磷酸盐供体ATP/GTP的末端磷酸基团一旦没有及时识别需要磷酸化的特异氨基酸,那么其后的相同氨基酸则会代替特异氨基酸进行磷酸化过程。

3.2. FSID_PhSite模型的识别结果

在独立测试集上,FSID_PhSite模型对丝氨酸、苏氨酸和酪氨酸的10组检验结果的平均值分别列于表2、表3和表4中。为了比较不同模型的识别性能,我们同时列出了其他4个最好的激酶无关模型在同样测试集上的识别结果。这四个模型的结果均取值文献[12]。

由表2可见,我们的模型FSID_PhSite对磷酸化丝氨酸位点的识别性能分别为,Sn = 73.45%、Sp = 95.21%、ACC = 84.34%和MCC = 0.704。比较其他4个模型,发现FSID_PhSite模型具有最高的识别总精度、特异性和马氏相关系数,总精度高出次优模型CKSAAP_PhSite [12]约6个百分点。敏感性最高的模型是DISPHOS [10]。

胡世赛等

Table 2. Comparing the performance of different models in terms of serine (S) site identification on the independent dataset 表2.不同模型在独立检验集上对丝氨酸的识别性能比较

Models ACC (%) Sn (%) Sp (%) MCC

NetPhos [9]64.91 78.90 55.64 0.343

DISPHOS [10]70.10 81.03 62.86 0.432

PPRED [11]62.87 72.62 56.42 0.286 CKSAAP_PhSite [12]78.59 79.45 78.03 0.566 FSID_PhSite 84.34 73.45 95.21 0.704 注:NetPhos: artificial neural networks method for predicts phosphorylation sites; DISPHOS: disorder-enhanced phosphorylation predictor; PPRED: phosphorylation predictor; CKSAAP_PhSite: the composition of k-spaced amino acid apirs for prediction of protein phosphorylation sites;

FSID_PhSite: feature selection based on increment of diversity for prediction of protein phosphorylation sites.

Table 3. Comparing the performance of different models in terms of threonine (T) site identification on the independent da-taset

表3. 不同模型在独立检验集上对苏氨酸的识别性能比较

Models ACC (%) Sn (%) Sp (%) MCC

NetPhos [9]64.70 47.78 74.75 0.231

DISPHOS [10]71.93 70.06 73.04 0.421

PPRED [11]62.12 48.26 70.34 0.187 CKSAAP_PhSite [12]78.98 79.16 78.88 0.567 FSID_PhSite 82.32 65.97 98.66 0.684 Table https://www.360docs.net/doc/7813334379.html,paring the performance of different models in terms of tyrosine (Y) site identification on the independent data-set

表4. 不同模型在独立检验集上对酪氨酸的识别性能比较

Models ACC (%) Sn (%) Sp (%) MCC

NetPhos [9]59.92 45.80 69.30 0.154

DISPHOS [10]66.62 55.24 74.19 0.298

PPRED [11]56.42 43.01 65.35 0.084 CKSAAP_PhSite [12]68.58 52.10 79.53 0.329 FSID_PhSite 68.89 47.18 90.59 0.420 由表3可见,我们的模型FSID_PhSite对磷酸化苏氨酸位点识别的敏感性为65.97%、特异性为98.66%、总精度为82.32%和马氏相关系数为0.684。除敏感性外,其他性能也显著优于其他模型。

由表4可见,我们的模型FSID_PhSite对磷酸化酪氨酸位点识别的敏感性为47.18%、特异性为90.59%和总精度为68.89%和马氏相关系数为0.420。比较其他模型,酪氨酸位点的识别结果类似于丝氨酸和苏氨酸。

由表2、表3和表4我们还可以发现一个显著的特点,就是FSID_PhSite模型的特异性值都很高,三类磷酸化位点的特异性值均超过90%。这表明FSID_PhSite模型对非磷酸化位点的识别准确度很高,这是其他四个模型均不具备的。由于非磷酸化位点数远大于磷酸化位点数,因此高特异性模型在推广性方面显然具备明显的优势。

胡世赛等4. 总结

我们提出一种精确的激酶无关磷酸化位点识别模型FSID_PhSite,模型的主要特点是采用FSID方法进行高效特征选择,在独立测试集上的检验结果表明,FSID_PhSite模型在磷酸化位点识别问题中具有优越的性能。FSID_PhSite模型发现了磷酸化过程的一个可能的容错机制,并且对非磷酸化位点的识别具有极高的准确度。

致谢

感谢内蒙古自治区自然科学基金资助项目(批准号:2015MS0331和2016MS0306)对本论文的支持。

参考文献

[1]Pinna, L.A. and Ruzzene, M. (1996) How do Protein Kinases Recognize Their Substrates? Biochimica et Biophysica

Acta, 1314, 191-225. https://https://www.360docs.net/doc/7813334379.html,/10.1016/S0167-4889(96)00083-3

[2]Wong, Y.H., Lee, T.Y., Liang, H.K., Huang, C.M., Wang, T.Y., Yang, Y.H., Chu, C.H., Huang, H.D., Ko, M.T. and

Hwang, J.K. (2007) KinasePhos 2.0: A Web Server for Identifying Protein Kinase Specific Phosphorylation Sites Based on Sequences and Coupling Patterns. Nucleic Acids Research, 35, W588-W594.

https://https://www.360docs.net/doc/7813334379.html,/10.1093/nar/gkm322

[3]张颖, 罗辽复, 吕军. 使用多样性增量预测磷酸化位点[J]. 内蒙古大学学报, 2008, 39(1): 34-39.

[4]Xue, Y., Ren, J., Gao, X., Jin, C., Wen, L. and Yao, X. (2008) GPS 2.0, a Tool to Predict Kinase-Specific Phosphory-

lation Sites in Hierarchy. Molecular and Cellular Proteomics, 7, 1598-1608.

https://https://www.360docs.net/doc/7813334379.html,/10.1074/mcp.M700574-MCP200

[5]白海燕, 吕军, 张颖, 等. 蛋白质磷酸化位点的识别[J]. 内蒙古工业大学学报, 2011, 30(2): 108-115.

[6]Trost, B., Kusalik, A. and Napper, S. (2016) Computational Analysis of the Predicted Evolutionary Conservation of

Human Phosphorylation Sites. PLoS One, 11, e0152809. https://https://www.360docs.net/doc/7813334379.html,/10.1371/journal.pone.0152809

[7]Karabulut, N.P. and Frishman, D. (2016) Sequence- and Structure-Based Analysis of Tissue-Specific Phosphorylation

Sites. PLoS One, 11, e0157896. https://https://www.360docs.net/doc/7813334379.html,/10.1371/journal.pone.0157896

[8]Zhao, Y.W., Lai, H.Y., Tang, H., Chen, W. and Lin, H. (2016) Prediction of Phosphothreonine Sites in Human Pro-

teins by Fusing Different Features. Scientific Reports, 6, 34817. https://https://www.360docs.net/doc/7813334379.html,/10.1038/srep34817

[9]Blom, N., Gammetltoft, S. and Brunak, S. (1999) Sequence and Structure-Based Prediction of Eukaryotic Protein

Phosphorylation Sites. Journal of Molecular Biology, 294, 1351-1362. https://https://www.360docs.net/doc/7813334379.html,/10.1006/jmbi.1999.3310 [10]Lakoucheva, L., Radivojac, P., Brown, C., et al. (2004) The Importance of Intrinsic Disorder for Protein Phosphoryla-

tion. Nucleic Acids Research, 32, 1037. https://https://www.360docs.net/doc/7813334379.html,/10.1093/nar/gkh253

[11]Biswas, A.K., Noman, N. and Sikder, A.R. (2010) Machine Learning Approach to Predict Protein Phosphorylation

Sites by Incorporating Evolutionary Information. BMC Bioinformatics, 11, 273.

https://https://www.360docs.net/doc/7813334379.html,/10.1186/1471-2105-11-273

[12]Zhao, X., Zhang, W., Xu, X., Ma, Z. and Yin, M. (2012) Prediction of Protein Phosphorylation Sites by Using the

Composition of k-Spaced Amino Acid Pairs. PLoS One, 7, e46302. https://https://www.360docs.net/doc/7813334379.html,/10.1371/journal.pone.0046302 [13]Chaudhuri, R. and Yang, J.Y. (2017) Cross-Species PTM Mapping from Phosphoproteomic Data. Methods in Molecu-

lar Biology, 1558, 459-469. https://https://www.360docs.net/doc/7813334379.html,/10.1007/978-1-4939-6783-4_22

[14]Audagnotto, M. and Dal Peraro, M. (2017) Protein Post-Translational Modifications: In Silico Prediction Tools and

Molecular Modeling. Computational and Structural Biotechnology Journal, 15, 307-319.

https://https://www.360docs.net/doc/7813334379.html,/10.1016/j.csbj.2017.03.004

[15]Drotár, P., Gazda, J. and Smékal, Z. (2015) An Experimental Comparison of Feature Selection Methods on Two-Class

Biomedical Datasets. Computers in Biology and Medicine, 66, 1-10.

https://https://www.360docs.net/doc/7813334379.html,/10.1016/https://www.360docs.net/doc/7813334379.html,pbiomed.2015.08.010

[16]Yu, L. and Liu, H. (2003) Feature Selection for High-Dimensional Data: A Fast Correlation-Based Filter Solution. In:

Fawcett, T. and Mishra, N., Eds., Proceedings of the Twentieth International Conference on International Conference on Machine Learning, The AAAI Press, Palo Alto, 856-863.

[17]Peng, H., Long, F. and Ding, C. (2005) Feature Selection Based on Mutual Information: Criteria of Max-Dependency,

Max-Relevance, and Min-Redundancy. IEEE Transactions on Pattern Analysis and Machine Intelligence, 27, 1226-1238.https://https://www.360docs.net/doc/7813334379.html,/10.1109/TPAMI.2005.159

胡世赛等

[18]Zou, Q., Zeng, J., Cao, L. and Ji, R. (2016) A Novel Features Ranking Metric with Application to Scalable Visual and

Bioinformatics Data Classification. Neurocomputing, 173, 346-354.https://https://www.360docs.net/doc/7813334379.html,/10.1016/j.neucom.2014.12.123

[19]Yang, S.Q., Hu, S.S., Zhang, Y. and Lv, J. (2017) Application of Feature Selection Technology Based on Incremental

of Diversity in Prediction of Flexible regions from Protein Sequences. Letters in Organic Chemistry, 14, 621-624.

https://https://www.360docs.net/doc/7813334379.html,/10.2174/1570178614666170221145333

[20]Diella, F., Cameron, S., Gemünd, C., Linding, R., Via, A., Kuster, B., Sicheritz-Pontén, T., Blom, N. and Gibson, T.J.

(2004) Phospho.ELM: A Database of Experimentally Verified Phosphorylation Sites in Eukaryotic Proteins. BMC

Bioinformatics, 5, 79.https://https://www.360docs.net/doc/7813334379.html,/10.1186/1471-2105-5-79

[21]Chang, C.C. and Lin, C.J. (2011) LIBSVM: A Library for Support Vector Machines. ACM Transactions on Intelligent

Systems and Technology, 2, 1-27.https://https://www.360docs.net/doc/7813334379.html,/10.1145/1961189.1961199

1. 打开知网页面https://www.360docs.net/doc/7813334379.html,/kns/brief/result.aspx?dbPrefix=WWJD

下拉列表框选择:[ISSN],输入期刊ISSN:2164-5426,即可查询

2. 打开知网首页https://www.360docs.net/doc/7813334379.html,/

左侧“国际文献总库”进入,输入文章标题,即可查询

投稿请点击:https://www.360docs.net/doc/7813334379.html,/Submission.aspx

期刊邮箱:hjcb@https://www.360docs.net/doc/7813334379.html,

磷酸化是最重要的蛋白质翻译后修饰之一, 白质磷酸化和去磷酸化为...

摘要 磷酸化是最重要的蛋白质翻译后修饰之一,蛋白质磷酸化和去磷酸化为真核细胞提供了调节机制。随着高通量鉴定磷酸化蛋白质技术的发展,尤其是质谱技术在蛋白质组学中的应用,磷酸化修饰数据不断积累,从现有数据中挖掘规律从而对未知蛋白质进行磷酸化修饰位点预测的条件日益成熟。将计算方法引入磷酸化蛋白质组学的研究中,将有利于发现新的磷酸化修饰规律并为生物学实验提供验证信息,从而推动磷酸化蛋白质组学的发展。 计算智能领域的方法可以很好地应用于位点预测问题。但对于生物信息学来说,除了给出较为准确的预测结果外,还需要给出对判断结果易于理解的解释才能够增加预测方法的可信度。规则抽取不但可以提供合理的解释来指导生物学实验,而且可以从现有数据中发现新的具有生物学意义的磷酸化修饰规律为磷酸化蛋白质的进一步研究提供有价值的参考信息。 本文深入分析了磷酸化修饰位点数据的特点,采用支持向量机分类方法试验和比较了多种特征构造提取、特征选择和分类方法的有效性;提出用AdaBoost 方法对筛选后的氨基酸性质和邻近序列位置进行特征选择并进行分类器训练,形成了新的磷酸化位点预测算法AproPhos,该算法在特异性高于已有预测算法(约2个百分点)的基础上,大大提高了预测的灵敏度(约10个百分点)。同时设计了一种新的基于AdaBoost方法的规则抽取方法,可以给出可理解的修饰位点邻近序列上氨基酸性质分布规律,并对分类结果进行解释。AproPhos及其规则抽取算法扩展了磷酸化位点预测方法在实际中的应用范围,既可以用于提供充分信息的位点预测,又可以用来提高磷酸化蛋白质质谱鉴定效率。 最后本文提出了一种利用串联质谱同位素信息进行分子式预测的算法和系统FFP(Fragment ion Formula Prediction),无论从计算效率上还是预测精度上较以前的方法都有了很大的提高。使分子式预测可以广泛用于质谱的预处理和蛋白质(包括磷酸化蛋白质)的鉴定,提高鉴定效率。 关键词:磷酸化,位点预测,规则抽取,SVM,AdaBoost

蛋白质修饰位点预测详解

蛋白质修饰位点预测详 解 公司标准化编码 [QQX96QT-XQQB89Q8-NQQJ6Q8-MQM9N]

蛋白质修饰位点分析目录

(特别提示:ctrl+单击目录下的标题链接,可以跟踪标题;ctrl+单击标题后的图标 可以返回目录) 实验目的 找出“人类connexin43”蛋白质上面的所有可能磷酸化位点,并说明为什么(注释) 找出“人类血红蛋白”上面的糖基化位点,注释结果 实验平台 uniprot数据库: (查看蛋白的修饰情况) 预测未知蛋白磷酸化位点 DISPHOS: PhosphoSitePlus:

预测未知蛋白的糖基化修饰位点 N型糖基化位点预测: O型糖基化位点预测: 实验过程 一、“人类connexin43”蛋白质磷酸化位点修饰 1、“人类connexin43”蛋白质序列下载 蛋白序列: 2、uniprot数据库查看蛋白磷酸化位点 网站链接: 3、在线软件预测指定蛋白磷酸化位点 (1)DISPHOS 预测未知蛋白磷酸化位点 网站链接: 开始预测 结果

DISPHOS由蛋白序列预测蛋白磷酸修饰位点,总共有37个丝氨酸修饰位点,13个苏氨酸修饰位点,16个酪氨酸修饰位点。但是根据打分,只有8个丝氨酸修饰位点可能存在。 (2)PhosphoSitePlus预测指定蛋白磷酸化位点 网站链接: 开始预测 结果 筛选参考文献来源多于5篇的磷酸化修饰位点,丙氨酸磷酸化修饰位点数目为1、丝氨酸为17、苏氨酸数目为1、酪氨酸数目为7。 4、“人类connexin43”蛋白质磷酸修饰结论 在线数据库查询和在线软件预测结果基本一致,“人类connexin43”蛋白质磷酸位点数量相对一般蛋白质较多,且丝氨酸磷酸修饰位点最多。“人类connexin43”蛋白质极有可能是一种活性较高的蛋白质,与机体的生物活性显着相关。 通过各种文献阅读和网络筛选发现connexin43蛋白质是一种哺乳动物连接蛋白,是主要的细胞缝隙连接蛋白,其表达的异常与多种疾病的发生有关。 二、“人类血红蛋白”糖基化位点修饰 Ncbi下载人类血红蛋白的蛋白序列保存为:

磷酸化蛋白的富集

TiO2法磷酸化富集 试验:pH值对TiO2富集磷酸化蛋白的影响 共5个样品,各400ug蛋白(酶解之前),每个样品用1mg TiO2,共用5mg。流程: 1.TiO2 Beads 活化 ①向10mg TiO2 Beads中加入1000 ul Elute buffer 2,震荡20min,8200×g,2min,离心,弃上清; ②更换wash buffer 1 1000ul,第一遍摇晃两次,弃上清;第二遍,震荡20min,弃上清; ③更换Loading buffer 1000ul,2遍震荡30min,最后TiO2 Beads保存在Loading buffer中。 2.酶解后的肽段溶液中加入TFA酸化,使TFA终浓度为0.1%—0.5%,离心浓缩抽干,之后重新用Loading buffer溶解(体积控制在400ul左右)。 3.每400ug蛋白用1mg TiO2 Beads 富集,将1mg TiO2 加入到一个样品中,室温旋转30min,转速1100转/分。 4.将孵育好的肽段溶液加入脱盐柱中,8200×g,2min,收集为Flow Through。 5.再向脱盐柱中加入200ul wash buffer 1,8200×g,2min,,重复3次,收集600ul。 6.再向脱盐柱中加入200ul wash buffer 2,8200×g,2min,,重复3次,收集600ul。 4、5、6合并到一起,为Flow Through。 7.再向脱盐柱中加入200ul Elute buffer 1,8200×g,2min,,重复2次,收集400ul,为elute1;再加入200ul Elute buffer 2,8200×g,2min,收集200ul,为elute 2;合并elute 1和elute 2,总共600ul磷酸化多肽。

蛋白质磷酸化概述

蛋白质磷酸化概述 蛋白质磷酸化是敏感而可逆地调节蛋白质功能的一种最常见和最重要的机制,是调节细胞增值的基础。很多多肽生长因子(血小板来源的生长因子和表皮生长因子)和细胞因子(白细胞介素-2、集落刺激因子-2和γ-干扰素)在与其受体结合后均激发磷酸化作用,而这些被诱导的磷酸化反过来激活细胞质内的蛋白激酶如raf、MEK和MAP。此外,在所以有核生物中,细胞周期中G1/S期和G2/M期的转换均受依赖细胞周期蛋白的蛋白激酶(CDK)的调节。磷酸化作用也控制着分化和发育,如果蝇视网膜的R7细胞和秀丽新小杆线虫(Caenorhabditis elegans)的阴门发育受控于受体蛋白激酶和胞内蛋白激酶。最后,新陈代谢受磷酸化作用的调节控制,尤其是葡萄糖和糖元的相互转换及葡萄糖的转运的代谢作用。因而,形形色色的生物学家为了弄清楚他们最感兴趣的基因及其编码产物的调控和功能,他们常常不约而同,有时还是不由自主地必须蛋白质地磷酸化。 研究蛋白质磷酸化最常用地方法是利用32P标记的无机磷酸盐(32Pi)进行生物合成标记。这种方法非常简单,而只将标记物中加入到培养基中。在节中描述了用32Pi进行生物成标记的一般方法。该方法能达到最大限度的提高掺入效率和降低放射性对工作人员的伤害及对设备的污染。 大多数蛋白质是在丝氨酸和苏氨酸残基上磷酸化,而许多与信号传导有关的蛋白质还在酪氨酸位置上被磷酸化。这三种羟基磷酸氨基酸在

酸性PH条件下化学性质稳定,酸水解后它们可被回收并被直接鉴定出来。在节中介绍了通过酸水解和双向薄层电泳鉴定磷酸丝氨酸、磷酸苏氨酸和磷酸酪氨酸的技术。蛋白质也可在组氨酸、半胱氨酸和天冬氨酸位置上与磷酸共价键合,它们可以是以磷酸-酶的中间体或稳定修饰物的形式存在,这些磷酸氨基酸在酸性条件下不稳定,不能用对酸稳定磷酸氨基酸的标准技术来研究,它们只能通过排除法或演绎法来鉴定。研究这些酸不稳定的氨基酸已超出本书的范围,读者可以参考《酶学方法》(Methods in Enzymolcgy)第200卷有关鉴定这些新磷酸氨基酸的技术。 磷酸酪氨酸不是含量丰富的磷酸氨基酸,因而一般很难在用32Pi标记的样品中检出,尤其是当样品中含有大量在丝氨酸残基上磷酸化的蛋白质或有RNA污染时则更难。凝胶电泳分级后的样品以碱处理,使RNA水解并使磷酸丝氨酸脱磷酸,可以大大提高磷酸酪氨酸和磷酸苏氨酸的检出率,在节中描述一种碱处理的简单方法。 如果蛋白质被磷酸化,无需借助生物合成标记方法也可鉴定磷酸氨基酸。例如,蛋白质中所含的稀有的磷酸酪氨酸可用抗磷酸酪氨酸的抗体来检测,其特异性和敏感性相当高。更普遍的是,蛋白质的磷酸化常常使蛋白质在SDS-聚丙烯酰氨凝胶电泳中的迁移率发生变化,而且几乎总是改变它的等电点。将蛋白质和磷酸酶共同温育后,从凝胶迁移率的变动可以推论出非标记蛋白质存在磷酸化残基。这种方法在内源性ATP以[γ-32P]ATP进行标记的效率很差时很实用,如目的蛋白是来源于某些难以进行生物合成标记的组织或来源于体外翻译的情

生物质谱分析蛋白质磷酸化位点

磷酸化蛋白的高效富集 在线酶解与快速鉴定 项目申请人:袁敏婷黄懿 指导教师:杨芃原 摘要:蛋白质的可逆磷酸化具有重要的生物学意义,对蛋白质磷酸化位点进行分析有助于阐明蛋白质磷酸化的机制与功能。生物质谱是目前进行蛋白质磷酸化分析最有力的方法之一,但由于蛋白质磷酸化的丰度低以及磷酸化的肽段离子化效率低,在质谱分析前,依然需要结合富集或分离的步骤。本作品旨在利用四氧化三铁磁性纳米材料对磷酸化肽或蛋白快速高效的特异性吸附,结合在线酶解技术的快速,高序列覆盖度特性构建一个快速,高效鉴定分析磷酸化蛋白的新技术。 关键词:蛋白质磷酸化;Fe3O4磁性材料富集;在线酶解 1.引言 蛋白质的翻译后修饰(PTMs)是目前蛋白质组研究中的一个重要课题。蛋白质磷酸化是最普遍、最重要的一种蛋白翻译后修饰方式,它几乎调节着生命活动的整个过程,包括细胞的增殖、发育和分化,神经活动,肌肉收缩,新陈代谢,肿瘤发生等。了解蛋白质磷酸化对功能的影响可深入理解生命系统如何在分子水平进行调控。据统计,在哺乳动物中大约有三分之一的蛋白质被认为是磷酸化修饰的,而脊椎动物基因组中有5%的基因编码蛋白激酶或磷酸酯酶。对众多生物化学功能起开/关调控作用,是一种普遍的调控机制。 蛋白质的可逆磷酸化使得蛋白质组学研究更为复杂。真核生物细胞蛋白质中主要的磷酸化氨基酸为丝氨酸、苏氨酸和酪氨酸,其比例大概为1800∶200∶1。大多数磷酸化蛋白质都有多个磷酸化位点,并且其磷酸化位点是可变的。因此,一种蛋白可能有多种磷酸化形式。对单一蛋白质进行研究的传统方法远不能满足分析这一层面上蛋白质的多样性和复杂性的需要,用蛋白质组技术和生物信息学高通量地研究翻译后蛋白质的修饰已成为必然趋势。虽然对磷酸化蛋白质组学分析已有很大进步,但依然存在多个难点亟待解决包括磷酸化蛋白和肽段的富集,可逆性磷酸化位点的鉴定以及磷酸化位点的定量等。 在过去几十年中已有多种分离和鉴定蛋白质磷酸化的技术发展起来,包括放射性同位素标记、免疫沉淀反应、化学修饰、固定金属离子亲合色谱法等,而生物质谱技术已经成为磷酸化蛋白鉴定的主要工具,串联质谱更是可以高通量,快速的给出详细的磷酸

蛋白质磷酸化1

浅谈蛋白质磷酸化 摘要:蛋白质翻译后修饰几乎在所有的蛋白质上都会发生,被修饰后的蛋白质功能将会发生显著的变化。而蛋白质磷酸化是最常见、最重要的一种蛋白质翻译后修饰方式,在蛋白质翻译后修饰研究中有着重要地位,它参与和调控生物体内的许多生命活动。随着蛋白质组学技术的发展和应用,蛋白质磷酸化的研究越来越受到广泛的重视。本文主要介绍了蛋白质磷酸化的主要知识,主要类型与功能,以及研究蛋白质磷酸化的主要目的,最后简单了提到了预测蛋白质磷酸化位点的方法。 关键词:蛋白质修饰;蛋白质磷酸化;磷酸化位点预测 随着基因组计划基本完成,生命科学研究已进入后基因时代,主要研究对象是功能基因组学,包括结构基因组研究和蛋白质组研究等。蛋白质组研究的开展不仅是生命科学研究进入后基因组时代的里程碑,也是生命科学研究的核心内容。传统的蛋白质研究注重研究单一蛋白质,而蛋白质组学注重研究参与特定生理或病理状态的所有的蛋白质种类及其与周围环境(分子)的关系。它的研究内容包括:(1)蛋白质鉴定;(2)蛋白质翻译后修饰的研究;(3)蛋白质结构研究;(4)蛋白质细胞内定位及功能确定;(5)发现药物靶分子及制药等。 早期蛋白质组学的研究范围主要是指蛋白质的表达模式,随着学科的发展,蛋白质组学的研究范围也在不断完善和扩充。蛋白质翻译后修饰研究已成为蛋白质组研究中的重要部分和巨大挑战。所谓蛋白质翻译后修饰指的是蛋白质折叠过程中和折叠过程后再多肽链上发生的共价反应,使蛋白质质量发生改变并且赋予蛋白质各种功能。 一、蛋白质磷酸化的概述 蛋白质的磷酸化反应是指通过酶促反应把磷酸基团从一个化合物转移到另一个化合物上的过程,是生物体内存在的一种普遍的调节方式,在细胞信号的传递过程中占有极其重要的地位。已经发现在人体内有多达2000个左右的蛋白质激酶和1000个左右的蛋白质磷酸酶基因。蛋白质的磷酸化是指由蛋白质激酶催化的把ATP或GTP上γ位的磷酸基转移到底物蛋白质氨基酸残基上的过程,其逆转过程是由蛋白质磷酸酶催化的,称为蛋白质脱磷酸化。蛋白质的磷酸化修饰是生物体内重要的共价修饰方式之一。其磷酸化和去磷酸化这一可逆过程,受蛋白激酶和磷酸酶的协同作用控制.酶蛋白的磷

磷酸化蛋白质组学

磷酸化蛋白质组学常用分析和定量方法 蛋白质的磷酸化修饰是生物体内重要的共价修饰方式之一。蛋白质的磷酸化和去磷酸化这一可逆过程几乎调节着包括细胞的增殖、发育、分化、信号转导、细胞凋亡、神经活动、肌肉收缩及肿瘤发生等过程在内的所有生命活动。目前已知有许多人类疾病是由于某些异常的磷酸化修饰所引起,而有些磷酸化修饰却是某种疾病所导致的后果。在哺乳动物细胞生命周期中,大约有1/3的蛋白质发生过磷酸化修饰;在脊椎动物基因组中,有5%的基因编码的蛋白质是参与磷酸化和去磷酸化过程的蛋白激酶和磷酸(酯)酶。磷酸化修饰本身所具有的简单、灵活、可逆的特性以及磷酸基团的供体ATP的易得性,使得磷酸化修饰被真核细胞所选择接受而成为一种最普遍的调控手段。鉴于磷酸化修饰在生命活动中所具有的重要意义,探索磷酸化修饰过程的奥秘及其对细胞功能的影响已成为众多生物化学家及蛋白组学家所关心的内容。用蛋白质组学的理念和分析方法研究蛋白质磷酸化修饰,可以从整体上观察细胞或组织中磷酸化修饰的状态及其变化,这对以某一种或几种激酶及其产物为研究对象的经典分析方法是一个重要的补充,同时提供了一个全新的研究视角,并由此派生出磷酸化蛋白质组学(phosphoproteomics)这一新概念。在蛋白质组学水平进行磷酸化蛋白质的分析定量研究已引起人们广泛关注,各种技术也相应地发展起来[60, 61]。 1. 磷酸化蛋白质和磷酸肽的富集[62] 1.1 免疫亲和色谱 富集磷酸化蛋白质最简单的方法就是用识别磷酸化氨基酸残基的特异抗体进行免疫共沉淀,从复杂混合物中免疫沉淀出目标蛋白质。目前,仅有酪氨酸磷酸化蛋白质的单克隆抗体可以用来进行有效的免疫共沉淀。这是因为该抗体具有较强的亲和力和特异性,可以有效地免疫沉淀酪氨酸磷酸化的蛋白质。Imam-Sghiouar等人从B-淋巴细胞中通过免疫沉淀获得酪氨酸磷酸化的蛋白质,然后再用二维电泳分离技术并结合质谱分析方法,从而鉴定出多个与斯科特综合症相关的酪氨酸磷酸化的蛋白质。由于抗磷酸化丝氨酸和苏氨酸抗体的抗原决定簇较小,所以令抗原抗体的结合位点存在空间障碍,特异性较差。因此,目前采用磷酸化丝氨酸/ 苏氨酸的抗体来富集磷酸化蛋白质的研究相对较少。 图片来源:https://www.360docs.net/doc/7813334379.html,/wiki/Phosphoproteomics

论述蛋白质磷酸化与去磷酸化在细胞信号系统传导中的作用及研究进展

论述蛋白质磷酸化与去磷酸化在细胞信号系统传导中的作用及研究进展 病毒所梁晓声200628012415030 细胞信号传导过程中磷酸酶/磷酸激酶对蛋白磷酸化程度的调控控制了细胞信号传递与否,信号强度等等细胞信号传导的过程从某种程度上说就是信号传导相关分子磷酸化水平的调节过程。 磷酸酶/磷酸激酶作为胞内信号直接或间接的靶酶通过磷酸化程度控制其它酶类或蛋白质的活性,一般情况下被磷酸化的酶有活性,脱磷酸后的酶没有活性。通过这种方式可以在不改变细胞内酶或相关蛋白的浓度的情况下将部分酶活冻结或解冻。在有外界信号刺激的时候可以迅速解冻酶活而不必合成新的酶。 由于酶反应具有高度专一性,使得蛋白质磷酸化与去磷酸化这种方式在胞内介导胞外信号时具有专一应答的特点。这就使得细胞信号传导途径的上游成分只能针对一个或几个的下游成分起作用,使信号传递具有很强的专一性。同时对信号的灭活也不会由于识别的错误而影响其他信号传导途径。 磷酸化与去磷酸化在细胞对外界信号的持续反应中具有重要的作用。信号引起的细胞生理学效应中,有许多是相当持久的,如细胞的分裂、分化等。虽然胞内信号分子的寿命可以很短,但蛋白激酶一旦激活,其活性却可以通过某些方式(如自身磷酸化)维持较长时间;更重要的是被它磷酸化所调节的蛋白质和酶类,其效应可以维持更长时间,直到被蛋白磷酸酶脱磷酸化为止。 蛋白磷酸化对外界信号具有放大作用,由于是酶促反应,一个酶分子可以催化成百上千个底物分子,即使只有很弱的胞外信号也可以通过酶促反应得到充分的放大。 蛋白质激酶 蛋白质激酶是一类磷酸转移酶,其作用是将ATP的磷酸基转移到它们的底物上特定氨基酸残基上去。依据这些氨基酸残基的特异性,将这些激酶分为4类。其中主要的两类是蛋白质丝氨酸/苏氨酸激酶(STK),和蛋白质酪氨酸激酶(PTK)。这两类酶的蛋白质激酶结构域的大小约为250-300个氨基酸残基。二者的催化域在进化上是密切相关的,并认为它们有共同的祖先。因此,它们的催化域的氨基酸残基序列在很大程度上也是一致的。更重要的是,这些序列表现为一组组高度保守的,甚至是完全保守的氨基酸模体,这些模体却嵌埋在氨基酸残基序列保守性很差的区域之内。一共有11种这类高度保守的短氨基酸残基序列模体。它们都以罗马数字命名,从最N-端的I开始,到最C-端的XI。对这些酶的结晶进行X-射线结构分析,发现这些模体对这些蛋白质激酶催化结构域的磷酸转移酶活性十分重要。据以为,亚域I,II和VII在结合ATP中起重要作用;而亚域VIII则在识别肽底物中起主要作用。对酪氨酸激酶家族来说,在亚域VIII中,紧靠关键模体上游的氨基酸残基有十分有趣的差异,它们是-KWTAPE- 或-KWMAPE-,看来这些序列造成了激酶家族的这个分支的底物专一性。 蛋白磷酸酯酶 丝氨酸/苏氨酸蛋白磷酸酯酶,选择性地作用于含磷酸丝氨酸或磷酸苏氨酸残基的肽链,使之脱去磷酸基团并改变生物活性。主要成员:PPl,PP2A,PP2B,PP2C等。 酪氨酸蛋白磷酸酯酶(PTPase)分胞质型(非受体型)和受体型(PTPR)

磷酸化蛋白质组学常用分析和定量方法

蛋白质的磷酸化修饰是生物体内重要的共价修饰方式之一。蛋白质的磷酸化和去磷酸化这一可逆过程几乎调节着包括细胞的增殖、发育、分化、信号转导、细胞凋亡、神经活动、肌肉收缩及肿瘤发生等过程在内的所有生命活动。目前已知有许多人类疾病是由于某些异常的磷酸化修饰所引起,而有些磷酸化修饰却是某种疾病所导致的后果。在哺乳动物细胞生命周期中,大约有1/3的蛋白质发生过磷酸化修饰;在脊椎动物基因组中,有5%的基因编码的蛋白质是参与磷酸化和去磷酸化过程的蛋白激酶和磷酸(酯)酶。磷酸化修饰本身所具有的简单、灵活、可逆的特性以及磷酸基团的供体ATP的易得性,使得磷酸化修饰被真核细胞所选择接受而成为一种最普遍的调控手段。鉴于磷酸化修饰在生命活动中所具有的重要意义,探索磷酸化修饰过程的奥秘及其对细胞功能的影响已成为众多生物化学家及蛋白组学家所关心的内容。用蛋白质组学的理念和分析方法研究蛋白质磷酸化修饰,可以从整体上观察细胞或组织中磷酸化修饰的状态及其变化,这对以某一种或几种激酶及其产物为研究对象的经典分析方法是一个重要的补充,同时提供了一个全新的研究视角,并由此派生出磷酸化蛋白质组学(phosphoproteomics)这一新概念。在蛋白质组学水平进行磷酸化蛋白质的分析定量研究已引起人们广泛关注,各种技术也相应地发展起来. 1.1 免疫亲和色谱 富集磷酸化蛋白质最简单的方法就是用识别磷酸化氨基酸残基的特异抗体进行免疫共沉淀,从复杂混合物中免疫沉淀出目标蛋白质。目前,仅有酪氨酸磷酸化蛋白质的单克隆抗体可以用来进行有效的免疫共沉淀。这是因为该抗体具有较强的亲和力和特异性,可以有效地免疫沉淀酪氨酸磷酸化的蛋白质。Imam-Sghiouar等人从B-淋巴细胞中通过免疫沉淀获得酪氨酸磷酸化的蛋白质,然后再用二维电泳分离技术并结合质谱分析方法,鉴定出多个与斯科特综合症相关的酪氨酸磷酸化的蛋白质。由于抗磷酸化丝氨酸和苏氨酸抗体的抗原决定簇较小,所以令抗原抗体的结合位点存在空间障碍,特异性较差。因此,目前采用磷酸化丝氨酸/苏氨酸的抗体来富集磷酸化蛋白质的研究相对较 少。 1.2 固相金属亲和色谱(IMAC) 固相金属亲和色谱(immobilized metal affinity chromatography, IMAC)是一项较为成熟的磷酸化多肽分离富集技术。它是利用磷酸基团与固相化的Fe3+、Ga2+和Cu2+等金属离子的高亲和力来富集磷酸肽。目前发展的高通量磷酸化蛋白质组分析途径主要采用IMAC亲和色谱-反相液相色谱-串联质谱-数据库检索联用的方法。Ficarro等人最先将IMAC富集技术应用到细胞系大规模磷酸化蛋白质组学的分析中,并从啤酒酵母中鉴定出了216个磷酸化肽段和383个磷酸化位点。该方法的优点在于对每个可溶磷酸肽,不管其长度如何,都有富集作用,而且IMAC柱洗脱下的样品可直接用于RP-HPLC分析,但有可能丢失一些与IMAC柱结合能力较弱的磷酸肽或某些因有多个磷酸化位点而难以洗脱的磷酸肽。另外,那些富含酸性氨基酸的非磷酸化肽段与固相金属离子也有结合能力,也可能被富集。为了解决IMAC柱的非特异性吸附的问题,可以采用对羧基进行酯化反应以及改变洗脱液的体系等方法来提高IMAC 柱的特异性。此外,自动化IMAC- capillary RP HPLC-ESI MS/MS技术平台的研究开发,使磷酸肽的富集、反相分离和质谱检测都能自动在线进行,为IMAC在蛋白质组学中的高通量应用开辟了道路。 1.3 TiO2色谱 近期金属氧化物亲和富集技术得到了人们极大的关注。2004年,Pinkse等人将二氧化钛(TiO2)技术引进磷酸化蛋白质组学领域,利用TiO2与磷酸肽上磷酸基团的亲和能力实现对磷酸肽的相对富集,并建立了通过TiO2作为预分离的2D-NanoLCESI-MS/MS 技术平台。虽然该技术在对磷酸化肽段富集时的选择性和灵敏度方面都优于IMAC技术,但仍然存在非特异性吸附等问题。后来,人们又利用纳米材料比表面积大的特点,对TiO2纳米级材料进行了开发

蛋白质修饰位点预测详解

蛋白质修饰位点分析 目录 实验目的 (2) 实验平台 (2) 实验过程 (3) 一、“人类connexin43”蛋白质磷酸化位点修饰 (3) 1、“人类connexin43”蛋白质序列下载 (3) 2、uniprot数据库查看蛋白磷酸化位点 (4) 3、在线软件预测指定蛋白磷酸化位点 (6)

(1)DISPHOS 1.3预测未知蛋白磷酸化位点 (6) (2)PhosphoSitePlus预测指定蛋白磷酸化位点 (11) 4、“人类connexin43”蛋白质磷酸修饰结论 (14) 二、“人类血红蛋白”糖基化位点修饰 (15) 1、N型糖基化位点预测 (15) 2、O型糖基化位点预测 (18) (1)哺乳动物O型糖基化位点预测 (18) (2)真核生物O型糖基化位点预测 (20) 3、uniprot数据库查看蛋白质糖基化修饰位点 (22) 4、“人类血红蛋白”糖基化位点修饰结论 (22) 实验结论 (23) (特别提示:ctrl+单击目录下的标题链接,可以跟踪标题;ctrl+单击标题后的图标可以返回目录) 实验目的 ●找出“人类connexin43”蛋白质上面的所有可能磷酸化位点, 并说明为什么(注释) ●找出“人类血红蛋白”上面的糖基化位点,注释结果 实验平台 ●uniprot数据库: https://www.360docs.net/doc/7813334379.html,/(查看蛋白的修饰 情况) ●预测未知蛋白磷酸化位点 DISPHOS:https://www.360docs.net/doc/7813334379.html,/disphos/

PhosphoSitePlus:https://www.360docs.net/doc/7813334379.html, 预测未知蛋白的糖基化修饰位点 N型糖基化位点预测:http://www.cbs.dtu.dk/services/NetNGlyc/ O型糖基化位点预测:http://www.cbs.dtu.dk/services/NetOGlyc/ http://www.cbs.dtu.dk/services/YinOY ang/ 实验过程 一、“人类connexin43”蛋白质磷酸化位点修饰 1、“人类connexin43”蛋白质序列下载 蛋白序列:fasta.txt

分子生物学---11蛋白质磷酸化和信号转导

蛋白质磷酸化和信号转导 一、蛋白质磷酸化过程和功能 1、蛋白质磷酸化p r o t e i n p h o s p h o r y l a t i o n (1)过程: P r o t e i n k i n a s e(蛋白激酶) P r o t e i n p h o s p h o r y l a t e d p r o t e i n A T P A D P P h o s p h a t a s e(磷酸酶) P i (2)主要磷酸化位点(对有-O H的氨基酸进行磷酸化) 丝氨酸(S e r)/苏氨酸(T h r):磷酸化之后电荷发生变化使蛋白质活性改变 酪氨酸(T y r):磷酸化之后通常招募其他蛋白因子,使下游蛋白质活性改变 (3)蛋白质磷酸化的功能 生物热力学;蛋白质降解;酶活性的调控(激活o r抑制);蛋白质相互作用 2、重要的蛋白激酶 (1)C D K s:c y c l i n-d e p e n d e n t k i n a s e周期蛋白依赖性蛋白激酶,属于一组调控细胞周期的S e r/T h r蛋白激酶,和周期蛋白c y c l i n协同作用发挥激酶活性,作用于细胞周期的不同阶段 (2)R T K s:R e c e p t o r T y r o s i n K i n a s e受体酪氨酸激酶,是具有酪氨酸激酶活性的受体,如E G F R(表皮生长因子受体) (3)C y t o p l a s m i c P r o t e i n-T y r o s i n e K i n a s e s:非受体酪氨酸激酶,存在于细胞质中,大部分结构中存在S H2、S H3结构域,是磷酸化的结合位点。如S r c、J A K、 F A K等 二、信号转导 1、信号转导的种类 E n d o c r i n e(内分泌):激素 P a r a c r i n e(旁分泌):神经递质 A u t o c r i n e(自分泌):生长因子 2、信号转导的步骤 (1)信号分子的合成 (2)信号分子释放 (3)信号分子传导 (4)信号分子与受体结合 (5)激活细胞内信号通路 (6)细胞内信号传导

磷酸化蛋白质组学常用定量方法介绍

磷酸化蛋白质组学常用定量方法介绍 蛋白质的磷酸化修饰是生物体内重要的共价修饰方式之一。蛋白质的磷酸化和去磷酸化这一可逆过程几乎调节着包括细胞的增殖、发育、分化、信号转导、细胞凋亡、神经活动、肌肉收缩及肿瘤发生等过程在内的所有生命活动。目前已知有许多人类疾病是由于某些异常的磷酸化修饰所引起,而有些磷酸化修饰却是某种疾病所导致的后果。在哺乳动物细胞生命周期中,大约有1/3的蛋白质发生过磷酸化修饰;在脊椎动物基因组中,有5%的基因编码的蛋白质是参与磷酸化和去磷酸化过程的蛋白激酶和磷酸(酯)酶。磷酸化修饰本身所具有的简单、灵活、可逆的特性以及磷酸基团的供体ATP的易得性,使得磷酸化修饰被真核细胞所选择接受而成为一种最普遍的调控手段。鉴于磷酸化修饰在生命活动中所具有的重要意义,探索磷酸化修饰过程的奥秘及其对细胞功能的影响已成为众多生物化学家及蛋白组学家所关心的内容。用蛋白质组学的理念和分析方法研究蛋白质磷酸化修饰,可以从整体上观察细胞或组织中磷酸化修饰的状态及其变化,这对以某一种或几种激酶及其产物为研究对象的经典分析方法是一个重要的补充,同时提供了一个全新的研究视角,并由此派生出磷酸化蛋白质组学(phosphoproteomics)这一新概念。在蛋白质组学水平进行磷酸化蛋白质的分析定量研究已引起人们广泛关注,各种技术也相应地发展起来。 1. 磷酸化蛋白质和磷酸肽的富集 1.1 免疫亲和色谱 富集磷酸化蛋白质最简单的方法就是用识别磷酸化氨基酸残基的特异抗体进行免疫共沉淀,从复杂混合物中免疫沉淀出目标蛋白质。目前,仅有酪氨酸磷酸化蛋白质的单克隆抗体可以用来进行有效的免疫共沉淀。这是因为该抗体具有较强的亲和力和特异性,可以有效地免疫沉淀酪氨酸磷酸化的蛋白质。Imam-Sghiouar等人从B-淋巴细胞中通过免疫沉淀获得酪氨酸磷酸化的蛋白质,然后再用二维电泳分离技术并结合质谱分析方法,鉴定出多个与斯科特综合症相关的酪氨酸磷酸化的蛋白质。由于抗磷酸化丝氨酸和苏氨酸抗体的抗原决定簇较小,所以令抗原抗体的结合位点存在空间障碍,特异性较差。因此,目前采用磷酸化丝氨酸/苏氨酸的抗体来富集磷酸化蛋白质的研究相对较 少。 1.2 固相金属亲和色谱(IMAC) 固相金属亲和色谱(immobilized metal affinity chromatography, IMAC)是一项较为成熟的磷酸化多肽分离富集技术。它是利用磷酸基团与固相化的Fe3+、Ga2+和Cu2+等金属离子的高亲和力来富集磷酸肽。目前发展的高通量磷酸化蛋白质组分析途径主要采用IMAC亲和色谱-反相液相色谱-串联质谱-数据库检索联用的方法。Ficarro等人最先将IMAC 富集技术应用到细胞系大规模磷酸化蛋白质组学的分析中,并从啤酒酵母中鉴定出了216个磷酸化肽段和383个磷酸化位点。该方法的优点在于对每个可溶磷酸肽,不管其长度如何,都有富集作用,而且IMAC柱洗脱下的样品可直接用于RP-HPLC分析,但有可能丢失一些与IMAC柱结合能力较弱的磷酸肽或某些因有多个磷酸化位点而难以洗脱的磷酸肽。另外,那些富含酸性氨基酸的非磷酸化肽段与固相金属离子也有结合能力,也可能被富集。为了解决IMAC柱的非特异性吸附的问题,可以采用对羧基进行酯化反应以及改变洗脱液的体系等方法来提高IMAC柱的特异性。此外,自动化IMAC- capillary RP HPLC-ESI MS/MS技术平台的研究开发,使磷酸肽的富集、反相分离和质谱检测都能自动在线进行,为IMAC在蛋白质组学中的高通量应用开辟了道路。

磷酸化蛋白质组学的研究及其应用

磷酸化蛋白质组学的研究及其应用 郝文杰生物化学与分子生物学 201421191526 摘要:蛋白质磷酸化是最常见、最重要的一种蛋白质翻译后修饰方式,蛋白质磷酸化和去磷酸化几乎调节着生命活动的整个过程。近年来蛋白质组学技术的发展和应用为磷酸化蛋白质的定性、定量和功能研究提供了必要的技术,使大规模和系统性进行磷酸化蛋白质研究成为可能。本文综述了检测和鉴定磷酸化蛋白质的蛋白质组学方法及其在生命领域的应用前景。 关键词:蛋白质;磷酸化;翻译;方法;检测 在对疾病发病机制、诊断、生理功能及药物开发研究中,往往需要获取一些高通量、大样本、全局性数据,通过整体化系统性分析,从中寻找线索,推断可能的病因以及诊断靶标,由此诞生了诸如基因组学、蛋白质组学及代谢组学等建立在网络架构式研究思路基础上多种新的研究方法和理论。生物体能迅速对体内环境变化和外界环境刺激产生应答反应,这些反应过程靠复杂的调控机制调节, 其中大多数调控机制是由蛋白质的构象变化所介导的,而蛋白质本身的构象变化常常是通过变构效应和蛋白质一级结构上发生的各种共价修饰来实现的[1]。目前,已发现20多种蛋白质翻译后修饰,以至一种基因产物可呈现磷酸化修饰、糖基化修饰、羧基化修饰、乙酰化修饰以及连接变异体等多种形式[2]。 蛋白质的磷酸化修饰是生物体内重要的共价修饰方式之一。磷酸化修饰本身所具有的简单、灵活、可逆的特性,以及磷酸基团的供体ATP的易得性,使得磷酸化修饰被真核细胞所选择接受成为一种最普遍的调控手段。蛋白质的磷酸化和去磷酸化这一可逆过程,几乎调节着包括细胞的增殖、发育、分化、细胞骨架调控、细胞凋亡、神经活动、肌肉收缩、新陈代谢及肿瘤发生等生命活动的所有过程,并且可逆的蛋白质磷酸化是目前所知道的最主要的信号转导方式[3]。目前已经知道有许多人类疾病是由于异常的磷酸化修饰所引起,而有些磷酸化修饰却是某种疾病所导致的后果[4]。 磷酸化蛋白质组学的研究尚处于初期阶段,鉴于其特殊的研究方法及内容,对揭示生命体尤其是疾病状态下细胞信号传导具有不可替代的优势[5-7]。此外, 磷酸化蛋白质组学的研究为寻找药物新的作用靶点和疾病诊断指标提供全新的 研究思路。本文就磷酸化蛋白质的检测、定量技术及其在生物领域的研究进行综述。 1.蛋白质磷酸化研究概况 蛋白质磷酸化作为真核细胞信号转导中的核心,在生命系统中发挥着重要作用。在真核生物中常见的三种磷酸化形式,丝氨酸磷酸化最多,苏氨酸磷酸化次之,而酪氨酸磷酸化最少,三者的比例是1800∶200∶1[8]。丝氨酸、苏氨酸、酪氨酸残基上的磷酸化是非常重要的蛋白质功能调节器[9],正确解析磷酸化蛋白质的结 构以及为磷酸化的位点是磷酸化蛋白质组的主要任务之一。另外,蛋白质磷酸化在机体内是动态的过程,不同条件下蛋白质磷酸化的定量分析是差异蛋白质组学研究的重要内容。 2.磷酸化蛋白质的主要检测技术 2.1放射性标记法 放射性标记法是研究蛋白质磷酸化的传统方法,是将用放射性同位素P标记的磷酸化蛋白质,经分离、富集后,利用放射自显影技术进行磷酸化蛋白质的检测。若要进一步分析磷酸化位点,则需要通过蛋白酶解消化,再通过Edman降解或质

用多样性增量特征选择技术识别 蛋白质磷酸化位点

Hans Journal of Computational Biology 计算生物学, 2018, 8(1), 24-32 Published Online March 2018 in Hans. https://www.360docs.net/doc/7813334379.html,/journal/hjcb https://https://www.360docs.net/doc/7813334379.html,/10.12677/hjcb.2018.81004 Identification of Protein Phosphorylation Sites by Diversity Increment Feature Selection Technique Shisai Hu, Zhen Liang, Yuxiang Chen, Ying Zhang*, Jun Lv* College of Science, Inner Mongolia University of Technology, Hohhot Inner Mongolia Received: Apr. 25th, 2018; accepted: May 15th, 2018; published: May 22nd, 2018 Abstract Phosphorylation is one of the most important protein post-translational modifications and plays important roles in numerous biological processes by significantly affecting proteins’ structure and dynamics. The development of computational biological methods for the accurate identification of phosphorylation sites helps to our understanding of key signal transduction mechanisms. In this paper, a kinase independent phosphorylation site identification model was presented, called FSID_PhSite. The model is featured by component of k-spaced amino acid pairs and the position conservation of residues surrounding the phosphorylation sites. Applying diversity incremental feature selection technique to feature selection and inputting the selected features into the sup-port vector machine algorithm for recognition, when the ratio of positive and negative samples is 1:1, on independent testing dataset validation, the accuracy of identification for serine, threonine and tyrosine sites is 84.34%, 82.32% and 68.89%, respectively. The results were superior to the existing kinase independent phosphorylation sites identification model. Keywords Protein Phosphorylation Site, Feature Selection Based on Increment of Diversity, Support Vector Machine 用多样性增量特征选择技术识别 蛋白质磷酸化位点 胡世赛,梁珍,陈宇翔,张颖*,吕军* 内蒙古工业大学理学院,内蒙古呼和浩特 *通讯作者。

蛋白质修饰位点预测详解

蛋白质修饰位点分析 目录 (特别提示:ctrl+单击目录下的标题链接,可以跟踪标题;ctrl+单击标题后

的图标可以返回目录) 实验目的 ●找出“人类connexin43”蛋白质上面的所有可能磷酸化位点,并说 明为什么(注释) ●找出“人类血红蛋白”上面的糖基化位点,注释结果 实验平台 ●uniprot数据库: (查看蛋白的修饰情况) ●预测未知蛋白磷酸化位点 DISPHOS: PhosphoSitePlus: ●预测未知蛋白的糖基化修饰位点 N型糖基化位点预测: O型糖基化位点预测: 实验过程 一、“人类connexin43”蛋白质磷酸化位点修饰 1、“人类connexin43”蛋白质序列下载 蛋白序列:

2、uniprot数据库查看蛋白磷酸化位点 网站链接: 3、在线软件预测指定蛋白磷酸化位点 (1)DISPHOS 预测未知蛋白磷酸化位点 网站链接: ●开始预测 ●结果 DISPHOS由蛋白序列预测蛋白磷酸修饰位点,总共有37个丝氨酸修饰位点,13个苏氨酸修饰位点,16个酪氨酸修饰位点。但是根据打分,只有8个丝氨酸修饰位点可能存在。 (2)PhosphoSitePlus预测指定蛋白磷酸化位点 网站链接: ●开始预测 ●结果 筛选参考文献来源多于5篇的磷酸化修饰位点,丙氨酸磷酸化修饰位点数目为1、丝氨酸为17、苏氨酸数目为1、酪氨酸数目为7。 4、“人类connexin43”蛋白质磷酸修饰结论 在线数据库查询和在线软件预测结果基本一致,“人类connexin43”蛋白质磷酸位点数量相对一般蛋白质较多,且丝氨酸磷酸修饰位点最多。“人

类connexin43”蛋白质极有可能是一种活性较高的蛋白质,与机体的生物活性显着相关。 通过各种文献阅读和网络筛选发现connexin43蛋白质是一种哺乳动物连接蛋白,是主要的细胞缝隙连接蛋白,其表达的异常与多种疾病的发生有关。 二、“人类血红蛋白”糖基化位点修饰 Ncbi下载人类血红蛋白的蛋白序列保存为: 1、N型糖基化位点预测 网站链接: ●开始预测 ●结果 2、O型糖基化位点预测 (1)哺乳动物O型糖基化位点预测 网站链接: ●开始预测 ●结果 (2)真核生物O型糖基化位点预测 网站链接: ●开始预测

磷酸化蛋白之western_blot检测操作细节和注意事项

磷酸化蛋白之western blot检测操作细节和注意事项 1.一定要在lysis buffer中加入蛋白酶抑制剂(配方见后页),还要加入一定量的磷酸酶抑制 剂,否则即使band压出来也会很浅,结果也不可信。 2.加一抗后最好4度过夜,保证抗体有充分的结合时间。因为磷酸化的蛋白只占总的蛋白量 的极少部分。4度也可使一抗重复使用多次(站长注:可加入防腐剂,如叠氮钠,Proclin TM 等,保存时间更长)。毕竟磷酸化的抗体都挺贵的。二抗则室温1小时即可。 3.磷酸化抗体的好坏是一个关键因素,所以要选择好的厂商。个人认为,Cell signaling公司 做的磷酸化抗体不错,尤其是MAPKs磷酸化抗体 4.最好根据厂商的protocol来操作实验,这是实验成功的保证。如Cell signaling会建议用 含5%BSA的TBST稀释phospho-p38等抗体,效果不错,而不是用常见的含5%non-fat milk的TBST。 5.抗体的稀释倍数也要适当。不同厂商也会有不同要求。 6.研究完某一蛋白的磷酸化情况后最好也要研究一下该蛋白总的表达量。如压完phospho-p 38抗体后,我会把相同的membrane做strip后再压p38,然后再strip一次,再压内标acti n。 7.做磷酸化蛋白WB时,除了目标蛋白的band以外,往往会出现非特异性的band.磷酸化抗体 不好的话,甚至会压出非特异性的band,而没有你想要的band,所以压片以后,你一定要根据markers比对一下,你压出的band分子量是否正确.我以前压WB时,压出了一条band,就以为是我想要的那条,然后还根据趋势推测可能的机制,走了不少怨枉路.还有一次,把markers 的分子量记错了,比对出来的结果当然也不对. 8.磷酸化蛋白WB时backgroud也往往较深,所以压片时间要适当,不能太长或过短,太长则b ackgroud太深盖住想要的那条band,时间过短则可能没有band或者band太浅.

蛋白质磷酸化对于许多生物现象的引发是很必要的,包括细胞

蛋白质磷酸化对于许多生物现象的引发是很必要的,包括细胞生长、增殖、泛素(ubiquitin)介导的蛋白降解等过程。特别是酪氨酸磷酸化,作为细胞信号转导和酶活性调控的一种主要方式,通常通过引发蛋白质之间的相互作用,进而介导生长因子、荷尔蒙和细胞因子等对细胞膜上受体的信号调控。 然而,酪氨酸磷酸化在细胞的所有磷酸化修饰中所占的比例却非常低。大概10%的细胞蛋白会受到磷酸化共价修饰,但每100次蛋白的磷酸化修饰中仅有1次酪氨酸基团的修饰。与大部分细胞中的丝氨酸和苏氨酸磷酸化水平相比,酪氨酸磷酸化的水平估计要低2000倍。正是由于细胞中酪氨酸磷酸化的水平相当低,才能保证细胞在内外信号的刺激下,作出灵敏的反应,所以研究酪氨酸的磷酸化对于细胞信号的调控和许多重要生物现象的研究具有极为重要的意义,而对发生酪氨酸磷酸化的蛋白质的识别及磷酸化位点的鉴定对揭示细胞过程的调控和药物的作用位点起到非常重要的作用。 研究蛋白质磷酸化的相关方法: 磷酸化Western Blot 对于信号转导科研来说,抗酪氨酸磷酸化抗体的出现是一个意义重大的事件。在没有抗酪氨酸磷酸化抗体之前,蛋白质和酶的酪氨酸磷酸化只能通过非常危险的并且很费时的放射性实验来检测。而利用抗酪氨酸磷酸化抗体,则可以通过Western Blot或其它免疫学方法轻松地检测到磷酸化信号。常规的检测方法包括:用抗酪氨酸磷酸化抗体在Western Blot上检测内源或外源表达的磷酸化蛋白。如果目标蛋白的含量较低,也可利用免疫沉淀的方法先富集发生磷酸化的酪氨酸蛋白,再检测目标蛋白的水平。抗酪氨酸磷酸化抗体也常用于检测在不同处理的条件下,细胞内总的酪氨酸磷酸化水平的变化情况,作为许多细胞生物现象的一个重要指标。 我们都知道如果需要检测某一个目标蛋白的某一特定位点的磷酸化状态,可以选用该蛋白特定位点的磷酸化特异性抗体。但由于我们研究的通常是新的磷酸化位点,或者这些蛋白特定位点的磷酸化抗体效果不够好,我们不得不自己制备磷酸化抗体。如果大家自己制备过磷酸化抗体,就会知道磷酸化抗体的制备比一般抗体的制备更加困难,而且浪费大量宝贵时间。现在国外的科学家发现可以使用通用型的磷酸化抗体,只要巧妙的设计实验,也可以达到同样的检测目的。以Yuan的文章为例,他们需要检测BCR-ABL的磷酸化,但他们没有特异性的磷酸化抗体。他们首先使用了抗c-ABL的抗体和蛋白G-琼脂糖珠子来免疫沉淀富集BCR-ABL蛋白,然后再通过Western-Blot和4G10通用型酪氨酸磷酸化抗体(pan-phosphotyrosine)来鉴定BCR-ABL蛋白的酪氨酸磷酸化水平。另外一组以Clemens 为首的科学家,则利用抗Dock蛋白抗体先免疫共沉淀了DACK蛋白,再用4G10酪氨酸磷酸化抗体来检测DACK蛋白和DSH3PX1蛋白的酪氨酸磷酸化水平,通过区分这些蛋白的分子量大小,来确认相应的磷酸化条带的蛋白身份。 与做普通的Western Blot相比,磷酸化Western Blot有一些要额外需要注意的事项: 首先,由于蛋白的磷酸化是可逆的,会被磷酸酶去磷酸化,所以在样品制备和整个免疫检测过程中,需要抑制或避免细胞内源性和外源性的磷酸酶的干扰。针对细胞内源性的磷酸酶,我们在样品制备时,需要在细胞裂解液中加入足量的并且是新鲜的磷酸酶抑制剂,如

相关文档
最新文档