蛋白抗原表位预测算法及抗原多肽设计原则

蛋白抗原表位预测算法及抗原多肽设计原则
蛋白抗原表位预测算法及抗原多肽设计原则

蛋白抗原表位预测算法

及多肽抗原设计原则

概述

为了获取识别天然蛋白的抗体,有两种方式可以选择。一种是利用重组蛋白的方式获取尽可能接近天然条件下的重组蛋白,然后刺激试验动物免疫系统,进而获取相应抗体。这种方式获取抗体的成功率较高且效价较好;另一种是预测天然蛋白的抗原决定簇,这种抗原决定簇最终体现为多肽形式,将其与相应的载体偶联后刺激试验动物免疫系统,也可以获取相应的抗体。这种方式的选择有其特殊需要。我们德泰生物科技南京有限公司提供这两种类型的抗体定制服务。

什么是抗原决定簇

蛋白质表面部分可以使免疫系统产生抗体的区域叫抗原决定簇。一般抗原决定簇是由 6-12 氨基酸或碳水基团组成,它可以是由连续序列(蛋白质一级结构)组成或由不连续的蛋白质三维结构组成。

蛋白抗原表位预测方法

目前蛋白质抗原表位预测的方法大致可以分为两类,一类是基于蛋白质高级结构预测,像beta‐转角、膜蛋白跨膜区预测等;一种是基于氨基酸的统计学倾向性,像亲水性(hydrophilicity)、弹性(flexibility)、表面可接触性(surface accessibility)、抗原倾向性(antigenic propensity)。具体算法请参考相关文献,部分文献如下:

1)Chou, Fasman Adv Enzymol Relat Areas Mol Biol. 1978;47:45‐148.

2)Hopp, T.P. and Woods, K.R. (1981) Proc. Natl. Acad. Sci. USA 78, 3824‐3828.

3)Welling, G.W., Weijer, W.J., van der Zee, R. and Welling‐Wester, S. (1985) FEBS Lett. 188,

215‐218.

4)Karplus PA, Schulz GE. Naturwissenschafren 1985; 72:212‐3.

5)Emini EA, Hughes JV, J Virol. 1985 Sep;55(3):836‐9.

6)Parker, J.M.R., Guo, D. and Hodges, R.S. (1986) Biochemistry 25, 5425‐5432.

7)Schmidt, A.M. (1989) Biotect. Adv. 7, 187‐213.

8) A.S. Kolaskar and Prasad C. Tongaonkar (1990) FEBS 09210

9)K. Hofmann & W. Stoffel (1993)

10)Paul Horton, Keun‐Joon Park, Takeshi Obayashi & Kenta Nakai, Proceedings of the 4th Annual

Asia Pacific Bioinformatics Conference, Taiwan. pp. 39‐48, 2006.

11)Jens Erik Pontoppidan Larsen, Ole Lund and Morten Nielsen. Immunome Res. 2006

选择多肽抗原的方法

不同算法预测出的候选多肽序列有所不同,需要综合考虑各种预测方法,同时结合实际应用进行最终选择。

最终选择的多肽序列一般在15‐20个碱基。单个抗原决定簇一般包含5‐8个碱基,那么15‐20个碱基的多肽一般会包含1个或更多个抗原决定簇。相对长一些的多肽段能够更好的保持和天然蛋白的一致性,更容易产生抗体。由于多肽是采用化学方法合成出来的,我们也要考虑到多肽合成的难度及其良好的可溶性。

我们一般会选择亲水区的多肽,其可溶性一般没太大问题,但是这些区域也会包含疏水性的碱基(如亮氨酸、色氨酸、异亮氨酸、缬氨酸、苯丙氨酸)。如果可能,尽量少选择带有这类氨基酸的多肽。谷氨酰胺由于容易和肽链形成氢键而导致多肽不可溶,所以具有多个谷氨酸的多肽也要尽量避免。

半胱氨酸有利于将多肽偶联到载体蛋白上。所以应该保留多肽N端或C端的半胱氨酸,以便于载体蛋白偶联,从而具有较好的免疫原性。同时两个或更多半胱氨酸的情况需要避免,因为它会造成多肽链之间形成二硫键,进而导致不溶和结构变化。当选择的多肽缺少半胱氨酸时,我们可以在N端或C端加上半胱氨酸。

脯氨酸采用顺式酰胺键的方式存在于多肽中,而一般多肽的酰胺键是反式的,它的存在更能使多肽与天然蛋白相似。在大多数情况下,脯氨酸的存在更能形成自然结构,增强多肽的免疫原性。

如果抗体用于识别目标蛋白翻译后的修饰区域(如磷酸化、糖基化位点),那么我们的多肽就需要在两端稍作延伸。从另一个方面来说,如果抗体用于识别翻译修饰前的蛋白,那么相应的位点需要去除掉。

跨膜区蛋白段需要移出掉,因为跨膜区无法被抗体接触到。

林林总总,经过层层规则的过滤,最终我们会保留至少3条多肽(经验证明3条多肽可以使抗体识别天然蛋白的成功率达到93%以上)。

化学合成的多肽,在抗体生产中,其浓度也影响着免疫应答反应。纯度越高,特异性免疫应答反应越强。

南京德泰生物的抗原预测软件能够综合多种预测算法,找到最符合要求的多肽,提高了预测成功率,减少了合成成本。

南京德泰生物提供免费的多肽抗原预测服务,也希望以上内容对您有帮助。

软件工程-数据库设计规范与命名规则

数据库设计规范、技巧与命名规范 一、数据库设计过程 数据库技术是信息资源管理最有效的手段。 数据库设计是指:对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,有效存储数据, 满足用户信息要求和处理要求。 数据库设计的各阶段: A、需求分析阶段:综合各个用户的应用需求(现实世界的需求)。 B、在概念设计阶段:形成独立于机器和各DBMS产品的概念模式(信息世界模型),用E-R图来描述。 C、在逻辑设计阶段:将E-R图转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式。 然后根据用户处理的要求,安全性的考虑,在基本表的基础上再建立必要的视图(VIEW)形成数据的外模式。 D、在物理设计阶段:根据DBMS特点和处理的需要,进行物理存储安排,设计索引,形成数据库内模式。 1. 需求分析阶段 需求收集和分析,结果得到数据字典描述的数据需求(和数据流图描述的处理需求)。 需求分析的重点:调查、收集与分析用户在数据管理中的信息要求、处理要求、安全性与完整性要求。 需求分析的方法:调查组织机构情况、各部门的业务活动情况、协助用户明确对新系统的各种要求、确定新系统的边界。 常用的调查方法有:跟班作业、开调查会、请专人介绍、询问、设计调查表请用户填写、查阅记录。 分析和表达用户需求的方法主要包括自顶向下和自底向上两类方法。自顶向下的结构化分析方法(Structured Analysis, 简称SA方法)从最上层的系统组织机构入手,采用逐层分解的方式分析系统,并把每一层用数据流图和数据字典描述。 数据流图表达了数据和处理过程的关系。系统中的数据则借助数据字典(Data Dictionary,简称DD)来描述。 2. 概念结构设计阶段 通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型,可以用E-R图表示。 概念模型用于信息世界的建模。概念模型不依赖于某一个DBMS支持的数据模型。概念模型可以转换为计算机上某一 DBMS 支持的特定数据模型。 概念模型特点: (1) 具有较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识。 (2) 应该简单、清晰、易于用户理解,是用户与数据库设计人员之间进行交流的语言。 概念模型设计的一种常用方法为IDEF1X方法,它就是把实体-联系方法应用到语义数据模型中的一种语义模型化技术, 用于建立系统信息模型。 使用IDEF1X方法创建E-R模型的步骤如下所示:

乙型脑炎病毒E蛋白结构域抗原表位鉴定

乙型脑炎病毒E 蛋白Ⅰ、Ⅱ结构域抗原表位鉴定 闫丽萍1,华荣虹2,亓文宝3,周艳君1,李国新1, 于 海1,姜一峰1,田志军2,童光志1* (1.中国农业科学院上海兽医研究所,上海200241;2.中国农业科学院哈尔滨兽医研究所兽医生物技术国家重点 实验室/猪传染病研究室,黑龙江哈尔滨150001;3.华南农业大学兽医学院,广东广州510642) 摘要:为鉴定乙型脑炎病毒(JEV)E 蛋白I ,II 结构域抗原表位,本研究设计了一系列针对E 蛋白的I 、II 结构域(1aa ~296aa)部分重叠短肽,分别进行GST 融合表达,用JEV 阳性血清进行western blot 和ELISA 反应性筛选,获得了5个线性抗原表位分别为:E1(1FNCLGMGNRDFIEGAS 16)、E10-4(77TGEAHNEK 84)、E11-2(83EKRADSS YVCKQ 94)、E19(145GTTTSENHGNYSAQVG 160)和E33(257SQEGGLHHALAGAIVV 272)。除E10和E19外,其它表位均为第一次通过实验方法确定的。将这5个融合蛋白对小鼠进行免疫,获得了高滴度的针对5个融合短肽的抗血清,研究证明了这些表位具有良好的免疫原性。本研究为乙型脑炎特异性诊断试剂及表位疫苗的开发奠定了基础。 关键词:乙型脑炎病毒;E 蛋白;抗原表位中图分类号:S852.65 文献标识码:A 文章编号:1008-0589(2010)01-0056-05 Antigenic epitopes mapping of domain I,II of Japanese encephalitis virus envelope protein YAN Li-ping 1,HUA Rong-hong 2,QI Wen-bao 3,ZHOU Yan-jun 1,LI Guo-xin 1, YU Hai 1,JIANG Yi-feng 1,TIAN Zhi-jun 2,TONG Guang-zhi 1* (1.Division of Swine Infectious Diseases,Shanghai Veterinary Research Institute,Chinese Academy of Agricultural Sciences,Shanghai 200241,China;2.Division of Swine Infectious Diseases,State Key Laboratory of Veterinary Biotechnology, Harbin Veterinary Research Institute,Chinese Academy of Agricultural Sciences,Harbin 150001,China;3.College of Veterinary Medicine,Southern China Agricultural University,Guangzhou 510642,China) Abstract:In order to map the antigenic epitopes domain Ⅰ,Ⅱof the envelope (E)protein of Japanese encephalitis virus (JEV),a set of partially overlapping fragments spanning the E protein were fused with GST and expressed.The reactivity of the fusion proteins was detected by western blot and ELISA.Five linear antigenic epitopes,E1(1FNCLGMGNRDFIEGAS 16),E10-4(77TGEA HNEK 84),E11-2(83EKRADSSYVCKQ 94),E19(145GTTTSENHGNYSAQVG 160)and E33(257SQEGGLHHALAGAIVV 272)were identified.Immunization of mice with the fusion proteins revealed that all five proteins could elicit short peptide specific antisera.These results provided important basis for study of the structure and function of domain I,II of the JEV E protein,and development of diagnostic techniques. Key words :Japanese encephalitis virus;envelope protein;epitope 收稿日期:2009-09-24 基金项目:院所长基金(2006-A-02) 作者简介:闫丽萍(1977-),女,黑龙江双鸭山人,助理研究员,博士,主要从事动物病毒分子生物学研究.*通信作者:E-mail :gztong@https://www.360docs.net/doc/e77764730.html, *Corresponding author 中国预防兽医学报 Chinese Journal of Preventive Veterinary Medicine 第32卷第1期2010年1月 Vol.32,No.1Jan.2010 流行性乙型脑炎(Japanese encephalitis ,JE),是由JE 病毒(JEV)引起的一种人与动物共同感染的蚊 媒病毒性疾病。JEV 主要侵害人的中枢神经系统,引起急性病毒性脑炎,导致高病死率(25%),或神经

甲型H1N1病毒HA、NA氨基酸序列比较及抗原性表位预测

龙源期刊网 https://www.360docs.net/doc/e77764730.html, 甲型H1N1病毒HA、NA氨基酸序列比较及抗原性表位预测 作者:邹泽红等 来源:《中国医学创新》2013年第19期 【摘要】目的:比较新型甲型H1N1流感病毒分离株HA、NA氨基酸序列之间的差异,分析HA、NA蛋白可能的抗原性细胞表位。方法:从GenBank中选取28株世界各地的新型甲型H1N1流感病毒分离株并下载各株HA、NA的氨基酸序列;使用Clustal X和MEGA 2.0软件对氨基酸序列的进行进化树分析;用Protean软件预测HA、NA蛋白的B细胞表位;用NetMHCⅡ 2.2预测T细胞抗原表位。结果:世界范围的毒株之间氨基酸序列相对保守,HA及NA均只有少数位点的变异,HA蛋白氨基酸序列之间较NA蛋白氨基酸序列之间变异较大; 预测HA蛋白具有8个B细胞表位和10个T细胞表位;NA蛋白有12个B细胞表位和7个T 细胞表位。结论:HA、NA蛋白的少数区域抗原性相对比较稳定,可以作为检测以及疫苗研究的靶区域。 【关键词】 H1N1流感病毒;抗原表位;血凝素;神经氨酸酶 2009年4月,在美国首次报道了两例感染新型甲型H1N1流感病毒患者[1],同时在墨西 哥出现了呼吸道感染的流行[2]。美国爆发的甲型H1N1流感迅速在北美洲地区蔓延,并很快波及亚洲、欧洲。新型甲型H1N1流感病毒是由禽流感、猪流感和人流感三种流感病毒的基因片段间的变异或重组产生的[3],已经引起世界性的大流行。 甲型H1N1流感能不断引起流行是由于其抗原性不断发生漂移所致[4],其中最重要是血凝素(hemagglutinin,HA)和神经氨酸酶(neuraminidase,NA)的变异[5]。血凝素是流感病毒最重要的蛋白,它的裂解性、受体特异性和糖基化是决定流感病毒感染性和致病性的重要因素。神经氨酸酶是病毒囊膜表面的另一种重要的糖蛋白,在决定病毒毒力和宿主特异性方面也具有重要作用,与HA共为流感病毒亚型分型的主要依据,NA同时也是抗流感病毒的重要作用靶点[6]。目前,国内虽然已经开发了H1N1流感疫苗并接种了2000多万人,但是,接种所致的不良反应事例的出现同样给健康的人们带来了灾难。有针对性地改造毒素的相应蛋白、获得更为安全有效的疫苗成为解决问题的关键,而解析甲型H1N1流感病毒HA、NA蛋白的抗 原性表位成为关键的突破口。 本研究分析了甲型H1N1流感病毒HA、NA蛋白抗原性变化的情况,并对其可能的抗原 性表位进行了分析预测,为新型甲型流感疫苗的制备提供依据,以便更有效及时地控制甲型流感的传播。 1 材料与方法

数据库设计方法及

数据库设计方法及命名规范

- - 2 数据库设计方法、规范与技巧 (5) 一、数据库设计过程 (5) 1. 需求分析阶段 (6) 2. 概念结构设计阶段 (9) 2.1 第零步——初始化工程 (10) 2.2 第一步——定义实体 (10) 2.3 第二步——定义联系 (11) 2.4 第三步——定义码 (11) 2.5 第四步——定义属性 (12) 2.6 第五步——定义其他对象和规则 (12) 3. 逻辑结构设计阶段 (13) 4. 数据库物理设计阶段 (15) 5. 数据库实施阶段 (15) 6. 数据库运行和维护阶段 (16) 7.建模工具的使用 (16) 二、数据库设计技巧 (18) 1. 设计数据库之前(需求分析阶段) (18) 2. 表和字段的设计(数据库逻辑设计) (19) 1) 标准化和规范化 (19) 2) 数据驱动 (20)

- - 3 3) 考虑各种变化 (21) 4) 对地址和电话采用多个字段 (22) 5) 使用角色实体定义属于某类别的列 (22) 6) 选择数字类型和文本类型尽量充足 (23) 7) 增加删除标记字段 (24) 3. 选择键和索引(数据库逻辑设计) (24) 4. 数据完整性设计(数据库逻辑设计) (27) 1) 完整性实现机制: (27) 2) 用约束而非商务规则强制数据完整性 (27) 3) 强制指示完整性 (28) 4) 使用查找控制数据完整性 (28) 5) 采用视图 (28) 5. 其他设计技巧 (29) 1) 避免使用触发器 (29) 2) 使用常用英语(或者其他任何语言)而不 要使用编码 (29) 3) 保存常用信息 (29) 4) 包含版本机制 (30) 5) 编制文档 (30) 6) 测试、测试、反复测试 (31) 7) 检查设计 (31) 三、数据库命名规范 (31) 1. 实体(表)的命名 (31) 2. 属性(列)的命名 (34)

抗原表位研究方法进展_宋帅

动物医学进展,2010,31(12):87-91Pr ogress in Veterinary Medicine 抗原表位研究方法进展 宋 帅,李春玲* ,贾爱卿,杨冬霞,李 淼 (广东省农业科学院兽医研究所 广东省兽医公共卫生实验室,广东广州510640) 收稿日期:2010-05-18 基金项目:广东省农业攻关项目(2007A020300005-11) 作者简介:宋 帅(1982-),男,河南汝州人,研究实习员,硕士,主要从事动物疫病及综合防控技术研究。*通讯作者 摘 要:抗原表位是抗原分子中的主要功能单位,能有效刺激机体的细胞免疫和体液免疫。随着免疫学和生物信息学技术的不断发展,用于研究T 细胞表位和B 细胞表位的方法得到了很大的提高。论文中概述了近几年用于研究T 细胞表位的预测方法和鉴定方法,以及在B 细胞表位研究中所用的表位肽扫描技术、蛋白质/切割0法、噬菌体展示技术、X -衍射与核磁共振、表位预测方法等技术,并对每种研究方法进行了比较,为从事抗原表位研究的人员提供参考,从而更有利于表位肽疫苗的研制和诊断方法的建立。 关键词:T 细胞表位;B 细胞表位;预测;鉴定 中图分类号:S852.4 文献标识码:A 文章编号:1007-5038(2010)12-0087-05 抗原表位又称抗原决定簇,是指抗原分子表面具有特殊结构和免疫活性的化学基团,具有刺激机体产生抗体或致敏淋巴细胞并能够被其识别的一个 免疫活性区。根据抗原表位特异性免疫应答的程度,可将抗原表位分为免疫优势表位、亚优势表位和隐性表位。根据与抗原受体结合细胞的不同,分为B 细胞抗原表位和T 细胞抗原表位;其中B 细胞抗原表位则往往为亲水性肽段,一般位于抗原三维大分子的氨基酸长链折叠处[1],而T 细胞抗原表位往往仅为埋藏在蛋白质空间结构内部的疏水性肽段[2]。根据表位对机体的影响,可分为保护性表位(免疫位)、致病性表位(变应位)和耐受性表位(耐受位)。按抗原表位结构的不同分为连续性抗原表位和非连续性抗原表位,前者又称线型表位,是由肽链上顺序连续的氨基酸组成,后者又称构象型表位,是由那些空间邻近但顺序上不连续的氨基酸组成。线型表位见于T 细胞表位和部分B 细胞表位,构象型表位只见于B 细胞表位[3]。在机体的免疫系统中,免疫细胞通常难以借助其表面受体识别整个蛋白质分子,仅识别抗原分子上的抗原决定簇,也就是说抗体的特异性是针对抗原表位而不是针对完整的抗原分子的[4]。表位一般只占5个~7个氨基酸或单糖残基的大小,最多不超过20个氨基酸残基。抗原表位是蛋白质抗原性的基础,所以深入研究蛋白质抗原表位对疾病的诊断及预后判定,定点改造蛋白质分子以降低蛋白质药物的免疫原性,设计无毒副作 用的人工疫苗以及免疫干预治疗等具有重要意义。 1 T 细胞表位的研究方法 T 细胞表位是抗原蛋白中经抗原递呈细胞(an -tig en presenting cell,APC)处理,由主要组织相溶性复合物(major histocompatibility com plex,MH C)分子递呈给T 淋巴细胞受体的多肽片段。主要涉及细胞毒性T 细胞(cytotox ic T cell,CT L )抗原表位和辅助性T 细胞(helper T cell,Th)抗原表位的研究,其中CT L 抗原表位与MH C ?类分子亲和肽相关,Th 抗原表位与M H C ò类分子的亲和肽相关。所以对T 细胞表位的筛选主要基于候选肽能否和MH C 分子结合。与M H C ?类分子结合的多肽长度通常为8个~11个氨基酸,一般为9个,在序列特定位置上有锚点存在。而MH C ò分子亲和肽长度可达30个氨基酸以上,其结合基序存在不同程度的退化[5]。随着免疫学和生物信息学技术的不断发展,对T 细胞表位的研究主要有以下几种方法。 1.1 合成肽法 在机体的免疫系统中,T 细胞主要识别抗原分子上的线型表位。所以根据抗原蛋白质分子的氨基酸序列随机合成或连续合成一个或几个重叠氨基酸的一系列肽段,然后通过多肽活性的检测实验进一步确定T 细胞表位。此方法鉴定的T 细胞表位较可靠,且能发现一些不符合多肽结合基序(motif)的MH C 结合抗原肽。Gerner W 等[6]将口蹄疫病毒结

数据库设计和编码规范

数据库设计和编码规范 Version

目录

简介 读者对象 此文档说明书供开发部全体成员阅读。 目的 一个合理的数据库结构设计是保证系统性能的基础。一个好的规范让新手容易进入状态且少犯错,保持团队支持顺畅,系统长久使用后不至于紊乱,让管理者易于在众多对象中,获取所需或理清问题。 同时,定义标准程序也需要团队合作,讨论出大家愿意遵循的规范。随着时间演进,还需要逐步校订与修改规范,让团队运行更为顺畅。 数据库命名规范 团队开发与管理信息系统讲究默契,而制定服务器、数据库对象、变量等命名规则是建立默契的基本。 命名规则是让所有的数据库用户,如数据库管理员、程序设计人员和程序开发人员,可以直观地辨识对象用途。而命名规则大都约定俗成,可以依照公司文化、团队习惯修改并落实。 规范总体要求 1.避免使用系统产品本身的惯例,让用户混淆自定义对象和系统对象或关键词。 例如,存储过程不要以sp_或xp_开头,因为SQL SERVER的系统存储过程以 sp_开头,扩展存储过程以xp_开头。 2.不要使用空白符号、运算符号、中文字、关键词来命名对象。 3.名称不宜过于简略,要让对象的用途直观易懂,但也不宜过长,造成使用不方 便。 4.不用为数据表内字段名称加上数据类型的缩写。 5.名称中最好不要包括中划线。

6.禁止使用[拼音]+[英语]的方式来命名数据库对象或变量。 数据库对象命名规范 我们约定,数据库对象包括表、视图(查询)、存储过程(参数查询)、函数、约束。对象名字由前缀和实际名字组成,长度不超过30。避免中文和保留关键字,做到简洁又有意义。前缀就是要求每种对象有固定的开头字符串,而开头字符串宜短且字数统一。可以讨论一下对各种对象的命名规范,通过后严格按照要求实施。例如:

蛋白抗原表位预测及抗原多肽设计

蛋白抗原表位预测及抗原多肽设计 利用在线软件BepiPred Server()从蛋白序列直接预测抗原表位 还有其他在线预测网站 进Antigenic Peptide Prediction 用tools 把氨基酸序列粘贴进去,就可以直接得出预测结果 抗原多肽选择的基本原则 1、尽可能是在蛋白表面 2、保证该段序列不形成α-helix 3、N,C端的肽段比中间的肽段更好 4、避免蛋白内部重复或接近重复段的序列 5、避免同源性太强的肽段 6、交联可以交联在N,C两端,选择依据就是交联在对产生抗体不太重要的一端 7、序列中不能有太多的Pro,但有一两个Pro有好处,可以使肽链结构相对稳定一些,对产生特异性抗体有益。 抗原多肽设计的基本原则 ????? 为了使生产抗体获得最佳效果,仔细地设计抗原多肽是很有必要的,设计应满足一个基本条件:在免疫过程中,该抗原既不会产生过强的免疫反应,同时又能产生出对感兴趣的蛋白有结合能力的抗体。尽管抗原设计是一个很复杂的课题,有诸多需要注意的细节,已超过了我们所能提供的范围,根据我们所积累的经验,有几点关键的基本设计原则可以提供给大家参考:

1、确定抗体的用途(应用)新开展一个研究项目,弄清楚所感兴趣的蛋白的一些基本特性是很有必要的,特别是如果知道蛋白的结构会对选择抗体易于接触和识别的识别区域有很大的帮助。然而,在没有这样精确的结构信息(多数是这种情况)的情况下,了解研究的用途(应用)会影响多肽设计的策略。例如:如果研究重点是集中在蛋白的不同区域,如C端或N端,或在一种特定状态下的蛋白,如磷酸化等,那么按照所需序列设计的多肽和产生的相应的抗体在应用上应该没有太大的困难,然而,蛋白的构象将影响抗体与其识别区域之间的相互作用。这种情况下可能存在的问题是如果在折叠的蛋白中,该识别区域被藏在蛋白的内部,抗体将无法接触到该区域。(无法产生相互作用)。 2、识别区域的选择原则一般说来最理想的抗原性识别区域应具备亲水、位于蛋白表面和结构上易变形性等特点。因为在大多数的天然(自然)环境中,亲水区域倾向于集中在蛋白表面,而疏水区域常常被包裹在蛋白内部,同样道理,抗体只能与在蛋白表面发现的识别区域相互作用,而当这些识别区域有足够的结构易变形性而转移到抗体可接触的位置时,将会与抗体间有很高的亲和性。 3、连续的与不连续的识别区域连续的区域是指由连续的氨基酸序列(残基)构成的识别区域。大多数抗体是针对连续识别区域的,抗体能与这类区域以很高的亲和力相结合表明这段序列不在蛋白内部。不连续的识别区域是代表有一定折叠的一段多肽序列,或是将两段分离开的多肽连在一起的抗体的识别区域。在某些情况下,针对这样不连续识别区域的抗体也能产生,只是用来免疫的抗原多肽必须具备与该不连续识别区域相似的二级结构,而序列的长度需要符合相关的要求。 4、基本建议为了避免识别区域隐藏在蛋白内部的风险,我们通常建议选择蛋白的N,C两端来产生的相应的抗体。因为在完整的蛋白中,N,C两端通常是暴露在蛋白表面的。然而,一定要注意膜蛋白的C端疏水性太强,不适合作为抗原。 5、序列的长度通常我们建议抗原多肽的序列长度在8-20个氨基酸残基之间,如果太短,就有多肽太特殊、所产生的抗体与天然蛋白之间的亲和力(结合能力)不够强的风险,同样,

数据库表设计的几条准则

数据库表设计的几条准则 前言:数据库设计在平时的工作是必不可少的,良好的表设计可以让我们查询效率更高,加快网站访问速度,提升用户体验,并且方便于我们查询数据。本篇博客就来聚焦一下,如何设计出高可复用,优良的表结构,从而在实际的工作中使我们写出更好的代码。 数据库表设计的几条黄金准则: 一:字段的原子性 解释:保证每列的原子性,不可分解,意思表达要清楚,不能含糊,高度概括字段的含义,能用一个字段表达清楚的绝不使用第二个字段,可以用两个字段表达清楚的绝不使用一个 字段 二:主键设计 解释:主键不要与业务逻辑有所关联,最好是毫无意义的一串独立不重复的数字,常见的比如UUID或者将主键设置为Auto_increment; 三:字段使用次数 解释:对于频繁修改的字段(一般是指状态类字段)最好用独立的数字或者单个字母去表示,不用使用汉字或者英文 四:字段长度 解释:建表的时候,字段长度尽量要比实际业务的字段大3-5个字段左右(考虑到合理性和伸缩性),最好是2的n次方幂值。不能建比实际业务太大的字段长度,这是因为如果字段长度过大,在进行查询的时候索引在B- Tree树上遍历会越耗费时间,从而查询的时间会越久;但是绝对不能建小,否则mysql数据会报错,程序会抛出异常; 五:关于外键 解释:尽量不要建立外键,保证每个表的独立性。如果非得保持一定的关系,最好是通过id 进行关联 六:动静分离 解释:最好做好静态表和动态表的分离。这里解释一下静态表和动态表的含义,静态表:存储着一些固定不变的资源,比如城市/地区名/国家。动态表:一些频繁修改的表 七:关于code值 解释:使用数字码或者字母去代替实际的名字,也就是尽量把name转换为code,因为name 可能会变(万一变化就会查询处多条数据,从而抛出错误),但是code一般是不会变化的.另一方面,code值存储的字符较少,也能减少数据库的压力 八:关于Null值 解释:不要有null值,有null值的话,数据库在进行索引的时候查询的时间更久,从而浪费更多的时间!

11-个重要的数据库设计规则

11-个重要的数据库设计规则

?简介 在您开始阅读这篇文章之前,我得明确地告诉您,我并不是一个数据库设计领域的大师。以下列出的11点是我对自己在平时项目实践和阅读中学习到的经验总结出来的个人见解。我个人认为它们对我的数据库设计提供了很大的帮助。实属一家之言,欢迎拍砖: ) 我之所以写下这篇这么完整的文章是因为,很多开发者一参与到数据库设计,就会很自然地把“三范式”当作银弹一样来使用。他们往往认为遵循这个规范就是数据库设计的唯一标准。由于这种心态,他们往往尽管一路碰壁也会坚持把项目做下去。 如果你对“三范式”不清楚,请点击这里(FQ)一步一步的了解什么是“三范式”。 大家都说标准规范是重要的指导方针并且也这么做着,但是把它当作石头上的一块标记来记着(死记硬背)还是会带来麻烦的。以下11点是我在数据库设计时最优先考虑的规则。 ?规则1:弄清楚将要开发的应用程序是什么性质的(OLTP 还是OPAP)?

当你要开始设计一个数据库的时候,你应该首先要分析出你为之设计的应用程序是什么类型的,它是“事务处理型”(Transactional)的还是“分析型”(Analytical)的?你会发现许多开发人员采用标准化做法去设计数据库,而不考虑目标程序是什么类型的,这样做出来的程序很快就会陷入性能、客户定制化的问题当中。正如前面所说的,这里有两种应用程序类型,“基于事务处理”和“基于分析”,下面让我们来了解一下这两种类型究竟说的是什么意思。 事务处理型:这种类型的应用程序,你的最终用户更关注数据的增查改删(CRUD,Creating/Reading/Updating/Deleting)。这种类型更加官方的叫法是“OLTP”。 分析型:这种类型的应用程序,你的最终用户更关注数据分析、报表、趋势预测等等功能。这一类的数据库的“插入”和“更新”操作相对来说是比较少的。它们主要的目的是更加快速地查询、分析数据。这种类型更加官方的叫法是“OLAP”。 那么换句话说,如果你认为插入、更新、删除数据这些操作在你的程序中更为突出的话,那就设计一个规范化的表否则的话就去创建一个扁平的、不规范化的数据库结构。

蛋白抗原表位预测算法及多肽抗原设计原则

https://www.360docs.net/doc/e77764730.html, 蛋白抗原表位预测算法 及多肽抗原设计原则 概述 为了获取识别天然蛋白的抗体,有两种方式可以选择。一种是利用重组蛋白的方式获取尽可能接近天然条件下的重组蛋白,然后刺激试验动物免疫系统,进而获取相应抗体。这种方式获取抗体的成功率较高且效价较好;另一种是预测天然蛋白的抗原决定簇,这种抗原决定簇最终体现为多肽形式,将其与相应的载体偶联后刺激试验动物免疫系统,也可以获取相应的抗体。这种方式的选择有其特殊需要。我们德泰生物科技南京有限公司提供这两种类型的抗体定制服务。 什么是抗原决定簇 蛋白质表面部分可以使免疫系统产生抗体的区域叫抗原决定簇。一般抗原决定簇是由6-12氨基酸或碳水基团组成,它可以是由连续序列(蛋白质一级结构)组成或由不连续的蛋白质三维结构组成。 蛋白抗原表位预测方法 目前蛋白质抗原表位预测的方法大致可以分为两类,一类是基于蛋白质高级结构预测,像beta-转角、膜蛋白跨膜区预测等;一种是基于氨基酸的统计学倾向性,像亲水性(hydrophilicity)、弹性(flexibility)、表面可接触性(surface accessibility)、抗原倾向性(antigenic propensity)。具体算法请参考相关文献,部分文献如下: 1)Chou,Fasman Adv Enzymol Relat Areas Mol Biol.1978;47:45-148. 2)Hopp,T.P.and Woods,K.R.(1981)https://www.360docs.net/doc/e77764730.html,A78,3824-3828. 3)Welling,G.W.,Weijer,W.J.,van der Zee,R.and Welling-Wester,S.(1985)FEBS Lett.188,215-218. 4)Karplus PA,Schulz GE.Naturwissenschafren1985;72:212-3. 5)Emini EA,Hughes JV,J Virol.1985Sep;55(3):836-9. 6)Parker,J.M.R.,Guo,D.and Hodges,R.S.(1986)Biochemistry25,5425-5432. 7)Schmidt,A.M.(1989)Biotect.Adv.7,187-213. 8) A.S.Kolaskar and Prasad C.Tongaonkar(1990)FEBS09210 9)K.Hofmann&W.Stoffel(1993) 10)Paul Horton,Keun-Joon Park,Takeshi Obayashi&Kenta Nakai,Proceedings of the4th Annual Asia Pacific Bioinformatics Conference,Taiwan.pp.39-48,2006. 11)Jens Erik Pontoppidan Larsen,Ole Lund and Morten Nielsen.Immunome Res.2006

规范化-数据库设计原则

规范化-数据库设计原则 关系数据库设计的核心问题是关系模型的设计。本文将结合具体的实例,介绍数据库设计规范化的流程。摘要 关系型数据库是当前广泛使用的数据库类型,关系数据库设计是对数据进行组织化和结构化的过程,核心问题是关系模型的设计。对于数据库规模较小的情况,我们可以比较轻松的处理数据库中的表结构。然而,随着项目规模的不断增长,相应的数据库也变得更加复杂,关系模型表结构更为庞杂,这时我们往往会发现我们写出来的SQL语句的是很笨拙并且效率低下的。更糟糕的是,由于表结构定义的不合理,会导致在更新数据时造成数据的不完整。因此,就有必要学习和掌握数据库的规范化流程,以指导我们更好的设计数据库的表结构,减少冗余的数据,借此可以提高数据库的存储效率,数据完整性和可扩展性。本文将结合具体的实例,介绍数据库规范化的流程。 序言 本文的目的就是通过详细的实例来阐述规范化的数据库设计原则。在DB2中,简洁、结构明晰的表结构对数据库的设计是相当重要的。规范化的表结构设计,在以后的数据维护中,不会发生插入(insert)、删除(delete)和更新(update)时的异常。反之,数据库表结构设计不合理,不仅会给数据库的使用和维护带来各种各样的问题,而且可能存储了大量不需要的冗余信息,浪费系统资源。 要设计规范化的数据库,就要求我们根据数据库设计范式――也就是数据库设计的规范原则来做。但是一些相关材料上提到的范式设计,往往是给出一大堆的公式,这给设计者的理解和运用造成了一定的困难。因此,本文将结合具体形象的例子,尽可能通俗化地描述三个范式,以及如何在实际工程中加以优化使用。规范化 在设计和操作维护数据库时,关键的步骤就是要确保数据正确地分布到数据库的表中。使用正确的数据结构,不仅便于对数据库进行相应的存取操作,而且可以极大地简化使用程序的其他内容(查询、窗体、报表、代码等)。正确进行表设计的正式名称就是"数据库规范化"。后面我们将通过实例来说明具体的规范化的工程。关于什么是范式的定义,请参考附录文章1. 数据冗余 数据应该尽可能少地冗余,这意味着重复数据应该减少到最少。比如说,一个部门雇员的电话不应该被存储在不同的表中,因为这里的电话号码是雇员的一个属性。如果存在过多的冗余数据,这就意味着要占用了更多的物理空间,同时也对数据的维护和一致性检查带来了问题,当这个员工的电话号码变化时,冗余数据会导致对多个表的更新动作,如果有一个表不幸被忽略了,那么就可能导致数据的不一致性。 规范化实例 为了说明方便,我们在本文中将使用一个SAMPLE数据表,来一步一步分析规范化的过程。 首先,我们先来生成一个的最初始的表。 CREATE TABLE "SAMPLE" ( "PRJNUM" INTEGER NOT NULL, "PRJNAME" VARCHAR(200), "EMYNUM" INTEGER NOT NULL, "EMYNAME" VARCHAR(200), "SALCATEGORY" CHAR(1), "SALPACKAGE" INTEGER)

数据库设计规范

1概述 1.1目的 软件研发数据库设计规范作为数据库设计的操作规范,详细描述了数据库设计过程及结果,用于指导系统设计人员正确理解和开展数据库设计。 1.2适用范围 1.3术语定义 DBMS:数据库管理系统,常用的商业DBMS有Oracle, SQL Server, DB2等。 数据库设计:数据库设计是在给定的应用场景下,构造适用的数据库模式,建立数据库及其应用系统,有效存储数据,满足用户信息要求和处理要求。 概念数据模型:概念数据模型以实体-关系 (Entity-RelationShip,简称E-R)理论为基础,并对这一理论进行了扩充。它从用户的观点出发对信息进行建模,主要用于数据库概念级别的设计,独立于机器和各DBMS产品。可以用Sybase PowerDesigner工具来建立概念数据模型(CDM)。 逻辑数据模型:将概念数据模型转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式。可

以用Sybase PowerDesigner工具直接建立逻辑数据模型(LDM),或者通过CDM转换得到。 物理数据模型:在逻辑数据模型基础上,根据DBMS特点和处理的需要,进行物理存储安排,设计索引,形成数据库内模式。可以用Sybase PowerDesigner工具直接建立物理数据模型(PDM),或者通过CDM / LDM转换得到。 2数据库设计原则 按阶段实施并形成该阶段的成果物 一般符合3NF范式要求;兼顾规范与效率 使用公司规定的数据库设计软件工具 命名符合公司标准和项目标准 3数据库设计目标 规范性:一般符合3NF范式要求,减少冗余数据。 高效率:兼顾规范与效率,适当进行反范式化,满足应用系统的性能要求。 紧凑性:例如能用char(10)的就不要用char(20),提高存储的利用率和系统性能,但同时也要兼顾扩展性和可移植性。 易用性:数据库设计清晰易用,用户和开发人员均能容

数据库设计规范

数据库设计规范 一、数据库设计过程 数据库技术是信息资源管理最有效的手段。数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,有效存储数据,满足用户信息要求和处理要求。 数据库设计中需求分析阶段综合各个用户的应用需求(现实世界的需求),在概念设计阶段形成独立于机器特点、独立于各个dbms产品的概念模式(信息世界模型),用e-r图来描述。在逻辑设计阶段将e-r图转换成具体的数据库产品支持的数据模型如关系模型,形成数据库逻辑模式。然后根据用户处理的要求,安全性的考虑,在基本表的基础上再建立必要的视图(view)形成数据的外模式。在物理设计阶段根据dbms特点和处理的需要,进行物理存储安排,设计索引,形成数据库内模式。 1. 需求分析阶段 需求收集和分析,结果得到数据字典描述的数据需求(和数据流图描述的处理需求)。 需求分析的重点是调查、收集与分析用户在数据管理中的信息要求、处理要求、安全性与完整性要求。 需求分析的方法:调查组织机构情况、调查各部门的业务活动情况、协助用户明确对新系统的各种要求、确定新系统的边界。 常用的调查方法有:跟班作业、开调查会、请专人介绍、询问、设计调查表请用户填写、查阅记录。 分析和表达用户需求的方法主要包括自顶向下和自底向上两类方法。自顶向下的结构化分析方法(structured analysis,简称sa方法)从最上层的系统组织机构入手,采用逐层分解的方式分析系统,并把每一层用数据流图和数据字典描述。 数据流图表达了数据和处理过程的关系。系统中的数据则借助数据字典(data dictionary,简称dd)来描述。 数据字典是各类数据描述的集合,它是关于数据库中数据的描述,即元数据,而不是数据本身。数据字典通常包括数据项、数据结构、数据流、数据存储和处理过程五个部分(至少应该包含每个字段的数据类型和在每个表内的主外键)。 数据项描述={数据项名,数据项含义说明,别名,数据类型,长度, 取值范围,取值含义,与其他数据项的逻辑关系} 数据结构描述={数据结构名,含义说明,组成:{数据项或数据结构}} 数据流描述={数据流名,说明,数据流来源,数据流去向, 组成:{数据结构},平均流量,高峰期流量} 数据存储描述={数据存储名,说明,编号,流入的数据流,流出的数据流, 组成:{数据结构},数据量,存取方式} 处理过程描述={处理过程名,说明,输入:{数据流},输出:{数据流}, 处理:{简要说明}}

MAGE_A家族抗原共同B细胞表位预测分析

?论 著? MAGE-A家族抗原共同B细胞表位预测分析 金劲激1,丁玉杰1,王冰冰2,侯柏龙2,张丽芳2,朱冠保1 (1.温州医科大学附属第一医院 胃肠外科,浙江 温州 325000;2.温州医科大学 分子病毒与免疫研究所,浙江 温州 325035) 收稿日期:基金项目:作者简介:通信作者:2013-05-17 浙江省自然科学基金资助项目(Y2100660)。金劲激(1988-),男,浙江瑞安人,硕士生。朱冠保,教授,硕士生导师,Email:zgbwmc@yahoo.com.cn。 黑色素瘤抗原A(MAGE-A)家族是一组在许多恶性肿瘤细胞如黑色素瘤、肺癌、胃癌等中高表达的 肿瘤抗原,而正常人体中仅在睾丸的生殖细胞、卵子和胎盘的滋养层细胞中表达。有研究表明,MAGE-A家族即MAGE-A1至MAGE-A12,其基因序列具有一定的同源性[1],在一种肿瘤组织或细胞中,可同时存在多种MAGE-A家族基因的表达[2]。因此,MAGE-A家族蛋白已成为肿瘤特异性抗原检测及免疫治疗的理想靶抗原[3-4]。而抗原表位,即抗原分子中决定抗原 [摘 要]目的:预测和筛选黑色素瘤抗原A(MAGE-A)家族抗原的共同B细胞表位。方法:以MAGE-A1的全长氨基酸序列为基础,利用生物信息学软件,采用Hopp&Woods的亲水性方案、Zimmerman极性参数和Jameson-Wolf抗原指数方案和Emini表面可及性方案等,结合MAGE-A1的二级结构与其柔性区域及跨膜区域对MAGE-A1的优势B表位区段进行综合分析,进一步运用抗原指数分析预测MAGE-A1的B细胞表位,并将其与MAGE-A家族中其他成员(MAGE-A2至A12)进行比对,以预测MAGE-A家族抗原的共同B细胞表位。结果:MAGE-A1的全长为309个氨基酸,相对分子质量为46 kDa,为可溶性蛋白。经综合分析,其B细胞优势表位可能存在于氨基酸序列N端的9~14,84~88,118~124,160~165,208~214,233~240区段;经与MAGE-A家族中其他成员的氨基酸序列比对,MAGE-A1的9~14,84~88,118~124及233~240区段,即HCKPEE,EEEGP,RAREPVTK,GEPRKLLT肽段可能为MAGE-A家族抗原共同B细胞优势表位。结论:利用生物信息学预测发现MAGE-A1的优势B细胞表位中,9~14,84~88,118~124及233~240区段可能为MAGE-A家族抗原的共同B细胞表位,可为表位疫苗的研制等提供理论依据。[关键词] 黑色素瘤抗原A家族;黑色素瘤抗原A1; B细胞表位;共同表位 [中图分类号] R730.2 [文献标志码] A [文章编号] 1000-2138(2013)11-0706-05 Comprehensive mapping of common immunodominant B-cell epitopes of MAGE-A subfamily JIN Jinji 1, DING Yujie 1, WANG Bingbing 2, HOU Bolong 2, ZHANG Lifang 2, ZHU Guanbao 1. 1.Department of Gastroenterological Surgery, the First Affiliated Hospital of Wenzhou Medical University, Wenzhou, 325000;2.Institute of Molecular Virology and Immunology, Wenzhou Medical University, Wenzhou, 325035 Abstract: Objective: To predict and screen the common B-cell epitopes of the melanoma antigen A (MAGE-A) subfamily. Methods: Base on the full-length amino acid sequence of the MAGE-A1, the B-cell epitopes of the MAGE-A1 protein was predicted by bioinformatics software, including the hydrophilic plot technique, polarity parameters, surface probability, antigenic index, and the secondary structure, along with its flexible regions and transmembrane region analysis, then antigenic index calculation was further taken as a standard to determine target epitopes. The amino acid sequence alignment of the predicting B epitopes of MAGE-A1 was blasted with the remain members of MAGE-A family (MAGE-A2 to A12) to predict the common B-cell epitope of MAGE-A subfamily.Results: The MAGE-A1 gene codes for a 46 kDa soluble protein consisted of 309 AA. The predicted B-cell epitopes of the MAGE-A1 might exist N-terminal of amino acid sequence: 9~14, 84~88, 118~124, 160~165, 208~214,233~240. Four of them, that is, the peptides about 9~14 (HCKPEE), 84~88 (EEEGP), 118~124(RAREPVTK)and 233~240 (GEPRKLLT) might be the common B cell epitopes of MAGE-A subfamily. Conclusion:Bioinformatics prediction provides a theoretical basis for the common B cell epitopes of MAGE-A subfamily. Key words: melanoma antigen A (MAGE-A) subfamily; melanoma antigen A1; B-cell epitope; common epitope

相关文档
最新文档