分布式企业服务总线平台数据集成研究及应用

第４１卷　第２期２０１４年２月计算机科学

Ｃｏｍｐ

ｕｔｅｒ　ＳｃｉｅｎｃｅＶｏｌ．４１Ｎｏ．２

Ｆｅｂ　

２０１４到稿日期：２０１３－０４－１３　返修日期：２０１３－０７－１１本文受浙江省重点科技创新团队（２００９Ｒ５０００９），重大科技专项重大工业项目（２０１２Ｃ１１０２６－２）资助。

范　菁（１９６９－），女，博士，教授，博士生导师，ＣＣＦ理事，主要研究方向为虚拟现实及可视化、软件中间件技术，Ｅ－ｍａｉｌ：ｆａｎｊｉｎｇ＠ｚｊｕｔ．ｅｄｕ．ｃｎ；熊丽荣（１９７３－），女，硕士，副教授，ＣＣＦ会员，主要研究方向为服务计算和软件中间件，Ｅ－ｍａｉｌ：ｌｉｌｙｂｅａｒ＠ｚｊｕｔ．ｅｄｕ．ｃｎ（通信作者）；徐　聪（１９８７－），男，硕士，主要研究方向为软件中间件技术。

分布式企业服务总线平台数据集成研究及应用

范　菁　熊丽荣　徐　聪

（浙江工业大学计算机学院　杭州３１００１４

）　

摘　要　为实现大规模的异构数据集成，解决数据源异地分布的问题，满足不同系统和应用之间的信息交互和共享，设计了一种企业服务总线（ＥＳＢ）平台下的数据集成模型。该模型采用ＷＳＤＬ和ＸＭＬ描述，能够结合ＥＳＢ系统的集成场景进行数据集成。提出了一种基于消息流程的负载均衡算法，该算法根据服务执行组件的负载情况和分布式节点的资源状况进行流程节点分配，并将其应用于分布式ＥＳＢ系统的应用集成模型中，能够高效地处理ＥＳＢ系统数据传输过程中的大量消息，有效解决应用流程执行时存在的消息处理能力低下的问题。最后，以医疗信息系统集成的仿真应用为例，在采用上述模型和算法的分布式ＥＳＢ平台上，验证了其在解决大规模异构数据服务集成以及消息处理的负载均衡问题时的可行性和有效性。

关键词　企业服务总线，数据集成模型，负载均衡，流程调度中图法分类号　ＴＰ３９１．９文献标识码　Ａ　

Ｒｅｓｅａｒｃｈ　ａｎｄ　Ａｐｐｌｉｃａｔｉｏｎ　ｏｆ　Ｄａｔａ　Ｉｎｔｅｇｒａｔｉｏｎ　ｉｎ　Ｄｉｓｔｒｉｂｕｔｅｄ　Ｅｎｔｅｒｐ

ｒｉｓｅ　Ｓｅｒｖｉｃｅ　Ｂｕｓ　ＰｌａｔｆｏｒｍＦＡＮ　Ｊｉｎｇ　ＸＩＯＮＧ　Ｌｉ－ｒｏｎｇ　ＸＵ　Ｃｏｎｇ

（Ｃｏｌｌｅｇｅ　ｏｆ　Ｃｏｍｐｕｔｅｒ，Ｚｈｅｊｉａｎｇ　Ｕｎｉｖｅｒｓｉｔｙ　

ｏｆ　Ｔｅｃｈｎｏｌｏｇｙ，Ｈａｎｇｚｈｏｕ　３１００１４，Ｃｈｉｎａ）　

Ａｂｓｔｒａｃｔ　Ｔｏ　ｉｍｐｌｅｍｅｎｔ　ｔｈｅ　ｉｎｔｅｇｒａｔｉｏｎ　ｏｆ　ｌａｒｇｅ　ｓｃａｌｅ　ｈｅｔｅｒｏｇｅｎｅｏｕｓ　ｄａｔａ，ｓｏｌｖｅ　ｔｈｅ　ｐｒｏｂｌｅｍ　ｏｆ　ｄａｔａ　ｓｏｕｒｃｅ　ｄｉｓｔｒｉｂｕｔｉｏｎａｎｄ　ｓａｔｉｓｆｙ　ｔｈｅ　ｒｅｑｕｉｒｅｍｅｎｔｄ　ｏｆ　ｉｎｆｏｒｍａｔｉｏｎ　ｃｏｍｍｕｎｉｃａｔｉｏｎ　ａｎｄ　ｓｈａｒｉｎｇ　ａｃｒｏｓｓ　ｖａｒｉｏｕｓ　ｓｙｓｔｅｍｓ　ａｎｄ　ａｐｐｌｉｃａｔｉｏｎｓ，ｔｈｉｓ　ｐａ－ｐｅｒ　ｐｒｅｓｅｎｔｅｄ　ａ　ｓｏｌｕｔｉｏｎ　ｆｏｒ　ｄａｔａ　ｉｎｔｅｇｒａｔｉｏｎ　ｉｎ　ｄｉｓｔｒｉｂｕｔｅｄ　ｅｎｔｅｒｐｒｉｓｅ　ｓｅｒｖｉｃｅ　ｂｕｓ　ｐｌａｔｆｏｒｍ．Ｔｈｅ　ｄａｔａ　ｍｏｄｅｌ　ｆｏｒ　ｉｎｔｅｇ

ｒａ－ｔｉｏｎ　ｂａｓｅｄ　ｏｎ　ＷＳＤＬ　ａｎｄ　ＸＭＬ　ｗａｓ　ｐｒｏｐｏｓｅｄ．Ｂｅｓｉｄｅｓ，ｔｏ　ｉｍｐｒｏｖｅ　ｐｅｒｆｏｒｍａｎｃｅ　ｏｎ　ｐｒｏｃｅｓｓｉｎｇ　ｌａｒｇｅ　ａｍｏｕｎｔ　ｏｆ　ｍｅｓｓａｇｅｓ，ａ　ｌｏａｄ　ｂａｌａｎｃｉｎｇ　ａｌｇｏｒｉｔｈｍ　ｂａｓｅｄ　ｏｎ　ｔｈｅ　ＥＳＢ　ｐｒｏｃｅｓｓ　ｗａｓ　ｐｒｅｓｅｎｔｅｄ．Ｔｈｉｓ　ａｌｇｏｒｉｔｈｍ　ｃａｎ　ａｌｌｏｃａｔｅ　ｔｈｅ　ｐｒｏｃｅｓｓ　ｎｏｄｅ　ａｃ－ｃｏｒｄｉｎｇ　ｔｏ　ｔｈｅ　ｌｏａｄ　ｏｆ　ｃｏｍｐｏｎｅｎｔ，ａｎｄ　ｉｓ　ａｐｐｌｉｅｄ　ｔｏ　ｔｈｅ　ｓｙｓｔｅｍ　ｉｎｔｅｇｒａｔｉｏｎ　ｍｏｄｅｌ　ｏｆ　ｔｈｅ　ｄｉｓｔｒｉｂｕｔｅｄ　ＥＳＢ　ｐｌａｔｆｏｒｍ．Ａｎ　ｅｘ－ａｍｐｌｅ　ｆｏｒ　ｈｏｓｐｉｔａｌ　ｉｎｆｏｒｍａｔｉｏｎ　ｓｙｓｔｅｍ　ｉｎｔｅｇｒａｔｉｏｎ　ｗａｓ　ｐｒｅｓｅｎｔｅｄ，ｗｈｉｃｈ　ｖｅｒｉｆｉｅｓ　ｔｈｅ　ｆｅａｓｉｂｉｌｉｔｙ　ａｎｄ　ｅｆｆｅｃｔｉｖｅｎｅｓｓ　ｏｆ　ｔｈｅｐｒｏｐｏｓｅｄ　ｆｒａｍｅｗｏｒｋ　ａｎｄ　ａｌｇｏｒｉｔｈｍ　ｔｏ　ｓｏｌｖｅ　ｔｈｅ　ｉｎｔｅｇｒａｔｉｏｎ　ｏｆ　ｌａｒｇｅｒ　ｓｃａｌｅ　ｈｅｔｅｒｏｇｅｎｅｏｕｓ　ｄａｔａ　ｓｏｕｒｃｅｓ　ａｎｄ　ｌｏａｄ　ｂａｌａｎｃｉｎｇｐ

ｒｏｂｌｅｍ．Ｋｅｙｗｏｒｄｓ　Ｅｎｔｅｒｐｒｉｓｅ　ｓｅｒｖｉｃｅ　ｂｕｓ，Ｄａｔａ　ｍｏｄｅｌ　ｆｏｒ　ｉｎｔｅｇｒａｔｉｏｎ，Ｌｏａｄ　ｂａｌａｎｃｅ，Ｐｒｏｃｅｓｓ　ｓｃｈｅｄｕｌｉｎｇ　

面对各种自治、

异构、分布的数据，如何实现异构数据源数据的灵活转换以及透明集成和访问，从而得到准确及时的高质量信息服务，是当前信息系统集成面临的重大课题。

数据集成是信息系统集成的基础和关键。被集成的数据

源通常是独立开发的，存在着语法和语义的异构性［

１］

。语法异构一般是指源数据和目的数据之间在命名规则、数据格式、数据类型等存在冲突；语义异构一般涉及领域知识，需要直接处理数据的内容，

复杂度高，解决的难度较大。用户一般希望在不影响原有系统运行和不需要进行物理数据集成的情况下，完成异构数据的透明访问。

在数据集成过程中，当集成的数据源数量不断增多时，系统中传输和交换的数据量也会不断变大，因此，安全可靠、高效的数据传输日益受到关注。

分布式企业服务总线（Ｄ－ＥＳＢ）是一种便利的中间件数据集成解决方案，主要是为了解决大规模的跨组织应用和服务集成问题。Ｄ－ＥＳＢ可以将相互关联的分布式异构数据源集成到一起，

使用户能够以透明的方式访问这些数据源。在基于ＥＳＢ的数据集成方法中，数据传输过程中请求消息会在事先指定的服务执行组件中进行处理和传递。但这种数据集成中的同步方式没有考虑数据传输过程中分布式ＥＳＢ节点的资源状况以及服务执行组件的消息处理能力，容易造成各个节点的负载分布不均、系统的运行效率降低。

本文研究分布式ＥＳＢ系统的数据集成方法。针对数据源异构性相关问题，本文开展了分布式ＥＳＢ系统的数据集成模型设计研究，采用适配器技术对异构数据源进行抽取，在ＥＳＢ系统中采用统一的ＸＭＬ数据共享格式，

将异构数据源·

６０２·

信息转换成基于ＷＳＤＬ的消息格式，把数据的集成问题转换成ＥＳＢ系统的面向流程的消息集成模型。针对数据传输过程的节点负载分布不均的问题，从数据传输效率的角度，本文研究了分布式ＥＳＢ数据集成的性能问题，采用基于流程负载均衡算法来提高效率。最后在钱塘ＥＳＢ系统上将上述方法应用于面向医疗信息的数据集成，证明了本文方法的有效性。

１　国内外研究现状

在数据集成中异构数据源之间往往存在着语法和语义方面的数据冲突问题。ＸＭＬ技术能够较好地解决语法层面的数据冲突［２，３］，而对于语义层的异构问题，一般采用知识库和本体技术［４，５］，通过描述不同数据源的概念信息，并构建语义映射关系加以解决。

已有的数据集成工作主要采用联邦数据库系统、数据仓库技术和基于中间件的信息集成技术来实现。

联邦数据库系统（ＦＤＳ）是多数据库系统数据集成方法，在已存在的局部数据库（Ｌｏｃａｌ　Ｄａｔａｂａｓｅ　Ｓｙｓｔｅｍ，ＬＤＳ）之上为用户提供统一的存取数据环境。ＦＤＳ由一组独立的ＬＤＳ组成，实现数据库系统间部分数据的共享［６］。

以数据仓库（Ｄａｔａ　Ｗａｒｅｈｏｕｓｅ，ＤＷ）为主的数据集成方法，通过对相关数据库的链接，抽取数据记录，复制需要的字段，将异构或同构数据源相关数据复制到特定数据源上，从而解决数据的分布和异构的问题，达到集成的目的。

上述两种方法对异构数据大都采取先把数据转换为统一、静态的格式，再将数据转换和整合规则融合在定制代码中。由于应用系统代码与数据库模式紧密耦合，不能适应数据动态变化，这两种数据集成方案较脆弱。

目前主流的数据集成方式是基于中间件的数据集成方案。传统的中间件解决方案是用ＤＣＯＭ、ＣＯＲＢＡ及ＲＭＩ等分布式对象模型来构建信息集成系统。这种方法可以有效地避免联邦数据库系统开发代价大、代码重用难的问题，但分布式对象模型要求服务客户端与服务之间必须进行紧密耦合。

随着ＳＯＡ框架和Ｗｅｂ　Ｓｅｒｖｉｃｅ技术的发展，传统应用中间件向企业服务总线（Ｅｎｔｅｒｐｒｉｓｅ　Ｓｅｒｖｉｃｅ　Ｂｕｓ，ＥＳＢ）过渡。ＥＳＢ成为企业数据集成采用的主流技术，它将基于事件驱动架构（Ｅｖｅｎｔ－Ｄｒｉｖｅｎ　Ａｒｃｈｉｔｅｃｔｕｒｅ，ＥＤＡ）的思想与面向服务体系架构（Ｓｅｒｖｉｃｅ－Ｏｒｉｅｎｔｅｄ　Ａｒｃｈｉｔｅｃｔｕｒｅ，ＳＯＡ）的思想相结合，简化业务单元的集成，在异构平台和环境之间建立了联系［７］。ＥＳＢ系统的消息转换和消息路由功能为数据异构性问题提供了解决方案。

集成大量的异构数据源需要建立高效、可靠的数据传输机制，集中式的ＥＳＢ实现架构难以满足集成的需求。ＩＢＭ提出了联邦式的ＥＳＢ模式以及中介式的ＥＳＢ模式，将多个服务总线通过ＪＭＳ相联接，以支持大规模的跨组织应用集成［８］。国内外对ＥＳＢ的实现架构进行了大量研究，并建立了多个基于ＪＢＩ（Ｊａｖａ　Ｂｕｓｉｎｅｓｓ　Ｉｎｔｅｇｒａｔｉｏｎ）规范的分布式ＥＳＢ平台，如Ｍｕｌｅ　ＥＳＢ［９］、Ａｐａｃｈｅ　ＳｅｒｖｉｃｅＭｉｘ［１０］、Ｏｐｅｎ　ＥＳＢ［１１］等。目前的一些分布式ＥＳＢ系统已经可以支持应用整合、复杂业务集成以及消息的可靠传输。

在负载均衡方面，动态负载均衡策略考虑的关键问题是及时、准确地把握节点的负载状况，并根据各节点当前的负载

状态来动态调整和分配任务［１２］。动态负载均衡策略一般可分为两类［１３］，一类是求最优解问题，即集群系统的节点提供系统负载、流量及其他一些资源信息，并通过高效通信机制传给负载均衡器，负载均衡器监视所有节点的状态，以便将下一个任务分配给负载最轻的节点。在进行负载最轻的决策时，由于系统处于不断变化中，从更新负载信息到做出决策之间存在时间差，有可能出现负载信息过时的状况。为了解决这一问题，有些研究人员提出先从全集中随机选取包含Ｋ个元素的子集，再从子集中选择负载最低的一个［１４，１５］。这种基于反馈的动态选取方式虽然存在一些局限性，但是对于节点数相对较少的分布式系统来说仍然是一种行之有效的方式［１６，１７］。另一类动态负载均衡策略主要是通过负载迁移的方式来保持节点之间的负载均衡［１８－２０］，这种策略的关键是确定过载和轻载的对象，以及需要迁移的负载数。负载迁移虽然可以较好地处理系统的过载现象，但是频繁的负载迁移会增加系统的额外开销，而且还会造成“负载抖动”问题［２１］。

在基于企业服务总线系统的负载均衡机制方面，目前主流的开源ＥＳＢ项目如Ｍｕｌｅ和ＳｅｒｖｉｃｅＭｉｘ都在一定程度上加入了一些负载均衡的实现，但是Ｍｕｌｅ　ＥＳＢ的集群比较弱，只能配置一个主实例和一个从实例，因此它的负载均衡机制主要是为了解决服务路由的问题，即根据集成到总线上的服务负载状况，选择负载最轻的一个作为目标服务，以此确定路由路径［２２］。

目前，国内外针对基于分布式企业服务总线实现架构下的负载均衡机制的研究还比较少，尤其是面向数据集成场景时，多个集群节点中大量数据消息的负载平衡仍是需要解决的问题。

本文主要研究分布式ＥＳＢ系统中的数据集成模型及方法，以解决异构数据的集成问题，并通过设计负载均衡策略来保证系统在大规模数据集成时的效率。

２　分布式企业服务总线Ｄ－ＥＳＢ

服务总线系统通过实现多种中介模式来生成特定的中介组件。中介组件的主要工作就是消息表现层的转换和消息内容的转换，消息表现层转换是指改变消息格式，而消息内容的转换主要是为了解决数据集成中的语法及语义异构性问题。

在企业服务总线系统中，可以通过实现特定的组件来完成传输协议的转化，这类组件也通常被称为适配组件，例如数据库适配器、ＨＴＴＰ适配器等。此外，在ＥＳＢ中，可以通过服务端点来实现服务提供者的地址透明性，因为每一个接入的服务都会暴露成一个服务端点，而服务端点又与特定的适配器相绑定。

本文研究的分布式企业服务总线结构如图１所示。整个框架由ＥＳＢ主节点、ＥＳＢ从节点、监控管理平台以及流程建模工具４部分组成。ＥＳＢ主节点主要负责分布式环境管理，监控和统计各个客户端的资源信息，并且通过加载中介组件来提供消息转换和消息路由的功能。ＥＳＢ从节点主要负责异构系统及外部应用的接入。监控管理平台是ＥＳＢ服务端与平台管理员的可视化接口，管理员可以通过Ｃｏｎｓｏｌｅ完成对各个客户端的资源管理以及消息流监控。流程建模工具给用户提供了图形化工具来完成集成场景的建模和部署。

７

０

２

图１　分布式企业服务总线结构图

３　分布式ＥＳＢ系统的数据集成模型

３．１　基于消息的数据集成方法

分布式ＥＳＢ系统采用基于消息的数据集成方法。在这种基于消息的数据集成方法中，适配器作为企业服务总线的一种消息处理组件，主要充当外部异构数据源与总线之间交互的代理，异构数据源通过适配器接入ＥＳＢ总线。适配器和ＥＳＢ总线，以及ＥＳＢ总线内部通过消息进行通信。

分布式ＥＳＢ系统的数据集成基本思路如下：

１

）企业服务总线平台在系统／异构数据源的数据传递与互操作上采用ＸＭＬ作为数据描述与交换的语言。

２

）将异构数据源抽象成统一的ＸＭＬ格式数据。将ＸＭＬ数据封装成ＪＭＳ消息，将异构数据源数据的转换和传输问题转换成ＥＳＢ环境下的消息转换和路由问题。

３）通过ＸＳＬＴ转换引擎实现对不同的ＸＭＬ消息格式的转换。

面向数据集成的ＥＳＢ消息转换工作流程如图２所示

。

图２　基于ＸＭＬ的ＥＳＢ消息转换工作流程图

消息转换的整个流程可分为应用接入和数据转换两个过程。

作为应用接入部分的适配器逻辑完成对具体数据源的包装、连接及各种读写操作。一方面它将从数据源获取的结构化、半结构化数据转换为公共的基于ＸＭＬ的数据格式，并以消息流的方式发送到下一个消息组件（

转换中介）的消息通道中；

另一方面，适配器从消息转换中介的消息通道中取出消息，并将消息体中经过转换的数据格式转换成需要的结构化或半结构化数据，输送到目的数据源。

而ＥＳＢ的中介模块的作用是接收消息发送者所定义格式的消息，经过转换或者路由以后以消息接收者所预期的格式传递到接收方。这个过程中涉及到多方面的消息处理，可以是对消息的格式、内容进行转化，也可以是加密、解密等自定义操作。

在数据集成中，适配器既可以作为服务提供者，也可以作为服务的消费者。以数据库适配器为例，作为服务提供者的数据库适配器提供了４个接口，即ＣＲＵＤ这４种数据库操作，这些操作可以通过标准的服务描述规范配置成具体的某一个服务发布到注册中心。外部系统可以通过服务注册中心查找特定种类的服务，在获得服务的描述信息以后去调用服务进行具体操作。而在ＥＳＢ环境内部中，适配器可以接收到消息通道中的ＥＳＢ消息，

并对消息内容进行解析和提取，之后调用数据库适配器内部接口进行具体的数据库操作。处理完成后通过适配器把回复内容转化为ＥＳＢ消息，消息目标为服务消费者的回复端点。

作为服务消费者的数据库适配器可以定时地检测本地数据库表是否有记录更新，发现有新的记录则将更新的内容封装成ＥＳＢ消息以后进行输出。适配器只需要知道要负责监听的数据库表的地址就可以完成如上的操作。

对于如何提供这个地址给适配器，具体的适配器解决的方式也可以不同。比如，

可以将监听地址配置在流程中，当适配器框架部署某个适配器的流程时将地址信息部署到该适配器上，之后适配器就能够启动监听；另一种方式也可以将监听地址的信息配置在服务配置文件中，在部署服务的时候将地址信息部署到某个具体适配器上，

之后在部署服务端点的时候适配器启动监听。本文的数据库适配器在开发的时候选择了后者的处理方式。

３．２　基于ＷＳＤＬ的消息模型

企业服务总线平台内部的适配模块要在异构系统与ＥＳＢ之间提供代理的功能，特定的适配器可以抽象出接入到总线上的数据源的具体实现，通过协调不同系统间的传输协议（例如ＦＩＬＥ、ＪＭＳ、ＳＯＡＰ、ＪＤＢＣ等）来完成消息转换过程中的传输层转换。为了实现上述功能以及组件间的交互通信，在面向数据集成的企业服务总线平台中定义了基于ＷＳＤＬ的消息模型。

ＪＢＩ规范中使用ＷＳＤＬ１．１和２．０规范描述组件所提供的和消费的服务模型。ＷＳＤＬ在以下两个层面上定义了基于消息的服务模型：

１

）抽象服务模型：使用抽象消息模型定义的、未限制到特定消息交换协议的服务。ＷＳＤＬ服务描述中抽象服务模型需

要定义以下几个元素：抽象消息类型（Ｍｅｓｓａｇｅ　Ｔｙｐｅ）、抽象操作（Ｏｐｅｒａｔｉｏｎ）以及抽象服务类型（Ｓｅｒｖｉｃｅ　Ｔｙｐ

ｅ）。２

）具体服务模型：建立在抽象服务模型之上，为抽象服务同特定通信协议及通信端点的映射提供描述信息。ＷＳＤＬ具体服务模型需要定义以下几个元素：绑定类型（ＢｉｎｄｉｎｇＴｙｐ

ｅ）、端点（Ｅｎｄｐｏｉｎｔ）以及服务（Ｓｅｒｖｉｃｅ）。以外部应用为数据库系统为例，在面向数据集成的企业

８０２·

服务总线平台中定义了如下的基于ＷＳＤＬ的消息模型：１）ｔｙｐｅ：Ｍｅｓｓａｇｅ　Ｔｙｐｅ表示抽象消息类型，类型中定义了合法的消息结构和约束，一般通过ＸＭＬ　Ｓｃｈｅｍａ来表示，如图３所示。

〈？ｘｍｌ　ｖｅｒｓｉｏｎ＝＂１．０＂ｅｎｃｏｄｉｎｇ＝＂ＵＴＦ－８０＂？〉

〈ｗｓｄｌ：ｄｅｆｉｎｉｔｉｏｎｓ　ｔａｒｇｅｔＮａｍｅｓｐａｃｅ＝＂ｈｔｔｐ：／／ｗｗｗ．ｚｊｕ．ｏｒｇ／ｓｙｎｅｒ－ｇｙ／＂

ｘｍｌｎｓ＝＂ｈｔｔｐ：／／ｓｃｈｅｍａ．ｘｍｌｓｏａｐ．ｏｒｇ／ｗｓｄｌ／＂

ｘｍｌｎｓ：ｎｓ＝＂ｈｔｔｐ：／／ｊ２ｅｅ．ｎｅｔｂｅａｎｓ．ｏｒｇ／ｘｓｄ／ｔａｂｌｅＳｃｈｅｍａ＂

ｘｍｌｎｓ：ｗｓｄｌ＝＂ｈｔｔｐ：／／ｓｃｈｅｍａｓ．ｘｍｌｓｏａｐ．ｏｒｇ．ｗｓｄｌ／＂

ｘｍｌｎｓ：ｔｎｓ＝＂ｈｔｔｐ：／／ｗｗｗ．ｚｊｕ．ｏｒｇ／ｓｙｎｅｒｇｙ／＂

ｘｍｌｎｓ：ｘｓｄ＝＂ｈｔｔｐ：／／ｗｗｗ．ｗ３．ｏｒｇ／２００１／ＸＭＬＳｃｈｅｍａ＂

ｘｍｌｎｓ：ｊｄｂｃ＝＂ｈｔｔｐ：／／ｗｗｗ．ｚｊｕ．ｏｒｇ／ｅｓｂ／ｗｓｄｌ－ｅｘｔｅｎｓｉｏｎｓ／ｊｂｄｃ／＂〉〈ｗｓｄｌ：ｄｏｃｕｍｅｎｔａｔｉｏｎ／〉

〈ｗｓｄｌ：ｔｙｐｅｓ〉

　〈ｘｓｄ：ｓｃｈｅｍａ〉

〈ｘｓｄ：ｉｍｐｏｒｔ　ｎａｍｅｓｐａｃｅ＝＂ｈｔｔｐ：／／ｊ２ｅｅ．ｎｅｔｂｅａｎｓ．ｏｒｇ／ｘｓｄ／ｔａｂｌｅ－Ｓｃｈｅｍａ＂ｓｃｈｅｍａＬｏｃａｔｉｏｎ＝＂ＰＥＲＳＯＮ．ｘｓｄ＂／〉

　〈／ｘｓｄ：ｓｃｈｅｍａ〉

〈／ｗｓｄｌ：ｔｙｐｅｓ〉

图３　ＷＳＤＬ消息模型中的抽象消息类型定义

ｔｙｐｅ元素中通过ｉｍｐｏｒｔ引入的ＸＳＤ文件（ＸＭＬ　ＳｃｈｅｍａＤｅｆｉｎｉｔｉｏｎ）即ＸＭＬ结构定义，描述了ＸＭＬ文档的存放结构，因此可以通过该文件来生成ＪＭＳ消息体中的ＸＭＬ文档格式。例如，当外部应用为数据库系统时，数据接入服务需要在ＸＭＬ文档结构和数据库结构之间建立映射，把数据从数据库转换成ＸＭＬ文档，或者把一个ＸＭＬ文档转换到数据库中。本文将关系模式映射到ＸＭＬ模式，图４表示了将数据库表ｐｅｒｓｏｎ结构映射成ＸＭＬ　Ｓｃｈｅｍａ的ｐｅｒｓｏｎ．ｘｓｄ文件。

／＊个人信息结构表＊／

ｃｒｅａｔｅ　ｔａｂｌｅ　ｐｅｒｓｏｎ（

ｉｄ　ｖａｒｃｈａｒ（１０），

ｎａｍｅ　ｖａｒｃｈａｒ（２５５）ｎｏｔ　ｎｕｌｌ，

ｐｒｏｃｅｓｓｅｄ　ｂｏｏｌｅａｎ，

ｃｏｎｓｔｒａｉｎｔ　ｐｋ＿ｉｄ　ｐｒｉｍａｒｙ　ｋｅｙ（ｉｄ）

）；

〈？ｘｍｌ　ｖｅｒｓｉｏｎ＝＂１．０＂ｅｎｃｏｄｉｎｇ＝＂ＵＴＦ－８０＂？〉

〈ｘｓｄ：ｓｃｈｅｍａ　ｅｌｅｍｅｎｔＦｏｒｍＤｅｆａｕｌｔ＝＂ｑｕａｌｉｆｉｅｄ＂

　ｔａｒｇｅｔＮａｍｅｓｐａｃｅ＝＂ｈｔｔｐ：／／ｊ２ｅｅ．ｎｅｔｂｅａｎｓ．ｏｒｇ／ｘｓｄ／ｔａｂｌｅＳｃｈｅｍａ＂

ｘｍｌｎｓ＝＂ｈｔｔｐ：／／ｊ２ｅｅ．ｎｅｔｂｅａｎｓ．ｏｒｇ／ｘｓｄ／ｔａｂｌｅＳｃｈｅｍａ＂

ｘｍｌｎｓ：ｘｓｄ＝＂ｈｔｔｐ：／／ｗｗｗ．ｗ３．ｏｒｇ／２００１／ＸＭＬＳｃｈｅｍａ＂

〈ｘｓｄ：ｅｌｅｍｅｎｔ　ｎａｍｅ＝＂ＰＥＲＳＯＮ＂ｔｙｐｅ＝＂ＰＥＲＳＯＮ＂／〉

〈ｘｓｄ：ｃｏｍｐｌｅｘＴｙｐｅ　ｎａｍｅ＝＂ＰＥＲＳＯＮ＂〉

　〈ｘｓｄ：ｓｅｑｕｅｎｃｅ　ｎａｍｅ＝＂ＰＥＲＳＯＮ＂〉

〈ｘｓｄ：ｅｌｅｍｅｎｔ　ｎａｍｅ＝＂ＩＤ＂ｔｙｐｅ＝＂ｘｓｄ：ｓｔｒｉｎｇ＂／〉

〈ｘｓｄ：ｅｌｅｍｅｎｔ　ｎａｍｅ＝＂ＮＡＭＥ＂ｔｙｐｅ＝＂ｘｓｄ：ｓｔｒｉｎｇ＂／〉

〈ｘｓｄ：ｅｌｅｍｅｎｔ　ｎａｍｅ＝＂ＰＲＯＣＥＳＳＥＤ＂ｔｙｐｅ＝＂ｘｓｄ：ｂｏｏｌｅａｎ＂／〉　〈／ｘｓｄ：ｓｅｑｕｅｎｃｅ〉

〈／ｘｓｄ：ｃｏｍｐｌｅｘＴｙｐｅ〉

〈／ｘｓｄ：ｓｃｈｅｍａ〉

图４　数据库表映射为ＸＭＬ　Ｓｃｈｅｍａ文件ｐｅｒｓｏｎ．ｘｓｄ

２）ｏｐｅｒａｔｉｏｎ：Ａｂｓｔｒａｃｔ　Ｏｐｅｒａｔｉｏｎ表示抽象操作，它定义了与某种服务进行交互的一次操作，抽象操作中一般定义了

操作名称、消息交换模式以及消息类型。

３）ｐｏｒｔＴｙｐｅ：ｐｏｒｔＴｙｐｅ表示抽象服务类型，也可以称为“服务接口（ｉｎｔｅｒｆａｃｅ）”，它是一组相关联的抽象操作（ｏｐｅｒａ－ｔｉｏｎ）的集合，图５中定义了一个名称为ｊｄｂｃＰｏｌｌｅｒＰｏｒｔＴｙｐｅ的接口，该接口定义了一个名称为ｐｏｌｌｒｅｃｏｒｄｓ的抽象操作。〈ｗｓｄｌ：ｐｏｒｔＴｙｐｅ　ｎａｍｅ＝＂ｊｄｂｃＰｏｌｌｅｒＰｏｒｔＴｙｐｅ＂〉

　〈ｗｓｄｌ：ｏｐｅｒａｔｉｏｎ　ｎａｍｅ＝＂ｐｏｌｌｒｅｃｏｒｄｓ＂〉

〈ｗｓｄｌ：ｉｎｐｕｔ　ｎａｍｅ＝＂ｉｎｐｕｔＰｏｌｌ＂ｍｅｓｓａｇｅ＝＂ｔｎｓ：ｉｎｐｕｔＭｓｇ＂〉

〈／ｗｓｄｌ：ｉｎｐｕｔ〉

　〈／ｗｓｄｌ：ｏｐｅｒａｔｏｎ〉

〈／ｗｓｄｌ：ｐｏｒｔＴｙｐｅ〉

〈ｗｓｄｌ：ｂｉｎｄｉｎｇ　ｎａｍｅ＝＂ｐｏｌｌｅｒＢｉｎｄｉｎｇ＂ｔｙｐｅ＝＂ｔｎｓ：ｊｄｂｃＰｏｌｌｅｒＰｏｒｔ－Ｔｙｐｅ＂〉

　〈ｊｄｂｃ：ｂｉｎｄｉｎｇ／〉

　〈ｗｓｄｌ：ｏｐｅｒａｔｉｏｎ　ｎａｍｅ＝＂ｐｏｌｌｒｅｃｏｒｄｓ＂〉〈ｊｄｂｃ：ｏｐｅｒａｔｉｏｎ／〉

〈ｗｓｄｌ：ｉｎｐｕｔ　ｎａｍｅ＝＂ｉｎｐｕｔＰｏｌｌ＂〉

〈ｊｄｂｃ：ｉｎｐｕｔ　ＴａｂｌｅＮｍａｅ＝＂ＰＥＲＳＯＮ＂ｏｐｅｒａｔｉｏｎＴｙｐｅ＝＂ｐｏｌｌ＂ＰＫＮａｍｅ＝＂ＩＤ＂ｐａｒａｍＯｒｄｅｒ＝＂＂ｒｅｓｕｌｔＯｒｄｅｒ＝＂ｉｄ，ｎａｍｅ＂

ＰｏｌｌＭｉｌｌｉＳｅｃｏｎｄ＝＂５００＂ＭａｒｋＣｏｌｕｍｎＮａｍｅ＝＂ＰＲＯＣＥＳＳＥＤ＂

ＭａｒｋＣｏｌｕｍｎＶａｌｕｅ＝＂１＂

ｓｑｌ＝＂ｓｅｌｅｃｔ　ｉｄ，ｎａｍｅ　ｆｒｏｍ　ｐｅｒｓｏｎ　ｗｈｅｒｅ　ｐｒｏｃｅｓｓｅｄ＝ｆａｌｓｅ＂／〉〈／ｗｓｄｌ：ｉｎｐｕｔ〉

〈／ｗｓｄｌ：ｏｐｅｒａｔｉｏｎ〉

〈／ｗｓｄｌ：ｂｉｎｄｉｎｇ〉

图５　ＷＳＤＬ消息模型中的操作定义

４）ｂｉｎｄｉｎｇ：ｂｉｎｄｉｎｇ表示绑定类型，它是对ｐｏｒｔＴｙｐｅ中定义的服务接口的具体实现，在图５的ｗｓｄｌ：ｂｉｎｄｉｎｇ元素内部定义了ｐｏｌｌｒｅｃｏｒｄｓ操作的实现细节。

５）ｓｅｒｖｉｃｅ：ｓｅｒｖｉｃｅ提供了访问该服务的一组端点的集合，每一个服务实现了特定的服务类型（接口），其中包括了服务名称、服务类型名称（ｐｏｒｔＴｙｐｅ）以及端点，图６中定义了访问服务类型名称为ｐｏｌｌｅｒＰｏｒｔ的一个端点。

〈ｗｓｄｌ：ｓｅｒｖｉｃｅ　ｎａｍｅ＝＂ｊｄｂｃ－ｓｅｒｖｉｃｅ＂〉

　〈ｗｓｄｌ：ｐｏｒｔ　ｎａｍｅ＝＂ｐｏｌｌｅｒＰｏｒｔ＂ｂｉｎｄｉｎｇ＝＂ｔｎｓ：ｐｏｌｌｅｒＢｉｎｇｉｎｇ＂〉

〈ｊｄｂｃ：ａｄｄｒｅｓｓ　ｄｉａｌｅｃｔ＝＂ｍｙｓｑｌ＂

ｄｒｉｖｅｒＣｌａｓｓＮａｍｅ＝＂ｃｏｍ．ｍｙｓｑｌ．ｊｄｂｃ．Ｄｒｉｖｅｒ＂

ｄｂＵＲＬ＝＂ｊｄｂｃ：ｍｙｓｑｌ：／／ｌｏｃａｌｈｏｓｔ：３３０６／ｄｅｆａｕｌｔｄｂ＂

ｕｓｅｒＮａｍｅ＝＂ｒｏｏｔ＂ｐａｓｓｗｏｒｄ＝＂ｒｏｏｔ＂／〉

〈／ｗｓｄｌ：ｐｏｒｔ〉

〈／ｗｓｄｌ：ｓｅｒｖｉｃｅ〉

图６　ＷＳＤＬ消息模型中的端点定义

３．３　基于ＸＳＬＴ的消息转换

企业服务总线平台内部所涉及的消息转换按层次角度区分，可以分为３类：传输层转换、消息表现层转换和消息内容转换层。其中传输层转换主要是为了协调不同系统间传输协议的区别，主要由适配模块完成；消息中介模块则负责消息表现层转换与消息内容转换层，图２中所示即为将应用Ａ格式的数据转换为应用Ｂ格式数据的过程。

为了解决异构数据间的映射问题，在ＥＳＢ平台内部采用ＸＭＬ来描述和存储数据，再通过映射规则进行数据转换。常用转换规则表示有ＸＳＬＴ（ｅＸｔｅｎｓｉｂｌｅ　Ｓｔｙｌｅｓｈｅｅｔ　ＬａｎｇｕａｇｅＴｒａｎｓｆｏｒｍａｔｉｏｎｓ）和用户自定义规则等。ＸＳＬＴ的主要功能

９

０

２

就是转换，它将一个没有形式表现的ＸＭＬ内容文档作为源树，将其转换为一个可显示的有样式信息的结果树。同时，在ＸＳＬＴ文档中定义与ＸＭＬ文档中各个逻辑成分相匹配的转换模板，以及匹配转换方式。

图２中的Ｔｒａｎｓｆｏｒｍｅｒ是将源消息格式转换为目的消息格式的主要模块，它可以根据配置信息来选择合适的消息转换器，并按照规则库中存储的ＸＳＬＴ规则把消息转化成合适的格式，图７所示为根据ＸＳＬＴ语法规则定义的样式文件。

〈？ｘｍｌ　ｖｅｒｓｉｏｎ＝＂１．０＂ｅｎｃｏｄｉｎｇ

＝＂ＵＴＦ－８＂？〉〈ｘｓｌ：ｓｔｙｌｅｓｈｅｅｔ　ｘｍｌｎｓ：ｘｓｌ＝＂ｈｔｔｐ：／／ｗｗｗ．ｗ３．ｏｒｇ／１９９９／ＸＳＬ／Ｔｒａｎｓｆｏｒｍ＂

ｘｍｌｎｓ：ｆｎ＝＂ｈｔｔｐ：／／ｗｗｗ．ｗ３．ｏｒｇ／２００５／０２／ｘｐａｔｈ－ｆｕｎｃｔｉｏｎｓ＂ｘｍｌｎｓ：ｖａｒ＝＂ｈｔｔｐ：／／ｗｗｗ．ｓｙｎｃｈｒｏｅｓｂ．ｏｒｇ／２００７／ｖａｒ＂ｖｅｒｓｏｎ＝＂２．０

＂〉　〈ｘｓｌ：ｔｅｍｐｌａｔｅ　ｍａｔｃｈ＝＂／＂〉　〈／ｘｓｌ：ｔｅｍｐｌａｔｅ〉〈／ｘｓｌ：ｓｔｙ

ｌｅｓｈｅｅｔ〉图７　基于ＸＳＬＴ规则的样式文件

该样式中包含了ｘｓｌ：ｓｔｙｌｅｓｈｅｅｔ元素，该元素是ＸＳＬＴ文件的根元素，它包含了ＸＳＬＴ名字空间、函数名字空间、变量名字空间以及版本信息。在ＸＳＬＴ中使用ｘｓｌ：ｔｅｍｐｌａｔｅ表示模板元素，它也是ＸＳＬＴ中最重要的一个属性元素，每个ｘｓｌ：ｔｅｍｐｌａｔｅ有一个节点匹配属性，由“ｍａｔｃｈ＝”指定。在对模板进行匹配时使用“ｘｓｌ：ａｐｐｌｙ－ｔｅｍｐ

ｌａｔｅｓ”选择要匹配的模板。４　基于消息流程的ＥＳＢ数据集成

４．１　基于分布式ＥＳＢ平台的数据集成框架

基于分布式ＥＳＢ平台的数据集成框架如图８所示

。

图８　基于分布式ＥＳＢ平台的数据集成框架

在数据集成框架中，用户视图代表的是外部应用层，对于特定的数据集成场景，一般都由用户来进行指定。流程编排的主要过程是用户根据具体的集成场景，使用特定的描述语言来完成对信息集成的建模。流程部署主要在系统的后台执行，主要过程是将流程中的单个服务部署到位于不同ＥＳＢ节点上的执行组件中。而系统的负载均衡机制主要负责将流程中的单个服务与合适的执行组件进行绑定。

结合分布式ＥＳＢ平台的集成方法，本文可以通过ＥＳＢ流

程建模工具对数据集成场景建模［２３］

，然后将生成的流程文件

部署到后台系统执行以实现数据集成。

４．２　数据集成流程

数据集成流程是对数据集成场景的逻辑表示，由许多个相关的流程节点组合而成。为了更好地描述流程这个逻辑概念，以及将相关的流程节点部署到对应的执行组件上，本文引入ＸＭＬ描述语言以便很好地表述消息代理中介的逻辑符号与实际的消息代理中介之间的对应关系，并且能够表示流程节点中的参数信息以及相关节点之间的链接关系。通过构造流程配置文件来描述相关的中介规则信息以及服务描述信息。

下面给出相关概念和数据集成流程的相关定义。１）Ｃｏｍｐｏｎｅｎｔ：表示了分布式企业服务总线平台中的服务执行组件，也称为消息代理组件。它主要负责接收请求消息，处理消息的内容，并且将处理后的消息进行转发。系统中主要存在两种类型的组件：适配组件（ａｄａｐｔｏｒ）和中介组件（ｍｅｄｉａｔｏｒ

）。２）Ｗｅｂ　Ｓｅｒｖｉｃｅ：表示所请求的外部服务，它可以是数据源、Ｗｅｂ服务（Ｗｅｂ　

Ｓｅｒｖｉｃｅ）或者应用程序等。３）Ａｐｐｌｉｃａｔｉｏｎ：表示服务的请求者，它也可以是数据源或者Ｗｅｂ服务。

４）Ａｔｏｍｉｃ　Ｓｅｒｖｉｃｅ：表示了应用流程中的单个节点，可以将它看成是原子服务。流程中的所有节点可以分为两类：中介规则（ｍｅｄｉａｔｉｏｎ）和端点（ｅｎｄｐｏｉｎｔ）。中介规则描述了消息中介的规则（

例如消息验证、消息路由以及消息转换）。对应数据集成场景，中介规则为消息转换。它被部署到对应的中介组件以后，

中介组件才能执行具体的中介操作；端点又可分为两类，一类描述了所请求的服务的相关信息，比如服务名称以及服务地址等信息，另一类描述了客户端通过怎样的方式将请求发送给ＥＳＢ，比如暴露ＨＴＴＰ端口等等。与中介规则类似，

端点被部署到对应的适配组件以后，适配组件才能执行具体的适配操作。

表１中给出了流程节点的常见服务名称及类型信息。

表１　ＥＳＢ流程节点的服务类型示例

服务名称组件类型流程节点执行组件消息聚合Ａｇｇｒｅｇａｔｅ　ｍｅｄｉａｔｉｏｎ中介组件消息分裂Ｓｐｌｉｔ　ｍｅｄｉａｔｉｏｎ中介组件基于内容路由ＣＢＲ　ｍｅｄｉａｔｉｏｎ中介组件消息广播Ｒｅｃｉｐｉｅｎｔ　ｍｅｄｉａｔｉｏｎ中介组件消息格式转换Ｔｒａｎｓｆｏｒｍａｔｉｏｎ　ｍｅｄｉａｔｉｏｎ中介组件消息内容转换Ｔｒａｎｓｆｏｒｍａｔｉｏｎ　

ｍｅｄｉａｔｉｏｎ中介组件数据库接入Ｄａｔａｂａｓｅ　ｅｎｄｐｏｉｎｔ适配组件文件接入Ｆｉｌｅ　ｅｎｄｐｏｉｎｔ适配组件Ｗｅｂ　

Ｓｅｒｖｉｃｅ接入ＷｅｂＳｅｒｖｉｃｅ　

ｅｎｄｐ

ｏｉｎｔ适配组件

对于任意一条数据集成流程，给出如下形式化定义：定义１　ｅｓｂ　ｐｒｏｃｅｓｓ表示基于ＥＳＢ平台的数据集成流程，

它主要由中介规则序列和服务端点集合组成，因此，它的主要属性包括ｐｒｏｃｅｓｓｉｄ，ｉｎｅｎｄｐｏｉｎｔｓ，ｍｅｄｉａｔｉｏｎｓ，ｏｕｔｅｎｄ－ｐ

ｏｉｎｔｓ。其中：①ｐｒｏｃｅｓｓｉｄ表示ＥＳＢ流程的名称，全局唯一；②ｉｎｅｎｄｐｏｉｎｔｓ表示请求者端点集合，流程中可能存在多个服务请求者的相关信息；③ｍｅｄｉａｔｉｏｎｓ表示中介规则的集合；④ｏｕｔｅｎｄｐｏｉｎｔｓ表示服务端点的集合，流程中有可能存在多个服务端点。

定义２　ｒｅｑｕｅｓｔｅｒ　ｅｎｄｐｏｉｎｔ表示请求者端点，它描述了接入到总线上的服务请求者的相关信息。它的主要属性有：

０１２·

通用数据采集管理平台

大港通用数据采集管理平台介绍大港油田公司信息中心

目录一、概述 (3) 二、基础运行环境 (5) 2.1 功能介绍 (5) 2.2 特性总结 (9) 三、数据模型管理平台 (10) 3.1功能介绍 (10) 3.2 模型管理平台特性 (12) 四、公共数据采集与管理平台 (13) 4.1 公共数据采集与管理平台功能介绍 (13) 4.2 公共数据采集与管理平台功能特性 (16) 4.3 统一数据审核平台 (17) 4.4统一数据审核平台特性 (18) 五、统一数据决策分析平台 (19) 5.1 通用数据查询平台 (19) 5.2 通用报表平台 (20) 5.3 通用图表平台 (22) 5.4 决策仪表盘 (23) 5.5 联机分析 (24) 六、统一集成应用平台 (25) 七、公共数据交换平台 (27) 八、公共空间数据展示平台 (29) 8.1 功能介绍 (29) 8.2 特性总结 (30) 九、一体化井筒平台 (32) 十、结论 (33)

一、概述简单的来讲，通用数据采集管理平台就是基于数据库Web应用的开发部署环境，通过内置的元数据管理器、导航控制器、表单处理器、报表生成器、报表定制器、图表控制和生成器等一系列定制和执行引擎，使开发人员快速开发和部署企业管理系统。并简化开发人员对技术依赖，大大简化系统维护的技术要求和降低维护成本。利用通用数据采集管理平台，构建的信息系统具有如下几方面能力和优势： ●快速：能够以业务为导向和驱动、快速构建应用软件。通常利用通用数据采集管理平台开发的应用系统的开发周期为传统编码的1/3左右； ●满足用户持续发展的需求：通用数据采集管理平台构建应用可以有效地降低开发难度，使应用系统具有足够的柔性，其可伸缩性、可更改性、可扩展性都非常好，随着用户的需求变化而变化；因而轻松应对用户在业务发展过程中发生的需求的各种各样变化； ●满足集成性要求：通用数据采集管理平台为复杂应用软件系统提供了一个集成框架，不仅为集成同一平台上的各种不同软件提供了规则，还为集成其他应用软件系统提供了集成接口； ●满足个性化需求：由于通用数据采集管理平台的灵活性，以及它面向业务的特点，全定制的开发模式，用户可通过它很容易、快速地满足自己的个性化要求； ●降低总体投资：由于开发难度的降低、开发效率的提高，通用数据采集管理平台的应用可大大降低复杂应用系统在开发、维护、发布、迁移、集成、升级、服务等各方面成本。另外，通用数据采集管理平台的应用也能很好地保护用户的投资，它的柔性能使应用系统的生命周期大大加长。通用数据采集管理平台对于油田勘探开发信息化建设的主要贡献在于提供一个随需应变的基础软件平台，在该平台上可以快速构建石油勘探开发的业务系统。通用数据采集平台是基于业务基础平台理论进行设计和开发的，业务基础平台是通用管理软件的开发和运行环境，可快速构建以数据库为存储基础的应用

海量数据下分布式数据库系统的探索与研究

海量数据下分布式数据库系统的探索与研究摘要：当前，互联网用户规模不断扩大，这些都与互联网的快速发展有关。现在传统的数据库已经不能满足用户的需求了。随着云计算技术的飞速发展，我国海量数据快速增长，数据量年均增速超过50％，预计到2020年，数据总量全球占比将达到20％，成为数据量最大、数据类型最丰富的国家之一。采用分布式数据库可以显著提高系统的可靠性和处理效率，同时也可以提高用户的访问速度和可用性。本文主要介绍了分布式数据库的探索与研究。关键词：海量数据；数据库系统 1.传统数据库： 1.1 层次数据库系统。层次模型是描述实体及其与树结构关系的数据模型。在这个结构中，每种记录类型都由一个节点表示，并且记录类型之间的关系由节点之间的一个有向直线段表示。每个父节点可以有多个子节点，但每个子节点只能有一个父节点。这种结构决定了采用层次模型作为数据组织方式的层次数据库系统只能处理一对多的实体关系。 1.2 网状数据库系统。网状模型允许一个节点同时具有多个父节点和子节点。因此，与层次模型相比，网格结构更具通用性，可以直接描述现实世界中的实体。也可以认为层次模型是网格模型的特例。 1.3 关系数据库系统。关系模型是一种使用二维表结构来表示实体类型及其关系的数据模型。它的基本假设是所有数据都表示为数学关系。关系模型数据结构简单、清晰、高度独立，是目前主流的数据库数据模型。随着电子银行和网上银行业务的创新和扩展，数据存储层缺乏良好的可扩展性，难以应对应用层的高并发数据访问。过去，银行使用小型计算机和大型存储等高端设备来确保数据库的可用性。在可扩展性方面，主要通过增加CPU、内存、磁盘等来提高处理能力。这种集中式的体系结构使数据库逐渐成为整个系统的瓶颈，越来越不适应海量数据对计算能力的巨大需求。互联网金融给金融业带来了新的技术和业务挑战。大数据平台和分布式数据库解决方案的高可用性、高可靠性和可扩展性是金融业的新技术选择。它们不仅有利于提高金融行业的业务创新能力和用户体验，而且有利于增强自身的技术储备，以满足互联网时代的市场竞争。因此，对于银行业来说，以分布式数据库解决方案来逐步替代现有关系型数据库成为最佳选择。 2.分布式数据库的概念：分布式数据库系统：分布式数据库由一组数据组成，这些数据物理上分布在计算机网络的不同节点上（也称为站点），逻辑上属于同一个系统。（1）分布性：数据库中的数据不是存储在同一个地方，更准确地说，它不是存储在同一台计算机存储设备中，这可以与集中数据库区别开来。（2）逻辑整体性：这些数据在逻辑上是相互连接和集成的（逻辑上就像一个集中的数据库）。分布式数据库的精确定义：分布式数据库由分布在计算机网络中不同计算机

(完整版)校本人才培养工作状态数据采集与管理平台管理办法

襄阳汽车职业技术学院校本人才培养工作状态数据采集与管理平台管理办法（试行）第一章总则第一条根据《教育部办公厅关于建立职业院校教学工作诊断与改进制度的通知》（教职成厅〔2015〕2 号）和《关于印发〈高等职业院校内部质量保证体系诊断与改进指导方案（试行）〉启动相关工作的通知》（教职成司函〔2015〕168 号）的要求，认真做好我校人才培养工作状态数据采集与管理平台（以下称“数据采集平台”）的数据采集与上报工作，及时分析我校人才培养工作状态，使数据采集常态化，满足我校开展教学工作诊断与改进（简称诊改）的需要, 特制定本办法。第二条数据平台是运用现代数据信息管理技术，对高等职业院校人才培养工作状态数据进行战略重组和系统优化，以不断完善教学质量保障体系，促进管理的制度化、规范化、信息化，从而提升管理水平，提高管理效益，深化内涵建设。第三条通过数据平台的建设和有序运行，实现其“统计汇总、反映现状，管理监控、促进规范，分析开发、提供决策” 的基本功第二章机构与职责

第四条组织机构设置为确保做好校本数据采集平台的管理和使用，学校成立数据采集管理办公室，办公室设在质量监督管理办公室。各部门的数据采集具体分工按数据采集平台表格的特征归口负责，由质量监督管理办公室负责具体分工安排。第五条职责1．数据采集平台由质量监督管理办公室统一管理，具体负责全院数据采集的组织工作，包括数据采集平台的运行管理与维护、对各部门报送的数据进行最终汇总、审核，形成总的分析报告提交院领导审议；并负责上报省教育厅或教育部。 2．各处室、各系（部）及有关单位指定专人（信息采集管理员）负责本单位数据的采集、汇总和审核，审核的内容包括数据填报格式的规范性、数据及字段的完整性、及时性和准确性等。 3．各处室、各系（部）及有关单位负责人为本部门信息数据采集工作的第一责任人，各填报单位在完成初始数据的采集、汇总、审核确认后，将电子数据报质量监督管理办公室。 4．各处室、各系（部）对相关条目数据进行统计分析，并形成分析报告，报送质量监督管理办公室。第六条数据采集工作实施工作责任制，纳入各部门工作目标绩效考核。

分布式数据库系统复习题

一、何为分布式数据库系统？一个分布式数据库系统有哪些特点？答案：分布式数据库系统通俗地说，是物理上分散而逻辑上集中的数据库系统。分布式数据库系统使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位连接起来，共同组成一个统一的数据库系统。因此，分布式数据库系统可以看成是计算机网络与数据库系统的有机结合。一个分布式数据库系统具有如下特点：物理分布性，即分布式数据库系统中的数据不是存储在一个站点上，而是分散存储在由计算机网络连接起来的多个站点上，而且这种分散存储对用户来说是感觉不到的。逻辑整体性，分布式数据库系统中的数据物理上是分散在各个站点中，但这些分散的数据逻辑上却构成一个整体，它们被分布式数据库系统的所有用户共享，并由一个分布式数据库管理系统统一管理，它使得“分布”对用户来说是透明的。站点自治性，也称为场地自治性，各站点上的数据由本地的DBMS管理，具有自治处理能力，完成本站点的应用，这是分布式数据库系统与多处理机系统的区别。另外，由以上三个分布式数据库系统的基本特点还可以导出它的其它特点，即：数据分布透明性、集中与自治相结合的控制机制、存在适当的数据冗余度、事务管理的分布性。二、简述分布式数据库的模式结构和各层模式的概念。分布式数据库是多层的，国内分为四层：全局外层：全局外模式，是全局应用的用户视图，所以也称全局试图。它为全局概念模式的子集，表示全局应用所涉及的数据库部分。全局概念层：全局概念模式、分片模式和分配模式全局概念模式描述分布式数据库中全局数据的逻辑结构和数据特性，与集中式数据库中的概念模式是集中式数据库的概念视图一样，全局概念模式是分布式数据库的全局概念视图。分片模式用于说明如何放置数据库的分片部分。分布式数据库可划分为许多逻辑片，定义片段、片段与概念模式之间的映射关系。分配模式是根据选定的数据分布策略，定义各片段的物理存放站点。局部概念层：局部概念模式是全局概念模式的子集。局部内层：局部内模式局部内模式是分布式数据库中关于物理数据库的描述，类同集中式数据库中的内模式，但其描述的内容不仅包含只局部于本站点的数据的存储描述，还包括全局数据在本站点的存储描述。三、简述分布式数据库系统中的分布透明性，举例说明分布式数据库简单查询的各级分布透明性问题。分布式数据库中的分布透明性即分布独立性，指用户或用户程序使用分布式数据库如同使用集中式数据库那样，不必关心全局数据的分布情况，包括全局数据的逻辑分片情况、逻辑片段的站点位置分配情况，以及各站点上数据库的数据模型等。即全局数据的逻辑分片、片段的物理位置分配，各站点数据库的数据模型等情况对用户和用户程序透明。

大数据采集可视化及应用管理平台

大数据采集、可视化及应用管理平台进入21世纪，新一代信息技术将使工业由自动化时代进入数字化和智能化时代，这是一种智慧化的新形态。未来，大数据和物联网会给人类带来更多可能，工业大数据可应用在包括产品创新、产品故障诊断与预测、工业生产线物联网分析、工业企业供应链优化和产品精准营销等诸多方面，通过信息化与工业化的深度融合，企业使用大数据和分析，并与物联网相结合以作出决定，实现对设备的远程监控、诊断维护和故障预警，再通过对数据的大量收集、分析处理、有效应用，实现设备和运维的优化。数网星大数据采集及应用管理平台，通过工业远程数据采集系统，实时、高效地实现PC及移动端的数据采集、录入、查询、挖掘、统计等功能，同时解决了设备远程监控、调试运维问题。数网星未来能帮助企业对采集的大数据进行加密、清理、打包、分析等，为企业深度挖掘工业信息、设备物联下的数据价值，从而助力企业更好的实现远程监控运维管理、预测性维护、产品竞争力及客户满意度提升、营销精准拓展等，助力企业成功迈向未来。大数据采集、可视化及应用管理平台功能实现业界专家认为以云平台为依托所构建的工业制造行业大数据具备以下功能: (1)不仅能为制造企业提供针对性推销、定向研发、智能维保等服务； 2）还可以告诉企业设备未来可能出现故障的时间，并提供避免事故发生的解决方案，消除设备故障停机给客户带来的损失； 3）就客户体验度而言，客户可以通过企业建立的移动端宣传平台，以场景化的方式参与产品的认知，无形之中也增加了品牌的传播效果；

4）就行业技术创新而言，制造企业可以借助平台的专家经验共享、智能决策库等内容，提高环保运维领域的装备管理水平，降低行业运营成本； 5）更为重要的是，企业主可通过数据集的切分和规律查找到最优化的数据集，以实现人员投入及控制过程的节能提效。 1、实现设备远程维护调试，在线仿真； 2、实现控制器远程编程及程序上下载； 3、实现触摸屏远程监控及调试； 4、实现组态画面的远程展示； 5、设备运行参数及数据远程采集，实现设备集中化管理； 6、串口协议转为以太网传输； 7、虚拟串口、虚拟局域网功能; &建立VPN通道功能等。大数据采集、可视化及应用管理平台优势更精准、及时的数据采集，更广泛、多样的通讯协议，更快速、稳定的数据传输，更多样、灵活的使用方式，更智能、专业的大数据决策，更低的投资成本！更多的数据财富! 大数据采集、可视化及应用管理平台特点

分布式数据采集系统中的时钟同步[图]

分布式数据采集系统中的时钟同步[图] 在高速数据传输的分布式数据采集系统中，各个组成单元间的时钟同步是保证系统正常工作的关键。由于系统工作于局域网，于是借鉴了IEEE1588时钟同步协议的原理，设计出简易、高效的时钟同步方案，并在基于局域网的分布式数据采集系统中实现微秒级的精确同步。鉴于方案的高可行性和高效性，可将其推广到其他分布式局域网系统中。引言随着网络技术的发展，各种分布式的网络和局域网都得到了广泛的应用[1]。分布式数据采集系统广泛应用于船舶、飞机等采集数据多、实时性要求较高的地方。同步采集是这类分布式数据采集系统的一个重要要求，数据采集的实时性、准确性和系统的高效性都要求系统能进行实时数据通信。因此，分布式数据采集系统中的一个关键技术就是实现数据的同步传输。由于产生时钟的晶振具有频率漂移的特性，故对于具有多个采集终端的分布式系统，如果仅仅在系统启动时进行一次同步，数据的同步传输将会随着系统运行时间的增长而失步。因此时钟的同步就是保证数据同步传输的关键所在。2002年提出的IEEE1588标准旨在解决网络的时钟同步问题。它制定了将分散在测量和控制系统内的分离节点上独立运行的时钟，同步到一个高精度和高准确度时钟上的协议。由于分布式数据采集系统工作于局域网的环境中，于是借鉴IEEE1588标准中的思想，设计出一种针对基于局域网的分布式系统的时钟同步的机制，成功地在分布式数据采集系统中实现了μs级的同步。 1 时钟同步原理及实现时钟同步原理借鉴了IEEE1588协议中的同步原理。IEEE1588 定义了一个在工业自动化系统中的精确同步时钟协议(PTP 协议)，该协议与网络交流、本地计算和分配对象有关。IEEE1588 时钟协议规定，在进行时钟同步时,先由主设备通过多播形式发出时钟同步报文,所有与主设备在同一个域中的设备都将收到该同步报文。从设备收到同步报文后,根据同步报文中的时间戳和主时钟到从时钟的线路延时计算出与主时钟的偏差,对本地的时钟进行调整[2]。系统由各个单元的系统控制板（简称“系统板”）来完成同步的工作。同步模型与IEEE1588时钟协议一致，采用主从结构。主从单元采用相同频率的晶振，此时时钟同步的关键就是解决时钟相位对准问题和时钟漂移的问题。系统中采用的时间同步算法，是借鉴IEEE1588的同步原理，主要是采用约定固定周期同步的算法。和IEEE1588同步算法一样，同步过程分为两个阶段: 延迟测量阶段和偏移测量阶段。下面以一主一从模式为例介绍其原理。 1.1 延迟测量延迟测量阶段用来测量网络传输造成的延迟时间[3]。定义一个延迟请求信息包(Delay Request Packet) ,简称“Delay_Req”。延迟测量示意图。图1 延迟测量示意图为了简化程序，采用固定的周期测量网络延迟，一般系统每工作一个小时进行一次测量。从属时钟TSd 时刻发出延迟请求信息包Delay_Req ,主时钟收到Delay_ Req 后再立刻返回一个延时响应包delay_back发送给从属时钟,因此从属时钟就可以非常准确地计算出网络延时: TM2 →TS2∶Delay1 = TS2-Offset-TM2 TS3 →TM3∶Delay2 = TM3-(TS3 - Offset) 其中的Offset为从时钟与主时钟之间的时间偏差。因为网络延迟时间是对称相等的,所以: Delay =（Delay1 + Delay2）/2=（（TS2-TM2）+（TM3-TS3））/2 需要说明的是,在这个测量过程中,假设传输介质是对称均匀的，且线路是对称的[4]。

数据采集与管理平台注释

1、学校标识码是指由教育部按照国家标准及编码规则编制，赋予每一个学校在全国范围内唯一的、始终不变的识别标识码。按照教育部编制的10位学校标识码填报。 2、学校名称是指在教育行政部门备案的学校全称。 3、建校日期是指院校独立设置具有举办高等职业教育资格的时间（上级主管部门批准时间）。 4、建校基础是指高等职业院校的筹建基础，具体包括哪几所学校。 5、"学校举办者（单一选项）：教育部门/其他部门/行业/企业/民办。（1）教育部门是指利用国家财政性教育经费举办各级各类学校的各级教育行政部门。（2）其他部门是指利用国家财政性经费和国有资产举办学校的教育行政部门以外的各级党政机关、事业单位，国家级金融机构、经济实体等，如：财政、卫生、农业、国家电网公司等单位。（3）行业是指利用行业拨款举办学校的从事国民经济中同性质的生产或其他经济社会的经营单位的组织结构体系，如机械行业，金融行业，服装行业等。（4）企业是指利用企业拨款（企业对学校的拨款属于国家财政性教育经费）和国有资产举办学校的地方国有企业，如钢铁、石油等企业。（5）民办是指利用非国家财政性经费举办学校的社会组织或个人。" 6、级别（单一选项）：政府/行业/企业（集团）/公民个人/其他。 7、学校性质类别（单一选项）：01综合大学/02理工院校/03农业院校/04林业院校/05医药院校/06师范院校/07语文院校/ 08财经院校/09政法院校/10体育院校/11艺术院校/12民族院校。 8、性质（单一选项）：示范院校/骨干院校/其他。 9、级别（单一选项）：国家级/省市级。

10、立项部门是指示范性院校批准立项的国家或省级行政部门的名称。 11、第一轮评估结论（单一选项）：优/良/合格/不合格 12、第二轮评论结论（单一选项）：通过/暂缓通过 13、未接受评估是指未参加第一轮、第二轮评估的独立设置的高职院校 14、招生计划是指学校实际执行的招收2016级新生的计划 15、“三校生”是指中等专科学校、中等职业学校和中等技术学校的应届毕业生。 16、“3＋2”是指独立设置的高等职业院校“利用优质的中等职业教育资源进行五年制高职前三年的教育教学工作，但后两年高职教育阶段必须在高等学校举办” 的教育形式。 17、五年制高职第4学年是指“前三年按照中等职业教育的管理办法进行管理，后两年纳入高等教育管理范畴”中后两年中的第一年；也即《高等教育学校（机 3年是否在构）统计报表》说明中的“五年制高职转入”。其与“3＋2”区别在于前本校内就读，教学计划是否五年一贯。 18、基于高考的“知识+技能”招生是指以高考为基础,对报考高等职业学校的考生增加技能考查内容，招生学校依据考生相关文化成绩和技能成绩，参考综合素质评价，择优录取的一种招生方式。包含原版中“全国统考”和“省市统考”两种方式。 19、对口招生是指面向中等职业学校毕业生对口升高职、以专业技能成绩为主要录取依据的一种招生方式。 20、单独考试招生是指国家示范性、省级示范性高等职业学校和现代学徒制试点学校等，高考前在本地符合当年高考报名条件的考生范围内（经教育部批准的学校可跨省招生），单独组织文化和技能考试，并根据考生文化成绩和技能成绩，参考考生普通高中综合素质评价结果，择优录取的一种招生方式。

(最新整理)分布式数据库研究现状及发展趋势

(完整)分布式数据库研究现状及发展趋势编辑整理：尊敬的读者朋友们：这里是精品文档编辑中心，本文档内容是由我和我的同事精心编辑整理后发布的，发布之前我们对文中内容进行仔细校对，但是难免会有疏漏的地方，但是任然希望（(完整)分布式数据库研究现状及发展趋势）的内容能够给您的工作和学习带来便利。同时也真诚的希望收到您的建议和反馈，这将是我们进步的源泉，前进的动力。本文可编辑可修改，如果觉得对您有帮助请收藏以便随时查阅，最后祝您生活愉快业绩进步，以下为(完整)分布式数据库研究现状及发展趋势的全部内容。

山西大学研究生学位课程论文（2014 —--— 2015 学年第 2 学期) 学院（中心、所）：计算机与信息技术学院专业名称：计算机应用技术课程名称：分布式数据库技术论文题目：分布式数据库研究现状及发展趋势授课教师（职称）: 曹峰（) 研究生姓名: 刘杰飞年级： 2014级学号： 201422403003 成绩: 评阅日期: 山西大学研究生学院 2015年 6 月 17日

分布式数据库研究现状及发展趋势摘要随着大数据、云时代的到来，数据库应用需求的拓展和计算机硬件环境的变化,特别是计算机网络与数字通信技术的飞速发展，卫星通信、蜂窝通信、计算机局域网、广域网和激增的Intranet及Internet得到了广泛应用,使分布式数据库系统应运而生。为了符合当今信息系统的应用需求和企业组织的管理思想和管理模式。分布式数据库提供了解决整个信息资产被分裂所成的信息孤岛，为孤岛联系在一起提供桥梁.本文主要介绍分布式数据库的研究现状，存在的一些问题以及未来的发展趋势。关键词分布式数据库；发展趋势；现状及问题 1.引言随着信息技术的飞速发展，社会经济结构、生产方式和消费结构已经发生了重大变化，这些变化深刻地影响着人民生活的方方面面。尤其是近十年来人们对计算机的依赖性越来越强，同时也对计算机提出了更高的要求。随着数据库在各个行业中的不断发展,各行业也对数据库提出了更高的要求，数据量也急剧增加，同时有关大数据分析的讨论正在愈演愈烈.甚至出现了爆炸性增长的趋势，一方面是由于移动互联网和移动智能终端的普及发展，数据信息正以每年40%的速度增长，造成数据量庞大；同时,数据种类呈多样性，文本、图片、视频等结构化和非结构化数据共存；另一方面也要求实时交互性强；最重要的是大数据蕴含了巨大的商业价值。相应的对于管理这些数据的复杂度也随之增加。同时各行业部门或企业所使用的软硬件之间的差异，这给开发企业管理数据库管理软件带来了巨大的工作量，如果能够有效解决这个问题,即使用同一模块管理操作不同的数据表格，对不同的数据表格进行查询、插入、删除、修改等操作，也即对企业简单的应用实现即插即用的功能，那么就能大大地减少软件开发的维护和更新费用,缩短软件的开发周期。分布式数据库系统的开发，降低了企业开发的成本,提高了软件使用的回报率。当今社会已进入了信息时代，人们将越来越多的信息存储在网络中的计算机上。如何更有

学院人才培养工作状态数据采集平台管理办法

学院人才培养工作状态数据采集平台管理办法第一章总则第一条根据《教育部关于印发<高等职业院校人才培养工作评估方案〉的通知》（教高〔2008〕5号）文件要求，认真做好我院人才培养工作状态数据采集平台（以下称“数据采集平台”）的数据采集与上报工作，及时分析我院人才培养工作状态，特制定本办法。第二条数据平台是运用现代数据信息管理技术，对高等职业院校人才培养工作状态数据进行战略重组和系统优化，以不断完善教学质量保障体系，促进管理的制度化、规范化、信息化，从而提升管理水平，提高管理效益，深化内涵建设。第三条通过数据平台的建设和有序运行，实现其“统计汇总、反映现状，管理监控、促进规范，分析开发、提供决策”的基本功能。第二章机构与职责第四条组织机构设置为确保做好数据采集平台的管理和使用，学院成立数据采集平台管理办公室,设在教育教学督导处。各部门数据采集平台管理具体分工按数据采集平台表格的特征归口负责，由数据采集平台管理办公室负责分工安排。

第五条职责 1.数据采集平台由学院数据采集平台管理办公室统一管理，具体负责全院数据采集的组织工作，包括数据采集平台的运行管理与维护、对各部门报送的数据进行最终汇总、审核，形成总的分析报告提交院长办公会审议；并负责上报省教育厅。 2. 各处室、二级学院、系（部）及有关单位指定专人（信息采集管理员，一般由办公室主任担任）负责本单位数据的采集、汇总和审核，审核的内容包括数据填报格式的规范性、数据及字段的完整性和准确性等。 3. 各处室、二级学院、系（部）及有关单位负责人为本部门信息数据采集工作的第一责任人，各填报单位在完成初始数据的采集、汇总和审核后，连同电子数据报数据采集平台管理办公室。 4.各处室、二级学院、系（部）对相关条目数据进行统计分析，并形成分析报告，报送数据采集平台管理办公室。第六条数据采集工作实施工作责任制，纳入各部门工作目标考核。第三章数据采集的组织实施第七条数据采集时间为确保数据采集时效性，各部门要及时更新数据。各部门的

DCS数据采集管理平台方案介绍(CDC版)

疾病预防控制数据采集管理平台介绍方案
上海南康科技有限公司 2011 年
-1-

目录
一、说明............................................................................................................................................... 3 二、DCS 平台应用说明........................................................................................................................ 3 2.1 电访专家调查技术介绍 .............................................................................................................. 4 2.2 面访专家调查技术介绍 .............................................................................................................. 5 2.3 网调专家调查技术介绍 .............................................................................................................. 5 三、DCS 平台的应用案例.................................................................................................................... 6 3.1 案例一：国家疾控 SSF 互动式膳食油盐控制健康调查 ........................................................ 6 3.2 案例二：北京市社区居民流感样症状和就诊状况的电话调查............................................. 9 3.3 案例三：深圳市 6 区居民行为危险因素电话调查分析......................................................... 9 3.4 案例四：广东省关于流感的知、信、行及罹患率系列电话调查....................................... 10 四、DCS 平台的特点.......................................................................................................................... 11 五、DCS 平台应用价值的体现 .......................................................................................................... 11 六、DCS 平台的技术方案说明 .......................................................................................................... 12 6.1 平台设计目标 ............................................................................................................................ 12 6.2 平台设计原则 ............................................................................................................................ 12 6.3 DCS 系统拓扑结构图 ................................................................................................................ 13 七、各子系统技术方案介绍............................................................................................................... 14 7.1 DCS 电访专家技术优势.......................................................................................................... 14 7.2 DCS 面访专家技术方优势...................................................................................................... 15 7.3 DCS 网络调查专家技术优势.................................................................................................. 18 八、用户报告....................................................................................................................................... 21 九、公司简介....................................................................................................................................... 28
-2-

分布式数据库管理系统简介

分布式数据库管理系统简介一、什么是分布式数据库：分布式数据库系统是在集中式数据库系统的基础上发展来的。是数据库技术与网络技术结合的产物。分布式数据库系统有两种：一种是物理上分布的，但逻辑上却是集中的。这种分布式数据库只适宜用途比较单一的、不大的单位或部门。另一种分布式数据库系统在物理上和逻辑上都是分布的，也就是所谓联邦式分布数据库系统。由于组成联邦的各个子数据库系统是相对“自治”的，这种系统可以容纳多种不同用途的、差异较大的数据库，比较适宜于大范围内数据库的集成。分布式数据库系统(DDBS)包含分布式数据库管理系统(DDBMS)和分布式数据库(DDB)。在分布式数据库系统中，一个应用程序可以对数据库进行透明操作，数据库中的数据分别在不同的局部数据库中存储、由不同的DBMS进行管理、在不同的机器上运行、由不同的操作系统支持、被不同的通信网络连接在一起。一个分布式数据库在逻辑上是一个统一的整体：即在用户面前为单个逻辑数据库，在物理上则是分别存储在不同的物理节点上。一个应用程序通过网络的连接可以访问分布在不同地理位置的数据库。它的分布性表现在数据库中的数据不是存储在同一场地。更确切地讲，不存储在同一计算机的存储设备上。这就是与集中式数据库的区别。从用户的角度看，一个分布式数据库系统在逻辑上和集中式数据库系统一样，用户可以在任何一个场地执行全局应用。就好那些数据是存储在同一台计算机上，有单个数据库管理系统(DBMS)管理一样，用户并没有什么感觉不一样。分布式数据库中每一个数据库服务器合作地维护全局数据库的一致性。分布式数据库系统是一个客户/服务器体系结构。在系统中的每一台计算机称为结点。如果一结点具有管理数据库软件，该结点称为数据库服务器。如果一个结点为请求服务器的信息的一应用，该结点称为客户。在ORACLE客户，执行数据库应用，可存取数据信息和与用户交互。在服务器，执行ORACLE软件，处理对ORACLE 数据库并发、共享数据存取。ORACLE允许上述两部分在同一台计算机上，但当客户部分和服务器部分是由网连接的不同计算机上时，更有效。分布处理是由多台处理机分担单个任务的处理。在ORACLE数据库系统中分布处理的例子如：客户和服务器是位于网络连接的不同计算机上。单台计算机上有多个处理器，不同处理器分别执行客户应用。

适用于MES的分布式数据采集方案

制造现场的分布式数据收集解决方案泽朗电子

简介 ◆随着工业自动化和客户需求的不断提高，基于MES的工业自动化数据采集和控制以及产品的可追溯性系统越来越多的在各大工厂推广应用，这类系统都需要对生产过程的每个环节进行精确的监测、数据采集、记录和控制，这需要生产设备能通过工业网络及时、准确的报告各项状态和数据。 ◆基于以太网的数据收集节点可以直接、准确、准时、安全、稳定的把各个流程节点的数据传送到中央数据服务器，而不必使用成本高、维护困难、软件和系统都不稳定的工业计算机，也不用担心计算机病毒对生产制造造成巨大损失。 ◆泽朗电子拥有齐全的适用于工业自动化生产的数据收集设备产品线和系统集成能力，全心全意的服务于您的要求。

应用场景数据集传器应用在生产线上每个需要收集数据的节点，对于 MES系统和产品追溯用系统，用于收集产品进入工序的时间等信息和产品编号条码/部件编号条码等信息。

网络拓扑 WEB服务器网络交换机 TN-03A 数据集传器用于配置和监控的PC LAN LAN LAN 网络交换机 TN-03A 生产线A生产线B

我们的数据集传器产品线产品型号： TN-03AW 相对于 TN-03A ，添加Wi-Fi 联网支持。产品型号：TN-03A 用于接收设备传感器或条码扫描头的数据，集成USB 接口和RJ45网口，可以把数据和自定义按钮事件通过以太网直接上传至应用服务器，并回显从服务器返回的执行结果。基于Alliwinner H3高性能处理器支持Wi-Fi (IEEE 802.11 b/g/n)

系统软件架构生产设备 DATA TRANSPORTER APP HAL USB Ethernet LwIP Linux OS WEB APP JavaEE Server Database Linux OS Ethernet DATA TRANSPORTER APPLICATION SERVER I/Os 数据采集设备

ESB企业服务总线解决方案剖析

关于SOA 关于SOA的概念，你可以找到很多的文章从不同的角度来描述它，不同的软件提供商也有不同的定义方式。BEA有流体计算，微软有Indigo和SOA-building，SAP有ESA。每个人都可以从不同的视角来理解SOA，从程序员的角度，SOA是一种全新的开发技术，新的组件模型，比如说Web Service；从架构设计师的角度，SOA就是一种新的设计模式，方法学；从业务分析人员的角度，SOA就是基于标准的业务应用服务。从概念的角度，IBM 对SOA的定义是最为全面的，既SOA是一种构造分布式系统的方法，它将业务应用功能以服务的形式提供给最终用户应用或其他服务。SOA包括如下要素: 一个体系架构，用开放的标准将软件资产(Asset)化为服务提供标准的方法来表示软件资产及其交互单独的软件资产作为构造单元，被重复使用来开发其他应用将关注点从细节实现转移到应用(application)组装整合企业外部的应用（B2B）的方式开发（现在）和整合（未来）的统一本文针对的读者是软件开发人员，站在开发人员的角度，往往希望软件开发能够满足对于开发效率、可靠性、易维护性、易管理等多方面的更高要求。让我们通过回顾软件开发的演化过程来看一看SOA出现的必然性：面向机器语言(Monolithic)的开发模式：需要根据不同平台的机器语言来开发代码。面向过程(Procedure)的开发模式：独立于机器的程序语言(C,Pascal等)使开发过程变得简单了，用过程来代表一个抽象的代码集合，包装重用现成的代码。面向对象(Object)的开发模式：用更接近现实的对象来表述一个相对完整的事物。面向对象的语言(Smalltalk，Java等)，提供了更抽象的封装和重用模式。面向对象的开发强调从现实世界问题域到软件程序的直接映射，更接近人类的自然思维方式。

时间同步在分布式数据采集系统中的实现

邮局订阅号：82-946360元/年技术创新数采与监测《PLC 技术应用200例》您的论文得到两院院士关注时间同步在分布式数据采集系统中的实现 The Implementation of the time synchronization in the distributed data collection system (空军工程大学) 徐锋樊晓光刘东 XU Feng FAN Xiao-guang LIU Dong 摘要:文中介绍了分布式数据采集系统中精确时间同步的实现方法以及相应的测试结果。该设计方案以IEEE1588标准中的精确时间协议(PTP)为基础,通过使用美国国家半导体公司生产的以太网物理层控制芯片DP83640,使得采用以太网架构的分布式数据采集系统主从节点上的时钟达到精确的时间同步。关键词:精确时间同步;IEEE1588;DP83640中图分类号:TP393文献标识码:A Abstract:The implementation of precise time synchronization in the distributed data collection system and test results is illuminated in this article.By use of DP83640Ethernet PHYTER produced by the National Semiconductor corporation,the design is based on the Precise Time Protocol (PTP)of the IEEE1588standard,and finally implemented the precise time synchronization between the master clock and slave clocks of the distributed data collection system based on standard Ethernet.Key words:precise time synchronization;IEEE1588;DP83640 文章编号:1008-0570(2009)11-1-0091-02 1引言分布式数据采集系统广泛应用于采集数据多、实时性要求较高的现场测控领域。因此,分布式数据采集系统中的一个关键技术就是实现数据的同步传输。但由于网络传输延迟以及晶振频率漂移的原因,如果仅仅在系统启动时进行一次同步,状态数据的同步传输将会随着系统运行时间的增长而失步,因而不能够对系统的全局状态获得准确的掌握。随着以太网技术逐渐应用于工业自动化测控领域,2002年国际电气和电子工程师协会(IEEE)发布了IEEE1588标准,该标准中的精确时间协议(Precise Time Protocol,简称PTP 协议)定义了一个以太网模式下的时间同步协议,主要应用在分布式测量和控制系统中,目的是提高工业以太网的实时性,使运行于各个独立测控节点上的时钟在系统范围内达到一个较高的同步精度。本文以IEEE1588标准中的PTP 协议为基础,通过使用以太网物理层控制芯片DP83640,在分布式数据采集系统中实现了精确的时间同步。 2分布式数据采集系统概述图1分布式数据采集系统结构图分布式数据采集是带传感器的多个微计算机节点借助现场总线或工业以太网连接在一起的分布式工业测控系统。传感器采用输出温度、压力、流量、位移等模拟量,再通过模数转换所生成数字量并由微计算机独立地进行处理,最后将局部的处理结果传输到总控单元上进行集中分析处理并得出全局状态的实时信息。拓扑结构如图1所示。 3IEEE1588标准和PTP 协议概述 IEEE1588标准的技术基础最初来源于安捷伦公司,是由安捷伦实验室的John C.Edison 以及来自其它公司和组织的12名成员共同研究的。经过多次修改后于2002年由国际电气和电子工程师协会(IEEE)正式发布。IEEE1588标准全称是:网络测量和控制系统的精密时钟同步协议标准。它定义一种在分布式测量和控制系统中实现高精度时钟同步的精确时间协议PTP 。该协议能够在所有支持多播的网络上实现,特别适合于以太网,但并不局限于以太网,目的是使分布式网络中的所有时钟保持精确的同步。 PTP 协议是一个关于时钟同步的协议标准,它被应用于由多个节点组成的分布式系统中,在系统中每个节点代表一个独立运行的时钟。PTP 协议将整个网络内的时钟分为普通时钟(ordinary clock)和边界时钟(boundary clock),而从通信关系上看又可把时钟分为主时钟(master clock)和从时钟(slave clock),整个系统中的最优时钟为最高主时钟(grandmaster clock),系统只能有一个最高主时钟,而一个PTP 协议的通信子网中只能有一个主时钟,从时钟与主时钟保持同步。 PTP 协议在现有的UDP/IP 协议基础之上实现局域网架构内的时钟同步,有关同步信息的协议报文共有4种,分别是:同步报文Sync,跟随报文Follow_up,延迟请求报文Delay_req,延迟应答报文Delay_Resp 。 PTP 协议的同步过程分为两个阶段:偏移(offset)测量阶段和延迟(Delay)测量阶段。偏移阶段的工作是修正主时钟和从时钟之间的时间偏差。徐锋:硕士研究生 91--