系统容灾平台规划

系统容灾平台规划
系统容灾平台规划

系统容灾平台规划

现如今本地负载均衡技术已经解决服务器集群的高可用问题但是断电、施工挖断光缆、自然灾害等依然可以导致整个数据中心无法工作。另外中国网络由多家运营商组成各运营商之间互联互通质量差已是不争的事实。引言

现如今本地负载均衡技术已经解决服务器集群的高可用问题,但是断电、施工挖断光缆、自然灾害等依然可以导致整个数据中心无法工作。另外,中国网络由多家运营商组成,各运营商之间互联互通质量差已是不争的事实。因此大型互联网企业早已不满足于单一、或者双活数据中心提供网站服务,越来越多的互联网企业开始考虑在不同地区、不同运营商部署多个数据中心集群,以实现用户访问就近接入、负载均衡和故障容灾。

提到多数据中心部署,就不可避免需要面对以下三个问题。

?多个数据中心流量如何分配?

?监控怎样及时发现网络故障?

?多个数据中心服务如何容灾?

如果这三个问题不能有效解决,将会导致用户访问质量差、服务黑洞、以及客户的投诉。而网站背后的运维人员,则会频繁受到销售、PM、领导的Challenge!沦为背黑锅的对象。令人欣喜的是,阿里云产品云解析DNS,现已助力中小企业解决多数据中心的流量负载均衡、实现用户就近接入、故障及时发现和实时容灾切换。

破局

一、多数据中心流量负载均衡

在多个数据中心部署服务时,必然需要面对不同数据中心接入带宽不同、服务器集群负载能力不同、以及运营成本等诸多因素。所以需要针对不同的因素设计与之相匹配的流量分配比例,那么如何能够精确的分配访问流量呢?云解析DNS为您提供了一些参考方案。

3. 阿里云BGP 两个Region的ECS数量比例是8 :2,那通过云解析设置线路内负载均衡时,将两个Region 公网弹性IP地址的权重分别设置成8和2,达到访问流量按照80%和20%分配的比例;

4. 网络监控对各个数据中心的服务IP进行实时监控;

5. 网络监控周期性将监控结果反馈给云解析DNS;

6. 用户向华北电信dns发起https://www.360docs.net/doc/fc13600779.html, DNS查询请求;

7. 华北电信dns收到用户的查询后如果没有缓存该域名,则向云解析DNS发起域名查询;

8. 云解析DNS收到华北电信的DNS查询时,轮询响应IP地址3.3.3.3和4.4.4.4。此时一半华北电信DNS得到的结果时3.3.3.3,另半华北电信DNS得到的结果时4.4.4.4。同理,云解析DNS收到华东联通的DNS查询时,先连续返回3次5.5.5.5,再连续返回7次6.6.6.6,然后重复执行,此时30%的华东联通DNS得到的结果是3.3.3.3,剩下70%得到的结果是4.4.4.4。

9. 华北电信DNS收到云解析DNS的响应后会缓存域名解析结果,并返回给最终查询用户。

10. 最终实现50%的华北电信用户访问3.3.3.3上的网站服务,另外50%华北电信用户访问4.4.4.4上的网站服务。

二、网络监控及时发现故障

1. 云解析DNS在通过智能解析和WRR帮助中小企业实现就近访问以及流量分配的同时,有效的结合阿里云分布式监控,利用全网拨测探针对网站的解析记录进行实时监控,如下图。

云解析DNS是一种高可用性、高可扩展的权威DNS服务和DNS管理服务。提供了多种全球负载均衡策略,帮助中小企业快速、准确的将用户请求路由至您的数据中心,同时具备高可用容灾切换能力,实现在一些数据中心故障的情况下,仍然能保证中小企业的网站服务可访问。

未来云解析DNS还会将会与更多的阿里云产品相结合,例如SLB、ECS、CDN、云盾等。形成立体化的高可用网站解决方案,从访问入口到后端服务助力中小企业实现全链路负载均衡。

容灾项目方案设计

容灾项目方案设计

目录

容灾技术规范 作为风险防范系统,灾备系统建设本身在总体规划、方案选择和投产实施后的管理运行,以及真正面对灾难时的切换操作等方面也存在着潜在的风险。 计算机信息系统实现数据大集、应用大集中后,系统的运行安全成为风险控制的焦点。目前,已经有多系统开始或准备进行灾备系统的建设,灾备系统建设的目标是减灾容灾,使计算机信息系统和数据能够最大限度地防范和化解各种意外和灾害所带来的风险。然而,与大多数工程一样,灾备系统建设本身在总体规划、方案选择和投产实施后的管理运行,以及真正面对灾难时的切换操作等方面也存在着潜在的风险。 可以说,风险防范系统本身也存在风险点,需要小心应对。 灾备系统建设中所涉及的潜在风险大致可分为技术风险、管理风险和投资风险,其中尤以技术选择风险最大,技术方案选择优越,可以规避一定的管理风险和投资风险。而这三者也存在内在的相互关联,不同灾备级别对应的建设投资规模、所采用的技术以及实施和管理的复杂度也不同,应考虑保护计算机系统的原有投资并提高灾备系统建设投资的利用率。 1.1 容灾的总体规划 1.2 真正的容灾是数据被不间断的一致性访问! 在灾难备份的世界里,是有等级观念的,级别不同,灾备系统所采用的技术和达到的功能是不同的,在系统建设资金投入方面的差距也很巨大。所以,对用户来说,明确灾备系统建设的总体规划十分必要。 1.2.1 技术指标RPO、RTO 衡量容灾技术的两个技术指标RPO、RTO RPO(Recovery Point Objective): 以数据为出发点,主要指的是业务系统所能容忍的数据丢失量。及在发生灾难,容灾系统接替原生产系统运行时,容灾系统与原

系统容灾解决方案

系统容灾解决方案 容灾基本概念 容灾是一个范畴比较广泛的概念,广义上,我们可以把所有与业务连续性相关的内容都纳入容灾。容灾是一个系统工程,它包括支持用户业务的方方面面。而容灾对于IT而言,就是提供一个能防止用户业务系统遭受各种灾难影响及破坏的计算机系统。容灾还表现为一种未雨绸缪的主动性,而不是在灾难发生后的“亡羊补牢”。 从狭义的角度,我们平常所谈论的容灾是指:除了生产站点以外,用户另外建立的冗余站点,当灾难发生,生产站点受到破坏时,冗余站点可以接管用户正常的业务,达到业务不间断的目的。为了达到更高的可用性,许多用户甚至建立多个冗余站点。 容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。 要实现容灾,首先要了解哪些事件可以定义为灾难?典型的灾难事件是自然灾难,如火灾、洪水、地震、飓风、龙卷风、台风等;还有其它如原提供给业务运营所需的服务中断,出现设备故障、软件错误、网络中断和电力故障等等;此外,人为的因素往往也会酿成大祸,如操作员错误、破坏、植入有害代码和病毒袭击等。现阶段,由于信息技术正处在高速发展的阶段,很多生产流程和制度仍不完善,加之缺乏经验,这方面的损失屡见不鲜。 容灾的七个层次 等级1: 被定义为没有信息存储的需求,没有建立备援硬件平台的需求,也没有发展应急计划的需求,数据仅在本地进行备份恢复,没有数据送往异地。这种方式是成本最低的灾难恢复解决方案,但事实上这种恢复并没有真正达到灾难恢复的能力。 一种典型等级1方式就是采用本地磁带库自动备份方案,通过制定相关的备份策略,可以实现系统等级1备份。 等级2: 是一种为许多站点采用的备份标准方式。数据在完成写操作之后,将会送到远离本地的地方,同时具备有数据恢复的程序。在灾难发生后,在一台未启动的计算机上重新完成。系统和数据将被恢复并重新与网络相连。这种灾难恢复方案相对来说成本较低,但同时有难以管理的问题,即很难知道什么样的数据在什么样的地方。这种情况下,恢复时间长短依赖于何时硬件平台能够被提供和准备好。

数据容灾备份设计方案

数据容灾备份设计方案 1.1数据备份的主要方式 目前比较实用的的数据备份方式可分为本地备份异地保存、远程磁带库与光盘库、远程关键数据+定期备份、远程数据库复制、网络数据镜像、远程镜像磁盘等六种。 (1)本地备份异地保存 是指按一定的时间间隔(如一天)将系统某一时刻的数据备份到磁带、磁盘、光盘等介质上,然后及时地传递到远离运行中心的、安全的地方保存起来。 (2)远程磁带库、光盘库 是指通过网络将数据传送到远离生产中心的磁带库或光盘库系统。本方式要求在生产系统与磁带库或光盘库系统之间建立通信线路。 — (3)远程关键数据+定期备份 本方式定期备份全部数据,同时生产系统实时向备份系统传送数据库日志或应用系统交易流水等关键数据。 (4)远程数据库复制 生产系统相分离的备份系统上建立生产系统上重要数据库的一个镜像拷贝,通过通信线路将生产系统的数据库日志传送到备份系统,使备份系统的数据库与生产系统的数据库数据变化保持同步。 (5)网络数据镜像 是指对生产系统的数据库数据和重要的数据与目标文件进行监控与跟踪,并将对这些数据及目标文件的操作日志通过网络实时传送到备份系统,备份系统则根据操作日志对磁盘中数据进行更新,以保证生产系统与备份系统数据同步。 (6)远程镜像磁盘 利用高速光纤通信线路和特殊的磁盘控制技术将镜像磁盘安放到远 …

离生产系统的地方,镜像磁盘的数据与主磁盘数据以实时同步或实时异步方式保持一致。磁盘镜像可备份所有类型的数据。备份拓扑网络结构1.2(即东风东路院区中心机广州市第八人民医院具有两个不同地点的中心机房房和嘉禾院区中心机房),在这基础上是可以构建一个异地容灾的数据备份系统,以确保本单位的系统正常运营及对关键业务数据进行有效地保护,以下设计方案仅提供参考。嘉禾院区数据中心东风东院区数据中心 本方案中,我们采用EMC的CDP保护技术来实现数据的连续保护和容灾系统。 1.在东风东院区数据中心部署一台EMC 480统一存储平台,配置一个大容量光纤磁盘存储设备,作为整个系统数据集中存储平台。 2.在嘉禾院区数据中心部署一台EMC 480统一存储系统,配置一个大容量光纤磁盘存储设备,作为整个平台的灾备存储平台。 ) 3.两地各部署两台EMC RecoverPoint/SE RPA,采用CLR技术,即CDP(持续数据保护)+CRR(持续远程复制),实现并发的本地和远程数据保护。 4.在东风东院区数据中心本地采用EMC RecoverPoint/SE CDP(持续数据保护)技术实现本地的数据保护。. 5.两地采用EMC RecoverPoint/SE CRR(持续远程复制)技术,实现远程的数据保护。由于两地之间专线的带宽有限,可以采用EMC Recoverpoint/SE异步复制技术,将东风东院区数据中心EMC480上的数据定时复制到嘉禾院区数据中心。根据带宽的大小,如果后期专线带宽有所增加,RecoverPoint会自动切换同步、异步、快照时间点三种复制方式,尽最大可能保证数据的零丢失。 1.3本地数据数据保护(CDP)设计

桌面云本地容灾技术架构

桌面云本地容灾技术架构 基于Citrix 平台

目录 1.1桌面云容灾体系架构 (3) 1.1.1桌面云容灾体系建设标准 (3) 1.1.2桌面云容灾平台架构 (4) 1.1.3桌面云容灾框架 (5) 1.2本地高可用性 (6) 1.2.1硬件层 (8) 1.2.2Cloud stack层 (12) 1.2.3管理层服务器 (13) 1.2.4桌面池的可用性 (17) 1.2.5云桌面管理层 (19) 1.2.6业务管理门户 (20) 1.2.7接入层 (20)

1.1 桌面云容灾体系架构 由于桌面云系统承载了企业所有用户到应用的交付的核心平台,桌面云平台的业务连续性关系到整个企业能否正常开展业务的核心层面。故桌面云平台自身具有一定的可用性的同时,但需要考虑到更高层次的威胁对系统带来的不可用,包括地震,电力故障,环境故障,人为误操作等。故而需要对桌面云系统进行灾备的建设,保障业务的可持续性发展,满足业务需要。 1.1.1 桌面云容灾体系建设标准 对于桌面云建设容灾,就必须提出相应的设计指标,以此作为衡量和选择灾难恢复解决方案的参数。建议根据国家标准《信息系统灾难恢复规范-GB/T 20988-2007》建立设计业务系统的容灾方案。 《信息系统灾难恢复规范》根据信息系统灾难恢复能力定义了六个级别,企业需要根据其计算机处理系统中数据的重要性,以及需要恢复数据的速度和程度,来进行数据容灾的总体规划。详细的灾难恢复能力分级详见下表:

1.1.2 桌面云容灾平台架构 对于桌面云容灾体系需要实现整个平台的高可用。这里包括: ●物理架构的高可用 构建物理架构的可用性,保证各个硬件层次的可用性,如服务器,存储,网络,这 部分主要通过硬件自身的冗余组件保证。 ●基础架构的高可用 基础架构的可用是桌面云系统的核心,由于桌面云的各个服务器可以通过虚拟化的 方法部署与各个Hypervisor层,故可以利用Hypervisor的集群特性实现。 ●回话并发的可用性 回话并发的可用性保证了在当底层基础架构层次的某单个服务器的不可用时实现 业务快速转移和日常访问的负载均衡。保证访问的可用性,而Citrix的服务器系统 本身具备负载均衡特性。可以很好的保障访问回话层次的高可用。 ●站点的可用性 站点的可用性解决当一个数据中心出现问题是,故障快速转移,实现业务连续性,Citrix的Netscaler觉有全局负载均衡特性,当生产中心或者某一站点出息故障时可 以快速完成业务切换到可用的站点或者数据中心。

电信核心业务系统容灾解决方案

电信核心业务系统容灾解决方案 Oracle 技术产品咨询顾问高壮志2004/05/24 随着电信运营商多年的系统建设,其核心业务系统的高可用性越来越受到人们的关注。从整个系统的角度来看高可用性,包括主机、操作系统、数据库、应用、网络设备等许多方面。而这些系统的一个显著特点就是以数据为中心,因此对数据的保护是整个系统高可用性的核心体现。Oracle数据库作为电信运营商核心系统的主流数据库,针对企业用户的重要数据、重要业务高可用性的需求提出了建立在数据库级别的容灾方案-- Oracle Data Guard (数据卫士)。 为什么要使用Data Guard 电信行业现有系统在容灾方面基本上有两种做法。一是采用备份的方法,即定期地将数据备份到硬盘和磁带上。这种方法的缺陷是实时性较差,恢复时间较长;另外备份设备和生产系统一般都处于同一物理位置,不能满足异地容灾的要求。另一种做法就是硬件镜像的做法,这种做法在硬件投资上较大,对两点间网络带宽有较大要求。鱼和熊掌,可否兼得?下面让我们来看看Oracle Data Guard解决方案。 Oracle Data Guard Oracle9i Data Guard 维护了一个或多个与客户生产数据的同步备份。Oracle9i Data Guard配置包括一个松散连接的系统集合,由一个生产数据库和若干备用数据库组成,形成一个独立、易于管理的数据保护方案。现有运营商的核心业务系统的数据库在物理位置上往往位于省信息中心或计费中心的机房内,如果在同一城市有其它机房或利用其它城市机房部署同步备份的数据库,通过Oracle网络服务连接到一起,就可以构成一个很好的容灾解决方案。在修改主数据库时,对主数据库更改而生成的更新数据即发送到备用数据库,这些更改在备用数据库被重新应用。当生产数据库出现故障时,备用数据库可以继续提供服务。 图1提供了一个例子。 图1简单的双工作区配置

容灾系统设计文档样本

容灾系统设计 一.设计目的 为了进一步保证icms系统正常运行, 同时支持系统级别冗余替换, 在平行域的基础上设计此系统容灾机制。 二.设计背景 本机制基于具有平行域环境的ICMS系统设计, 平行域功能与实现具体参照<<平行域系统设计>> 三.基本流程 平行域中存在icmsA, icmsB, 其中icmsD为系统A与系统B的容灾系统, 正常状态下icmsD系统具有自己的系统icms标识, 其它系统仅将无法正常送达的平行域信息转发至替代的容灾系统。 容灾系统虽属于平行域下的成员, 但其内部更新的数据并不同步到其它分控, 仅接受其它分控的数据更新, 以下流程为icmsD接替icmsA的手动流程.

1.Manager登录平行域中的D, 根据数据库冗余映射关系通知系统D接替已经冗 余的系统A, 此时icmsD系统系统D获取切换命令后, 首先根据表ExRelationID的数据验证是否支持此系统的冗余替换, 如果支持此映射关系则在表ICMSInfo中添加替换系统的信息。 2.根据录像计划表内容自动划分冗余系统D中的存储条带信息, 仅分配具有计 划任务的设备, 其余设备不会参与存储条带的自动分配. 3.本地系统完成系统切换后, 需要通知平行域内所有管理服务器此次接替动作, 其它管理服务器建立映射关系, 将之后发送至系统D的所有信令转发给A。4.此时icms D具有完成icms A系统的所有功能信息, 管理服务器通知所有服 务器重新启动, 媒体服务器成功登录后检测到录像任务开始调度录像任务. 5.取消冗余系统替代时, 由Manager发送请求至icmsD, 恢复系统与平行域系 统icms标识, 恢复存储条带配置信息等

集中备份容灾系统设计方案解析

数据集中备份容灾系统方案 目前,越来越多的集团企业依赖信息系统支撑其关键业务的开展,越来越多的企业在逐步重视容灾技术,将其作为企业在遭受灾难经历后保证企业尽快恢复业务的重要手段。但实际上,容灾(DT,Disaster Tolerance),或者灾难恢复(DR,Disaster Recovery)是企业保证其业务信息系统实现不间断运行的主要技术手段。企业的最终目的是实现业务连续性(BC,Business Continuity),即当企业面临危机和灾难时,能及时恢复正常,把损失降低到最低限度,保证业务的高可用性。许多企业发现,要尽可能地保证企业业务的连续性,仅仅在技术层面考虑是不够的,还需要制定和管理一系列方法、策略、流程、条件以及部门和人力资源调配方案等等,因此,现在大部分企业在业务连续性的层面上进行统一规划和实施。 具体来说,业务连续性是一种由计划和执行过程组成的策略,其目的是为了保证企业包括生产、销售、市场、财务、管理以及其他各种重要的功能完全在内的运营状况百分之百可用。相比之下,灾难备份只是一种尽可能减少宕机损失的工具或者策略。不过,灾难备份是业务连续性的基础,没有前者,后者就是空中楼阁,但是如果一个灾难备份系统使数据恢复正常的时间过长,那也就不存在所谓的业务连续性了,缩短这个时间,就是业务连续性的目标,消除这个时间,则是业务连续性的终极目标。 所谓灾难,通常指关键业务的信息服务中断,且中断的时间让人不能忍受。引起灾难的因素很多,可以是小系统中的硬件故障,还可以是因火灾、飓风、地震而引起的数据处理设备的损坏,只要造成了关键业务的中断,都是灾难。容灾就是为恢复计算机系统提供的保障,这些保障包括备份中心、备份设备和备份数据等。 从以上对容灾系统特点分析可以看出,目前系统还无法完成现有状况下的备份和容灾要求,其设计已经不能满足企业级用户日益缩减的备份窗口下海量数据的容灾备份需求,随着业务的发展,数据量将会更加庞大,以上问题也将日益突出,因此我们从容灾技术路线的比较来分析如何有效的解决以上问题

(完整版)适合云化数据中心的备份容灾系统

a t i m e a n d A l l t h i n g s i n t h e i r b e i n g a r e g o o d f o r s o 适合云化数据中心备份容灾系统 以虚拟化、超融合、云平台等为形态的云化数据中心已经成为越来越多的企业机构数据中心升级方案。据权威媒体统计,云每年以25%的速度增加,其中虚拟化渗透率大于80%。云在按需交付、资源池化等方面有先天的优势,但随之也带来更多的数据和业务安全风险。无论是自建的云还是公有云,每年都频繁 发生大量的数据安全和业务中断事故。 在备份容灾管理领域,一方面IT 基础架构的云化变化速度已经大大超出了现有的数据保护技术的变化速度,而另一方面不少厂商又都声称自家的产品可以备

a t i m e a n d A l l t h i n g s i n t h e i r b e i n g a r e g o o d f o r s o 份云。那么到底该如何选择真正适合云化数据中心的备份容灾系统,本文重点从以下几个方面展开讨论。 什么是云化数据中心? 简单讲,就是当业务需要,数据中心可以在数分钟内增加或减少业务所需要的计算、存储、网络等资源。再简单讲,就是随时增加或减少可以安装部署业务应用软件的服务器。 自建云化数据中心的方案有多种思路,如下:1、虚拟化为中心的经典架构 这种方案是目前最主流的云化数据中心方案,主要采用的方案就是虚拟化操作系统、服务器与企业级集中式存储,该方案成熟度最高。这种方案,随着虚拟

a t i m e a n d A l l t h i n g s i n t h e i r b e i n g a r e g o o d f o r s 机规模增加,底层的集中存储会越来越感觉到不够用。这时候需要增加新的存储或服务器部署,重新迁移或分布虚拟机系统。2、以OpenStack 为代表的开源大集成架构 这套体系接近公有云平台的体系,主要的3个核心服务都采用高度弹性的方案来构成。随着引入的服务越多,运维管理复杂度也大幅度提升。目前开源体系最大的问题在于企业级运维管理的能力较弱,可靠性不能很好保障,可管理性差,易用性方面门槛很高,需要高度依赖商业发行版企业来保障持续的运行。这类平台通常是从几千到上万个虚拟机规模,是一些大型企业在重点升级的云 架构方案。 3、各类公有云的企业部署版本 国内的云计算公司,都相应推出了企业内部部署的版本,与OpenStack 的架 构类似,核心也包含3大核心服务,以及各类上层应用服务。第2、第3这类

数据中心容灾备份方案完整版

数据中心容灾备份方案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

数据保护系统 医院备份、容灾及归档数据容灾 解决方案 1、前言 在医院信息化建设中,HIS、PACS、RIS、LIS 等临床信息系统得到广泛应用。医院信息化 HIS、LIS 和 PACS 等系统是目前各个医院的核心业务系统,承担了病人诊疗信息、行政管理信息、检验信息的录入、查询及监控等工作,任何的系统停机或数据丢失轻则降低患者的满意度、医院的信誉丢失,重则引起医患纠纷、法律问题或社会问题。为了保证各业务系统的高可用性,必须针对核心系统建立数据安全保护,做到“不停、不丢、可追查”,以确保核心业务系统得到全面保护。 随着电子病历新规在 4 月 1 日的正式施行,《电子病历应用管理规范(试行)》要求电子病历的书写、存储、使用和封存等均需按相关规定进行,根据规范,门(急)诊电子病历由医疗机构保管的,保存时间自患者最后一次就诊之日起不少于15 年;住院电子病历保存时间自患者最后一次出院之日起不少于 30 年。

2、医院备份、容灾及归档解决方案 针对医疗卫生行业的特点和医院信息化建设中的主要应用,包括:HIS、PACS、RIS、LIS 等,本公司推出基于数据保护系统的多种解决方案,以达到对医院信息化系统提供全面的保护以及核心应用系统的异地备份容灾 数据备份解决方案 针对于医院的 HIS、PACS、LIS 等服务器进行数据备份时,数据保护系统的备份架构采用三层构架。 备份软件主控层(内置一体机):负责管理制定全域内的备份策略和跟踪客户端的备份,能够管理磁盘空间和磁带库库及光盘库,实现多个客户端的数据备份。备份软件主服务器是备份域内集中管理的核心。 客户端层(数据库和操作系统客户端):其他应用服务器和数据库服务器安装备份软件标准客户端,通过这个客户端完成每台服务器的 LAN 或 LAN-FREE 备份工作。另外,为包含数据库的客户端安装数据库代理程序,从而保证数据库的在线热备份。 备份介质层(内置虚拟带库):主流备份介质有备份存储或虚拟带库等磁盘介质、物理磁带库等,一般建议将备份存储或虚拟带库等磁盘介质作为一级备份介质,用于近期的备份数据存放,将物理磁带库或者光盘库作为二级备份介质,用于长期的备份数据存放。

浅谈容灾与容灾方案设计

浅谈容灾与容灾方案设计 自从有了信息技术以来,信息系统面临的各种故障和灾难就从来没有停止过。在企业信息化进程不断加快的今天,保持业务的持续性是企业用户进行数据存储时必须考虑的重要问题。灾难的出现,可能导致生产停顿、客户满意度降低,企业的竞争力会因此大打折扣。震惊世界的“9.11” 事件让全世界都看到了金融、电信企业在灾难中遭受的巨大损失。08年的南方雪灾和汶川地震告诉我们,灾难就在我们身边,容灾系统的建设已经刻不容缓。 容灾是指为了保证关键业务和应用在经历各种灾难后,仍然能够最大限度的提供正常服务所进行的一系列系统计划及建设行为,业务连续性是容灾的最终建设目标。一般来说容灾是一个宏观的概念,IT领域所说的灾备、灾难恢复等只是容灾的一部分,主要讨论数据和信息系统保护的问题,或者说是容灾整体框架中的技术基础部分。容灾技术的进步和需求的增长是企业信息化发展的必然结果,同时也反映了信息化系统及数据对个人、企业和国家的重要程度的不断提升。 信息系统容灾建设的目标是提高信息系统抵御灾难和重大事故的能力,减少意外情况发生所造成的损失,减轻对企业和社会带来的不良影响。容灾与数据安全性是密切相关的,数据的安全性是实现业务连续性的基础。统计结果表明,在过去5年内,全球93%的公司有过丢失重要数据而造成业务损失的经历,72% 的业务没有可靠的业务连续性计划,只有18%的最终用户的数据得到了可靠保护。 虽然已经认识到数据安全的重要性,但很多企业在如何建立容灾系统的问题上却存在种种疑惑。我国在实施容灾工程方面尚处于初级阶段,某些已经建成并投入使用的容灾系统,功能单一,而且存在投入成本高、投资回报率低、容灾数

容灾备份-解决方案方法

容灾备份系统 2010-8-11 项目背景 随着计算机技术的快速发展,每个企业都在大量的使用计算机处理自己的核心数据,这些数据往往是企业生产经营必不可少的部分。依赖这些数据的计算机系统的停机往往会造成企业生产经营活动的停顿,给企业造成巨大的损失。所以,可以说,这些数据是企业的生命核心。

企业的IT 管理员为了保证生产经营活动的持续运行,不断的加强对系统和数据的保护,如使用基于双机的高可用技术,磁盘阵列系统的RAID 技术等。然而,人们依然无法 回避由于磁盘故障,人为失误,应用程序的逻辑错误,自然灾害等原因带来的系统停机或者 数据丢失。所以,数据备份作为数据保护的最后一道屏障,必不可少。 二、功能介绍 实时保护:连续捕获、实时备份数据变化,全过程保护数据安全。实现真正的持续性 数据保护(CDP),无需设置任何备份时间点,居国内外同类产品领先地位。 完善备份:同一软件可实现“数据库双机热备+接管”、“本地实时灾备” 、“异 地实时灾备” ,全方位保证数据库安全。 任意回退:可按任意操作步数或时间点进行数据回退。主数据库遭到破坏时,备份数 据库可将主数据库回退到损坏前最后时刻的状态,且能保证事件的完整性。 快速恢复:主数据库或表损坏,从站自动检测,提示回退的步数。恢复1个G数据 库在3-5分钟。 增量备份:只备份变化部分,在保障备份数据安全的同时减少备份的工作量。 错峰机制:在系统负荷极大时暂停备份以免系统瘫痪,当系统负荷下降时备份暂停 期间的数据,并重新开始实时备份。 低耗资源:对主数据库压力小,系统采用消息机制,只有灾数据库发生变化时才触 发,只传数据库的变化部分,不同于文件拷贝,和数据表的轮询。 操作简单:自主开发设计,着重考虑国内用户使用习惯,安装、设置非常简单。维护 方便:启动或连接中断后重连时,自动校验主从站数据,保证数据准确。 加密传输:底层通讯采用自主研发的通讯平台,所有数据都是用加密数据包进行数据 交换,充分保证数据安全。 高性价比:在各项性能领先的同时,价格远远优于国外软件。当选择不接管的热 容灾备份方式时,从站可采用低档Server 或高稳定性的PC(有足够的存储空间即 可),从而实现极低的总体成本。 通用性好:不对数据库中的应用做任何修改。与数据库中表的结构无关,且无任 何限制。对数据库备份完整:如TABLES(表)、DIAGRAM(S关系图)、VIEWS(视图)、USERS(用户)、ROLES、RULES等。

阿里云混合云容灾服务

阿里云混合云容灾服务 产品简介 文档版本:20181122

混合云容灾服务产品简介 / 法律声明法律声明 阿里云提醒您在阅读或使用本文档之前仔细阅读、充分理解本法律声明各条款的内容。如果您阅读或使用本文档,您的阅读或使用行为将被视为对本声明全部内容的认可。 1.您应当通过阿里云网站或阿里云提供的其他授权通道下载、获取本文档,且仅能用于自身的合法 合规的业务活动。本文档的内容视为阿里云的保密信息,您应当严格遵守保密义务;未经阿里云事先书面同意,您不得向任何第三方披露本手册内容或提供给任何第三方使用。 2.未经阿里云事先书面许可,任何单位、公司或个人不得擅自摘抄、翻译、复制本文档内容的部分 或全部,不得以任何方式或途径进行传播和宣传。 3.由于产品版本升级、调整或其他原因,本文档内容有可能变更。阿里云保留在没有任何通知或者 提示下对本文档的内容进行修改的权利,并在阿里云授权通道中不时发布更新后的用户文档。您应当实时关注用户文档的版本变更并通过阿里云授权渠道下载、获取最新版的用户文档。 4.本文档仅作为用户使用阿里云产品及服务的参考性指引,阿里云以产品及服务的”现状“、“有缺 陷”和“当前功能”的状态提供本文档。阿里云在现有技术的基础上尽最大努力提供相应的介绍及操作指引,但阿里云在此明确声明对本文档内容的准确性、完整性、适用性、可靠性等不作任何明示或暗示的保证。任何单位、公司或个人因为下载、使用或信赖本文档而发生任何差错或经济损失的,阿里云不承担任何法律责任。在任何情况下,阿里云均不对任何间接性、后果性、惩戒性、偶然性、特殊性或刑罚性的损害,包括用户使用或信赖本文档而遭受的利润损失,承担责 任(即使阿里云已被告知该等损失的可能性)。 5.阿里云网站上所有内容,包括但不限于著作、产品、图片、档案、资讯、资料、网站架构、网站 画面的安排、网页设计,均由阿里云和/或其关联公司依法拥有其知识产权,包括但不限于商标权、专利权、著作权、商业秘密等。非经阿里云和/或其关联公司书面同意,任何人不得擅自使用、修改、复制、公开传播、改变、散布、发行或公开发表阿里云网站、产品程序或内容。此 外,未经阿里云事先书面同意,任何人不得为了任何营销、广告、促销或其他目的使用、公布或复制阿里云的名称(包括但不限于单独为或以组合形式包含”阿里云”、Aliyun”、“万网”等阿里云和/或其关联公司品牌,上述品牌的附属标志及图案或任何类似公司名称、商号、商标、产品或服务名称、域名、图案标示、标志、标识或通过特定描述使第三方能够识别阿里云和/或其关联公司)。 6.如若发现本文档存在任何错误,请与阿里云取得直接联系。

两地三中心容灾系统设计方案

两地三中心容灾系统设计方案 系统介绍 统一考核平台数据库、流程处理应用服务及总行级web服务放在一台服务器上,数据存储在磁盘阵列上,两台服务器互为备份,全行考核平台数据集市、实例系统数据集市及实例系统考核结果数据存储在磁盘阵列上。各实例系统设置本实例系统的查询web服务器,通过网络与本实例系统考核数据集市相连,提供本实例系统的考核数据查询及报表展现,考核平台最终用户通过局域网或广域网连接到查询web服务器。主要数据应用环境为DB2数据库,以下是系统的基础架构图: 以下是整套系统的功能架构图:

●当前环境 当前数据库存放在V7000系统存储中,V7000通过SVC管理,IBM SVC虚拟化方案实现存储层的双活,SVC采用stretched cluster,利用两台V7000实现vdisk mirror,加入第三个节点作为仲裁节点,每台V7000总可用容量120T,两个node距离20KM,通过DWDM设备 ●用户痛点: 1.目前全行两地三中心建设,在现有的技术条件下,当前V7000存储环境不支持两地 三中心灾备建设 2.月末,季末,报表查询导出,绩效统计,考核业务压力大,主要瓶颈在于存储的I/O 压力。 3.客户希望提高分行考核系统的处理速度,应对日益增长的员工数和分支行数量带来 的数据增长的压力。 4.两地三中心的容灾建设,需要定时切换验证数据的有效性, 目前的SVC双活环境无 法实现两地三中心的数据保护。

●解决方案: ?基础架构选型 a.SVC使用已有的SVC-DH8, 相对于以往的SVC版本,它在多项硬件功能上做了改 进,在实时压缩等功能上都有非常好的表现。 b.与EMC XtreamIO闪存系列存储相比,IBM flashsystem可以在更小的机架空间提 供四倍于EMC XtremIO闪存产品的容量,并提供更高的IOPS。因此选用 Flashsystem FS 900,IOPS为1.1M, 相比于flashsystem 840, 900提供了更高的带 宽(读10GB/sec, 写4.5GB/sec)和更大的总可用容量,同时IBM与镁光合作,采 用改进的MLC Nand, 提供了更高的可靠性。考虑到当前交换机不支持16G port, Flashsystem 900采用16个8G port,2.9T的flash module, 总可用容量26T左右, 占用2U空间,在空间上不用再添加新的物理机柜。 c.本地SVC VDM双活采用已有的DWDM设备,两条运营商裸光纤链路实现线路 冗余,异地复制增加思科FCIP设备,数据压缩比最高可以达到1:6, 以减少链路 带宽占用,同时租用两家运营商IP专网,联通和电信,均为155*2M。 d.交换机支持8G port, 在该方案中不存在ISL情景。 e.需要新采购一套同等配置的V7000存储作为第三中心异地存储。 ?技术选型 a.本地复制仍然采用SVC提供的virtual disk mirror双活技术, b.为了解决当前存储的性能瓶颈,为SVC添加flash system 900的存储层,采用SVC 的easy tier,该功能在SVC上默认打开,不会额外增加采购成本。 c.远程复制采用V7000的Global mirror, RPO 30秒。 d.由于可以利用SVC和V7000的快照和复制技术,暂时不必采购V9000, 以后可 以根据业务需要进行横向扩展。 如上图,方案设计如下:

某公司系统容灾解决建设方案

某公司软件容灾方案 1容灾软件 Symantec 的存储管理软件VERITAS Storage Foundation(简称SF)适用于企业存储管理的标准化平台,它不仅提供比操作系统本身逻辑卷管理器更加强大的在线卷管理功能,还提供许多高级的存储管理功能,其中包括用于容灾的数据镜像、数据复制等功能。是目前市场上广泛使用的容灾软件。 Symantec VERITAS Cluster Server(简称VCS)是一个用于容灾演练、应用级容灾的软件。它是在基本的HA软件功能的基础上发展而来的。 Veritas Storage Foundation 软件可以根据企业不同需求,提供不同的容灾解决方案,小到同城数据镜像,大到两地三中心数据容灾。SF与VCS紧密集成,可以提供完整的、从数据到应用、并自动实时演练的企业容灾方案。 铁道部高铁指挥实验系统采用了SF/VCS实现了容灾。

2数据同城镜像方式 利用灾备中信和主中心之间或者同机房内的裸光纤线路构成SAN环境,直接采用Storage Foundation在两个存储之间实现存储镜像。即所有数据都将同时写入两边的磁盘整列中。 如上图所示,主中心的服务器将应用的每个写i/o数据同时写入到两个中心的存储中。由于镜像的实现是依托于底层的Volume,所有数据存取的过程对于应用来说都是透明的。我们可以通过设臵Volume Manager的读取策略来指定主中心的服务器从本地的磁盘阵列上读取数据,加快数据查询的速度。 在这个场景中,数据发生物理错误的可能性基本上分为两种,生产中心的存储系统出现物理错误,如硬盘问题、光纤卡问题、光纤连接问题或光纤交换机问题等,另外一种就是整个数据中心出现故障。

金融云计算容灾技术规范

云计算技术金融应用规范 容灾 Financial application specification of cloud computing technology—— Disaster recovery

目次 前言..................................................................................II 1范围 (1) 2规范性引用文件 (1) 3术语和定义 (1) 4缩略语 (3) 5概述 (3) 6云计算平台容灾能力分级 (3) 7预案与演练 (7) 8组织管理 (7) 9监控管理 (8) 10监督管理 (8) I

JR/T 0168—2018 前言 本标准是云计算技术金融应用系列标准之一,云计算技术金融应用系列标准包括: ——《云计算技术金融应用规范技术架构》; ——《云计算技术金融应用规范安全技术要求》; ——《云计算技术金融应用规范容灾》。 本标准按照GB/T 1.1—2009给出的规则起草。 本标准由中国人民银行提出。 本标准由全国金融标准化技术委员会(SAC/TC 180)归口。 本标准负责起草单位:中国人民银行科技司、中国人民银行福州中心支行。 本标准参加起草单位:中国金融电子化公司、网联清算有限公司、中国互联网金融协会、中国人民银行泉州市中心支行、北京中金国盛认证有限公司、北京移动金融产业联盟、中金金融认证中心有限公司、北京银联金卡科技有限公司、北京软件产品质量检测检验中心、财付通支付科技有限公司、蚂蚁金融服务集团、华为技术有限公司、阿里云计算有限公司、北京百度网讯科技有限公司、新华三技术有限公司、万国数据服务有限公司、兴业数字金融服务(上海)股份有限公司、亚马逊通技术服务(北京)有限公司、北京京东金融科技控股有限公司、中国工商银行、中国农业银行、中国银行、中国建设银行、招商银行、中国光大银行、中国民生银行、平安银行、国泰君安证券股份有限公司、华泰证券股份有限公司、中国人寿保险(集团)公司、中国人民保险集团股份有限公司、中国银联股份有限公司、天津麒麟信息技术有限公司、北京三快云计算有限公司。 本标准主要起草人:李伟、李兴锋、邬向阳、张宏基、班廷伦、强群力、杨倩、聂丽琴、林光丰、郭林、胡达川、朱勇、周国林、辛路、杨彬、陈则栋、林羽、段家钦、傅凯铮、吴永强、吴金海、白阳、于柳婍、张文涛、符海芳、汪琪、高勇、赵华、郭红英、高志民、高强裔、金怡、孔令斌、杜辉、居未伟、李明凯、王晓燕、张亮、刘刚、杨俊、郝轶、陈当阳、樊华、罗子强、雷佳杰、许涛、王绍斌、张荣典、燕冰、曹辉、董亮、苏晗、赵春华、高天游、司渤洋、来宾、种毓鑫、李澍、张洁、陈晨、章彩红、刘永福、穆冬生、宋杰、瞿红来、黄超、高坤、李荣振、李宝、巩向锋、李国光、谭晓辉、王仕、王研娟、林春、周亚国、张洋洋、张翰林。 II

云计算平台容灾解决方案2011

云数据中心容灾解决方案 VMware SRM

目录 一方案介绍 (3) 二方案设计 (5) 2.1方案拓扑结构 (5) 2.2方案描述 (5) 三方案优势 (10) 3.1方案总体优势 (10) 3.2服务器虚拟化优势 (10)

一方案介绍 从5.12坟川大地震、1.21海地地震、2.17智利大地震以及我国北方的雪灾等自然灾害和其他的意外灾难如火灾、水灾,无论是医院、学校还是企业,作为数据中心的领导,我们重视到了对于保护数据的完整性、提高业务的连续性的紧迫性。对于单位的业务系统而言,高可用性与连续性至关重要。一旦数据系统遭遇灾难损坏或服务器设备发生故障,将给单位带来诸多不便甚至会给单位和社会造成巨大的损失。如何确保业务的不间断,对服务器和容灾备份系统提出了更为严格的要求。 利用VMware站点容灾技术,确保在各种灾难损害发生后,依然能够最大限度地保障提供正常应用服务。异地组建的容灾数据中心通过VMware Site Recovery Manager实现生产站点与恢复站点之间系统级自动切换,保障业务连续性。 VMware Site Recovery Manager是VMware 提供的一款灾难恢复管理和自动化解决方案。它通过自动执行恢复过程来加快恢复的速度,并将灾难恢复作为VMware虚拟基础架构管理的集成要素,从而简化灾难恢复计划的管理工作。该解决方案省去了复杂的手动恢复步骤,支持无中断的恢复计划测试,确保了恢复过程的安全性与可靠性。

利用VMware Site Recovery Manager,不仅可以管理从生产数据中心到灾难恢复站点的故障切换,还可以管理两个互为恢复站点且具有活动工作负载的站点之间的故障切换。同时,VMware Site Recovery Manager还可以自动执行及简化故障切换至新数据中心的过程,从而让所计划的数据中心故障切换(如数据中心迁移)变得更加顺畅。 而且能够简化并自动执行设置、测试和执行恢复计划: 设置恢复基础架构。Site Recovery Manager不仅会指导用户完成连接远程站点并连接使用的存储复制软件的操作,还可让用户轻松地将生产资源(包括计算资源和网络资源)映射到恢复站点上相应的资源。 创建恢复计划。Site Recovery Manager具有直观的界面,可以协助用户创建适用于不同故障切换情况和基础架构不同部分的恢复计划。用户可以指定一些虚拟机暂停或关闭,从而释放可用资源以供恢复使用。还可以指定虚拟机启动的顺序、设置用户定义的脚本自动执行,以及必要时决定暂停恢复过程的时间点。 测试恢复计划。Site Recovery Manager可以利用存储阵列的快照功能,在恢复站点上自动创建无中断的、隔离的测试环境,然后将虚拟机连接到用户的隔离测试网络中。它将自动执行在实际故障切换中将使用的恢复计划,并在测试结束后清除测试环境。测试结果会被保存,以便随时查看和导出。 自动执行故障切换。管理员从VirtualCenter启动恢复计划之后,Site Recovery Manager会自动执行恢复计划中的所有步骤,保证恢复完全按照预期执行。管理员通过VirtualCenter可以看到恢复计划的执行情况,并可以随时暂停或停止执行。

容灾系统设计

13.1 容灾方法的具体分析 13.1.1 灾难备份需求的衡量指标 对于大多数企业而言,提到灾难备份,最直接的反映就是增加预算,购买更多的主机,存储设备以及相应软件。虽然这是实施灾难备份项目的一个必要步骤,但是,从“灾备方案应是风险和成本相应平衡”的出发点来综合考虑,实施灾难备份项目的第一步应该从“分析评估以确定灾难灾难备份需求目标”开始。 RTO (Recovery Time Objective) RTO,Recovery Time Objective,是指灾难发生后,从I/T 系统当机导致业务停顿之刻开始,到IT 系统恢复至可以支持各部门运作,业务恢复运营之时,此两点之间的时间段称为RTO。 一般而言,RTO 时间越短,即意味要求在更短的时间内恢复至可使用状态。虽然从管理的角度而言,RTO 时间越短越好,但是,这同时也意味着更多成本的投入,即可能需要购买更快的存储设备或高可用性软件。 对于不同行业的企业来说,其RTO 目标一般是不相同的。即使是在同一行业,各企业因业务发展规模的不同,其RTO 目标也会不尽相同。 RTO 目标的确定可以用下图来说明: 如上所说,RTO 目标越短,成本投入也越大。另一方面,各企业都有其在该发展阶段的单位时间赢利指数,该指数是通过业务冲击分析(BIA-Business Impact Analysis)咨询服务,以交谈、问答和咨询的方式得到确定的。在确定了企业的单位时间赢利指数后,就可以计算出业务停顿随时间而造成的损失大小。如上图,结合这两条曲线关系,存储工程师将可以找到对该企业而言比较适合的RTO 目标,即在该目标定义下,用于灾难备份的投入应不大与对应的业务损失。 RPO (Recovery Point Objective) RPO,Recovery Point Objective,是指从系统和应用数据而言,要实现能够恢复至可以 支持各部门业务运作,系统及生产数据应恢复到怎样的更新程度。这种更新程度可以是上一周的备份数据,也可以是上一次交易的实时数据。

数据容灾备份中心建设方案书.

https://www.360docs.net/doc/fc13600779.html, - 国内第一医疗信息化网站,为业内人士提供最强大的交流共享平台 ×××单位 数据容灾备份中心建设方案书(DSG-Realsync数据复制容灾技术) 迪思杰(北京)数码技术有限公司 DSGdata Inc.

迪思杰(北京)数码技术有限公司 目录 第一部需求分析 (7) 1 容灾项目建设需要注意的几大问题 (9) 1.1 为什么要建容灾系统 (9) 1.2 容灾不能替换备份 (9) 1.3 容灾项目需要多大的投资? (11) 1.4 容灾项目如何解决投资回收问题 (12) 1.5 容灾项目对生产系统性能的影响 (13) 1.6 选择什么容灾技术能保证项目实施成功? (13) 2 容灾项目的建设原则“平战结合” (14) 2.1 变成本中心为利润中心 (14) 2.2 核心业务的灾备平台 (14) 2.3 业务负载分担 (14) 2.4 容灾技术的推荐“DSG RealSync” (15) DSG-RealSync数据同步复制容灾产品应用案例 (15) DSG-SnapAssure高速备份产品应用案例 (16) 2.5 DSG RealSync数据库复制产品的特点 (17) 3 容灾技术对比和分析 (20) 3.1 容灾产品概述 (20) 3.2 基于异地备份技术实现容灾的分析 (20) 3.3 基于应用层容灾技术的分析 (21) 3.4 基于磁盘阵列复制容灾技术的分析 (21) 3.5 基于存储卷复制容灾技术的分析 (23) 3.6 基于虚拟化存储技术的分析 (24) 3.7 基于Oracle DataGuard容灾技术的分析 (25) 3.8 DSG Realsync容灾技术的分析 (27) 第二部整体方案设计 (30) 4 方案设计(案例:西部证券) (31) 4.1 需求分析 (31) 4.2 DSG灾备一体化产品线 (31) 4.3 Snapassure与Realsync的关系 (31) 4.4 容灾技术的推荐 (32) 4.5 系统结构 (33) 4.6 实时复制软件realsync配置 (33) 4.7 定时备份软件snapassure配置 (34) 4.8 功能实现 (34) 4.9 性能和资源需求估算 (35) 4.9.1网络需求 (35) 4.9.2日志分析速度 (35) 4.9.3每秒钟复制的操作数 (35) 4.9.4复制数据延迟 (35) 4.9.5CPU资源占用 (36)

相关文档
最新文档