EMC存储容灾解决方案

EMC存储容灾解决方案
EMC存储容灾解决方案

XX县人民医院存储项目EMC存储恢复容灾方案

2011年11月

目录

第1章 EMC主备存储容灾互切说明 (2)

1.1 XX医院IT现状简述 (2)

1.2 存在的主要问题 (2)

1.3 EMC的解决方案 (2)

1.4 主备存储、容灾装置等发生故障时切换说明 (4)

1.5 医疗行业及国内部分容灾案例 (5)

第2章生产存储性能和容灾存储可用性说明 (9)

2.1 生产存储VNX5100的性能说明 (9)

2.2 生产存储VNX5100的空间分配 (11)

2.3 生产存储VNX5100的性能监控和解决建议 (11)

2.4 容灾存储的可用性说明 (12)

第3章实施步骤、效果说明和测试方案 (13)

3.1 整个EMC Recoverpoint实施步骤和时间预估 (13)

3.2 效果说明 (13)

3.3 测试目的 (14)

3.4 测试环境说明 (14)

3.5 服务器系统 (15)

3.5.1常见系统故障 (15)

3.5.2常见系统维护 (15)

3.6 测试项目设置 (16)

3.7 具体测试内容 (17)

3.7.1数据一致性测试 (19)

3.7.2数据容灾故障恢复测试 (20)

3.7.3容灾:任意时间点回滚测试 (22)

3.7.4容灾: 容灾存储恢复至主存储数据测试 (24)

3.7.5容灾:主存储误操作数据恢复测试 (25)

第4章 EMC秒级恢复容灾方案RecoverPoint介绍 (27)

4.1 EMC RecoverPoint介绍 (27)

第1章EMC主备存储容灾互切说明

1.1 XX医院IT现状简述

L A N

主机房

orporation. All rights reserved.

3台数据库服务器,包括HIS、LIS、PACS等。存储使用一台EMC NX4。1.2 存在的主要问题

1,保存全院关键业务数据的存储只有一台,存在单点故障,一旦出现灾难事件,全院业务将受到影响。

2,PACS影像文件没有实现归档,占用主存储空间和降低主存储性能。

3,随着业务的增长,现有的NX4会遇到更大的性能压力。

1.3 EMC的解决方案

EMC推荐的解决方案采用业内最成熟、可靠、先进的技术,可以很好的解决以上三点问题。EMC方案非常方便的融合到现有的应用系统中,应用系统无需做

大的变动。

整个拓扑如下:

等备机

4x

4x

4x

SAN

SAN

4x

生产机房

医院内部网络

VNX5100

VNX5100

EMC 容灾装置recoverpoint

生产副本日志

生产日志2x

san-switch*2

8口san-switch*2

VMware vSphere

方案说明: (一)

服务器:原有的两台服务器可不做修改,配置一台服务器或在其上安装

虚拟机给灾备阵列,安装HIS 等软件,作为HIS 等系统的备机。 (二)

存储交换机:原有生产机房内的两台光纤存储交换机升级为16口,新购

置两台DS-300B 8口光纤交换机置于容灾机房。 (三)

信息中心生产和容灾存储:原有机房增加一台EMC 中端存储VNX5100阵

列,原来的NX4在完成数据迁移后作为备份存储使用。 (四)

业务连续性保护装置:增加2台连续数据保护RecoverPoint 服务器装置,

通过旁路实现数据的同步,不对主阵列造成性能上的负担。2台装置之间采用高可用配置,任何一台故障,对生产或容灾没有影响。若2台装置发生故障,对生产也没有任何影响。 (五)

业务连续性保护软件:使用EMC 独有的技术产品RecoverPoint CDP ,将

生产存储上的关键应用数据(HIS/PACS)实时同步到容灾存储上,实现数据的2份保存。RecoverPoint 具备传统容灾方案所没有的数据回滚功能,可以解

决传统容灾经常碰见的致命问题数据库因逻辑故障而无法启动的故障,通过

RecoverPoint精确到IO数据回滚功能完美解决。同时RecoverPoint还有支

持异构存储整合、灾备存储根据需要打开容灾数据库、链路带宽压缩等一系

列高端功能。

1.4 主备存储、容灾装置等发生故障时切换说明

此处假设已经完成生产和容灾阵列以及容灾装置、网络等架构部署,在生产机房的EMC VNX5100作为主生产阵列(标识为一号存储),容灾机房的VNX5100作为容灾阵列(标识为二号存储)。针对阵列、recoverpoint装置的故障切换步骤描述。

当生产存储(一号存储)发生误操作时,应急操作如下:

1.由于二号存储内的数据随时可用,可以在10分钟内回滚到过去任意时间点的;故把容灾机房内的二号存储进行切换操纵,升级成生产存

储,提供存储服务。对于生产主机或容灾主机读写,RecoverPoint

装置会继续纪录这些主机的写I/O。

2.在生产机房的一号存储故障解决后,使用容灾机房的二号存储的正确数据覆盖一号存储的数据,这一动作在后台完成。VNX5100带宽为

400MB/s,假设有30%带宽用于后台覆盖原生产存储的数据操作,则每

小时大概可以往原生产存储写360G数据。可以快速的实现HIS/LIS

的数据同步。

3.等一号存储数据覆盖和数据正确性检验完成后,把一号存储重新升级成主存储给生产主机访问。

当容灾存储(二号存储)发生误操作时,应急操作如下:

1.若容灾存储二号存储发生故障,对生产系统无任何影响。

2.等二号存储的故障修复后;通过EMC Recoverpoint装置将变化的数据同步到二号存储上。这一动作在后台完成,实现两边的数据一致可

用。

当recoverpoint容灾装置发生误操作时,应急操作如下:

1.首先recoverpoint装置是由2个单节点组成的高可用集群,真正消

除了单点故障。

2.假设一台发生故障,对生产阵列、容灾阵列没有任何影响,2台装置间的集群会自动接管,继续实现数据的实时同步。

3.假设2台均发生故障,由于recoverpoint采用的是旁路方式,对生产阵列也没有影响,暂时无法实现对容灾阵列的数据同步。不过2台

同时坏的几率极低。

4.在recoverpoint装置修复好后,可以将生产阵列的数据全部重新同步到容灾阵列上。

5.Recoverpoint容灾服务器装置最大支持8个节点组成高可用集群。本次配置2个RecoverPoint设备群集使用,2个均处于活动状态,带宽

高达150MB/s,足以实现关键数据连续保护,记录写I/O需要的带宽。

当存储交换机发生误操作时,应急操作如下:

1.共有4台存储交换机,组成2个独立、冗余的fabric网络。

2.新购的2台SAN交换机为8Gb的带宽,完全可以满足医院HIS/LIS/PACS的带宽要求。

3.任何一台交换机故障均不会影响生产、容灾。

4.交换机的故障修复后,插回原来的位置继续提供冗余的fabric网络。

可见,在处理误操作,数据回滚方面,对生产带来的影响仅仅是切换的数分钟甚至秒级恢复时间,符合医院的数据不丢失,应用中断到最小的要求。

1.5 医疗行业及国内部分容灾案例

说明: EMC Recoverpoint 有3种部署模式:

CDP: 本地业务连续性保护(<2km),

CRR: 远程业务连续性保护(2km-1000km),

CLR: 本地和远程业务连续性保护

第2章生产存储性能和容灾存储可用性说明

2.1 生产存储VNX5100的性能说明

此次配置的生产存储及容灾存储均为EMC中端阵列VNX5100。全球已经售出1万台以上。获得了客户的良好评价,尚未遇到性能瓶颈,此外还可以通过EMC 的企业级闪存盘(SSD)和FAST软件包大幅度提升阵列的性能。

VNX 系列是一种强健的平台,整合了原有的数据块存储、文件服务器和直连应用程序存储,使客户可以动态增加、共享和经济高效地管理多协议文件系统以及多协议数据块存储访问。VNX 操作环境支持Microsoft Windows? 和Linux/UNIX 客户端在多协议(NFS 和 CIFS)环境中共享文件。同时,它还支持高带宽和对延迟敏感的数据块应用程序的 iSCSI、光纤通道和 FCoE 访问。EMC Atmos ? Virtual Edition软件和 VNX 存储结合使用,可支持基于对象的存储,并使客户能够通过 EMCUnisphere 管理 Web 应用程序。

VNX 系列的新一代存储平台包括VNX5100, VNX5300, VNX5500, VNX5700和VNX7500,由带 6-Gb/s SAS 驱动器后端的 Intel Quad Core Xeon 5600系列提供支持,与上一代的存储相比,性能得到大幅提升:

?运行Microsoft SQL 和Oracle 的速度比以前快3 倍

?不到两分钟就可使系统性能翻倍,而且无中断

?运行数据仓库的速度快3 倍

VNX 系列专门设计为利用闪存驱动器技术的最新创新成果,最大程度提高存储系统的性能和效率,同时将每 GB 成本降至最低。即使只有数个闪存驱动器与EMC FAST 套件结合使用,客户也可以体验到 FLASH 1st 策略带来的最佳优势。

VNX的主要特性包括:

?无折扣的可用性:即使在出现故障的情况下也可以保证相同的性能和服务级别。

?免费的高级功能:通过数据压缩、文件系统数据消重、虚拟资源分配的技术,以实现对存储更有效的使用。

?丰富的软件:VNX软件包提供所有必要的功能来管理和保护客户的信息,包括数据复制功能、通过快照和克隆实现按时间点数据恢复功能,以及定义保护策略等。

?自动分层:EMC独特的FLASH 1st策略可以将“热”数据自动放到高性能磁盘和缓存中,已最小的管理代价提高应用的性能。

?集中管理:EMC Unisphere管理软件通过简单易用、集成化的管理方式,减少对用户的配置、管理和监控工作量。

?灵活的模块化设计:用户可以初始配置文件或块存储的功能,需要的时候升级为同一存储。

?虚拟化集成. EMC10 与VMware10 vSphere?有超过60 个集成点,这使VNX?最大限度地提高了性能和易用性。EMC 是唯一一家支持所有

vStorage API 系列产品的供应商。

高效的架构:多核Intel Xeon处理器和6 Gb/sec SAS 提供了更好的性能和高级软件的基础。

EMC阵列在医疗行业拥有强大的稳定性和性能。比如玉林人民医院(CX4-480,HIS/PACS/LIS)和柳州人民医院VNX5500均未遇到性能问题。且VNX5100的16G内存和后端24Gb的带宽,最大可以支持150TB容量,完全可以满足医院的性能和以后的空间需求。

故我们认为,VNX5100作为生产阵列完全可以满足客户的性能需求。

2.2 生产存储VNX5100的空间分配

目前配置600G*8 SAS2.0 15krpm硬盘和2TB*4块 NL-SAS 7.2krpm硬盘,可用空间达12TB。

主要有2个应用:HIS、PACS。

对于HIS系统分别分配2TB,

使用虚拟资源调配功能分配空间给2TB给PACS(每个月800G)分配,最高可扩展至10个TB。

预计HIS日志空间,每天变化100M,按照数据往前回滚30天的要求计算所需的空间为:

100MB*30/0.75=4000MB.

空间上可以满足客户的需求。

2.3 生产存储VNX5100的性能监控和解决建议

实施完recoverpoint后,EMC将会在1-2个月内收集VNX5100的性能数据,通过EMC专业的工具进行分析,检查系统中是否存在阵列的瓶颈。

若存在性能问题,可以通过2种方式提升性能:

1,添加闪存盘和FAST suite包,提升存储的二级cache;

2,通过FAST suite自动的将热点数据迁移到闪存盘,提升整个阵列的性能。

2.4 容灾存储的可用性说明

容灾存储的数据通过Recoverpoint从生产存储迁移到VNX5100上。结合容灾存储上配置的服务器,在需要的时刻将VNX5100二号机上的HIS数据库打开,模拟生产环境。

在模拟的环境中可以用作:

1,解决数据库的逻辑故障,快速的将二号存储上的数据恢复到一号存储上,从而保证数据库能够打开;

2,减少数据的丢失,在生产系统遭遇病毒、人为误删除后,二号存储可以快速任意IO回滚,找到丢失的数据,从而减少医疗纠纷。

3,降低新业务上线前的风险,模拟的环境进行BUG测试;

4,降低数据库的升级风险,数据库升级前的模拟环境,在遇到故障后可以进行任意的回退;

5,制作月报、年度报表,历史数据查询,减轻生产阵列的压力。

6,通过不断的演练recoverpoint,可以让客户熟练掌握EMC的容灾技术,在关键时候能够快速的实现数据的恢复、减少应用停机的时间。

第3章实施步骤、效果说明和测试方案

3.1 整个EMC Recoverpoint实施步骤和时间预估

3.2 效果说明

1,实现存储间的数据互联互通、相互流动的功能。

2,实现主备存储间数据实时同步,主备存储的数据一致、高可用的功能。

3,实现当主存储发生逻辑错误后,可以通过备用存储对主存储的数据追回、不丢失数据的功能。

4,实现存储上的数据任意时间点回滚功能,有效地避免主数据库的逻辑错误或突然断电导致数据库无法正常运行的故障。并将数据丢失率降低至最小。

5,实现备用存储的在线使用功能,当备用存储的数据修改后,能够直接恢复到主存储。该功能可以在备用存储上打开数据库,实现报表、测试、升级、培训

等操作,分流用户的业务,降低生产系统的负载。

6,完成备用存储的报表、测试、升级、培训功能后,可以通过主存储将其变化的数据继续同步到备用存储,恢复存储间的数据实时同步,保持数据一致、高

可用状态。

3.3 测试目的

为了检验是否可以达到客户的要求,在首次完成recoverpoint 后,需要按照以下的要求进行测试:

1,实现河池XX 医院HIS 等应用系统容灾,实现存储设备数据同城或者异地容灾功能

3,对出现故障以后(服务器, 存储, 应用软件)进行数据恢复演练,测试数据及应用恢复时间。

3.4 测试环境说明

测试环境组网架构图如下:

为实现上述的测试目标,需要在河池XX 医院测试环境中搭建一

EMC RecoverPoint 应用装置

(RPA)

本地复制卷

本地日志卷

VNX5100

本地生产卷

服务器 HIS/PACS

光纤交换机

VNX5100

RecoverPoint系统,主要组成部件有:

●VNX5100系列存储两台.

●光纤线及光纤交换机2台

●服务器,安装WIN2008系统和数据库

●EMC Recoverpoint RPA 两台

●控制电脑两台

3.5 服务器系统

3.5.1常见系统故障

本测试根据实际工作环境下系统可能发生的故障或事故,EMC总结了应用运行时常见故障,并提供数据安全解决之道。

?常见多发故障:

?服务器故障

?SAN网络故障

?生产存储硬盘损坏

?生产存储控制器损坏

?数据库逻辑错误导致数据库无法启动

?工作人员误操作导致数据丢失

?黑客攻击人为恶意篡改数据

3.5.2常见系统维护

本测试根据实际工作环境下系统可能发生的业务和工作情况,EMC总结了常见维护事项,并提供例行维护解决之道。

?生产服务器补丁升级

?数据库补丁升级

?业务系统统计报表

?应用软件开发测试

?工作人员培训

?系统容量不足增加硬盘

?设备性能不足设备替换

3.6 测试项目设置

根据上述故障和例行维护特点,同时结合EMC以往客户在安装、实施、运维时的经验设计了以下测试场景:

3.7 具体测试内容

?数据一致性测试:

-添加CDP保护卷:

模拟生产系统在正常运行时,将指定的应用数据纳入RecoverPoint系统

保护的过程,以此验证RecoverPoint系统实施的方便和灵活程度。

-删除CDP保护卷:

模拟生产系统在正常运行时,将指定的应用数据脱离RecoverPoint系统

保护的过程,以此验证RecoverPoint系统更改的方便和灵活程度。

-CDP数据复制:

模拟生产系统在正常运行时,受保护的生产数据向CDP备份卷复制的过程。

-CDP粒度设置:

模拟生产系统在正常运行时,在RecoverPoint系统中设置恢复时间点,

调整恢复点的粒度,从系统优化的推荐值到最小1秒钟或者是精确到每

个I/O

-CDP一致性组:

模拟生产系统在正常运行时,将指定的应用程序及数据库数据加入到一

致性组,以此验证RecoverPoint系统在多个数据源之间的一致性。

?容灾故障切换测试:

-故障切换:

模拟生产系统在正常运行时,主存储阵列故障导致应用数据不可用时,

RecoverPoint系统如何在备份端启动应用并保证数据一致可用。

-故障回切:

模拟生产系统切换到备份端运行时,主存储阵列恢复正常后,备份端对

应用数据所做的修改可以被保存,并且在应用切换回主存储阵列时上述

修改不会丢失,验证整个切换过程的方便和灵活程度。

?容灾数据回滚测试:

-CDP回滚:

模拟生产系统在正常运行时,由于操作失误造成数据丢失,使用

RecoverPoint系统恢复到最近一个正常的时间点,在最短时间内恢复应用

同时使得数据丢失量最小。

-CDP模拟回滚与物理回滚流程:

-模拟生产系统在正常运行时,由于操作失误造成数据丢失,使用RecoverPoint系统模拟回滚到最近一个时间点,经检查后此时间点数据仍

是丢失状态,继续回滚到上一个时间点,检查数据是否仍然丢失,直至

找到最近一个正常的时间点,验证模拟回滚和物理回滚之间操作的便利

性。

?容灾存储使用

在主生产存储在使用时,在容备存储打开数据库,进行报表,开发,培训,校验等,同时不影响容灾业务。

3.7.1数据一致性测试

数据中心容灾备份方案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

数据保护系统 医院备份、容灾及归档数据容灾 解决方案 1、前言 在医院信息化建设中,HIS、PACS、RIS、LIS 等临床信息系统得到广泛应用。医院信息化 HIS、LIS 和 PACS 等系统是目前各个医院的核心业务系统,承担了病人诊疗信息、行政管理信息、检验信息的录入、查询及监控等工作,任何的系统停机或数据丢失轻则降低患者的满意度、医院的信誉丢失,重则引起医患纠纷、法律问题或社会问题。为了保证各业务系统的高可用性,必须针对核心系统建立数据安全保护,做到“不停、不丢、可追查”,以确保核心业务系统得到全面保护。 随着电子病历新规在 4 月 1 日的正式施行,《电子病历应用管理规范(试行)》要求电子病历的书写、存储、使用和封存等均需按相关规定进行,根据规范,门(急)诊电子病历由医疗机构保管的,保存时间自患者最后一次就诊之日起不少于15 年;住院电子病历保存时间自患者最后一次出院之日起不少于 30 年。

2、医院备份、容灾及归档解决方案 针对医疗卫生行业的特点和医院信息化建设中的主要应用,包括:HIS、PACS、RIS、LIS 等,本公司推出基于数据保护系统的多种解决方案,以达到对医院信息化系统提供全面的保护以及核心应用系统的异地备份容灾 数据备份解决方案 针对于医院的 HIS、PACS、LIS 等服务器进行数据备份时,数据保护系统的备份架构采用三层构架。 备份软件主控层(内置一体机):负责管理制定全域内的备份策略和跟踪客户端的备份,能够管理磁盘空间和磁带库库及光盘库,实现多个客户端的数据备份。备份软件主服务器是备份域内集中管理的核心。 客户端层(数据库和操作系统客户端):其他应用服务器和数据库服务器安装备份软件标准客户端,通过这个客户端完成每台服务器的 LAN 或 LAN-FREE 备份工作。另外,为包含数据库的客户端安装数据库代理程序,从而保证数据库的在线热备份。 备份介质层(内置虚拟带库):主流备份介质有备份存储或虚拟带库等磁盘介质、物理磁带库等,一般建议将备份存储或虚拟带库等磁盘介质作为一级备份介质,用于近期的备份数据存放,将物理磁带库或者光盘库作为二级备份介质,用于长期的备份数据存放。

EMC VNX5400 存储容灾技术解决方案 2017年8月 易安信电脑系统(中国)有限公司 .1

一、需求分析 随着各行业数字化进程的推进,数据逐渐成为企事业单位的运营核心,用户对承载数据的存储系统的稳定性要求也越来越高。虽然不少存储厂商能够向用户提供稳定性极高的存储设备,但还是无法防止各种自然灾难对生产系统造成不可恢复的毁坏。为了保证数据存取的持续性、可恢复性和高可用性,远程容灾解决方案应运而生,而远程复制技术则是远程容灾方案中的关键技术之一。 远程复制技术是指通过建立远程容灾中心,将生产中心数据实时或分批次地复制到容灾中心。正常情况下,系统的各种应用运行在生产中心的计算机系统上,数据同时存放在生产中心和容灾中心的存储系统中。当生产中心由于断电、火灾甚至地震等灾难无法工作时,则立即采取一系列相关措施,将网络、数据线路切换至容灾中心,并且利用容灾中心已经搭建的计算机系统重新启动应用系统。 容灾系统最重要的目标就是保证容灾切换时间满足业务连续性要求,同时尽可能保持生产中心和容灾中心数据的连续性和完整性,而如何解决生产中心到容灾中心的数据复制和恢复则是容灾备份方案的核心内容。 本方案采用EMC MirrorView 复制软件基于磁盘阵列(VNX5300-VNX5400)的数据复制技术。它是由磁盘阵列自身实现数据的远程复制和同步,即磁盘阵列将对本系统中的存储器写I/O操作复制到远端的存储系统中并执行,保证生产数据和备份数据的一致性。由于这种方式下数据复制软件运行在磁盘阵列内,因此较容易实现生产中心和容灾容灾中心的生产数据和应用数据或目录 .2

的实时拷贝维护能力,且一般很少影响生产中心主机系统的性能。如果在容灾中心具备了实时生产数据、备用主机和网络环境,那么就可以当灾难发生后及时开始业务系统的恢复。 .3

数据保护系统 医院备份、容灾及归档数据容灾 解决方案

1、前言 在医院信息化建设中,HIS、PACS、RIS、LIS 等临床信息系统得到广泛应用。医院信息化HIS、LIS 和PACS 等系统是目前各个医院的核心业务系统,承担了 病人诊疗信息、行政管理信息、检验信息的录入、查询及监控等工作,任何的系统停机或数据丢失轻则降低患者的满意度、医院的信誉丢失,重则引起医患纠纷、法律问题或社会问题。为了保证各业务系统的高可用性,必须针对核心系统建立数据安全保护,做到“不停、不丢、可追查”,以确保核心业务系统得到全面保护。 随着电子病历新规在 4 月 1 日的正式施行,《电子病历应用管理规范(试行)》要求电子病历的书写、存储、使用和封存等均需按相关规定进行,根据规范,门(急)诊电子病历由医疗机构保管的,保存时间自患者最后一次就诊之日起不少于15 年;住院电子病历保存时间自患者最后一次出院之日起不少于30 年。

2、医院备份、容灾及归档解决方案 针对医疗卫生行业的特点和医院信息化建设中的主要应用,包括:HIS、PACS、RIS、LIS 等,本公司推出基于数据保护系统的多种解决方案,以达到对医院信息化系统提供全面的保护以及核心应用系统的异地备份容灾 2.1 数据备份解决方案 针对于医院的HIS、PACS、LIS 等服务器进行数据备份时,数据保护系统的备份架构采用三层构架。 备份软件主控层(内置一体机):负责管理制定全域内的备份策略和跟踪客户端的备份,能够管理磁盘空间和磁带库库及光盘库,实现多个客户端的数据备份。备份软件主服务器是备份域内集中管理的核心。 客户端层(数据库和操作系统客户端):其他应用服务器和数据库服务器安装备份软件标准客户端,通过这个客户端完成每台服务器的LAN 或LAN-FREE 备份工作。另外,为包含数据库的客户端安装数据库代理程序,从而保证数据库的在线热备份。

六种数据库容灾方案 1、经典方案,即双机ha,单盘阵的环境。 简单的说,双机热备就是用两台机器,一台处于工作状态,一台处于备用状态,但备用状态下,也是开机状态,只是开机后没有进行其他的操作。打个比方来说,在网关处架上两台频宽管理设备,将两台的配置设定为一致,只是以一台的状态为主,一台为次。主状态下的频宽管理设备工作,处理事件,次状态下的频宽管理设备处于休眠,一旦主机出现故障,备用频宽管理设备将自动转为工作状态,代替原来的主机。这就是“双机热备”。 2、单机双盘阵(os层镜像)。针对某些用户的双盘阵冗余的需求,我提出了在os层安装卷管理软件,用软件对两台盘阵做镜像的方案,但只有单机工作,一台盘阵挂了,因为os层的软raid的作用,系统仍然可以工作。 3、双机双柜(os层镜像)方案,这个方案,仍然是用os层做镜像,但是用了双机ha,这种方式有个尚未确认的风险,非纯软方式的ha要求主机有共享的存储系统。一台机器对盘阵lun做的镜像虚拟卷,是否也适用另一台主机,也就是说,a主机做的镜像,b主机接管后,是否会透明的认出a机做镜像之后的逻辑虚拟卷,如果ab两主机互相都能认,那么就是成功的方案!! 4、双机双柜(底层镜像)。这种方案,虽然共享的lun不是在一台物理盘阵上,但是被底层存储远程镜像到另一台盘阵上,能保持数据的一致性

5、双机双柜纯软方式HA。这种方案,主机装纯软HA软件,虽然纯软不需要外接盘阵,但是接了盘阵,照样可行。 6、双机双柜(hacmp geo),其实geo大体上就是个类似于纯软HA的软件。

数据库安全 (一)数据库安全的定义 数据库安全包含两层含义:第一层是指系统运行安全,系统运行安全通常受到的威胁如下,一些网络不法分子通过网络,局域网等途径通过入侵电脑使系统无法正常启动,或超负荷让机子运行大量算法,并关闭cpu风扇,使cpu过热烧坏等破坏性活动;第二层是指系统信息安全,系统安全通常受到的威胁如下,黑客对数据库入侵,并盗取想要的资料。 编辑本段 (二)数据库安全的特征 数据库系统的安全特性主要是针对数据而言的,包括数据独立性、数据安全性、数据完整性、并发控制、故障恢复等几个方面。下面分别对其进行介绍 1.数据独立性 数据独立性包括物理独立性和逻辑独立性两个方面。物理独立性是指用户的应用程序与存储在磁盘上的数据库中的数据是相互独立的;逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的。 2.数据安全性 操作系统中的对象一般情况下是文件,而数据库支持的应用要求更为精细。通常比较完整的数据库对数据安全性采取以下措施: (1)将数据库中需要保护的部分与其他部分相隔。 (2)采用授权规则,如账户、口令和权限控制等访问控制方法。 (3)对数据进行加密后存储于数据库。 3.数据完整性 数据完整性包括数据的正确性、有效性和一致性。正确性是指数据的输入值与数据表对应域的类型一样;有效性是指数据库中的理论数值满足现实应用中对该数值段的约束;一致性是指不同用户使用的同一数据应该是一样的。保证数据的完整性,需要防止合法用户使用数据库时向数据库中加入不合语义的数据 4.并发控制 如果数据库应用要实现多用户共享数据,就可能在同一时刻多个用户要存取数据,这种事件叫做并发事件。当一个用户取出数据进行修改,在修改存入数据库之前如有其它用户再取此数据,那么读出的数据就是不正确的。这时就需要对这种并发操作施行控制,排除和避免这种错误的发生,保证数据的正确性。 5.故障恢复 由数据库管理系统提供一套方法,可及时发现故障和修复故障,从而防止数据被破坏。数据库系统能尽快恢复数据库系统运行时出现的故障,可能是物理上或是逻辑上的错误。比如对系统的误操作造成的数据错误等。 SQL server数据库安全策略 SQL Server2000[1]的安全配置在进行SQL Server2000数据库的安全配置之前,首先必须对操作系统进行安全配置,保证操作系统处于安全状态。然后对要使用的操作数据库软件(程序)进行必要的安全审核,比如对ASP、PHP等脚本,这是很多基于数据库的Web应用常出现的安全隐患,对于脚本主要是一个过滤问题,需要过滤一些类似“,;@/”等字符,防止破坏者构造恶意的SQL语句。接着,安装SQL Server2000后请打上最新SQL补丁SP3。 SQL Server的安全配置 1.使用安全的密码策略 我们把密码策略摆在所有安全配置的第一步,请注意,很多数据库账号的密码过于简单,这跟系统密码过于简单是一个道理。对于sa更应该注意,同时不要让sa账号的密码写于应用程序或者脚本中。健壮的密码是安全的第一步,建议密码含有多种数字字母组合并9位以上。SQL Server2000安装的时候,如果是使用混合模式,那么就需要输入sa的密码,除非您确认必须使用空密码,这比以前的版本有所改进。同时养成定期修改密码的好习惯,数据库管理员应该定期查看是否有不符合密码要求的账号。 2.使用安全的账号策略 由于SQL Server不能更改sa用户名称,也不能删除这个超级用户,所以,我们必须对这个账号进行最强的保

数据容灾备份设计方案 1.1数据备份的主要方式 目前比较实用的的数据备份方式可分为本地备份异地保存、远程磁带库与光盘库、远程关键数据+定期备份、远程数据库复制、网络数据镜像、远程镜像磁盘等六种。 (1)本地备份异地保存 是指按一定的时间间隔(如一天)将系统某一时刻的数据备份到磁带、磁盘、光盘等介质上,然后及时地传递到远离运行中心的、安全的地方保存起来。 (2)远程磁带库、光盘库 是指通过网络将数据传送到远离生产中心的磁带库或光盘库系统。本方式要求在生产系统与磁带库或光盘库系统之间建立通信线路。 — (3)远程关键数据+定期备份 本方式定期备份全部数据,同时生产系统实时向备份系统传送数据库日志或应用系统交易流水等关键数据。 (4)远程数据库复制 生产系统相分离的备份系统上建立生产系统上重要数据库的一个镜像拷贝,通过通信线路将生产系统的数据库日志传送到备份系统,使备份系统的数据库与生产系统的数据库数据变化保持同步。 (5)网络数据镜像 是指对生产系统的数据库数据和重要的数据与目标文件进行监控与跟踪,并将对这些数据及目标文件的操作日志通过网络实时传送到备份系统,备份系统则根据操作日志对磁盘中数据进行更新,以保证生产系统与备份系统数据同步。 (6)远程镜像磁盘 利用高速光纤通信线路和特殊的磁盘控制技术将镜像磁盘安放到远 …

离生产系统的地方,镜像磁盘的数据与主磁盘数据以实时同步或实时异步方式保持一致。磁盘镜像可备份所有类型的数据。备份拓扑网络结构1.2(即东风东路院区中心机广州市第八人民医院具有两个不同地点的中心机房房和嘉禾院区中心机房),在这基础上是可以构建一个异地容灾的数据备份系统,以确保本单位的系统正常运营及对关键业务数据进行有效地保护,以下设计方案仅提供参考。嘉禾院区数据中心东风东院区数据中心 本方案中,我们采用EMC的CDP保护技术来实现数据的连续保护和容灾系统。 1.在东风东院区数据中心部署一台EMC 480统一存储平台,配置一个大容量光纤磁盘存储设备,作为整个系统数据集中存储平台。 2.在嘉禾院区数据中心部署一台EMC 480统一存储系统,配置一个大容量光纤磁盘存储设备,作为整个平台的灾备存储平台。 ) 3.两地各部署两台EMC RecoverPoint/SE RPA,采用CLR技术,即CDP(持续数据保护)+CRR(持续远程复制),实现并发的本地和远程数据保护。 4.在东风东院区数据中心本地采用EMC RecoverPoint/SE CDP(持续数据保护)技术实现本地的数据保护。. 5.两地采用EMC RecoverPoint/SE CRR(持续远程复制)技术,实现远程的数据保护。由于两地之间专线的带宽有限,可以采用EMC Recoverpoint/SE异步复制技术,将东风东院区数据中心EMC480上的数据定时复制到嘉禾院区数据中心。根据带宽的大小,如果后期专线带宽有所增加,RecoverPoint会自动切换同步、异步、快照时间点三种复制方式,尽最大可能保证数据的零丢失。 1.3本地数据数据保护(CDP)设计

系统容灾解决方案 容灾基本概念 容灾是一个范畴比较广泛的概念,广义上,我们可以把所有与业务连续性相关的内容都纳入容灾。容灾是一个系统工程,它包括支持用户业务的方方面面。而容灾对于IT而言,就是提供一个能防止用户业务系统遭受各种灾难影响及破坏的计算机系统。容灾还表现为一种未雨绸缪的主动性,而不是在灾难发生后的“亡羊补牢”。 从狭义的角度,我们平常所谈论的容灾是指:除了生产站点以外,用户另外建立的冗余站点,当灾难发生,生产站点受到破坏时,冗余站点可以接管用户正常的业务,达到业务不间断的目的。为了达到更高的可用性,许多用户甚至建立多个冗余站点。 容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。 要实现容灾,首先要了解哪些事件可以定义为灾难?典型的灾难事件是自然灾难,如火灾、洪水、地震、飓风、龙卷风、台风等;还有其它如原提供给业务运营所需的服务中断,出现设备故障、软件错误、网络中断和电力故障等等;此外,人为的因素往往也会酿成大祸,如操作员错误、破坏、植入有害代码和病毒袭击等。现阶段,由于信息技术正处在高速发展的阶段,很多生产流程和制度仍不完善,加之缺乏经验,这方面的损失屡见不鲜。 容灾的七个层次 等级1:

被定义为没有信息存储的需求,没有建立备援硬件平台的需求,也没有发展应急计划的需求,数据仅在本地进行备份恢复,没有数据送往异地。这种方式是成本最低的灾难恢复解决方案,但事实上这种恢复并没有真正达到灾难恢复的能力。 一种典型等级1方式就是采用本地磁带库自动备份方案,通过制定相关的备份策略,可以实现系统等级1备份。 等级2: 是一种为许多站点采用的备份标准方式。数据在完成写操作之后,将会送到远离本地的地方,同时具备有数据恢复的程序。在灾难发生后,在一台未启动的计算机上重新完成。系统和数据将被恢复并重新与网络相连。这种灾难恢复方案相对来说成本较低,但同时有难以管理的问题,即很难知道什么样的数据在什么样的地方。这种情况下,恢复时间长短依赖于何时硬件平台能够被提供和准备好。 典型方式就是将数据备份到本地磁带介质上,然后通过运输方式(如“卡车”)将备份介质送往异地保存,而异地没有主机系统。当灾难发生时,再使用新的主机,利用数据备份介质(磁带)将数据恢复起来。 等级3: 相当于等级2再加上具有热备份能力站点的灾难恢复。热备份站点拥有足够的硬件和网络设备去支持关键应用的安装需求。对于十分关键的应用,在灾难发生的同时,必须在异地有正运行着的硬件提供支持。这种方式与等级2方式的区别是在异地有一个热备份站点,该站点有主机系统,平时利用数据备份介质(磁带)将数据恢复到主机系统起来。一旦发生灾难,利用该主机系统将数据恢复。 这种情况下,由于备份介质是采用运输方式送往异地,可能会有一天、甚至一周的数据丢失。由于备份站点己经有主机系统,数据恢复典型地需要一定的时间。 等级4:

道孚县人民法院 数据安全存储及备份容灾系统建设方案 一、建设意义 随着计算机的普及和信息技术的进步,特别是计算机网络的飞 速发展,信息安全的重要性日趋明显。但是作为信息安全的一个重 要内容数据备份的重要性却往往被人们所忽视。只要发生数据传输、数据存储和数据交换,就有可能产生系统失效、数据丢失或遭到破坏。如果没有采取数据备份和数据恢复手段与措施,就会导致数据 丢失或损毁,给数据中心造成的损失是无法弥补与估量的。 道孚县人民法院近年来越来越依赖于数据处理来进行管理及办公,对业务系统的依赖性也随之增加。我法院从2010年开始着重推 进信息化,但在进行信息化建设的同时灾难也随之潜伏进来,使得 业务系统在潜伏着威胁的环境里运行。因此在进行信息化建设过程 中保证法院的业务系统连续运行及数据处理的高可靠性和高可用性 已经成为首先要考虑。 二、我院可能面临的灾难事故风险 1、存储介质风险:,包括存储和服务器硬盘,设备老化,影响 数据安全,发生概率较高。 2、应用服务器风险:服务器硬件故障,影响应用业务间断,发 生概率比较高。 3、逻辑错误风险:受人为误操作,病毒,升级等因素。影响数 据和应用,发生概率非常高。 4、机房环境风险:机房断点,异常电压,灰尘,气温等,影 响数据和应用。 5、自然灾害风险:地震、火灾、动乱等发生将是彻底灾难事故。影响数据和应用。 如果不能对风险采取有效治理,一旦数据由于上述某种原因丢失,就有可能造成整个法院在管理及办公上的严重问题,法院的形 象也将受到影响。如果核心数据丢失,严重时完全有可能造成整个 法院的瘫痪。

三、我院现状 道孚县人民法院地处甘北入口之重县,目前下设三个派出法庭,在未来几年还将再建四个派出法庭。随着“数字法院”的建设发展,业务应用系统的增加现有的数据保障模式已无法满足我院及其派出 法庭的数据安全和应用持续性保护。 (1)道孚县人民法院机房业务环境有: 法院信息化管理系统,它包括:案件绩效评估系统,审判管理 系统,OA系统,邮件系统,人事系统等;科技法庭系统还在建设之中。全院服务器有两台,一台为数据库服务器,一台为中间件服务器,均为windows操作系统平台,数据库服务器由Sybase数据库支撑。 (2)道孚县法院存储数据主要类型: 1、日常材料的扫描图片; 2、服务器业务运行产生的文件; 3、以后科技法庭建成后所产生的大量音视频文件; (3)备份数据的主要类型: 1、日常材料的扫描件; 2、服务器操作系统; 3、服务器业务运行产生的文件; 4、应用模块产生的业务数据,数据库等; 由于各种环境因素和升级问题,法院系统可能会出现故障。随 着硬件使用逐渐老化,应用程序故障等其他问题,会导致系统时常 停顿。保障这些业务系统不间断运行,需要构建一套能够及时恢复 故障设备,应用高可用性保障系统。 四、方案设计要求 (1)异地容灾: 方案设计需考虑备份的数据往往会因为非人为操作错误外的其 他因素所影响而导致毁坏,如地震、火灾、丢失等。因此必须在不 同的地点建立备份系统。

1.用户现状与需求 1.1.用户IT系统现状 用户现有系统包括数据库、应用、WEB、邮件等系统,虽然是双机架构,但是其稳定性和可靠性都没有达到核心系统应该具备的标准,而且直连的存储架构对于性能和管理型都有一定的局限性。 业务数据是企业业务的生命线,如何保护好计算机系统里存储的数据,保证系统稳定可靠地运行,并为业务系统提供快捷可靠的访问,是系统建设中最重要的问题之一。为了保护业务系统的关键业务数据,我们必须对这些数据进行有效的备份,并支持快速恢复。 通过备份的方式将文件、数据库等重要数据做一个副本,只能在本地建立数据保护。但因意外(如火灾、地震等)停止工作时,随之而来的损失更是不可估量,为避免类似风险的存在,就需要建立异地容灾系统,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作,保证业务稳定运行。 1.2.用户需求 1.2.1.建设目标 从容灾的级别来说,可以规划数据级容灾和应用级容灾,根据业务种类多,业务方式多样化的特点,仅建设一个数据级容灾是不够,容灾发生时,业务快速的恢复是容灾系统的一大需求。应用级容灾是建立在数据级容灾的基础上,在容灾切换时,除了切换核心的数据库数据外,还包含了IP地址切换(按客户需要选择),中间件服务,用户级业务。应用级容灾从流程上实现了全业务的连续性需求。 从我们的灾难系统建设经验出发,xxx有限公司可以考虑以下业务连续性计划目标:RPO(最大允许数据丢失时间):零数据丢失 RTO(最大允许宕机时间):30分钟

应用级容灾需求 1.2.2.需求分析 用户需要保障数据的长期安全可靠的,数据对于灾难的安全性和可恢复性:灾难切换时间要求灾难系统切换时间不超过30分钟,最好在10分钟内实现。 多种灾难切换方式提供自动灾难系统切换和手动灾难切换方式 计划内维护要求提供计划内维护支持能力,计划内维护切换时间不多于10分钟 数据丢失性要求原则上要求零数据丢失,可以依据情况进行调整 数据同步方式提供同步和异步两种方式 备份和灾难备份方式采用物理备份方式实现 物理部件失败要求支持部分磁盘,文件系统,主机,磁盘柜等各种物理部件失败导致的失败保护。 站点失败要求支持由于火灾,电力以及其他因素导致站点失败的数据保护。 逻辑失败要求支持由于数据块腐败导致的数据库无法启动,数据丢失等逻辑失败保护 人类错误失败要求支持由于人类误操作以及入侵等导致人类错误失败导致的数据保护或者恢复。 生产系统的性能影响要求生产系统性能影响不超过5% 生产系统可用性要求容灾系统不会降低生产系统可用性 网络链路分钟级别短暂故障要求不会对生产系统产生影响 网络链路小时级别长期故障要求不会对生产系统产生影响 网络链路密集的秒级别短暂故障要求不会对生产系统产生影响 网络链路容错支持网络链路的容错,可以利用网络的备份链路,比如多路网卡等灾难系统的硬件故障由于灾难系统硬件故障导致的灾难系统不可用不会对生产系统产生影响,比如网卡,磁盘以及控制卡等 灾难系统的软件故障由于灾难系统软件故障导致的灾难系统不可用不会对生产系统产生影响,比如灾难系统管理软件部件等 网络协议采用IP网络实现

1.用户现状与需求 1.1.用户系统现状 用户现有系统包括数据库、应用、、邮件等系统,虽然是双机架构,但是其稳定性和可靠性都没有达到核心系统应该具备的标准,而且直连的存储架构对于性能和管理型都有一定的局限性。 业务数据是企业业务的生命线,如何保护好计算机系统里存储的数据,保证系统稳定可靠地运行,并为业务系统提供快捷可靠的访问,是系统建设中最重要的问题之一。为了保护业务系统的关键业务数据,我们必须对这些数据进行有效的备份,并支持快速恢复。 通过备份的方式将文件、数据库等重要数据做一个副本,只能在本地建立数据保护。但因意外(如火灾、地震等)停止工作时,随之而来的损失更是不可估量,为避免类似风险的存在,就需要建立异地容灾系统,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作,保证业务稳定运行。 1.2.用户需求 1.2.1.建设目标 从容灾的级别来说,可以规划数据级容灾和应用级容灾,根据业务种类多,业务方式多样化的特点,仅建设一个数据级容灾是不够,容灾发生时,业务快速的恢复是容灾系统的一大需求。应用级容灾是建立在数据级容灾的基础上,在容灾切换时,除了切换核心的数据库数据外,还包含了地址切换(按客户需要选择),中间件服务,用户级业务。应用级容灾从流程上实现了全业务的连续性需求。 从我们的灾难系统建设经验出发,有限公司可以考虑以下业务连续性计划目标:(最大允许数据丢失时间):零数据丢失 (最大允许宕机时间):30分钟 应用级容灾需求

1.2.2.需求分析 用户需要保障数据的长期安全可靠的,数据对于灾难的安全性和可恢复性:灾难切换时间要求灾难系统切换时间不超过30分钟,最好在10分钟内实现。 多种灾难切换方式提供自动灾难系统切换和手动灾难切换方式 计划内维护要求提供计划内维护支持能力,计划内维护切换时间不多于10分钟 数据丢失性要求原则上要求零数据丢失,可以依据情况进行调整 数据同步方式提供同步和异步两种方式 备份和灾难备份方式采用物理备份方式实现 物理部件失败要求支持部分磁盘,文件系统,主机,磁盘柜等各种物理部件失败导致的失败保护。 站点失败要求支持由于火灾,电力以及其他因素导致站点失败的数据保护。 逻辑失败要求支持由于数据块腐败导致的数据库无法启动,数据丢失等逻辑失败保护 人类错误失败要求支持由于人类误操作以及入侵等导致人类错误失败导致的数据保护或者恢复。 生产系统的性能影响要求生产系统性能影响不超过5% 生产系统可用性要求容灾系统不会降低生产系统可用性 网络链路分钟级别短暂故障要求不会对生产系统产生影响 网络链路小时级别长期故障要求不会对生产系统产生影响 网络链路密集的秒级别短暂故障要求不会对生产系统产生影响 网络链路容错支持网络链路的容错,可以利用网络的备份链路,比如多路网卡等灾难系统的硬件故障由于灾难系统硬件故障导致的灾难系统不可用不会对生产系统产生影响,比如网卡,磁盘以及控制卡等 灾难系统的软件故障由于灾难系统软件故障导致的灾难系统不可用不会对生产系统产生影响,比如灾难系统管理软件部件等 网络协议采用网络实现 网络带宽一般的百兆或者千兆带宽

i b m存储容灾方案v This manuscript was revised by the office on December 22, 2012

存储容灾解决方案 目录

一、概述 1.1信息系统现状 1.1.1存储系统现状 目前业务系统主要应用系统有文件服务器(windows )、应用服务器(windows )、邮件服务器(windows )、防病毒服务器(windows )、HR 服务器(windows )和ERP 服务器(SUN 小机)。目前应用系统均运行在独立的服务器中,一方面服务器本身容量空间有限,随着业务数据的不断增长,空间已基本饱和,另一方面数据安全性没有保障,服务器故障将面临整个业务系统数据丢失(单台服务器故障,怎么会造成整个数据丢失)。应用系统的高性能存储空间及数据保护工作是信息中心最为重视的 现有存储系统情况统计:(表格把客户目前服务型号及硬盘分布要写的详细些,表格我会提供) 序号 系统组成 系统类型/存储方式(位置) 现有磁盘阵列及类型、容量 1 文件服务器 Windows/本地 // 2 应用服务器 Windows/本地 3 邮件服务器 Windows/本地 4 防病毒服务器 Windows/本地 5 HR 服务器 Windows/本地 6 ERP 服务器 SUN 小机/本地 从上表情况来看,所有业务系统的数据都存放在本地硬盘上,本地硬盘存储具有如下缺陷: 单硬盘或者原始RAID 方式,故障率高,安全性低。 性能低下,影响应用主机性能。 磁盘容量性能扩展性差。 只能通过与之连接的主机进行访问。 每一个主机管理它本身的文件系统,但不能实现与其他主机共享数据。 数据分散,管理复杂。

存储升级整合与迁移方案规划建议书

目录 1. 方案总体规划 (4) 1.1存储现状及问题 (4) 2. 方案架构和选型分析 (6) 2.1高端存储平台选型论证 (6) 2.2整体方案及拓扑结构 (10) 2.3本次推荐的VSP及原有USP配置及容量规划 (11) 2.3.1 现有USP硬件配置及升级后配置情况 (11) 2.3.2 现有USP软件配置及升级后配置情况 (11) 2.3.3 新购VSP硬件配置情况 (11) 2.3.4 新购VSP软件配置情况 (12) 3. 数据迁移及服务 (13) 3.1数据迁移概述 (13) 3.1.1 当前系统架构 (13) 3.1.2 存储迁移架构 (13) 3.1.3 TrueCopy项目实施工作表 (14) 3.1.4 HUR项目实施工作表 (15) 3.1.5 ShadowImage项目实施工作表 (17) 4. 项目灾难备份演练、切换策略 (19) 4.1灾难备份演练策略 (19) 4.2灾难备份演练概述 (19) 4.2.1 灾难备份演练的目的 (19) 4.2.2 灾难备份演练的方法 (19) 4.3灾难备份切换策略 (21) 4.3.1 灾难备份切换概述 (21) 4.3.2 灾难备份切换策略 (21) 4.3.3 灾难切换及完整地意义的灾难恢复 (21) 4.3.4 灾难备份系统在技术层面可能存在的恢复缺陷 (22) 4.3.5 关键业务系统灾难恢复方案 (22) 5. 方案总结与介绍 (24) 5.1HDS存储方案特点 (24) 5.2HDS VSP高端存储指标和关键技术 (26) 5.2.1 存储虚拟化功能 (28) 5.2.2 存储逻辑分区技术 (29) 5.2.3 通用复制(UR)软件技术 (30) 5.3HDS VSP高端存储指标 (32)

分布式存储系统设计方案——备份容灾 在分布式存储系统中,系统可用性是最重要的指标之一,需要保证在机器发生故障时,系统可用性不受影响,为了做到这点,数据就需要保存多个副本,并且多个副本要分布在不同的机器上,只要多个副本的数据是一致的,在机器故障引起某些副本失效时,其它副本仍然能提供服务。本文主要介绍数据备份的方式,以及如何保证多个数据副本的一致性,在系统出现机器或网络故障时,如何保持系统的高可用性。 数据备份 数据备份是指存储数据的多个副本,备份方式可以分为热备和冷备,热备是指直接提供服务的备副本,或者在主副本失效时能立即提供服务的备副本,冷备是用于恢复数据的副本,一般通过Dump的方式生成。 数据热备按副本的分布方式可分为同构系统和异步系统。同构系统是把存储节点分成若干组,每组节点存储相同的数据,其中一个主节点,其他为备节点;异构系统是把数据划分成很多分片,每个分片的多个副本分布在不同的存储节点,存储节点之间是异构的,即每个节点存储的数据分片集合都不相同。在同构系统中,只有主节点提供写服务,备节点只提供读服务,每个主节点的备节点数可以不一样,这样在部署上会有更大的灵活性。在异构系统中,所有节点都是可以提供写服务的,并且在某个节点发生故障时,会有多个节点参与故障节点的数据恢复,但这种方式需要比较多的元数据来确定各个分片的主副本所在的节点,数据同步机制也会比较复杂。相比较而言,异构系统能提供更好的写性能,但实现比较复杂,而同构系统架构更简单,部署上也更灵活。鉴于互联网大部分业务场景具有写少读多的特性,我们选择了更易于实现的同构系统的设计。 系统数据备份的架构如下图所示,每个节点代表一台物理机器,所有节点按数据分布划分为多个组,每一组的主备节点存储相同的数据,只有主节点能提供写服务,主节点负责把数据变更同步到所有的备节点,所有节点都能提供读服务。主节点上会分布全量的数据,所以主节点的数量决定了系统能存储的数据量,在系统容量不足时,就需要扩容主节点数量。在系统的处理能力上,如果是写能力不足,只能通过扩容主节点数来解决;而在写能力不足时,则可以通过增加备节点来提升。每个主节点拥有的备节点数量可以不一样,这在各个节点的数据热度不一样时特别有用,可以通过给比较热的节点增加更多的备节点实现用更少的资源来提升系统的处理能力。

数据库容灾、复制解决方案全分析(绝对精品) 目前,针对oracle数据库的远程复制、容灾主要有以下几种技术或解决方案: (1)基于存储层的容灾复制方案 这种技术的复制机制是通过基于SAN的存储局域网进行复制,复制针对每个IO进行,复制的数据量比较大;系统可以实现数据的同步或异步两种方式的复制.对大数据量的系统来说有很大的优势(每天日志量在60G以上),但是对主机、操作系统、数据库版本等要求一致,且对络环境的要求比较高。 目标系统不需要有主机,只要有存储设备就可以,如果需要目标系统可读,需要额外的配置和设备,比较麻烦。 (2)基于逻辑卷的容灾复制方案 这种技术的机制是通过基于TCP/IP的网络环境进行复制,由操作系统进程捕捉逻辑卷的变化进行复制。其特点与基于存储设备的复制方案比较类似,也可以选择同步或异步两种方式,对主机的软、硬件环境的一致性要求也比较高,对大数据量的应用比较有优势。其目标系统如果要实现可读,需要创建第三方镜像。个人认为这种技术和上面提到的基于存储的复制技术比较适合于超大数据量的系统,或者是应用系统的容灾复制。 我一直有一个困惑,存储级的复制,假如是同步的,能保证数据库所有文件一致吗?或者说是保证在异常发生的那一刻有足够的缓冲来保障? 也就是说,复制的时候起文件写入顺序和oracle的顺序一致吗?如果不一致就可能有问题,那么是通过什么机制来实现的呢? 上次一个存储厂商来讲产品,我问技术工程师这个问题,没有能给出答案 我对存储级的复制没有深入的研究过,主要是我自己的一些理解,你们帮我看一下吧…… 我觉得基于存储的复制应该是捕捉原系统存储上的每一个变化,而不是每隔一段时间去复制一下原系统存储上文件内容的改变结果,所以在任意时刻,如果原系统的文件是一致的,那么目标端也应该是一致的,如果原系统没有一致,那目标端也会一样的。形象一点说它的原理可能有点像raid 0,就是说它的写入顺序应该和原系统是一样的。不知道我的理解对不对。另外,在发生故障的那一刻,如果是类似断电的情况,那么肯定会有缓存中数据的损失,也不能100%保证数据文件的一致。一般来说是用这种方式做oracle的容灾备份,在发生灾难以后目标系统的数据库一般是只有2/3的机会是可以正常启动的(这是我接触过的很多这方面的技术人员的一种说法,我没有实际测试过)。我在一个移动运营商那里看到过实际的情况,他们的数据库没有归档,虽然使用了存储级的备份,但是白天却是不做同步的,只有在晚上再将存储同步,到第二天早上,再把存储的同步断掉,然后由另外一台主机来启动目标端存储上的数据库,而且基本上是有1/3的机会目标端数据库是起不来的,需要重新同步。 所以我觉得如果不是数据量大的惊人,其他方式没办法做到同步,或者要同时对数据库和应用进行容灾,存储级的方案是没有什么优势的,尤其是它对网络的环境要求是非常高的,在异地环境中几乎不可能实现。

山西新景矿煤业有限责任公司数据灾备解决方案 2017年10月

目录 第1章需求分析 (3) 1.1用户简介 (3) 1.2需求描述 (3) 1.3方案目标 (5) 第2章技术方案 (7) 2.1全局拓扑 (7) 2.2(人员定位、产量监控、自动化平台)应用级双活容灾设计——镜像系统 (7) 2.3(网站、OA、虹膜系统等)数据级容灾设计——实时备份 (8) 2.4功能展示 (8) 2.4.1全自动化追逐式全量 (8) 2.4.2实时增量复制 (9) 2.4.3切换 (9) 2.4.4回切 (9) 2.4.5日常维护 (9) 2.5镜像系统.在线式应用级容灾系统产品优势 (10) 2.5.1所见即所得的容灾 (10) 2.5.2应用级的复制技术 (10) 2.5.3实施无需停顿业务系统 (10) 2.5.4主备系统硬件规格无需一致 (10) 2.5.5对网络带宽消耗非常小 (10) 2.5.6其他 (11) 2.6实时备份.数据级备份系统产品优势 (11) 2.6.1全功能全平台 (11) 2.6.2实时、定时备份 (11) 2.6.3任意时间点还原 (12) 2.6.4其他 (12) 2.7Y系MCenter平台.可持续运维平台 (13) 2.8方案配置 (14) 2.8.1软件模块 (14) 2.8.2硬件模块 (14) 第3章项目预算清单 (16)

第1章需求分析 1.1用户简介 新景矿是国家"八五"、"九五"重点能源建设项目之一,前身为阳煤集团三矿改扩建区。1997年8月试生产,井口定名三矿新井,隶属三矿管理。1998年10月阳煤集团为建立高产、高效矿井,以"阳煤党发【1998】398号"文《关于成立新景矿及新井党委的通知》将三矿新井从三矿分离出来,成立新景矿。 随着企业社会信息化的发展,众多业务系统的运行,必然会产生大量的数据,而这些数据作为各行各业最重要的资源,越来越受到人们重视。同样,由于数据量的增加和新业务的不断涌现,如何确保数据的安全性、可用和可靠性;如何确保业务系统的可持续性运行;如何实现数据的集中管理,建立便捷维护的平台也是目前所面临的一个重要问题。 1.2需求描述 ?简述 根据与用户的沟通,我们初步了解到客户的实际环境业务系统众多,其中人员定位系统、产量监控系统、生产自动化平台均采用集群方式,也是本企业的核心应用系统,其他诸如网站、OA、虹膜等系统均为单机运行。具体环境见下方调研表: ?容灾环境调研表

Oracle DataGuard容灾解决方案

目录 一. 需求分析 (3) 二. 解决方案 (3) 拓扑架构 (3) 方案特点 (4) 方案优势 (4) 产品介绍 (5) 三. Oracle维保服务 (8) 四. 方案报价 (10)

一. 需求分析 用户现有两台服务器,windows2008平台,一台运行oracle 11g r2,一台运行用友NC 6.3。现在通过每天备份的方式保证安全。用户希望在他的另一个机房(裸光纤互联)中搭建容灾平台。 因此本方案针对以上现状,提出Oracle DataGuard容灾解决方案,这样主数据库在遇到极端状况时,可以及时切换到备库,保证业务的连续性。 二. 解决方案 拓扑架构 Dataguard可以实现远程数据容灾,利用该功能也可实现高可用性。 数据容灾是指建立一个异地的数据系统,该系统是本地关键应用数据的一个实时复制。在本地数据及整个应用系统出现灾难时,系统至少在或本地异地保存有一份可用的关键业务的数据,基于该功能,结合客户实际情况我方推荐使用其作为保证系统可靠运行的一种解决方案,由于两台机器的数据一致性以及低延迟,完全可以胜任,在主机出现故障时,切换至备机运行。

方案特点 ?对现有的环境改动小,能最大限度的减少对现有应用系统的影响。 ?能满足客户对海量数据的管理要求。 ?可以实现远距离容灾,对网络要求低,低延时,快速业务切换。 ?同步或异步日志传输; ?低成本的投入。 方案优势 灾难恢复和高可用性—Data Guard 提供了一个高效和全面的灾难恢复和高可用性解决方案。易于管理的转换和故障切换功能允许主数据库和备用数据库之间的角色转换,从而使主数据库因计划的和计划外的中断所导致的停机时间减到最少。 完善的数据保护—使用备用数据库,Data Guard 可保证即使遇到不可预见的灾难也不会丢失数据。备用数据库提供了防止数据损坏和用户错误的安全保护。主数据库上的存储器级物理损坏不会传播到备用数据库上。同样,导致主数据库永久损坏的逻辑损坏或用户错误也能够得到解决。最后,在将重做数据应用到备用数据库时会对其进行验证。 有效利用系统资源—备用数据库表使用从主数据库接收到的重做数据进行更新,并且可用于诸如备份操作、报表、合计和查询等其它任务,从而减少执行这些任务所必需的主数据库工作负载,节省宝贵的CPU 和I/O 周期。使用逻辑备用数据库,用户可以在模式中不从主数据库进行更新的表上执行数据处理操作。逻辑备用数据库可以在从主数据库中对表进行更新时保持打开,并可同时对表进行只读访问。最后,可以在维护的表上创建额外索引和物化视图,以获得更好的查询性能和适应特定的业务要求。 灵活的数据保护功能,从而在可用性与性能要求之间取得平衡—Oracle Data Guard 提供了最大保护、最高可用性和最高性能等模式,来帮助企业在系统性能要求和数据保护之间取得平衡。 自动间隔检测及其解决方案—如果主数据库与一个或更多个备用数据库之间的连接丢失(例如,由于网络问题),则在主数据库上生成的重做数据将无

系统容灾技术方案大全

目录 一、数据中心灾备系统的分类 (3) 二、数据库远程复制和异地容灾方案相关分析 (11) 三、数据备份与数据容灾 (14) 四、重复数据删除成就异地容灾 (15) 五、金税工程三期背景下省级容灾备份建设探索 (22) 六、安徽中烟数据集中容灾系统建设实践与探索 (36) 七、推荐九个容灾解决方案 (42) 八、推荐九个容灾解决方案 (42) 九、GDS灾难恢复解决方案 (62) 十、多级企业数据容灾解决方案对比 (65)

一、数据中心灾备系统的分类 摘要:本文为大家讲述数据中心的一些技术知识,具体为您讲述数据中心灾备系统的 分类情况。 1.数据级容灾和应用级容灾 按照容灾系统对应用系统的保护程度可以分为数据级容灾和应用级容灾,业务级容灾的大部分内容是非IT系统。 数据级容灾系统只保证数据的完整性、可靠性和安全性,但提供实时服务的请求在灾难中会中断。应用级容灾系统能够提供不间断的应用服务,让服务请求能够透明(在灾难发生时毫无觉察)地继续运行,保证数据中心提供的服务完整、可靠、安全。因此对服务中断不太敏感的部分可以选择数据级容灾,以便节省成本,在数据级容灾的基础上构建应用级容灾系统,保证实时服务不间断运行,为用户提供更好的服务。 (1)数据级容灾。通过在异地建立一份数据复制的方式保证数据的安全性,当本地工作系统出现不可恢复的物理故障时,容灾系统提供可用的数据。数据级容灾是容灾的基础形式,由于只需要考虑数据的复制和存放,不需要考虑备用系统,实现起来相对简单,投资也较少。数据级容灾需要考虑三方面问题:在线模式与离线模式问题;远程数据复制技术问题;同步与异步容灾问题。 (2)应用级容灾。应用级容灾能保证业务的连续性。在数据级容灾的基础上,建立备份的应用系统环境,当本地工作系统出现不可恢复的物理故障时,容灾系统提供可用的数据和应用系统。

EMC VNX5400 存储容灾技术解决方案 2017年8月 易安信电脑系统(中国)有限公司 一、需求分析 随着各行业数字化进程的推进,数据逐渐成为企事业单位的运营核心,用户对承载数据的存储系统的稳定性要求也越来越高。虽然不少存储厂商能够向用户提供稳定性极高的存储设备,但还是无法防止各种自然灾难对生产系统造成不可恢复的毁坏。为了保证数据存取的持续性、可恢复性和高可用性,远程容灾解决方案应运而生,而远程复制技术则是远程容灾方案中的关键技术之一。 远程复制技术是指通过建立远程容灾中心,将生产中心数据实时或分批次地复制到容灾中心。正常情况下,系统的各种应用运行在生产中心的计算机系统上,数据同时存放在生产中心和容灾中心的存储 页脚内容1

系统中。当生产中心由于断电、火灾甚至地震等灾难无法工作时,则立即采取一系列相关措施,将网络、数据线路切换至容灾中心,并且利用容灾中心已经搭建的计算机系统重新启动应用系统。 容灾系统最重要的目标就是保证容灾切换时间满足业务连续性要求,同时尽可能保持生产中心和容灾中心数据的连续性和完整性,而如何解决生产中心到容灾中心的数据复制和恢复则是容灾备份方案的核心内容。 本方案采用EMC MirrorView 复制软件基于磁盘阵列(VNX5300-VNX5400)的数据复制技术。它是由磁盘阵列自身实现数据的远程复制和同步,即磁盘阵列将对本系统中的存储器写I/O操作复制到远端的存储系统中并执行,保证生产数据和备份数据的一致性。由于这种方式下数据复制软件运行在磁盘阵列内,因此较容易实现生产中心和容灾容灾中心的生产数据和应用数据或目录的实时拷贝维护能力,且一般很少影响生产中心主机系统的性能。如果在容灾中心具备了实时生产数据、备用主机和网络环境,那么就可以当灾难发生后及时开始业务系统的恢复。 页脚内容2

相关文档
最新文档