CDP容灾接管方案

CDP容灾接管方案
CDP容灾接管方案

XX公司容灾接管方案数据实时保护、业务容灾接管

目录

XX公司CDP容灾接管方案 (2)

一、业务现状及需求 (2)

二、方案设计原则 (2)

三、方案目标 (3)

四、项目方案 (3)

4.1、方案一 (3)

4.2、方案二 (5)

4.3、方案三 (7)

五、上讯CDP技术原理 (9)

六、上讯CDP系统架构与部署 (10)

七、上讯CDP主要技术说明 (11)

八、项目方案总结 (16)

XX公司CDP容灾接管方案

一、业务现状及需求

业务环境:

目前公司有15台服务器,系统分别为Windows、Linux操作系统,数据文件分为两类:SqlServer 数据库数据、图片数据,数据总量为4-5TB,存储总量为20TB。

项目需求:

实现数据的实时备份:将15台服务器的数据实现实时的数据保护,确保数据完整性和可用性的同时,做到数据的任意时间点恢复。

实现业务的容灾接管:将15台服务器实现1对1的数据实时复制,当业务服务器出现故障时,可以通过备用服务器快速接管业务,实现业务的容灾高可用。

二、方案设计原则

高性能原则:根据众多用户需求反馈和项目实施经验,结合最新的容灾技术来确定我们解决方案的设计,保证RPO和RTO的完美平衡

高可靠原则:利用先进的底层驱动技术将稳定性发挥到极致,强大的容灾容错技术保证系统特定时间特定环境下的工作效率

高安全原则:考虑到用户数据的特点,通过身份验证、保密通信、访问控制等手段完全保证数据安全性

易管理原则:简洁友好的界面,利用全鼠标操作和对象图标显示,完成全部的管理工作,集中化的管理方式可以通过一个控制程序管理所有的备份和恢复作业等。

易扩展原则:平台化、模块化产品易于升级扩展,满足客户日益增长的数据容灾需求,同时又能保护客户现有投资,灵活适应未来业务的发展和容灾系统的升级。

易维护原则:完善的监控和诊断机制,主动报警机制和事件通知功能,无需单独的人工干预就可以第一时间发现风险,将损失降到最低。

三、方案目标

模拟用户现有环境和灾备需求,设计一套全面的,完整的容灾备份系统方案,最大限度的保证用户的业务连续性和数据完整性。

基本功能目标包括:

1应对最广泛的灾难类型,实现无死角的容灾防范;

2实现关键系统主备服务器数据实时同步,应急容灾接管,采用系统以及数据库可读的形式进行增量同步,并且实时整合可读的备份文件;

3实现以秒级为单位的数据同步,保证数据零丢失;

4实现数据备份的一致性和断点续传功能;

5通过独有带宽优化技术,实现多种网络带宽情况下的灾备系统建设;

6实现对生产系统的低干扰性,CPU使用率目标不超过5%,物理内存占用量目标不超过100M;7充分适应生产系统和容灾系统的环境:如多种操作系统平台,主流或非主流数据库类型,多种架构策略,虚拟化等;兼容绝大多数第三方主流硬件;

8按用户需求设计相应模块的组合,降低用户灾备系统建设成本;

四、项目方案

4.1、方案一

方案逻辑结构图一

图例说明:异地容灾方案,针对业务需求,对业务服务器组的每一个系统进行一对一异地数据同步,与业务接管。

实时对业务服务器组的每一台服务器或系统进行数据同步,保证异地容灾中心的每一个接管服务器或系统的数据实时跟主机保持一致。

当生产中的任何一台服务器发生灾难时,异地容灾中心相对应的接管服务器都会自动进行业务接管。

每个接管服务器一一对应业务服务器,互不干预。

当接管服务器接管完毕后,主机进行修理,修理完成后,可进行反向同步,重新构建一对一的容灾架构。

因考虑本地数据量为5T,VPN带宽为100M,如果按照传统方式传输原始量,将耗费过长时间,本方案将采用本地数据原始量采集,通过物理运送到异地,进行多线程校验,然后在进行增量传输,使其传递原始量的时间大幅度缩减,最大限度减少网络资源占用。 容灾备份工作站配置高性能多核处理器、高速内存、大容量磁盘空间,同时利用虚拟化技术构建与应用服务逐个对应的容灾备份环境,保证灾备系统稳定的前提下,充分利用系统资源,降低灾备系统构建成本。

当有新系统上线时,可以首先分析现有灾备系统资源使用情况,条件满足情况下,无需购置新灾备服务器,可在不影响任何业务前提下,利用虚拟化技术在容灾备份工作站部署对应新系统的灾备环境。

提供容灾系统资源监控技术,不间断的监测应用的状况和整个应用环境的状态,保证整个系统在最佳的状态下运行。针对应用所使用的硬件,软件,网络环境等的稳定性与可靠性为基础而设计资源监控。

将管理控制台程序安装在本地局域网内任意PC或服务器上,实现对整个容灾系统的管理。

为用户提供容灾备份一体化的平台,意味着用户如果在今后需要对灾备系统进行升级,只需要在平台上搭建新的模块即可实现,大大节约构建成本。

4.2、方案二

方案逻辑结构图二

图例说明:异地备份方案,针对业务需求,对业务服务器组的每一个系统的数据进行实时数据备份,保护数据绝对安全。

备份一体机实时对业务服务器的主机进行增量备份,当主机数据发生任何灾难时,如人为误操作,病毒侵害,硬件损坏,自然灾害等等,备份一体机可以对数据进行回退恢复。 回退恢复可以选择任意时间点和任意操作步骤进行数据回退,保证恢复到发生灾难前的数据。

任意恢复路径,备份的数据根据需要可以恢复到非原主机的任意系统上,并且支持恢复到虚拟系统。最快恢复数据。

强大的断点续传功能可以防止网络抖动,服务器重启,等任何终端传输的动作而导致原始量数据重新传输,保证数据实时备份过程不会因为短暂中断而停止。

因考虑本地数据量为5T,VPN带宽为100M,如果按照传统方式传输原始量,将耗费过长时间,本方案将采用本地数据原始量采集,通过物理运送到异地,进行多线程校验,然后在进行增量传输,使其传递原始量的时间大幅度缩减,最大限度减少网络资源占用。 容灾备份工作站配置高性能多核处理器、高速内存、大容量磁盘空间,同时利用虚拟化技术构建与应用服务逐个对应的容灾备份环境,保证灾备系统稳定的前提下,充分利用系统资源,降低灾备系统构建成本。

当有新系统上线时,可以首先分析现有灾备系统资源使用情况,条件满足情况下,无需购置新灾备服务器,可在不影响任何业务前提下,利用虚拟化技术在容灾备份工作站部署对应新系统的灾备环境。

提供容灾系统资源监控技术,不间断的监测应用的状况和整个应用环境的状态,保证整个系统在最佳的状态下运行。针对应用所使用的硬件,软件,网络环境等的稳定性与可靠性为基础而设计资源监控。

将管理控制台程序安装在本地局域网内任意PC或服务器上,实现对整个容灾系统的管理。

为用户提供容灾备份一体化的平台,意味着用户如果在今后需要对灾备系统进行升级,只需要在平台上搭建新的模块即可实现,大大节约构建成本。

4.3、方案三

方案逻辑结构图三

图例说明:级联异地容灾备份架构,针对有限带宽,通过级联的方式只需对增量传输一次即可,通过异地业务接管服务器组进行对生产中心的业务服务器组的数据进行同步,保证业务连续性。通过对业务接管服务器组的同步数据进行备份,保证生产中心的业务数据安全。 实时对业务服务器组的每一台服务器或系统进行数据同步,保证异地容灾中心的每一个接管服务器或系统的数据实时跟主机保持一致。

当生产中的任何一台服务器发生灾难时,异地容灾中心相对应的接管服务器都会自动进行业务接管。

每个接管服务器一一对应业务服务器,互不干预。

当接管服务器接管完毕后,主机进行修复,修复完成后,可进行反向同步,重新构建一对一的容灾架构。

备份一体机实时对异地业务接管服务器的同步数据进行增量备份,当业务主机数据发生任何灾难时,如人为误操作,病毒侵害,硬件损坏,自然灾害等等,备份一体机可以对数据进行回退恢复。

回退恢复可以选择任意时间点和任意操作步骤进行数据回退,保证恢复到发生灾难前的数据。

任意恢复路径,备份的数据根据需要可以恢复到非原主机的任意系统上,并且支持恢复

到虚拟系统。最快恢复数据。

强大的断点续传功能可以防止网络抖动,服务器重启,等任何终端传输的动作而导致原始量数据重新传输,保证数据实时备份过程不会因为短暂中断而停止。

异地业务接管服务器进行接管动作并不会影响实时备份任务,接管后无需重新进行备份部署与任务开启。

容灾备份工作站配置高性能多核处理器、高速内存、大容量磁盘空间,同时利用虚拟化技术构建与应用服务逐个对应的容灾备份环境,保证灾备系统稳定的前提下,充分利用系统资源,降低灾备系统构建成本。

当有新系统上线时,可以首先分析现有灾备系统资源使用情况,条件满足情况下,无需购置新灾备服务器,可在不影响任何业务前提下,利用虚拟化技术在容灾备份工作站部署对应新系统的灾备环境。

提供容灾系统资源监控技术,不间断的监测应用的状况和整个应用环境的状态,保证整个系统在最佳的状态下运行。针对应用所使用的硬件,软件,网络环境等的稳定性与可靠性为基础而设计资源监控。

将管理控制台程序安装在本地局域网内任意PC或服务器上,实现对整个容灾系统的管理。

为用户提供容灾备份一体化的平台,意味着用户如果在今后需要对灾备系统进行升级,只需要在平台上搭建新的模块即可实现,大大节约构建成本。

五、上讯CDP技术原理

◆数据感知与抓取

上讯CDP通过运行在Production Server端的Client模块实时分析并获取Production Server端的操作及数据。上讯CDP时刻感知Production Server端内是否有新交易变化产生,并在内存层抓取这些交易变化信息形成上讯CDP独有的QL文件,同时封装为TCP/IP数据包实时传送至Standby Server端,Standby Server端接收后即时同步写入,保持与Production Server端的一致。

◆数据传输

QL文件传输:QL格式是上讯CDP独有的专项技术,通过对捕获变化数据的压缩加密,既保证低带宽状况下Production Server和Standby Server之间数据同步效率,同时增强了数据传输过程中的安全性。

首阶段全量数据同步:在不中断业务运行的前提下,读取Production Server端所有Data Source

已有存量数据,初始化为FBK文件同步到Standby Server端实时写入。

Temporary增量数据同步:首阶段全量同步过程中新产生的数据增量被捕获后,经严格的逻辑校验和顺序标记实时写入Standby Server端缓存,当全量同步结束后即执行写入。

常规增量数据同步:通过上讯CDP同步校验机制,验证Production Server和Standby Server 两端数据一致后,可按用户设置进行时间点或I/O点的增量数据同步。

◆同步校验与逻辑校验

同步校验:上讯CDP通过自有Check机制,主动侦测数据头尾的一致性,从而判断增量数据是否为软件自身数据并校验增量数据的可用性。该机制保证了上讯CDP实现主备机两端数据同时在线的“双活”状态。

逻辑校验:上讯CDP通过Logic Check程序,对捕获的数据进行严格的I/O顺序排列,保证系统逻辑关系的正确,并通过Log跟踪分析数据的完整性和一致性。

◆灾难判定与应急接管

上讯CDP通过Sockct对服务器IP、网卡、系统服务、应用进程等提供自定义方式的监控,满足自定义条件的情况下,将自动执行容灾切换,保证用户业务连续性,上讯CDP同时提供人工手动接管功能。

◆时间定位与操作定位

上讯CDP提供按时间点和I/O点两种策略,用来定位数据变化过程,在备份数据恢复的过程中,可按照任意时间点(any point in time)或任意I/O操作点(any point in operating)的方式,进行回滚式恢复,结合强大的逻辑校验机制,保证数据恢复后的可用性和准确性。

六、上讯CDP系统架构与部署

◆系统组成

系统由两部分组成:服务器客户端程序、上讯CDP控制管理平台。服务器客户端程序是负责捕获需备份数据的变化和服务器资源状态的变化,并实时传输,从而实现数据同步或备份的功能,负责整个备份系统数据的接收、管理、存储等后台服务;上讯CDP控制管理平台是系统的统一配置、监控平台,用户可以通过该平台实现备份、还原、同步、接管,运维等任务配置及监控管理等功能。。

◆服务器客户端程序

服务器客户端程序是安装在所有灾备系统内服务器上的,是整个系统的核心部件。

服务器客户端程序模块是多线程、多任务的运行架构,包含存储、备份还原、合成备份、备份池管理、用户权限管理、逻辑校验、通信控制、传输控制、日志管理等。灾备服务器端程序负责将实时增量数据存储到对应的存储位置。

服务器客户端程序会根据用户制定的备份策略对存储的数据进行备份池的管理,生成对应时间点或操作点的备份数据版本,同时备份服务器会保存所有的备份数据块,以做到任意时间点或任意操作点恢复的功能。

服务器客户端程序包含数据捕获、数据压缩,数据加密,数据传输、数据校验等模块,支持对文件、操作系统、MSSQL Server、Oracle、DB2、MySQL、Sybase等备份与恢复。

◆上讯CDP控制管理平台

基于上讯CDP控制管理平台,主要是针对用户的实际需求,将备份产品的特点、功能都集中展示和实现,体现集中管理理念,即所有的操作都在控制台中完成,无需在服务器上安装额外的软件,将对服务器性能的影响降到最低。

上讯CDP控制管理平台的功能:运维监控功能包括监控备份服务器的备份任务运行状态及整个灾备系统的监控和实时数据展示;管理功能包括服务器运行参数、运行日志、用户权限、灾备策略,灾备任务等管理;操作功能包括实现基本的备份、同步、恢复、接管等功能。。

◆系统部署模式

只需在灾备系统内服务器上安装服务器客户端程序,同时将上讯CDP控制管理平台也安装到局域网内任意服务器上。

一般部署的大致步骤:

1.在服务器上安装服务器客户端程序。

2.通过上讯CDP控制管理平台配置服务器端的所有设置功能。

七、上讯CDP主要技术说明

◆数据捕获与传输

备份速度和性能的提升关键来自于数据获取阶段,传统备份系统采用应用系统提供的数据接口方式来获取数据,又或者才有嵌入操作系统捕获磁盘I/O获取变化数据,这些技术除了会造成应用系统性能的下降外,更重要的是无法保证主备机之间数据实时一致。上讯CDP通

过自主研发的核心技术:内存层数据截取技术,通过对物理内存及系统缓存的监视,截取即将写入磁盘的数据,利用并发原理,同时向主备服务器写入数据,以主备服务器数据落盘写入指令为校验,实现主备服务器之间数据实时一致。

◆服务器监视

服务器监视是容灾系统切换所需的最基本的监视功能,是监视构成核心业务系统服务器是否停止运行的功能。

◆业务监视

业务监视是对业务应用系统本身,以及使业务陷入无法执行状态的故障主要原因进行监视。按照监视可选软件对应用系统/协议的停止、结果异常进行监视,同时可以监视数据库应用系统、协议(FTP,HTTP 等) 、应用系统服务器(WebSphere,WebLogic 等)的停止和结果异常。

◆内部监视

内部监视是上讯CDP内部模块之间的相互监视,用于监视上讯CDP的各功能是否正常运行及进程的生存状态。

◆应用容灾切换

一旦检测核心业务系统服务器的心跳中断,上讯CDP将在开始执行切换前判断故障原因。然后,在灾备服务器上激活各种资源,启动业务应用协同来执行切换。

?心跳超时

核心业务系统服务器发生故障后,直至容灾备用服务器查出该故障为止的时间。考虑到业务负荷等导致的延迟,调整容灾属性的设置值。(默认值为4 秒。)

?网络分区解析

是为了确认核心业务系统服务器的心跳的中断(心跳超时)是由于网络分区症状引起还是实际上对方服务器发生故障引起的所需时间。

?激活业务所需资源所用的时间。

按照一般的设置只需几秒即可激活,激活时间也会根据登录到失效切换组上的资源的种类和数量发生变化。

?应用系统的恢复处理/重启

启动业务所用的应用系统所需时间。重新启动数据库服务的时间。

?秒级切换原理

上讯信息自主研发的字节级及多磁盘同时写入技术,在截取内存数据后,进行字节级的传输,以保障传输效率及磁盘的写入性能。无需等待数据库回滚及挂载时间。数据库服务重新启动

后及可完成海量数据的挂载。字节级及多磁盘同时写入技术保障数据的实时可用性和一致性,数秒内及可完成容灾切换。

系统资源监控

在上讯CDP中,监视方和被监视方均被称作资源,并将监视方和被监视方的资源分类管理。这样,除能更明确的区分监视/被监视对象,在构建容灾和检测故障时可更容易应对。支持应用进程、系统服务、存储设备、磁盘空间、系统资源等健康体检及实时监控,为IT管理人员提供最可靠的风险管控依据。

◆数据恢复原理

通过内存驱动层数据截取技术,实时、持续捕捉数据所发生的变化,软件能提供细颗粒的目标恢复,通过实时记录或捕捉数据的变更和改变,使数据可恢复到之前的任意一个状态或者任意一点的操作,没有固定的恢复点,恢复时间点可精确到任意时间点或任意操作点。支持精确到每秒单位内单条数据恢复,支持容灾切换后,备机数据一键回迁至主机。

◆数据库备份

通过对磁盘下文件系统的拷贝,完成对数据库完整数据的提取,将结构化数据提取为非结构化数据,进行本地磁盘缓存,再将提取的数据传输至备份服务器或备份存储,并以最终写入时间为准,开始获取增量数据。增量数据同样以非结构化形式进行存储,并与之前的备份集存储在同一目录下。

◆文件备份

通过对磁盘下文件系统的拷贝,完成对完整文件系统数据的直接传输,备份服务器或存储上的备份集保留了原数据格式。最终完成写入后,开始获取增量数据,增量数据同样保留原数据格式,并与之前的备份集存储在同一目录下。

◆操作系统备份

通过对磁盘下文件系统的拷贝,完成操作系统的备份,能够备份磁盘的分区信息、分区数据、应用系统环境及开发环境,需要恢复则启动软件的引导系统或使用引导光盘,无需重新安装操作系统,就可以进行快速的自动的智能恢复,可以保证在最短的时间内恢复系统运作。

◆集中备份管理

集中备份管理可以使得管理员只启动一个控制台,便可以管理网络上的所有备份服务器,包

括基于各平台操作系统的服务器;数据可灵活备份到网络上任何存储设备,支持集中式、图形化和全中文的备份和恢复管理控制平台。

◆自定义备份池管理

上讯CDP采用独有的“自定义容量”+“自定义数量”+“合成备份”备份池管理策略,摒弃传统的以时间周期自动处理备份集的办法,传统方式极易在备份集数据量超出硬盘空间容量时,丢失数据,从而造成备份数据无法恢复。

◆备份策略

提供了多种备份策略,包含实时备份策略、定时备份策略。可提供无间隙式的实时增量备份,以及根据不同需求制定的定时完整备份、增量备份等。定时备份策略可提供分钟、小时、日、年的时间策略。

◆高速的数据恢复,异地远程备份

上讯CDP拥有高效的检索功能,能在众多的备份数据中快速锁定恢复时间点的数据,优化功能保证了恢复速度的效率以及系统的高可靠性。在数据恢复时避免了重复效验、组合的过程。加快恢复速度。支持批量备份文件类型的数据时(TB/PB级),某单个文件独立快速恢复。支持系统独占的非结构化数据热备份,实现对打开、进程中文件进行实时备份。通过源数据压缩处理技术,降低了远程异地备份对带宽的要求,减少网络压力及传输时间,极大的提高了数据传输效率。可靠的数据实时校验和传输流量控制,避免了对生产服务器的性能影响。通过上讯CDP可以搭建本地----本地----异地的级联保护方案。

基于控制台的统一管理和配置,核心技术具有开放性

支持统一控制台平台,即所有的作业操作都可以在上讯CDP控制台上完成。支持所有灾备系统服务请求统一由控制台以任务管理模式处理,如:备份,容灾,恢复,切换等。采用自定义系统数据存储结构,无需安装第三方数据库作为数据存储系统;采用构件式平台架构,支持业务系统接口对接;支持用户自定义具有行业属性的系统运行流程;支持针对性二次开发;软件需采用底层内核级核心技术,核心技术具有开放性,不依赖特定硬件系统。

八、项目方案总结

通过灾备软件实现相关数据的保护是一个很好的解决办法,即是利用服务器上的备份软件通过IP网络实现数据的远程复制。对应用及数据进行容灾备份,确保数据零丢失,服务不停断。

备份软件采用C/S架构,统一监控/配置中文界面,支持多种操作系统平台(包含windowns、

Linux)的数据文件备份和保护、多种数据库的备份和保护、应用的实时保护和异常接管、远程容灾等功能。支持字节级别的增量数据旁路捕捉模式,可为数据备份制定相应的策略流程,包括启动时间、存储路径、流量控制、备份模式、状态管理等内容,再将数据的更新动作通过网络实时地复制到本地或远程的备份系统。当本地备份系统发生故障时,可以从异地备份系统进行恢复。

系统容灾解决方案

系统容灾解决方案 容灾基本概念 容灾是一个范畴比较广泛的概念,广义上,我们可以把所有与业务连续性相关的内容都纳入容灾。容灾是一个系统工程,它包括支持用户业务的方方面面。而容灾对于IT而言,就是提供一个能防止用户业务系统遭受各种灾难影响及破坏的计算机系统。容灾还表现为一种未雨绸缪的主动性,而不是在灾难发生后的“亡羊补牢”。 从狭义的角度,我们平常所谈论的容灾是指:除了生产站点以外,用户另外建立的冗余站点,当灾难发生,生产站点受到破坏时,冗余站点可以接管用户正常的业务,达到业务不间断的目的。为了达到更高的可用性,许多用户甚至建立多个冗余站点。 容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。 要实现容灾,首先要了解哪些事件可以定义为灾难?典型的灾难事件是自然灾难,如火灾、洪水、地震、飓风、龙卷风、台风等;还有其它如原提供给业务运营所需的服务中断,出现设备故障、软件错误、网络中断和电力故障等等;此外,人为的因素往往也会酿成大祸,如操作员错误、破坏、植入有害代码和病毒袭击等。现阶段,由于信息技术正处在高速发展的阶段,很多生产流程和制度仍不完善,加之缺乏经验,这方面的损失屡见不鲜。 容灾的七个层次 等级1: 被定义为没有信息存储的需求,没有建立备援硬件平台的需求,也没有发展应急计划的需求,数据仅在本地进行备份恢复,没有数据送往异地。这种方式是成本最低的灾难恢复解决方案,但事实上这种恢复并没有真正达到灾难恢复的能力。 一种典型等级1方式就是采用本地磁带库自动备份方案,通过制定相关的备份策略,可以实现系统等级1备份。 等级2: 是一种为许多站点采用的备份标准方式。数据在完成写操作之后,将会送到远离本地的地方,同时具备有数据恢复的程序。在灾难发生后,在一台未启动的计算机上重新完成。系统和数据将被恢复并重新与网络相连。这种灾难恢复方案相对来说成本较低,但同时有难以管理的问题,即很难知道什么样的数据在什么样的地方。这种情况下,恢复时间长短依赖于何时硬件平台能够被提供和准备好。

容灾项目方案设计

容灾项目方案设计

目录

容灾技术规范 作为风险防范系统,灾备系统建设本身在总体规划、方案选择和投产实施后的管理运行,以及真正面对灾难时的切换操作等方面也存在着潜在的风险。 计算机信息系统实现数据大集、应用大集中后,系统的运行安全成为风险控制的焦点。目前,已经有多系统开始或准备进行灾备系统的建设,灾备系统建设的目标是减灾容灾,使计算机信息系统和数据能够最大限度地防范和化解各种意外和灾害所带来的风险。然而,与大多数工程一样,灾备系统建设本身在总体规划、方案选择和投产实施后的管理运行,以及真正面对灾难时的切换操作等方面也存在着潜在的风险。 可以说,风险防范系统本身也存在风险点,需要小心应对。 灾备系统建设中所涉及的潜在风险大致可分为技术风险、管理风险和投资风险,其中尤以技术选择风险最大,技术方案选择优越,可以规避一定的管理风险和投资风险。而这三者也存在内在的相互关联,不同灾备级别对应的建设投资规模、所采用的技术以及实施和管理的复杂度也不同,应考虑保护计算机系统的原有投资并提高灾备系统建设投资的利用率。 1.1 容灾的总体规划 1.2 真正的容灾是数据被不间断的一致性访问! 在灾难备份的世界里,是有等级观念的,级别不同,灾备系统所采用的技术和达到的功能是不同的,在系统建设资金投入方面的差距也很巨大。所以,对用户来说,明确灾备系统建设的总体规划十分必要。 1.2.1 技术指标RPO、RTO 衡量容灾技术的两个技术指标RPO、RTO RPO(Recovery Point Objective): 以数据为出发点,主要指的是业务系统所能容忍的数据丢失量。及在发生灾难,容灾系统接替原生产系统运行时,容灾系统与原

容灾整体解决方案

XX 容灾整体解决方案

第1章

前言................................................................................................................................................2

容灾整体解决方案 第2章 2.1 2.2 2.2.1 2.2.2 2.3 2.4 容灾概述........................................................................................................................................3
概述 ...........................................................................................................................................................3 业务连续性管理简介................................................................................................................................5 《规范》简介 .........................................................................................................................................5 恢复时间目标(RTO)与恢复点目标(RPO)...................................................................................8 容灾系统建设的流程..............................................................................................................................10 容灾系统中的人员组织安排..................................................................................................................12 第3章 容灾建设中 IT 技术的选择 ........................................................................................................14
3.1.1
容灾中 IT 技术的选择..........................................................................................................................14 主流厂商解决方案简介 ..............................................................................................................23
第4章 4.1.1 4.1.2 4.1.3
EMC 容灾解决方案简介 .....................................................................................................................23 SYMMENTEC|VERITAS 整体解决方案简介.....................................................................................26 HDS 容灾解决方案简介.......................................................................................................................29 京北方公司容灾解决方案 ..........................................................................................................32
第5章 5.1.1 5.1.2
京北方公司容灾建设分阶段论............................................................................................................32 京北方公司容灾体系各阶段推荐的产品及产品优势 ........................................................................32 附件..............................................................................................................................................35
第6章
1-

“双活”容灾引领现代备份技术

“双活”容灾引领现代备份技术虽然每周全量夜间增量备份仍是常态,但很多组织机构逐渐发现他们的数据(以及恢复那些数据所需的条件)打破了长久以来传统备份所依赖的模型。存储管理人员备份操作不当,意味着困难并关键的备份现代化任务迎面而来。 备份现代化将是一个有点痛苦的过程,不仅需要选择一项备份技术,还需要考虑这种转变对关键业务处理和需求的影响。 备份替代技术考量 就备份现代化来讲,有各种各样的解决方案,无论经济实用型方案,还是舶来品。不过,当今有三类主要的数据保护策略: ·持续数据保护 ·快照 ·基于镜像的备份 CDP技术对数据进行近乎连续不断地保护。并非在夜间进行大型备份,CDP产品的备份全天候执行,每隔几分钟就进行一次。CDP产品首先将数据以块的方式复制到磁盘备份介质中。当某个块被创建或更改时,该块被备份。CDP有对版本信息进行跟踪的索引,而数据重删技术能够保证只有不重复的块会被存储到备份介质中。 快照与备份有所不同,前者并不创建数据的拷贝,而是提供将虚拟机、文件或应用回滚到先前某点状态的方法。快照是使用磁盘差分或指针的技术。由于快照并不进行实际备份,一些备份厂商将快照作为一种提高自身产品恢复能力的方式,而不是将其用作单独的数据保护策略。 基于镜像的备份代表着备份领域一种新的策略,并应用于虚拟机备份中。此类备份源于这样一种思想即备份处理对虚拟机进行整体数据捕获。如果需要进行恢复操作,将虚拟机的拷贝挂载至沙盒环境中用以承载数据。沙盒挂载能力有时也用来提供本地恢复测试甚至模拟实验能力。只要你受保护的资源全部部署在虚拟服务器上,基于镜像的备份就能够提供显著的灵活性。

重大业务考量。不管你选择使用哪种备份技术,都有一些与公司业务需求相关的重要因素需要考虑。一些因素在购买一个新的备份系统前就需要考虑,另外一些在新的备份系统安装完毕时,就需要立即考虑。 保留需求。选择一个现代备份系统时你最先需要考虑的你的备份保留要求,换句话说,你在多长的时间之内会需要检索数据。 这样的考虑很是重要,因为大多数现代备份方案都是基于磁盘或云服务,或者两者都是。以磁带为基础的备份能够提供近乎无限的保留跨度,因为你能备份到磁带上,而你想将磁带保留多久都可以,而基于磁盘的备份却并非如此。磁盘的容量是有限的,而容量会影响能够保留在备份中历史数据的总量。 快照的回滚可能引起数据库崩溃,除非该快照产品经过特殊设计,能够与你服务器上运行的应用一起工作。 即使磁盘的容量不是一个问题,一些现代备份应用也会有各种限制。比如,一些CDP 产品区分短期保存(磁盘)和长期保存(磁带),并对前者存储介质上的恢复点数量有十分严格的限制。 代理软件兼容性。如果你正在考虑的备份方案是基于代理的,那么就必须在购买之前把代理软件的兼容性当做一个首要考虑因素。尽管大部分备份软件提供商都会提供适用于大多数流行的操作系统的代理软件,你仍需要核实在你自己的环境下运行的操作系统中,该软件是否能正常使用。 业务识别性。在选择一个备份业务时,业务识别性是最重要的一个标准之一。如果你的备份不仅仅是文件数据,那么你的备份软件都必须支持你所运行的业务。 对于CDP或基于镜像的备份产品,业务识别性的确认通常意味着验证某备份产品是否包含一个Microsoft卷影复制服务(VSS),服务器上你所备份业务的运行需要它。对于快照产品,你则需要找寻细粒度应用回滚功能。 尽管大多数快照应用支持整个服务器的回滚,但可能会对数据库应用造成很严重的后果。因为在获取快照时,快照并不能捕捉储存在服务器内存中的处理状态。因此,快照回滚可能引发数据库崩溃,除非某快照产品对你服务器上的应用进行了定制化设计。 初始备份。在你付费并部署了现代备份解决方案之后,关于你的首次备份,有些事情需

点对点容灾解决方案 华为

华为点对点容灾解决方案技术建议书 临时方案 华为技术有限公司 2014年5月12日

目录 1项目概述 (4) 1.1项目需求 (4) 1.2华为点对点整体方案优势 (4) 2点对点容灾方案设计方案 (5) 2.1总体技术方案 (5) 2.1.1点对点容灾方案架构与组件介绍 (5) 2.1.2阵列异步远程复制子方案 (8) 2.1.3阵列同步远程复制子方案 (10) 2.1.4基于VIS的本地高可用子方案 (12) 2.1.5 Oracle Rac的持续化数据保护子方案 (14) 2.2设备选型方案 (14) 2.2.1华为T系列存储系统 (14) 2.2.2 Huawei Tecal RH2285 V2服务器 (18) 2.2.3 OceanStor VIS6600T (21) 2.2.4 OceanStor ReplicationDirector管理软件 (24) 3配置方案 (28)

术语说明

1 项目概述 1.1 项目需求 对于现行业务没有容灾保护的场景下,在面对灾难时,将面临数据丢失,业务长时间中断的风险。传统的单一站点的各种弊端和诸多不便,主要体现在以下几方面: ?难以有效保护核心数据:单一站点在面对突发灾难或者突发事件的时候,无法保护数据的完整性。一旦整个站点在地震等大规模灾难中彻底损坏,客户将面临数据全部丢失的风险。 ?难以提供合理的RPO和RTO:单一站点存在无法提供一个较小的RPO和RTO的限制。 ?系统维护困难:在对单一站点进行维护时,会面临长时间停止业务的风险,对于一个企业来说,业务停止的时间越长,企业受到的影响就越大。 ?难以有效利用现有存储资源:企业在更换高性能存储设备后,如何有效的利用陈旧设备是一个难题。 ?难以实现本地存储高可用:目前的单一存储很难提供有效的本地高可用支持,通过上层的应用软件来实现会影响上层主机性能。对于企业来说,如何在不影响业务运行性能的情况下实现本地存储的高可用是一个难题。 针对上述问题,建议使用点对点容灾方案。点对点容灾方案帮助企业解决数据保护问题,降低系统维护难度,充分利用企业资源,通过存储虚拟化技术实现本地高可用,为实现企业业务稳定、可靠的运行提供整体的解决方案。 1.2 华为点对点整体方案优势 华为公司针对本项目提供了端到端的解决方案。华为主要优势如下: (1)主要部件使用华为自研产品(如存储,交换机,服务器等),兼容性好,高性能,高可靠。 (2)提供较少的数据丢失(3S-5S的RPO)。华为能够提供秒级的RPO保护,为客户提供更好的数据保护。 (3)对华为的存储设备可以做到高中低端互通,充分的利用企业闲置的旧存储设备。 (4)通过存储虚拟化技术(VIS)实现本地存储系统的高可用,提高系统的可靠性。消除单阵列宕机时,业务无法运行的风险。 (5)对于光网络环境使用华为业界领先的光网络技术,提供高质量、高速率、远距离的数据传输支持。 (6)通过统一的管理软件,实现对整个存储资源的集中管理,大大提升管理系统的效率。 使用华为点对点整体方案,能够帮助企业: (1)保护核心业务数据

浪潮双活存储解决方案

浪潮双活存储解决方案 Prepared on 22 November 2020

浪潮数据中心存储双活解决方案 【需求分析】 大数据时代,数据已经成为各行业至关重要的核心资产。传统的灾备方案中存在着资源利用率低、可用性差、出现故障时停机时间长、数据恢复慢、风险高等问题。数据是否安全、业务是否连续运行无中断成为用户衡量一个灾备方案的关键。 传统数据中心存储灾备一般采用主备模式,只有当生产数据中心存储故障后,灾备中心存储才会接管数据访问业务,并且此过程需要手动执行,将灾备中心对应的业务Lun手动激活读写服务;此外,主备数据中心的模式,在正常业务运转情况下,只有主中心发挥作用,备中心的资源一直处于“待命”模式,无法最大程度发挥所有资源的效率。 双活数据中心将是未来数据中心发展的趋势,而存储双活又是数据中心双活的重要基础。 【浪潮存储双活方案设计】 浪潮AS8000-M3使用虚拟卷镜像与节点分离两个核心功能实现数据存储的双活构建: ?AS8000-M3虚拟卷镜像功能实现: 浪潮AS8000-M3作为异构存储整合的专业设备,可以实现在两台存储设备之间实现逻辑卷的镜像。保障单个磁盘的故障或单台存储的故障都不造成对前端服务器性能的影响,实现业务连续性。 上图是通过AS8000-M3实现两台阵列之间存储镜像的示意图,对于底层的磁盘阵列来说,其使用方式与现在相同,对其内部的磁盘先进行RAID,然后在RAID组上进行逻辑磁盘(LUN)的划分。如上图的例子中,首先对两个阵列的磁盘做RAID5,然后在左边阵列中再作成LUNa和LUNb两个逻辑磁盘,同样在右边阵列中可以作成LUN1和LUN2两个逻辑磁盘。AS8000-M3将从左边磁盘阵列获得的管理磁盘a和从右边阵列获得的管理磁盘1进行镜像后,形成了虚拟卷为虚拟卷1,然后再将虚拟卷1映射给服务器。服务器就像使用本地磁盘一样的使用虚拟卷1。使用AS8000-M3进行跨阵列镜像后,对于服务器获得的虚拟卷来说,不会因为任何一个后端磁盘存储系统的故障而出现问题。 ?AS8000-M3节点分离功能实现: 浪潮AS8000-M3拥有节点分离功能,可以把AS8000-M3一个节点组中的两个控制器节点分开放置,两个节点间最远距离可以达到100KM,AS8000-M3节点分离功能只是物理节点的分开放置,但是在用户对于数据的访问以及在 AS8000-M3对于后挂存储空间的管理上与一个节点组处理方式相同,如果一个

异地容灾解决方案

存储升级整合与迁移方案规划建议书

目录 1. 方案总体规划 (4) 1.1存储现状及问题 (4) 2. 方案架构和选型分析 (6) 2.1高端存储平台选型论证 (6) 2.2整体方案及拓扑结构 (10) 2.3本次推荐的VSP及原有USP配置及容量规划 (11) 2.3.1 现有USP硬件配置及升级后配置情况 (11) 2.3.2 现有USP软件配置及升级后配置情况 (11) 2.3.3 新购VSP硬件配置情况 (11) 2.3.4 新购VSP软件配置情况 (12) 3. 数据迁移及服务 (13) 3.1数据迁移概述 (13) 3.1.1 当前系统架构 (13) 3.1.2 存储迁移架构 (13) 3.1.3 TrueCopy项目实施工作表 (14) 3.1.4 HUR项目实施工作表 (15) 3.1.5 ShadowImage项目实施工作表 (17) 4. 项目灾难备份演练、切换策略 (19) 4.1灾难备份演练策略 (19) 4.2灾难备份演练概述 (19) 4.2.1 灾难备份演练的目的 (19) 4.2.2 灾难备份演练的方法 (19) 4.3灾难备份切换策略 (21) 4.3.1 灾难备份切换概述 (21) 4.3.2 灾难备份切换策略 (21) 4.3.3 灾难切换及完整地意义的灾难恢复 (21) 4.3.4 灾难备份系统在技术层面可能存在的恢复缺陷 (22) 4.3.5 关键业务系统灾难恢复方案 (22) 5. 方案总结与介绍 (24) 5.1HDS存储方案特点 (24) 5.2HDS VSP高端存储指标和关键技术 (26) 5.2.1 存储虚拟化功能 (28) 5.2.2 存储逻辑分区技术 (29) 5.2.3 通用复制(UR)软件技术 (30) 5.3HDS VSP高端存储指标 (32)

容灾解决方案

容灾解决方案 方案概述 数据容灾一般要求在异地建立一套数据保护系统,用以保证数据安全和提高数据的连续可用性。 主要从数据备份、数据复制、链路冗余、RAID保护、故障预警、离线保存等方面考虑。就IT信息 系统而言,数据容灾系统主要是为了提供一个应对各种灾难的环境。当计算机信息系统遭受到如洪 水、地震、战争等不可抗拒的自然灾害;亦或由于设备老化、计算机宕机、服务器故障等硬件故障;还有计算机病毒、软件故障、人为误操作等直接影响信息系统中的数据安全。数据容灾系统可以给数据提供切实有效安全保障。像医疗、电信、金融、海关等行业来说,业务连续性与数据安全同等重要,因此容灾系统可以完成业务接管、数据保护。由此可见,建立一套完善的、安全的、有效的数据容灾系统将是现代IT信息建设过程中的重中之重。 信息系统根据在国家安全、经济建设、社会生活中的重要程度,遭到破坏后对国家安全、社会 秩序、公共利益以及公民、法人和其他组织的合法权益的危害程度分为不同的安全等级。因此,数 据容灾系统必须满足不同的安全等级保护要求,来充分满足用户的需求。 火星舱数据容灾系统,依据用户的需求,充分满足不同的等级保护要求。从数据安全和业务连 续性岀发,依托数据备份、CDP、网络存储等专业技术,灵活而有效的为用户提供一套完整的,高可靠地数据安全保护容灾系统。 价值体现 1 )平台异构全面兼容全方面数据保护

简单部署,无需改变现有IT架构 不受品牌/技术限制,支持任意存储设备、软件及协议异构系统平台支持、异构数据类型支持 链路冗余,避免单点故障 备份、CDP、网络存储完美结合,提供全面的数据保护2)策略保护多模式结合灵活扩容高效容灾 针对不同需求,提供不同方式的数据保护方法 多种模式相结合,充分满足各种应用场景 定时与实时相结合,应对不同架构,不同数据类型 随着业务需求灵活扩容 3)专利数据传输技术、存储、应用 双主控远程备份模式的专利技术 断点续传、流量控制、双向缓冲、数据压缩 存储介质多样化,支持磁盘、磁带、虚拟磁带库 单台设备完成跨平台的LAN-Free备份

模板3_系统容灾解决方案

容灾基本概念 容灾是一个范畴比较广泛的概念,广义上,我们可以把所有与业务连续性相关的内容都纳入容灾。容灾是一个系统工程,它包括支持用户业务的方方面面。而容灾对于IT而言,就是提供一个能防止用户业务系统遭受各种灾难影响及破坏的计算机系统。容灾还表现为一种未雨绸缪的主动性,而不是在灾难发生后的“亡羊补牢”。 从狭义的角度,我们平常所谈论的容灾是指:除了生产站点以外,用户另外建立的冗余站点,当灾难发生,生产站点受到破坏时,冗余站点可以接管用户正常的业务,达到业务不间断的目的。为了达到更高的可用性,许多用户甚至建立多个冗余站点。 容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。 要实现容灾,首先要了解哪些事件可以定义为灾难?典型的灾难事件是自然灾难,如火灾、洪水、地震、飓风、龙卷风、台风等;还有其它如原提供给业务运营所需的服务中断,出现设备故障、软件错误、网络中断和电力故障等等;此外,人为的因素往往也会酿成大祸,如操作员错误、破坏、植入有害代码和病毒袭击等。现阶段,由于信息技术正处在高速发展的阶段,很多生产流程和制度仍不完善,加之缺乏经验,这方面的损失屡见不鲜。 容灾的七个层次 等级1: 被定义为没有信息存储的需求,没有建立备援硬件平台的需求,也没有发展应急计划的需求,数据仅在本地进行备份恢复,没有数据送往异地。这种方式是成本最低的灾难恢复解决方案,但事实上这种恢复并没有真正达到灾难恢复的能力。 一种典型等级1方式就是采用本地磁带库自动备份方案,通过制定相关的备份策略,可以实现系统等级1备份。 等级2: 是一种为许多站点采用的备份标准方式。数据在完成写操作之后,将会送到远离本地的地方,同时具备有数据恢复的程序。在灾难发生后,在一台未启动的计算机上重新完成。系统和数据将被恢复并重新与网络相连。这种灾难恢复方案相对来说成本较低,但同时有难以管理的问题,即很难知道什么样的数据在什么样的地方。这种情况下,恢复时间长短依赖于何时硬件平台能够被提供和准备好。 典型方式就是将数据备份到本地磁带介质上,然后通过运输方式(如“卡车”)将备份介质送往异地保存,而异地没有主机系统。当灾难发生时,再使用新的主机,利用数据备份介质(磁带)将数据恢复起来。 等级3: 相当于等级2再加上具有热备份能力站点的灾难恢复。热备份站点拥有足够的硬件和网络设备去支持关键应

云平台容灾备份整体解决方案

云平台容灾备份整体解决方案 北京蓝科泰达科技股份有限公司整合当前市场先进的服务虚拟化技术推出了PlusWell云计算系统,实现了基于虚拟机的快速迁移Plusmotion,虚拟机间的高可用切换PlusHA技术及虚拟机在多台物理服务器间的动态均衡PlusDRS技术。同时,通过存储冗余和数据的实时备份和快速的在线还原技术对云计算机平台给予安全保障。 云平台容灾备份系统拓扑图 方案特点 1、该方案使用了Plus HA组成了高性能【虚拟服务器集群】。任何一台虚拟服务 器出现故障,备用的虚拟服务器都可以接管他们的虚拟机服务;或实现虚拟机级别的业务接管服务。

宿主机整机接管 虚拟机级别接管 2、在主数据中心,使用Plus DRS虚拟机动态衡均技术,DRS实时监测服务器集群,当一台虚拟机服务器资源使用量大的时候,其中运行的虚拟机都可以按优先级顺序迁移到资源空闲的服务器运行。 Plus DRS动态均衡示意图 3、存储高可用功能,D620容灾交换机可以实现主存储系统和备用存储系统的高可用,即负责主备存储间的数据实时备份,同时也负责主备存储间的容灾切换。当主存储系统故障时,D620可以完全无缝的切换到备用存储上,以实现存储的高度可用性。 存储系统容灾示意图 4、存储异地容灾功能,借助于D620的块数据备份及异地数据同步功能,实现两个机房的数据实时,从而实现数据中心的容灾保护。

数据中心容灾保护示意图 产品简介 PlusWell D系列 D620产品示意图 D720产品示意图 功能介绍 PlusWell D系列容灾交换机是面向云计算系统的数据虚拟存储交换系统,是构建云计算系统的基础设备。程序完全由蓝科泰达研发生产,融合虚拟存储、网络存储、多重数据保障等高端技术,满足在线交易、数据挖掘、视频图像存储、大型核心数据库及邮件系统、集中存储和数据备份等满足不同业务应用的需求。 针对云计算系统和虚拟机系统进行了优化,可以直接对存储块进行块级备份,有存储的块数据异地备份功能。 同时支持存储高可用功能,实现主备存储数据复制及接管;异地数据同步功能,实现基于存储的块级数据远程传输;快速还原,在线的快速还原功能,可迅速还原存储内容。 可以对经过的系统块数据流进行实时的块数据备份,并可以实现备份数据的快速还原,该设备可以在两个或多个设备之间进行数据传输从而实现数据的备份。

某某集团云计算数据中心和双活灾备x-io解决方案--5word版本

某某集团 云计算数据中心解决方案 xxxx电子科技有限公司 2014年4月25日

目录 1.方案背景及用户需求 (4) 1.1.方案背景 (4) 1.2.需求分析 (4) 2.双活数据中心解决方案的优势 (6) 3.X-IO双活数据中心解决方案 (7) 3.1.拓扑结构图 (7) 3.2.双活数据中心配置 (8) 3.2.1.方案配置 (8) 3.2.2.智能DNS多站点选择器:跨数据中心基于域名的多活 (10) 3.2.3.VMware虚拟化平台:数据中心虚拟化互联 (8) 3.2.4.虚拟化服务器 (8) 3.2.5.光纤通道交换机:SAN扩展存储 (9) 3.2.6.X-IO ISE高性能存储阵列 (9) 3.2.7.AAM双活软件 (9) 3.3.相关技术参考 (10) 3.3.1.双活数据中心路径优化(Internet) (10) 3.3.2.双活数据中心应用网络 (11) 3.3.3.双活数据中心数据同步 (12) 4.X-IO 存储介绍 (13) 4.1.背景 (13) 4.2.目标 (14)

4.3.架构 (16) 4.3.1.X-IO 网格云存储体系架构 (16) 4.3.2.系统部署架构 (17) 4.4.功能 (17) 4.4.1.ISE Manager (17) 4.4.2.网格Matrix RAID (17) 4.4.3.RAGS (17) 4.4.4.CADP (18) 4.4.5.AAM (18) 4.5.特点 (20) 5.配置列表 (22)

1.方案背景及用户需求 1.1.方案背景 随着企业的商业活动越来越依赖于网络,因此越来越多的企业在寻找一种强大的数据中 心架构,这种高可用的结构能够减少甚至消除正常和非正常的停机对业务可用性造成的影响。 这意味着无论是否有中断,关键任务应用系统都能够不间断地创造产值并提高公司的业务持 续性底线。 而在面对大数据时代的来临,和云时代的来临,数据中心里不同的环节都需要考虑如何 融入大数据和云时代的需求,所以在系统架构上就有云化的必要性。 因此建立多个数据中心来实现业务的容灾成为必然的选择。而企业建立多个数据中心来承载业务系统的主要目的是为了实现应用的高可用性,因此根据数据中心之间的关系,通常将数据中心分为以下两个类型: 主数据中心/灾备数据中心 双运营双活数据中心 1.2.需求分析 企业建立多个数据中心来承载业务系统的主要目的是为了实现应用的高可用性,因此根据数据中心之间的关系,通常将数据中心分为以下两个类型: 主数据中心/灾备数据中心, 双运营双活数据中心 主数据中心/灾备数据中心:

浪潮双活存储解决方案

浪潮数据中心存储双活解决方案【需求分析】 大数据时代,数据已经成为各行业至关重要的核心资产。传统的灾备方案中存在着资源利用率低、可用性差、出现故障时停机时间长、数据恢复慢、风险高等问题。数据是否安全、业务是否连续运行无中断成为用户衡量一个灾备方案的关键。 传统数据中心存储灾备一般采用主备模式,只有当生产数据中心存储故障后,灾备中心存储才会接管数据访问业务,并且此过程需要手动执行,将灾备中心对应的业务Lun手动激活读写服务;此外,主备数据中心的模式,在正常业务运转情况下,只有主中心发挥作用,备中心的资源一直处于“待命”模式,无法最大程度发挥所有资源的效率。 双活数据中心将是未来数据中心发展的趋势,而存储双活又是数据中心双活的重要基础。 【浪潮存储双活方案设计】 浪潮AS8000-M3使用虚拟卷镜像与节点分离两个核心功能实现数据存储的双活构建: AS8000-M3虚拟卷镜像功能实现: 浪潮AS8000-M3作为异构存储整合的专业设备,可以实现在两台存储设备之间实现逻辑卷的镜像。保障单个磁盘的故障或单台存储的故障都不造成对前端服务器性能的影响,实现业务连续性。 上图是通过AS8000-M3实现两台阵列之间存储镜像的示意图,对于底层的磁盘阵列来说,其使用方式与现在相同,对其内部的磁盘先进行RAID,然后在RAID 组上进行逻辑磁盘(LUN)的划分。如上图的例子中,首先对两个阵列的磁盘做RAID5,然后在左边阵列中再作成LUNa和LUNb两个逻辑磁盘,同样在右边阵列中可以作成LUN1和LUN2两个逻辑磁盘。AS8000-M3将从左边磁盘阵列获得的管理磁盘a和从右边阵列获得的管理磁盘1进行镜像后,形成了虚拟卷为虚拟卷1,然后再将虚拟卷1映射给服务器。服务器就像使用本地磁盘一样的使用虚拟卷1。 使用AS8000-M3进行跨阵列镜像后,对于服务器获得的虚拟卷来说,不会因为任何一个后端磁盘存储系统的故障而出现问题。 ?AS8000-M3节点分离功能实现: 浪潮AS8000-M3拥有节点分离功能,可以把AS8000-M3一个节点组中的两个控制器节点分开放置,两个节点间最远距离可以达到100KM,AS8000-M3节点分离功能只是物理节点的分开放置,但是在用户对于数据的访问以及在AS8000-M3对于后挂存储空间的管理上与一个节点组处理方式相同,如果一个AS8000-M3

容灾系统建设方案

xxxxxxx应用容灾系统建议方案 目录

1.用户需求及针对本需求的容灾系统设计综述 (3) 1.1应用数据安全级别的分级考虑 (3) 1.2用户需求分析: (3) 1.3本项目中需要注意的几个要点 (5) 2.数据容灾系统的详细设计 (8) 2.1系统设计原则 (8) 2.2系统的产品选择 (8) 3.3灾备中心的组建 (10) 2.4数据容灾系统的基本结构 (11) 2.5数据的远程复制流程 (13) 2.6数据的远程恢复流程 (14) 2.7本容灾系统的结构特点 (17) 2.8数据容灾系统扩展 (18) 2.9系统投资保障 (18) 3.数据容灾系统与其他方案的简要比较 (18) 4.数据容灾系统的实施计划 (20) 4.1系统实施需求规划 (20) 4.2相关性要求/实施步骤 (21) 4.3系统配置清单 (23) 5.数据容灾系统的测试/验收计划 (23) 5.1基本测试及对O R A CL E和其他类型数据的测试 (23) 5.2切换及回切的测试 (24) 5.3故障测试 (25) 6.数据容灾系统的日常管理/演练计划 (26) 7.应用级容灾的规划 (26) 8.后续其他节点的扩展规划 (27) 10. EMC RECOVERPOINT的维护 (27)

xxxxxxx应用容灾系统建议方案 1.用户需求及针对本需求的容灾系统设计综述 xxxxxxx当前的应用系统类别较多,包括了办公及业务等多个方面。在平台上包括Windows及当前主流的多种UNIX,在存储体系上也具有多种型号的存储产品。因此,整个系统的复杂程度较大。同时,由于应用系统一经处于比较完善的程度,因此,任何的调整都将带来很大的影响。 为此,为了确保数据的安全性,在早期用户实施了数据的磁带备份,但对于关键数据来说,这种磁带备份还不能够完全满足系统抵御各种灾难的能力。为此,用户考虑对数据实施灾备计划。 数据的容灾保护提供最基本的容灾底线保证,确保在任何预计之外的灾难发生后,业务系统都可以在允许损失极少量数据(或无损失)的情况下,在一定的时间内恢复,数据容灾同时也是应用逻辑错误和数据库软件bug的容灾应对出发点;可以通过一定的方式来恢复到这种故障之前的可用的状态。 1.1 应用数据安全级别的分级考虑 鉴于当前存在的大量数据,在安全性的要求上建议分出不同的优先级别,建立不同安全级别的保护措施。这样不仅在成本上会带来优势,同时也可以确保最关键数据的不丢失。 这种分级保护一般根据可以承受的数据丢失量(如半小时,或一天)来考虑。我们不妨把不允许有任何数据丢失的应用定义为安全级别最高,要求进行实时的同步的数据远程传输,对于相对来讲数据安全级别稍低者可以把数据传输的优先级别作相对较低的配置,从而确保在同一时间优先发送最为关键的应用数据。 而对于数据安全要求一般的数据来说,建议采用本地的磁带备份即可,而不必纳入到灾备的体系中来。 这样不仅可以合理使用资金,同时也可以确保关键数据的最高级别保护。 1.2用户需求分析: 用户资料采集:

双活容灾简介

浪擎AgileMirror镜像系统 ——应用级双活容灾 1.双活容灾──在线式应用级容灾 浪擎AgileMirror镜像系统(简称镜像系统)采用基于应用系统的复制技术,将主服务器上的数据实时复制到备用(目标)服务器上,保持两端数据实时相同,以实现容错。此外,镜像系统还可恢复数据到某一历史状态,以实现容错。镜像系统无需主备端硬件规格、配置相同,且占用资源少、应用灵活。 镜像系统实现备端在线的、双活的应用级容灾,践行在线式应用级容灾理念。在线式是指备用服务器上的数据库是在线的,处于可读可查询的状态,确保容灾是可靠的、稳定的;应用级是指镜像系统复制的数据是数据库事务,是属于应用层的。 镜像系统支持SQLServer数据库、Oracle数据库、文件系统等应用系统的容灾。 2.双活容灾原理概述 镜像系统不依赖DataGaurd、LogMinor、DBCC LOG等数据库自带的日志工具来实现数据复制,完全依靠自身研发的数据库实时捕获引擎ACA和数据组装两大核心技术来实现全量复制和实时增量复制。其实时增量复制过程为:生产端代理进程实时捕捉数据库在线或归档日志的变化数据,然后传输到容灾数据库端;容灾端的装载进程按照数据库标准格式组装这些变化数据块,然后提交给数据库的存储引擎保存到容灾数据库。 容灾端数据库处于在线运行状态,具备最高的可靠性,且用户可以随时查询业务数据来检验容灾结果。这是双活容灾最大的优势。 3.主要功能 1)追逐式全量复制 在第一次部署时,且在不停止生产业务的要求下,自动的将生产端业务系统的存量数据和活动数据全部复制到备用端的数据库。 无需停止生产数据库和无需停止业务系统;无需改变生产数据库的现有配置。

系统容灾解决方案讲解学习

系统容灾解决方案

系统容灾解决方案 容灾基本概念 容灾是一个范畴比较广泛的概念,广义上,我们可以把所有与业务连续性相关的内容都纳入容灾。容灾是一个系统工程,它包括支持用户业务的方方面面。而容灾对于IT而言,就是提供一个能防止用户业务系统遭受各种灾难影响及破坏的计算机系统。容灾还表现为一种未雨绸缪的主动性,而不是在灾难发生后的“亡羊补牢”。 从狭义的角度,我们平常所谈论的容灾是指:除了生产站点以外,用户另外建立的冗余站点,当灾难发生,生产站点受到破坏时,冗余站点可以接管用户正常的业务,达到业务不间断的目的。为了达到更高的可用性,许多用户甚至建立多个冗余站点。 容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。 要实现容灾,首先要了解哪些事件可以定义为灾难?典型的灾难事件是自然灾难,如火灾、洪水、地震、飓风、龙卷风、台风等;还有其它如原提供给业务运营所需的服务中断,出现设备故障、软件错误、网络中断和电力故障等等;此外,人为的因素往往也会酿成大祸,如操作员错误、破坏、植入有害代码和病毒袭击等。现阶段,由于信息技术正处在高速发展的阶段,很多生产流程和制度仍不完善,加之缺乏经验,这方面的损失屡见不鲜。 容灾的七个层次 等级1: 被定义为没有信息存储的需求,没有建立备援硬件平台的需求,也没有发展应急计划的需求,数据仅在本地进行备份恢复,没有数据送往异地。这种方式是成本最低的灾难恢复解决方案,但事实上这种恢复并没有真正达到灾难恢复的能力。 一种典型等级1方式就是采用本地磁带库自动备份方案,通过制定相关的备份策略,可以实现系统等级1备份。 等级2: 是一种为许多站点采用的备份标准方式。数据在完成写操作之后,将会送到远离本地的地方,同时具备有数据恢复的程序。在灾难发生后,在一台未启动的计算机上重新完成。系统和数据将被恢复并重新与网络相连。这种灾难恢复方案相对来说成本较低,但同时有难以管理的问题,即很难知道什么样的数据在什么样的地方。这种情况下,恢复时间长短依赖于何时硬件平台能够被提供和准备好。

容灾解决方案

GoldenGate容灾解决方案 黄行威 甲骨文(中国)软件系统有限公司 目录 第一章方案概述2 1.1 概览2 1.2 GoldenGate TDM的好处2 1.2.1实时性2 1.2.2持续可用性2 1.2.3异构支持2 1.2.4高性能,低影响2 1.2.5事务一致性2 1.3 GoldenGate技术介绍3 第二章方案实现技术细节10

第一章方案概述 1.1 概览 为了应对这样的现状,我们推荐Oracle 公司的GoldenGate软件,该软件提供了事务数据管理(TDM)平台,用于持续性的在电子客票系统和灾备系统之间传递大量事务数据,并确保投递速度快,事务完整,系统整体开销影响小。 采用GoldenGate的数据复制技术,实现数据实时备份,确保核心数据的安全,同时避免引入过多种类的软硬件产品,降低了运营维护的复杂度和投入,有利于灾备系统的恢复和切换。 1.2 GoldenGate TDM的好处 1.2.1 实时性 随着一个新事务在数据源端产生,数据马上被捕获,转换(如果有必要),并且在极短时间内被传送给目标端系统 1.2.2 持续可用性 GoldenGate工作不需要专门的时间窗口或者系统中断,它的架构可以保证即使遇到计划或非计划断电也不会影响可用性。 1.2.3 异构支持 只要源和目标端都是主流数据库,主流平台,即使在在异构环境下,也可以使用TDM进行系统间数据复制,这就确保了IT部门的灵活性。 1.2.4 高性能,低影响 GoldenGate能够支持每秒数千的事务交易,同时对源系统和目标系统仅仅有极小的性能影响。 1.2.5 事务一致性 尽管事务是在源和目的两个不同的系统之间传递的,GoldenGate依然可以

数据容灾备份解决方案模板

数据容灾备份解决 方案

中国移动公司 IP网管系统 性数据容灾备份解决方案 VERITAS公司北京办事处 2020年5月5日

目录 1系统需求分析 (3) 1.1 系统建设目标 (3) 1.2 需求简析 (8) 2高可用容灾方案设计 (11) 2.1 设计原则 (11) 2.2 方案概述 (13) 2.1.1 IPNET流量管理服务器及NetCool汇总管理服务器“N+1”冗 余备份方式 (15) 2.1.2 “N+1” 冗余备份方式 (16) 2.1.3 N节点循环备份方式 (17) 2.1.4 软件安装 (18) 2.1.5 NetCool网管服务器/PM服务器、业务网管服务器、 Precision服务器容灾 (18) 2.1.6 功能配置说明 (20) 2.1.7 Visionary应用服务器、NetCool报表服务器、IPNET报表服 务器容灾 (25) 3高可用容灾方案实现 (28) 3.1 软件功能解释 (28) 3.2 安装、配置过程 (36)

3.3 工作过程 (37) 3.4方案分析 (42) 3.1.1 3.4.1 有关数据的量化分析及结果 (42) 3.1.2 方案小结 (44) 4附录 (50) 一、VERITAS公司简介 (50) 二、VERITAS Foundation Suite? (53) 三、VERITAS Cluster Server ? (62)

1系统需求分析 1.1系统建设目标 建设本系统的目的是为中国移动公司IP网管系统建立一个全面的、整体的容灾方案,最大限度地保证业务系统工作的连续性、可靠性。 常言道,“知己知彼,百战不殆”。要实现容灾,首先要了解我们的“敌人”-灾难。那么,哪些事件能够定义为灾难呢?典型的灾难事件是自然灾难,如火灾、洪水、地震、飓风、龙卷风、台风等,还有其它如原先提供给业务运营所需的服务中断,如设备故障、软件错误、电信网络中断和电力故障等等。另外,人为的因素往往也会酿成大祸,如操作员错误、破坏、植入有害代码和恐怖袭击。现阶段,由于中国很多行业正处在高速发展的阶段,很多生产流程和制度仍不完善,加之缺乏经验,这方面的损失屡见不鲜。事实上,中国年遭遇的“非典”,某种意义上也是灾难。对此,我们认为需要做到两点:一是建立切实可行的应急机制,这主要包含一套基于充分且清楚地将风险予以分类定义的业务持续计划,二是在危机突然降临时,此计划能被有效执行。对于IT 系统,除了上述的灾难之外,与系统相关的计划外宕机也可视作灾难。 对于IT 系统而言,在技术层面上,容灾需要考虑:

相关文档
最新文档