咨询热线 4008073606

容灾备份

当前位置:首页>>解决方案>>数据中心建设>>容灾备份

飞康CDP容灾解决方案

时间:2016-06-11 05:25:18 来源:本站 作者:admin 点击:2934次

飞康CDP容灾解决方案

1.      系统现状及需求

用户的核心业务系统主要安置于苏州XX研究中心内,该业务系统包含有数台物理服务器以及相关数据库、配套应用系统共同组成。由于该业务系统的特殊性、复杂性、专业性以及各相关服务器的紧密耦合性,使得其部署起来非常繁琐、复杂,一旦出现服务器硬件或者系统故障,都将导致业务系统出现较长时间(数天甚至1-2个月)的中断宕机。
由于新药研发测试的行业特殊性以及实验阶段的不可逆、不可暂停、等待等诸多限制,同时对于实验录入数据的连续性、完整性要求非常高,使得我们对于当前业务系统的安全、数据保护也提出了非常高的标准和要求。
鉴于该业务系统的关联性、复杂性,以及实验数据的重要性,同时,也为了避免局部区域的灾难发生导致的数据损失,XXX需要建立一套专业、可靠的数据实时容灾保护系统将苏州XX研究中心内的业务数据实时的传输至北京研究中心内,实现异地容灾及数据保护。

2.      建议方案

综上所述,我们建议采用飞康的CDP存储管理器来实现以上容灾需求和数据保护功能,实现苏州XX研究中心的核心数据,以及操作系统、业务应用等通过VPN专线实时的同步传输至北京研究中心内,做到系统和应用级别的数据容灾保护。
方案拓扑如下:

如上图所示,我们将当前在XX苏州生产中心和北京灾备中心内各部署一台飞康CDP存储管理器(自带5TB存储容量,内置VMware虚拟化平台),在生产中心的核心业务系统以及每个需要保护的业务系统中均安装一个代理软件——飞康DiskSafe软件,利用该代理软件可以将需要保护的操作系统和重要数据所在分区通过千兆以太网同步传输到部署在本地(苏州生产中心)的CDP存储管理器中,同时,生产中心的CDP会将接收到的数据同步传输至异地(北京灾备中心)CDP设备中,从而实现关键业务系统数据的本地实时同步以及远程容灾。
两中心内的飞康CDP存储管理器可配置255份生产卷(数据分区)快照,快照间隔可以秒、分钟、小时或者天为单位,设定的时间单位越大,可保留的历史数据时间越久。例如,以每分钟为单位,可以保留4个小时以内的变化数据,如果以小时为单位,则可以保留4天内的变化数据。同时,利用CDP功能,可在两次快照之间实现数据录像机,对磁盘上每一个读写IO(数据块)的变化,均可进行记录、保存,实现IO级颗粒度的恢复精度。快照模块(TimeMark)可实现多历史点保护,如果生产系统出现人为的错误,需提取数据进行查询或纠正错误,只需提取CDP存储管理器中的快照映射给一台主机,即可实现历史的快速恢复(这一过程3-5分钟即可完成);若出现硬件磁盘故障或操作系统无法启动的情况,可使用飞康CDP配合内置的VMware虚拟化平台实现系统级别的恢复。只需将CDP中的磁盘或快照分配给VMware服务器,再建立虚拟机即可。
飞康CDP存储管理器采用旁路的方式接入到以太网络中,不会对现有网络拓扑有任何的更改和影响,而且数据以镜像的方式备份到CDP存储管理器中,不影响正常的生产数据。

3.      方案优势

3.1.       飞康CDP存储管理器

飞康CDP容灾方式改变了传统备份与容灾的游戏规则,是目前使用最广泛的容灾方式,其核心优势为:
Ø   实现一体化的本地/异地备份与容灾体系
Ø   全面防御所有灾难,彻底消除灾难死角
Ø   瞬间恢复,数据立即可用
Ø   传输带宽精简
Ø   复制策略灵活
Ø   全面支持异构存储
Ø   易于维护,简单的图形化管理
Ø   随时进行灾备演练
Ø   开放架构,节约成本,充分利旧
Ø   灾备扩展成本低

3.2.       连续数据保护原理

在需要保护的Windows系统中,会在其上安装一个名为Disksafe的软件,该软件的作用是将被保护的分区或磁盘镜像到CDP服务器中,从而提供连续数据保护。
Disksafe是经过Microsoft认证的软件,集成在MMC中,对系统资源占用小于1%,不会影响性能。

3.3.       实时备份和历史快照

美国飞康软件CDP解决方案可以实现连续数据保护。在增加了CDP设备的新的存储架构下,系统在本地就提供了多种连续数据保护和恢复模式:
镜像的保护模式可以有效应对存储设备的单点故障引起的数据灾难。在“主存储”系统发生设备故障时,CDP系统可以立即提供存储服务,保证应用服务的持续性。
通过CDP设备提供的逻辑快照功能,可以获得多255个全备份。这种模式可以应对任何数据逻辑故障,包括:数据库逻辑错误、人为误操作和病毒等引起的数据库数据丢失、人为或病毒引起的数据库崩溃等故障。
利用CDP快照,我们不仅可以对数据库各类错误实现快速恢复,还可以解决传统备份无法实现的数据库“表级恢复”。比如在误操作导致某个数据库表被误删除的情况下,不需要对整个数据库进行恢复,只需要从快照中提取丢失的“表”,把它恢复到还在运行的数据库中即可。
需要说明的一个技术优势是:实现这255个快照全备份,并不需要其他备份方式那样需要的“255倍存储空间”,只需要增加大约20%的额外存储空间就可以满足所有备份的需要。
有了这255个全备份的支持能力,我们可以非常方便的制定数据备份策略,根据需要,我们可以选择制定诸如以下案例的备份策略:
l  每小时一次的快照(全备份),可以保留至少10天左右的历史数据备份,使得我们至少有能力追溯到10天以前的历史数据。
l  每10分钟一次的快照,可以保留两天左右的历史数据备份,使得我们有能力追溯到接近2天内的历史数据,而且数据最大只有10分钟的偏离。
对比:一般磁带库备份只能通过速度很慢的“Restore”操作恢复到“前天晚上”的备份点的数据,然后需要结合数据库日志恢复整整“一天”的交易。而一般的容灾系统又无法提供历史数据的恢复。
利用CDP系统进行的实时数据备份和快照备份,我们可以应对各种数据系统故障和错误,保证数据系统的快速恢复。对于用户系统而言,采用CDP数据保护架构,可以避免我们以前遇到的各种数据备份的困扰:
l  备份数据无法立即验证,潜在的风险是无法保证数据恢复的成功!
l  磁带库设备故障率高,难以维护。这个问题各地系统深有体会。
l  备份速度慢,恢复速度更慢,结合第一点的数据恢复的可靠性低,使得数据恢复过程就像一把悬在信息中心头顶的剑那样的难受。
重要的是,利用本地的CDP以及快照系统,RPO指标完全可以在0至10分钟内,这对应用系统而言,相当于增加了一把保险锁。

3.4.       远程复制

在两站点同时部署了飞康CDP之后,远程数据实时备份或容灾将会变得非常简单。
飞康CDP的远程复制策略分为三种:
l  连续远程复制
l  时间增量复制
l  数据增量复制
一般在宽带的远程传输系统上,可以采用连续方式传递,而在常规的广域网络中,则建议采用定时增量的方式传输。我们以定时增量传输方式为例进行过程描述。
l  本地CDP数据保护器将时间间隔内的差量block(利用了SnapShot缓存区)经由TCP/IP传到远端的CDP管理器中。远端CDP管理器先将数据放入暂时存储区中,待确认所有数据均传输无误后,才确认完成,否则需重新续传。
l  远端CDP管理器将暂时存储区中的数据写入到对应的逻辑卷中。
l  远端CDP管理器可搭配TimeMark快照提取功能进行快照的提取。
飞康CDP管理器的远程复制拥有极大的优点:CDP管理器的Replication经由TCP/IP WAN传输,因是标准的协议,故可由两台CDP的网卡直接传输。一般传统容灾技术中的磁盘阵列的Replication则由两台磁盘阵列的控制器经WAN专线传输,不论是透过磁盘阵列的ESCON接口或FC switch的光纤端口,都必须搭配一对非常昂贵的gateway网关转WAN来传输,导致其建设、管理与维护成本大幅提高。

飞康CDP管理器先进的远程数据实时复制功能,是目前各种其他形式的数据复制技术所无法比拟的,这些技术包括:
l  复制数据的网络级高压缩率:4倍以上。
l  Micro Scan微差异扫描技术,进一步提高数据复制效率。
l  SCAN Difference差异比对技术,可大幅度提高容灾系统在容灾演练、容灾系统恢复过程成的效率和可操作性,使得这些原本很复杂的过程简单化。
集成的容灾备份管理和全图形化的容灾备份系统操作界面,使得原本非常复杂的容灾备份系统管理变得极其简单,大大地提高了容灾备份系统广泛部署的可能性,降低了潜在的维护成本。

3.5.       灾难发生时的接管和恢复

对于用户Windows系统可能发生的灾难以及恢复方法如下:

3.5.1.              文件丢失或损坏

当发现数据库文件或应用程序文件丢失或损坏时,使用CDP恢复只需要3个步骤大约1分钟的恢复时间。CDP可以对镜像过来的生产数据做定时的快照,如果发现单个文件丢失或损坏,可以找到没有丢失的时间点提取快照,并分配给应用主机,然后在应用主机的磁盘管理中可以发行多了一个磁盘,打开这个磁盘找到丢失的文件COPY会原来的目录即可。
这种方法可以使应用管理员用磁盘COPY的方法进行恢复,比备份软件中看到的更加直观,恢复更加方便。同时这种COPY的方法进行恢复当然支持选择性恢复指定目录与指定文件。

3.5.2.              数据库和应用系统无法正常启动

当数据库或应用系统出现问题无法启动时,可以先使用CDP中的逻辑资源或快照进行接管。方法是将镜像关系断开,然后将镜像盘分配给应用主机,将分区的盘符修改为正在原来生产系统使用的盘符即可。若逻辑资源也无法启动,可以使用在各个时间点创建的快照进行查看。

3.5.3.              硬盘中毒后的接管和恢复

当硬盘中毒但无物理损坏时,也可以使用CDP进行接管和恢复。首先,当生产盘无法使用时,可以使用CDP上的逻辑资源进行业务接管。方法是:先断开镜像关系,然后将镜像盘分配给应用主机,再将盘符改成生产环境使用的盘符即可,整个过程也是在1分钟内可以完成,非常简单方便。然后,使用Disksafe的Restore功能在后台将数据同步到原来生产盘中即可。

3.5.4.              硬盘物理损坏的接管和恢复

硬盘篇的故障是一种极为严重的威胁,往往对于业务系统具有致命的杀伤力,经常导致许多业务系统的完全瘫痪。以往的各个行业的IT系统对付这类故障一般没有好的解决方法,都是采用备份系统花费大量的时间恢复到前一天的备份点,即无法达到RPO的数据保存指标,也无法达到RTO的业务恢复指标。
本系统中,美国飞康软件公司的容灾备份架构完全解决了这一点。一旦核心的硬盘出现故障,美国飞康软件公司的CDP设备会立即接替其运行,应用系统只需等待较短的挂起时间,因此,磁盘系统的故障已完全纳入了为无法造成业务威胁的范围,完全解决了众多IT系统的杀手问题。
更换硬盘后,再使用Disksafe的Restore功能在后台将数据同步到新的硬盘中。

3.5.5.              Windows系统恢复

CDP保护方案还能对Windows系统进行恢复,当系统分区出现中毒或无法启动的情况时,可以直接使用CDP中的镜像盘进行启动,这样可以大大缩短恢复时间。
飞康CDP提供3种方式做Windows的系统恢复。
1)        使用VMware做系统恢复(适用于异构物理平台)
2)        使用Remote Booting做系统恢复
3)        使用RecoveryCD做系统恢复
采用以上3种方法的任何一种, 飞康CDP都可以提供多版本的快照和多版本回滚恢复。

3.5.6.              其他关键技术和优势

CDP技术是一种数据的连续时间点的保护技术,其根本作用是能在故障瞬间完成任何时间点的故障恢复,达到业务的快速连续的作用,从根本上解决传统备份中低恢复能力和非精细时间策略的先天弱点。这种技术的诞生造成了备份领域和灾难恢复领域的一次革命,采用的关键技术包括:
l  窄带传输技术(Microscan+压缩)
l  回切(反转)技术 -- Failback
l  一致性对比技术
l  数据完整性保证机制
l  双向复制
l  链路故障容错
l  数据一致性保证
l  Journal 历史轨迹恢复技术