1. 数据灾备
1.1 备份
将数据由一份数据转存为多份数据的过程,即为备份,通常指将数据通过某些手段,将数据存放到其他不同设备中,防止数据丢失。指用户为应用系统产生的重要数据(或者原有的重要数据信息)制作一份或者多份拷贝,以增强数据的安全性,总结:数据不丢
- 定时备份:定时定期将生产数据整体备份至另一个地方做归档式备份。
- 快照备份:快照备份是将生产数据冻结I/O几秒钟-几分钟;当快照拷贝的位图建立后,并将快照数据传输至另一个地方做归档式备份。
- 实时备份:实时备份进行自动监控,实时捕获和备份数据变化,只要数据发生变化,便实时、准确的进行传输备份。
1.2 双活
指在相隔较远的两地(同城或者异地)建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换。当一处系统因意外(天灾、人祸)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作,总结:业务不断
1.3 灾备分类
以灾备内容分类:
数据级灾备:重在数据的备份和保存
应用级灾备:重在数据同步及系统持续可用
业务级灾备:涵盖系统之外的部分,如办公场所等
从数据角度来讲,灾备分为:
- 冷备:主数据中心承担业务;数据周期性备份
- 热备:主数据中心承担业务;灾备数据中心的应用已经启动。故障时,应用访问的数据流自动切换到灾备数据中心,需要手动启用灾备数据中心的服务
- 双活/多活:主备两个或多个数据中心互为备份,分担业务负载;主备中心同时具备承载资源和系统服务提供能力。
1.4 RTO
Recovery Time Object,恢复时间目标,决定业务中断了多长时间。灾难发生后,从IT系统宕机导致业务停顿之刻开始,到IT系统恢复至可以支持各部门运作,业务恢复运营之时,此两点之间的时间段称为RTO。比如说灾难发生后半天内便需要恢复,RTO值就是12小时。
1.5 RPO
Recovery Point Object,恢复点目标,决定了丢失多少数据。灾难发生后,容灾系统进行数据恢复,恢复得来的数据所对应的时间点称为RPO。如果企业每天凌晨零时进行备份一次,当服务恢复后,系统内储存的只会是最近灾难发生前那个凌晨零时的资料。
2. 云平台灾备方案
2.1 云平台备份
云平台备份应提供连续数据备份、按需恢复服务能简便地将各分节点的数据实时备份到本地或异地的灾备中心节点,并且按需快速地恢复需要的数据。并严格保证生产系统和灾备中心数据的一致性和完整性。广泛应用于普通文件系统、数据库系统、邮件系统等实时的容灾备份保护。
云平台备份依赖于备份软件备份至备份平台,备份平台可以和云平台设备在同一机房或者异地机房。云平台软件可以部署在VM中或者备份平台中,即有代理模式或无代理模式备份。其特点为:
- 备份软件可以指定所有或某个VM备份,以及备份策略,备份策略应支持定时备份、实时备份、以及整机备份;
- 当云平台故障时,所有业务均不可用,需要云平台恢复后,由备份平台进行数据恢复;
- 当某个VM故障时,该VM不可用,需新建VM,由备份平台恢复该VM数据,不阻塞业务;
- 一般支持块级备份或者字节级备份;
2.2 云平台主备
云平台主备的架构下,主要使用一个中心提供业务,通过备份一体机或者备份软件,将数据同步到备端数据中心去。当主数据中心故障时,备端数据中心可正常提供业务支撑。但需要客户端主动切换IP。
- 正常情况下,业务访问生产中心,备份软件部署在备份平台上,将生产中心上的数据备份至备份平台(备份一体机);
- 备份平台通过专网,定时将数据备份至同城灾备中心;
- 当生产中心发生故障时,同城灾备中心可以启用,对外提供业务支撑;
- 当生产中心某个虚机故障时,可以在生产中心新起一个虚机,并从备份平台中将故障虚机的数据恢复至新虚机中,提供业务。
2.3 云平台双活
云平台双活的业务架构下,两中心的云平台均可提供业务,业务可以完全在一个中心或者在两个中心,两个中心的业务可以是镜像级、部分镜像级和非镜像级三类。相较于云平台备份场景,云平台双活架构需要生产中心和灾备中心都有备份平台进行数据的备份。
3. 存储灾备
3.1 存储双活
存储双活技术是为了保障业务的连续性和应用的高可用性,当其中任何一处存储集群发生灾难时,另外一处存储集群也可提供连续的业务访问能力。存储双活场景一般使用集中式存储较多。其特点为:
- 不同的存储集群位于不同的数据中心,同城、异地或不同机房;
- 双集群均可为客户端提供服务;
- 存储集群A和存储集群B之间通过万兆交换机进行数据的双向同步;数据同步可以是同步或异步的;
- 当某存储集群发生灾难无法提供业务时,需要客户端手动进行业务切换至另一个集群,或者客户端配置F5交换机进行切换IP/域名访问;
- 不同数据中心之间提供高可用的存储服务,保障业务的连续性访问,RPO=0,RTO≈0.
3.2 存储备份
与存储双活不同,存储备份又称为远程复制,是一种数据级备份。支持同步、异步、周期异步三种复制模式。该模式下对数据灾备的要求不高,只要保证数据不丢失即可。存储备份场景一般使用分布式存储较多,其特点为:
- 不同的存储集群位于不同的数据中心,同城、异地或不同机房;
- 双集群均可为客户端提供服务;但是客户端同一时间只使用单一的存储集群;
- 存储集群A和存储集群B之间通过万兆交换机进行数据的单向同步;数据同步可以是同步、异步或者周期异步的;
- 当存储集群A发生故障时,客户端可临时切换至存储集群B进行业务访问。待存储集群A恢复后切换至存储集群A;
- 存储集群距离较近时,同步复制的场景下,RPO可为0,远距离时采用异步复制降低对前端主机业务性能的影响,RPO>0;