CDP(持续数据保护)是一种在不影响主要数据运行的前提下,可以实现持续捕捉或跟踪目标数据所发生的任何改变,并且能够恢复到此前任意时间点的方法。CDP系统能够提供块级、文件级和应用级的备份,以及恢复目标的无限的任意可变的恢复点。
CDP可以大大提高数据恢复时间点目标。传统备份技术实现的数据保护间隔一般为24小时,因此用户会面临数据丢失多达24小时的风险,采用快照技术,可以将数据的丢失量风险降低到几个小时之内,而CDP能够实现的数据丢失量可以降低到几秒。实际上,在传统数据保护技术中采用的是对“单时间点(SPIT,Single Point-In-Time)”的数据拷贝进行管理的模式,而持续数据保护可以实现对“任意时间点(APIT,Any Point-In-Time)”的数据访问。
与传统复制技术相比,虽然复制技术可以通过与生产数据的同步获得数据的最新状态,但其无法规避由人为的逻辑错误或病毒攻击所造成的数据丢失。当生产数据由于以上原因导致数据遭到破坏时(例如数据被误删除),复制技术会将遭到破坏的数据状态同步到后备数据存储系统,使后备数据也受到破坏。CDP系统可以使数据状态恢复到数据遭到破坏之前的任意一个时间点,也就可以消除前者具有的风险。另外,由于恢复时间和恢复对象的粒度更细,所以持续数据保护的数据恢复也更加灵活。目前的部分产品和解决方案允许最终用户(而不仅仅是系统管理员)直接对数据进行恢复操作,这在很大程度上方便了使用者。
CDP实现方式分为:
1、基于文件实现CDP
基于文件的CDP,其功能作用在文件系统上,它可以捕捉文件系统数据或者元数据的变化事件(比如创建、修改、删除等),并及时将文件的变动记录下来,以便将来实现任意时间点的文件恢复。
2、基于数据块实现CDP
基于块的CDP功能直接运行在物理的存储设备或逻辑的卷管理器上,甚至也可以运行在数据传输层上。当数据块写入生产数据的存储设备时,CDP系统可以捕获数据的拷贝并将其存放在另外一个存储设备中。
基于数据块的数据保护又有基于主机层、基于传输层和基于存储层三类实现方式。
(1)基于主机端卷管理软件或客户端代理软件Agent实现
目前常见的主机端卷管理软件有Veritas VxVM、Linux LVM、Microsoft动态磁盘等,也有厂商针对Linux和Windows平台开发了客户端代理软件Agent,它们的功能是通过卷镜像的方式获取生产数据的动态副本,并以此副本为基准进行数据持续保护。
(2)基于传输层实现
通过含有Data Splitter功能的FC SAN交换机来获取同写入生产卷相同的I/O数据块,这种FC SAN交换机有Brocade系列、CISCO MDS系列价格比较高。
(3)基于存储层实现
某些厂商的存储阵列本身支持Write Splitter功能,比如EMC ClariiON磁盘阵列,这种实现方式比较受限于厂商。通过上面介绍的三种方式可以获取动态变化的生产数据的副本,下一步的任务是如何将数据的每一次的数据变化跟踪保存下来,从而实现持续数据保护。不同的厂商大多采取了以下两种实现方式:
(1)通过记录数据差异事件日志的方式
首先需要建立供数据恢复时参考用的数据拷贝,但CDP开始运行时,实时在已建立的数据拷贝基础上开始顺序向前记录数据差异事件日志。但需要恢复数据时,从最原始的参考数据拷贝开始,依据数据差异日志进行数据恢复。但恢复时间点越靠近当前的时间,恢复所需要的时间就越长。还有另外一种记录数据差异事件日志的模式,即供恢复用的参考数据实时与生产数据同步;在同步的同时,在当前数据的基础上记录时间的回退事件;需要恢复时,在当前数据的基础上,依据数据回退差异记录日志将数据回退到过去的任意时间点。这种方式恢复的时间点越靠近当前,所需要的恢复时间越短。但在数据的保存过程中,需要同时进行数据和日志记录的同步,需要比较多的系统资源。
(2)通过对数据卷持续快照的方式
通过对获取的生产卷的实时镜像副本进行持续快照的方式来保存历史数据,可以实现细粒度到秒级的持续数据保护。通过相应应用程序的Agent,可以做到精确的相关数据卷组的数据一致性,从而可以在极短时间内实现应用级的灾难恢复。快照技术的实现包括写时拷贝(Copy-on-Write)和写时重定向(Redirect-on-Write)等不同的方式。
需要对CDP(持续数据保护)技术有进一步的了解,请联系蓝盟IT外包获取免费咨询。