灾备环境配置完成后,定期的测试可以提高灾备环境的可靠性,避免配置问题和环境变更问题使得真的灾难发生时,容灾切换无法正确完成,从而导致业务无法快速通过容灾系统恢复。通过将灾备端快照映射给测试主机实现容灾测试,验证复制到灾备中心的数据的可用性或快照的可用性。测试过程不会对生产站点造成任何影响。测试完成后,需清理灾备端的演练数据,还原至容灾演练前资源状态,以便后续执行计划性迁移或故障恢复。
背景信息
灾备中心数据测试用于验证灾备端数据的可用性,测试时灾备端存储的数据为远程复制最近一次同步的数据。测试是通过对远程复制灾备LUN创建即时快照并映射给灾备主机完成,而非使用灾备端已有的用于备份的历史快照数据。测试示意如图1所示。测试完成后,请通过eReplication提供的一键清理功能,及时清理测试数据,即系统自动删除即时快照与灾备主机之间的映射关系,并删除即时快照。
图1 容灾测试
- 对于Oracle、SQL Server、DB2、SAP HANA等应用建议配置基于应用的保护策略,支持一键式测试操作。
- 对于其他应用建议配置基于LUN的保护策略,支持自动完成存储侧测试配置,需要自定义脚本或者手动操作实现应用启动及测试。
- 在容灾测试中,灾备端快照映射只支持映射给启动器模式,不支持添加端口映射模式。
由于容灾测试为重大操作,进行容灾测试时,有如下注意事项:
- 对于保护类型为数据库的保护组在进行测试前,请确保灾备端的数据库连接已全部断开。
- 容灾测试的过程中所有系统管理员和业务管理员不能进行其他维护操作。
- 进行容灾测试后,必须清理测试数据,才可以进行下一次测试。
- 测试结束后,需要尽快清理测试数据。在测试过程中如果网络被断开或eReplication环境被人为关闭,在环境恢复后执行清理时可能存在某些测试数据删除不了的情况,此时需要手动清理测试生成的数据后再次执行清理。
操作步骤
- 登录灾备中心的eReplication系统。
- 测试恢复计划。
- 在菜单栏上,单击。
- 选择需要测试的恢复计划,在“操作”区域选择“更多> 测试”。
如果灾备主机(Linux操作系统)安装了华为多路径软件,请确认多路径软件设置的I/O悬挂时间不为“0”,且该灾备主机上由多路径软件所产生的虚拟设备均存在所对应的物理设备。更多详细信息请参见《OceanStor UltraPath for Linux xxx 用户指南》。xxx代表版本号,配套关系请参见版本配套表。
- 测试完成后,请在灾备端检查应用启动情况。
待测试完成后,请检查应用启动是否成功并能正常进行数据读写操作。如果应用出现启动异常或不能进行数据读写操作,请联系华为技术支持工程师。
- 对于基于应用的保护策略,请检查应用启动是否成功并能正常进行数据读写操作。
- 对于基于LUN的保护策略,您需要登录灾备端应用主机,先扫描磁盘并启动应用,检查应用启动是否成功并能正常进行数据读写操作。
- 容灾测试后,当保护对象类型为“VMware虚拟机”时,在测试主机中新注册的虚拟机名称规则为“保护的虚拟机名称_四位随机数_Drilling_恢复计划名称”。
- 您也可通过自行开发和部署脚本实现扫描磁盘、启动应用和测试应用的操作。
- 清理灾备端的演练数据,还原至容灾演练前资源状态,以便后续执行计划性迁移或故障恢复。
对于保护类型为数据库的保护组在进行清理前,请确保灾备端的数据库连接已全部断开。
- 选择需要清理数据的恢复计划,在“操作”区域单击“更多 > 清理”。
在Oracle应用中,默认为关闭集群的状态,如果您不需要关闭集群,则需要先打开集群关闭配置,再进行下一步操作。具体关闭集群操作请参考修改关闭Oracle集群配置项。
- 仔细阅读弹出的对话框中的提示内容后,单击“确定”。