针对已经创建的恢复计划,通过测试操作来验证复制到灾备站点的数据的可用性或快照的可用性。测试期间,灾备站点利用快照的方式产生测试数据,不会对生产站点造成任何影响。待测试后,需清理测试环境。在进行故障恢复或计划性迁移前,建议至少成功执行一次容灾测试。
前提条件
- 已使用具有容灾管理权限的用户登录eReplication。
- 生产站点和灾备站点之间通信正常,且灾备站点的管理系统及灾备环境运行正常。
- 系统中存在成功创建的恢复计划。
- 如果验证复制到灾备站点的数据的可用性,生产站点与灾备站点的存储设备建立了远程复制关系,且状态正常。
- 恢复计划的状态为“就绪”、“已完成重保护”或“已完成清理”。
- 当生产端或灾备端存储、主机、虚拟机等网元上信息发生变更时,请手动刷新网元信息,变更项说明以及详细操作,请参见刷新保护组相关资源。
- 如果应用数据的复制策略是通过存储自动进行数据复制,而不是在创建保护组时指定按照时间表策略周期执行,当执行容灾测试时,需要暂停存储复制,否则可能导致容灾测试失败。在设备管理软件中暂停复制的方法有如下两种:
- 当受保护应用使用的远程复制Pair关系处于已同步且数据状态处于一致时,执行远程复制的分裂操作,暂停数据复制。
- 将受保护应用使用的远程复制的复制策略修改为手工同步策略。
各保护类型的要求说明如下表所示。
保护对象
|
要求
|
Oracle
|
- 灾备主机需要与生产主机创建和配置一样的数据库,包括数据库的实例名称、数据库名称、已经使用存储的路径等。
- Oracle RAC集群,灾备端为单机时,在创建完灾备端数据库后,将生产端Oracle数据库的pfile文件拷贝一份副本,并根据灾备端Oracle单机部署方式替换该副本pfile中的集群配置信息,然后将该副本pfile生成spfile文件并放到灾备端本地磁盘。并且保证配置文件在Linux操作系统下,位于“$ORACLE_HOME/dbs”目录中;在Windows操作系统下,位于“$ORACLE_HOME/database”目录中。
|
IBM DB2
|
灾备主机需要与生产主机创建和配置一样的数据库,包括数据库的实例名称、数据库名称、已经使用存储的路径等。
|
Microsoft SQL Server
|
- 灾备主机需要与生产主机创建和配置一样的数据库,包括数据库的实例名称、数据库名称、已经使用存储的路径等。
- 在SQL Server集群中,数据库启动前,数据库文件所在磁盘资源在集群管理器中必须处于维护模式,否则,可能导致启动数据库时磁盘资源挂载失败。
|
Microsoft Exchange Server
|
灾备主机需要与生产主机创建和配置一样的数据库,包括数据库的实例名称、数据库名称、已经使用存储的路径等。
|
FusionCompute虚拟机
|
- 如果生产端和灾备端的网络未隔离,可以在恢复计划“保护对象”页签下为测试虚拟机配置与生产虚拟机不同的恢复IP地址,避免IP地址冲突影响生产端业务。
- 如果对受保护虚拟机执行了增加或减少磁盘操作,请刷新受保护虚拟机信息,并及时手动执行受保护虚拟机所在的保护组。
|
VMware虚拟机
|
如果生产端和灾备端的ESXi集群(主机)网络未隔离,可以在恢复计划“保护对象”页签下为测试虚拟机配置与生产虚拟机不同的恢复IP地址,避免IP地址冲突影响生产端业务。
|
SAP HANA
|
灾备主机需要与生产主机创建和配置一样的数据库,包括数据库的实例名称、数据库名称、已经使用存储的路径等。
|
背景信息
- 在容灾测试中,快照映射只支持映射给启动器模式,不支持添加端口映射模式。
由于容灾测试为重大操作,进行容灾测试时,有如下注意事项:
- 对于保护类型为数据库的保护组在进行测试前,请确保灾备端的数据库连接已全部断开。
- 容灾测试的过程中所有系统管理员和业务管理员不能进行其他维护操作。
- 进行容灾测试后,必须清理测试数据,才可以进行下一次测试。
- 测试结束后,需要尽快清理测试数据。在测试过程中如果网络被断开或eReplication环境被人为关闭,在环境恢复后执行清理时可能存在某些测试数据删除不了的情况,此时需要手动清理测试生成的数据后再次执行清理。
当生产站点所在的虚拟机配置了IP地址,在执行容灾测试操作后,如果灾备站点所在的虚拟机未配置网卡,则灾备站点所在的虚拟机IP地址说明如下:
- Windows:
- 已配置虚拟机规格属性:自动获取IP地址。
- 未配置虚拟机规格属性:与生产站点所在的虚拟机IP地址一致。
- Linux:
操作步骤
- 在菜单栏上,单击“数据利用 > 数据恢复”。
- 选择待测试的恢复计划,在“操作”区域单击“测试”。
系统弹出“测试”对话框。
- 根据保护对象类型,分别执行操作。
如果灾备主机(Linux操作系统)安装了华为多路径软件,请确认多路径软件设置的I/O悬挂时间不为“0”,且该灾备主机上由多路径软件所产生的虚拟设备均存在所对应的物理设备。更多详细信息请参见《OceanStor UltraPath for Linux xxx 用户指南》。
- 基于克隆保护策略模板的恢复计划,请选择需要安装到测试主机(组)的本地副本,并单击“确定”。
- 基于一体化灾备、备份(SAN)保护策略模板的恢复计划,请选择“测试主机”后,再选择测试的副本,并单击“测试”。
在“保护对象”区域,单击“查看”,在弹出的“关联保护对象”对话框中,可以查看副本和当前实际时刻所保护的保护对象变化信息。
- 基于远程恢复模式的保护策略模板的恢复计划,且保护对象类型为“LUN”、“本地文件系统”、“Oracle”、“IBM DB2”、“Microsoft SQL Server”、“Microsoft Exchange Server”时,请执行:
- 选择。
- 选择(对于保护对象类型为“LUN”时,该操作可选)。
- 当灾备站点使用的存储阵列为T系列V2及以后的版本时,此处选择的待恢复的主机在存储阵列上只能归属于一个主机组,且该主机组只能归属于同一个映射视图。同时,受保护的应用使用的存储LUN,其对应的远程复制从LUN,只能归属于同一个LUN组,且该LUN组与该主机组必须归属于同一个映射视图中。如果使用的存储阵列为T系列V2R2版本,创建映射视图后,需要修改映射视图的属性,取消勾选“为主机启用带内命令”。
- 对于T系列V2R2及其更高版本、18000系列存储,提供了自动添加主机与存储映射的功能,只需要保证存储与主机的启动器连接正常,系统会自动在存储上创建对应的主机、主机组、LUN组和映射视图,创建原则如下:

- 单击“确定”。
- 在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果。”
- 单击“确定”。
- 基于远程恢复模式的保护策略模板的恢复计划,且保护对象类型为“VMware虚拟机”时,请执行:
- 选择测试集群信息。
虚拟机将在测试集群中恢复。需要选择“测试站点”、“测试vCenter”和“测试集群”信息。
- 选择测试网络。
测试网络默认为资源映射对应的网络,如果不使用此网络,可根据需要或规划选择其他的网络。
如果“生产资源”和“灾备资源”未配对,请选中“生产资源”和“灾备资源”后,单击“添加到映射视图”进行配对。
- 选择非重要虚拟机。
在“可用虚拟机”列表中,选择需要关闭的非重要的虚拟机,以释放计算资源。
- 单击“测试”。
- 在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果。”
- 单击“确定”。
- 基于远程恢复模式的保护策略模板的恢复计划,且保护对象类型为“FusionCompute虚拟机”时,请执行:
- 选择测试集群信息。
虚拟机将在测试集群中恢复。需要选择“测试站点”信息。
- 选择测试网络。
测试网络默认为资源映射对应的网络,如果不使用此网络,可根据需要或规划选择其他的网络。
- 选择可用上电主机。
可用上电主机将为恢复虚拟机提供资源。
- 选择非重要虚拟机。
在“可用虚拟机”列表中,选择需要关闭的非重要的虚拟机,以释放计算资源。
- 单击“测试”。
- 在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果。”
- 单击“确定”。
- 基于双活(SAN)的保护策略模板的恢复计划,且保护对象类型为“FusionCompute虚拟机”、“VMware虚拟机”、“Oracle”、“IBM DB2”、“Microsoft SQL Server”、“InterSystems Caché”时,请执行:
- 选择停止接收主机业务的存储设备。
对于T系列V3R3C10及其更高版本存储,才提供选择停止接收主机业务的存储设备功能。
- 单击“测试”。
- 在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果。”
- 单击“确定”。
操作结果
测试开始执行,可以通过查看执行步骤,查看执行过程和结果。对于测试失败的恢复计划,排查原因后可以先执行清理操作后重新测试。