当生产中心的数据或应用由于灾难或故障不能正常使用时执行故障恢复,以便快速在灾备中心启动业务。在进行故障恢复前,建议至少成功执行一次容灾测试。此操作只能在灾备端eReplication系统进行。
前提条件
- 对于物理机部署的数据库应用或者VMware vSphere、FusionCompute虚拟化环境,已经配置基于应用的保护策略和恢复计划。
- 对于其他应用已配置基于LUN的保护策略和恢复计划。
- 对于使用阵列异步远程复制的保护组,需要保证灾备中心至少有一份可以使用的完整业务数据。
- 当保护对象类型为SAP HANA时,请先执行“测试”及“清理”操作,具体操作请参见灾备中心容灾测试。
- 不支持数据存储名称中包含中文字符。
背景信息
故障恢复可以在生产中心的数据或应用非正常停止时,快速在灾备中心启动业务。当生产中心恢复后,执行计划性迁移操作将业务回切至生产中心。
操作步骤
- 恢复前配置。
- 当保护对象类型为FusionCompute虚拟机时,请执行以下配置:
- 在未配置虚拟机恢复IP地址时,故障恢复的虚拟机IP地址与生产端相同,如果需要为进行计划性迁移的虚拟机配置不同的IP地址,可以在恢复计划“保护对象”页签下进行配置。具体配置方法请参见自定义保护对象启动参数。
- 如果对受保护虚拟机执行了增加或减少磁盘操作,请刷新受保护虚拟机信息,并及时手动执行受保护虚拟机所在的保护组。
- 当保护对象类型为VMware虚拟机时,请执行以下配置:
- 在未配置虚拟机恢复IP地址时,故障恢复的虚拟机IP地址与生产端相同,如果需要为进行故障恢复的虚拟机配置不同的IP地址,可以在恢复计划“保护对象”页签下进行配置。具体配置方法请参见自定义保护对象启动参数。
- 对于异步复制(NAS)场景,用户需要在灾备端阵列DeviceManager上创建共享并配置权限,权限要求与生产中心保持一致。
若没有成功创建共享,配置权限,将会导致故障恢复失败。
- 执行故障恢复。
如果灾备主机(Linux操作系统)安装了华为多路径软件,请确认多路径软件设置的I/O悬挂时间不为“0”,且该灾备主机上由多路径软件所产生的虚拟设备均存在所对应的物理设备。更多详细信息请参见对应版本的《OceanStor UltraPath for Linux xxx 用户指南》。
- 在菜单栏上,单击“数据利用 > 数据恢复”。
- 选择需要故障恢复的恢复计划,在“操作”区域单击“更多 > 故障恢复”。
- 根据不同的保护对象类型,执行故障恢复。
- 当保护对象类型为“LUN”、“本地文件系统”、“Oracle”、“IBM DB2”、“Microsoft SQL Server”、“Microsoft Exchange Server”、“SAP HANA”时,请执行:
- 选择“灾备站点”。
- 选择“主机(组)> 可用灾备恢复主机或主机组”(对于保护对象类型为“LUN”时,该操作可选)。
- 当灾备站点使用的存储阵列为T系列V2及以后的版本时,此处选择的待恢复的主机在存储阵列上只能归属于一个主机组,且该主机组只能归属于同一个映射视图。同时,受保护的应用使用的存储LUN,其对应的远程复制从LUN,只能归属于同一个LUN组,且该LUN组与该主机组必须归属于同一个映射视图中。如果使用的存储阵列为T系列V2R2版本,创建映射视图后,需要修改映射视图的属性,取消勾选“为主机启用带内命令”。
- 对于T系列V2R2及其更高版本、18000系列存储,提供了自动添加主机与存储映射的功能,只需要保证存储与主机的启动器连接正常,系统会自动在存储上创建对应的主机、主机组、LUN组和映射视图,创建原则如下:

- 当保护对象类型为“LUN”时,在不选择容灾恢复主机或主机组的情况下,您需要手动将容灾LUN映射给容灾主机。
- 单击“故障恢复”。
- 在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果”。
- 单击“确定”。
- 当保护对象类型为“VMware虚拟机”时,请执行:
- 选择恢复集群。
虚拟机将在恢复集群中恢复。需要选择“灾备站点”、“灾备vCenter”和“灾备集群”信息。
- 选择恢复网络。
虚拟机恢复后,可以通过该恢复网络访问虚拟机。
- 如果“生产资源”和“灾备资源”未配对,请选中“生产资源”和“灾备资源”后,单击“添加到映射视图”进行配对。
- 如果勾选“保持MAC地址不变”,系统将检查生产虚拟机与灾备vCenter中所有虚拟机的MAC地址是否冲突,如果不冲突,系统将保持灾备vCenter中虚拟机的MAC地址不变,否则,恢复任务将会执行失败。
- 如果不勾选“保持MAC地址不变”,且挂载后的虚拟机处于关机状态,vCenter上挂载的虚拟机显示的MAC地址保持不变。直到虚拟机开机后,vCenter会自动给虚拟机分配MAC地址。
- 访问设置。
输入“逻辑端口IP地址”,恢复集群中的主机可以通过该端口访问灾备端文件系统。
- 选择恢复时需要关闭的非重要虚拟机。
在“可用虚拟机”列表中,选择需要关闭的非重要的虚拟机,以释放计算资源。
- 单击“故障恢复”。
- 当保护对象类型为“FusionCompute虚拟机”或“NAS文件系统”时,在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果。”单击“确定”。
- 最新数据方式:系统将根据故障前灾备中心备份的业务数据进行恢复,并在灾备中心启动业务。
- 最新快照方式:手动或自动执行保护组时,系统将对灾备站点的占位虚拟机自动创建虚拟机快照。故障恢复时,如果选择使用最新快照方式进行恢复,则系统将使用最新的占位虚拟机快照注册虚拟机,并启动虚拟机。
- 在灾备中心检查应用启动情况。
待故障恢复完成后,检查应用和数据是否正常,如果应用或数据出现异常,请联系华为技术支持工程师。
- 检查应用启动分为以下两种情况。
- 对于基于应用的保护策略,请检查应用启动是否成功并能正常进行数据读写操作。
- 对于基于LUN的保护策略,请登录灾备端应用主机,先扫描磁盘并启动应用,检查应用启动是否成功并能正常进行数据读写操作。
您也可通过自行开发和部署脚本实现扫描磁盘、启动应用和测试应用的操作。
- 重保护前环境检查。
对于华为分布式块存储,用户需要对生产端进行修复,修复完成后,手工将生产端的LUN解除映射。
- 执行重保护,对灾备站点接管的业务进行反向保护。
故障恢复完成之后,应用系统运行在灾备站点,保护组变为“无效”。此时需要进行重保护,恢复从灾备站点到生产站点的复制状态,将灾备站点运行期间的数据同步回生产站点。重保护后,原灾备站点为生产站点。
为了确保重保护前保护和恢复的配置不影响重保护后保护组和恢复计划的运行,执行重保护后系统将自动清理保护和恢复的配置(包括保护策略、恢复计划的启动设置、自定义执行脚本、自定义执行步骤等)。在执行重保护后,请重新配置保护策略和恢复策略,以确保容灾业务正常运行。
- 在菜单栏上,单击“数据利用 > 数据恢复”。
- 选择需要执行重保护的恢复计划,在“操作”区域单击“更多 > 重保护”。
当保护对象为VMware虚拟机时,如果您已经通过故障恢复从站点A恢复到站点B,为了避免虚拟化环境中存在冗余或不正确的数据,在执行重保护操作前后,请执行以下操作:
- 通过vSphere Client登录到站点A上的vCenter服务器。
- 关闭并移除注册所有恢复计划恢复到站点B上面的虚拟机。
- 对已经迁移的虚拟机所在的集群下所有的ESXi主机,逐个卸载这些虚拟机使用的所有的数据存储。
- 分离已卸载的数据存储所使用的LUN。
- 在“存储器”下进行“全部重新扫描”操作,确保ESXi主机上无残留的数据存储信息。
- 返回eReplication系统,请分别刷新站点A和站点B上的相应vCenter服务器和存储资源,获取最新的虚拟化环境信息。
- 在弹出的“确认”对话框中仔细阅读提示内容后,单击“确定”。
如果选择“保留用户配置数据”,将保留自定义的保护策略以及恢复设置,如自定义恢复步骤等。请确保重保护后保留的配置数据不影响业务正常运行。