当生产中心的数据或应用由于灾难或故障不能正常使用时执行故障恢复,以便快速在灾备中心启动业务。在进行故障恢复前,建议至少成功执行一次容灾测试。此操作只能在灾备端eReplication系统进行。
前提条件
- 对于物理机部署的数据库应用,已经配置基于应用的保护策略和恢复计划。
- 对于其他应用已配置基于LUN的保护策略和恢复计划。
- 对于使用阵列异步远程复制的保护组,需要保证灾备中心至少有一份可以使用的完整业务数据。
在Oracle应用中,默认为不关闭集群的状态,如果您需要关闭集群,则需要先打开集群关闭配置,再进行下一步操作。具体关闭集群操作请参考修改关闭Oracle集群配置项。
背景信息
由于生产中心灾难,数据复制已经处于故障分裂状态。故障恢复仅在灾备中心将灾备LUN切换为可读写状态并映射给灾备主机,而不再启动新的数据同步,以尽快使用灾备端数据恢复业务。
- 如果灾难发生时,数据复制正好处于同步中的状态,此时将灾备端数据切换为读写状态,灾备LUN将回滚至复制开始前的数据一致性状态。
- 如果灾难发生时,数据复制已经同步完成,灾备LUN则直接将此时的数据切换为读写状态并映射至灾备主机。
故障恢复示意如图1所示。
图1 故障恢复
操作步骤
- 执行故障恢复。
如果灾备主机(Linux操作系统)安装了华为多路径软件,请确认多路径软件设置的I/O悬挂时间不为“0”,且该灾备主机上由多路径软件所产生的虚拟设备均存在所对应的物理设备。更多详细信息请参见对应版本的《OceanStor UltraPath for Linux xxx用户指南》。
- 在菜单栏上,单击。
- 选择需要故障恢复的恢复计划,在“操作”区域单击“更多 > 故障恢复”。
- 配置故障恢复灾备端的信息,并执行故障恢复。
- 选择灾备站点。
- 选择灾备恢复主机或主机组。
- 单击“故障恢复”。
- 在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果。”单击“确定”。
- 在灾备中心检查应用启动情况。
待故障恢复完成后,检查应用和数据是否正常,如果应用或数据出现异常,请联系华为技术支持工程师。
检查应用启动分为以下两种情况。
- 对于基于应用的保护策略,请检查应用启动是否成功并能正常进行数据读写操作。
- 对于基于LUN的保护策略,请登录灾备端应用主机,先扫描磁盘并启动应用,检查应用启动是否成功并能正常进行数据读写操作。
您也可通过自行开发和部署脚本实现扫描磁盘、启动应用和测试应用的操作。