生产中心故障恢复后业务回迁

生产中心故障后针对可以按照原配置修复和无法按原配置修复两种情况,对应的容灾回切操作有所不同。

前提条件

在Oracle应用中,默认为不关闭集群的状态,如果您需要关闭集群,则需要先打开集群关闭配置,再进行下一步操作。具体关闭集群操作请参考修改关闭Oracle集群配置项

操作步骤

  1. 登录原生产中心的业务系统,检查业务启动情况。

    确认生产中心的应用已停止,为卸载磁盘做准备。

    数据库场景下,需要手动关闭生产中心的应用。

  2. 卸载应用主机磁盘。
  3. 切换主从关系。

    登录灾备中心存储,对处于分裂状态的远程复制或者一致性组,执行“主从切换”。

  4. 启用从资源写保护功能。

    启用后,从LUN的数据不能被写入,保证了从LUN数据的安全性。

    1. 登录生产中心存储管理界面,在远程复制管理界面选择需要启用从资源保护的远程复制。
    2. 如果是远程复制Pair,请单击“属性”,修改“从资源保护状态”为“只读”。如果是远程复制一致性组,请选择“更多 > 启用从资源保护”。

  5. 刷新eReplication上注册的资源。

    进入“资源”界面,选择需要刷新的设备,在“操作”区域单击“刷新”,刷新设备信息。各容灾保护的对象需要刷新的设备如表1所示
    表1 保护对象和设备对应关系

    保护对象

    待刷新设备

    Oracle、DB2、SQL Server、SAP HANA数据库

    数据库所在的主机、关联的存储设备。

    VMware虚拟机

    虚拟机关联的存储设备。

    LUN

    LUN所在的存储设备。

  6. 执行重保护。

    复制灾备中心的数据到生产中心,完成初始的数据同步。

    1. 在菜单栏上,单击数据利用 > 数据恢复。
    2. 选择需要执行重保护的恢复计划,在“操作”区域单击“更多 > 重保护”。
    3. 在弹出的“确认”对话框中仔细阅读提示内容后,单击“确定”。

      为了确保重保护前保护和恢复的配置不影响重保护后保护组和恢复计划的运行,执行重保护后系统将自动清理保护和恢复的配置(包括保护策略、恢复计划的启动设置、自定义执行脚本、自定义执行步骤等),保护策略将改为按需调度。在执行重保护后,请重新配置保护策略和恢复策略,以确保容灾业务正常运行。

  7. 刷新保护组。

    由于此时eReplication对于存储复制关系调整未知,所以此时保护组处于“无效”状态,需要手动刷新。

  8. 在eReplication系统上执行恢复计划的测试和清理。当测试恢复计划过程中需要选择主机或主机组时,请选择生产中心的主机或主机组。

    在业务回切至原生产中心前,需经过一次容灾测试以便验证数据可用性,确保业务回切的成功率。测试完成后,还需要清理容灾测试过程中产生的测试数据,确保业务回切时,不会因容灾测试过程中产生的测试数据影响业务回切成功率。具体操作请参考容灾测试/清理

  9. 在eReplication系统上执行计划性迁移。

    执行计划性迁移,将灾备中心的业务回迁至生产中心,迁移完成后,还需要执行迁移后的数据检查和数据清理。具体操作请参考生产中心业务计划性迁移中的13

  10. 在eReplication系统上再次执行重保护。

    复制生产中心的数据到灾备中心,恢复保护组状态。


版权所有 © 华为技术有限公司