故障恢复

当生产站点的数据或应用由于灾难或故障不能正常使用时执行故障恢复。故障恢复需要在灾备站点进行操作,执行时将使用灾备站点最近的数据进行恢复,并在灾备站点快速启动业务。在进行故障恢复前,建议至少成功执行一次容灾测试。此操作只能在灾备端容灾管理系统进行。

前提条件

背景信息

对基于快照保护策略模板的恢复计划,不能执行故障恢复操作。

在两地三中心容灾解决方案中,当生产中心发生灾难时,通过故障恢复在同城灾备中心恢复数据并启动业务;当生产中心和同城灾备中心都发生灾难时,通过故障恢复在异地灾备中心恢复数据并启动业务。

注意事项

如果主备容灾解决方案和两地三中心容灾解决方案采用2个UltraVR Server的部署方式,必须在灾备端UltraVR上执行故障恢复。

操作步骤

  1. 在菜单栏上,单击“恢复”。
  2. 选择待进行故障恢复的远程恢复计划,在“操作”区域单击“更多 > 故障恢复”。

    系统弹出“故障恢复”对话框。

  3. 执行故障恢复。

    如果灾备主机(Linux操作系统)安装了华为多路径软件,请确认多路径软件设置的I/O悬挂时间不为“0”,且该灾备主机上由多路径软件所产生的虚拟设备均存在所对应的物理设备。更多详细信息请参见《OceanStor UltraPath for Linux V100R008C00 用户指南》。

    1. 选择恢复集群信息。

      虚拟机将在测试集群中恢复。需要选择“灾备站点”信息。

      对于使用主机复制容灾的FusionSphere虚拟机保护组,可根据需要选择使用最新数据恢复还是使用最新快照恢复。

    2. 可选:选择可用上电主机。

      可用上电主机将为恢复虚拟机提供资源。

    3. 可选:选择非重要虚拟机。

      在“可用虚拟机”列表中,选择需要关闭的非重要的虚拟机,以释放计算资源。

      若关闭非重要的虚拟机失败,请到FusionCompute管理界面上手动关闭虚拟机。

    4. 单击“故障恢复”。
    5. 在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果。”
    6. 单击“确定”。

操作结果

故障恢复开始执行,可以通过查看执行步骤,查看执行过程和结果。对于执行失败的故障恢复任务,排查原因后可以重新执行。

后续处理

当故障恢复完成后,业务已在灾备站点上运行。如果原生产站点在非站点级损坏下重建场景(如突然掉电后一段时间内恢复供电等),且需要将业务回切至原生产站点,请执行以下操作步骤:

  1. 执行重保护

    业务回切前,需要通过该操作完成运行在灾备站点上的业务反向保护,将在灾备站点上产生的业务数据按照指定的策略自动复制至原生产站点。

  2. 执行测试恢复计划

    当重保护完成后,业务数据反向复制至原生产站点,在业务回切至原生产站点前,需经过一次容灾测试进行数据可用性验证,确保业务回切的成功率。

  3. 执行清理测试数据

    该步骤将完成自动清理容灾测试过程中产生的测试数据,确保业务回切时,不会因容灾测试过程中产生的测试数据影响业务回切成功率。

  4. 执行计划性迁移

    当需要将业务回切至原生产站点时,执行计划性迁移,业务将自动迁移至原生产站点运行。

  5. 执行重保护

    为确保回切至原生产站点的业务在发生计划内或计划外事件时,能够在灾备站点上进行恢复,则需要再次执行重保护,确保业务被正常保护。

当成功执行故障恢复后,可以通过导出配置文件,查看执行故障恢复前和执行故障恢复后的FusionCompute虚拟机的资源映射等信息。导出配置文件的操作步骤如下:

  1. 选择成功执行故障恢复操作的恢复计划,单击下方的“保护对象”页签。
  2. 单击“导出”,将配置文档导出到本地保存。

版权所有 © 华为技术有限公司