故障恢复

当生产站点的数据或应用由于灾难或故障不能正常使用时执行故障恢复。故障恢复需要在灾备站点进行操作,执行时将使用灾备站点最近的数据进行恢复,并在灾备站点快速启动业务。在进行故障恢复前,建议至少成功执行一次容灾测试。此操作只能在灾备端容灾管理系统进行。

前提条件

背景信息

对基于快照、克隆保护策略模板的恢复计划,不能执行故障恢复操作。

在两地三中心容灾解决方案中,当生产中心发生灾难时,通过故障恢复在同城灾备中心恢复数据并启动业务;当生产中心和同城灾备中心都发生灾难时,通过故障恢复在异地灾备中心恢复数据并启动业务。

当生产站点所在的虚拟机配置了IP地址,在执行故障恢复操作后,如果灾备站点所在的虚拟机未配置网卡,则灾备站点所在的虚拟机IP地址说明如下:

  • Windows
  • 已配置虚拟机规格属性:自动获取IP地址。
  • 未配置虚拟机规格属性:与生产站点所在的虚拟机IP地址一致。
  • Linux

    自动获取IP地址。

操作步骤

  1. 在菜单栏上,单击“数据利用 > 数据恢复”。
  2. 选择待进行故障恢复的远程恢复计划,在“操作”区域单击“更多 > 故障恢复”。
  3. 根据不同的保护对象类型,执行故障恢复。

    如果灾备主机(Linux操作系统)安装了华为多路径软件,请确认多路径软件设置的I/O悬挂时间不为“0”,且该灾备主机上由多路径软件所产生的虚拟设备均存在所对应的物理设备。更多详细信息请参见《OceanStor UltraPath for Linux xxx 用户指南》。

    • 当保护对象类型为“LUN”时,请执行:
      1. 选择“灾备站点”。
      2. 选择“主机(组)> 可用灾备恢复主机或主机组”(对于保护对象类型为“LUN”时,该操作可选)。
        • 当灾备站点使用的存储阵列为T系列V2及以后的版本时,此处选择的待恢复的主机在存储阵列上只能归属于一个主机组,且该主机组只能归属于同一个映射视图。同时,受保护的应用使用的存储LUN,其对应的远程复制从LUN,只能归属于同一个LUN组,且该LUN组与该主机组必须归属于同一个映射视图中。如果使用的存储阵列为T系列V200R001C00版本,创建映射视图后,需要修改映射视图的属性,取消勾选“为主机启用带内命令”。
        • 对于T系列V2R2及其更高版本、18000系列存储,提供了自动添加主机与存储映射的功能,只需要保证存储与主机的启动器连接正常,系统会自动在存储上创建对应的主机、主机组、LUN组和映射视图,创建原则如下:

        • 当保护对象类型为“LUN”时,在不选择容灾恢复主机或主机组的情况下,您需要手动将容灾LUN映射给容灾主机。
      3. 单击“故障恢复”。
      4. 在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果。”
      5. 单击“确定”。
    • 基于一体化灾备、备份(SAN)保护策略模板的恢复计划,可以选择副本进行备份恢复。

      在“保护对象”区域,单击“查看”,在弹出的“关联保护对象”对话框中,可以查看副本和当前实际时刻所保护的保护对象变化信息。

操作结果

故障恢复开始执行,可以通过查看执行步骤,查看执行过程和结果。对于执行失败的故障恢复任务,排查原因后可以重新执行。

后续处理

当故障恢复完成后,业务已在灾备站点上运行。如果原生产站点在非站点级损坏下重建场景(如突然掉电后一段时间内恢复供电等),且需要将业务回切至原生产站点,请执行以下操作步骤:

  1. 执行重保护

    业务回切前,需要通过该操作完成运行在灾备站点上的业务反向保护,将在灾备站点上产生的业务数据按照指定的策略自动复制至原生产站点。

  2. 执行测试恢复计划

    当重保护完成后,业务数据反向复制至原生产站点,在业务回切至原生产站点前,需经过一次容灾测试进行数据可用性验证,确保业务回切的成功率。

  3. 执行清理测试数据

    该步骤将完成自动清理容灾测试过程中产生的测试数据,确保业务回切时,不会因容灾测试过程中产生的测试数据影响业务回切成功率。

  4. 执行计划性迁移

    当需要将业务回切至原生产站点时,执行计划性迁移,业务将自动迁移至原生产站点运行。

  5. 执行重保护

    为确保回切至原生产站点的业务在发生计划内或计划外事件时,能够在灾备站点上进行恢复,则需要再次执行重保护,确保业务被正常保护。


版权所有 © 华为技术有限公司