故障恢复

当生产站点的数据或应用由于灾难或故障不能正常使用时执行故障恢复。故障恢复需要在灾备站点进行操作,执行时将使用灾备站点最近的数据进行恢复,并在灾备站点快速启动业务。在进行故障恢复前,建议至少成功执行一次容灾测试。此操作只能在灾备端容灾管理系统进行。

前提条件

各保护类型的要求说明如下表所示。

保护对象

要求

Oracle/IBM DB2/Microsoft SQL Server/Microsoft Exchange Server

灾备主机需要与生产主机创建和配置一样的数据库,包括数据库的实例名称、数据库名称、已经使用存储的路径等。

FusionCompute虚拟机

  • 在未配置虚拟机恢复IP地址时,故障恢复的虚拟机IP地址与生产端相同,如果需要为进行故障恢复的虚拟机配置不同的IP地址,可以在恢复计划“保护对象”页签下进行配置。
  • 如果对受保护虚拟机执行了增加或减少磁盘操作,请刷新受保护虚拟机信息,并及时手动执行受保护虚拟机所在的保护组。

VMware虚拟机

在未配置虚拟机恢复IP地址时,故障恢复的虚拟机IP地址与生产端相同,如果需要为进行故障恢复的虚拟机配置不同的IP地址,可以在恢复计划“保护对象”页签下进行配置。

背景信息

对基于快照、克隆保护策略模板的恢复计划,不能执行故障恢复操作。

在两地三中心容灾解决方案中,当生产中心发生灾难时,通过故障恢复在同城灾备中心恢复数据并启动业务;当生产中心和同城灾备中心都发生灾难时,通过故障恢复在异地灾备中心恢复数据并启动业务。

当生产站点所在的虚拟机配置了IP地址,在执行故障恢复操作后,如果灾备站点所在的虚拟机未配置网卡,则灾备站点所在的虚拟机IP地址说明如下:

  • Windows
  • 已配置虚拟机规格属性:自动获取IP地址。
  • 未配置虚拟机规格属性:与生产站点所在的虚拟机IP地址一致。
  • Linux

    自动获取IP地址。

操作步骤

  1. 在菜单栏上,单击“数据利用 > 数据恢复”。
  2. 选择待进行故障恢复的远程恢复计划,在“操作”区域单击“更多 > 故障恢复”。
  3. 根据不同的保护对象类型,执行故障恢复。

    如果灾备主机(Linux操作系统)安装了华为多路径软件,请确认多路径软件设置的I/O悬挂时间不为“0”,且该灾备主机上由多路径软件所产生的虚拟设备均存在所对应的物理设备。更多详细信息请参见《OceanStor UltraPath for Linux xxx 用户指南》。

    • 当保护对象类型为“LUN”、“本地文件系统”、“Oracle”、“IBM DB2”、“Microsoft SQL Server”、“Microsoft Exchange Server”时,请执行:
      1. 选择“灾备站点”。
      2. 选择“主机(组)> 可用灾备恢复主机或主机组”(对于保护对象类型为“LUN”时,该操作可选)。
        • 当灾备站点使用的存储阵列为T系列V2及以后的版本时,此处选择的待恢复的主机在存储阵列上只能归属于一个主机组,且该主机组只能归属于同一个映射视图。同时,受保护的应用使用的存储LUN,其对应的远程复制从LUN,只能归属于同一个LUN组,且该LUN组与该主机组必须归属于同一个映射视图中。如果使用的存储阵列为T系列V200R001C00版本,创建映射视图后,需要修改映射视图的属性,取消勾选“为主机启用带内命令”。
        • 对于T系列V2R2及其更高版本、18000系列存储,提供了自动添加主机与存储映射的功能,只需要保证存储与主机的启动器连接正常,系统会自动在存储上创建对应的主机、主机组、LUN组和映射视图,创建原则如下:

        • 当保护对象类型为“LUN”时,在不选择容灾恢复主机或主机组的情况下,您需要手动将容灾LUN映射给容灾主机。
      3. 单击“故障恢复”。
      4. 在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果。”
      5. 单击“确定”。
    • 当保护对象类型为“VMware虚拟机”时,请执行:
      1. 选择恢复集群信息。

        虚拟机将在恢复集群中恢复。需要选择“灾备站点”、“灾备vCenter”和“灾备集群”信息。

      2. 选择恢复网络。

        恢复网络默认为资源映射对应的网络,如果不使用此网络,可根据需要或规划选择其他的网络。

        • 如果“生产资源”和“灾备资源”未配对,请选中“生产资源”和“灾备资源”后,单击“添加到映射视图”进行配对。
        • 如果勾选“保持MAC地址不变”,系统将检查生产虚拟机与灾备vCenter中所有虚拟机的MAC地址是否冲突如果不冲突,系统将保持灾备vCenter中虚拟机的MAC地址不变否则,恢复任务将会执行失败。
        • 如果不勾选“保持MAC地址不变”,且挂载后的虚拟机处于关机状态,vCenter上挂载的虚拟机显示的MAC地址保持不变。直到虚拟机开机后,vCenter会自动给虚拟机分配MAC地址。
      3. 选择非重要虚拟机。

        在“可用虚拟机”列表中,选择需要关闭的非重要的虚拟机,以释放计算资源。

      4. 单击“故障恢复”。
      5. 在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果。”
      6. 单击“确定”。
    • 当保护对象类型为“FusionCompute虚拟机”时,请执行:
      1. 选择恢复集群信息。

        虚拟机将在测试集群中恢复。需要选择“灾备站点”信息。

        首次选择测试网络时,需要设置恢复集群信息。

      2. 选择可用上电主机。

        可用上电主机将为恢复虚拟机提供资源。

      3. 选择非重要虚拟机。

        在“可用虚拟机”列表中,选择需要关闭的非重要的虚拟机,以释放计算资源。

      4. 单击“故障恢复”。
      5. 在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果。”
      6. 单击“确定”。
    • 基于一体化灾备、备份(SAN)保护策略模板的恢复计划,可以选择副本进行备份恢复。

      在“保护对象”区域,单击“查看”,在弹出的“关联保护对象”对话框中,可以查看副本和当前实际时刻所保护的保护对象变化信息。

操作结果

故障恢复开始执行,可以通过查看执行步骤,查看执行过程和结果。对于执行失败的故障恢复任务,排查原因后可以重新执行。

后续处理

当故障恢复完成后,业务已在灾备站点上运行。如果原生产站点在非站点级损坏下重建场景(如突然掉电后一段时间内恢复供电等),且需要将业务回切至原生产站点,请执行以下操作步骤:

  1. 执行重保护

    业务回切前,需要通过该操作完成运行在灾备站点上的业务反向保护,将在灾备站点上产生的业务数据按照指定的策略自动复制至原生产站点。

  2. 执行测试恢复计划

    当重保护完成后,业务数据反向复制至原生产站点,在业务回切至原生产站点前,需经过一次容灾测试进行数据可用性验证,确保业务回切的成功率。

  3. 执行清理测试数据

    该步骤将完成自动清理容灾测试过程中产生的测试数据,确保业务回切时,不会因容灾测试过程中产生的测试数据影响业务回切成功率。

  4. 执行计划性迁移

    当需要将业务回切至原生产站点时,执行计划性迁移,业务将自动迁移至原生产站点运行。

  5. 执行重保护

    为确保回切至原生产站点的业务在发生计划内或计划外事件时,能够在灾备站点上进行恢复,则需要再次执行重保护,确保业务被正常保护。

对于保护对象类型为“FusionCompute虚拟机”(非OpenStack架构)的恢复计划,当成功执行故障恢复后,可以通过导出配置文件,查看执行故障恢复前和执行故障恢复后的FusionCompute虚拟机的资源映射等信息。导出配置文件的操作步骤如下:

  1. 选择成功执行故障恢复操作的恢复计划,单击下方的“保护对象”页签。
  2. 单击“导出”,将配置文档导出到本地保存。

版权所有 © 华为技术有限公司