双活数据中心故障迁移到异地灾备中心

当双活数据中心的数据或应用由于灾难或故障不能正常使用时执行故障恢复,快速在异地灾备中心启动业务。

前提条件

背景信息

故障恢复可以在双活数据中心的数据或应用非正常停止时,快速在异地灾备中心启动业务。故障迁移前阵列间的复制关系如图1所示。

图1 故障迁移前阵列间复制状态

操作步骤

  1. 登录异地灾备中心eReplication系统。
  2. 恢复前配置。

    • 当保护对象类型为FusionCompute虚拟机时,请执行以下配置:
      • 在未配置虚拟机恢复IP地址时,故障恢复的虚拟机IP地址与生产端相同,如果需要为进行计划性迁移的虚拟机配置不同的IP地址,可以在恢复计划“保护对象”页签下进行配置。具体配置方法请参见自定义保护对象启动参数
      • 如果对受保护虚拟机执行了增加或减少磁盘操作,请刷新受保护虚拟机信息,并及时手动执行受保护虚拟机所在的保护组。
    • 当保护对象类型为VMware虚拟机时,请执行以下配置:
      • 在未配置虚拟机恢复IP地址时,故障恢复的虚拟机IP地址与生产端相同,如果需要为进行故障恢复的虚拟机配置不同的IP地址,可以在恢复计划“保护对象”页签下进行配置。具体配置方法请参见自定义保护对象启动参数
      • 对于双活(NAS)+异步复制(NAS)场景,用户需要在灾备端阵列Device Manager上创建共享并配置权限,权限需要与生产中心保持一致。

      若没有成功创建共享,配置权限,将会导致故障迁移失败。

  3. 执行故障恢复。

    如果灾备主机(Linux操作系统)安装了华为多路径软件,请确认多路径软件设置的I/O悬挂时间不为“0”,且该灾备主机上由多路径软件所产生的虚拟设备均存在所对应的物理设备。更多详细信息请参见对应版本的《OceanStor UltraPath for Linux xxx 用户指南》。

    1. 在菜单栏上,单击“数据利用 > 数据恢复”。
    2. 选择需要故障恢复的恢复计划,在“操作”区域单击“更多 > 故障恢复”。
    3. 根据不同的保护对象类型,执行故障恢复。
      • 当保护对象类型为“Oracle”、“IBM DB2”、“Microsoft SQL Server”时,请执行:
        1. 选择灾备站点
        2. 选择“可用灾备恢复主机或主机组”。
        • 当灾备站点使用的存储阵列为T系列V2及以后的版本时,此处选择的待恢复的主机在存储阵列上只能归属于一个主机组,且该主机组只能归属于同一个映射视图。同时,受保护的应用使用的存储LUN,其对应的远程复制从LUN,只能归属于同一个LUN组,且该LUN组与该主机组必须归属于同一个映射视图中。如果使用的存储阵列为T系列V2R2版本,创建映射视图后,需要修改映射视图的属性,取消勾选“为主机启用带内命令”。
        • 对于T系列V2R2及其更高版本、18000系列存储,提供了自动添加主机与存储映射的功能,只需要保证存储与主机的启动器连接正常,系统会自动在存储上创建对应的主机、主机组、LUN组和映射视图,创建原则如下:

        1. 单击“故障恢复”。
        2. 在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果”。
        3. 单击“确定”。
      • 当保护对象类型为“VMware虚拟机”时,请执行:
        1. 选择恢复集群。

          虚拟机将在恢复集群中恢复。需要选择“灾备站点”、“灾备vCenter”和“灾备集群”信息。

          首次选择恢复网络时,需要设置恢复集群信息。

        1. 选择恢复网络。

          虚拟机恢复后,可以通过该恢复网络访问虚拟机。

          • 如果“生产资源”和“灾备资源”未配对,请选中“生产资源”和“灾备资源”后,单击“添加到映射视图”进行配对。
          • 如果勾选“保持MAC地址不变”,系统将检查生产虚拟机与灾备vCenter中所有虚拟机的MAC地址是否冲突如果不冲突,系统将保持灾备vCenter中虚拟机的MAC地址不变否则,恢复任务将会执行失败。
          • 如果不勾选“保持MAC地址不变”,且挂载后的虚拟机处于关机状态,vCenter上挂载的虚拟机显示的MAC地址保持不变。直到虚拟机开机后,vCenter会自动给虚拟机分配MAC地址。
        1. 访问设置。

          输入“逻辑端口IP地址”,恢复集群中的主机可以通过该端口访问灾备端文件系统。

          对于双活(NAS)+异步复制(NAS)场景需要配置“访问设置”。

        1. 选择恢复时需要关闭的非重要虚拟机。

          在“可用虚拟机”列表中,选择需要关闭的非重要的虚拟机,以释放计算资源。

        2. 单击“故障恢复”。
      • 当保护对象类型为“FusionCompute虚拟机”、“NAS文件系统”时,在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果。”单击“确定”。

  4. 在灾备中心检查应用启动情况。

    待故障恢复完成后,检查应用和数据是否正常,如果应用或数据出现异常,请联系华为技术支持工程师。

    • 检查应用启动分为以下两种情况。
    • 对于基于应用的保护策略,请检查应用启动是否成功并能正常进行数据读写操作。
    • 对于基于LUN的保护策略,请登录灾备端应用主机,先扫描磁盘并启动应用,检查应用启动是否成功并能正常进行数据读写操作。

    您也可通过自行开发和部署脚本实现扫描磁盘、启动应用和测试应用的操作。

操作结果

故障恢复后,阵列间复制关系如图2所示。

图2 故障迁移后阵列间复制状态


版权所有 © 华为技术有限公司