灾备中心容灾测试

介绍在同城或异地灾备中心执行容灾数据测试的方法。通过灾备端快照映射的方式实现容灾测试,验证复制到灾备中心的数据的可用性或快照的可用性。测试过程不会对生产站点造成任何影响。待测试完成后,需清理灾备端的演练数据,还原至容灾演练前资源状态,以便后续执行计划性迁移或故障恢复。

前提条件

背景信息

灾备中心数据测试用于验证灾备端数据的可用性。

在容灾测试中,灾备端快照映射只支持映射给启动器模式,不支持添加端口映射模式。

操作步骤

  1. 依次登录FC交换机,检查各个FC端口(FC Ports)的信息并计算误码率。若误码率大于0.1%,则请检查链路排除链路故障。

    误码率=Total Errors/(In Bytes+Out Bytes)*100%

    误码率高可能导致远程复制无法在设定的窗口完成或者远程复制异常断开。

  2. 登录同城或异地灾备中心容灾管理服务器eReplication。
  3. 测试恢复计划。

    1. 在菜单栏上,单击“数据利用 > 数据恢复”。
    2. 选择需要测试的恢复计划,在“操作”区域单击“测试”。
    3. 根据保护对象类型,分别执行操作。

      如果灾备主机(Linux操作系统)安装了华为多路径软件,请确认多路径软件设置的I/O悬挂时间不为“0”,且该灾备主机上由多路径软件所产生的虚拟设备均存在所对应的物理设备。更多详细信息请参见对应版本的《OceanStor UltraPath for Linux xxx 用户指南》。

      • 当保护对象类型为“LUN”、“本地文件系统”、“Oracle”、“IBM DB2”、“Microsoft SQL Server”、“Microsoft Exchange Server”、“SAP HANA”时,请执行:
        1. 选择“灾备站点”。
        2. 选择“可用灾备恢复主机或主机组”(对于保护对象类型为“LUN”时,该操作可选)。
          • 当灾备站点使用的存储阵列为T系列V2及以后的版本时,此处选择的待恢复的主机在存储阵列上只能归属于一个主机组,且该主机组只能归属于同一个映射视图。同时,受保护的应用使用的存储LUN,其对应的远程复制从LUN,只能归属于同一个LUN组,且该LUN组与该主机组必须归属于同一个映射视图中。如果使用的存储阵列为T系列V2R2版本,创建映射视图后,需要修改映射视图的属性,取消勾选“为主机启用带内命令”。
          • 对于T系列V2R2及其更高版本、18000系列存储,提供了自动添加主机与存储映射的功能,只需要保证存储与主机的启动器连接正常,系统会自动在存储上创建对应的主机、主机组、LUN组和映射视图,创建原则如下:

        1. 单击“测试”。
        2. 在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果。”单击“确定”。
      • 当保护对象类型为“VMware虚拟机”时,请执行:
        1. 选择测试集群信息。
          虚拟机将在测试集群中恢复。需要选择“测试站点”、“测试vCenter”和“测试集群”信息。

          首次选择测试网络时,需要设置测试集群信息。

        1. 选择测试网络。

          测试网络默认为资源映射对应的网络,如果不使用此网络,可根据需要或规划选择其他的网络。

          • 如果“生产资源”和“灾备资源”未配对,请选中“生产资源”和“灾备资源”后,单击“添加到映射视图”进行配对。
          • 进行容灾测试时,请勿勾选“保持MAC地址不变”,否则会导致生产虚拟机和容灾虚拟机MAC地址冲突且IP地址无法ping通。
        1. 选择非重要虚拟机。

          在“可用虚拟机”列表中,选择需要关闭的非重要的虚拟机,以释放计算资源。

        2. 单击“测试”。
        3. 在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果。”
        4. 单击“确定”。
      • 当保护对象类型为“FusionCompute虚拟机”时,请执行:
        1. 选择测试集群信息。

          虚拟机将在测试集群中恢复。需要选择“测试站点”信息。

          首次选择测试网络时,需要设置测试集群信息。

        1. 选择测试网络。

          测试网络默认为资源映射对应的网络,如果不使用此网络,可根据需要或规划选择其他的网络。

        2. 选择可用上电主机。

          可用上电主机将为恢复虚拟机提供资源。

        3. 选择非重要虚拟机。

          在“可用虚拟机”列表中,选择需要关闭的非重要的虚拟机,以释放计算资源。

        4. 单击“测试”。
        5. 在弹出的“警告”对话框中仔细阅读提示内容后,勾选“我已阅读上述信息,了解执行此操作带来的后果。”
        6. 单击“确定”。

  4. 测试完成后,请在灾备端检查应用启动情况。

    待测试完成后,请检查应用启动是否成功并能正常进行数据读写操作。如果应用出现启动异常或不能进行数据读写操作,请联系华为技术支持工程师。

    • 对于基于应用的保护策略,请检查应用启动是否成功并能正常进行数据读写操作。
    • 对于基于LUN的保护策略,您需要登录灾备端应用主机,先扫描磁盘并启动应用,检查应用启动是否成功并能正常进行数据读写操作。

    您也可通过自行开发和部署脚本实现扫描磁盘、启动应用和测试应用的操作。

    • 容灾测试后,当保护对象类型为“VMware虚拟机”时,在测试vCenter中注册的虚拟机名称规则为“保护的虚拟机名称_四位随机数_Drilling_恢复计划名称”。

  5. 清理灾备端的演练数据,还原至容灾演练前资源状态,以便后续执行计划性迁移或故障恢复。

    • 在Oracle应用中,Agent默认为关闭数据库但不关闭集群的状态,如果您需要关闭集群,请修改关闭集群配置,具体操作请参见修改关闭Oracle集群配置项。
    • 对于本地文件系统类型的保护组,进行清理前,请确保灾备端文件系统上的程序和文件已关闭。
    • 当生产端或灾备端存储、主机、虚拟机等设备上信息发生变更时,请手动刷新设备信息,变更项说明以及详细操作,请参见刷新保护组相关资源
    1. 选择需要清理数据的恢复计划,在“操作”区域单击“更多 > 清理”。
    2. 单击“确定”。


版权所有 © 华为技术有限公司