重启单个控制器指导

操作步骤

  1. 使用admin用户登录存储系统CLI界面。
  2. 复位前检查计划复位的节点是否满足复位的5个条件。
    1. 整个集群状态正常,整个集群系统不处于上电、下电等状态。

      1. 执行change user_mode current_mode user_mode=developer命令进入developer模式。
      2. 执行debug命令进入diagnose模式。
      3. 执行sys showflowstatus命令查看当前系统的状态。



        其中“FlowClusterServiceStaus”“Normal”表示集群状态正常时才能进行单节点复拉操作。

    2. 主机多路径同时连接到集群内的其它控制器。通过如下两种方法中的一种检查多路径信息。

      • 方法一:观察客户主机是否有两条以上的物理通道连接到阵列的不同节点上。
      • 方法二:通过查询系统告警、事件是否存在主机到阵列没有冗余路径的告警,告警ID为“F00150019ULL”,如存在此告警信息,则表示主机到阵列没有冗余路径,不能执行单节点复位操作。

    3. 引擎内控制器同时连接到磁盘阵列中所有硬盘(所有在位的成员盘以及前4盘中的一块)。

      在DeviceManage中查看硬盘的多路径状态。

      其中“多路径”“A,B”表示硬盘分别连接到控制器A和控制器B。

    4. 引擎内控制器节点状态为正常工作状态。

      1. 执行change user_mode current_mode user_mode=developer命令进入developer模式。
      2. 执行debug命令进入diagnose模式。
      3. 执行sys showflowstatus命令查看当前系统的状态。



        其中“FlowNodeServiceStaus(id X)”“Normal”表示节点X状态为正常工作状态。

    5. 控制器B当前容量能接纳控制器A业务压力。

      1. 执行change user_mode current_mode user_mode=developer命令进入developer模式。
      2. 执行debug命令进入diagnose模式。
      3. 执行ioperf iobandwidth 5命令查看当前控制器前端压力是否小于80%。



        返回值为“True”则表示当前控制器前端压力是否小于80%。

  3. 检查项都通过后,复位节点。
    1. 执行change user_mode current_mode user_mode=developer命令进入developer模式。
    2. 执行reboot controller命令复位单个节点,通过参数controller指定复位的节点ID。
  4. 节点复位后确认节点上电成功,能正常接管业务。
    1. 执行change user_mode current_mode user_mode=developer命令进入developer模式。
    2. 执行debug命令进入diagnose模式。
    3. 执行sys showflowstatus命令查看当前系统的状态。



      其中“FlowNodeServiceStaus(id X)”“Normal”表示表示节点X状态为正常工作状态,能够接管业务。

  5. 重复执行234依次复位检查不通过的其它控制器节点。