1   检查前排查

操作步骤

  1. 检查阵列版本是否为V300R002C10,或低于V300R001C20/ V100R001C30/ V200R002C20

· => 2

· => 3

  1. 检查阵列映射视图中是否存在端口组。

· => 该映射视图下的Host需要登录主机进行检查

· => 参考“前端冗余路径检查B”进行检查

  1. 阵列版本是否高于V3R6C20

· => 参考“前端冗余路径检查B”进行检查

· => 参考“前端冗余路径检查A”进行检查

2   前端冗余路径检查A

操作步骤

1.登录“DeviceManager > 资源分配 > 主机”页面,遍历所有主机,检查主机是否存在映射的LUN

 说明:

以上图为例说明主机Host001存在映射LUN

 

2.点击该主机下“启动器”,观察该主机下是否存在状态为在线的启动器

 说明:

以上图为例说明主机Host001上存在3个在线启动器。

 

3.登录“DeviceManager > 资源分配 > 映射视图”页面,找到该主机对应的映射视图,判断该映射视图下是否存在端口组。

 

 说明:

以上图为例说明主机Host001对应映射视图MappingView003,该映射视图下存在端口组PortGroup001,有4个已连接端口。

 

4.进入“DeviceManager > 资源分配 > 端口”页面,遍历步骤3中查询出来的运行状态为已连接的端口,查询该端口下状态为在线的启动器。查询出来的启动器与步骤2中的进行对比,判断主机下的同一类型启动器对应的端口,是否满足同时包含控制AB或者AD或者BC或者CD

 说明:

以上图为例说明端口CTE0.A3.P0上查询出一个iSCSI类型的在线启动器。

5.进入“DeviceManager > 资源分配 > 端口”页面,遍历所有运行状态为已连接的端口,查询该端口下状态为在线的启动器。查询出来的启动器与步骤2中的进行对比,判断主机下的同一类型启动器对应的端口,是否满足同时包含控制AB或者AD或者BC或者CD

 说明:

以上图为例说明端口CTE0.A3.P0上查询出一个iSCSI类型的在线启动器。

 

3   前端冗余路径检查B

操作步骤

1.登录DeviceManager > 资源分配 > 主机页面,遍历所有主机,检查主机是否存在映射的LUN

 说明:

以上图为例说明主机Host001存在映射LUN

2.登录“DeviceManager > 资源分配 > 映射视图”页面,找到该主机对应的映射视图,判断该映射视图下是否存在端口组。

 

 说明:

以上图为例说明主机Host001对应映射视图MappingView003,该映射视图下存在端口组PortGroup001,有4个已连接端口。

3.进入“DeviceManager > 资源分配 > 主机”页面,点击该主机下“启动器”,观察该主机下是否存在状态为在线的启动器

 说明:

以上图为例说明主机Host001上存在3个在线启动器。

4.进入“DeviceManager > 资源分配 > 端口”页面,遍历步骤2中查询出来的运行状态为已连接的端口,查询该端口下状态为在线的启动器。查询出来的启动器与步骤3中的进行对比,判断该主机下同一类型启动器对应的端口,是否满足同时包含控制AB或者AD或者BC或者CD

 说明:

以上图为例说明端口CTE0.A3.P0上查询出一个iSCSI类型的在线启动器。

 

5.点击该主机下“路径信息”,观察该主机下路径是否满足以下条件:1.存在在线链路;2.同一启动器类型的在线链路,包含到控制器AB,或者AD,或者CB,或者CD的路径

 说明:

以上图为例说明主机Host001上存在4条在线链路。

 

4   检查不通过处理

操作步骤

1.  检查不通过的Host操作系统是否为惠普Unix,且组网存在iSCSI链路。

· => 登录主机手动排查链路冗余性,参考“主机多路径链路检查”

· => 2

2.  阵列当前版本是否为V300R002C10,或低于V300R001C20/V100R001C30/V200R002C20

· => 3

· => 5

3.  阵列上是否存在16G FC/SmartIO 接口卡。

· =>登录主机手动排查链路冗余性,参考“主机多路径链路检查”

· => 4

4.  检查不通过的Host下,hostlink数量是否为9条。

· =>登录主机手动排查链路冗余性,参考“主机多路径链路检查”

· => 5

5.  登录主机,对不冗余的主机进行冗余路径修复,参考主机兼容性评估修复案例。

 

5      主机多路径链路检查

本节介绍在升级前如何对主机多路径链路状态进行检查,确保不因为多路径软件问题导致升级过程中业务受到影响。

检查原因

存储设备在线升级,是采取按控制器分批升级的方式,默认是按控制器编号(如:0123,单引擎4控设备,分别对应控制器为0A0B0C0D)奇数偶数平面分两批升级。在每批控制器升级重启期间,需要确保其他控制器到主机有可用链路,才能确保主机IO不中断,所以,多路径到存储设备控制器间链路必须满足如下冗余条件才能进行在线升级:

1.         主机到控制器偶数平面(02468101214控,单引擎4控设备对应XAXC,单引擎双控设备,对应XA)间至少存在一条可用链路。

2.         主机到控制器奇数平面(13579111315控,单引擎4控设备对应XBXD,单引擎双控设备,对应XB)间至少存在一条可用链路。

以单引擎4控的存储设备,控制器编号为0A/0B/0C/0D举例:

l   如下组网方式可以满足在线升级:0A/0B,或0A/0D,或0B/0C,或0B/0D有链路,或者在此组网基础上,三个以上控制器有链路。

l   如下组网方式不满足在线升级:0A/0C,或0B/0D有链路但其他控制器均无链路,或者主机到所有控制器只有一条链路。

说明

1.     上述组网要求是满足在线升级的最低组网要求,为了提升在线升级期间的业务可靠性,强烈建议主机到每个控制器均有可用链路,或者至少满足主机到每个引擎的奇数偶数平面均有可用链路。

2.     为了确保映射到主机的每一个LUN都有冗余链路,本章介绍的冗余链路检查方法,是基于每一个映射到主机的LUN做的检查,如果映射到主机的LUN过多无法一一检查时,可以在确保主机到控制器链路冗余的前提下,随机选择部分LUN进行检查。

3.     本章介绍的冗余链路检查方法,只适用于华为UltraPath多路径和系统自带多路径软件,如果使用了第三方多路径软件,请参考第三方多路径软件链路检查方法,以及上述组网要求进行检查。

5.1      VMware ESX

本节介绍VMware ESX/ESXi的多路径冗余链路检查方法。

5.1.1        华为UltraPath多路径冗余链路检查方法

                                步骤 1      登录VMware ESX系统,执行esxcli upadm show version命令,检查回显中是否包含Software VersionDriver Version,如果是,如下图,说明已经安装了UltraPath多路径软件,请执行下一步,否则,请参照VMware自带多路径冗余链路检查方法检查。

 

                                步骤 2      执行esxcli upadm show vlun命令,查看Vlun ID字段,如下图。如果未查询到Vlun信息,说明UltraPath多路径未接管任何LUN,请参照VMware自带多路径冗余链路检查方法检查,否则,请执行下一步。

 

                                步骤 3      执行esxcli upadm show vlun -l < VLun ID >(多路径版本小于等于8.01.051),或esxcli upadm show vlun l < VLun ID > -t all(如果多路径版本号大于8.01.051)查看所有LUN路径信息,如下图。

 

 

                                步骤 4      查看vlun路径信息,检查是否奇数平面控制器(单引擎4控设备对应XBXD,单引擎双控设备,对应XB)存在Nomal的可用路径,偶数平面控制器(单引擎4控设备对应XAXC,单引擎双控设备,对应XA)存在Normal的可用路径,如下图所示,0A/0B均存在两条路径,满足在线升级要求。

 

----结束

5.1.2        VMware自带多路径冗余链路检查方法

                                步骤 1      执行命令esxcfg-mpath -b | grep E i "huawei|huasy|symantec|hs|eisoo|udsafe|marstor|sanm|anystor|sugon|netposa,查看是否存在华为磁盘,如下图,如果未查询到华为磁盘,检查通过,否则,请执行下一步。

图5-1 查看华为磁盘信息

 

                                步骤 2      执行esxcfg-mpath -b d DeviceName获取指定LUN的路径信息。获取命令回显最后一列信息(阵列控制器端口的WWN)。

 

说明

DeviceName2 中查询到的naa.xxx部分信息。

                                步骤 3      依次将每个WWPN转换为二进制,查看第53~56位值,换算为十进制后,数值即表示控制器ID,如下图表示1号控制器。

 

                                步骤 4      根据计算出的所有控制器ID,确认是否每个LUN的路径均满足到控制器偶数平面(02468101214)和奇数平面(13579111315)均存在至少一条可用路径的条件,如果满足,可以进行在线升级,否则不能进行在线升级。

----结束

5.2      Windows

本节介绍Windows主机多路径冗余链路检查方法。

5.2.1        华为UltraPath多路径冗余链路检查方法

                                步骤 1      打开CMD命令行界面,或者在PowerShell上执行cmd命令进入CMD界面,执行命令upadm show version,查看UltraPath多路径软件版本号,如下图。如果命令执行后无版本信息显示,或者命令执行提示命令不存在,说明未安装UltraPath多路径软件,检查通过。

 

                                步骤 2      如果多路径版本小于等于8.01.051,执行upadm show vlun,如果多路径版本大于8.01.051,执行upadm show vlun type=all,如下图,查看第一列VLun ID

 

                                步骤 3      执行upadm show vlun id=<Vlun ID>(多路径版本小于等于8.01.051),或upadm show vlun vlun id =< VLun ID > -t type=all(如果多路径版本号大于8.01.051)查看所有LUN路径信息。

                                步骤 4      查看vlun路径信息,检查是否奇数平面控制器(单引擎4控设备对应XBXD,单引擎双控设备,对应XB)存在Nomal的可用路径,偶数平面控制器(单引擎4控设备对应XAXC,单引擎双控设备,对应XA)存在Normal的可用路径。如果奇数和偶数平面控制均有可用链路,则可以进行在线升级,否则不能进行在线升级。

----结束

5.3      Linux

本节介绍Linux下检查主机多路径冗余链路的方法。

5.3.1        华为UltraPath多路径冗余链路检查方法

                                步骤 1      登录Linux主机,执行upadm show version查看UltraPath多路径软件版本号,如下图。

 

                                步骤 2      如果多路径软件版本小于等于5.01.017,执行命令upadm show array查询UltraPath管理的所有阵列信息,获取第一列“Array ID”值。如果多路径软件版本大于5.01.017,执行步骤6

 

                                步骤 3      根据获取的Array ID,执行命令“upadm show lun array=<Array ID>来查看所有Lun的路径信息,如下图。

 

                                步骤 4      观察上一步显示信息中的 Controller xx信息,比如“Controller 0A”和“Controller 0B”项,分别观察显示信息中的“NumLunObjects”项,如果数值大于0DevState状态为“OPTIMAL”,则表示该控制器上存在可用链路。

                                步骤 5      根据所有的可用链路,检查是否奇数平面控制器(单引擎4控设备对应XBXD,单引擎双控设备,对应XB)和偶数平面控制器(单引擎4控设备对应XAXC,单引擎双控设备,对应XA)均存在可用路径。如果奇数和偶数平面控制均有可用链路,则可以进行在线升级,否则不能进行在线升级。

                                步骤 6      如果多路径软件版本大于5.01.017,执行upadmin show vlun多路径版本小于等于8.01.051时)或upadmin show show vlun type=all(多路径版本大于8.01.051时)命令查询UltraPath for Linux管理的所有LUN信息,并获取第一列的“VLun ID”。

 

                                步骤 7      执行upadm show vlun id=<Vlun ID>(多路径版本小于等于8.01.051),或upadm show vlun vlun id =< VLun ID > -t type=all(如果多路径版本号大于8.01.051)查看所有LUN路径信息。

                                步骤 8      查看vlun路径信息,检查是否奇数平面控制器(单引擎4控设备对应XBXD,单引擎双控设备,对应XB)存在Nomal的可用路径,偶数平面控制器(单引擎4控设备对应XAXC,单引擎双控设备,对应XA)存在Normal的可用路径。如果奇数和偶数平面控制均有可用链路,则可以进行在线升级,否则不能进行在线升级。

----结束

5.3.2        Linux自带多路径冗余链路检查方法

                                步骤 1      执行lsscsi命令,根据回显第一列获取阵列上报的目标器端口编号,根据第三列判断是否存在华为存储映射的磁盘,如下图。

 

                                步骤 2      按第三列显示的信息,查看是否有来自华为存储设备映射的磁盘,以下类型属于华为存储设备磁盘(不区分大小写):huawei|huasy|symantec|hs|eisoo|udsafe|marstor|sanm|anystor|sugon|netposa,如果不存在华为设备磁盘,请跳过本节后续检查。

                                步骤 3      获取华为磁盘列表后,按第一列的前三位数字进行分类,如上图所示可分为4类,分别是0:0:00:0:11:0:01:0:1 ,分别表示存储上报的不同目标器的端口号。

                                步骤 4      执行cat /sys/class/fc_transport/targetX:X:X/port_name X:X:X为上一步获取的第一列前三位端口号,本例中分别为0:0:00:0:11:0:01:0:1)查询当前主机连接了哪些阵列控制器的目标器,查询的结果为16进制的端口名称(WWPN),如下图。

 

                                步骤 5      依次将每个端口名称(WWPN)转换为二进制,查看第53~56位值,换算为十进制后,数值即表示控制器ID,如下图所示,表示0号控制器。

 

                                步骤 6      根据计算出的所有控制器ID,确认是否每个LUN的路径均满足到控制器偶数平面(02468101214)和奇数平面(13579111315)均存在至少一条可用路径的条件,如果满足,可以进行在线升级,否则不能进行在线升级。

----结束

5.4      Solaris

本节介绍Solaris操作系统下多路径冗余链路检查方法。

5.4.1        华为UltraPath多路径冗余链路检查方法

                                步骤 1      登录Linux主机,执行upadm show version查看UltraPath多路径软件版本号,如下图。

 

                                步骤 2      执行命令upadm show vlun(多路径版本小于等于8.01.051时)upadm show vlun type=all(多路径版本大于8.01.051时)查询UltraPath管理的所有vlun信息,获取第一列的“VLun ID”,如下图。

 

说明

如果查询显示“can't find any vlun”,说明UltraPath未管理任何华为磁盘,请跳过本节检查。

                                步骤 3      执行upadm show vlun id=<VLun ID>(多路径版本小于等于8.01.051时)或upadm show vlun id=<VLun ID>  type=all(多路径版本大于8.01.051时)查看所有LUN的路径信息,如下图。

 

                                步骤 4      查看vlun路径信息,检查是否奇数平面控制器(单引擎4控设备对应XBXD,单引擎双控设备,对应XB)存在Nomal的可用路径,偶数平面控制器(单引擎4控设备对应XAXC,单引擎双控设备,对应XA)存在Normal的可用路径。如果奇数和偶数平面控制均有可用链路,则可以进行在线升级,否则不能进行在线升级。

----结束

5.4.2        Solaris自带多路径冗余链路检查方法

                                步骤 1      执行mpathadm list lu|grep rdsk命令获取 STMS管理的磁盘,如下图0

 

说明

如果命令回显为空,说明无STMS管理的磁盘,请跳过本节后续检查。

                                步骤 2      对每个STMS磁盘, 执行mpathadm show lu /dev/rdsk/XXXX 命令,查看Vendor字段是否华为磁盘,如下图。

 

说明

1.     Vendor字段为以下字段之一(不区分大小写),说明是华为磁盘,否则不是华为磁盘:huawei|huasy|symantec|hs|eisoo|udsafe|marstor|sanm|anystor|sugon|netposa

2.     如果所有盘都不是华为磁盘,请跳过本节后续检查。

                                步骤 3      查看Paths下面的每个Target Port Name,依次将每个端口名称(WWPN)转换为二进制,查看第53~56位值,换算为十进制后,数值即表示控制器ID,如下图所示,表示0号控制器。

 

                                步骤 4      根据计算出的所有控制器ID,确认是否每个LUN的路径均满足到控制器偶数平面(02468101214)和奇数平面(13579111315)均存在至少一条可用路径的条件,如果满足,可以进行在线升级,否则不能进行在线升级。

----结束

5.5      HP_UX

本节介绍HP_UX系统多路径冗余链路检查方法。华为UltraPath多路径暂不支持HP_UX,只介绍HP_UX自带多路径检查方法。

5.5.1        HP_UX 11i V1/V2 PVlinks多路径冗余链路检查方法

                                步骤 1      登陆主机执行命令uname a,如#ZH-CN_TOPIC_0115692720/fig1326310599301,其中标红处为系统版本号,B.11.11对应HP-UX 11i v1B.11.23对应HP-UX 11i v2B.11.31对应HP-UX 11i v3

 

                                步骤 2      如果版本号为HP-UX 11i v1/v2,即B.11.11或者B.11.23,请执行下一步,否则请跳过本节后续步骤。

                                步骤 3      执行命令ioscan -fnC fc 获取当前HP-UXHBA卡的H/W Path列表,如下图。

 

                                步骤 4      执行命令ioscan -funC disk获取当前映射的disk device列表,获取H/W Path与上一步获取的H/W Path一致且Description包含HUAWEIdevice信息,例如:/dev/dsk/c23t0d2,如下图。

 

                                步骤 5      上一步获取到device信息后,执行命令pvdisplay xxx| grep 'PV Name',其中xxx表示上一步获取的device名称,如/dev/dsk/c23t0d2,如果命令执行结果包含“Alternate Link“,则说明该disk无冗余链路,无需再进一步进行后续检查。

 

                                步骤 6      根据步骤3获取到的所有Driver信息,依次执行fcmsutil /dev/xxx get remote all | grep 'Target Port Word Wide Name'命令,其中xxx即表示Driver名称,查询该端口连接的阵列目标器信息,如下图。

 

                                步骤 7      查看每个Target Port World Wide Name,依次将每个端口名称(WWN)转换为二进制,查看第53~56位值,换算为十进制后,数值即表示控制器ID,如下图所示,表示0号控制器。

 

                                步骤 8      根据计算出的所有控制器ID,确认是否每个LUN的路径均满足到控制器偶数平面(02468101214)和奇数平面(13579111315)均存在至少一条可用路径的条件,如果满足,可以进行在线升级,否则不能进行在线升级。

----结束

5.5.2        HP_UX 11i V3 NMP多路径冗余链路检查方法

                                步骤 1      登陆主机执行命令uname a,如下图,其中标红处为系统版本号,B.11.11对应HP-UX 11i v1B.11.23对应HP-UX 11i v2B.11.31对应HP-UX 11i v3

 

                                步骤 2      如果是HP-UX 11i v3,即B.11.31,执行scsimgr get_attr a leg_mpath_enable命令,查询是否安装且启用了NMP多路径软件,如下图,如果currentdefault均为true,表示已安装并启用了NMP,继续后续检查,否则结束检查。

 

                                步骤 3      执行ioscan -funNC disk命令,获取主机上的所有磁盘信息,根据DescriptionS/W State字段获取到华为且CLAIMED的磁盘,如下图。

 

说明

1.     Description字段为以下字段之一(不区分大小写),说明是华为磁盘,否则不是华为磁盘:huawei|huasy|symantec|hs|eisoo|udsafe|marstor|sanm|anystor|sugon|netposa

2.     如果所有盘都不是华为磁盘,请跳过本节后续检查。

                                步骤 4      执行ioscan -P health | grep lunpath命令,获取所有onlineLUN wwpn,如下图。

 

                                步骤 5      执行scsimgr lun_map -D xxx命令(其中xxx为步骤3获取到的华为CLAIMED的磁盘),获取磁盘路径信息,如下图。

 

                                步骤 6      查看每个LUN path,依次将每个StateLast Open or Close stateACTIVEpath信息中对应的Hardware path下的WWN转换为二进制,查看第53~56位值,换算为十进制后,数值即表示控制器ID,如下图所示,表示0号控制器。

 

                                步骤 7      根据计算出的所有控制器ID,确认是否每个LUN的路径均满足到控制器偶数平面(02468101214)和奇数平面(13579111315)均存在至少一条可用路径的条件,如果满足,可以进行在线升级,否则不能进行在线升级。

----结束

5.6      AIX

本节介绍AIX系统下多路径冗余链路的检查方法。AIX系统下,华为UltraPath多路径和系统自带多路径检查方法相同。

                                步骤 1      在主机侧执行 lsdev -Cc disk | grep FC,获取主机侧接管的所有磁盘 hdiskx,如下图。

 

说明

如果未查询到任何磁盘,则检查通过,无需再继续检查。

                                步骤 2      执行 lscfg vpl hdisk1(此处以hdisk1为例),逐个获取磁盘信息,并通过Manufacturer字段判断是否为华为磁盘,并记录其中的华为磁盘信息,如下图。

 

说明

1.     Manufacturer字段为以下字段之一(不区分大小写),说明是华为磁盘,否则不是华为磁盘:huawei|huasy|symantec|hs|eisoo|udsafe|marstor|sanm|anystor|sugon|netposa

2.     如果所有盘都不是华为磁盘,请跳过本节后续检查。

                                步骤 3      对每个华为磁盘,执行lspath -F"name:parent:connection:path_id:status" -l hdisk1(此处以hdisk1为例)获取其路径信息,如下图。

 

                                步骤 4      依次将每个路径状态为Enabled的端口名称(WWN)转换为二进制,查看第53~56位值,换算为十进制后,数值即表示控制器ID,如下图所示,表示0号控制器。

 

                                步骤 5      根据计算出的所有控制器ID,确认是否每个LUN的路径均满足到控制器偶数平面(02468101214)和奇数平面(13579111315)均存在至少一条可用路径的条件,如果满足,可以进行在线升级,否则不能进行在线升级。

----结束