创建路径策略

路径策略是路径与集群间的映射关系,通过创建路径策略,一条路径上的所有操作请求都将被网关集群转发至指定集群中执行。

前提条件

背景信息

操作步骤

  1. 选择“资源 > 资源 > 命名空间”。
  2. 在左上方的“帐户”下拉框中选择命名空间所属的帐户。
  3. 单击命名空间名称,进入详情页面。选择“智能纳管 > 路径策略”页签。
  4. 单击“创建”。

    系统右侧弹出“创建路径策略”页面。

  5. 设置路径策略,具体参数说明参见表1

    表1 路径策略参数说明

    参数名称

    参数说明

    路径

    代表需要转发的HDFS的路径。此参数格式只支持绝对路径格式,以及绝对路径的最后一级目录为POSIX的ERE语法正则表达式的格式,例如需要/home目录下的所有子目录和文件写在指定集群,则配置/home/.*。

    集群名称

    路径的转发目标集群,表示与路径形成映射的被纳管集群。

    说明:

    智能纳管模式为“网关联邦”和“本地联邦”时才显示该参数。

    均衡策略

    选择路径的均衡策略,均衡策略决定了当一个路径挂载在多个集群时,如何选择集群创建文件的问题,即从多个集群中,按照一定的算法选取出一个集群进行操作。详细的策略说明参见表2

    说明:

    智能纳管模式为“网关联邦”和“本地联邦”时才显示该参数。

    均衡因子

    通过设置均衡因子,以一定的概率尝试往剩余容量大的集群写入更多的文件。

    说明:
    • 只有在智能纳管模式为“网关联邦”和“本地联邦”时,且“均衡策略”为“SPACE”时,才需要设置。
    • 取值范围是[0, 100],默认为60。

    故障容错

    当集群列表中的一个或者多个集群出现故障的情况下,是否切换到集群列表中其他非故障集群继续执行业务。

    说明:

    智能纳管模式为“网关联邦”和“本地联邦”时才显示该参数。

    表2 均衡策略参数说明

    均衡策略

    说明

    HASH

    在路径策略配置多个集群的情况下,路径策略路径的第一级子目录路径名决定该目录下文件的分布集群,相同第一级子目录下的所有子文件分布在同一集群;路径策略路径的第一级子文件由路径名决定该文件的分布集群。

    该模式适合拥有相同父目录的文件分布在相同集群的场景。

    示例:

    当路径策略如下:

    path=/dir01/.*

    cluster_name_list=cluster1,cluster2,cluster3

    order=HASH

    根据哈希算法,/dir01/dir02/dir_test路径下的所有文件及其子目录下文件都会创建在cluster1存储集群上;

    根据哈希算法,/dir01/dir02/dir03路径下的所有文件及其子目录下文件都会创建在cluster3存储集群上;

    文件/dir01/testfile会按照算法创建在cluster2集群上。

    HASH_ALL

    在路径策略配置多个集群的情况下,文件会按路径分布到各个集群上,对于全路径相似的文件,将相对集中的分布在固定的集群。

    请注意,当大量全路径相似的文件集中创建在同一个集群时,可能会带来性能下降的问题。

    该模式适合有规律路径的文件需要相对集中分布的场景。

    示例:

    当路径策略如下:

    path=/dir01/.*

    cluster_name_list=cluster1,cluster2,cluster3

    order=HASH_ALL

    根据哈希算法,文件/dir01/dir02/dir03/a1到文件/dir01/dir02/dir03/a10000一共一万个文件中,由于全路径相似度高,绝大部分文件都创建在cluster3存储集群上;

    如果全路径相似度低,文件会相对均匀地分布在三个集群上。

    RANDOM

    在路径策略配置多个集群的情况下,网关集群会随机均匀地将文件写入各个集群。

    该模式适合需要将文件按数量均匀分布到各个集群的场景。

    示例:

    当路径策略如下:

    path=/dir01/.*

    cluster_name_list=cluster1,cluster2,cluster3

    order=RANDOM

    文件/dir01/dir02/dir03/a1到文件/dir01/dir02/dir03/a10000一共一万个文件会相对均匀地分布在三个集群上。

    SPACE

    在路径策略配置多个集群的情况下,网关集群按照一定的概率(可配置均衡因子,取值范围是[0-100],表示概率的百分比),尝试往剩余容量大的集群写入更多的文件。

    均衡因子等于100,则文件写入当前剩余容量最大的集群;

    均衡因子等于0,则文件写入当前剩余容量最小的集群;

    均衡因子为(0, 100),则以均衡因子作为概率,往剩余容量最大的集群写文件。

    该模式适合均衡集群容量的场景。

    请注意,在均衡因子较大的情况下,网关集群会将大部分业务发送到容量最大的集群,可能导致该集群压力过大,从而带来业务受损等问题。

    当路径策略如下:

    path=/dir01/.*

    cluster_name_list=cluster1,cluster2,cluster3

    order=SPACE

    balanced_factor=60

    文件/dir01/dir02/dir03/a1到文件/dir01/dir02/dir03/a10000一共一万个文件,大概60%的文件会创建在剩余容量最大的存储集群cluster1上;剩下文件中大概60%的文件会创建在剩余容量第二大的存储集群cluster3上;余下的文件会创建在cluster2存储集群上。

    WRITE_FIRST

    在路径策略配置多个集群的情况下,网关集群会固定地将文件写入路径策略集群列表中第一个集群。

    该模式适合需要多读单写,文件写入固定集群的场景。

    当路径策略如下:

    path=/dir01/.*

    cluster_name_list=cluster1,cluster2,cluster3

    order=WRITE_FIRST

    /dir01路径下的所有文件都会创建在cluster_name_list参数中排第一的cluster1存储集群上。

  6. 单击“确定”。