WO2021018183A1

WO2021018183A1 - 一种资源分配方法和资源借调方法

Info

Publication number: WO2021018183A1
Application number: PCT/CN2020/105476
Authority: WO
Inventors: 曾艳; 姜慧; 李继忠; 刘敏
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2019-07-31
Filing date: 2020-07-29
Publication date: 2021-02-04
Anticipated expiration: 2022-01-31
Also published as: EP4002115A1; CN112306651B; US20220156115A1; EP4002115A4; US12386671B2; CN112306651A

Abstract

一种资源分配方法，不会出现由于多个忙集群向同一个空闲集群并发借调资源而导致的借调冲突。其中，资源分配方法包括：第一节点确定第一集群对应的哈希值；第一节点获取哈希环；第一节点建立第一集群和目标第二集群的关联关系（304），其中，与第一集群建立了关联关系的目标第二集群被允许从第一集群申请资源。

Description

一种资源分配方法和资源借调方法

本申请要求于2019年07月31日提交中国国家知识产权局、申请号为201910704756.7、发明名称为“一种资源分配方法和资源借调方法”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及分布式系统领域，尤其涉及一种资源分配方法和资源借调方法。

背景技术

随着人工智能(artificial intelligence，AI)和物联网(internet of things，IoT)的发展，许多新兴计算密集型和延迟敏感型终端应用，如虚拟现实(virtual reality，VR)、增强现实(augmented reality，AR)以及高清视频图片处理等正在迅速兴起，低延时、高带宽和强计算等应用需求日益增长。云计算技术受网络链路容量限制等因素影响，容易导致数据传输速率过慢以及响应延迟过高等问题，难以满足应用服务需求。利用靠近数据源的边缘设备进行计算以提高服务响应性能逐渐成为一种趋势。然而单个边缘设备算力小，仅使用单个边缘设备执行任务难以胜任大规模任务需求。因此，将多边缘设备的计算能力加以组合使用，通过多边缘设备资源共享互助，协同完成复杂任务的数据处理，从而可以有效保障服务质量。

设备间的资源互助场景主要分为两类，一类是层次化的异构设备的资源互助，如边缘设备和边缘服务器、中央云处理器之间不同运算能力设备的协同；另一类是同层设备间的资源协同，即当边缘设备资源不足时，可以向其他边缘设备借调资源。

现有技术中，当资源不足的忙集群需要向其他空闲集群借调资源时，需要忙集群中的主节点向随机选择的空闲集群发送资源查询请求，并在接收到返回后，再进行资源借调，在多个忙集群向同一个空闲集群并发借调资源时，会出现借调冲突的情况。

发明内容

本申请实施例提供了一种资源分配方法和资源借调方法，不会出现由于多个忙集群向同一个空闲集群并发借调资源而导致的借调冲突。

第一方面，本申请提供了一种资源分配方法，包括：

第一节点确定第一集群对应的哈希值；所述第一节点获取哈希环，所述哈希环包括至少一个哈希值区间，每个哈希值区间对应一个第二集群；所述第一节点根据所述第一集群对应的哈希值确定对应的目标第二集群，其中，所述第一集群对应的哈希值属于目标哈希区间，所述目标哈希区间为所述至少一个哈希值区间中的一个哈希值区间，所述目标哈希区间对应所述目标第二集群；所述第一节点建立第一集群和目标第二集群的关联关系，其中，与所述第一集群建立了关联关系的所述目标第二集群被允许从所述第一集群申请资源。且，由于资源借调的对应关系是基于将第一集群的哈希值在基于第二集群生成的哈希环上的对应关系确定的，该对应关系是唯一的，因此第一集群仅能被哈希环上对应的第二集群借调资源，因此，不会出现由于多个集群向同一个集群并发借调资源而导致的借调冲突。

这样，第一节点可以通过第一集群对应的哈希值在哈希环(根据第二集群对应的哈希值生成的)上的分布，来确定第一集群对应的目标第二集群，建立目标第二集群和第一集群的关联关系，由于基于一致性哈希算法的哈希环上的第一集群对应的哈希值和第二集群对应的哈希节点的分布是确定的，每个集群只允许被固定的集群借调，因此，当目标第二集群需要借调第一集群的空闲资源时，不需要随机向某个集群发送资源查询请求，并在接收到返回后，再进行资源借调，可以直接向特定的第一集群借调资源，减少了一次信息往返的时延开销。

在第一方面的一种可选设计中，第一集群为包含多个空闲节点的空闲集群，第二集群为包含多个忙节点的忙集群，其中空闲节点和忙节点是根据节点的负载来区分的，比如负载高于特定阈值的节点为忙节点，负载不高于特定阈值的节点为空闲节点。

在第一方面的一种可选设计中，第一集群为包含多个胖节点的胖集群，第二集群为包含多个瘦节点的瘦集群，其中胖节点和瘦节点是根据节点具有的资源或能力来区分的，比如资源受限或能力偏弱的节点为瘦节点，资源丰富，处理能力强节点为胖节点。在第一方面的一种可选设计中，所述哈希环包括第一哈希节点和第二哈希节点，所述第一哈希节点对应所述目标第二集群，所述第一哈希节点为所述哈希环上所述第二哈希节点的相邻后继节点，所述目标哈希区间为所述第一哈希节点的哈希值与所述第二哈希节点的哈希值之间的哈希区间。

在第一方面的一种可选设计中，所述方法还包括：所述第一节点对包括多个计算节点的空闲集群进行划分，得到多个子集群，所述第一集群为所述多个子集群中的一个。

在第一方面的一种可选设计中，所述多个子集群包括第三子集群和第四子集群，所述第三子集群为所述多个子集群中资源空闲量最大的子集群，所述第四子集群为所述多个子集群中资源空闲量最小的集群，所述第三子集群的资源空闲量与所述第四子集群的资源空闲量的差值的绝对值小于第一阈值。这样，第一节点可以对空闲集群的多个计算节点进行划分，以使得划分后得到的多个子集群中的各个第一集群之间的资源空闲量的差异不会过大。

在第一方面的一种可选设计中，所述多个子集群中的每个子集群的资源空闲量与预设资源空闲量的差值的绝对值小于或等于第二阈值，所述预设资源空闲量与历史资源请求量相关。这样，第一节点基于历史资源请求在对空闲集群的多个计算节点进行划分，使得划分后的每个子集群的空闲资源量接近于历史资源请求量。

在第一方面的一种可选设计中，所述多个子集群的数量与所述第二集群的数量小于第三阈值。

在第一方面的一种可选设计中，所述方法还包括：所述第一节点接收所述目标第二集群发送的第一资源借调请求，所述第一资源借调请求包括任务数据和第一集群的标识；所述第一节点根据所述第一集群的标识向所述第一集群发送所述任务数据。

在第一方面的一种可选设计中，所述方法还包括：所述第一节点接收所述目标第二集群发送的第一资源借调请求，所述第一资源借调请求包括任务数据；所述第一节点向所述第一集群发送所述任务数据。

在第一方面的一种可选设计中，所述第一节点向所述第一集群发送所述任务数据，包括：第一节点基于所述第一集群和目标第二集群的关联关系向所述第一集群发送所述任务数据。

在第一方面的一种可选设计中，所述哈希环包括Y个哈希节点，每个第二集群对应至少一个哈希节点，且所述Y个哈希节点的对应的哈希值和所述第一集群对应的哈希值为根据相同的哈希算法生成的，所述Y为正整数。这样，哈希环上的哈希节点的对应的哈希值和所述第一集群对应的哈希值基于相同的哈希算法生成，使得不会出现第一集群对应的哈希值与哈希环上的哈希节点重合的情况。

在第一方面的一种可选设计中，所述方法还包括：所述第一节点确定X个第二集群对应的Y个哈希值，其中，每个第二集群对应至少一个哈希值，所述X正整数，所述Y为大于或等于X的正整数；所述第一节点根据所述Y个哈希值生成所述哈希环，其中，所述哈希环包括Y个哈希节点，每个第二集群对应至少一个哈希节点，所述Y个哈希节点将所述哈希环划分为Y个哈希值区间，每个哈希节点对应一个哈希值区间。这样，第一节点可以自己生成哈希环。

在第一方面的一种可选设计中，所述方法还包括：所述第一节点接收所述第二集群发送的所述哈希环。

在第一方面的一种可选设计中，所述方法还包括：所述第一节点向所述目标第二集群发送所述第一集群的资源空闲量。

第二方面，本申请提供了一种资源借调方法，所述方法包括：第二节点确定与目标第二集群具有关联关系的第一集群，其中，所述第二节点属于所述目标第二集群，所述目标第二集群对应于哈希环中的目标哈希值区间，所述第一集群对应的哈希值属于所述目标哈希值区间；所述第二节点接收任务数据；所述第二节点向第一节点发送第一资源借调请求，所述第一借调请求用于指示所述第一节点将所述任务数据分配给所述第一集群处理。

这样，由于基于一致性哈希算法的哈希环上的第一集群对应的哈希值和第二集群对应的哈希节点的分布是确定的，每个空闲集群只允许被固定的空集群借调，因此，当目标第二集群需要借调第一集群的空闲资源时，不需要随机向选择的空闲集群发送资源查询请求，并在接收到返回后，再进行资源借调，可以直接向第一集群借调资源，减少了一次信息往返的时延开销。

在第二方面的一种可选设计中，所述方法还包括：所述第二节点基于向第一节点发送所述第一资源借调请求，确定所述第一集群处于资源不可借调状态。这样，第二节点向第一节点发送第一资源借调请求之后，相当于已经占用了第一集群的空闲资源，则可以确定第一集群处于资源不可借调状态。可选地，第二节点可以在映射表中标注第一集群的资源借调状态为资源不可借状态。相应的，第一节点也可以确定第一集群处于资源不可借调状态，即确定第一集群不能为其他忙集群提供可用资源，从而确保了资源锁定，实现了跨集群资源的无冲突调度。

在第二方面的一种可选设计中，与所述目标第二集群具有关联关系的集群有多个，所述第二节点确定与目标第二集群具有关联关系的第一集群，包括：所述第二节点确定与所述目标第二集群具有关联关系的多个集群中的一个集群为第一集群。

在第二方面的一种可选设计中，所述第二节点确定与所述目标第二集群具有关联关系的多个集群中的一个集群为第一集群，包括：所述第二节点确定与所述目标第二集群具有关联关系的多个集群的资源空闲量中，与所述任务数据的资源需求量差值最小的资源空闲量对应的集群为所述第一集群。这样，所述第二节点确定与所述目标第二集群具有关联关系的多个集群的资源空闲量中，与所述任务数据的资源需求量差值最小的资源空闲量对应的集群为所述第一集群，提高了资源借调时的资源利用率。

在第二方面的一种可选设计中，其特征在于，所述方法还包括：所述第二节点接收第三节点发送的所述任务数据的资源需求量；基于所述第一集群的资源空闲量大于或等于所述资源需求量，所述第二节点向所述第三节点发送所述第一集群的标识和第一集群的资源空闲量。

在第二方面的一种可选设计中，所述第二节点接收任务数据包括：所述第二节点接收所述第三节点发送的第二资源借调请求，所述第二资源借调请求包括所述任务数据，所述第二借调请求用于指示所述第二节点将所述任务数据分配给所述第一集群处理。

第三方面，本申请提供了一种资源借调方法，包括：第二节点接收第三节点发送的任务数据的资源需求量；所述第二节点确定与目标第二集群具有关联关系的第一集群，其中，所述第二节点属于所述目标第二集群，所述目标第二集群对应于哈希环中的目标哈希值区间，所述第一集群对应的哈希值属于所述目标哈希值区间；基于所述第一集群的资源空闲量大于或等于所述资源需求量，所述第二节点向所述第三节点发送第三资源借调请求，所述第三资源借调请求用于指示所述第三节点被允许从所述第一集群申请资源。

这样，第一节点可以通过第一集群对应的哈希值在哈希环(根据第二集群对应的哈希值生成的)上的分布，来确定第一集群对应的目标第二集群，建立目标第二集群和第一集群的关联关系，由于基于一致性哈希算法的哈希环上的第一集群对应的哈希值和第二集群对应的哈希节点的分布是确定的，每个空闲集群只允许被固定的空集群借调，因此，当第三节点需要向第二节点借调资源时，第二节点不需要随机向选择的空闲集群发送资源查询请求，并在接收到返回后，再进行资源借调，而是直接可以确定可以借调资源的第一集群，减少了一次信息往返的时延开销。

在第三方面的一种可选设计中，与所述目标第二集群具有关联关系的集群有多个，所述第二节点确定与目标第二集群具有关联关系的第一集群，包括：所述第二节点确定与所述目标第二集群具有关联关系的多个集群中的一个集群为第一集群。

第四方面，本申请提供了一种资源借调方法，包括：第三节点接收任务数据；所述第三节点向第二节点发送所述任务数据的资源需求量；所述第三节点接收所述第二节点发送的第三资源借调请求，所述第三资源借调请求用于指示所述第三节点被允许从第一集群申请资源，其中，所述第二节点属于目标第二集群，所述目标第二集群对应于哈希环中的目标哈希值区间，所述第一集群对应的哈希值属于所述目标哈希值区间，且所述第一集群的资源空闲量大于或等于所述资源需求量；所述第三节点向第一节点发送第一资源借调请求，所述第一借调请求用于指示所述第一节点将所述任务数据分配给所述第一集群处理。

这样，由于基于一致性哈希算法的哈希环上的第一集群对应的哈希值和第二集群对应的哈希节点的分布是确定的，且相对均衡，因此，当第三节点需要向第二节点借调资源时，第二节点不需要随机向选择的空闲集群发送资源查询请求，并在接收到返回后，再进行资源借调，而是直接可以确定可以借调资源的第一集群，减少了一次信息往返的时延开销。

在第四方面的一种可选设计中，所述第三节点向第二节点发送所述任务数据的资源需求量，包括：所述第三节点向多个节点发送所述任务数据的资源需求量，所述第二节点为所述多个节点中的一个；所述第三节点接收所述第二节点发送的第三资源借调请求，包括：所述第三节点接收所述多个节点发送的第三资源借调请求，所述第三资源借调请求用于指示所述第三节点被允许从多个子集群申请资源，所述第一集群为所述多个子集群中的一个。

在第四方面的一种可选设计中，所述方法还包括：所述第三节点确定所述多个子集群的资源空闲量中，与所述任务数据的资源需求量的差值最小的资源空闲量对应的子集群为所述第一集群。

第五方面，本申请提供了一种第一管理节点，所述第一管理节点包括：

处理模块，用于确定第一集群对应的哈希值；获取哈希环，所述哈希环包括至少一个哈希值区间，每个哈希值区间对应一个第二集群；根据所述第一集群对应的哈希值确定对应的目标第二集群，其中，所述第一集群对应的哈希值属于目标哈希区间，所述目标哈希区间为所述至少一个哈希值区间中的一个哈希值区间，所述目标哈希区间对应所述目标第二集群；

收发模块，用于建立第一集群和目标第二集群的关联关系，其中，与所述第一集群建立了关联关系的所述目标第二集群被允许从所述第一集群申请资源。

在第五方面的一种可选设计中，所述哈希环包括第一哈希节点和第二哈希节点，所述第一哈希节点对应所述目标第二集群，所述第一哈希节点为所述哈希环上所述第二哈希节点的相邻后继节点，所述目标哈希区间为所述第一哈希节点的哈希值与所述第二哈希节点的哈希值之间的哈希区间。

在第五方面的一种可选设计中，所述处理模块，还用于对包括多个计算节点的空闲集群进行划分，得到多个子集群，所述第一集群为所述多个子集群中的一个。

在第五方面的一种可选设计中，所述多个子集群包括第三子集群和第四子集群，所述第三子集群为所述多个子集群中资源空闲量最大的子集群，所述第四子集群为所述多个子集群中资源空闲量最小的集群，所述第三子集群的资源空闲量与所述第四子集群的资源空闲量的差值的绝对值小于第一阈值。

在第五方面的一种可选设计中，所述多个子集群中的每个子集群的资源空闲量与预设资源空闲量的差值的绝对值小于或等于第二阈值，所述预设资源空闲量与历史资源请求量相关。

在第五方面的一种可选设计中，所述多个子集群的数量与所述第二集群的数量小于第三阈值。

在第五方面的一种可选设计中，所述收发模块还用于：

接收所述目标第二集群发送的第一资源借调请求，所述第一资源借调请求包括任务数据和第一集群的标识；

根据所述第一集群的标识向所述第一集群发送所述任务数据。

在第五方面的一种可选设计中，所述收发模块还用于：

接收所述目标第二集群发送的第一资源借调请求，所述第一资源借调请求包括任务数据，向所述第一集群发送所述任务数据。

在第五方面的一种可选设计中，所述收发模块具体用于：基于所述第一集群和目标第二集群的关联关系向所述第一集群发送所述任务数据。

在第五方面的一种可选设计中，所述哈希环包括Y个哈希节点，每个第二集群对应至少一个哈希节点，且所述Y个哈希节点的对应的哈希值和所述第一集群对应的哈希值为根据相同的哈希算法生成的，所述Y为正整数。

在第五方面的一种可选设计中，所述处理模块，还用于确定X个第二集群对应的Y个哈希值，其中，每个第二集群对应至少一个哈希值，所述X正整数，所述Y为大于或等于X的正整数；根据所述Y个哈希值生成所述哈希环，其中，所述哈希环包括Y个哈希节点，每个第二集群对应至少一个哈希节点，所述Y个哈希节点将所述哈希环划分为Y个哈希值区间，每个哈希节点对应一个哈希值区间。

在第五方面的一种可选设计中，所述收发模块，还用于接收所述第二集群发送的所述哈希环。

在第五方面的一种可选设计中，所述收发模块，还用于向所述目标第二集群发送所述第一集群的资源空闲量。

第六方面，本申请提供了一种第二管理节点，其特征在于，所述第二管理节点包括：

处理模块，用于确定与目标第二集群具有关联关系的第一集群，其中，所述第二节点属于所述目标第二集群，所述目标第二集群对应于哈希环中的目标哈希值区间，所述第一集群对应的哈希值属于所述目标哈希值区间；

收发模块，用于接收任务数据；并向第一节点发送第一资源借调请求，所述第一借调请求用于指示所述第一节点将所述任务数据分配给所述第一集群处理。

在第六方面的一种可选设计中，所述处理模块，还用于基于收发模块向第一节点发送资源借调请求，确定所述第一集群处于资源不可借调状态。

在第六方面的一种可选设计中，与所述目标第二集群具有关联关系的集群有多个，所述处理模块，具体用于确定与所述目标第二集群具有关联关系的多个集群中的一个集群为第一集群。

在第六方面的一种可选设计中，所述处理模块，具体用于确定与所述目标第二集群具有关联关系的多个集群的资源空闲量中，与所述任务数据的资源需求量差值最小的资源空闲量对应的集群为所述第一集群。

在第六方面的一种可选设计中，所述收发模块，还用于接收第三节点发送的所述任务数据的资源需求量，并基于所述第一集群的资源空闲量大于或等于所述资源需求量，向所述第三节点发送所述第一集群的标识和第一集群的资源空闲量。

在第六方面的一种可选设计中，所述收发模块，具体用于接收所述第三节点发送的第二资源借调请求，所述第二资源借调请求包括所述任务数据，所述第二借调请求用于指示所述第二节点将所述任务数据分配给所述第一集群处理。

第七方面，本申请提供了一种第二管理节点，其特征在于，所述第二管理节点包括：

收发模块，用于接收第三节点发送的任务数据的资源需求量；

所述收发模块，还用于基于所述第一集群的资源空闲量大于或等于所述资源需求量，向所述第三节点发送第三资源借调请求，所述第三资源借调请求用于指示所述第三节点被允许从所述第一集群申请资源。

在第七方面的一种可选设计中，与所述目标第二集群具有关联关系的集群有多个，所述处理模块，具体用于确定与所述目标第二集群具有关联关系的多个集群中的一个集群为第一集群。

第八方面，本申请提供了一种第三管理节点，其特征在于，所述第三管理节点包括：

收发模块，用于接收任务数据，向第二节点发送所述任务数据的资源需求量，接收所述第二节点发送的第三资源借调请求，所述第三资源借调请求用于指示所述第三节点被允许从第一集群申请资源，其中，所述第二节点属于目标第二集群，所述目标第二集群对应于哈希环中的目标哈希值区间，所述第一集群对应的哈希值属于所述目标哈希值区间，且所述第一集群的资源空闲量大于或等于所述资源需求量，向第一节点发送第一资源借调请求，所述第一借调请求用于指示所述第一节点将所述任务数据分配给所述第一集群处理。

在第八方面的一种可选设计中，所述收发模块，具体用于向多个节点发送所述任务数据的资源需求量，所述第二节点为所述多个节点中的一个，接收所述多个节点发送的第三资源借调请求，所述第三资源借调请求用于指示所述第三节点被允许从多个子集群申请资源，所述第一集群为所述多个子集群中的一个。

在第八方面的一种可选设计中，所述第三管理节点还包括：

处理模块，用于确定所述多个子集群的资源空闲量中，与所述任务数据的资源需求量的差值最小的资源空闲量对应的子集群为所述第一集群。

第九方面，本申请提供了一种集群，所述集群包括多个计算节点，所述计算节点为任务数据提供所需的资源以执行所述任务数据，以及，所述集群还包括：上述任一方面所述的第一管理节点。

第十方面，本申请提供了一种集群，所述集群包括多个计算节点，所述计算节点为任务数据提供所需的资源以执行所述任务数据，以及，所述集群还包括：上述任一方面所述的第二管理节点。

第十一方面，本申请提供了一种集群，所述集群包括多个计算节点，所述计算节点为任务数据提供所需的资源以执行所述任务数据，以及，所述集群还包括：上述任一方面所述的第三管理节点。

第十二方面，本申请提供了一种分布式系统，其特征在于，所述分布式系统包括上述第九方面描述的集群以及上述第十方面描述的集群。

第十三方面，本申请提供了一种分布式系统，其特征在于，所述分布式系统包括上述第九方面描述的集群、上述第十方面描述的集群以及上述第十一方面描述的集群。

第十四方面，本申请提供了一种计算机存储介质，用于储存为上述第一管理节点所用的计算机软件指令，其包含用于执行上述方面所设计的程序。

第十五方面，本申请提供了一种计算机存储介质，用于储存为上述第二管理节点所用的计算机软件指令，其包含用于执行上述方面所设计的程序。

第十六方面，本申请提供了一种计算机存储介质，用于储存为上述第三管理节点所用的计算机软件指令，其包含用于执行上述方面所设计的程序。

本申请实施例中，第一节点确定第一集群对应的哈希值；第一节点获取哈希环，哈希环包括至少一个哈希值区间，每个哈希值区间对应一个第二集群；第一节点根据第一集群对应的哈希值确定对应的目标第二集群，其中，第一集群对应的哈希值属于目标哈希区间，目标哈希区间为至少一个哈希值区间中的一个哈希值区间，目标哈希区间对应目标第二集群；第一节点建立第一集群和目标第二集群的关联关系，其中，与所述第一集群建立了关联关系的所述目标第二集群被允许从所述第一集群申请资源。通过上述方式，第一节点可以通过第一集群对应的哈希值在哈希环(根据第二集群对应的哈希值生成的)上的分布，来确定第一集群对应的目标第二集群，建立目标第二集群和第一集群的关联关系，由于基于一致性哈希算法的哈希环上的第一集群对应的哈希值和第二集群对应的哈希节点的分布是确定的，每个空闲集群只允许被固定的空集群借调，因此，当目标第二集群需要借调第一集群的空闲资源时，不需要随机向选择的空闲集群发送资源查询请求，并在接收到返回后，再进行资源借调，可以直接向第一集群借调资源，减少了一次信息往返的时延开销。

附图说明

图1为一种一层架构的中心化分布式系统架构示意图；

图2为一种资源借调场景的架构示意图；

图3a为本申请实施例提供的一种资源分配方法的实施例的示意图；

图3b为一种集群闲忙状态分布示意图；

图3c为一种集群闲忙状态分布示意图；

图3d为本申请实施例中的一种装箱结果示意图；

图4a为本申请实施例提供的一种哈希环的结构示意图；

图4b为本申请实施例提供的一种哈希环的结构示意图；

图4c为本申请实施例提供的一种哈希环的结构示意图；

图4d为本申请实施例提供的一种哈希环的结构示意图；

图5为本申请实施例提供的一种资源借调方法的实施例的示意图；

图6为本申请实施例提供的一种资源借调方法的实施例的示意图；

图7为本申请实施例提供的一种第一管理节点的结构示意图；

图8为本申请实施例提供的一种第二管理节点的结构示意图；

图9为本申请实施例提供的一种第三管理节点的结构示意图；

图10为适用于本发明实施例的一种管理节点的系统实例；

图11为本申请实施例提供的一种集群的结构示意图；

图12为本申请实施例提供的一种集群的结构示意图；

图13为本申请实施例提供的一种集群的结构示意图；

图14为本申请实施例提供的一种分布式系统的结构示意图；

图15为本申请实施例提供的一种分布式系统的结构示意图。

具体实施方式

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包括，例如，包括了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

下面通过图1示例性的说明本发明实施例应用的的分布式系统的系统架构。

如图1所示的是一种一层架构的中心化分布式系统架构示意图。在该架构下，用户(user1、user2、……)可以将任务数据提交到节点集群的主节点(master)上，主节点通过调度器(scheduler)对任务数据进行调度分配，为任务数据分配所需要的资源，从而把任务分配到满足任务所需资源的从节点(slave1、slave2、……slaveN)上。

需要说明的是，本申请中的主节点(master)也可以被理解为管理节点，从节点(slave)可以被理解为计算节点。

在前述的多种架构中，调度器(scheduler)可以是集成在相关节点上的硬件设备，也可以通过节点的通用硬件通过软件实现。在本发明实施例中，不限制管理节点实施所述调度器功能的具体方式。

本发明实施例中所述的资源调度，是指将分布式中的计算节点的资源分配给任务数据。应当注意的是，在本发明的各类实施例中，计算节点指的是分布式系统中作为资源调度单位的一个资源集合，一般而言，计算节点是以一台服务器或者一个物理计算机为单位的。但是，在一些场景下，针对不同的资源类型，可以按照不同的划分单位来划分计算节点。例如，当以CPU作为被监测资源时，可以按照处理器或者处理核作为划分单位，分布式系统中每个处理器或者处理核作为一个计算节点，一个服务器中可能包含多个计算节点。又例如，当仅以存储资源作为被监测资源时，可以按照数据分片作为计算节点的划分单位，则分布式数据库中一个数据分片作为一个计算节点，一个服务器中可能包含多个数据分片，即包含多个计算节点。

参照图2，图2为一种资源借调场景的架构示意图，如图2中示出的那样，包括集群201、集群202、集群203和集群204，其中，集群201、集群202、集群203为资源空闲量较多的空闲集群，集群204为资源空闲量较少的忙集群，集群201包括管理节点2011和多个计算节点2012，集群202包括管理节点2021和多个计算节点2022，集群203包括管理节点2031和多个计算节点2032，集群204包括管理节点2041和多个计算节点2042。

在一种实施例中，以集群204的空闲资源不足为例，可以按照如下策略进行跨集群的资源借调：

管理节点2041对集群201、集群202、集群203按照资源空闲量的大小进行从大到小进行排序，得到第一集群列表。

例如，第一集群列表是{集群201，集群203，集群202}。

管理节点2041接收任务数据，并确定多个计算节点2042可用的资源空闲量小于任务数据的资源需求量。

管理节点2041在第一集群列表中，选择资源空闲量满足任务数据的资源需求的集群，得到第二集群列表。

例如，若集群201、集群202、集群203的资源空闲量都满足任务数据的资源需求，则第二集群列表是{集群201，集群203，集群202}。

管理节点2041从第二集群列表中随机选择2个集群，向选择的2个集群发送资源查询请求。

例如，管理节点2041选择了集群201和集群203，此时，管理节点2041可以向管理节点2011和管理节点2021发送资源查询请求。

管理节点2041选择第一个返回借调结果且满足任务数据的资源需求的集群，进行跨集群的资源借调。

例如，集群201为第一个返回借调结果且满足任务数据的资源需求的集群，则管理节点可以将任务数据发送给管理节点2011，使得管理节点2011调度多个计算节点处理任务数据。

然而，在上述设计中，由于管理节点2041在进行跨级群的资源借调时，需要向随机选择的k个集群发送资源查询请求，并在接收到返回借调结果后，再进行资源借调，因此，资源借调前需要一次信息往返的时延开销，增加了时延。

同时，以集群为粒度进行资源借调，对于集群数小、但集群中节点多的场景，并发借调时，借调冲突概率比较大，即针对于同一个空闲集群，可能存在多个忙集群进行资源借调。例如，以上述实施例为例，若集群201和集群203都正在被其他忙集群借调资源，则集群201和集群203上会发生资源借调冲突，导致没有一个集群返回借调结果。

为解决上述技术问题，本申请提供了一种资源分配方法，参照图3a，图3a为本申请实施例提供的一种资源分配方法的实施例的示意图，如图3a中示出的那样，本申请提供的资源分配方法包括：

301、第一节点确定第一集群对应的哈希值。

本申请实施例中，第一节点可以是空闲集群的管理节点，其中，空闲集群包括第一节点和多个计算节点，第一集群可以是由多个计算节点中的全部节点或部分节点组成的节点集群，第一集群也可以包括第一节点，这里并不限定。

本申请实施例中，第一节点在确定第一集群对应的哈希值之前，可以先确定所在的集群的忙闲状态。

可选地，在一种实施例中，第一节点可以根据所在的集群下计算节点的主导资源的占用率评估节点的忙闲状态，并根据所在的集群中忙节点个数和闲节点的个数评估集群的忙闲状态。

示例性的，第一节点可以按照如下公式定义计算节点的忙闲状态：

其中，i表示第i种资源，Use(i)表示正在使用的第i种资源的资源占用量，Total(i)表示第i种资源的总资源量；

其中，a为预设的阈值，max{P _i}表示i个资源占用率中最大的。

本申请实施例中，当计算节点中最大的资源占用率大于或等于阈值a时，第一节点可以确定该计算节点为忙节点，当计算节点中最大的资源占用率小于阈值a时，第一节点可以确定该计算节点为空闲节点。

需要说明的是，上述阈值a可以根据需求实时调整，可根据不同场景进行配置，本申请并不限定。

示例性的，第一节点可以按照如下方式定义所在的集群的忙闲状态：

第一节点所在的集群中，忙节点数量为n，闲节点数量为m；

当m＝1时：即第一节点所在的集群内只有一个空闲节点时，第一节点可以确定所在的集群为忙集群；

当m≠1时：计算

其中，b为预设的阈值。

需要说明的是，上述阈值b可以根据需求实时调整，可根据不同场景进行配置，本申请并不限定。

参照图3b和图3c，图3b和图3c是一种集群闲忙状态分布示意图，如图3b和图3c所示，在图3b中，集群内有4个忙节点，5个空闲节点，即n＝4，m＝5；

则p＝1.25，若确定阈值b为0.3，由于1.25＞0.3，则图3b示出的集群为闲集群，可以提供空闲资源。

同理，图3c所示的集群内有7个忙节点，2个空闲节点，即n＝7，m＝2；

则p＝0.286，由于0.286＜0.3，则图3c示出的集群为忙集群。

本申请实施例中，第一节点在确定所在的集群的闲忙状态为闲时，可以确定第一集群对应的哈希值。

可选的，第一节点在所在的空闲集群包括多个计算节点，第一节点可以对空闲集群的多个计算节点进行划分，得到多个子集群。

进一步的，第一节点在所在的空闲集群包括多个空闲节点，第一节点可以对空闲集群的多个空闲节点进行划分，得到多个子集群。

在一种实施例中，多个子集群包括第三集群和第四集群，第三集群为多个子集群中资源空闲量最大的集群，第四集群为多个子集群中资源空闲量最小的集群，第三集群的资源空闲量与第四集群的资源空闲量的差值的绝对值小于第一阈值。

即，本申请实施例中，第一节点可以对空闲集群的多个计算节点进行划分，以使得划分后得到的多个子集群中的各个第一集群之间的资源空闲量的差异不会过大(最大的资源空闲量与最小的资源空闲量的差值的绝对值小于第一阈值)。

示例性的，第一节点可以在空闲集群的多个闲节点中随机选取一部分空闲节点或全部空闲节点作为预留资源，为空闲集群本地的忙节点提供资源；

本申请实施例中，第一节点可以确定空闲节点中除了作为预留资源之外的剩余空闲节点作为可借资源，并对其进行分组。

具体的，第一节点可以首先计算可借资源中的每个空闲节点的资源空闲率r _i＝α×c _i+β×m _i，并根据资源空闲率将节点进行降序排序，其中，c _i表示CPU资源空闲率，m _i表示内存资源空闲率，α和β表示CPU资源空闲率和内存资源空闲率的权重参数。

第一节点将可借资源分为j组，并将所有可借节点进行“s”型装箱操作，同时计算每个空闲资源组的总空闲率

以及σ _j＝max{R _j}-min{R _j}，迭代到σ _j大于σ _j-1时，算法终止，将j-1组作为分组结果，其中，n表示可借节点个数，需要说明的是，j为一个可配置参数，实际应用中可按照需求选择，这里并不限定。

例如，第一节点可以确定空闲节点中除了作为预留资源之外的剩余空闲节点包括：{节点1，节点2，节点3，节点4，节点5，节点6，节点7，节点8，节点9，节点10，节点11，节点12}，其中每个节点已经按照空闲率降序排序(即节点1空闲率最高，节点12空闲率最低)，参照图3d，图3d为本申请实施例中的一种装箱结果示意图，其中，当确定分组数量j为5时，“S”型装箱结果示意图如图3d所示，在图3d中，划分后得到了5个子集群。

在另一种实施例中，所述多个子集群中的每个子集群的资源空闲量与预设资源空闲量的差值的绝对值小于或等于第二阈值，所述预设资源空闲量与历史资源请求量相关。

具体的，资源空闲量可以包括CPU资源空闲量和内存资源空闲量，预设资源空闲量可以包括预设CPU资源空闲量和预设内存资源空闲量，其中，预设资源空闲量与历史资源请求量相关，相应的，预设CPU资源空闲量与历史CPU资源请求量相关，预设内存资源空闲量与历史内存资源请求量相关。

本申请实施例中，所述多个子集群中的每个子集群的CPU资源空闲量与预设CPU资源空闲量的差值的绝对值小于或等于第三阈值，所述多个子集群中的每个子集群的内存资源空闲量与预设内存资源空闲量的差值的绝对值小于或等于第四阈值。

本申请实施例中预设CPU资源空闲量和预设内存资源空闲量可以根据历史借调请求中的资源请求量来确定，示例性的，第一节点可以记录所在的空闲集群最近k个周期内被请求的资源信息，其中k为可调参数。

可选的，第一节点可以首先根据历史资源请求表，分别对k个周期内的CPU资源请求量和内存资源请求量进行统计平均，得到单个周期内每个空闲资源组CPU历史平均请求量

和内存历史平均请求量

其中，CPU _i表示第i个周期内的CPU资源请求总量，s _i表示第i个周期内的空闲资源组个数，MEM _i表示第i个周期内的内存资源请求总量。

第一节点可以确定CPU历史平均请求量

为预设CPU资源空闲量，内存历史平均请求量

为预设内存资源量。

第一节点可以以

和

为指标，对可借资源进行分组，使得分组后的每个子集群内的CPU资源空闲量和内存资源空闲量都接近于

和

第一节点可以计算每个空闲节点的贡献率

并根据贡献率将空闲节点进行降序排序，将可借资源分为N组，

将所有可借节点进行“S”型装箱，得到多个子集群。

其中，idle_c _i表示CPU空闲量和idle_m _i表示内存空闲量，α和β表示CPU和内存的权重参数，sum_cpu表示空闲集群内可借空闲CPU总量，sum_mem表示空闲集群内可借空闲内存总量。

关于第一节点如何将所有空闲节点进行“S”型装箱，得到多个子集群，可以参照上述实施例中的描述，这里不再赘述。

本申请实施例中，每隔预设的时间，集群内的管理节点可以确定各自所在的集群的闲忙状态，当管理节点确定所在的集为空闲集群时，可以按照上述方式对空闲集群中的全部或部分空闲节点进行划分，得到多个子集群。当管理节点确定所在的集为忙集群时，可以向其他管理节点广播自己的忙闲状态(忙状态)。

本申请实施例中，第一节点可以确定第一集群对应的哈希值，具体的，第一节点可以确定多个子集群中的每个子集群对应的哈希值，应当理解，第一集群中多个子集群中的一个。

具体的，第一集群可以唯一对应一个标识，例如可以用IP和ID来唯一标识第一集群，其中，IP为第一节点所在的空闲集群的标识，ID为分组的标识，本申请实施例中，IP可以为空闲集群所在的服务器的IP地址，IP地址可以包含服务器的IP地址和端口号两项信息。举例来说，计算第一集群对应的哈希值可以是根据所在的服务器的IP地址、端口号信息以及用于标识分组的ID，基于预设的哈希算法计算得到第一集群对应的哈希值。

第一节点可以基于预设的哈希算法计算每个子集群对应的哈希值，具体的，第一节点可以基于预设的哈希算法计算每个子集群的标识的哈希值，由于多个子集群的标识彼此不重复，则对应的哈希值也是不同的。

302、第一节点获取哈希环，所述哈希环包括至少一个哈希值区间，每个哈希值区间对应一个第二集群。

本申请实施例中，哈希环可以理解为包括多个哈希节点的哈希值以及相邻两个哈希节点之间的哈希值区间的数据结构，该数据结构可以为列表，或者是数组的形式。本申请并不限定哈希值的具体形式，只要是可以反映至少一个第二集群的分布特征的数据结构都应落入本申请的保护范围。

在一种实施例中，第一节点可以基于预设的哈希算法构建哈希环。

其中，在基于一致性哈希(hash)算法的分布式系统中，集群可以根据其分别对应的哈希值而分布于一个数值空间逻辑环上，称为哈希环。该哈希环一般由管理节点生成并保存。在所述哈希环上的一段数据范围(如哈希环上1000～20000的hash值范围)称为一个哈希值区间。

具体的，当管理节点确定所在的集为忙集群时，可以向其他管理节点广播自己的忙闲状态(忙状态)，相应的，第一节点可以确定分布式系统中包括的忙集群(至少一个第二集群)。

第一节点可以基于预设的哈希算法计算各个第二集群对应的哈希值，需要说明的是，上述预设的哈希算法可以为jhash哈希算法，也可以为其它类型的哈希算法，本申请实施例对此不作具体限定。第一节点可根据系统需要选择合适的哈希算法，只要计算第一集群的哈希值与计算第二集群的哈希值采用相同的哈希算法即可。

第一节点可以根据各个第二集群对应的哈希值生成哈希环，参照图4a，图4a为本申请实施例提供的一种哈希环的结构示意图，该哈希环的数据范围从0到232，哈希环中的每个大圆圈为根据第二集群的标识计算得到的哈希值，代表一个第二集群。第二集群根据各自对应的哈希值而分布在哈希环上的不同位置。如图4a所示，第二集群对应的哈希值将整个哈希环划分为与第二集群相同数量的哈希值区间，一个哈希值区间是哈希环上的一段哈希值的数据范围。

可选的，在一种实施例中，哈希环包括第一哈希节点和第二哈希节点，第一哈希节点对应目标第二集群，第一哈希节点为哈希环上第二哈希节点的相邻后继节点，目标哈希区间为第一哈希节点与第二哈希节点之间的哈希区间。

本申请实施例中，哈希环上的每个哈希值区间与一个第二集群对应。在一种可能的实现方式中，针对组成哈希环的任一哈希值区间，沿着第一方向从该哈希值区间开始查找，将查找到的第一个第二集群确定为该哈希值区间对应的第二集群。换句话说，若第二集群的哈希值为该哈希值区间在第一方向上的边界哈希值，则可认为该第二集群与该哈希值区间对应。其中，第一方向为哈希环的正方向，它可以是顺时针方向，也可以是逆时针方向，本申请实施例不作具体限定。示例性地，图4a中选取了顺时针方向为第一方向。

本申请实施例中，第一节点可以确定X个第二集群对应的Y个哈希值，其中，每个第二集群对应至少一个哈希值，X正整数，Y为大于或等于X的正整数。

在一种实施例中，Y大于X，即存在第二集群，该第二集群对应多个哈希值。

本申请实施例中，当第二集群的数量过少时，在哈希环上第二集群的分布会过于稀疏，参照图4b，图4b为本申请实施例提供的一种哈希环的结构示意图，当第二集群的数量过少时，第二集群在哈希环上的分布会过于稀疏，因此，可以将第二集群对应哈希环上的多个节点，即引入虚拟节点，参照图4c，图4c为本申请实施例提供的一种哈希环的结构示意图，如图4c中示出的那样，目标第二集群可以对应于哈希环上的两个哈希节点，通过引入虚拟节点，使得第二集群可以对应哈希环上的多个节点，进而第二集群在哈希环上的分布不会过于稀疏。关于如何通过引入虚拟节点来实现将第二集群对应哈希环上的多个节点可以参照现有方案中的实现，这里不再赘述。

本申请实施例中，第一节点根据Y个哈希值生成哈希环，其中，哈希环包括Y个哈希节点，每个第二集群对应至少一个哈希节点，Y个哈希节点将哈希环划分为Y个哈希值区间，每个哈希节点对应一个哈希值区间，即每个哈希节点对应一个第二集群，而一个第二集群可以对应哈希环上的多个哈希节点。

本申请实施例中，第一节点可以周期性的接收到其他集群广播的闲忙状态，并根据其他集群广播的闲忙状态周期性的更新哈希环。

可选的，在另一种实施例中，第一节点可以接收第二集群发送的哈希表。

本申请实施例中，第二集群中的管理节点(例如第二节点)可以接收到其他集群广播的闲忙状态，并根据其他集群广播的闲忙状态构建哈希环，关于第二集群如何根据其他集群广播的闲忙状态构建哈希环可以参照上述实施例中的描述，这里不再赘述。

303、第一节点根据第一集群对应的哈希值确定对应的目标第二集群，其中，第一集群对应的哈希值属于目标哈希区间，目标哈希区间为至少一个哈希值区间中的一个哈希值区间，目标哈希区间对应目标第二集群。

本申请实施例中，第一节点在确定第一集群对应的哈希值，以及获取到基于第二集群的哈希值生成的哈希环之后，可以根据第一集群对应的哈希值从哈希环中确定对应的目标第二集群。

本申请实施例中，由于哈希环上的每个哈希值区间对应一个第二集群，因此，第一节点可以确定第一集群对应的哈希值在哈希环上属于的哈希值区间为目标哈希区间，并确定该目标哈希区间对应的第二集群为目标第二集群。

参照图4d，图4d为本申请实施例提供的一种哈希环的结构示意图，如图4d中示出的那样，哈希环包括：六个哈希节点{哈希节点1，哈希节点3，哈希节点4，哈希节点6，哈希节点8，哈希节点10}，其中，哈希节点3和哈希节点8对应第二集群1，哈希节点1和哈希节点4对应第二集群2，哈希节点6和哈希节点10对应第二集群3。

哈希节点1与哈希节点3之间的哈希值区间对应于第二集群1，哈希节点3与哈希节点4之间的哈希值区间对应于第二集群2，哈希节点4与哈希节点6之间的哈希值区间对应于第二集群3，哈希节点6与哈希节点8之间的哈希值区间对应于第二集群1，哈希节点8与哈希节点10之间的哈希值区间对应于第二集群3，哈希节点10与哈希节点1之间的哈希值区间对应于第二集群2。

空闲集群a包括两个子集群{第一集群a1，第一集群a2},空闲集群b包括两个子集群{第一集群b1，第一集群b2}。

各个第一集群{第一集群a1，第一集群a2，第一集群b1，第一集群b2}在哈希环上的分布如图4中示出的那样，其中，第一集群a1对应的哈希值属于哈希节点8与哈希节点6之间的哈希值区间，第一集群a2对应的哈希值属于哈希节点4与哈希节点10之间的哈希值区间，第一集群b1对应的哈希值属于哈希节点1与哈希节点3之间的哈希值区间，第一集群b2对应的哈希值属于哈希节点4与哈希节点10之间的哈希值区间。

结合上述各个第一集群在哈希环中的分布，空闲集群a中的第一节点可以确定第一集群a1对应于第二集群6，空闲集群a中的第一节点可以确定第一集群a2对应于第二集群4，空闲集群b中的第一节点可以确定第一集群b1对应于第二集群3，空闲集群b中的第一节点可以确定第一集群b2对应于第二集群4。

304、所述第一节点建立第一集群和目标第二集群的关联关系，其中，与所述第一集群建立了关联关系的所述目标第二集群被允许从所述第一集群申请资源。

本申请实施例中，第一节点根据第一集群对应的哈希值确定对应的目标第二集群之后，可以向目标第二集群发送第一集群的标识，具体的，第一节点根据第一集群对应的哈希值确定对应的目标第二集群之后，可以向目标第二集群中的管理节点(第二节点)发送资源分配指示，该资源分配指示包括第一集群的标识，该资源分配指示可以指示目标第二节点被允许从所述第一集群申请资源。

可选的，在一种实施例中，第一节点还可以向目标第二集群发送第一集群的资源空闲量。

具体的，第一节点还可以向目标第二集群发送第一集群的CPU资源空闲量和内存资源空闲量。

一方面，第一节点可以通过第一集群对应的哈希值在哈希环(根据第二集群对应的哈希值生成的)上的分布，来确定第一集群对应的目标第二集群，建立目标第二集群和第一集群的关联关系，由于基于一致性哈希算法的哈希环上的第一集群对应的哈希值和第二集群对应的哈希节点的分布是确定的，每个空闲集群只允许被固定的空集群借调，因此，当目标第二集群需要借调第一集群的空闲资源时，不需要随机向选择的空闲集群发送资源查询请求，并在接收到返回后，再进行资源借调，可以直接向第一集群借调资源，减少了一次信息往返的时延开销。

另一方面，由于资源借调的对应关系是基于将第一集群的哈希值在基于忙集群生成的哈希环上的对应关系确定的，该对应关系是唯一的，因此空闲集群仅能被哈希环上对应的忙集群借调资源，因此，不会出现由于多个忙集群向同一个空闲集群并发借调资源而导致的借调冲突。

另一方面，第一节点通过对空闲集群的多个计算节点进行划分，得到多个子集群，之后可以以子集群为单位为其他忙集群借调资源，使得空闲集群中的空闲资源可以实现相对均衡的借调。

另一方面，当第二集群的数量过少时，第二集群在哈希环上的分布会过于稀疏，因此，可以将第二集群(例如目标第二集群)对应哈希环上的多个节点，即引入虚拟节点，使得不会出现由于第二集群在哈希环上分布过于稀疏，而导致一个第二集群会对应多个第一集群的情况，增加了资源分配的均衡性。

本申请实施例中，第一节点确定第一集群对应的哈希值；第一节点获取哈希环，哈希环包括至少一个哈希值区间，每个哈希值区间对应一个第二集群；第一节点根据第一集群对应的哈希值确定对应的目标第二集群，其中，第一集群对应的哈希值属于目标哈希区间，目标哈希区间为至少一个哈希值区间中的一个哈希值区间，目标哈希区间对应目标第二集群；第一节点建立第一集群和目标第二集群的关联关系，其中，与所述第一集群建立了关联关系的所述目标第二集群被允许从所述第一集群申请资源。通过上述方式，一方面，第一节点可以通过第一集群对应的哈希值在哈希环(根据第二集群对应的哈希值生成的)上的分布，来确定第一集群对应的目标第二集群，建立目标第二集群和第一集群的关联关系，由于基于一致性哈希算法的哈希环上的第一集群对应的哈希值和第二集群对应的哈希节点的分布是确定的，每个空闲集群只允许被固定的空集群借调，因此，当目标第二集群需要借调第一集群的空闲资源时，不需要随机向选择的空闲集群发送资源查询请求，并在接收到返回后，再进行资源借调，可以直接向第一集群借调资源，减少了一次信息往返的时延开销。且，由于资源借调的对应关系是基于将第一集群的哈希值在基于忙集群生成的哈希环上的对应关系确定的，该对应关系是唯一的，因此空闲集群仅能被哈希环上对应的忙集群借调资源，因此，不会出现由于多个忙集群向同一个空闲集群并发借调资源而导致的借调冲突。

需要说明的是，在另一种实施例中，第一节点可以不基于第一集群对应的哈希值在哈希环上的分布确定对应的目标第二集群，而是通过随机分配的方式，或者顺序分配的方式确定对应的目标第二集群。

具体的，第一节点可以从分布式系统中的多个第二集群中随机选择一个第二集群作为目标第二集群。

具体的，可以对至少一个第二集群进行排序，并按照预设的顺序将多个子集群(包括第一集群)顺次挂载到相应的第二集群上(即建立各个子集群与第二集群的关联关系)。则，第一节点也可以通过上述方式确定对应的目标第二集群。

应当理解，实际应用中可以不限于上述实现方式，只要在资源借调关系分配时，分布式系统确定固定的资源分配关系(第一节点与某一个目标第二集群建立关联关系)，都可以实现，忙集群在进行资源借调时，不需要随机向选择的空闲集群发送资源查询请求，并在接收到返回后，再进行资源借调，可以直接向第一集群借调资源，减少了一次信息往返的时延开销。且，由于资源借调的对应关系是基于将第一集群的哈希值在基于忙集群生成的哈希环上的对应关系确定的，该对应关系是唯一的，因此空闲集群仅能被哈希环上对应的忙集群借调资源，因此，不会出现由于多个忙集群向同一个空闲集群并发借调资源而导致的借调冲突。

参照图5，图5为本申请实施例提供的一种资源借调方法的实施例的示意图，如图5中示出的那样，本申请提供的资源借调方法包括：

501、第二节点确定与目标第二集群具有关联关系的第一集群，其中，所述第二节点属于所述目标第二集群，所述目标第二集群对应于哈希环中的目标哈希值区间，所述第一集群对应的哈希值属于所述目标哈希值区间。

本申请实施例中，第二节点属于目标第二集群，其中，目标第二集群为忙集群。具体的，第二节点可以接收到第一节点发送的资源分配指示，该资源分配指示包括第一集群的标识，该资源分配指示可以指示第二节点可以借调第一集群的空闲资源，关于第一节点如何向目标第二集群发送第一集群的标识可参照上述实施例，这里不再赘述。

本申请实施例中，第二节点可以接收到多个子集群的标识，即，与所述目标第二集群具有关联关系的集群有多个。

本实施例中，所述第二节点可以确定与所述目标第二集群具有关联关系的多个集群中的一个集群为第一集群。

可选的，在一种实施例中，第二节点还可以接收到多个子集群中每个子集群的资源空闲量。

502、第二节点接收任务数据。

本申请实施例中，第二节点可以接收到任务数据。

可选的，在一种实施例中，第二节点接收到任务数据之后，可以确定接收到的任务数据的资源需求量，并判断所在的忙集群(目标第二集群)中的空闲节点的资源空闲量，若所属的忙集群中的空闲节点的资源空闲量大于或等于任务数据的资源需求量，相当于第二节点可以确定本地的集群有足够的资源空闲量来处理该任务数据。若所属的忙集群中的空闲节点的资源空闲量小于任务数据的资源需求量，相当于第二节点可以确定本地的集群没有足够的资源空闲量来处理该任务数据。

具体的，若所属的忙集群中的空闲节点的CPU资源空闲量大于或等于任务数据的CPU资源需求量，且所属的忙集群中的空闲节点的内存资源空闲量大于或等于任务数据的内存资源需求量，相当于第二节点可以确定本地的集群有足够的资源空闲量来处理该任务数据。若所属的忙集群中的空闲节点的CPU资源空闲量小于任务数据的CPU资源需求量，且所属的忙集群中的空闲节点的内存资源空闲量小于任务数据的内存资源需求量，相当于第二节点可以确定本地的集群没有足够的资源空闲量来处理该任务数据。

503、第二节点向第一节点发送第一资源借调请求，所述第一借调请求用于指示所述第一节点将所述任务数据分配给所述第一集群处理。

若第二节点确定本地集群没有足够的资源空闲量来处理该任务数据，则需要向其他集群借调资源来执行该任务数据。

本申请实施例中，第二节点可以向第一节点发送第一资源借调请求，第一借调请求可以包括任务数据和第一集群的标识，相应的，第一节点接收到第一资源借调请求之后，可以将其中包括的任务数据分配给第一集群来处理。

在一种实施例中，第二节点可以接收到多个子集群的标识以及多个子集群的资源空闲量，此时第二节点需要从其中确定一个集群作为资源借调的对象，接下来论述第二节点如何从多个子集群中确定作为资源借调对象的第一集群。

本申请实施例中，第二节点可以维护一个映射表，该映射表中存储了多个子集群的标识，以及对应的资源空闲量，第二节点可以在映射表中查找多个子集群中资源空闲量大于或等于任务数据的资源需求量的集群集合，得到满足资源需求量的子集群集合{slices 1，slices 2，……，slices n}，其中，slices n表示第n个子集群的标识。

第二节点在得到子集群集合{slices 1，slices 2，……，slices n}之后，可以对子集群集合中的多个子集群进行优先级排序，其中，优先级排序的指标为子集群的资源空闲量与任务数据的资源需求量的接近程度，越接近则对应的子集群的优先级越高，第二节点可以选择优先级最高的子集群发起第一借调请求。

示例性的，第二节点可以维护如下的映射表：

第二节点接收到任务数据，并确定该任务数据对应的CPU资源需求量为0.6，内存资源需求量为0.65。

第二节点可以在映射表中查找多个第一集群中资源空闲量大于或等于任务数据的资源需求量的集群集合，得到满足资源需求量的第一集群集合{slices6，slices7}。

第二节点可以根据如下公式来确定与任务数据的资源需求量最接近的第一集群：

其中，α表示CPU的权重参数，β表示内存的权重参数，

表示注册在第二集群j上的第一集群i的CPU资源空闲量，

表示第二集群j中确定的任务数据需要的CPU资源空闲量，

表示注册在第二集群j上的第一集群i的空闲内存资源量，

表示第二集群j中确定的任务数据需要的空闲内存资源量。示例性的，α为0.6，β为0.4。

slices 6与任务数据资源请求量的接近程度为：

(0.65-0.6)*0.6+(0.75-0.65)*0.4＝0.07

slices 7与任务数据资源请求量的接近程度为：

(0.74-0.6)*0.6+(0.7-0.65)*0.4＝0.104

则第二节点可以确定slices 6对应的第一集群的资源空闲量最接近任务数据的资源需求量，并向slices 6对应的第一集群发起第一借调请求。

需要说明的是，上述描述仅为一种示意，其中具体的参数选择仅为一种示意，本申请并不限定。

通过上述方式，所述第二节点确定与所述目标第二集群具有关联关系的多个集群的资源空闲量中，与所述任务数据的资源需求量差值最小的资源空闲量对应的集群为所述第一集群，提高了资源借调时的资源利用率。

可选地，在一种实施例中，第二节点可以基于接收到第一节点发送的第一集群的标识，确定该第一集群处于资源可借调状态。

第二节点可以基于向第一节点发送资源借调请求，确定第一集群处于资源不可借调状态。

本申请实施例中，第二节点向第一节点发送资源借调请求之后，相当于已经占用了第一集群的空闲资源，则可以确定第一集群处于资源不可借调状态。可选地，第二节点可以在映射表中标注第一集群的资源借调状态为资源不可借状态。相应的，第一节点也可以确定第一集群处于资源不可借调状态，即确定第一集群不能为其他忙集群提供可用资源，从而确保了资源锁定，实现了跨集群资源的无冲突调度。

本申请实施例中，第一集群在处理完任务数据之后，可以将处理结果返回第一节点，第一节点将处理结果发送到第二节点。

本申请实施例中，第二节点确定与目标第二集群具有关联关系的第一集群，其中，所述第二节点属于所述目标第二集群，所述目标第二集群对应于哈希环中的目标哈希值区间，所述第一集群对应的哈希值属于所述目标哈希值区间；所述第二节点接收任务数据；所述第二节点向第一节点发送第一资源借调请求，所述第一借调请求用于指示所述第一节点将所述任务数据分配给所述第一集群处理。通过上述方式，一方面，当分布式系统中存在多个第一集群时，各个第一节点通过第一集群对应的哈希值在根据第二集群对应的哈希值生成的哈希环上的分布，来确定第一集群对应的目标第二集群，并指示目标第二集群可以借调第一集群的空闲资源，由于基于一致性哈希算法的哈希环上的第一集群对应的哈希值和第二集群对应的哈希节点的分布是确定的，且相对均衡，因此，当目标第二集群需要借调第一集群的空闲资源时，不需要随机向选择的空闲集群发送资源查询请求，并在接收到返回后，再进行资源借调，而是直接确定需要借调资源的第一集群，并向第一节点发送第一资源借调请求，减少了一次信息往返的时延开销。且，由于资源借调的对应关系是基于将第一集群的哈希值在基于忙集群生成的哈希环上的对应关系确定的，该对应关系是唯一的，因此空闲集群仅能被哈希环上对应的忙集群借调资源，因此，不会出现由于多个忙集群向同一个空闲集群并发借调资源而导致的借调冲突。

参照图6，图6为本申请实施例提供的一种资源借调方法的实施例的示意图，如图5中示出的那样，本申请提供的资源借调方法包括：

601、第二节点确定与目标第二集群具有关联关系的第一集群，其中，所述第二节点属于所述目标第二集群，所述目标第二集群对应于哈希环中的目标哈希值区间，所述第一集群对应的哈希值属于所述目标哈希值区间。

步骤601的具体描述可参照图5对应的实施例中步骤501的具体描述，这里不再赘述。

602、第二节点接收第三节点发送的任务数据的资源需求量。

本申请实施例中，第三节点接收到任务数据之后，可以确定接收到的任务数据的资源需求量，并判断所属的忙集群中的空闲节点的资源空闲量，若所属的忙集群中的空闲节点的资源空闲量小于任务数据的资源需求量，即第三节点确定本地的集群没有足够的资源空闲量来处理该任务数据。

则第三节点可以遍历存储了多个子集群的标识，以及对应的资源空闲量的映射表，并在映射表中查找多个子集群中资源空闲量大于或等于任务数据的资源需求量的集群集合，若第三节点确定多个子集群中的每个子集群的资源空闲量都小于任务数据的资源需求量，或者确定多个子集群都为资源不可借调状态，则第三节点需要向其他忙集群借调资源。

具体的，第三节点可以从维护的哈希环中沿着第一方向确定第三节点对应的哈希节点的相邻后续节点，该相邻后续节点对应于第二集群。第三节点可以向第二集群的管理节点(第二节点)发送任务数据的资源需求量，具体的，第三节点可以向第二节点发送任务数据的资源需求量。

可选地，在一种实施例中，第三节点可以从维护的哈希环中沿着第一方向确定第三节点对应的哈希节点的多个后续节点，多个后续节点对应于多个第二集群。第三节点可以向多个第二集群的管理节点(第二节点)发送任务数据的资源需求量。

相应的，第二节点可以接收到第三节点发送的任务数据的资源需求量。

603、基于第一集群的资源空闲量大于或等于资源需求量，所述第二节点向第三节点发送第三资源借调请求，所述第三资源借调请求用于指示所述第三节点被允许从所述第一集群申请资源。

本申请实施例中，第二节点接收到资源需求量之后，可以查找自己维护的映射表，并确定资源空闲量大于或等于资源需求量的第一集群，并向第三节点发送第三资源借调请求，第三资源借调请求包括第一集群的标识，所述第三资源借调请求用于指示所述第三节点被允许从第一集群申请资源。

可选地，在一种实施例中，第二节点可以确定多个子集群的资源空闲量大于或等于资源需求量，则第二节点可以向第三节点发送确定的多个子集群的标识，其中第一集群为多个子集群中的一个。

可选地，在一种实施例中，第二节点可以确定多个子集群的资源空闲量大于或等于资源需求量，并从确定的多个子集群中随机选择一部分子集群，并向第三节点发送一部分子集群的标识。

可选地，在一种实施例中，第二节点可以接收到第三节点发送的第二资源借调请求，所述第二资源借调请求包括所述任务数据，所述第二借调请求用于指示所述第二节点将所述任务数据分配给所述第一集群处理。

本申请实施例中，第三节点接收到第二节点发送的第一集群的标识之后，相当于从第二节点获取到了可以进行资源借调的第一集群的标识。

可选地，在一种实施例中，第三节点可以接收到多个第二节点发送的多个子集群的标识，或者，第三节点可以接收到一个第二节点发送的多个子集群的标识之后，需要确定出多个子集群中的一个集群作为资源借调对象，关于第三节点如何确定出多个第一集群中的一个第一集群作为资源借调对象，可以参照上述实施例中，第二节点如何确定出多个子集群中的第一集群作为资源借调对象的描述，这里不再赘述。

若第三节点确定多个子集群中的第一集群为资源借调对象，相应的，第二节点可以接收第三节点发送的第二资源借调请求，所述第二资源借调请求包括所述任务数据和第一集群的标识，所述第二借调请求用于指示所述第二节点将所述任务数据分配给所述第一集群处理。

本申请实施例中，第二节点可以向第一节点发送任务数据和第一集群的标识。

第一节点可以将所述任务数据分配给所述第一集群处理。

可选地，在另一种实施例中，所述第三节点在接收所述第二节点发送的第三资源借调请求之后，可以不向第二节点发送第二资源借调请求，来指示所述第二节点将所述任务数据分配给所述第一集群处理，而是直接向第一节点发送第一资源借调请求，所述第一借调请求用于指示所述第一节点将所述任务数据分配给所述第一集群处理，减少了一步信息的转发开销。

参照图7，图7为本申请实施例提供的一种第一管理节点700的结构示意图，如图7中示出的那样，所述第一管理节点700包括：

处理模块701，用于确定第一集群对应的哈希值；获取哈希环，所述哈希环包括至少一个哈希值区间，每个哈希值区间对应一个第二集群；根据所述第一集群对应的哈希值确定对应的目标第二集群，其中，所述第一集群对应的哈希值属于目标哈希区间，所述目标哈希区间为所述至少一个哈希值区间中的一个哈希值区间，所述目标哈希区间对应所述目标第二集群；

收发模块702，用于建立第一集群和目标第二集群的关联关系，其中，与所述第一集群建立了关联关系的所述目标第二集群被允许从所述第一集群申请资源。

可选地，在一种实施例中，所述哈希环包括第一哈希节点和第二哈希节点，所述第一哈希节点对应所述目标第二集群，所述第一哈希节点为所述哈希环上所述第二哈希节点的相邻后继节点，所述目标哈希区间为所述第一哈希节点的哈希值与所述第二哈希节点的哈希值之间的哈希区间。

可选地，在一种实施例中，所述处理模块701，还用于对包括多个计算节点的空闲集群进行划分，得到多个子集群，所述第一集群为所述多个子集群中的一个。

可选地，在一种实施例中，所述多个子集群包括第三子集群和第四子集群，所述第三子集群为所述多个子集群中资源空闲量最大的子集群，所述第四子集群为所述多个子集群中资源空闲量最小的集群，所述第三子集群的资源空闲量与所述第四子集群的资源空闲量的差值的绝对值小于第一阈值。

可选地，在一种实施例中，所述多个子集群中的每个子集群的资源空闲量与预设资源空闲量的差值的绝对值小于或等于第二阈值，所述预设资源空闲量与历史资源请求量相关。

可选地，在一种实施例中，所述收发模块702还用于：

接收所述目标第二集群发送的资源借调请求，所述资源借调请求包括任务数据和第一集群的标识；

可选地，在一种实施例中，所述哈希环包括Y个哈希节点，每个第二集群对应至少一个哈希节点，且所述Y个哈希节点的对应的哈希值和所述第一集群对应的哈希值为根据相同的哈希算法生成的，所述Y为正整数。

可选地，在一种实施例中，所述处理模块701，还用于确定X个第二集群对应的Y个哈希值，其中，每个第二集群对应至少一个哈希值，所述X正整数，所述Y为大于或等于X的正整数；根据所述Y个哈希值生成所述哈希环，其中，所述哈希环包括Y个哈希节点，每个第二集群对应至少一个哈希节点，所述Y个哈希节点将所述哈希环划分为Y个哈希值区间，每个哈希节点对应一个哈希值区间。

可选地，在一种实施例中，所述收发模块702，还用于接收所述第二集群发送的所述哈希环。

可选地，在一种实施例中，所述收发模块702，还用于向所述目标第二集群发送所述第一集群的资源空闲量。

参照图8，图8为本申请实施例提供的一种第二管理节点800的结构示意图，如图8中示出的那样，所述第二管理节点800包括：

处理模块801，用于确定与目标第二集群具有关联关系的第一集群，其中，所述第二节点属于所述目标第二集群，所述目标第二集群对应于哈希环中的目标哈希值区间，所述第一集群对应的哈希值属于所述目标哈希值区间；

收发模块802，用于接收任务数据；并向第一节点发送第一资源借调请求，所述第一借调请求用于指示所述第一节点将所述任务数据分配给所述第一集群处理。

可选地，在一种实施例中，所述处理模块801，还用于基于收发模块向第一节点发送资源借调请求，确定所述第一集群处于资源不可借调状态。

可选地，在一种实施例中，与所述目标第二集群具有关联关系的集群有多个，所述处理模块801，具体用于确定与所述目标第二集群具有关联关系的多个集群中的一个集群为第一集群。

可选地，在一种实施例中，所述处理模块801，具体用于确定与所述目标第二集群具有关联关系的多个集群的资源空闲量中，与所述任务数据的资源需求量差值最小的资源空闲量对应的集群为所述第一集群。

可选地，在一种实施例中，所述收发模块802，还用于接收第三节点发送的所述任务数据的资源需求量，并基于所述第一集群的资源空闲量大于或等于所述资源需求量，向所述第三节点发送所述第一集群的标识和第一集群的资源空闲量。

可选地，在一种实施例中，所述收发模块802，具体用于接收所述第三节点发送的第二资源借调请求，所述第二资源借调请求包括所述任务数据，所述第二借调请求用于指示所述第二节点将所述任务数据分配给所述第一集群处理。

收发模块802，用于接收第三节点发送的任务数据的资源需求量；

所述收发模块802，还用于基于所述第一集群的资源空闲量大于或等于所述资源需求量，向所述第三节点发送第三资源借调请求，所述第三资源借调请求用于指示所述第三节点被允许从所述第一集群申请资源。

可选地，在一种实施例中，与所述目标第二集群具有关联关系的集群有多个，所述处理模块，具体用于确定与所述目标第二集群具有关联关系的多个集群中的一个集群为第一集群。

参照图9，图9为本申请实施例提供的一种第三管理节点900的结构示意图，如图9中示出的那样，所述第三管理节点900包括：

收发模块901，用于接收任务数据，向第二节点发送所述任务数据的资源需求量，接收所述第二节点发送的第三资源借调请求，所述第三资源借调请求用于指示所述第三节点被允许从第一集群申请资源，其中，所述第二节点属于目标第二集群，所述目标第二集群对应于哈希环中的目标哈希值区间，所述第一集群对应的哈希值属于所述目标哈希值区间，且所述第一集群的资源空闲量大于或等于所述资源需求量，向第一节点发送第一资源借调请求，所述第一借调请求用于指示所述第一节点将所述任务数据分配给所述第一集群处理。

可选地，在一种实施例中，所述收发模块901，具体用于向多个节点发送所述任务数据的资源需求量，所述第二节点为所述多个节点中的一个，接收所述多个节点发送的第三资源借调请求，所述第三资源借调请求用于指示所述第三节点被允许从多个子集群申请资源，所述第一集群为所述多个子集群中的一个。

可选地，在一种实施例中，所述第三管理节点900还包括：

处理模块902，用于确定所述多个子集群的资源空闲量中，与所述任务数据的资源需求量的差值最小的资源空闲量对应的子集群为所述第一集群。

图10说明了适用于本发明实施例的一种管理节点的系统实例，其中该管理节点可以为上述实施例中描述的第一管理节点、第二管理节点和第三管理节点中的任意一种。基于该实施例中的系统环境可以实现上一实施例中管理节点的各个逻辑模块的功能。该实施例只是一个适用于本发明的实例，并不试图建议对本发明所提供的管理节点的功能和结构构成任何限制。

本发明实施例以一种通用计算机系统环境作为示例来对管理节点进行说明。众所周知的，可适用于该管理节点还可以采用其他的硬件架构来实现类似的功能。包括并不限制于，个人计算机，服务计算机，多处理器系统，基于微处理器的系统，可编程消费电器，网路 PC，小型计算机，大型计算机，包括任何上述系统或设备的分布式计算环境，等等。

参照图10，实现本发明所举例的系统包括管理节点1000形式的通用计算设备。结合前述所述的系统场景及架构，本实施例所述的管理节点可以为前述场景及架构中所说明的本发明实施例的执行主体。例如，可以为主节点、管理节点或者去中心化架构中的任一节点。

管理节点1000的元件可以包括，但并不限制于，处理单元1020，系统存储器1030，和系统总线1010。系统总线将包括系统存储器的各种系统元件与处理单元1020相耦合。系统总线1010可以是几种类型总线结构中的任意一种总线，这些总线可以包括存储器总线或存储器控制器，外围总线，和使用一种总线结构的局部总线。总线结构可以包括工业标准结构(ISA)总线，微通道结构(MCA)总线，扩展ISA(EISA)总线，视频电子标准协会(VESA)局域总线，以及外围器件互联(PCI)总线。

管理节点1000一般包括多种管理节点可读媒介。管理节点可读媒介可以是任何管理节点1000可有效访问的媒介，并包括易失性或非易失性媒介，以及可拆卸或非拆卸的媒介。例如，但并不限制于，管理节点可读媒介可以包括管理节点存储媒介和通讯媒介。管理管理节点可读指令，数据结构，程序模块或其他数据的信息的任何方法或技术来实现。管理节点存储媒介包括，但并不限制于，RAM，ROM，EEPROM，闪存存储器或其他存储器技术，或者硬盘存储、固态硬盘存储、光盘存储，磁盘盒，磁盘存储或其它存储设备，或任何其它可以存储所要求信息和能够被管理节点1000访问的媒介。通讯媒介一般包括嵌入的计算机可读指令，数据结构，程序模块或在模块化数据信号(例如，载波或其他传输机制)中的其他数据，并且还包括任何信息传递的媒介。术语“模块化数据信号”是指具有一个或多个信号特征组或采用对信号中的信息进行编码的方式来改变的信号。例如，但并不限制，通讯媒介包括诸如有线网络或直接有线连接的有线媒介，和诸如声，RF红外和其它无线媒介的无线媒介。上述任何组合也应该包括在管理节点可读媒介的范围内。

系统存储器1030包括管理节点存储媒介，它可以是易失性和非易失性存储器，例如，只读存储器(ROM)1031和随即存取存储器(RAM)1032。基本输入/输出系统1033(BIOS)一般存储于ROM1031中，包含着基本的例行程序，它有助于在管理节点1010中各元件之间的信息传输。RAM 1032一般包含着数据和/或程序模块，它可以被处理单元1020即时访问和/或立即操作。例如，但并不限制于，图10说明了操作系统1034，应用程序1035，其他程序模块1036和程序数据1037。

管理节点1000也可以包括其他可拆卸/非拆卸，易失性/非易失性的管理节点存储媒介。仅仅是一个实例，图10说明了硬盘存储器1041，它可以是非拆卸和非易失性的可读写磁媒介；外部存储器1051，它可以是可拆卸和非易失性的各类外部存储器，例如光盘、磁盘、闪存或者移动硬盘等；硬盘存储器1041一般是通过非拆卸存储接口(例如，接口1040)与系统总线1010相连接，外部存储器一般通过可拆卸存储接口(例如，接口1060)与系统总线1010相连接。上述所讨论的以及图10所示的驱动器和它相关的管理节点存储媒介提供了管理节点可读指令，数据结构，程序模块和管理节点1000的其它数据的存储。例如，硬盘驱动器1041说明了用于存储操作系统1042，应用程序1043，其它应用程序1044以及程序数据1045。值得注意的是，这些元件可以与操作系统1034，应用程序1035，其他程序模块1036，以及程序数据1037是相同的或者是不同的。

在本实施例中，前述实施例中的方法或者上一实施例中逻辑模块的功能可以通过存储在管理节点存储媒介中的代码或者可读指令，并由处理单元1020读取所述的代码或者可读指令从而执行所述方法。

用户可以通过各类输入设备1061管理节点1000输入命令和信息。各种输入设备经常都是通过用户输入接口1060与处理单元1020相连接，用户输入接口1060与系统总线相耦合，但也可以通过其他接口和总线结构相连接，例如，并行接口，或通用串行接口(USB)。显示设备1091也可以通过接口(例如，视频接口1090)与系统总线1010相连接。此外，诸如计算设备1000也可以包括各类外围输出设备1020，输出设备可以通过输出接口10100等来连接。管理节点1000可以在使用逻辑连接着一个或多个计算设备，例如，远程计算机1071。远程计算节点包括管理节点，计算节点，服务器，路由器，网络PC，等同的设备或其它通用的网络结点，并且一般包括许多或所有与管理节点1000有关的上述所讨论的元件。结合前述图1所描述的架构中，远程计算节点可以是从节点、计算节点或者其他管理节点。在图10中所说明的逻辑连接包括局域网(LAN)和广域网(WAN)，也可以包括其它网络。通过逻辑连接，管理节点可以与其他节点实现本发明中与其他主题之间的交互。例如，可以通过与用户的逻辑链接进行任务信息和数据的传输，从而获取用户的任务数据；通过和计算节点的逻辑链接进行资源数据的传输以及任务分配命令的传输，从而实现各个节点的资源信息的获取以及任务数据的分配。

参照图11，图11为本申请实施例提供的一种集群1100的结构示意图，如图11中示出的那样，所述集群1100包括多个计算节点1101，所述计算节点1101为任务数据提供所需的资源以执行所述任务数据，以及，所述集群1100还包括：图7对应的实施例中描述的第一管理节点700。

参照图12，图12为本申请实施例提供的一种集群的结构示意图，如图12中示出的那样，所述集群1200包括多个计算节点1201，所述计算节点1201为任务数据提供所需的资源以执行所述任务数据，以及，所述集群1200还包括：图8对应的实施例中描述的第二管理节点800。

参照图13，图13为本申请实施例提供的一种集群的结构示意图，如图13中示出的那样，所述集群1300包括多个计算节点1301，所述计算节点1301为任务数据提供所需的资源以执行所述任务数据，以及，所述集群1300还包括：图9对应的实施例中描述的第三管理节点900。

参照图14，图14为本申请实施例提供的一种分布式系统1400的结构示意图，如图14中示出的那样，所述分布式系统1400包括图11对应的实施例中描述的集群1100以及图12对应的实施例中描述的集群1200。

参照图15，图15为本申请实施例提供的一种分布式系统的结构示意图，如图12中示出的那样，所述分布式系统1500包括图11对应的实施例中描述的集群1100、图12对应的实施例中描述的集群1200以及图13对应的实施例中描述的集群1300。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(Digital Subscriber Line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种资源分配方法，其特征在于，所述方法包括：

第一节点确定第一集群对应的哈希值；

所述第一节点获取哈希环，所述哈希环包括至少一个哈希值区间，每个哈希值区间对应一个第二集群；

所述第一节点根据所述第一集群对应的哈希值确定对应的目标第二集群，其中，所述第一集群对应的哈希值属于目标哈希区间，所述目标哈希区间为所述至少一个哈希值区间中的一个哈希值区间，所述目标哈希区间对应所述目标第二集群；

所述第一节点建立第一集群和目标第二集群的关联关系，其中，与所述第一集群建立了关联关系的所述目标第二集群被允许从所述第一集群申请资源。
根据权利要求1所述的方法，其特征在于，所述哈希环包括第一哈希节点和第二哈希节点，所述第一哈希节点对应所述目标第二集群，所述第一哈希节点为所述哈希环上所述第二哈希节点的相邻后继节点，所述目标哈希区间为所述第一哈希节点的哈希值与所述第二哈希节点的哈希值之间的哈希区间。
根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

所述第一节点对包括多个计算节点的空闲集群进行划分，得到多个子集群，所述第一集群为所述多个子集群中的一个。
根据权利要求3所述的方法，其特征在于，所述多个子集群包括第三子集群和第四子集群，所述第三子集群为所述多个子集群中资源空闲量最大的子集群，所述第四子集群为所述多个子集群中资源空闲量最小的集群，所述第三子集群的资源空闲量与所述第四子集群的资源空闲量的差值的绝对值小于第一阈值。
根据权利要求3所述的方法，其特征在于，所述多个子集群中的每个子集群的资源空闲量与预设资源空闲量的差值的绝对值小于或等于第二阈值，所述预设资源空闲量与历史资源请求量相关。
根据权利要求1至5任一所述的方法，其特征在于，所述方法还包括：

所述第一节点接收所述目标第二集群发送的第一资源借调请求，所述第一资源借调请求包括任务数据和第一集群的标识；

所述第一节点根据所述第一集群的标识向所述第一集群发送所述任务数据。
根据权利要求1至6任一所述的方法，其特征在于，所述哈希环包括Y个哈希节点，每个第二集群对应至少一个哈希节点，且所述Y个哈希节点的对应的哈希值和所述第一集群对应的哈希值为根据相同的哈希算法生成的，所述Y为正整数。
根据权利要求1至7任一所述的方法，其特征在于，所述第一节点获取哈希环，包括：

所述第一节点确定X个第二集群对应的Y个哈希值，其中，每个第二集群对应至少一个哈希值，所述X正整数，所述Y为大于或等于X的正整数；

所述第一节点根据所述Y个哈希值生成所述哈希环，其中，所述哈希环包括Y个哈希节点，每个第二集群对应至少一个哈希节点，所述Y个哈希节点将所述哈希环划分为Y个哈希值区间，每个哈希节点对应一个哈希值区间。
根据权利要求1至7任一所述的方法，其特征在于，所述第一节点获取哈希环，包括：

所述第一节点接收所述第二集群发送的所述哈希环。
根据权利要求1至9任一所述的方法，其特征在于，所述方法还包括：

所述第一节点向所述目标第二集群发送所述第一集群的资源空闲量。
一种资源借调方法，其特征在于，所述方法包括：

第二节点确定与目标第二集群具有关联关系的第一集群，其中，所述第二节点属于所述目标第二集群，所述目标第二集群对应于哈希环中的目标哈希值区间，所述第一集群对应的哈希值属于所述目标哈希值区间；

所述第二节点接收任务数据；

所述第二节点向第一节点发送第一资源借调请求，所述第一资源借调请求用于指示所述第一节点将所述任务数据分配给所述第一集群处理。
根据权利要求11所述的方法，其特征在于，所述方法还包括：

所述第二节点基于向第一节点发送第一资源借调请求，确定所述第一集群处于资源不可借调状态。
根据权利要求12所述的方法，其特征在于，所述方法还包括：

所述第二节点接收第一节点发送的第一集群的资源空闲量。
根据权利要求11至13任一所述的方法，其特征在于，与所述目标第二集群具有关联关系的集群有多个，所述第二节点确定与目标第二集群具有关联关系的第一集群，包括：

所述第二节点确定与所述目标第二集群具有关联关系的多个集群中的一个集群为第一集群。
根据权利要求14所述的方法，其特征在于，所述第二节点确定与所述目标第二集群具有关联关系的多个集群中的一个集群为第一集群，包括：

所述第二节点确定与所述目标第二集群具有关联关系的多个集群的资源空闲量中，与所述任务数据的资源需求量差值最小的资源空闲量对应的集群为所述第一集群。
根据权利要求11至15任一所述的方法，其特征在于，所述方法还包括：

所述第二节点接收第三节点发送的所述任务数据的资源需求量；

基于所述第一集群的资源空闲量大于或等于所述资源需求量，所述第二节点向所述第三节点发送所述第一集群的标识和第一集群的资源空闲量。
根据权利要求16所述的方法，其特征在于，所述第二节点接收任务数据包括：

所述第二节点接收所述第三节点发送的第二资源借调请求，所述第二资源借调请求包括所述任务数据，所述第二借调请求用于指示所述第二节点将所述任务数据分配给所述第一集群处理。
一种资源借调方法，其特征在于，包括：

第二节点接收第三节点发送的任务数据的资源需求量；

所述第二节点确定与目标第二集群具有关联关系的第一集群，其中，所述第二节点属于所述目标第二集群，所述目标第二集群对应于哈希环中的目标哈希值区间，所述第一集群对应的哈希值属于所述目标哈希值区间；

基于所述第一集群的资源空闲量大于或等于所述资源需求量，所述第二节点向所述第三节点发送第三资源借调请求，所述第三资源借调请求用于指示所述第三节点被允许从所述第一集群申请资源。
根据权利要求18所述的方法，其特征在于，与所述目标第二集群具有关联关系的集群有多个，所述第二节点确定与目标第二集群具有关联关系的第一集群，包括：

所述第二节点确定与所述目标第二集群具有关联关系的多个集群中的一个集群为第一集群。
一种资源借调方法，其特征在于，包括：

第三节点接收任务数据；

所述第三节点向第二节点发送所述任务数据的资源需求量；

所述第三节点接收所述第二节点发送的第三资源借调请求，所述第三资源借调请求用于指示所述第三节点被允许从第一集群申请资源，其中，所述第二节点属于目标第二集群，所述目标第二集群对应于哈希环中的目标哈希值区间，所述第一集群对应的哈希值属于所述目标哈希值区间，且所述第一集群的资源空闲量大于或等于所述资源需求量；

所述第三节点向第一节点发送第一资源借调请求，所述第一借调请求用于指示所述第一节点将所述任务数据分配给所述第一集群处理。
根据权利要求20所述的方法，其特征在于，所述第三节点向第二节点发送所述任务数据的资源需求量，包括：

所述第三节点向多个节点发送所述任务数据的资源需求量，所述第二节点为所述多个节点中的一个；

所述第三节点接收所述第二节点发送的第三资源借调请求，包括：

所述第三节点接收所述多个节点发送的第三资源借调请求，所述第三资源借调请求用于指示所述第三节点被允许从多个子集群申请资源，所述第一集群为所述多个子集群中的一个。
根据权利要求21所述的方法，其特征在于，所述方法还包括：

所述第三节点确定所述多个子集群的资源空闲量中，与所述任务数据的资源需求量的差值最小的资源空闲量对应的子集群为所述第一集群。
一种第一管理节点，其特征在于，所述第一管理节点包括：

处理模块，用于确定第一集群对应的哈希值；获取哈希环，所述哈希环包括至少一个哈希值区间，每个哈希值区间对应一个第二集群；根据所述第一集群对应的哈希值确定对应的目标第二集群，其中，所述第一集群对应的哈希值属于目标哈希区间，所述目标哈希区间为所述至少一个哈希值区间中的一个哈希值区间，所述目标哈希区间对应所述目标第二集群；

收发模块，用于建立第一集群和目标第二集群的关联关系，其中，与所述第一集群建立了关联关系的所述目标第二集群被允许从所述第一集群申请资源。
根据权利要求23所述的第一管理节点，其特征在于，所述哈希环包括第一哈希节点和第二哈希节点，所述第一哈希节点对应所述目标第二集群，所述第一哈希节点为所述哈希环上所述第二哈希节点的相邻后继节点，所述目标哈希区间为所述第一哈希节点的哈希值与所述第二哈希节点的哈希值之间的哈希区间。
根据权利要求23或24所述的第一管理节点，其特征在于，所述处理模块，还用于对包括多个计算节点的空闲集群进行划分，得到多个子集群，所述第一集群为所述多个子集群中的一个。
根据权利要求25所述的第一管理节点，其特征在于，所述多个子集群包括第三子集群和第四子集群，所述第三子集群为所述多个子集群中资源空闲量最大的子集群，所述第四子集群为所述多个子集群中资源空闲量最小的集群，所述第三子集群的资源空闲量与所述第四子集群的资源空闲量的差值的绝对值小于第一阈值。
根据权利要求25所述的第一管理节点，其特征在于，所述多个子集群中的每个子集群的资源空闲量与预设资源空闲量的差值的绝对值小于或等于第二阈值，所述预设资源空闲量与历史资源请求量相关。
根据权利要求23至27任一所述的第一管理节点，其特征在于，所述收发模块还用于：

接收所述目标第二集群发送的第一资源借调请求，所述第一资源借调请求包括任务数据和第一集群的标识；

根据所述第一集群的标识向所述第一集群发送所述任务数据。
根据权利要求23至28任一所述的第一管理节点，其特征在于，所述哈希环包括Y个哈希节点，每个第二集群对应至少一个哈希节点，且所述Y个哈希节点的对应的哈希值和所述第一集群对应的哈希值为根据相同的哈希算法生成的，所述Y为正整数。
根据权利要求23至29任一所述的第一管理节点，其特征在于，所述处理模块，还用于确定X个第二集群对应的Y个哈希值，其中，每个第二集群对应至少一个哈希值，所述X正整数，所述Y为大于或等于X的正整数；根据所述Y个哈希值生成所述哈希环，其中，所述哈希环包括Y个哈希节点，每个第二集群对应至少一个哈希节点，所述Y个哈希节点将所述哈希环划分为Y个哈希值区间，每个哈希节点对应一个哈希值区间。
根据权利要求23至29任一所述的第一管理节点，其特征在于，所述收发模块，还用于接收所述第二集群发送的所述哈希环。
根据权利要求23至31任一所述的第一管理节点，其特征在于，所述收发模块，还用于向所述目标第二集群发送所述第一集群的资源空闲量。
一种第二管理节点，其特征在于，所述第二管理节点包括：

处理模块，用于确定与目标第二集群具有关联关系的第一集群，其中，所述第二节点属于所述目标第二集群，所述目标第二集群对应于哈希环中的目标哈希值区间，所述第一集群对应的哈希值属于所述目标哈希值区间；

收发模块，用于接收任务数据，并向第一节点发送第一资源借调请求，所述第一借调请求用于指示所述第一节点将所述任务数据分配给所述第一集群处理。
根据权利要求33所述的第二管理节点，其特征在于，所述处理模块，还用于基于收发模块向第一节点发送第一资源借调请求，确定所述第一集群处于资源不可借调状态。
根据权利要求33或34所述的第二管理节点，其特征在于，与所述目标第二集群具有关联关系的集群有多个，所述处理模块，具体用于确定与所述目标第二集群具有关联关系的多个集群中的一个集群为第一集群。
根据权利要求35所述的第二管理节点，其特征在于，所述处理模块，具体用于确定与所述目标第二集群具有关联关系的多个集群的资源空闲量中，与所述任务数据的资源需求量差值最小的资源空闲量对应的集群为所述第一集群。
根据权利要求33至36任一所述的第二管理节点，其特征在于，所述收发模块，还用于接收第三节点发送的所述任务数据的资源需求量，并基于所述第一集群的资源空闲量大于或等于所述资源需求量，向所述第三节点发送所述第一集群的标识和第一集群的资源空闲量。
根据权利要求37所述的第二管理节点，其特征在于，所述收发模块，具体用于接收所述第三节点发送的第二资源借调请求，所述第二资源借调请求包括所述任务数据，所述第二借调请求用于指示所述第二节点将所述任务数据分配给所述第一集群处理。
一种第二管理节点，其特征在于，所述第二管理节点包括：

收发模块，用于接收第三节点发送的任务数据的资源需求量；

处理模块，用于确定与目标第二集群具有关联关系的第一集群，其中，所述第二节点属于所述目标第二集群，所述目标第二集群对应于哈希环中的目标哈希值区间，所述第一集群对应的哈希值属于所述目标哈希值区间；

所述收发模块，还用于基于所述第一集群的资源空闲量大于或等于所述资源需求量，向所述第三节点发送第三资源借调请求，所述第三资源借调请求用于指示所述第三节点被允许从所述第一集群申请资源。
根据权利要求39所述的第二管理节点，其特征在于，与所述目标第二集群具有关联关系的集群有多个，所述处理模块，具体用于确定与所述目标第二集群具有关联关系的多个集群中的一个集群为第一集群。
一种第三管理节点，其特征在于，所述第三管理节点包括：

收发模块，用于接收任务数据，向第二节点发送所述任务数据的资源需求量，接收所述第二节点发送的第三资源借调请求，所述第三资源借调请求用于指示所述第三节点被允许从第一集群申请资源，其中，所述第二节点属于目标第二集群，所述目标第二集群对应于哈希环中的目标哈希值区间，所述第一集群对应的哈希值属于所述目标哈希值区间，且所述第一集群的资源空闲量大于或等于所述资源需求量，向第一节点发送第一资源借调请求，所述第一借调请求用于指示所述第一节点将所述任务数据分配给所述第一集群处理。
根据权利要求41所述的第三管理节点，其特征在于，所述收发模块，具体用于向多个节点发送所述任务数据的资源需求量，所述第二节点为所述多个节点中的一个，接收所述多个节点发送的第三资源借调请求，所述第三资源借调请求用于指示所述第三节点被允许从多个子集群申请资源，所述第一集群为所述多个子集群中的一个。
根据权利要求42所述的第三管理节点，其特征在于，所述第三管理节点还包括：

处理模块，用于确定所述多个子集群的资源空闲量中，与所述任务数据的资源需求量的差值最小的资源空闲量对应的子集群为所述第一集群。
一种集群，其特征在于，所述集群包括多个计算节点，所述计算节点为任务数据提供所需的资源以执行所述任务数据，以及，所述集群还包括：如权利要求23-32中任意一项权利要求所述的第一管理节点。
一种集群，其特征在于，所述集群包括多个计算节点，所述计算节点为任务数据提供所需的资源以执行所述任务数据，以及，所述集群还包括：如权利要求33-40中任意一项权利要求所述的第二管理节点。
一种集群，其特征在于，所述集群包括多个计算节点，所述计算节点为任务数据提供所需的资源以执行所述任务数据，以及，所述集群还包括：如权利要求41至43中任意一项权利要求所述的第三管理节点。
一种分布式系统，其特征在于，所述分布式系统包括如权利要求44所述的集群和权利要求45所述的集群。
一种分布式系统，其特征在于，所述分布式系统包括如权利要求44所述的集群、权利要求45所述的集群以及如权利要求46所述的集群。