WO2022012621A1

WO2022012621A1 - 联邦学习方法、装置和系统、电子设备、存储介质

Info

Publication number: WO2022012621A1
Application number: PCT/CN2021/106469
Authority: WO
Inventors: 杜永生
Original assignee: ZTE Corp
Current assignee: ZTE Corp
Priority date: 2020-07-17
Filing date: 2021-07-15
Publication date: 2022-01-20
Anticipated expiration: 2023-01-17
Also published as: US20230281508A1; EP4184361A1; CN113282933B; EP4184361A4; CN113282933A

Abstract

本公开提供了一种联邦学习方法、装置和系统、电子设备、计算机可读存储介质，联邦学习方法应用于第i层节点，i为大于或等于2，且小于或等于(N-1)的整数，(N-1)为联邦学习的层数，该方法包括：接收到第i层节点下的至少一个第(i-1)层节点上报的对应的第一梯度；根据至少一个第(i-1)层节点对应的第一梯度和第i层节点对应的第(i-1)层权重指标计算第i层节点对应的更新的第(i-1)层全局梯度；其中，第(i-1)层权重指标为通信指标。图4

Description

联邦学习方法、装置和系统、电子设备、存储介质

相关申请的交叉引用

本公开要求在2020年7月17日提交国家知识产权局、申请号为202010695940.2、发明名称为“联邦学习方法、装置和系统、电子设备、存储介质”的中国专利申请的优先权，该申请的全部内容通过引用结合在本公开中。

技术领域

本公开实施例涉及但不限于人工智能领域，特别涉及联邦学习方法、装置和系统、电子设备、计算机可读存储介质。

背景技术

在数据化最为成熟的通信领域，如果进行智能化，显然面临这样一个问题，智能化带来的计算负荷资源要求在通信领域实时性要求高的前提下，网络现存设备剩余不多的算力资源目前难以满足通信智能化发展的实时算力要求。

对于存量网络所需的实时计算要求，目前主要的解决思路是把网络设备(即网络的中心计算节点)的计算从网络设备内部迁移到移动接入网边缘，实现边缘侧的实时智能化计算需求，即在网络中靠近网元侧部署具备数据采集和计算能力的节点(即，NCCN，Near Collect Computer Node)。这种方式对于现存网络，例如3G、4G、部分5G的智能化所带来的实时计算需求起到一个过渡作用。

在这种算力架构下引入联邦学习，不仅能保护网元侧用户数据的隐私，而且能充分利用网络设备不多的算力资源，以及防止数据移动带来的带宽消耗。但是目前的联邦学习方法得到的优化结果往往不是最佳的。

发明内容

本公开实施例提供一种联邦学习方法、装置和系统、电子设备、计算机可读存储介质。

第一方面，本公开实施例提供一种联邦学习方法，应用于第i层节点，i为大于或等于2，且小于或等于(N-1)的整数中的任意一个，(N-1)为联邦学习的层数，该方法包括：接收到第i层节点下的至少一个第(i-1)层节点上报的对应的第一梯度；以及根据至少一个第(i-1)层节点对应的第一梯度和第i层节点对应的第(i-1)层权重指标计算第i层节点对应的更新的第(i-1)层全局梯度；其中，第(i-1)层权重指标为通信指标。

第二方面，本公开实施例提供一种联邦学习方法，应用于第1层节点，该方法包括：将第1层节点对应的更新的梯度上报给第2层节点；以及接收第2层节点发送的更新的第j层全局梯度；其中，第j层全局梯度根据至少一个第j层节点对应的第一梯度和第(j+1)层节点对应的第j层权重指标计算得到；第j层权重指标为通信指标；j为大于或等于1，且小于或等于(N-1)的整数中的任意一个，(N-1)为联邦学习的层数。

第三方面，本公开实施例提供一种联邦学习方法，应用于第N层节点或第N层子系统，(N-1)为联邦学习的层数，该方法包括：接收到第N层节点或第N层子系统下的至少一个第(N-1)层节点上报的对应的第(N-2)层全局梯度；以及根据至少一个第(N-1)层节点对应的第(N-2)层全局梯度和第(N-1)层权重指标计算第N层节点或第N层子系统对应的第(N-1)层全局梯度；其中，第(N-1)层权重指标为通信指标。

第四方面，本公开实施例提供一种电子设备，包括：至少一个处理器；以及存储器，存储器上存储有至少一个程序，当至少一个程序被至少一个处理器执行，使得至少一个处理器实现上述任意一种联邦学习方法。

第五方面，本公开实施例提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现上述任意一种联邦学习方法。

第六方面，本公开实施例提供一种联邦学习系统，包括：第N层节点或第N层子系统，被配置为接收到第N层节点或第N层子系统下的至少一个第(N-1)层节点上报的对应的第(N-2)层全局梯度；根据至少一个第(N-1)层节点对应的第(N-2)层全局梯度和第(N-1)层权重指标计算第N层节点或第N层子系统对应的第(N-1)层全局梯度；其中，第(N-1)层权重指标为通信指标；将第N层节点或第N层子系统对应的第(N-1)层全局梯度下发给至少一个第(N-1)层节点；其中，(N-1)为联邦学习的层数；第i层节点，被配置为接收到第i层节点下的至少一个第(i-1)层节点上报的对应的第一梯度；根据至少一个第(i-1)层节点对应的第一梯度和第i层节点对应的第(i-1)层权重指标计算第i层节点对应的更新的第(i-1)层全局梯度；其中，第(i-1)层权重指标为通信指标；第i层节点还被配置为：将第i层节点对应的更新的第(i-1)层全局梯度下发给第(i-1)层节点；或者，将第i层节点对应的更新的第(i-1)层全局梯度上报给第(i+1)层节点；接收第(i+1)层节点发送的更新的第i层全局梯度到更新的第(N-1)层全局梯度中的任意一个，将更新的第i层全局梯度到更新的第(N-1)层全局梯度中的任意一个下发给第(i-1)层节点；第1层节点，被配置为将第1层节点对应的更新的梯度上报给第2层节点；接收第2层节点发送的更新的第j层全局梯度；其中，第j层全局梯度根据至少一个第j层节点对应的第一梯度和第(j+1)层节点对应的第j层权重指标计算得到；第j层权重指标为通信指标；j为大于或等于1，且小于或等于(N-1)的整数中的任意一个，(N-1)为联邦学习的层数。

本公开实施例提供的联邦学习方法，以通信指标为权重指标来计算全局梯度，由于通信指标对于运营商来说是比较有价值的数据指标，因此基于以通信指标为权重指标来计算的全局梯度进行模型训练得到的模型训练结果对于运营商来说是最优结果，从而提高了优化效果。

附图说明

图1为本公开实施例提供的联邦学习系统架构示意图；

图2为本公开实施例提供的单层联邦学习系统架构示意图；

图3为本公开实施例提供的双层联邦学习系统架构示意图；

图4为本公开一个实施例提供的联邦学习方法的流程图；

图5为本公开另一个实施例提供的联邦学习方法的流程图；

图6为本公开另一个实施例提供的联邦学习方法的流程图；

图7为本公开示例1-4提供的联邦学习系统架构示意图；

图8为本公开示例5提供的联邦学习系统架构示意图；

图9为本公开另一个实施例提供的联邦学习装置的组成框图；

图10为本公开另一个实施例提供的联邦学习装置的组成框图；

图11为本公开另一个实施例提供的联邦学习装置的组成框图。

具体实施方式

为使本领域的技术人员更好地理解本公开的技术方案，下面结合附图对本公开提供的联邦学习方法、装置和系统、电子设备、计算机可读存储介质进行详细描述。

在下文中将参考附图更充分地描述示例实施例，但是所述示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之，提供这些实施例的目的在于使本公开透彻和完整，并将使本领域技术人员充分理解本公开的范围。

在不冲突的情况下，本公开各实施例及实施例中的各特征可相互组合。

如本文所使用的，术语“和/或”包括至少一个相关列举条目的任何和所有组合。

本文所使用的术语仅用于描述特定实施例，且不意欲限制本公开。如本文所使用的，单数形式“一个”和“该”也意欲包括复数形式，除非上下文另外清楚指出。还将理解的是，当本说明书中使用术语“包括”和/或“由……制成”时，指定存在所述特征、整体、步骤、操作、元件和/或组件，但不排除存在或添加至少一个其它特征、整体、步骤、操作、元件、组件和/或其群组。

除非另外限定，否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解，诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义，且将不解释为具有理想化或过度形式上的含义，除非本文明确如此限定。

目前的横向联邦学习方法大致包括：

参与方用本地数据进行模型训练得到更新的梯度，使用加密、差分隐私(DP，Different Privacy)或秘密共享技术对更新的梯度进行隐私保护处理，得到隐私保护处理后的梯度；将隐私保护处理后的梯度发送到中心服务器；

中心服务器对至少一个参与方对应的隐私保护处理后的梯度进行解密，得到至少一个参与方对应的更新的梯度，根据至少一个参与方对应的更新的梯度计算更新的全局梯度，将更新的全局梯度分别下发给每一个参与者；

参与方根据更新的全局梯度更新模型。

上述横向联邦学习方法中，更新的全局梯度一般采用谷歌(Google)的联合平均(FedAvg，Federated Averaging)算法，即将所有参与方(或者随机一部分参与方)对应更新的梯度取平均值或加权平均值得到更新的全局梯度；其中，权重为参与方参与训练的数据量。这种方法以参与方参与训练的数据量作为权重，由于参与训练的数据量不等同于运营商关注的有价值的数据量，因此，模型训练结果对于运营商来说并不是最优结果；并且，没有对参与方进行区分，无法实现个性化的优化，从而降低优化效果。

下面介绍本公开实施例提供的联邦系统架构。

图1为本公开实施例提供的联邦学习系统架构示意图。如图1所示，本公开实施例的联邦学习系统用于实现(N-1)层联邦学习，N为大于或等于2的整数。

本公开实施例的(N-1)层联邦学习由N层节点实现，或(N-1)层联邦学习由第1层节点到第(N-1)层节点以及第N层子系统实现；并且，第1层节点到第(N-1)层节点均包括一个或一个以上，而第N层节点或第N层子系统仅包括一个。

具体的，第i层联邦学习由第i层节点和第(i+1)层节点实现，i为大于或等于1，且小于或等于(N-2)的整数；第(N-1)层联邦学习由第(N-1)层节点和第N层节点实现，或第(N-1)层联邦学习由第(N-1)层节点和第N层子系统实现。

需要说明的是，不同的第(i+1)层节点的下一层节点(即，第i层节点)不同。

需要说明的是，第1层节点可以是网元(NE，Network Element)，如基站，第2层节点到第(N-1)层节点可以是NCCN，第N层节点或第N层子系统可以是网元管理系统(EMS，Element Management System)对应的节点或子系统。

需要说明的是，第2层节点到第(N-1)层节点可以是实体设备，也可以是虚拟节点。

例如，图2以单层联邦学习为例给出了单层联邦学习系统架构示意图。如图2所示，单层联邦学习系统实现了单层联邦学习，单层联邦学习由第1层节点和第2层节点实现，或单层联邦学习由第1层节点和第2层子系统实现。

又如，图3以双层联邦学习为例给出了双层联邦学习系统架构示意图。如图3所示，双层联邦学习由第1层节点、第2层节点和第3层节点实现，或双层联邦学习由第1层节点、第2层节点和第3层子系统实现。具体的，第1层联邦学习由第1层节点和第2层节点实现，第2层联邦学习由第2层节点和第3层节点实现，或第2层联邦学习由第2层节点和第3层子系统实现。

下面分别从第1层节点侧、第2层节点到第(N-1)层节点中任何一层节点侧、第N层节点或第N层子系统侧来分别描述联邦学习过程。

图4为本公开一个实施例提供的联邦学习方法的流程图。

第一方面，参照图4，本公开一个实施例提供一种联邦学习方法，应用于第i层节点，i为大于或等于2，且小于或等于(N-1)的整数中的任意一个，(N-1)为联邦学习的层数，该方法包括：

步骤400、接收到第i层节点下的至少一个第(i-1)层节点上报的对应的第一梯度。

在一些示例性实施例中，若i等于2，第(i-1)层节点对应的第一梯度为第(i-1)层节点进行模型训练得到的更新的梯度。

在一些示例性实施例中，若i等于2，为了提高安全性，第(i-1)层节点对应的第一梯度也可以是第(i-1)层节点进行模型训练得到更新的梯度后，对第(i-1)层节点对应的更新的梯度进行隐私保护处理得到的第(i-1)层节点对应的第二梯度。

在一些示例性实施例中，若i大于2，且小于或等于(N-1)，第(i-1)层节点对应的第一梯度为第(i-1)层节点对应的更新的第(i-2)层全局梯度。

在一些示例性实施例中，若i大于2，且小于或等于(N-1)，为了提高安全性，第(i-1)层节点对应的第一梯度也可以是第(i-1)层节点对第(i-1)层节点对应的更新的第(i-2)层全局梯度进行隐私保护处理得到的第(i-1)层节点对应的隐私保护处理后的第(i-2)层全局梯度。

在一些示例性实施例中，隐私保护处理可以采用加密、DP或秘密共享技术实现，也可以采用其他的方式实现，具体的实现方式不用于限定本公开实施例的保护范围。

步骤401、根据至少一个第(i-1)层节点对应的第一梯度和第i层节点对应的第(i-1)层权重指标计算第i层节点对应的更新的第(i-1)层全局梯度；其中，第(i-1)层权重指标为通信指标。

在一些示例性实施例中，通信指标包括以下至少一个：平均时延、话务量、上下行流量、话务量和上下行流量的加权平均。

在一些示例性实施例中，同一层的不同节点对应的权重指标相同或不同，不同层的不同节点对应的权重指标相同或不同。例如，为了实现网络优化的实时性，可以将同一层的不同节点对应的权重指标设置为相同，也就是采用至少一个同一层的不同节点来实现同一个权重指标的优化，类似于分布式系统；为了实现网络优化的个性化，可以将同一层的不同节点对应的权值指标设置为不同，具体可以设置同一层的任意两个节点对应的权重指标均不相同，也可以设置同一层的其中一部分节点对应的权重指标相同，同一层的另一部分节点对应的权重指标不同，具体视实际情况而定。

在一些示例性实施例中，第i层节点对应的第(i-1)层权重指标可以统一设置在第N层节点或第N层子系统中，具体设置时，可以设置第i层节点和第(i-1)层权重指标之间的对应关系。这种设置方式中，在第N层节点或第N层子系统逐层下发联邦学习任务时，可以将第i层节点对应的第(i-1)层权重指标随联邦学习任务一起逐层下发到第i层节点，也可以单独将第i层节点对应的第(i-1)层权重指标逐层下发到第i层节点，也可以不将第i层节点对应的第(i-1)层权重指标随联邦学习任务一起逐层下发到第i层节点。

在一些示例性实施例中，第i层节点对应的第(i-1)层权重指标也可以设置在对应的第i层节点上，这样省去了第N层节点或第N层子系统将第i层节点对应的第(i-1)层权重指标逐层下发到第i层节点的过程，从而节省了网络开销。

在一些示例性实施例中，根据至少一个第(i-1)层节点对应的第一梯度和第i层节点对应的第(i-1)层权重指标计算第i层节点对应的更新的第(i-1)层全局梯度包括：

根据第i层节点对应的第(i-1)层权重指标获取至少一个第(i-1)层节点对应的第(i-1)层权重指标值；以至少一个第(i-1)层节点对应的第(i-1)层权重指标值为权重，计算至少一个第(i-1)层节点对应的第一梯度的加权平均值，得到第i层节点对应的更新的第(i-1)层全局梯度。

在一些示例性实施例中，如果第(i-1)层节点对应的第一梯度为第(i-1)层节点对应的第二梯度，或第(i-1)层节点对应的隐私保护处理后的第(i-2)层全局梯度，则需要先对第(i-1)层节点对应的第一梯度进行去隐私保护处理，也就是进行隐私保护处理的反处理。例如，如果隐私保护处理为加密，那么去隐私保护处理就是解密，其他的隐私保护处理方式以此类推；然后再计算至少一个第(i-1)层节点对应的去隐私保护处理后的第一梯度的加权平均值。

在一些示例性实施例中，对于某些隐私保护处理方式，例如同态加密方式，也可以不用对第(i-1)层节点对应的第一梯度进行去隐私保护处理，而直接计算至少一个第(i-1)层节点对应的第一梯度的加权平均值。

在一些示例性实施例中，第(i-1)层节点对应的第(i-1)层权重指标值可以根据第(i-1)层节点下的所有第1层节点对应的第(i-1)层权重指标值获得，具体可以采用多种方式获得，例如，每一个第1层节点分别获得对应的第(i-1)层权重指标值后，逐层上报到第(i-1)层节点，由第(i-1)层节点统一进行计算；又如，每一个第1层节点分别获得对应的第(i-1)层权重指标值后，逐层上报到第(i-1)层节点，每上报一层节点，则进行一次计算；又如，由第(i-1)层节点获取用于计算第(i-1)层权重指标值的第1层节点的相关信息，然后基于第1层节点的相关信息分别计算每一个第1层节点对应的第(i-1)层权重指标值，然后计算第(i-1)层节点对应的第(i-1)层权重指标值；等等，当然，还有其他很多的获取方式，具体的获取方式不用于限定本公开实施例的保护范围。

在一些示例性实施例中，按照公式

计算第i层节点对应的更新的第(i-1)层全局梯度；

其中，GRA _i为第i层节点对应的更新的第(i-1)层全局梯度，GRA _m _(i-1)为第i层节点下的第m个第(i-1)层节点对应的第一梯度，KPI _m(i-1)为第i层节点下的第m个第(i-1)层节点对应的第(i-1)层权重指标值。

在一些示例性实施例中，如果权重指标为平均时延，那么只需要计算以平均时延为权重的全局梯度。

在一些示例性实施例中，如果权重指标为话务量，那么只需要计算以话务量为权重的全局梯度。

在一些示例性实施例中，如果权重指标为上下行流量，那么只需要计算以上下行流量为权重的全局梯度。

在一些示例性实施例中，如果权重指标为话务量和上下行流量的加权平均，那么需要分别计算以话务量为权重的全局梯度和以上下行流量为权重的全局梯度，然后计算以话务量为权重的全局梯度和以上下行流量为权重的全局梯度的加权平均值。

在一些示例性实施例中，接收到第i层节点下的至少一个第(i-1)层节点上报的对应的第一梯度之前，该方法还包括：

步骤402、接收到第(i+1)层节点发送的联邦学习任务，将联邦学习任务下发给至少一个第(i-1)层节点。

在一些示例性实施例中，联邦学习任务可以是第N层节点或第N层子系统中的业务应用发起的业务联邦学习过程请求后，向第(N-1)层节点下发，并逐层下发的第1层节点的，从而第i层节点在接收到第(i+1)层节点发送的联邦学习任务后，将联邦学习任务下发给至少一个第(i-1)层节点。

在一些示例性实施例中，业务联邦学习过程请求中包括训练的第1层节点范围，第N层节点或第N层子系统从业务联邦学习过程请求中获取训练的第1层节点范围，基于训练的第1层节点范围确定联邦学习任务需要下发的第(N-1)层节点范围。如何基于训练的第1层节点范围确定联邦学习任务需要下发的第(N-1)层节点范围具体取决于训练的第1层节点范围对应的第1层节点所连接的第(N-1)层节点，例如基于图1所示的拓扑结构来确定。

在一些示例性实施例中，在第i层节点向第(i-1)层节点下发联邦学习任务时，还可以下发训练的第1层节点范围，使得第(i-1)层节点根据训练的第1层节点范围确定联邦学习任务需要下发的第(i-2)层节点。如何基于训练的第1层节点范围确定联邦学习任务需要下发的第(i-2)层节点范围具体取决于训练的第1层节点范围对应的第1层节点所连接的第(i-2)层节点，例如基于图1所示的拓扑结构来确定。

在一些示例性实施例中，若当前状态是进行第(i-1)层联邦学习过程，根据至少一个第(i-1)层节点对应的第一梯度和第i层节点对应的第(i-1)层权重指标计算第i层节点对应的更新的第(i-1)层全局梯度之后，该方法还包括：

将第i层节点对应的更新的第(i-1)层全局梯度下发给第(i-1)层节点。

在一些示例性实施例中，第i层节点将第i层节点对应的更新的第(i-1)层全局梯度下发给第(i-1)层节点，并逐层下发至第1层节点，以供第1层节点根据第(N-1)层全局梯度更新模型。

在一些示例性实施例中，若当前状态是进行第i层联邦学习过程到第(N-1)层联邦学习过程中的任何一层联邦学习过程，根据至少一个第(i-1)层节点对应的第一梯度和第i层节点对应的第(i-1)层权重指标计算第i层节点对应的更新的第(i-1)层全局梯度之后，该方法还包括：

将第i层节点对应的更新的第(i-1)层全局梯度上报给第(i+1)层节点；接收第(i+1)层节点发送的更新的第i层全局梯度到更新的第(N-1)层全局梯度中的任意一个，将更新的第i层全局梯度到更新的第(N-1)层全局梯度中的任意一个下发给第(i-1)层节点。

在一些示例性实施例中，第i层节点将更新的第i层全局梯度到更新的第(N-1)层全局梯度中的任意一个下发给第(i-1)层节点，并逐层下发至第1层节点，以供第1层节点根据第(N-1)层全局梯度更新模型。

在一些示例性实施例中，第1层节点接收到联邦学习任务后，根据联邦学习任务进行模型训练得到更新的梯度，并将第1层节点对应的更新的梯度上报给第2层节点；第2层节点根据至少一个第1层节点对应的更新的梯度和第2层节点对应的第1层权重指标计算第2层节点对应的更新的第1层全局梯度；如果当前状态是进行第1层联邦学习过程，则第2层节点将对应的更新的第1层全局梯度下发给第1层节点，第1层节点根据更新的第1层全局梯度更新模型；如果当前状态是进行第2层联邦学习过程到第(N-1)层联邦学习过程中的任何一层联邦学习过程，则第2层节点将对应的更新的第1层全局梯度上报给第3层节点；

当i大于2，且小于或等于(N-1)时，第i层节点根据至少一个第(i-1)层节点对应的更新的第(i-2)层全局梯度和第i层节点对应的第(i-1)层权重指标计算第i层节点对应的更新的第(i-1)层全局梯度；如果当前状态是进行第(i-1)层联邦学习过程，则第i层节点将对应的更新的第(i-1)层全局梯度下发给第(i-1)层节点，并逐层下发至第1层节点，第1层节点根据更新的第(i-1)层全局梯度更新模型；如果当前状态是进行第i层联邦学习过程到第(N-1)层联邦学习过程中的任何一层联邦学习过程，则第i层节点将对应的更新的第(i-1)层全局梯度上报给第(i+1)层节点。

图5为本公开另一个实施例提供的联邦学习方法的流程图。

第二方面，参照图5，本公开另一个实施例提供一种联邦学习方法，应用于第1层节点，该方法包括：

步骤500、将第1层节点对应的更新的梯度上报给第2层节点。

在一些示例性实施例中，为了提高安全性，第1层节点也可以先对第1层节点对应的更新的梯度进行隐私保护处理得到第1层节点对应的隐私保护处理后的梯度，再将第1层节点对应的隐私保护处理后的梯度上报给第2层节点。

第2层节点接收到第1层节点对应的隐私保护处理后的梯度，需要先对第1层节点对应的隐私保护处理后的梯度进行去隐私保护处理，也就是进行隐私保护处理的反处理，例如，如果隐私保护处理为加密，那么去隐私保护处理就是解密，其他的隐私保护处理方式以此类推；然后再计算至少一个第1层节点对应的更新的梯度的加权平均值。

或者，对于某些隐私保护处理方式，例如同态加密方式，第2层节点也可以不用对第1层节点对应的隐私保护处理后的梯度进行去隐私保护处理，而直接计算至少一个第1层节点对应的隐私保护处理后的梯度的加权平均值。

步骤501、接收第2层节点发送的更新的第j层全局梯度；其中，第j层全局梯度根据至少一个第j层节点对应的第一梯度和第(j+1)层节点对应的第j层权重指标计算得到；第j层权重指标为通信指标；j为大于或等于1，且小于或等于(N-1)的整数中的任意一个，(N-1)为联邦学习的层数。

在一些示例性实施例中，若j等于1，第j层节点对应的第一梯度为第j层节点对应的更新的梯度。

在一些示例性实施例中，若j等于1，为了提高安全性，第j层节点对应的第一梯度也可以是第j层节点进行模型训练得到更新的梯度后，对第j层节点对应的更新的梯度进行隐私保护处理得到的第j层节点对应的第二梯度。

在一些示例性实施例中，若j大于1，且小于或等于(N-1)，第j层节点对应的第一梯度为第j层节点对应的更新的第(j-1)层全局梯度。

在一些示例性实施例中，若j大于1，且小于或等于(N-1)，为了提高安全性，第j层节点对应的第一梯度也可以是第j层节点对第j层节点对应的更新的第(j-1)层全局梯度进行隐私保护处理得到的第j层节点对应的隐私保护处理后的第(j-1)层全局梯度。

在一些示例性实施例中，时延是指第1层节点发出数据请求到接收到数据之间的时延，或发出网址访问请求到接收到网址内容之间的时延。

在一些示例性实施例中，第(j+1)层节点对应的第j层权重指标可以统一设置在第N层节点或第N层子系统中。在具体设置时，第(j+1)层节点对应的第j层权重指标可以设置第(j+1)层节点和第j层权重指标之间的对应关系。这种设置方式中，在第N层节点或第N层子系统逐层下发联邦学习任务时，可以将第(j+1)层节点对应的第j层权重指标随联邦学习任务一起逐层下发到第(j+1)层节点，也可以单独将第(j+1)层节点对应的第j层权重指标逐层下发到第(j+1)层节点，也可以不将第(j+1)层节点对应的第j层权重指标随联邦学习任务一起逐层下发到第(j+1)层节点。

在一些示例性实施例中，第(j+1)层节点对应的第j层权重指标也可以设置在对应的第(j+1)层节点上，这样省去了第N层节点或第N层子系统将第(j+1)层节点对应的第j层权重指标逐层下发到第(j+1)层节点的过程，从而节省了网络开销。

在一些示例性实施例中，根据至少一个第j层节点对应的第一梯度和第(j+1)层节点对应的第j层权重指标计算得到第j层全局梯度包括：

根据第(j+1)层节点对应的第j层权重指标获取至少一个第j层节点对应的第j层权重指标值；以至少一个第j层节点对应的第j层权重指标值为权重，计算至少一个第j层节点对应的第一梯度的加权平均值，得到第(j+1)层节点对应的更新的第j层全局梯度。

在一些示例性实施例中，如果第j层节点对应的第一梯度为第j层节点对应的第二梯度，或第j层节点对应的隐私保护处理后的第(j-1)层全局梯度，则需要先对第j层节点对应的第一梯度进行去隐私保护处理，也就是进行隐私保护处理的反处理，例如，如果隐私保护处理为加密，那么去隐私保护处理就是解密，其他的隐私保护处理方式以此类推；然后再计算至少一个第j层节点对应的去隐私保护处理后的第一梯度的加权平均值。

在一些示例性实施例中，对于某些隐私保护处理方式，例如同态加密方式，也可以不用对第j层节点对应的第一梯度进行去隐私保护处理，而直接计算至少一个第j层节点对应的第一梯度的加权平均值。

在一些示例性实施例中，第j层节点对应的第j层权重指标值可以根据第j层节点下的所有第1层节点对应的第j层权重指标值获得，具体可以采用多种方式获得，例如，每一个第1层节点分别获得对应的第j层权重指标值后，逐层上报到第j层节点，由第j层节点统一进行计算；又如，每一个第1层节点分别获得对应的第j层权重指标值后，逐层上报到第j层节点，每上报一层节点，则进行一次计算；又如，由第j层节点获取用于计算第j层权重指标值的第1层节点的相关信息，然后基于第1层节点的相关信息分别计算每一个第1层节点对应的第j层权重指标值，然后计算第j层节点对应的第j层权重指标值；等等，当然，还有其他很多的获取方式，具体的获取方式不用于限定本公开实施例的保护范围。

在一些示例性实施例中，按照公式

计算第j层节点对应的更新的第(j-1)层全局梯度；

其中，GRA _j为第j层节点对应的更新的第(j-1)层全局梯度，GRA _m _(j-1)为第j层节点下的第m个第(j-1)层节点对应的第一梯度，KPI _m(j-1)为第j层节点下的第m个第(j-1)层节点对应的第(j-1)层权重指标值。

在一些示例性实施例中，将第1层节点对应的更新的梯度上报给第2层节点之前，该方法还包括：进行模型训练得到第1层节点对应的更新的梯度；

相应的，接收第2层节点发送的更新的第j层全局梯度之后，该方法还包括：

根据更新的第j层全局梯度更新模型。

在一些示例性实施例中，可以根据联邦学习任务进行模型训练得到第1层节点对应的更新的梯度。

在一些示例性实施例中，联邦学习任务可以是第N层节点或第N层子系统中的业务应用发起的业务联邦学习过程请求后，向第(N-1)层节点下发，并逐层下发的第1层节点的，从而第1层节点在接收到第2层节点发送的联邦学习任务后，根据联邦学习任务进行模型训练得到第1层节点对应的更新的梯度。

图6为本公开另一个实施例提供的联邦学习方法的流程图。

第三方面，参照图6，本公开另一个实施例提供一种联邦学习方法，应用于第N层节点或第N层子系统，(N-1)为联邦学习的层数，该方法包括：

步骤600、接收到第N层节点或第N层子系统下的至少一个第(N-1)层节点上报的对应的第(N-2)层全局梯度。

步骤601、根据至少一个第(N-1)层节点对应的第(N-2)层全局梯度和第(N-1)层权重指标计算第N层节点或第N层子系统对应的第(N-1) 层全局梯度；其中，第(N-1)层权重指标为通信指标。

在一些示例性实施例中，通信指标包括以下至少一个：

平均时延、话务量、上下行流量、话务量和上下行流量的加权平均。

在一些示例性实施例中，根据至少一个第(N-1)层节点对应的第(N-2)层全局梯度和第(N-1)层权重指标计算第N层节点或第N层子系统对应的第(N-1)层全局梯度包括：

根据第(N-1)层权重指标获取至少一个第(N-1)层节点对应的第(N-1)层权重指标值；以至少一个第(N-1)层节点对应的第(N-1)层权重指标值为权重，计算至少一个第(N-1)层节点对应的第(N-2)层全局梯度的加权平均值，得到第N层节点或第N层子系统对应的第(N-1)层全局梯度。

在一些示例性实施例中，第(N-1)层节点对应的第(N-1)层权重指标值可以根据第(N-1)层节点下的所有第1层节点对应的第(N-1)层权重指标值获得，具体可以采用多种方式获得，例如，每一个第1层节点分别获得对应的第(N-1)层权重指标值后，逐层上报到第(N-1)层节点，由第(N-1)层节点统一进行计算；又如，每一个第1层节点分别获得对应的第(N-1)层权重指标值后，逐层上报到第(N-1)层节点，每上报一层节点，则进行一次计算；又如，由第(N-1)层节点获取用于计算第(N-1)层权重指标值的第1层节点的相关信息，然后基于第1层节点的相关信息分别计算每一个第1层节点对应的第(N-1)层权重指标值，然后计算第(N-1)层节点对应的第(N-1)层权重指标值；等等，当然，还有其他很多的获取方式，具体的获取方式不用于限定本公开实施例的保护范围。

在一些示例性实施例中，按照公式

计算第N层节点或第N层子系统对应的更新的第(N-1)层全局梯度；

其中，GRA _N为第N层节点或第N层子系统对应的更新的第(N-1)层全局梯度，GRA _m(N-1)为第N层节点或第N层子系统下的第m个第(N-1)层节点对应的第一梯度，KPI _m(N-1)为第N层节点下的第m个第(N-1)层节点对应的第(N-1)层权重指标值。

在一些示例性实施例中，接收到第N层节点或第N层子系统下的至少一个第(N-1)层节点上报的对应的第(N-2)层全局梯度之前，该方法还包括：

步骤602、向第N层节点或第N层子系统下的至少一个第(N-1)层节点下发联邦学习任务。

在一些示例性实施例中，根据至少一个第(N-1)层节点对应的第(N-2)层全局梯度和第(N-1)层权重指标计算第N层节点或第N层子系统对应的第(N-1)层全局梯度之后，该方法还包括：

步骤603、将第N层节点或第N层子系统对应的第(N-1)层全局梯度下发给至少一个第(N-1)层节点。

在一些示例性实施例中，第N层节点或第N层子系统将第N层节点或第N层子系统对应的第(N-1)层全局梯度下发给至少一个第(N-1)层节点，并逐层下发至第1层节点，以供第1层节点根据第(N-1)层全局梯度更新模型。

下面通过几个示例说明本公开实施例的联邦学习方法的具体实现过程，所列举的示例仅仅是为了说明方便，并不用于限定本公开实施例的保护范围。

示例1

本示例描述基于两层联邦学习系统进行两层联邦学习过程。

如图7所示，两层联邦学习系统包括：EMS、一个虚拟NCCN、一个NCCN和四个NE。

其中，虚拟NCCN设置在EMS中，虚拟NCCN下连接有两个NE，分别为NE1和NE2；NCCN连接至EMS，NCCN下连接有两个NE，分别为NE3和NE4。

其中，EMS包括：业务应用、第一任务管理模块、第一全局模型管理模块和权重指标管理模块；虚拟NCCN包括：第二任务管理模块和第二全局模型管理模块；NCCN包括：第三任务管理模块和第三全局模型管理模块。

其中，NE1、NE2、NE3、NE4、NCCN和虚拟NCCN用于实现第1 层联邦学习过程，NCCN、虚拟NCCN和EMS用于实现第2层联邦学习过程。

基于上述两层联邦学习系统的两层联邦学习方法包括：

1.对于未连接到NCCN的NE1和NE2，在EMS中按照业务特征设置虚拟NCCN，把NE1和NE2按照业务特征连接至对应的虚拟NCCN上。

2.在EMS的权重指标管理模块中设置EMS对应的第2层权重指标。例如，如果运营商关注运营收益，则可设置第2层权重指标为：话务量、或上下行流量、或话务量和上下行流量的加权平均。

3.在EMS的权重指标管理模块中按照不同领域的业务特点设置不同的NCCN对应的第1层权重指标，不同的NCCN对应的第1层权重指标可能相同，也可能不同。例如，对于自动驾驶，设置对应的第1层权重指标为平均时延；对于体育场馆，设置对应的第1层权重指标为话务量；对于科技园，设置对应的第1层权重指标为上下行流量。本示例中，虚拟NCCN所属的区域属于自动驾驶区域，整网要求以时延为主，设置虚拟NCCN对应的第1层权重指标为平均时延；NCCN所属的区域属于体育场馆区域，整网要求以话务为主，设置NCCN对应的第1层权重指标为话务量。

4.业务应用向第一任务管理发起业务联邦学习过程请求，并告知训练的基站范围。第一任务管理模块从EMS的权重指标管理模块中获取第2层权重指标、虚拟NCCN对应的第1层权重指标和NCCN对应的第1层权重指标，将第2层权重指标、虚拟NCCN对应的第1层权重指标，放置在联邦学习任务中一起下发给虚拟NCCN的第二任务管理模块；将第2层权重指标、NCCN对应的第1层权重指标，放置在联邦学习任务中一起下发给NCCN的第三任务管理模块。

5.虚拟NCCN的第二任务管理模块接收到携带第2层权重指标、虚拟NCCN对应的第1层权重指标的联邦学习任务，将第2层权重指标、虚拟NCCN对应的第1层权重指标放置到联邦学习任务中，下发给NE1和NE2；NCCN的第三任务管理模块接收到携带第2层权重指标、NCCN对应的第1层权重指标的联邦学习任务，将第2层权重指标、NCCN对应的第1层权重指标放置到联邦学习任务中，下发给NE3和NE4。

6.NE1根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据虚拟NCCN对应的第1层权重指标获取NE1对应的第1层权重指标值；根据第2层权重指标获取NE1对应的第2层权重指标值；使用加密，DP或秘密共享技术对NE1对应的更新的梯度进行隐私保护处理得到NE1对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE1对应的第1层权重指标值进行隐私保护处理得到NE1对应的隐私保护处理后的第1层权重指标值，使用加密，DP或秘密共享技术对NE1对应的第2层权重指标值进行隐私保护处理得到NE1对应的隐私保护处理后的第2层权重指标值；将NE1对应的隐私保护处理后的梯度、NE1对应的隐私保护处理后的第1层权重指标值和NE1对应的隐私保护处理后的第2层权重指标值上报给虚拟NCCN的第二全局模型管理模块。

7.NE2根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据虚拟NCCN对应的第1层权重指标获取NE2对应的第1层权重指标值；根据第2层权重指标获取NE2对应的第2层权重指标值；使用加密，DP或秘密共享技术对NE2对应的更新的梯度进行隐私保护处理得到NE2对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE2对应的第1层权重指标值进行隐私保护处理得到NE2对应的隐私保护处理后的第1层权重指标值，使用加密，DP或秘密共享技术对NE2对应的第2层权重指标值进行隐私保护处理得到NE2对应的隐私保护处理后的第2层权重指标值；将NE2对应的隐私保护处理后的梯度、NE2对应的隐私保护处理后的第1层权重指标值和NE2对应的隐私保护处理后的第2层权重指标值上报给虚拟NCCN的第二全局模型管理模块。

8.NE3根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据NCCN对应的第1层权重指标获取NE3对应的第1层权重指标值；根据第2层权重指标获取NE3对应的第2层权重指标值；使用加密，DP或秘密共享技术对NE3对应的更新的梯度进行隐私保护处理得到NE3对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE3 对应的第1层权重指标值进行隐私保护处理得到NE3对应的隐私保护处理后的第1层权重指标值，使用加密，DP或秘密共享技术对NE3对应的第2层权重指标值进行隐私保护处理得到NE3对应的隐私保护处理后的第2层权重指标值；将NE3对应的隐私保护处理后的梯度、NE3对应的隐私保护处理后的第1层权重指标值和NE3对应的隐私保护处理后的第2层权重指标值上报给NCCN的第三全局模型管理模块。

9.NE4根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据NCCN对应的第1层权重指标获取NE4对应的第1层权重指标值；根据第2层权重指标获取NE3对应的第2层权重指标值；使用加密，DP或秘密共享技术对NE4对应的更新的梯度进行隐私保护处理得到NE4对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE4对应的第1层权重指标值进行隐私保护处理得到NE4对应的隐私保护处理后的第1层权重指标值，使用加密，DP或秘密共享技术对NE4对应的第2层权重指标值进行隐私保护处理得到NE4对应的隐私保护处理后的第2层权重指标值；将NE4对应的隐私保护处理后的梯度、NE4对应的隐私保护处理后的第1层权重指标值和NE4对应的隐私保护处理后的第2层权重指标值上报给虚拟NCCN的第三全局模型管理模块。

10.虚拟NCCN的第二全局模型管理模块对NE1对应的隐私保护处理后的梯度进行去隐私保护处理得到NE1对应的更新的梯度，对NE1对应的隐私保护处理后的第1层权重指标值进行去隐私保护处理得到NE1对应的第1层权重指标值，对NE1对应的隐私保护处理后的第2层权重指标值进行去隐私保护处理得到NE1对应的第2层权重指标值；虚拟NCCN的第二全局模型管理模块对NE2对应的隐私保护处理后的梯度进行去隐私保护处理得到NE2对应的更新的梯度，对NE2对应的隐私保护处理后的第1层权重指标值进行去隐私保护处理得到NE2对应的第1层权重指标值，对NE2对应的隐私保护处理后的第2层权重指标值进行去隐私保护处理得到NE2对应的第2层权重指标值；虚拟NCCN的第二全局模型管理模块按照公式GRA ₁₂＝GRA ₁₁₁KPI ₁₁₁+GRA ₁₂₁KPI ₁₂₁计算虚拟NCCN对应的更新的第1层全局梯度；其中，GRA ₁₂为虚拟NCCN对应的更新的第1层全局梯度，GRA ₁₁₁为NE1对应的更新的梯度，KPI ₁₁₁为NE1对应的第1层权重指标值，GRA ₁₂₁为NE2对应的更新的梯度，KPI ₁₂₁为NE2对应的第1层权重指标值；将虚拟NCCN对应的更新的第1层全局梯度、NE1对应的第2层权重指标值和NE2对应的第2层权重指标值上报给EMS的第一全局模型管理模块。

11.NCCN的第三全局模型管理模块对NE3对应的隐私保护处理后的梯度进行去隐私保护处理得到NE3对应的更新的梯度，对NE3对应的隐私保护处理后的第1层权重指标值进行去隐私保护处理得到NE3对应的第1层权重指标值，对NE3对应的隐私保护处理后的第2层权重指标值进行去隐私保护处理得到NE3对应的第2层权重指标值；NCCN的第三全局模型管理模块对NE4对应的隐私保护处理后的梯度进行去隐私保护处理得到NE4对应的更新的梯度，对NE4对应的隐私保护处理后的第1层权重指标值进行去隐私保护处理得到NE4对应的第1层权重指标值，对NE4对应的隐私保护处理后的第2层权重指标值进行去隐私保护处理得到NE4对应的第2层权重指标值；NCCN的第三全局模型管理模块按照公式GRA ₂₂＝GRA ₂₃₁KPI ₂₃₁+GRA ₂₄₁KPI ₂₄₁计算NCCN对应的更新的第1层全局梯度；其中，GRA ₂₂为NCCN对应的更新的第1层全局梯度，GRA ₂₃₁为NE3对应的更新的梯度，KPI ₂₃₁为NE3对应的第1层权重指标值，GRA ₂₄₁为NE4对应的更新的梯度，KPI ₂₄₁为NE4对应的第1层权重指标值；将NCCN对应的更新的第1层全局梯度、NE3对应的第2层权重指标值和NE4对应的第2层权重指标值上报给EMS的第一全局模型管理模块。

12.EMS的第一全局模型管理模块根据NE1对应的第2层权重指标值和NE2对应的第2层权重指标值计算虚拟NCCN对应的第2层权重指标值；根据NE3对应的第2层权重指标值和NE4对应的第2层权重指标值计算NCCN对应的第2层权重指标值；按照公式 GRA ₃＝GRA ₃₁₂KPI ₃₁₂+GRA ₃₂₂KPI ₃₂₂计算EMS对应的第2层全局梯度；其中，GRA ₃为EMS对应的第2层全局梯度，GRA ₃₁₂为虚拟NCCN对应的第1层全局梯度，KPI ₃₁₂为虚拟NCCN对应的第2层权重指标值，GRA ₃₂₂为NCCN对应的第1层全局梯度，KPI ₃₂₂为NCCN对应的第2层权重指标值；将EMS对应的第2层全局梯度下发给虚拟NCCN的第二全局模型管理模块和NCCN的第三全局模型管理模块。

13.虚拟NCCN的第二全局模型管理模块将EMS对应的第2层全局梯度下发给NE1和NE2，NCCN的第三全局模型管理模块将EMS对应的第2层全局梯度下发给NE3和NE4；NE1、NE2、NE3和NE4根据EMS对应的第2层全局梯度更新模型。

示例2

本示例描述基于两层联邦学习系统进行第1层联邦学习过程。

其中，NE1、NE2、NE3、NE4、NCCN和虚拟NCCN用于实现第1层联邦学习过程，NCCN、虚拟NCCN和EMS用于实现第2层联邦学习过程。

基于上述两层联邦学习系统的第1层联邦学习方法包括：

1.对于未连接到NCCN的NE1和NE2，在EMS中按照业务特征设置虚拟NCCN，把NE1和NE2按照业务特征连接到对应的虚拟NCCN上。

4.业务应用向第一任务管理发起业务联邦学习过程请求，并告知训练的基站范围。第一任务管理模块从EMS的权重指标管理模块中获取虚拟NCCN对应的第1层权重指标和NCCN对应的第1层权重指标，将虚拟NCCN对应的第1层权重指标，放置在联邦学习任务中一起下发给虚拟NCCN的第二任务管理模块；将NCCN对应的第1层权重指标，放置在联邦学习任务中一起下发给NCCN的第三任务管理模块。

5.虚拟NCCN的第二任务管理模块接收到携带虚拟NCCN对应的第1层权重指标的联邦学习任务，将虚拟NCCN对应的第1层权重指标放置到联邦学习任务中，下发给NE1和NE2；NCCN的第三任务管理模块接收到携带NCCN对应的第1层权重指标的联邦学习任务，将NCCN对应的第1层权重指标放置到联邦学习任务中，下发给NE3和NE4。

6.NE1根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据虚拟NCCN对应的第1层权重指标获取NE1对应的第1层权重指标值；使用加密，DP或秘密共享技术对NE1对应的更新的梯度进行隐私保护处理得到NE1对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE1对应的第1层权重指标值进行隐私保护处理得到NE1对应的隐私保护处理后的第1层权重指标值；将NE1对应的隐私保护处理后的梯度和NE1对应的隐私保护处理后的第1层权重指标值上报给虚拟NCCN的第二全局模型管理模块。

7.NE2根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据虚拟NCCN对应的第1层权重指标获取NE2对应的第1层权重指标值；使用加密，DP或秘密共享技术对NE2对应的更新的梯度进行隐私保护处理得到NE2对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE2对应的第1层权重指标值进行隐私保护处理得到NE2对应的隐私保护处理后的第1层权重指标值；将NE2对应的隐私保护处理后的梯度和NE2对应的隐私保护处理后的第1层权重指标值上报给虚拟NCCN的第二全局模型管理模块。

8.NE3根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据NCCN对应的第1层权重指标获取NE3对应的第1层权重指标值；使用加密，DP或秘密共享技术对NE3对应的更新的梯度进行隐私保护处理得到NE3对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE3对应的第1层权重指标值进行隐私保护处理得到NE3对应的隐私保护处理后的第1层权重指标值；将NE3对应的隐私保护处理后的梯度和NE3对应的隐私保护处理后的第1层权重指标值上报给NCCN的第三全局模型管理模块。

9.NE4根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据NCCN对应的第1层权重指标获取NE4对应的第1层权重指标值；使用加密，DP或秘密共享技术对NE4对应的更新的梯度进行隐私保护处理得到NE4对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE4对应的第1层权重指标值进行隐私保护处理得到NE4对应的隐私保护处理后的第1层权重指标值；将NE4对应的隐私保护处理后的梯度和NE4对应的隐私保护处理后的第1层权重指标值上报给虚拟NCCN的第三全局模型管理模块。

10.虚拟NCCN的第二全局模型管理模块对NE1对应的隐私保护处理后的梯度进行去隐私保护处理得到NE1对应的更新的梯度，对NE1对应的隐私保护处理后的第1层权重指标值进行去隐私保护处理得到NE1对应的第1层权重指标值；虚拟NCCN的第二全局模型管理模块对NE2对应的隐私保护处理后的梯度进行去隐私保护处理得到NE2对应的更新的梯度，对NE2对应的隐私保护处理后的第1层权重指标值进行去隐私保护处理得到NE2对应的第1层权重指标值；虚拟NCCN的第二全局模型管理模块按照公式GRA ₁₂＝GRA ₁₁₁KPI ₁₁₁+GRA ₁₂₁KPI ₁₂₁计算虚拟NCCN对应的更新的第1层全局梯度；其中，GRA ₁₂为虚拟NCCN对应的更新的第1层全局梯度，GRA ₁₁₁为NE1对应的更新的梯度，KPI ₁₁₁为NE1对应的第1层权重指标值，GRA ₁₂₁为NE2对应的更新的梯度，KPI ₁₂₁为NE2对应的第1层权重指标值；将虚拟NCCN对应的更新的第1层全局梯度下发给NE1和NE2；NE1和NE2根据虚拟NCCN对应的更新的第1层全局梯度更新模型。

11.NCCN的第三全局模型管理模块对NE3对应的隐私保护处理后的梯度进行去隐私保护处理得到NE3对应的更新的梯度，对NE3对应的隐私保护处理后的第1层权重指标值进行去隐私保护处理得到NE3对应的第1层权重指标值；NCCN的第三全局模型管理模块对NE4对应的隐私保护处理后的梯度进行去隐私保护处理得到NE4对应的更新的梯度，对NE4对应的隐私保护处理后的第1层权重指标值进行去隐私保护处理得到NE4对应的第1层权重指标值；NCCN的第三全局模型管理模块按照公式

计算NCCN对应的更新的第1层全局梯度；其中，GRA ₂₂为NCCN对应的更新的第1层全局梯度，GRA ₂₃₁为NE3对应的更新的梯度，KPI ₂₃₁为NE3对应的第1层权重指标值，GRA ₂₄₁为NE4对应的更新的梯度，KPI ₂₄₁为NE4对应的第1层权重指标值；将NCCN对应的更新的第1层全局梯度下发给NE3和NE4；NE3和NE4根据NCCN对应的更新的第1层全局梯度更新模型。

示例3

本示例描述基于两层联邦学习系统进行两层联邦学习过程。

基于上述两层联邦学习系统的两层联邦学习方法包括：

2.在EMS的权重指标管理模块中设置第2层权重指标和第1层权重指标相同(本示例中称为全局权重指标)。例如，如果运营商关注运营收益，则可设置全局权重指标为：话务量、或上下行流量、或话务量和上下行流量的加权平均。

3.业务应用向第一任务管理发起业务联邦学习过程请求，并告知训练的基站范围。第一任务管理模块从EMS的权重指标管理模块中获取全局权重指标，将全局权重指标放置在联邦学习任务中一起下发给虚拟NCCN的第二任务管理模块和NCCN的第三任务管理模块。

4.虚拟NCCN的第二任务管理模块接收到携带全局权重指标的联邦学习任务，将全局权重指标放置到联邦学习任务中，下发给NE1和NE2；NCCN的第三任务管理模块接收到携带全局权重指标的联邦学习任务，将全局权重指标放置到联邦学习任务中，下发给NE3和NE4。

5.NE1根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据全局权重指标获取NE1对应的全局权重指标值；使用加密，DP或秘密共享技术对NE1对应的更新的梯度进行隐私保护处理得到NE1对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE1对应的全局权重指标值进行隐私保护处理得到NE1对应的隐私保护处理后的全局权重指标值；将NE1对应的隐私保护处理后的梯度、NE1对应的隐私保护处理后的全局权重指标值上报给虚拟NCCN的第二全局模型管理模块。

6.NE2根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据全局权重指标获取NE2对应的全局权重指标值；使用加密，DP或秘密共享技术对NE2对应的更新的梯度进行隐私保护处理得到NE2对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE2对应的全局权重指标值进行隐私保护处理得到NE2对应的隐私保护处理后的全局权重指标值；将NE2对应的隐私保护处理后的梯度、NE2对应的隐私保护处理后的全局权重指标值上报给虚拟NCCN的第二全局模型管理模块。

7.NE3根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据全局权重指标获取NE3对应的全局权重指标值；使用加密，DP或秘密共享技术对NE3对应的更新的梯度进行隐私保护处理得到NE3对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE3对应的全局权重指标值进行隐私保护处理得到NE3对应的隐私保护处理后的全局权重指标值；将NE3对应的隐私保护处理后的梯度、NE3对应的隐私保护处理后的全局权重指标值上报给NCCN的第三全局模型管理模块。

8.NE4根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据全局权重指标获取NE4对应的全局权重指标值；使用加密，DP或秘密共享技术对NE4对应的更新的梯度进行隐私保护处理得到NE4对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE4对应的全局权重指标值进行隐私保护处理得到NE4对应的隐私保护处理后的全局权重指标值；将NE4对应的隐私保护处理后的梯度、NE4对应的隐私保护处理后的全局权重指标值上报给NCCN的第三全局模型管理模块。

9.虚拟NCCN的第二全局模型管理模块对NE1对应的隐私保护处理后的梯度进行去隐私保护处理得到NE1对应的更新的梯度，对NE1对应的隐私保护处理后的全局权重指标值进行去隐私保护处理得到NE1对应的全局权重指标值；虚拟NCCN的第二全局模型管理模块对NE2对应的隐私保护处理后的梯度进行去隐私保护处理得到NE2对应的更新的梯度，对NE2对应的隐私保护处理后的全局权重指标值进行去隐私保护处理得到NE2对应的全局权重指标值；虚拟NCCN的第二全局模型管理模块按照公式GRA ₁₂＝GRA ₁₁₁KPI ₁₁₁+GRA ₁₂₁KPI ₁₂₁计算虚拟NCCN对应的更新的第1层全局梯度；其中，GRA ₁₂为虚拟NCCN对应的更新的第1层全局梯度，GRA ₁₁₁为NE1对应的更新的梯度，KPI ₁₁₁为NE1对应的全局权重指标值，GRA ₁₂₁为NE2对应的更新的梯度，KPI ₁₂₁为NE2对应的全局权重指标值；将虚拟NCCN对应的更新的第1层全局梯度、NE1对应的全局权重指标值和NE2对应的全局权重指标值上报给EMS的第一全局模型管理模块。

10.NCCN的第三全局模型管理模块对NE3对应的隐私保护处理后的梯度进行去隐私保护处理得到NE3对应的更新的梯度，对NE3对应的隐私保护处理后的全局权重指标值进行去隐私保护处理得到NE3对应的全局权重指标值；NCCN的第三全局模型管理模块对NE4对应的隐私保护处理后的梯度进行去隐私保护处理得到NE4对应的更新的梯度，对NE4对应的隐私保护处理后的全局权重指标值进行去隐私保护处理得到NE4对应的全局权重指标值；NCCN的第三全局模型管理模块按照公式GRA ₂₂＝GRA ₂₃₁KPI ₂₃₁+GRA ₂₄₁KPI ₂₄₁计算NCCN对应的更新的第1层全局梯度；其中，GRA ₂₂为NCCN对应的更新的第1层全局梯度，GRA ₂₃₁为NE3对应的更新的梯度，KPI ₂₃₁为NE3对应的全局权重指标值，GRA ₂₄₁为NE4对应的更新的梯度，KPI ₂₄₁为NE4对应的全局权重指标值；将NCCN对应的更新的第1层全局梯度、NE3对应的全局权重指标值和NE4对应的全局权重指标值上报给EMS的第一全局模型管理模块。

11.EMS的第一全局模型管理模块根据NE1对应的全局权重指标值和NE2对应的全局权重指标值计算虚拟NCCN对应的全局权重指标值；根据 NE3对应的全局权重指标值和NE4对应的全局权重指标值计算NCCN对应的全局权重指标值；按照公式GRA ₃＝GRA ₃₁₂KPI ₃₁₂+GRA ₃₂₂KPI ₃₂₂计算EMS对应的第2层全局梯度；其中，GRA ₃为EMS对应的第2层全局梯度，GRA ₃₁₂为虚拟NCCN对应的第1层全局梯度，KPI ₃₁₂为虚拟NCCN对应的全局权重指标值，GRA ₃₂₂为NCCN对应的第1层全局梯度，KPI ₃₂₂为NCCN对应的全局权重指标值；将EMS对应的第2层全局梯度下发给虚拟NCCN的第二全局模型管理模块和NCCN的第三全局模型管理模块。

12.虚拟NCCN的第二全局模型管理模块将EMS对应的第2层全局梯度下发给NE1和NE2，NCCN的第三全局模型管理模块将EMS对应的第2层全局梯度下发给NE3和NE4；NE1、NE2、NE3和NE4根据EMS对应的第2层全局梯度更新模型。

示例4

本示例描述基于两层联邦学习系统进行第1层联邦学习过程。

基于上述两层联邦学习系统的第1层联邦学习方法包括：

3.业务应用向第一任务管理发起业务联邦学习过程请求，并告知训练的基站范围。第一任务管理模块从EMS的权重指标管理模块中获取全局权重指标，将全局权重指标，放置在联邦学习任务中一起下发给虚拟NCCN的第二任务管理模块和NCCN的第三任务管理模块。

5.NE1根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据全局权重指标获取NE1对应的全局权重指标值；使用加密，DP或秘密共享技术对NE1对应的更新的梯度进行隐私保护处理得到NE1对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE1对应的全局权重指标值进行隐私保护处理得到NE1对应的隐私保护处理后的全局权重指标值；将NE1对应的隐私保护处理后的梯度和NE1对应的隐私保护处理后的全局权重指标值上报给虚拟NCCN的第二全局模型管理模块。

6.NE2根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据全局权重指标获取NE2对应的全局权重指标值；使用加密，DP或秘密共享技术对NE2对应的更新的梯度进行隐私保护处理得到NE2对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE2对应的全局权重指标值进行隐私保护处理得到NE2对应的隐私保护处理后的全局权重指标值；将NE2对应的隐私保护处理后的梯度和NE2对应的隐私保护处理后的全局权重指标值上报给虚拟NCCN的第二全局模型管理模块。

7.NE3根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据NCCN对应的全局权重指标获取NE3对应的全局权重指标值；使用加密，DP或秘密共享技术对NE3对应的更新的梯度进行隐私保护处理得到NE3对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE3对应的全局权重指标值进行隐私保护处理得到NE3对应的隐私保护处理后的全局权重指标值；将NE3对应的隐私保护处理后的梯度和NE3对应的隐私保护处理后的全局权重指标值上报给NCCN的第三全局模型管理模块。

8.NE4根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据NCCN对应的全局权重指标获取NE4对应的全局权重指标值；使用加密，DP或秘密共享技术对NE4对应的更新的梯度进行隐私保护处理得到NE4对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE4对应的全局权重指标值进行隐私保护处理得到NE4对应的隐私保护处理后的全局权重指标值；将NE4对应的隐私保护处理后的梯度和NE4对应的隐私保护处理后的全局权重指标值上报给虚拟NCCN的第三全局模型管理模块。

9.虚拟NCCN的第二全局模型管理模块对NE1对应的隐私保护处理后的梯度进行去隐私保护处理得到NE1对应的更新的梯度，对NE1对应的隐私保护处理后的全局权重指标值进行去隐私保护处理得到NE1对应的全局权重指标值；虚拟NCCN的第二全局模型管理模块对NE2对应的隐私保护处理后的梯度进行去隐私保护处理得到NE2对应的更新的梯度，对NE2对应的隐私保护处理后的全局权重指标值进行去隐私保护处理得到NE2对应的全局权重指标值；虚拟NCCN的第二全局模型管理模块按照公式GRA ₁₂＝GRA ₁₁₁KPI ₁₁₁+GRA ₁₂₁KPI ₁₂₁计算虚拟NCCN对应的更新的第1层全局梯度；其中，GRA ₁₂为虚拟NCCN对应的更新的第1层全局梯度，GRA ₁₁₁为NE1对应的更新的梯度，KPI ₁₁₁为NE1对应的全局权重指标值， GRA ₁₂₁为NE2对应的更新的梯度，KPI ₁₂₁为NE2对应的全局权重指标值；将虚拟NCCN对应的更新的第1层全局梯度下发给NE1和NE2；NE1和NE2根据虚拟NCCN对应的更新的第1层全局梯度更新模型。

10.NCCN的第三全局模型管理模块对NE3对应的隐私保护处理后的梯度进行去隐私保护处理得到NE3对应的更新的梯度，对NE3对应的隐私保护处理后的全局权重指标值进行去隐私保护处理得到NE3对应的全局权重指标值；NCCN的第三全局模型管理模块对NE4对应的隐私保护处理后的梯度进行去隐私保护处理得到NE4对应的更新的梯度，对NE4对应的隐私保护处理后的全局权重指标值进行去隐私保护处理得到NE4对应的全局权重指标值；NCCN的第三全局模型管理模块按照公式GRA ₂₂＝GRA ₂₃₁KPI ₂₃₁+GRA ₂₄₁KPI ₂₄₁计算NCCN对应的更新的第1层全局梯度；其中，GRA ₂₂为NCCN对应的更新的第1层全局梯度，GRA ₂₃₁为NE3对应的更新的梯度，KPI ₂₃₁为NE3对应的全局权重指标值，GRA ₂₄₁为NE4对应的更新的梯度，KPI ₂₄₁为NE4对应的全局权重指标值；将NCCN对应的更新的第1层全局梯度下发给NE3和NE4；NE3和NE4根据NCCN对应的更新的第1层全局梯度更新模型。

示例5

本示例描述基于单层联邦学习系统进行单层联邦学习过程。

如图8所示，单层联邦学习系统包括：EMS、NE1和NE2；NE1和NE2均连接到EMS。

其中，EMS包括：业务应用、任务管理模块、全局模型管理模块和权重指标管理模块。

其中，EMS、NE1、NE2用于实现单层联邦学习过程。

基于上述单层联邦学习系统的单层联邦学习方法包括：

1.在EMS的权重指标管理模块中设置全局权重指标。例如，如果运营商关注运营收益，则可设置全局权重指标为：话务量、或上下行流量、或话务量和上下行流量的加权平均。

2.业务应用向任务管理发起业务联邦学习过程请求，并告知训练的基站范围。任务管理模块从EMS的权重指标管理模块中获取全局权重指标，将全局权重指标，放置在联邦学习任务中一起下发给NE1和NE2。

3.NE1根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据全局权重指标获取NE1对应的全局权重指标值；使用加密，DP或秘密共享技术对NE1对应的更新的梯度进行隐私保护处理得到NE1对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE1对应的全局权重指标值进行隐私保护处理得到NE1对应的隐私保护处理后的全局权重指标值；将NE1对应的隐私保护处理后的梯度和NE1对应的隐私保护处理后的全局权重指标值上报给EMS的全局模型管理模块。

4.NE2根据联邦学习任务采用本地数据进行模型训练得到对应的更新的梯度；根据全局权重指标获取NE2对应的全局权重指标值；使用加密，DP或秘密共享技术对NE2对应的更新的梯度进行隐私保护处理得到NE2对应的隐私保护处理后的梯度，使用加密，DP或秘密共享技术对NE2对应的全局权重指标值进行隐私保护处理得到NE2对应的隐私保护处理后的全局权重指标值；将NE2对应的隐私保护处理后的梯度和NE2对应的隐私保护处理后的全局权重指标值上报给EMS的全局模型管理模块。

5.EMS的全局模型管理模块对NE1对应的隐私保护处理后的梯度进行去隐私保护处理得到NE1对应的更新的梯度，对NE1对应的隐私保护处理后的全局权重指标值进行去隐私保护处理得到NE1对应的全局权重指标值；EMS的全局模型管理模块对NE2对应的隐私保护处理后的梯度进行去隐私保护处理得到NE2对应的更新的梯度，对NE2对应的隐私保护处理后的全局权重指标值进行去隐私保护处理得到NE2对应的全局权重指标值；EMS的全局模型管理模块按照公式GRA ₃＝GRA ₁KPI ₁+GRA ₂KPI ₂计算更新的全局梯度；其中，GRA ₃为更新的全局梯度，GRA ₁为NE1对应的更新的梯度，KPI ₁为NE1对应的全局权重指标值，GRA ₂为NE2对应的更新的梯度，KPI ₂为NE2对应的全局权重指标值；将更新的全局梯度下发给NE1和NE2；NE1和NE2根据更新的全局梯度更新模型。

第四方面，本公开实施例提供一种电子设备，包括：

至少一个处理器；

存储器，存储器上存储有至少一个程序，当至少一个程序被至少一个处理器执行，使得至少一个处理器实现上述任意一种联邦学习方法。

其中，处理器为具有数据处理能力的器件，其包括但不限于中央处理器(CPU)等；存储器为具有数据存储能力的器件，其包括但不限于随机存取存储器(RAM，更具体如SDRAM、DDR等)、只读存储器(ROM)、带电可擦可编程只读存储器(EEPROM)、闪存(FLASH)。

在一些实施例中，处理器、存储器通过总线相互连接，进而与计算设备的其它组件连接。

图9为本公开另一个实施例提供的联邦学习装置的组成框图。

第六方面，参照图9，本公开另一个实施例提供一种联邦学习装置(如第i层节点，i为大于或等于2，且小于或等于(N-1)的整数中的任意一个，(N-1)为联邦学习的层数)，该装置包括：

第一通信模块901，被配置为接收到第i层节点下的至少一个第(i-1)层节点上报的对应的第一梯度；

第一计算模块902，被配置为根据至少一个第(i-1)层节点对应的第一梯度和第i层节点对应的第(i-1)层权重指标计算第i层节点对应的更新的第(i-1)层全局梯度；其中，第(i-1)层权重指标为通信指标。

在一些示例性实施例中，第一通信模块901还被配置为：

接收到第(i+1)层节点发送的联邦学习任务，将联邦学习任务下发给第i层节点下的至少一个第(i-1)层节点。

在一些示例性实施例中，同一层的不同节点对应的权重指标相同或不同，不同层的不同节点对应的权重指标相同或不同。

在一些示例性实施例中，若所述i等于2，第(i-1)层节点对应的第一梯度为第(i-1)层节点根据联邦学习任务进行模型训练得到的更新的梯度；

若i大于2，且小于或等于(N-1)，第(i-1)层节点对应的第一梯度为所述第(i-1)层节点对应的更新的第(i-2)层全局梯度。

在一些示例性实施例中，第一计算模块902具体被配置为：

在一些示例性实施例中，第一通信模块901还被配置为：

上述联邦学习装置的具体实现过程与前述实施例的联邦学习方法的具体实现过程相同，这里不再赘述。

图10为本公开另一个实施例提供的联邦学习装置的组成框图。

第七方面，参照图10，本公开另一个实施例提供一种联邦学习装置(如第1层节点)，该装置包括：

第二通信模块1001，被配置为将第1层节点对应的更新的梯度上报给第2层节点；接收第2层节点发送的更新的第j层全局梯度；其中，第j层全局梯度根据至少一个第j层节点对应的第一梯度和第(j+1)层节点对应的第j层权重指标计算得到；第j层权重指标为通信指标；j为大于或等于1，且小于或等于(N-1)的整数中的任意一个，(N-1)为联邦学习的层数。

在一些示例性实施例中，还包括：

模型训练更新模块1002，被配置为根据更新的第j层全局梯度更新模型。

在一些示例性实施例中，第二通信模块1001还被配置为：

接收第2层节点发送的联邦学习任务。

在一些示例性实施例中，若j等于1，第j层节点对应的第一梯度为第j层节点对应的更新的梯度；

若j大于1，且小于或等于(N-1)，第j层节点对应的第一梯度为第j层节点对应的更新的第(j-1)层全局梯度。

在一些示例性实施例中，通信指标包括以下至少一个：平均时延、话务量、上下行流量、所述话务量和所述上下行流量的加权平均。

第八方面，参照图11，本公开另一个实施例提供一种联邦学习装置(如第N层节点，(N-1)为联邦学习的层数)，该装置包括：

第三通信模块1101，被配置为接收到第N层节点下的至少一个第(N-1)层节点上报的对应的第(N-2)层全局梯度；

第二计算模块1102，被配置为根据至少一个第(N-1)层节点对应的第(N-2)层全局梯度和第(N-1)层权重指标计算第N层节点对应的第(N-1)层全局梯度；其中，第(N-1)层权重指标为通信指标。

在一些示例性实施例中，第三通信模块1101还被配置为：向第N层节点下的至少一个第(N-1)层节点下发联邦学习任务。

在一些示例性实施例中，第三通信模块1101还被配置为：将第N层节点对应的第(N-1)层全局梯度下发给至少一个第(N-1)层节点。

第九方面，本公开另一个实施例提供一种联邦学习系统，包括：

第N层节点或第N层子系统，被配置为接收到第N层节点或第N层子系统下的至少一个第(N-1)层节点上报的对应的第(N-2)层全局梯度；根据至少一个第(N-1)层节点对应的第(N-2)层全局梯度和第(N-1)层权重指标计算第N层节点或第N层子系统对应的第(N-1)层全局梯度；其中，第(N-1)层权重指标为通信指标；将第N层节点或第N层子系统对应的第(N-1)层全局梯度下发给至少一个第(N-1)层节点；其中，(N-1)为联邦学习的层数；

第i层节点，被配置为接收到第i层节点下的至少一个第(i-1)层节点上报的对应的第一梯度；根据至少一个所述第(i-1)层节点对应的第一梯度和第i层节点对应的第(i-1)层权重指标计算第i层节点对应的更新的第(i-1)层全局梯度；其中，第(i-1)层权重指标为通信指标；

第i层节点还被配置为：

将第i层节点对应的更新的第(i-1)层全局梯度下发给第(i-1)层节点；或者，将第i层节点对应的更新的第(i-1)层全局梯度上报给第(i+1)层节点；接收第(i+1)层节点发送的更新的第i层全局梯度到更新的第(N-1)层全局梯度中的任意一个，将更新的第i层全局梯度到更新的第(N-1)层全局梯度中的任意一个下发给第(i-1)层节点；

第1层节点，被配置为将第1层节点对应的更新的梯度上报给第2层节点；接收第2层节点发送的更新的第j层全局梯度；其中，第j层全局梯度根据至少一个第j层节点对应的第一梯度和第(j+1)层节点对应的第j层权重指标计算得到；第j层权重指标为通信指标；第j层权重指标为通信指标；j为大于或等于1，且小于或等于(N-1)的整数中的任意一个，(N-1)为联邦学习的层数。

在一些示例性实施例中，第1层节点还被配置为：进行模型训练得到第1层节点对应的更新的梯度；根据更新的第j层全局梯度更新模型。

在一些示例性实施例中，若i等于2，第(i-1)层节点对应的第一梯度为所述第(i-1)层节点根据联邦学习任务进行模型训练得到的更新的梯度；

在一些示例性实施例中，第i层节点具体被配置为采用以下方式实现根据至少一个第(i-1)层节点对应的第一梯度和第i层节点对应的第(i-1)层权重指标计算第i层节点对应的更新的第(i-1)层全局梯度：

根据第i层节点对应的第(i-1)层权重指标获取至少一个第(i-1)层节点对应的第(i-1)层权重指标值；

以至少一个第(i-1)层节点对应的第(i-1)层权重指标值为权重，计算至少一个第(i-1)层节点对应的第一梯度的加权平均值，得到第i层节点对应的更新的第(i-1)层全局梯度。

在一些示例性实施例中，第i层节点还被配置为：将第i层节点对应的更新的第(i-1)层全局梯度下发给第(i-1)层节点。

在一些示例性实施例中，第i层节点还被配置为：

将第i层节点对应的更新的第(i-1)层全局梯度上报给第(i+1)层节点；

接收第(i+1)层节点发送的更新的第i层全局梯度到更新的第(N-1)层全局梯度中的任意一个，将更新的第i层全局梯度到所述更新的第(N-1)层全局梯度中的任意一个下发给第(i-1)层节点。

上述联邦学习系统的具体实现过程与前述实施例的联邦学习方法的具体实现过程相同，这里不再赘述。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其它数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储、磁盒、磁带、磁盘存储或其它磁存储器、或者可以用于存储期望的信息并且可以被计算机访问的任何其它的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其它传输机制之类的调制数据信号中的其它数据，并且可包括任何信息递送介质。

本文已经公开了示例实施例，并且虽然采用了具体术语，但它们仅用于并仅应当被解释为一般说明性含义，并且不用于限制的目的。在一些实例中，对本领域技术人员显而易见的是，除非另外明确指出，否则可单独使用与特定实施例相结合描述的特征、特性和/或元素，或可与其它实施例相结合描述的特征、特性和/或元件组合使用。因此，本领域技术人员将理解，在不脱离由所附的权利要求阐明的本公开的范围的情况下，可进行各种形式和细节上的改变。

Claims

一种联邦学习方法，应用于第i层节点，所述i为大于或等于2，且小于或等于(N-1)的整数中的任意一个，所述(N-1)为联邦学习的层数，该方法包括：

接收到第i层节点下的至少一个第(i-1)层节点上报的对应的第一梯度；以及

根据至少一个所述第(i-1)层节点对应的所述第一梯度和所述第i层节点对应的第(i-1)层权重指标计算所述第i层节点对应的更新的第(i-1)层全局梯度；其中，所述第(i-1)层权重指标为通信指标。
根据权利要求1所述的联邦学习方法，其中，所述通信指标包括以下至少一个：

平均时延、话务量、上下行流量、所述话务量和所述上下行流量的加权平均。
根据权利要求1所述的联邦学习方法，其中，同一层的不同节点对应的权重指标相同或不同，不同层的不同节点对应的权重指标相同或不同。
根据权利要求1所述的联邦学习方法，其中，若所述i等于2，所述第(i-1)层节点对应的所述第一梯度为所述第(i-1)层节点进行模型训练得到的更新的梯度；

若所述i大于2，且小于或等于(N-1)，所述第(i-1)层节点对应的所述第一梯度为所述第(i-1)层节点对应的更新的第(i-2)层全局梯度。
根据权利要求1所述的联邦学习方法，其中，所述根据至少一个第(i-1)层节点对应的第一梯度和第i层节点对应的第(i-1)层权重指标计算第i层节点对应的更新的第(i-1)层全局梯度包括：

根据所述第i层节点对应的所述第(i-1)层权重指标获取至少一个所述第(i-1)层节点对应的第(i-1)层权重指标值；

以至少一个所述第(i-1)层节点对应的第(i-1)层权重指标值为权重，计算至少一个所述第(i-1)层节点对应的所述第一梯度的加权平均值，得到所述第i层节点对应的所述更新的第(i-1)层全局梯度。
根据权利要求1-5任一项所述的联邦学习方法，所述根据至少一个第(i-1)层节点对应的第一梯度和第i层节点对应的第(i-1)层权重指标计算第i层节点对应的更新的第(i-1)层全局梯度之后，该方法还包括：

将所述第i层节点对应的所述更新的第(i-1)层全局梯度下发给所述第(i-1)层节点。
根据权利要求1-5任一项所述的联邦学习方法，所述根据至少一个第(i-1)层节点对应的第一梯度和第i层节点对应的第(i-1)层权重指标计算第i层节点对应的更新的第(i-1)层全局梯度之后，该方法还包括：

将所述第i层节点对应的所述更新的第(i-1)层全局梯度上报给所述第(i+1)层节点；

接收所述第(i+1)层节点发送的更新的第i层全局梯度到更新的第(N-1)层全局梯度中的任意一个，将所述更新的第i层全局梯度到所述更新的第(N-1)层全局梯度中的任意一个下发给所述第(i-1)层节点。
一种联邦学习方法，应用于第1层节点，该方法包括：

将所述第1层节点对应的更新的梯度上报给第2层节点；

接收所述第2层节点发送的更新的第j层全局梯度；其中，所述第j层全局梯度根据至少一个第j层节点对应的第一梯度和第(j+1)层节点对应的第j层权重指标计算得到；所述第j层权重指标为通信指标；所述j为大于或等于1，且小于或等于(N-1)的整数中的任意一个，(N-1)为联邦学习的层数。
根据权利要求8所述的联邦学习方法，其中，若j等于1，所述第j层节点对应的第一梯度为所述第j层节点对应的更新的梯度；

若j大于1，且小于或等于(N-1)，所述第j层节点对应的第一梯度为所述第j层节点对应的更新的第(j-1)层全局梯度。
根据权利要求8所述的联邦学习方法，其中，所述通信指标包括以下至少一个：

平均时延、话务量、上下行流量、所述话务量和所述上下行流量的加权平均。
根据权利要求8所述的联邦学习方法，同一层的不同节点对应的权重指标相同或不同，不同层的不同节点对应的权重指标相同或不同。
一种联邦学习方法，应用于第N层节点或第N层子系统，(N-1)为联邦学习的层数，该方法包括：

接收到第N层节点或第N层子系统下的至少一个第(N-1)层节点上报的对应的第(N-2)层全局梯度；

根据至少一个所述第(N-1)层节点对应的所述第(N-2)层全局梯度和第(N-1)层权重指标计算所述第N层节点或所述第N层子系统对应的第(N-1)层全局梯度；其中，所述第(N-1)层权重指标为通信指标。
根据权利要求12所述的联邦学习方法，其中，所述通信指标包括以下至少一个：

平均时延、话务量、上下行流量、所述话务量和所述上下行流量的加权平均。
一种电子设备，包括：

至少一个处理器；

存储器，所述存储器上存储有至少一个程序，当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现根据权利要求1-13任意一项所述的联邦学习方法。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现根据权利要求1-13任意一项所述的联邦学习方法。
一种联邦学习系统，包括：

第N层节点或第N层子系统，被配置为接收到第N层节点或第N层子系统下的至少一个第(N-1)层节点上报的对应的第(N-2)层全局梯度；根据至少一个所述第(N-1)层节点对应的所述第(N-2)层全局梯度和第(N-1)层权重指标计算所述第N层节点或所述第N层子系统对应的第(N-1)层全局梯度；其中，所述第(N-1)层权重指标为通信指标；将所述第N层节点或所述第N层子系统对应的所述第(N-1)层全局梯度下发给至少一个所述第(N-1)层节点；其中，(N-1)为联邦学习的层数；

第i层节点，被配置为接收到第i层节点下的至少一个第(i-1)层节点上报的对应的第一梯度；根据至少一个所述第(i-1)层节点对应的所述第一梯度和所述第i层节点对应的第(i-1)层权重指标计算所述第i层节点对应的更新的第(i-1)层全局梯度；其中，所述第(i-1)层权重指标为通信指标；

所述第i层节点还被配置为：

将所述第i层节点对应的所述更新的第(i-1)层全局梯度下发给所述第(i-1)层节点；或者，将所述第i层节点对应的所述更新的第(i-1)层全局梯度上报给所述第(i+1)层节点；接收所述第(i+1)层节点发送的更新的第i层全局梯度到更新的第(N-1)层全局梯度中的任意一个，将所述更新的第i层全局梯度到所述更新的第(N-1)层全局梯度中的任意一个下发给所述第(i-1)层节点；

第1层节点，被配置为将所述第1层节点对应的更新的梯度上报给所述第2层节点；接收所述第2层节点发送的更新的第j层全局梯度；其中，所述第j层全局梯度根据至少一个第j层节点对应的第一梯度和第(j+1)层节点对应的第j层权重指标计算得到；所述第j层权重指标为通信指标；所述第j层权重指标为通信指标；所述j为大于或等于1，且小于或等于(N-1)的整数中的任意一个，(N-1)为联邦学习的层数。