WO2024021990A1

WO2024021990A1 - 一种路径确定的方法及相关设备

Info

Publication number: WO2024021990A1
Application number: PCT/CN2023/103818
Authority: WO
Inventors: 单良; 温华锋; 吴涛; 李军; 吴钦志; 王炳权; 龚翔宇
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2022-07-27
Filing date: 2023-06-29
Publication date: 2024-02-01
Anticipated expiration: 2025-01-27
Also published as: US20250168116A1; CN117527675A; CN121418335A; EP4557688A1; EP4557688A4

Abstract

本申请提供了一种路径确定的方法及相关设备，用于提升数据流的转发效率。在该方法中，第一网络设备获取包含有N个第二网络设备和P个第三网络设备之间的连接关系的第一拓扑信息，并且该第一网络设备获取M条数据流的通信关系之后，该第一网络设备根据该M条数据流的通信关系和该第一拓扑信息确定并向N个第二网络设备发送M个路径。此后，N个第二网络设备可以基于该M个路径分别向P个第三网络设备发送该M条数据流。从而，相比于N个第二网络设备仅基于本地数据流作为路径确定依据而容易导致路径冲突的实现方式，在该方法中，第一网络设备能够基于全局信息实现路径的确定，以避免路径冲突，提升数据流的转发效率。

Description

一种路径确定的方法及相关设备

本申请要求于2022年07月27日提交中国国家知识产权局，申请号为202210891496.0，发明名称为“一种路径确定的方法及相关设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及通信领域，尤其涉及一种路径确定的方法及相关设备。

背景技术

在通信网络中，不同通信装置之间不存在直连链路的情况下，不同通信装置之间交互的数据流需要经过其他通信装置的转发。其中，该其他通信装置可以称为转发设备，例如该转发设备可以包括路由器、交换机或虚拟机等。

目前，随着组网的规模越加庞大，有可能需要通过多层网络的转发才可以实现不同通信装置之间数据流的交互。而在该多层网络中，数据流的源地址对应的通信装置和数据流的目的地址对应的通信装置之间往往存在多条路径。作为转发设备的通信装置在转发数据流的时候，会基于本地策略在该多条路径中进行路径选择，并基于本地选择的路径转发数据流。

然而，在多层网络中，往往存在多个作为转发设备的通信装置，而每一个作为转发设备的通信装置的路径确定依据为各自的本地数据流，容易导致不同转发设备确定的路径存在冲突，影响数据流的转发效率。

发明内容

本申请提供了一种路径确定的方法及相关设备，用于提升数据流的转发效率。

本申请第一方面提供了一种路径确定的方法，该方法由第一网络设备执行，或者，该方法由第一网络设备中的部分组件(例如处理器、芯片或芯片系统等)执行，或者该方法还可以由能实现全部或部分第一网络设备功能的逻辑模块或软件实现。在第一方面及其可能的实现方式中，以该方法由第一网络设备执行为例进行描述，该第一网络设备可以为路由器、交换机、虚拟机等。在该方法中，第一网络设备获取第一拓扑信息，该第一拓扑信息包括N个第二网络设备和P个第三网络设备之间的连接关系，任一第二网络设备为任一第三网络设备的上游网络设备，N为大于或等于2的整数，P为大于或等于1的整数；该第一网络设备获取M条数据流的通信关系，该M条数据流中的每条数据流的通信关系包括源地址信息和目的地址信息，M为大于或等于2的整数，该M条数据流分别通过该N个第二网络设备向该P个第三网络设备传输；该第一网络设备根据该M条数据流的通信关系和该第一拓扑信息确定M个路径，该M个路径分别与M条数据流对应，该M个路径指示通过该N个第二网络设备向该P个第三网络设备传输该M条数据流的路径；该第一网络设备分别向该N个第二网络设备发送该M个路径。

基于上述技术方案，第一网络设备获取包含有N个第二网络设备和P个第三网络设备之间的连接关系的第一拓扑信息，并且该第一网络设备获取M条数据流的通信关系之后，该第一网络设备根据该M条数据流的通信关系和该第一拓扑信息确定并向N个第二网络设备发送M个路径。此后，N个第二网络设备可以基于该M个路径分别向P个第三网络设备发送该M条数据流。换言之，第一网络设备作为确定路径的设备，该第一网络设备的路径确定依据为N个第二网络设备和P个第三网络设备之间的连接关系以及M条数据流的通信关系。从而，相比于N个第二网络设备仅基于本地数据流作为路径确定依据而容易导致路径冲突的实现方式，在上述方法中，第一网络设备能够基于全局信息实现路径的确定，以避免路径冲突，提升数据流的转发效率。

应理解，M条数据流中的任一数据流可以为单向数据流，也可以为双向数据流，本申请对此不做限定。其中，若M条数据流中存在某一数据流为双向数据流，则该M条数据流的通信关系中，该双向数据流的通信关系可以仅包含某一流向的源地址信息以及目的地址信息，该双向数据流的通信关系也可以包含两个流向分别对应的源地址信息以及目的地址信息，此处不做限定。

在第一方面的一种可能的实现方式中，该M条数据流通过该P个第三网络设备向K个第四网络设备传输，K为大于或等于1的整数；该M条数据流包括第一数据流和第二数据流，该第一数据流的源地址信息与该第二数据流的源地址信息对应于不同的第二网络设备，该第一数据流的目的地址信息与该第二数据流的目的地址信息对应于同一第四网络设备，该M个路径包括第一路径和第二路径，该第一路径与该第一数据流对应，该第二路径与该第二数据流对应，该第一路径与该第二路径对应于不同的第三网络设备。

可选地，任一第四网络设备与任一第二网络设备均不相同。

可选地，N个第二网络设备中的至少一个网络设备与K个第四网络设备中的至少一个网络设备为相同的网络设备。

可选地，N与K相等，且N个第二网络设备与K个第四网络设备为相同的网络设备。

基于上述技术方案，第一网络设备确定的M个路径包括与第一数据流对应的第一路径以及与第二数据流对应的第二路径，并且，该第一路径与该第二路径对应于不同的第三网络设备，其中，该第一数据流的源地址信息与该第二数据流的源地址信息对应于不同的第二网络设备，该第一数据流的目的地址信息与该第二数据流的目的地址信息对应于同一第四网络设备。换言之，由于任一第四网络设备为任一第三网络设备的下游网络设备，第一数据流和第二数据流通过不同的第二网络设备分别向不同的第三网络设备发送之后，该不同的第三网络设备分别向同一第四网络设备发送该第一数据流和第二数据流。从而，可以避免来自于不同第二网络设备的数据流通过同一第三网络设备传输之后，再通过同一第三网络设备向同一第四网络设备传输的过程中产生的网络拥塞，以提升该第一数据流和该第二数据流的传输效率。

在第一方面的一种可能的实现方式中，该M个路径还指示该M条数据流在该N个第二网络设备上的出端口。

基于上述技术方案，第一网络设备确定的M个路径除了指示通过该N个第二网络设备向该P个第三网络设备传输该M条数据流的路径之外，该M个路径还指示该M条数据流在该N个第二网络设备上的出端口，以便于该N个第二网络设备接收M个路径之后，能够明确发送该M条数据流的出端口。

在第一方面的一种可能的实现方式中，该M条数据流包括第三数据流和第四数据流，该第三数据流的源地址信息和该第四数据流的源地址信息对应于同一第二网络设备，该M个路径包括第三路径和第四路径，该第三路径和该第三数据流对应，该第四路径和该第四数据流对应，该第三路径和该第四路径不同。

基于上述技术方案，第一网络设备确定的M个路径包括与第三数据流对应的第三路径以及与第四数据流对应的第四路径，并且，该第三路径和该第四路径不同。其中，该第三数据流的源地址信息和该第四数据流的源地址信息对应于同一第二网络设备。换言之，第三数据流和第四数据流通过同一第二网络设备分别通过不同的路径进行传输。从而，可以避免来自于同一第二网络设备的数据流通过相同路径传输的过程中产生的网络拥塞，以提升该第三数据流和该第四数据流的传输效率。

在第一方面的一种可能的实现方式中，该M条数据流通过该P个第三网络设备向K个第四网络设备传输，K为正整数；该第一网络设备根据该M条数据流的通信关系和该第一拓扑信息确定M个路径包括：该第一网络设备根据该M条数据流的通信关系和该第一拓扑信息确定第一映射关系，该第一映射关系用于指示该M条数据流中每条数据流的源地址信息对应的第二网络设备与该M条数据流中每条数据流的目标地址信息对应的第四网络设备之间的映射关系；该第一网络设备根据该第一映射关系确定该M个路径。

可选地，该拓扑信息还包括P个第三网络设备和K个第四网络设备之间的连接关系。

基于上述技术方案，提供了第一网络设备确定M个路径的一种实现方式，以便于第一网络设备基于该N个第二网络设备与K个第四网络设备之间的映射关系确定该M个路径。

在第一方面的一种可能的实现方式中，该第一网络设备根据该第一映射关系确定该M个路径包括：该第一网络设备根据该第一映射关系确定第一排序信息，该第一排序信息用于指示该K个第四网络设备对应的第二网络设备的数量的排序；该第一网络设备根据该第一排序信息依次对该N个第二网络设备的出端口进行遍历，得到第二映射关系；其中，该第二映射关系用于指示该N个第二网络设备的出端口与该K个第四网络设备之间的映射关系；该第一网络设备基于该第二映射关系确定该M个路径。

基于上述技术方案，提供了第一网络设备确定M个路径的一种实现方式，以便于第一网络设备基于依次确定的第一映射关系、第一排序信息以及第二映射关系确定该M个路径。

在第一方面的一种可能的实现方式中，该第一网络设备根据该第一排序信息依次对该N个第二网络设备的出端口进行遍历，得到第二映射关系包括：该第一网络设备根据该第一排序信息依次对该N个第二网络设备的出端口进行遍历，得到第三映射关系；其中，该第三映射关系用于指示每个该第四网络设备对应的该第二网络设备的出端口的可选数量；该第一网络设备基于该第三映射关系确定该第二映射关系。

基于上述技术方案，第三映射关系用于指示每个该第四网络设备对应的该第二网络设备的出端口的可选数量，其中，该可选数量的取值越大则对应的第四网络设备的可选路径的不确定性就越小，反之，该可选数量的取值越小则对应的第四网络设备的可选路径的不确定性就越大。为此，基于第三映射关系所确定的第二映射关系能够优先为可选路径的不确定性较小的第四网络设备对应的该第二网络设备的出端口进行遍历，以提升方案的准确性，避免后续基于该第二映射关系所确定的M个路径产生冲突。

在第一方面的一种可能的实现方式中，该方法还包括：该第一网络设备获取第二拓扑信息，该第二拓扑信息包括A个第二网络设备和该P个第三网络设备之间的连接关系，该A个第二网络设备中的至少一个第二网络设备与该N个第二网络设备中的至少一个第二网络设备相同，该A为大于或等于1的整数；该第一网络设备获取B条数据流的通信关系，该B条数据流中的每条数据流的通信关系包括源地址信息和目的地址信息，该B为大于或等于1的整数，该B条数据流分别通过该A个第二网络设备向该P个第三网络设备传输；在该第一网络设备根据该M条数据流的通信关系和该拓扑信息确定M个路径之后，该方法还包括：该第一网络设备根据该B条数据流的通信关系和该拓扑信息确定B个路径，该B个路径分别与B条数据流对应，该B个路径指示通过该A个第二网络设备向该P个第三网络设备发送该M条数据流的路径；其中，该B个路径对应的第二网络设备的出端口不同于该M个路径对应的第二网络设备的出端口；该第一网络设备分别向该A个第二网络设备发送该B个路径。

基于上述技术方案，第一网络设备确定的B个路径对应的第二网络设备的出端口不同于该M个路径对应的第二网络设备的出端口，以避免M条数据流和B条数据流对应于同一第二网络设备的出端口时产生的流量冲突，提升M条数据流和B条数据流的数据传输效率。

在第一方面的一种可能的实现方式中，该第一网络设备获取M条数据流的通信关系包括：该第一网络设备分别接收来自该N个第二网络设备的该M条数据流的通信关系。

基于上述技术方案，第一网络设备可以基于分别接收来自该N个第二网络设备的该M条数据流的通信关系的方式，以获取该M条数据流的通信关系，以便于该第一网络设备和N个第二网络设备之间进行交互的方式获得该M条数据流的通信关系。

可选地，该M条数据流的通信关系预配置于该第一网络设备，以避免不同网络设备之间的交互所造成的开销以及时延增加。

在第一方面的一种可能的实现方式中，该M条数据流对应于多个人工智能(artificial intelligence，AI)集合通信任务中的一个任务。

可选地，该M条数据流对应于长稳态流量任务，该长稳态流量任务中的数据流的流量大小在一定的时长内大于预设阈值。

在第一方面的一种可能的实现方式中，该第一网络设备为控制器或该P个第三网络设备中的一个网络设备。

基于上述技术方案，执行该方法确定并发送M个路径的第一网络设备可以为控制器，也可以为P个第三网络设备中的一个网络设备，以提升方案实现的灵活性。

本申请第二方面提供了一种路径确定的方法，该方法由第二网络设备执行，或者，该方法由第二网络设备中的部分组件(例如处理器、芯片或芯片系统等)执行，或者该方法还可以由能实现全部或部分第二网络设备功能的逻辑模块或软件实现。在第二方面及其可能的实现方式中，以该方法由第二网络设备执行为例进行描述，该第二网络设备可以为路由器、交换机、虚拟机等。在该方法中，第二网络设备向第一网络设备发送Q条数据流的通信关系，该Q条数据流中的每条数据流的通信关系包括源地址信息和目的地址信息，Q为大于或等于1的整数；该第二网络设备接收来自第一网络设备的Q个路径，该Q 个路径指示该第二网络设备传输该Q条数据流时使用的路径；该第二网络设备基于该Q个路径传输该Q条数据流。

基于上述技术方案，第二网络设备向第一网络设备发送Q条数据流的通信关系的关系之后，该第二网络设备接收来自第一网络设备的指示该第二网络设备传输该Q条数据流时使用的Q个路径，并且，该第二网络设备基于该Q个路径传输该Q条数据流。换言之，第一网络设备作为确定路径的设备，该第一网络设备能够确定在N个第二网络设备和P个第三网络设备之间传输的M条数据流对应的M个路径。从而，相比于N个第二网络设备仅基于本地数据流作为路径确定依据而容易导致路径冲突的实现方式，在上述方法中，第一网络设备能够基于全局信息实现路径的确定，以避免路径冲突，提升数据流的转发效率。

应理解，Q条数据流中的任一数据流可以为单向数据流，也可以为双向数据流，本申请对此不做限定。其中，若Q条数据流中存在某一数据流为双向数据流，则该Q条数据流的通信关系中，该双向数据流的通信关系可以仅包含某一流向的源地址信息以及目的地址信息，该双向数据流的通信关系也可以包含两个流向分别对应的源地址信息以及目的地址信息，此处不做限定。

在第二方面的一种可能的实现方式中，该路径信息还指示该Q条数据流在该第二网络设备上的出端口。

基于上述技术方案，第二网络设备接收的Q个路径除了指示通过该第二网络设备传输该Q条数据流的路径之外，该Q个路径还指示该Q条数据流在该第二网络设备上的出端口，以便于该第二网络设备接收Q个路径之后，能够明确发送该Q条数据流的出端口。

在第二方面的一种可能的实现方式中，该Q条数据流包括第三数据流和第四数据流，该第三数据流的源地址信息和该第四数据流的源地址信息对应于该第二网络设备，该路径信息包括第三路径和第四路径，该第三路径和该第三数据流对应，该第四路径和该第四数据流对应，该第三路径和该第四路径不同。

基于上述技术方案第二网络设备接收的Q个路径包括与第三数据流对应的第三路径以及与第四数据流对应的第四路径，并且，该第三路径和该第四路径不同。其中，该第三数据流的源地址信息和该第四数据流的源地址信息对应于同一第二网络设备。换言之，第三数据流和第四数据流通过同一第二网络设备分别通过不同的路径进行传输。从而，可以避免来自于同一第二网络设备的数据流通过相同路径传输的过程中产生的网络拥塞，以提升该第三数据流和该第四数据流的传输效率。

在第二方面的一种可能的实现方式中，该Q条数据流对应于多个AI集合通信任务中的一个任务。

可选地，该Q条数据流对应于长稳态流量任务，该长稳态流量任务中的数据流的流量大小在一定的时长内大于预设阈值。

本申请第三方面提供了一种通信装置，该装置可以实现上述第一方面或第一方面任一种可能的实现方式中的方法。该装置包括用于执行上述方法的相应的单元或模块。该装置包括的单元或模块可以通过软件和/或硬件方式实现。例如，该装置可以为第一网络设备，或者，该装置可以为第一网络设备中的组件(例如处理器、芯片或芯片系统等)，或者该装置还可以为能实现全部或部分第一网络设备功能的逻辑模块或软件。

该装置包括收发单元和处理单元；该收发单元用于获取第一拓扑信息，该第一拓扑信息包括N个第二网络设备和P个第三网络设备之间的连接关系，任一第二网络设备为任一第三网络设备的上游网络设备，N为大于或等于2的整数，P为大于或等于1的整数；该收发单元还用于获取M条数据流的通信关系，该M条数据流中的每条数据流的通信关系包括源地址信息和目的地址信息，M为大于或等于2的整数，该M条数据流分别通过该N个第二网络设备向该P个第三网络设备传输；该处理单元用于根据该M条数据流的通信关系和该第一拓扑信息确定M个路径，该M个路径分别与M条数据流对应，该M个路径指示通过该N个第二网络设备向该P个第三网络设备传输该M条数据流的路径；该收发单元还用于分别向该N个第二网络设备发送该M个路径。

在第三方面的一种可能的实现方式中，该M条数据流通过该P个第三网络设备向K个第四网络设备传输，K为大于或等于1的整数；该M条数据流包括第一数据流和第二数据流，该第一数据流的源地址信息与该第二数据流的源地址信息对应于不同的第二网络设备，该第一数据流的目的地址信息与该第二数据流的目的地址信息对应于同一第四网络设备，该M个路径包括第一路径和第二路径，该第一路径与该第一数据流对应，该第二路径与该第二数据流对应，该第一路径与该第二路径对应于不同的第三网络设备。

在第三方面的一种可能的实现方式中，该M个路径还指示该M条数据流在该N个第二网络设备上的出端口。

在第三方面的一种可能的实现方式中，该M条数据流包括第三数据流和第四数据流，该第三数据流的源地址信息和该第四数据流的源地址信息对应于同一第二网络设备，该M个路径包括第三路径和第四路径，该第三路径和该第三数据流对应，该第四路径和该第四数据流对应，该第三路径和该第四路径不同。

在第三方面的一种可能的实现方式中，该M条数据流通过该P个第三网络设备向K个第四网络设备传输，K为正整数；该处理单元具体用于：根据该M条数据流的通信关系和该第一拓扑信息确定第一映射关系，该第一映射关系用于指示该M条数据流中每条数据流的源地址信息对应的第二网络设备与该M条数据流中每条数据流的目标地址信息对应的第四网络设备之间的映射关系；根据该第一映射关系确定该M个路径。

在第三方面的一种可能的实现方式中，该处理单元具体用于：根据该第一映射关系确定第一排序信息，该第一排序信息用于指示该K个第四网络设备对应的第二网络设备的数量的排序；根据该第一排序信息依次对该N个第二网络设备的出端口进行遍历，得到第二映射关系；其中，该第二映射关系用于指示该N个第二网络设备的出端口与该K个第四网络设备之间的映射关系；基于该第二映射关系确定该M个路径。

在第三方面的一种可能的实现方式中，该处理单元具体用于：根据该第一排序信息依次对该N个第二网络设备的出端口进行遍历，得到第三映射关系；其中，该第三映射关系用于指示每个该第四网络设备对应的该第二网络设备的出端口的可选数量；基于该第三映射关系确定该第二映射关系。

在第三方面的一种可能的实现方式中，该收发单元还用于获取第二拓扑信息，该第二拓扑信息包括A个第二网络设备和该P个第三网络设备之间的连接关系，该A个第二网络设备中的至少一个第二网络设备与该N个第二网络设备中的至少一个第二网络设备相同，该A为大于或等于1的整数；该收发单元还用于获取B条数据流的通信关系，该B条数据流中的每条数据流的通信关系包括源地址信息和目的地址信息，该B为大于或等于1的整数，该B条数据流分别通过该A个第二网络设备向该P个第三网络设备传输；该处理单元还用于根据该B条数据流的通信关系和该拓扑信息确定B个路径，该B个路径分别与B条数据流对应，该B个路径指示通过该A个第二网络设备向该P个第三网络设备发送该M条数据流的路径；其中，该B个路径对应的第二网络设备的出端口不同于该M个路径对应的第二网络设备的出端口；该收发单元还用于分别向该A个第二网络设备发送该B个路径。

在第三方面的一种可能的实现方式中，该收发单元具体用于分别接收来自该N个第二网络设备的该M条数据流的通信关系。

在第三方面的一种可能的实现方式中，该M条数据流对应于多个人工智能AI集合通信任务中的一个任务。

在第三方面的一种可能的实现方式中，该第一网络设备为控制器或该P个第三网络设备中的一个网络设备。

本申请第三方面中，通信装置的组成模块还可以用于执行第一方面的各个可能实现方式中所执行的步骤，并实现相应的技术效果，具体均可以参阅第一方面，此处不再赘述。

本申请第四方面提供了一种通信装置，该装置可以实现上述第二方面或第二方面任一种可能的实现方式中的方法。该装置包括用于执行上述方法的相应的单元或模块。该装置包括的单元或模块可以通过软件和/或硬件方式实现。例如，该装置可以为第二网络设备，或者，该装置可以为第二网络设备中的组件(例如处理器、芯片或芯片系统等)，或者该装置还可以为能实现全部或部分第二网络设备功能的逻辑模块或软件。

该装置包括收发单元和处理单元；该处理单元用于确定Q条数据流的通信关系，该Q条数据流中的每条数据流的通信关系包括源地址信息和目的地址信息，Q为大于或等于1的整数；该收发单元用于向第一网络设备发送Q条数据流的通信关系；该收发单元还用于接收来自第一网络设备的Q个路径，该Q个路径指示该第二网络设备传输该Q条数据流时使用的路径；该收发单元还用于基于该Q个路径传输该Q条数据流。

在第四方面的一种可能的实现方式中，该路径信息还指示该Q条数据流在该第二网络设备上的出端口。

在第四方面的一种可能的实现方式中，该Q条数据流包括第三数据流和第四数据流，该第三数据流的源地址信息和该第四数据流的源地址信息对应于该第二网络设备，该路径信息包括第三路径和第四路径，该第三路径和该第三数据流对应，该第四路径和该第四数据流对应，该第三路径和该第四路径不同。

在第四方面的一种可能的实现方式中，该Q条数据流对应于多个人工智能AI集合通信任务中的一个任务。

本申请第四方面中，通信装置的组成模块还可以用于执行第二方面的各个可能实现方式中所执行的步骤，并实现相应的技术效果，具体均可以参阅第二方面，此处不再赘述。

本申请第五方面提供了一种通信装置。该通信装置包括至少一个处理器。该至少一个处理器与存储器耦合。该存储器用于存储程序或指令。该至少一个处理器用于执行该程序或指令，以使该装置实现前述第一方面或第一方面任意一种可能的实现方式所述的方法，或，以使该装置实现前述第二方面或第二方面任意一种可能的实现方式所述的方法。

本申请第六方面提供了一种通信装置，包括至少一个逻辑电路和输入输出接口；该逻辑电路用于执行如前述第一方面或第一方面任意一种可能的实现方式所述的方法，或，该逻辑电路用于执行如前述第二方面或第二方面任意一种可能的实现方式所述的方法。

本申请第七方面提供一种计算机可读存储介质，用于存储计算机指令；当计算机指令被处理器执行时，该处理器执行如上述第一方面或第一方面任意一种可能的实现方式所述的方法，或，该处理器执行如上述第二方面或第二方面任意一种可能的实现方式所述的方法。

本申请第八方面提供一种计算机程序产品(或称计算机程序)，该计算机程序产品包括指令，当该计算机程序产品中的指令被处理器执行时，该处理器执行上述第一方面或第一方面任意一种可能实现方式的方法，或，该处理器执行上述第二方面或第二方面任意一种可能实现方式的方法。

本申请第九方面提供了一种芯片系统，该芯片系统包括至少一个处理器，用于支持通信装置实现上述第一方面或第一方面任意一种可能的实现方式中所涉及的功能，或，用于支持通信装置实现上述第二方面或第二方面任意一种可能的实现方式中所涉及的功能。

在一种可能的设计中，该芯片系统还可以包括存储器，存储器，用于保存该通信装置必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包含芯片和其他分立器件。可选的，该芯片系统还包括接口电路，该接口电路为该至少一个处理器提供程序指令和/或数据。

本申请第十方面提供了一种通信系统，该通信系统包括上述任一方面中的第一网络设备。

可选地，该通信系统包括上述任一方面中的一个或多个第二网络设备。

可选地，该通信系统包括上述任一方面中的一个或多个第三网络设备。

可选地，该通信系统包括上述任一方面中的一个或多个第四网络设备。

其中，第二方面至第十方面中任一种设计方式所带来的技术效果可参见上述第一方面中不同实现方式所带来的技术效果，在此不再赘述。

附图说明

图1a为本申请提供的通信系统的一个示意图；

图1b为本申请提供的通信系统的另一个示意图；

图1c为本申请提供的通信系统的另一个示意图；

图1d为本申请提供的通信系统的另一个示意图；

图1e为本申请提供的通信系统的另一个示意图；

图1f为本申请提供的通信系统的另一个示意图；

图2a为本申请涉及的通信场景的一个示意图；

图2b为本申请涉及的通信场景的另一个示意图；

图2c为本申请涉及的通信场景的另一个示意图；

图2d为本申请涉及的通信场景的另一个示意图；

图2e为本申请涉及的通信场景的另一个示意图；

图2f为本申请涉及的通信场景的另一个示意图；

图2g为本申请涉及的通信场景的另一个示意图；

图3为本申请提供的路径确定的方法的一个示意图；

图4a为本申请提供的路径确定的方法的另一个示意图；

图4b为本申请提供的路径确定的方法的另一个示意图；

图5a为本申请提供的AI集合通信过程的一个示意图；

图5b为本申请提供的AI集合通信过程的另一个示意图；

图5c为本申请提供的AI集合通信过程的另一个示意图；

图6为本申请提供的AI集合通信过程的另一个示意图；

图7为本申请提供的AI集合通信过程的另一个示意图；

图8为本申请提供的通信装置的一个示意图；

图9为本申请提供的通信装置的另一个示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

本申请实施例中的术语“系统”和“网络”可被互换使用。“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A、同时存在A和B、单独存在B的情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如“A，B和C中的至少一个”包括A，B，C，AB，AC，BC或ABC。以及，除非有特别说明，本申请实施例提及“第一”、“第二”等序数词是用于对多个对象进行区分，不用于限定多个对象的顺序、时序、优先级或者重要程度。

需要说明的是，本申请中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言，使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

在通信网络中，不同通信装置之间不存在直连链路的情况下，不同通信装置之间交互的数据流需要经过其他通信装置的转发。其中，该其他通信装置可以称为转发设备，例如该转发设备可以包括路由器、交换机或虚拟机等。下面将结合图1a至图1c的实现示例，对本申请涉及的通信系统进行介绍。

参见图1a，为本申请实施例提供的通信系统的架构示意图。如图1a所示，该系统包括多个用户边缘(customer edge，CE)设备，例如用户边缘设备101和用户边缘设备102，以及可能存在的其他用户边缘设备；该系统还包括多个网络设备，例如网络设备103、网络设备104和网络设备105，以及可能存在的其他网络设备。

在图1a中，用户边缘设备可以作为通信系统传输的数据流的入口设备，在这种情况下，该用户边缘设备可以连接数据流的发送端，即数据流的源地址信息所指示的设备。或者，用户边缘设备可以作为通信系统传输的数据流的出口设备，在这种情况下，该用户边缘设备可以连接数据流的接收端，即数据流的目的地址信息所指示的设备。其中，数据流的发送端或数据流的接收端可以为终端设备、服务器、虚拟机等具备数据收发需求的设备。

可选的，在图1a中，网络设备103、网络设备104和网络设备105是路由器(router)、交换机(switch)、虚拟机等设备。这些网络设备可以用于将数据流从某一个用户边缘设备传输至另一个用户边缘设备。

可选地，用户边缘设备可以称为边缘交换设备。

以图1a的实现场景为例，随着组网的规模越加庞大，有可能需要通过多层网络的转发才可以实现不同通信装置之间数据流的交互。换言之，图1a中的不同网络设备之间可以组网成多层网络。下面将结合一些实现示例，对本申请提供的通信场景中的多层网络进行介绍。

一种实现示例如图1b所示，图中箭头的指向为数据流的流向，数据流依次从数据流的源地址信息指示的源设备流向N(N为大于或等于2的整数)个第二网络设备、P(P为大于或等于1的整数，图示中以P大于或等于2为例)个第三网络设备以及K(K为大于或等于2的整数)个第四网络设备之后，该数据流被目的地址信息指示的目的设备所接收。在图1b的数据流流向可知，N个第二网络设备为P个第三网络设备的上游设备，相应的，P个第三网络设备也可以称为N个第二网络设备的下游设备。类似地，P个第三网络设备为K个第四网络设备的上游设备，相应的，K个第四网络设备也可以称为P个第三网络设备的下游设备。

可选地，图1b所示场景示例中，还可以包括与各个第二网络设备连接的控制器，本申请提供的路径确定的方法可以由该控制器执行，也可以由任一第三网络设备执行。

此外，考虑到网络的复杂性，某一个数据流的源设备与该数据流的目的设备有可能均连接至同一个网络设备，或者，某一个数据流的源设备与另一数据流的目的设备有可能均连接至同一个网络设备，或者，某一个数据流的源设备与该数据流的目的设备有可能不是连接至同一个网络设备，或者，某一个数据流的源设备与另一数据流的目的设备有可能不是连接至同一个网络设备。换言之，N个第二网络设备有可能与K个第四网络设备完全不同，或者，N个第二网络设备有可能与K个第四网络设备部分相同或者完全相同。下面将结合更多的实现示例进一步介绍。

一种实现示例如图1c所示，N个第二网络设备与K个第四网络设备完全不同，即任一第四网络设备与任一第二网络设备均不相同。

另一种实现示例如图1d所示，N的取值与K的取值相等，且N个第二网络设备与K个第四网络设备完全相同。

可选地，N个第二网络设备、P个第三网络设备以及K个第四网络设备所组成的多层网络可以为包含有接入层、汇聚层和核心层的三层网络，该多层网络也可以为包含有脊(Spine)节点和叶(Leaf)节点的两层网络，或者是其他实现，本申请不做限定。

在图1e中，以上述多层网络为包含有Spine节点和Leaf节点的两层网络为例。在图1e中，以N个第二网络设备与K个第四网络设备完全相同为例进行说明。其中，Leaf节点分别可以连接至一个或多个服务器(Server)，不同Server之间交互的数据流可以通过Leaf节点转发。其中，当两个Server连接至同一Leaf节点时，这两个Server之间的数据流通过该同一Leaf节点的转发即可实现交互；当两个Server连接至不同Leaf节点时，这两个Server之间的数据流需要通过各自连接的Leaf节点以及Spine节点的转发才可实现交互。

需要说明的是，为了便于描述，在后文实施例中主要介绍两层网络之间的通信过程进行描述。而在方案的实际应用中，后文实施例还可以应用于其它网络中的任意两个网络之间的通信过程。例如，对于包含有接入层、汇聚层和核心层的三层网络而言，可以在接入层和汇聚层之间的网络应用后文实施例，也可以在汇聚层和核心层之间的网络应用后文实施例，也可以在接入层和核心层之间的网络应用后文实施例。

在图1f中，此处仍以上述多层网络为包含有Spine节点和Leaf节点的两层网络为例，后文实施例的实现过程主要涉及网络设备(例如Spine节点和Leaf节点)中用于接收数据的接收模块、用于本地处理数据的处理模块和用于发送数据的发送模块中至少一个模块的改进。

以上述多层网络为数据中心网络为例。随着云计算、5G、大数据、物联网、AI等新技术的跨越式发展，以及无人驾驶汽车、5G智造工厂、智能风控、人脸识别等应用的成熟商用，对数据中心网络要求越来越高，要求数据中心提供无丢包、高吞吐和低时延的无损网络。随着数据中心网络包含的业务逐渐丰富，组网的规模也随之越加庞大。所以，数据中心网络多采用多根分层的网络拓扑。在不同层交换设备间存在等价的成员链路。在网际协议(internet protocol，IP)网络中，多条不同链路到达同一目的地址的网络环境中。当多条路由的路由优先级和路由度量都相同时，这几条路由就称为等价路由则会形成等价多路径(Equal-Cost Multi-Path，ECMP)。在多路径分叉位置的设备，会基于特定的策略进行路径选择，将报文发往不同的路径实现流量负载分担。ECMP机制是将数据包的特征字段(例如：源媒体接入控制(media access control，MAC)地址、目的MAC地址、IP五元组信息等)作为哈希因子，通过哈希(HASH)算法生成哈希-键(HASH-KEY)值，然后根据HASH-KEY值在负载分担链路中选取一条成员链路对数据包进行转发。这时，对于具有不同特征字段的数据包，由于其HASH-KEY值可能不一样，因此可能会选取不同的成员链路进行转发；对于具有相同特征字段的数据包，由于其HASH-KEY值一样，因此会选取相同的成员链路进行转发。这样，既实现了不同数据流在不同成员链路上的负载分担转发，也保证了同一数据流中各数据包到达接收端的时序性。

换言之，在上述多层网络中，数据流的源地址对应的通信装置和数据流的目的地址对应的通信装置之间往往存在多条路径。作为转发设备的通信装置在转发数据流的时候，会基于本地策略在该多条路径中进行路径选择，并基于本地选择的路径转发数据流。下面将以前述图1b所示架构为例，结合图2a至图2g的实现示例，对基于本地选择确定路径的实现过程进行示例性描述。

如图2a所示，服务器A(Server-A)需要分别与服务器B(Server-B)和服务器C(Server-C)之间通信时，需要经过包含有交换设备A(Switch-A)和交换设备B(Switch-B)，以及包含有交换设备1(Switch-1)、交换设备2(Switch-2)、交换设备3(Switch-3)和交换设备4(Switch-4)的多层网络。在图2a中涉及的数据流包括四个，即图2a中传输报文1，5，9的数据流1，传输报文5，6，10的数据流2，传输报文3，7，11的数据流3，传输报文4，8，12的数据流4。由数据流向可知，在图2a中，Switch-A为第二网络设备的实现示例，Switch-1，Switch-2，Switch-3和Switch-4为第三网络设备的实现示例，Switch-B为第四网络设备的实现示例。当Server-A与Server-B及Server-C经过多层网络通信时，网络中Switch-A与Switch-B之间存在4条相同的路径即为4条等价路径，ECMP通过hash计算，根据hash-key值为数据报文选在等价的成员链路中进行选择并转发，使得四个数据流在该四个ECMP上分别进行传输。

具体地，基于本地选择确定路径的实现过程可以基于负载分担技术实现。其中，基于负载分担技术按粒度划分常见的有逐包负载分担(Packet-based Load Balancing)，逐流负载分担(Flow-based Load Balancing)，以及逐子流负载分担(Flowlet-based Load Balancing)技术。下面将通过一些实现示例这三种实现过程进行描述。

实现方式一，逐包负载分担的实现过程。

具体地，逐包多路径负载分担的实现过程中，交换设备将第N个报文转发至路径i，将第N+1个报文转发至路径i+1，以此类推，在交换设备出端口进行轮询。其行为的数学描述为，路径选择为报文的编号对可选等价路径个数进行取模运算。目的是将所有报文平均分布在下一跳的等价成员链路上。

一种实现示例如图2b所示，Server-A向Server-B按时间顺序先后发出送四个报文即图中1-4个报文，此4个报文也以发送的先后顺序到达了Switch-A，Switch-A按逐包负载分担的策略将报文1和3转发至与Switch-1相连的路径上，并且Switch-A将报文2和4转发至与Switch-2相连的路径上。

由图2b所示示例可知，在实现方式一中，可以做到等价成员路径均匀分担网络负载。但是因不同的路径转发时延有差异，会导致报文到达接收端时产生乱序。如图2c所示，由于报文1和报文3所在的链路与报文2和报文4所在的链路的传输时延有可能不同，将会造成报文2和4早于报文1和3到达Server-B。其中，乱序现象会因重传影响网络性能。

实现方式二，逐流负载分担的实现过程。

具体地，依赖ECMP机制实现多个下一跳机制的选择，这种机制是将数据包的特征字段(比如源MAC地址、目的MAC地址、IP五元组信息等)作为哈希因子，通过HASH算法生成HASH-KEY值，然后根据HASH-KEY值在负载分担链路中选取一条成员链路对数据包进行转发。对于具有不同特征字段的数据包，由于其HASH-KEY值可能不一样，因此可能会选取不同的成员链路进行转发；对于具有相同特征字段的数据包，由于其HASH-KEY值一样，因此会选取相同的成员链路进行转发。这样，既实现了不同数据流Flow在不同成员链路上的负载分担转发，也保证了同一数据流Flow中各数据包到达接收端的时序性。

一种实现示例如图2d所示，Server-A向Server-D传送包含报文1，2，5，6的数据流1(记为Flow 1)。Server-B向Server-C传送包含报文3，4的数据流2(记为Flow 2)。Switch-A通过入端口报文的五元组信息进行hash计算，报文1，2，5，6得到相同的Key值，在Switch-A的下一跳走相同的路径。同理，报文3，4同走Switch-A的另一条下游路径。

由图2d所示示例可知，逐流负载分担的缺点是没有考虑负载分担链路中各成员链路的利用率，从而会出现成员链路之间的负载分担不均衡，尤其当大数据流出现时会加剧所选中成员链路的拥塞甚至引起丢包。

此外，逐流负载分担会形成两类冲突，造成网络负载不均衡，影响业务性能。下面将分别通过图2e和图2f进行介绍。

一类冲突可以称为本地冲突，原因是由于输入的不同特征字段通过hash算法计算的hash-key结果相同，从而导致不同的流被转发至相同的路径上，导致冲突发生。

示例性的，本地冲突的实现过程如图2e所示。Server-A、Server-B、Server-C、Server-D的IP地址分别为：0.0.0.1、0.0.0.2、0.0.0.3、0.0.0.4，Server-A向Server-C发送报文1，2，Server-B向Server-D发送报文3，4，Switch-A上的HASH函数为“源ip+目的ip”。为此，Switch-A在本地执行的路径计算方法如下：

1.Server-A发送到Server-C的报文：HASH函数计算结果为4，路径数量为2，HASH函数计算结果模路径数量的值为0，即选择第0条路径(路径编号从0开始)。

2.Server-B发送到Server-D的报文，HASH函数计算结果为6，路径数量为2，HASH函数计算结果模路径数量的值为0，即选择第0条路径(路径编号从0开始)。

从路径选择结果可知，从Server-A和Server-B传送的所有报文，均被转发到了Switch-A到Switch-1之间的路径上，Switch-A到Switch-2之间路径上没有报文，导致网络负载不均衡，业务性能受损。

另一类冲突可以称为全局冲突，原因是由于当前负载分担技术采用分布式决策机制，缺少全局视角，交换设备对上游流量的流向无法预测和控制，从而导致的流量冲突。

示例性的，全局冲突的实现过程如图2f所示。包含报文1和报文2的Flow-1是从Server-A到Server-C的一条流，包含报文3和报文4的Flow-2是从Server-B到Server-D的一条流。当Flow-1经过Switch-A时，选择到Switch-1之间的成员链路对流量进行转发。当Flow-2经过Switch-B时，也选择了到Switch-1之间的成员链路对flow-2进行转发。Flow-1和Flow-2的目的交换设备同在Switch-C本地，而Switch-1与Switch-C之间只有一条链路相连。所以，Flow-1和Flow-2将在Switch-1下游链路上发生冲突，且在当前的分布式决策的负载分担技术中，全局冲突问题是无法预见和控制避免的，此类冲突将严重影响网络性能。

实现方式三，逐子流负载分担的实现过程。

具体地，网络设备在转发数据包时会判断待转发数据包与其所属数据流中上一个数据包之间的时间间隔，若大于负载分担链路中各成员链路的最大链路传输时延(flowlet_gap_time)，则认为待转发数据包是一个新子流(Flowlet)的首包；若小于负载分担链路中各成员链路的最大链路传输时延，则与上一个数据包作为同一个Flowlet。设备基于Flowlet选取当前负载分担链路中负载较轻的成员链路进行转发，同一Flowlet中的数据包选取相同的成员链路进行转发。

一种实现示例如图2g所示，Server-A，Server-B分别发送Flow-1和Flow-2经过网络到Server-C。Flow-1中的报文1，2，3由Switch-1和Switch-A之间的链路转发记为数据流1-1(Flowlet1-1)，Flow-2的报文4，5因为是不相同的Flow，则由另一条等价成员链路，即Switch-2和Switch-A之间的链路进行转发记为数据流2-1(Flowlet2-1)。Flow-1中的报文6，7因为与之前的报文间隔大于flowlet_gap，所以报文6被检测为是新flowlet的首包，则由报文6，7组成的新flowlet与报文1，2，3所组成flowlet，虽然是相同的flow，但为不同的flowlet，需要通过不同的等价成员链路进行转发记为数据流1-2(Flowlet1-2)。所以，如图2g中所示，Flow-1中的Flowlet1-1即报文1，2，3通过Switch-A到Switch-1之间链路转发；Flow-1中的Flowlet1-2和Flow-2即报文4，5，6，7则通过Switch-A到Switch-2之间链路转发。

在实现方式三的逐子流负载分担的实现过程中，可以基于报文间距将一整条流分成多条子流的方式。并且，能够根据网络特征对不同子流选路：如根据链路利用率，出端口队列深度等。但是，该实现方式仍存在不足之处。一方面，主机侧无法主动构造flowlet；另一方面，如果强行主机侧采用发-停-发的机制强行构造flowlet，在网络无拥塞时影响吞吐，链路利用率较低；而网络有拥塞时，无法保证构造的flowlet的间隔大于交换机设置的flowlet gap，从而导致接收端乱序，触发重传。综上所述，基于Flowlet的多路径负载分担技术，同时具有基于包和基于流的负载分担技术的缺点，即负载不均衡和报文乱序的风险。同时，基于flowlet的负载分担技术需要考虑，权衡网络吞吐最大化和报文乱序最小化，精确设置flowlet_gap_time值。但是，在权衡网络吞吐和报文乱序过程中，flowlet_gap_time并不是一个静态的参数，需要通过网络性能指标的反馈，动态调整所述flowlet_gap_time值。这种动态flowlet_gap_time值的机制一方面会影响网络的吞吐率，无法达到全局最优值。

由上述实现方式一至实现方式三的实现过程可知，存在如下技术问题：

一方面，在多层网络中，往往存在多个作为转发设备的通信装置，而每一个作为转发设备的通信装置都需要基于各自的本地策略在多条路径中进行路径选择的过程，才可以确定转发路径，导致该路径确定方式的效率较低。另一方面，在上述三种实现方式中，由于各个作为转发设备的通信装置在本地做决策的方式，由于缺乏网络传输的多个数据流的全局规划，使得该路径确定方式容易造成其它的问题，例如在实现方式一容易造成的交换设备本地流量冲突，在实现方式二中容易造成全局冲突以及本地冲突，在实现方式三中容易影响网络的吞吐率。

为了解决上述问题，本申请提供了一种路径确定的方法及相关设备，用于提升数据流的转发效率。下面将结合附图进一步详细说明。

请参阅图3，为本申请提供的一种路径确定的方法的一个实现示意图，该方法包括如下步骤。需要说明的是，该方法可以由第一网络设备执行，或者，该方法也可以由第一网络设备中的部分组件(例如处理器、芯片或芯片系统等)执行，或者该方法还可以由能实现全部或部分第一网络设备功能的逻辑模块或软件实现。在下述实施例中，以该方法由第一网络设备执行为例进行描述，该第一网络设备可以为路由器、交换机、虚拟机等。

S301.第一网络设备获取第一拓扑信息。

本实施例中，第一网络设备在步骤S301中获取的第一拓扑信息包括N个第二网络设备和P个第三网络设备之间的连接关系，任一第二网络设备为任一第三网络设备的上游网络设备，N为大于或等于2的整数，P为大于或等于1的整数。

在一种可能的实现方式中，该第一网络设备为控制器或该P个第三网络设备中的一个网络设备。具体地，执行该方法确定并发送M个路径的第一网络设备可以为控制器，也可以为P个第三网络设备中的一个网络设备，以提升方案实现的灵活性。

作为一种实现示例，如前述图1b所示场景示例中，第一网络设备可以为图1b中的控制器，或者，第一网络设备可以为图1b中的任一第三网络设备。

示例性的，以前述图1e所示场景为例。数据流的源地址信息所指示的一个Server向数据流的目的地址信息所指示的另一个Server发送数据流的过程中，该一个Server所发送的数据流有可能分别需要经过该一个Server所连接的Leaf节点(为便于后文引用，记为源Leaf节点)、Spine节点以及该另一个Server(为便于后文引用，记为目的Leaf节点)所连接的Leaf节点的转发。其中，源Leaf节点可以为步骤S301中第一拓扑信息所指示的N个第二网络设备，Spine节点可以为步骤S301中第一拓扑信息所指示的P个第三网络设备，目的Leaf节点可以为后文提及的K个第四网络设备。

可选地，第一网络设备可以为图1e中与各个Leaf节点连接的任一Spine节点，或者，第一网络设备可以为图1e中与各个Leaf节点连接的控制器(图中未示出)，以便于该第一网络设备在后续步骤S304中向各个Leaf节点发送M个路径。

应理解，在图1b所示示例，在不同的数据流中同一Leaf节点可能具备不同的角色。

例如，当数据流为双向数据流的情况下，某一个Leaf节点既是该数据流的一个流向的源Leaf节点，也是该数据流的另一个流向的目的Leaf节点。又如，当数据流为单向数据流的情况下，某一个Leaf节点是该数据流的源Leaf节点，或者是该数据流的目的Leaf节点。又如，同一个Leaf节点可以分别用于传输不同的数据流，在某一数据流中该Leaf节点可能是源Leaf节点，而在另一数据流中该Leaf节点可能是源Leaf节点或目的Leaf节点。

S302.第一网络设备获取M条数据流的通信关系。

本实施例中，第一网络设备在步骤S302中获取的M条数据流中的每条数据流的通信关系包括源地址信息和目的地址信息，M为大于或等于2的整数，该M条数据流分别通过该N个第二网络设备向该P个第三网络设备传输。

需要说明的是，本申请对步骤S301和步骤S302的实现过程不做限定，即，第一网络设备可以先执行步骤S301后执行步骤S302，该第一网络设备也可以先执行步骤S302后执行步骤S301。

在一种可能的实现方式中，该第一网络设备获取M条数据流的通信关系包括：该第一网络设备分别接收来自该N个第二网络设备的该M条数据流的通信关系。具体地，第一网络设备可以基于分别接收来自该N个第二网络设备的该M条数据流的通信关系的方式，以获取该M条数据流的通信关系，以便于该第一网络设备和N个第二网络设备之间进行交互的方式获得该M条数据流的通信关系。

可选地，在步骤S302中，M条数据流的通信关系预配置于该第一网络设备，以避免不同网络设备之间的交互所造成的开销以及时延增加。

类似地，在前述步骤S301中，第一网络设备在步骤S301中获取的第一拓扑信息可以是通过N个第二网络设备所发送的各自的拓扑信息确定，或者，该第一拓扑信息预配置于该第一网络设备。

示例性的，下面将以第一网络设备通过N个第二网络设备所发送的各自的通信关系和拓扑信息确定步骤S301中的第一拓扑信息以及步骤S302中的M条数据流的通信关系为例，进行示例性说明。其中，每个第二网络设备需对本地大流建立流表，包括如下过程。

首先，当一条新流进入第二网络设备时，第二网络设备将此条流的五元组及特征信息(例如：首包时间，字节数)添加至原始流表。

其次，第二网络设备基于采集周期的字节数设置大小流门限值，并过滤去掉小流，保留大流。

再次，第二网络设备将原始流表转化成二元组流表，保留源IP和目的IP。目的是保留全局最优路径分配算法所需的关键字段，节省存储空间。

最后，第二网络设备将过滤后的二元组流表汇聚本地拓扑知识，组成本地流量信息表。该本地流量信息表的实现示例如表1至表3所示。

表1

表2

表3

可选地，对于前后两次获取的流表，第二网络设备可以对已经老化的表项进行删除动作。另外，还可以以文件的形式提供一个任务的全部通信节点，例如使用主机文件(hostfile)的形式，将任务的所有通信设备显式提供。配合显式通信算法名称，就可以获得当前任务的通信关系。

此后，第二网络设备获取本地流量信息后，将建成的流表汇聚到第一网络设备，使得第一网络设备得到步骤S302中的M条数据流的通信关系。

可选地，对上述表1至表3进行汇聚得到的表格的实现示例如下表4所示。

表4

可选地，上述实现过程可以表示为图4a中的实现过程，包括“步骤401.对本地大流建立流表并聚合通信关系”。应理解，图4a所示实现过程中的“全局计算节点”即为第一网络设备，“边缘交换节点”即为N个第二网络设备。

此外，第一网络设备周期性对本地流量通信关系和拓扑信息进行获取。并汇聚到第一网络设备，第一网络设备对汇聚的N个第二网络设备的本地流量信息表进行整合，并通过通信关系划分通信集群，以确定该M条数据流。

可选地，N个第二网络设备将本地的通信关系和拓扑信息汇聚到第一网络设备后，第一网络设备可以明确当前需要计算的M条数据流属于单个任务场景还是多任务场景。如果是多个任务的场景，需要对每个单独的任务进行资源分配工作，该实现过程可以表示为图4a中的实现过程中“步骤402.获取本地拓扑信息，并汇聚完整任务的拓扑信息”。

可选地，第一网络设备还可以执行图4a中，“步骤403判断是否覆盖全部节点”，并且，在确定覆盖全部节点的情况下，第一网络设备执行“步骤405.根据汇聚流表指导全部任务急全部step通信关系”；在确定未覆盖全部节点的情况下，第一网络设备执行图4a中“步骤404.根据通信关系按任务分资源”中的实现过程。

下面将对行图4a中步骤404对应的实现过程进一步描述，包括如下过程。

4041.输入通信关系。

4042.根据根据通信关系和拓扑信息建立Dtor到Stor的映射矩阵。

4043.Tor出现的次数降序进行遍历分配。

4044.按Dtor上行端口顺序分配链路资源。

4045.判断是否遍历全部Dtor，若是则执行步骤4046，若否则重新执行步骤4043。

4046.判断是否有其他通信关系待分配资源，若是则执行步骤4047，若否则重新执行步骤4042。

4047.资源分配结束。

由上述实现过程可知，第一网络设备根据拓扑信息和首包时间将相同任务的通信关系转化成通信关系矩阵。并且，第一网络设备将通信关系矩阵转换成Dtor到Stor的映射矩阵，并从出现次数最多的ToR开始分配资源。如图4b中所示场景中，可得通信关系矩阵如表5所示，Dtor-SID映射矩阵如下表6所示，Dtor-Stor映射矩阵如下表7所示。

表5

表6

表7

在上述表5至表7的实现示例中，ToR-1出现的次数最多，则从ToR-1开始分配资源。即，第一网络设备在分配资源时，将ToR的上行端口在Spine个数上轮询分配。如图4b所示，ToR-1的出端口在S-1和S-2上轮询，遍历全部ToR后结束资源分配过程。实施例分配结果如图4b中不同S节点(包括S1、S2)与T节点(包括T1、T2、T3和T4)之间的连接关系所示，为当前任务所分配到的链路资源。

在一种可能的实现方式中，第一网络设备在步骤S302中获取的M条数据流对应于多个人工智能(artificial intelligence，AI)集合通信任务中的一个任务。可选地，该M条数据流对应于长稳态流量任务，该长稳态流量任务中的数据流的流量大小在一定的时长内大于预设阈值。

示例性地，本申请提供的方案可以适用于，通信关系周期性变化的，或者是收敛时间要求严格的大流场景下，主要细分为长稳态流场景和AI集合通信场景。

可选地，长稳态流量场景的通信关系特点是：通信关系一般不发生改变，也可视为变化周期无穷大。此场景下，流表随任务开始和结束进行更新和老化。流程上只需要在新任务开始后，边缘交换设备获取本地流量通信关系，并在第一网络设备上聚合成流量信息表，即可作为全局最优路径分配算法的输入进行计算。但如果出现相同目的IP，而源IP不同。说明此场景存在多打一(Incast)流量。长稳态流量的Incast场景不属于本发明要解决问题。如果遇到此类通信关系，则不需要通过全局最优路径分配算法计算。

可选地，AI集合通信场景的通信关系特点是：AI集合通信场景的设备间通信根据算法通常将整个过程分成多个子阶段(phase)。在各个phase中，设备的通信关系都发生变化，且在每个phase开始的时候，通信集群内所有设备需要做同步。这对算法的收敛速度要求很高。下面将对AI集合通信场景主要使用三类算法进行示例性描述，该三类算法包括Halving-Doubling(H-D)算法，Ring算法，Tree算法。

一种可能的实现方式中，H-D算法分为两个阶段：第一个阶段为Halving做分散规约(reduce-scatter)操作，如图5a所示。共执行(log₂N)个子阶段(phase)，其中N为通信节点个数。每前进一个phase，节点间交互的数据量减半。

具体地，由于AI集合通信场景的通信关系特点是：AI集合通信场景的设备间通信根据算法通常将整个过程分成多个子阶段(phase)。在不同phase中，设备的通信关系都发生变化，通信的步长为,其中n为当前的phase，N为通信节点个数。且在每个phase开始的时候，通信集群内所有设备需要做同步。这对算法的收敛速度要求很高。

第二个阶段为Doubling做全局收集(all-gather)操作,如图5b所示。与Halving相同，共执行log₂N个phase，所以在整个H-D过程中共需要进行2*log₂N个phase。与Halving不同，每前进一个phase，节点间交互的数据量增倍。

综上，在H-D算法工作的AI集合通信的设备间通信的全局规约(all-reduce)阶段，一共需要2*log₂N个phase。其中，N为通信节点个数。在全局最优路径分配算法对网络内流量最优路径计算前，需要对整个all-reduce阶段的全部phase内的流量通信关系进行还原，在全局最优路径分配算法计算阶段也将全部phase内的最优路径进行计算，得到最优结果。

如图5c所示，前述表4可以表示为图5c中的通信关系。可见，从一个任务的通信关系恢复出H-D算法支撑的all-reduce过程的全部phase通信关系。对于所有的通信设备，对相同的server本地的所有流进行排序，排序后的相同编号的位置，即为相同的phase。这种排序的优势在于可避免进行整网的时钟同步。

一种可能的实现方式中，Ring算法与H-D算法不同，主要在于其整个通信过程的通信关系不发生改变。

示例性的，如图6所示，为整个all-reduce阶段通信关系特征。其中，Ring算法同H-D算法一样分成两部分进行，第一步为规约分散(scatter-reduce),第二步为all-gather。在scatter-reduce部分，通信节点将交换数据，使每个节点可得到最终结果一块数据。在之后的all-gather部分，节点将交换这些最终的块，以便全部节点得到完成的数据。在scatter-reduce和all-gather过程中，N个通信节点中的每一个节点都将分别接受和发送N-1次数据。每次都会发送K/N的数据量，其中K表示的是完整数据中不同节点上相加的值的总和。因此，传输到每个节点和从每个节点发送出的数据总量表示为：
DataTransferred＝2(N-1)K/N；

可见，在这个all-reduce过程中，N个通信节点共进行2(N-1)个phase，但在所有的phase中，节点的通信关系没有发生任何变化。所以，此类算法的通信关系处理方式同长稳态流量相同，只需计算出一个phase的最优路径即为全部phase全局最优路径计算结果。

一种可能的实现方式中，Tree算法与Ring算法不同之处在于，Tree算法在每个phase阶段通信关系会发生变化。与H-D算法不同之处在于，Tree算法在相同的phase内，发送和接收数据的通信对象是不相同的。

示例性的，如图7所示，为整个all-reduce阶段通信关系特征。其中，在Tree算法中，需要对两棵通信关系树进行操作。两棵树的特点为，第一棵树的叶节点为第二棵树的脊节点，第一棵树的脊节点为第二棵树的叶节点。另外，相同脊节点下的叶节点不可同时对脊节点发送或接收数据。在整个设备间通信过程中，Tree算法也分为两个步骤：第一步为归约(reduce)，第二步为广播(broadcast)。在reduce阶段，第i时刻，其通信关系为图中虚线链路连接的设备可进行通信，在第i+1时刻，其通信关系为图中实线链路连接的设备可进行通信。在broadcast阶段，通信关系与reduce阶段的通信关系特征相同。

综上所述，三种算法使节点的通信关系发生了改变，包括长稳流量的通信关系特征均不相同。长稳流量与Ring算法的通信特征相似，在整个设备间通信的过程中不会发生变化。H-D算法的节点通信关系是周期性发生改变，且Halving过程与Doubling过程为互逆。在相同phase内，通信关系是发送和接收对象相同。Tree算法的节点间通信关系类似H-D算法，周期性会发生改变。但与H-D算法不同的是，在相同phase内，Tree算法下的同一节点发送和接收数据的对象不相同。通过以上特征可以对流量进行识别，并完成全部phase的通信关系。另外，还可以通过文件制定当前通信的算法：如在文件中显式提供Ring，H-D，Tree或Static通信的算法标志。

可选地，本申请提供的方案可以适用于网络带宽整体充足的场景。所述网络整体带宽充足表示为，假设网络内有n条带宽为d的流，要分布在m条容量为c的等价链路中，如果nd﹥mc，表示网络总体带宽短缺。单靠负载均衡机制无法解决拥塞问题，需要协同调度算法或拥塞控制算法共同解决网络拥塞问题。本发明适用于nd≤mc的场景下。例如：上述提及的以大流为主，通信关系周期变化，算法收敛时间有严格要求的AI集合通信场景；通信关系相对固定的长稳态流量场景等。

S303.第一网络设备根据该M条数据流的通信关系和该第一拓扑信息确定M个路径。

本实施例中，第一网络设备在步骤S301中获取第一拓扑信息并且在步骤S302中获取M条数据流的通信关系之后，在步骤S303中，该第一网络设备根据该M条数据流的通信关系和该第一拓扑信息确定的M个路径分别与M条数据流对应，该M个路径指示通过该N个第二网络设备向该P个第三网络设备传输该M条数据流的路径。

在一种可能的实现方式中，该M条数据流通过该P个第三网络设备向K个第四网络设备传输，K为正整数；该第一网络设备在步骤S403中根据该M条数据流的通信关系和该第一拓扑信息确定M个路径的过程具体包括：该第一网络设备根据该M条数据流的通信关系和该第一拓扑信息确定第一映射关系，该第一映射关系用于指示该M条数据流中每条数据流的源地址信息对应的第二网络设备与该M条数据流中每条数据流的目标地址信息对应的第四网络设备之间的映射关系；该第一网络设备根据该第一映射关系确定该M个路径。

可选地，任一第四网络设备与任一第二网络设备均不相同。

具体地，提供了第一网络设备确定M个路径的一种实现方式，以便于第一网络设备基于该N个第二网络设备与K个第四网络设备之间的映射关系确定该M个路径。

在一种可能的实现方式中，该第一网络设备根据该第一映射关系确定该M个路径包括：该第一网络设备根据该第一映射关系确定第一排序信息，该第一排序信息用于指示该K个第四网络设备对应的第二网络设备的数量的排序；该第一网络设备根据该第一排序信息依次对该N个第二网络设备的出端口进行遍历，得到第二映射关系；其中，该第二映射关系用于指示该N个第二网络设备的出端口与该K个第四网络设备之间的映射关系；该第一网络设备基于该第二映射关系确定该M个路径。具体地，提供了第一网络设备确定M个路径的一种实现方式，以便于第一网络设备基于依次确定的第一映射关系、第一排序信息以及第二映射关系确定该M个路径。

在一种可能的实现方式中，该第一网络设备根据该第一排序信息依次对该N个第二网络设备的出端口进行遍历，得到第二映射关系包括：该第一网络设备根据该第一排序信息依次对该N个第二网络设备的出端口进行遍历，得到第三映射关系；其中，该第三映射关系用于指示每个该第四网络设备对应的该第二网络设备的出端口的可选数量；该第一网络设备基于该第三映射关系确定该第二映射关系。具体地，第三映射关系用于指示每个该第四网络设备对应的该第二网络设备的出端口的可选数量，其中，该可选数量的取值越大则对应的第四网络设备的可选路径的不确定性就越小，反之，该可选数量的取值越小则对应的第四网络设备的可选路径的不确定性就越大。为此，基于第三映射关系所确定的第二映射关系能够优先为可选路径的不确定性较小的第四网络设备对应的该第二网络设备的出端口进行遍历，以提升方案的准确性，避免后续基于该第二映射关系所确定的M个路径产生冲突。

S304.该第一网络设备分别向该N个第二网络设备发送该M个路径。

本实施例中，第一网络设备在步骤S303中确定M个路径之后，该第一网络设备在步骤S304中分别向该N个第二网络设备发送该M个路径。

在一种可能的实现方式中，该M条数据流通过该P个第三网络设备向K个第四网络设备传输，K为大于或等于1的整数；第一网络设备在步骤S302所获取的通信关系对应的M条数据流包括第一数据流和第二数据流，该第一数据流的源地址信息与该第二数据流的源地址信息对应于不同的第二网络设备，该第一数据流的目的地址信息与该第二数据流的目的地址信息对应于同一第四网络设备。此外，第一网络设备在步骤S303所确定的M个路径包括第一路径和第二路径，该第一路径与该第一数据流对应，该第二路径与该第二数据流对应，该第一路径与该第二路径对应于不同的第三网络设备。

具体地，第一网络设备确定的M个路径包括与第一数据流对应的第一路径以及与第二数据流对应的第二路径，并且，该第一路径与该第二路径对应于不同的第三网络设备，其中，该第一数据流的源地址信息与该第二数据流的源地址信息对应于不同的第二网络设备，该第一数据流的目的地址信息与该第二数据流的目的地址信息对应于同一第四网络设备。换言之，由于任一第四网络设备为任一第三网络设备的下游网络设备，第一数据流和第二数据流通过不同的第二网络设备分别向不同的第三网络设备发送之后，该不同的第三网络设备分别向同一第四网络设备发送该第一数据流和第二数据流。从而，可以避免来自于不同第二网络设备的数据流通过同一第三网络设备传输之后，再通过同一第三网络设备向同一第四网络设备传输的过程中产生的网络拥塞，以提升该第一数据流和该第二数据流的传输效率。

在一种可能的实现方式中，第一网络设备在步骤S303所确定的M个路径还指示该M条数据流在该N个第二网络设备上的出端口。具体地，第一网络设备确定的M个路径除了指示通过该N个第二网络设备向该P个第三网络设备传输该M条数据流的路径之外，该M个路径还指示该M条数据流在该N个第二网络设备上的出端口，以便于该N个第二网络设备接收M个路径之后，能够明确发送该M条数据流的出端口。

在一种可能的实现方式中，图3所示实现方法还包括：该第一网络设备获取第二拓扑信息，该第二拓扑信息包括A个第二网络设备和该P个第三网络设备之间的连接关系，该A个第二网络设备中的至少一个第二网络设备与该N个第二网络设备中的至少一个第二网络设备相同，该A为大于或等于1的整数；该第一网络设备获取B条数据流的通信关系，该B条数据流中的每条数据流的通信关系包括源地址信息和目的地址信息，该B为大于或等于1的整数，该B条数据流分别通过该A个第二网络设备向该P个第三网络设备传输；在该第一网络设备根据该M条数据流的通信关系和该拓扑信息确定M个路径之后，该方法还包括：该第一网络设备根据该B条数据流的通信关系和该拓扑信息确定B个路径，该B个路径分别与B条数据流对应，该B个路径指示通过该A个第二网络设备向该P个第三网络设备发送该M条数据流的路径；其中，该B 个路径对应的第二网络设备的出端口不同于该M个路径对应的第二网络设备的出端口；该第一网络设备分别向该A个第二网络设备发送该B个路径。具体地，第一网络设备确定的B个路径对应的第二网络设备的出端口不同于该M个路径对应的第二网络设备的出端口，以避免M条数据流和B条数据流对应于同一第二网络设备的出端口时产生的流量冲突，提升M条数据流和B条数据流的数据传输效率。

在一种可能的实现方式中，第一网络设备在步骤S302所获取的通信关系对应的M条数据流包括第三数据流和第四数据流，该第三数据流的源地址信息和该第四数据流的源地址信息对应于同一第二网络设备。此外，第一网络设备在步骤S303所确定的M个路径包括第三路径和第四路径，该第三路径和该第三数据流对应，该第四路径和该第四数据流对应，该第三路径和该第四路径不同。具体地，第一网络设备确定的M个路径包括与第三数据流对应的第三路径以及与第四数据流对应的第四路径，并且，该第三路径和该第四路径不同。其中，该第三数据流的源地址信息和该第四数据流的源地址信息对应于同一第二网络设备。换言之，第三数据流和第四数据流通过同一第二网络设备分别通过不同的路径进行传输。从而，可以避免来自于同一第二网络设备的数据流通过相同路径传输的过程中产生的网络拥塞，以提升该第三数据流和该第四数据流的传输效率。

基于上述技术方案，第一网络设备在步骤S301中获取包含有N个第二网络设备和P个第三网络设备之间的连接关系的第一拓扑信息，并且该第一网络设备在步骤S302中获取M条数据流的通信关系之后，该第一网络设备在步骤S303中根据该M条数据流的通信关系和该第一拓扑信息确定并在步骤S304中向N个第二网络设备发送M个路径。此后，N个第二网络设备可以基于该M个路径分别向P个第三网络设备发送该M条数据流。换言之，第一网络设备作为确定路径的设备，该第一网络设备能够确定在N个第二网络设备和P个第三网络设备之间传输的M条数据流对应的M个路径。从而，相比于N个第二网络设备仅基于本地数据流作为路径确定依据而容易导致路径冲突的实现方式，在上述方法中，第一网络设备能够基于全局信息实现路径的确定，以避免路径冲突，提升数据流的转发效率。

下面将以源地址信息对应的网络设备(即第二网络设备)为源架顶式交换机(source top of rack，Stor)，且目的地址信息对应的网络设备(即第四网络设备)为目的架顶式交换机(destination top of rack，Dtor)为例，对上述步骤S303的实现过程进行示例性说明。

在一种可能的实现方式中，上述步骤S303中确定的M个路径可以用于解决最优路径分配问题，其中，最优路径分配问题是一个数学上的精准覆盖问题，属于NP完全问题。描述为全集X是所有IP对DIP所在的Dtor(Dtor)对应的Stor(Stor)的上行端口，而子集S是每个Dtor对应的Stor的上行端口。问题是要求S是X的精确覆盖，即所有Dtor对应的Stor上行端口不能重复分配。从而达成为网络内每条流分配一条最优路径的目的。整个最优路径分配计算过程分为如下一个步骤。其中，在步骤S303中用于解决该问题的算法可以称为流量矩阵算法(flow matrix algorithm，FMA)。

示例性的，第一网络设备在步骤S303的实现过程可以表示为图4a中虚线框4中的实现过程(即“步骤407.按任务全局最优路径计算”)，包括如下实现过程。

步骤4071.第一网络设备获取输入的通信关系[SIP，DIP]。

步骤4072.第一网络设备根据通信关系和拓扑信息建立Dtor到Stor映射矩阵。

步骤4073.第一网络设备在Dtor维度遍历流量矩阵，负作用值(negative effect value，NEV)指导矩阵列迭代顺序。

步骤4074.第一网络设备在横向自由度值(horizontal degree of freedom，HDOF)值和纵向自由度(vertical degree of freedom，VDOF)值指导迭代内矩阵行计算顺序。

步骤4075.判断是否完成遍历Dtor的for循环，若是则执行步骤4076，若否则重复执行步骤4073。

步骤4076.输出最优分配结果。

可选地，如图4a所示，“步骤406.通信关系识别”得到的识别结果也可以作为“步骤407.按任务全局最优路径计算”的输入之一，以便于明确当前输入的通信关系对应的数据流用于执行4061中的AI集合通信任务，还是用于执行4062中的稳态流通信任务。

下面将通过一些实现示例介绍步骤1和步骤2。

在步骤4071中，第一网络设备汇聚任务通信集群的流量信息的一个实现如表8所示。

表8

如表8所示。第一网络设备汇聚的完整流表中包括：流编号，流表生成交换机信息，通信关系对，即[SIP,DIP],首包时间和字节数几个重要项。

可选地，作为算法的输入，需要对此流表进行初始化处理。首先，需要在原始流表中继续筛选出计算过程中需要的信息，表中与计算相关的信息有流表生成的交换机以及通信IP对[SIP,DIP]。其次，将原始表中的通信单向流表转换成双向流表，如表9和表10所示。

表9

表10

此外，因为全局最优路径分配算法是在Dtor维度上迭代计算的。所以，在步骤4072中，将原始双向流表转换成Dtor到Stor映射的矩阵，如表11所示。

表11

在步骤4071和步骤4072中，首先将原始通信关系表转化成Dtor到SIP的映射矩阵，而后SIP所在的Stor是在原始表中的流表生成交换设备项中找到的。所以，最终转换成Dtor到Stor的映射关系矩阵。全局最优路径分配算法的核心就是对Dtor-Stor映射关系矩阵进行计算处理。

可以理解的是，表11所示Dtor-Stor映射矩阵即为前述步骤S303中的第一映射关系的一个实现示例。

下面将通过一些实现示例介绍步骤4073、步骤4074和步骤4075。

在步骤4073中，需要初始化Dtor-Stor映射矩阵和ToR可用端口矩阵。具体地，第一网络设备将汇聚的原始流表转化成Dtor到Stor映射矩阵，如表11所示。Dtor-Stor映射矩阵中的列表示为Dtor(Dtor)，行表示为到Dtor的流在Stor出端口号。矩阵中的条目表示到所在列对应的Dtor(Dtor)的流量所对应的Stor(Stor)。另外，在Dtor到Stor映射矩阵中的条目‘-1’表示为只流经本地ToR的流量。此外，在初始化阶段需要进行两步操作：第一步操作是将原始流表转化成Dtor到Stor映射的关系矩阵。第二步操作是生成ToR的可用出端口矩阵，如表12所示。

表12

在表12中，矩阵的列定义为ToR的编号。行定义为流经过每个ToR时可作为备选的出端口编号。在整个最优路径计算的阶段，即是对Dtor到Stor映射矩阵，以及ToR可用出端口矩阵的计算操作。

上述提到基于流的负载分担会有全局冲突的风险，而全局冲突形成的条件是：不同的流经过不同的Stor,流向相同的ToR内的节点，且选择相同的Spine作为中继。所以，在处理Dtor到Stor映射矩阵的时候，如果满足公式1的要求，则可保证避免所述全局冲突问题。

在公式1中，x表示Dtor到Stor映射关系矩阵，表示的是行角标，j表示矩阵的列角标，而k表示的是cell(i,j)对应的矩阵的元素，保证等式成立的意味对应的元素在矩阵的行和列上是互斥的,也称元素在所述行，列空间上具备唯一性。对应网络中的流量没有重合的链路，即不会发生本地冲突和全局冲突问题，使得每条流的路径均为最优分配。

在步骤4073中，第一网络设备对算法输入数据结构初始化后，根据FMA算法对流量矩阵进行计算。FMA算法在流量矩阵的Dtor维度进行迭代计算，即Dtor到Stor映射矩阵的各列进行遍历。算法通过各列负作用值，即NEV指标值的大小选择遍历顺序。其中，NEV定义为出现的条目的总个数减1，如表13所示。

表13

在表13中，当选择一条流在Stor出端口进行分配计算时，在确保流量无冲突的约束条件下，具有相同Dtor的其他流量会受第一条流计算结果的影响，被动地在各自Stor其他编号的出端口上进行分配计算。这种由于一条流的分配计算对其他流的计算结果的影响大小值即为负作用值。根据NEV指标定义，在Dtor遍历的每轮迭代开始前对待计算的流量矩阵的列进行NEV计算。

示例性的，表13中给出了第一轮迭代前的计算，除Dtor-4和Dtor-5外，全部Dtor列的元素均为4个不重复的值。根据NEV定义，其负作用的值均为4-1，即为3。在NEV值相同的情况，当前迭代周期的列的选择根据自然Dtor的顺序选择最小值进入当前迭代周期。当NEV值不相同的情况：例如，第一迭代周期选择Dtor-0进行计算。元素为1，2，3，7。在第二个迭代周期计算之前，Dtor-1的NEV值为7-1，即为6。而Dtor-3的NEV值为5-1，为4。小于Dtor-1的值，也是全部待遍历Dtor列中最小的。则根据遍历顺序约束条件。Dtor-3将以第二顺位进入迭代计算。这种方式，可以保证算法的确定性。从表13中可见Dtor-4和Dtor-5在当前迭代周期开始时，是不进行NEV计算的。原因是所述两个Dtor有本地流量，这将导致流出本地交换设备的流量少与出端口的数量。以表13为例：Dtor-4和Dtor-5分别只有2条流需要在各自的4个出端口上分配计算。分配方式总数为,共为12种分配方法。这将严重影响算法的确定性，和后续迭代计算的正确性，甚至导致后续迭代无法计算出最优解。所以，需要将有本地流量的Dtor遍历顺序后置。FMA算法通过所述方法，对全部Dtor进行遍历迭代。

在步骤4074和步骤4075中，第一网络设备通过自由度值指导ToR端口分配。具体地，通过NEV选定当前迭代的Dtor后，在此迭代内需为同Dtor的不同流量，计算分配其在Stor上的出端口号。如表14中所示。

表14

在表14中，基于表13所述的方法选择第一轮迭代的Dtor为Dtor-0,其元素包括来自1,2,3,7Stor的流量。在当前迭代周期内，根据纵向自由度值，即VDOF和HDOF对流量在Stor的出端口上进行分配计算。

示例性的，VDOF和HDOF指标指导流量矩阵行分配计算顺序的实现过程如下所示。其中，HDOF定义为本轮迭代计算的子矩阵中，编号相同出端口可用数量总数，算法规定按HDOF值从小到大顺序进行分配计算，如HDOF值相同，则按自然顺序有小到大进行分配计算。如表14所示，在初始化阶段，全部ToR的出端口都是待分配计算的状态，所以在由4个ToR组成的第一轮迭代的子矩阵中，编号相同的出端口都是可用的，所以全部HDOF值为4。在遍历Dtor的迭代过程中，每轮迭代组成的子流量矩阵具有很强随机性。根据HDOF值的约束条件进行ToR出端口分配计算，可保证在每个迭代周期内能计算得到最优解。另一个指标为VDOF，定义为本轮迭代计算后，对应TOR可选出端口数量。算法规定按VDOF值从小到大顺序进行分配计算，如VDOF值相同，则按自然顺序有小到大进行分配计算。如表14所示，在当前迭代周期内，Dtor为0的流量，需在所在Stor的出端口上各选择1个端口。而当前每个Stor可选的端口数为初始化的4个，所以在当前周期分配计算结束后，当前子流量矩阵中，每个Stor可选的端口数均为4-1，为3个。所以当前迭代周期应按ToR自然顺序进行端口分配计算。表14中带“x”符号的块代表着在本轮迭代中，为Dtor-0的几条流，在Stor上出端口的计算分配结果。

可以理解的是，表12至表14任一表格中的实现过程为前述步骤S303中的第三映射关系的一个实现示例。

由上述步骤4073至步骤4075的实现过程可知，根据FMA算法计算规则，全局最优路径分配算法根据3个指标值，在4个维度上完成整个计算过程。因为除了处理三个指标本身维度计算的同时，都考虑到了时间维度上，历史计算结果，保证本迭代最大确定性分配，以及保证后续迭代过程可持续计算出最优解，直到迭代结束。通过上述迭代规则，遍历全部Dtor，可计算出全局最优路径分配结果，如表15所示。

表15

可以理解的是，表15所示全局最优路径分配结果即为前述步骤S303中的第二映射关系的一个实现示例。

可以理解的是，全局最优路径分配算法如上所述，需要根据3个指标值在各自维度上对流量矩阵进行遍历计算，所以其时间复杂度为O(n3)，其中n为交换机端口数。计算结果可根据流量无交叉判定规则对流量矩阵的行和列遍历检查，所以验证结果的时间复杂度为O(n2)，其中n为交换机端口数。

此后，第一网络设备将计算得到的最优路径分配结果记录到原始流表中，如表16所示。

表16

由上述表16可知，经过流量路径编排计算后，可以得到路径规划的关键输出Stor下一跳。通过输出的计算结果矩阵可转化成与Stor出端口相关联的路径规划表。并将结果同步给网络的边缘交换设备，指导流量在边缘交换节点下一跳对应的出端口选择,从而完成全局路径分配流程。

综上所述，本申请实施例的核心创新点在于，在包括N个第二网络设备和P个第三网络设备组成的多层网络系统中。第一网络设备在获取通信关系以及拓扑信息之后，第一网络设备根据汇聚到的通信关系信息及网络拓扑信息，通过全局最优路径分配算法进行最优化计算。第一网络设备将计算得到最优化结果发送给N个第二网络设备。最后，N个第二网络设备根据接收到的最优化计算结果作为本地流量路径分配指导进行选路，实现负载分担，控制网络拥塞。从而，在N个第二网络设备执行业务报文转发时，是通过全局最优路径分配算法，为所有流量计算出最优的路径，从而一步收敛，而不需要在局部单台设备上进行hash函数计算选路，解决了逐流多路径负载分担方法中的本地冲突问题以及由于局部决策机制导致的全局冲突问题；通信关系固定的业务报文转发路径一致，解决了逐包多路径负载分担方法中报文乱序的问题。

可选地，N个第二网络设备获取进入网络的流量通信关系信息，包括：源IP，目的IP，首包时间。N个第二网络设备获取本地拓扑信息。且将获取的本地流量通信关系信息和拓扑信息汇聚到第一网络设备。

可选地，第一网络设备将汇聚的边缘交换节点的通信关系信息以及拓扑信息，组合成网络流量信息表。所述网络信息表中记录有至少一个边缘节点拓扑信息和通信关系。并将所述网络信息表作为全局最优路径分配算法输入，所述网络信息表的列为流量目的边缘交换节点到所有到此目的边缘交换节点的源交换节点的映射。网络信息表的行表示，待分配的源交换节点的出端口号。

可选地，第一网络设备通过全局最优路径分配算法计算输出得到网络流量路径分配表。所述网络流量路径分配表中有N个第二网络设备内流量的网络路径分配信息。网络路径分配表的列为流量目的边缘交换节点到所有到此目的边缘交换节点的源交换节点的映射，网络路径分配表的行表示为到所述目的边缘节点的流量在源边缘节点分配到的出端口。

请参阅图8，本申请实施例提供了一种通信装置，该通信装置800可以实现上述方法实施例中通信装置(即第一网络设备或第二网络设备)的功能，因此也能实现上述方法实施例所具备的有益效果。

当该通信装置800用于实现前述第一网络设备的功能时，该通信装置所包含收发单元801和处理单元802；该收发单元801用于获取第一拓扑信息，该第一拓扑信息包括N个第二网络设备和P个第三网络设备之间的连接关系，任一第二网络设备为任一第三网络设备的上游网络设备，N为大于或等于2的整数，P为大于或等于1的整数；该收发单元801还用于获取M条数据流的通信关系，该M条数据流中的每条数据流的通信关系包括源地址信息和目的地址信息，M为大于或等于2的整数，该M条数据流分别通过该N个第二网络设备向该P个第三网络设备传输；该处理单元802用于根据该M条数据流的通信关系和该第一拓扑信息确定M个路径，该M个路径分别与M条数据流对应，该M个路径指示通过该N个第二网络设备向该P个第三网络设备传输该M条数据流的路径；该收发单元801还用于分别向该N个第二网络设备发送该M个路径。

在一种可能的实现方式中，该M条数据流通过该P个第三网络设备向K个第四网络设备传输，K为大于或等于1的整数；该M条数据流包括第一数据流和第二数据流，该第一数据流的源地址信息与该第二数据流的源地址信息对应于不同的第二网络设备，该第一数据流的目的地址信息与该第二数据流的目的地址信息对应于同一第四网络设备，该M个路径包括第一路径和第二路径，该第一路径与该第一数据流对应，该第二路径与该第二数据流对应，该第一路径与该第二路径对应于不同的第三网络设备。

在一种可能的实现方式中，该M个路径还指示该M条数据流在该N个第二网络设备上的出端口。

在一种可能的实现方式中，该M条数据流包括第三数据流和第四数据流，该第三数据流的源地址信息和该第四数据流的源地址信息对应于同一第二网络设备，该M个路径包括第三路径和第四路径，该第三路径和该第三数据流对应，该第四路径和该第四数据流对应，该第三路径和该第四路径不同。

在一种可能的实现方式中，该M条数据流通过该P个第三网络设备向K个第四网络设备传输，K为正整数；该处理单元802具体用于：根据该M条数据流的通信关系和该第一拓扑信息确定第一映射关系，该第一映射关系用于指示该M条数据流中每条数据流的源地址信息对应的第二网络设备与该M条数据流中每条数据流的目标地址信息对应的第四网络设备之间的映射关系；根据该第一映射关系确定该M个路径。

在一种可能的实现方式中，该处理单元802具体用于：根据该第一映射关系确定第一排序信息，该第一排序信息用于指示该K个第四网络设备对应的第二网络设备的数量的排序；根据该第一排序信息依次对该N个第二网络设备的出端口进行遍历，得到第二映射关系；其中，该第二映射关系用于指示该N个第二网络设备的出端口与该K个第四网络设备之间的映射关系；基于该第二映射关系确定该M个路径。

在一种可能的实现方式中，该处理单元802具体用于：根据该第一排序信息依次对该N个第二网络设备的出端口进行遍历，得到第三映射关系；其中，该第三映射关系用于指示每个该第四网络设备对应的该第二网络设备的出端口的可选数量；基于该第三映射关系确定该第二映射关系。

在一种可能的实现方式中，该收发单元801还用于获取第二拓扑信息，该第二拓扑信息包括A个第二网络设备和该P个第三网络设备之间的连接关系，该A个第二网络设备中的至少一个第二网络设备与该N个第二网络设备中的至少一个第二网络设备相同，该A为大于或等于1的整数；该收发单元801还用于获取B条数据流的通信关系，该B条数据流中的每条数据流的通信关系包括源地址信息和目的地址信息，该B为大于或等于1的整数，该B条数据流分别通过该A个第二网络设备向该P个第三网络设备传输；该处理单元802还用于根据该B条数据流的通信关系和该拓扑信息确定B个路径，该B个路径分别与B条数据流对应，该B个路径指示通过该A个第二网络设备向该P个第三网络设备发送该M条数据流的路径；其中，该B个路径对应的第二网络设备的出端口不同于该M个路径对应的第二网络设备的出端口；该收发单元801还用于分别向该A个第二网络设备发送该B个路径。

在一种可能的实现方式中，该收发单元801具体用于分别接收来自该N个第二网络设备的该M条数据流的通信关系。

在一种可能的实现方式中，该M条数据流对应于多个人工智能AI集合通信任务中的一个任务。

在一种可能的实现方式中，该第一网络设备为控制器或该P个第三网络设备中的一个网络设备。

当该通信装置800用于实现前述第二网络设备的功能时，该装置包括收发单元801和处理单元802；该处理单元802用于确定Q条数据流的通信关系，该Q条数据流中的每条数据流的通信关系包括源地址信息和目的地址信息，Q为大于或等于1的整数；该收发单元801用于向第一网络设备发送Q条数据流的通信关系；该收发单元801还用于接收来自第一网络设备的Q个路径，该Q个路径指示该第二网络设备传输该Q条数据流时使用的路径；该收发单元801还用于基于该Q个路径传输该Q条数据流。

在一种可能的实现方式中，该路径信息还指示该Q条数据流在该第二网络设备上的出端口。

在一种可能的实现方式中，该Q条数据流包括第三数据流和第四数据流，该第三数据流的源地址信息和该第四数据流的源地址信息对应于该第二网络设备，该路径信息包括第三路径和第四路径，该第三路径和该第三数据流对应，该第四路径和该第四数据流对应，该第三路径和该第四路径不同。

在一种可能的实现方式中，该Q条数据流对应于多个人工智能AI集合通信任务中的一个任务。

需要说明的是，上述通信装置800的各单元的信息执行过程等内容，具体可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

本申请实施例还提供了一种通信装置900，参见图9所示，图9为本申请实施例提供的一种通信装置900的结构示意图。

可选地，该通信装置900执行附图3及相关实施例中第一网络设备的功能；其中，通信装置1000执行附图3及相关实施例中第二网络设备的功能。

可选地，该通信装置900执行附图3及相关实施例中第二网络设备的功能；其中，通信装置1000执行附图3及相关实施例中第一网络设备的功能。

附图9所示通信装置900包括存储器902和至少一个处理器901。

可选地，处理器901通过读取存储器902中保存的指令实现上述实施例中的方法，或者，处理器901也可以通过内部存储的指令实现上述实施例中的方法。在处理器901通过读取存储器902中保存的指令实现上述实施例中的方法的情况下，存储器902中保存实现本申请上述实施例提供的方法的指令。

可选地，至少一个处理器901是一个或多个CPU，或者是单核CPU，也可以是多核CPU。

进一步可选地，至少一个处理器901还可以用于执行前述图6所示实施例中处理单元602对应的实现过程，并实现相应的有益效果，此处不做赘述。

存储器902包括但不限于是RAM、ROM、EPROM、快闪存储器、或光存储器等。存储器902中保存有操作系统的指令。

存储器902中存储的程序指令被所述至少一个处理器901读取后，通信装置执行前述实施例中对应的操作。

可选地，附图9所示的通信装置还包括网络接口903。网络接口903可以是有线接口，例如FDDI，GE接口；网络接口903也可以是无线接口。网络接口903用于在附图3及相关实施例中执行数据的收发。

进一步可选地，网络接口903还可以用于执行前述图6所示实施例中收发单元601对应的实现过程，并实现相应的有益效果，此处不做赘述。

应理解，网络接口903具备接收数据和发送数据的功能，“接收数据”的功能和“发送数据”的功能可以集成在同一个收发接口中实现，或者，“接收数据”的功能和“发送数据”的功能可以分别在不同的接口中实现，此处不做限定。换言之，网络接口903可以包括一个或多个接口，用于实现“接收数据”的功能和“发送数据”的功能。

处理器901读取存储器902中的程序指令后，通信装置900能够执行的其他功能请参照前面各个方法实施例中的描述。

可选地，通信装置900还包括总线904，上述处理器901、存储器902通常通过总线904相互连接，也可以采用其他方式相互连接。

可选地，通信装置900还包括输入输出接口905，输入输出接口905用于与输入设备连接，接收用户、或者与通信装置900能够联动的其他设备通过输入设备输入的相关配置信息。输入设备包括但不限于键盘、触摸屏、麦克风等等。

本申请实施例提供的通信装置900用于执行上述各个方法实施例提供的通信装置(第一网络设备)执行的方法，并实现对应的有益效果。

例如，当通信装置900执行附图3及相关实施例中第一网络设备的功能的情况下；通信装置900获取包含有N个通信装置1000和P个第三网络设备之间的连接关系的第一拓扑信息，并且该通信装置900获取M条数据流的通信关系之后，该通信装置900根据该M条数据流的通信关系和该第一拓扑信息确定并向N个通信装置1000发送M个路径。此后，N个通信装置1000可以基于该M个路径分别向P个第三网络设备发送该M条数据流。换言之，通信装置900作为确定路径的设备，该通信装置900能够确定在N个通信装置1000和P个第三网络设备之间传输的M条数据流对应的M个路径。从而，通信装置900能够基于全局信息实现路径的确定，以避免路径冲突，提升数据流的转发效率。

又如，当通信装置900执行附图3及相关实施例中第二网络设备的功能的情况下；通信装置900向通信装置1000发送Q条数据流的通信关系的关系之后，该通信装置900接收来自通信装置1000的指示该通信装置900传输该Q条数据流时使用的Q个路径，并且，该通信装置900基于该Q个路径传输该Q条数据流。换言之，通信装置1000作为确定路径的设备，该通信装置1000能够确定在N个通信装置900和P个第三网络设备之间传输的M条数据流对应的M个路径。从而，通信装置1000能够基于全局信息实现路径的确定，以避免路径冲突，提升数据流的转发效率。

图9所示通信装置的具体实现方式，均可以参考前述的各个方法实施例中的叙述，此处不再一一赘述。

本申请实施例还提供了一种通信系统，该通信系统至少包括第一网络设备与N个第二网络设备。

可选地，该通信系统还包括P个第三网络设备。

可选地，该通信系统还包括K个第四网络设备。

应理解，在该通信系统中，各个网络设备还可以应用前述实施例所涉及的其它方法，并实现相应的技术效果，此处不做赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，该单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

一种路径确定的方法，其特征在于，包括：

第一网络设备获取第一拓扑信息，所述第一拓扑信息包括N个第二网络设备和P个第三网络设备之间的连接关系，任一第二网络设备为任一第三网络设备的上游网络设备，所述N为大于或等于2的整数，所述P为大于或等于1的整数；

所述第一网络设备获取M条数据流的通信关系，所述M条数据流中的每条数据流的通信关系包括源地址信息和目的地址信息，所述M为大于或等于2的整数，所述M条数据流分别通过所述N个第二网络设备向所述P个第三网络设备传输；

所述第一网络设备根据所述M条数据流的通信关系和所述第一拓扑信息确定M个路径，所述M个路径分别与M条数据流对应，所述M个路径指示通过所述N个第二网络设备向所述P个第三网络设备传输所述M条数据流的路径；

所述第一网络设备分别向所述N个第二网络设备发送所述M个路径。
根据权利要求1所述的方法，其特征在于，所述M条数据流通过所述P个第三网络设备向K个第四网络设备传输，K为大于或等于1的整数；

所述M条数据流包括第一数据流和第二数据流，所述第一数据流的源地址信息与所述第二数据流的源地址信息对应于不同的第二网络设备，所述第一数据流的目的地址信息与所述第二数据流的目的地址信息对应于同一第四网络设备，所述M个路径包括第一路径和第二路径，所述第一路径与所述第一数据流对应，所述第二路径与所述第二数据流对应，所述第一路径与所述第二路径对应于不同的第三网络设备。
根据权利要求1或2所述的方法，其特征在于，所述M个路径还指示所述M条数据流在所述N个第二网络设备上的出端口。
根据权利要求1至3所述的方法，其特征在于，所述M条数据流通过所述P个第三网络设备向K个第四网络设备传输，K为正整数；所述第一网络设备根据所述M条数据流的通信关系和所述第一拓扑信息确定M个路径包括：

所述第一网络设备根据所述M条数据流的通信关系和所述第一拓扑信息确定第一映射关系，所述第一映射关系用于指示所述M条数据流中每条数据流的源地址信息对应的第二网络设备与所述M条数据流中每条数据流的目标地址信息对应的第四网络设备之间的映射关系；

所述第一网络设备根据所述第一映射关系确定所述M个路径。
根据权利要求4所述的方法，其特征在于，所述第一网络设备根据所述第一映射关系确定所述M个路径包括：

所述第一网络设备根据所述第一映射关系确定第一排序信息，所述第一排序信息用于指示所述K个第四网络设备对应的第二网络设备的数量的排序；

所述第一网络设备根据所述第一排序信息依次对所述N个第二网络设备的出端口进行遍历，得到第二映射关系；其中，所述第二映射关系用于指示所述N个第二网络设备的出端口与所述K个第四网络设备之间的映射关系；

所述第一网络设备基于所述第二映射关系确定所述M个路径。
根据权利要求5所述的方法，其特征在于，所述第一网络设备根据所述第一排序信息依次对所述N个第二网络设备的出端口进行遍历，得到第二映射关系包括：

所述第一网络设备根据所述第一排序信息依次对所述N个第二网络设备的出端口进行遍历，得到第三映射关系；其中，所述第三映射关系用于指示每个所述第四网络设备对应的所述第二网络设备的出端口的可选数量；

所述第一网络设备基于所述第三映射关系确定所述第二映射关系。
根据权利要求1至6任一项所述的方法，其特征在于，所述第一网络设备获取M条数据流的通信关系包括：

所述第一网络设备分别接收来自所述N个第二网络设备的所述M条数据流的通信关系。
根据权利要求1至7任一项所述的方法，其特征在于，

所述M条数据流对应于多个人工智能AI集合通信任务中的一个任务。
根据权利要求1至8任一项所述的方法，其特征在于，

所述第一网络设备为控制器或所述P个第三网络设备中的一个网络设备。
一种路径确定的方法，其特征在于，包括：

第二网络设备向第一网络设备发送Q条数据流的通信关系，所述Q条数据流中的每条数据流的通信关系包括源地址信息和目的地址信息，Q为大于或等于1的整数；

所述第二网络设备接收来自第一网络设备的Q个路径，所述Q个路径指示所述第二网络设备传输所述Q条数据流时使用的路径；

所述第二网络设备基于所述Q个路径传输所述Q条数据流。
根据权利要求10所述的方法，其特征在于，所述路径信息还指示所述Q条数据流在所述第二网络设备上的出端口。
根据权利要求10或11所述的方法，其特征在于，

所述一个或多条数据流对应于多个人工智能AI集合通信任务中的一个任务。
一种通信装置，其特征在于，包括收发单元和处理单元；

所述收发单元用于获取第一拓扑信息，所述第一拓扑信息包括N个第二网络设备和P个第三网络设备之间的连接关系，任一第二网络设备为任一第三网络设备的上游网络设备，所述N为大于或等于2的整数，所述P为大于或等于1的整数；

所述收发单元还用于获取M条数据流的通信关系，所述M条数据流中的每条数据流的通信关系包括源地址信息和目的地址信息，所述M为大于或等于2的整数，所述M条数据流分别通过所述N个第二网络设备向所述P个第三网络设备传输；

所述处理单元用于根据所述M条数据流的通信关系和所述第一拓扑信息确定M个路径，所述M个路径分别与M条数据流对应，所述M个路径指示通过所述N个第二网络设备向所述P个第三网络设备传输所述M条数据流的路径；

所述收发单元还用于分别向所述N个第二网络设备发送所述M个路径。
根据权利要求13所述的装置，其特征在于，所述M条数据流通过所述P个第三网络设备向K个第四网络设备传输，K为大于或等于1的整数；

所述M条数据流包括第一数据流和第二数据流，所述第一数据流的源地址信息与所述第二数据流的源地址信息对应于不同的第二网络设备，所述第一数据流的目的地址信息与所述第二数据流的目的地址信息对应于同一第四网络设备，所述M个路径包括第一路径和第二路径，所述第一路径与所述第一数据流对应，所述第二路径与所述第二数据流对应，所述第一路径与所述第二路径对应于不同的第三网络设备。
根据权利要求13或14所述的装置，其特征在于，所述M个路径还指示所述M条数据流在所述N个第二网络设备上的出端口。
根据权利要求13至15所述的装置，其特征在于，所述M条数据流通过所述P个第三网络设备向K个第四网络设备传输，K为正整数；所述处理单元具体用于：

根据所述M条数据流的通信关系和所述第一拓扑信息确定第一映射关系，所述第一映射关系用于指示所述M条数据流中每条数据流的源地址信息对应的第二网络设备与所述M条数据流中每条数据流的目标地址信息对应的第四网络设备之间的映射关系；

根据所述第一映射关系确定所述M个路径。
根据权利要求16所述的装置，其特征在于，所述处理单元具体用于：

根据所述第一映射关系确定第一排序信息，所述第一排序信息用于指示所述K个第四网络设备对应的第二网络设备的数量的排序；

根据所述第一排序信息依次对所述N个第二网络设备的出端口进行遍历，得到第二映射关系；其中，所述第二映射关系用于指示所述N个第二网络设备的出端口与所述K个第四网络设备之间的映射关系；

基于所述第二映射关系确定所述M个路径。
根据权利要求17所述的装置，其特征在于，所述处理单元具体用于：

根据所述第一排序信息依次对所述N个第二网络设备的出端口进行遍历，得到第三映射关系；其中，所述第三映射关系用于指示每个所述第四网络设备对应的所述第二网络设备的出端口的可选数量；

基于所述第三映射关系确定所述第二映射关系。
根据权利要求13至18任一项所述的装置，其特征在于，所述收发单元具体用于分别接收来自所述N个第二网络设备的所述M条数据流的通信关系。
根据权利要求13至19任一项所述的装置，其特征在于，

所述M条数据流对应于多个人工智能AI集合通信任务中的一个任务。
根据权利要求13至20任一项所述的装置，其特征在于，

所述第一网络设备为控制器或所述P个第三网络设备中的一个网络设备。
一种通信装置，其特征在于，包括收发单元和处理单元；

所述处理单元用于确定Q条数据流的通信关系，所述Q条数据流中的每条数据流的通信关系包括源地址信息和目的地址信息，Q为大于或等于1的整数；

所述收发单元用于向第一网络设备发送Q条数据流的通信关系；

所述收发单元还用于接收来自第一网络设备的Q个路径，所述Q个路径指示所述第二网络设备传输所述Q条数据流时使用的路径；

所述收发单元还用于基于所述Q个路径传输所述Q条数据流。
根据权利要求22所述的装置，其特征在于，所述路径信息还指示所述Q条数据流在所述第二网络设备上的出端口。
根据权利要求22或23所述的装置，其特征在于，

所述一个或多条数据流对应于多个人工智能AI集合通信任务中的一个任务。
一种通信装置，其特征在于，包括至少一个处理器，所述至少一个处理器与存储器耦合；

所述存储器用于存储程序或指令；

所述至少一个处理器用于执行所述程序或指令，以使所述通信装置实现如权利要求1至9中任一项所述的方法，或，以使所述通信装置实现如权利要求10至12中任一项所述的方法。
一种计算机可读存储介质，其特征在于，所述介质存储有指令，当所述指令被处理器执行时，实现权利要求1至12中任一项所述的方法。
一种计算机程序产品，其特征在于，包括指令，当所述指令在处理器上运行时，实现如权利要求1至12中任一项所述的方法。
一种通信系统，其特征在于，所述通信系统包括第一网络设备以及N个第二网络设备，其中，所述第一网络设备用于执行如权利要求1至9中任一项所述的方法，所述第二网络设备用于如权利要求10至12中任一项所述的方法。