WO2023066193A1 - 通信方法及装置、系统、存储介质、程序产品 - Google Patents

通信方法及装置、系统、存储介质、程序产品 Download PDF

Info

Publication number
WO2023066193A1
WO2023066193A1 PCT/CN2022/125651 CN2022125651W WO2023066193A1 WO 2023066193 A1 WO2023066193 A1 WO 2023066193A1 CN 2022125651 W CN2022125651 W CN 2022125651W WO 2023066193 A1 WO2023066193 A1 WO 2023066193A1
Authority
WO
WIPO (PCT)
Prior art keywords
distributed
node
data
distributed node
indication information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/CN2022/125651
Other languages
English (en)
French (fr)
Inventor
王坚
李榕
张公正
王俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to EP22882799.4A priority Critical patent/EP4412287A4/en
Publication of WO2023066193A1 publication Critical patent/WO2023066193A1/zh
Priority to US18/641,026 priority patent/US20240284203A1/en
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0002Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the transmission rate
    • H04L1/0003Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the transmission rate by switching between different modulation schemes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0009Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the channel coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0015Systems modifying transmission characteristics according to link quality, e.g. power backoff characterised by the adaptation strategy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0023Systems modifying transmission characteristics according to link quality, e.g. power backoff characterised by the signalling
    • H04L1/0025Transmission of mode-switching indication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0061Error detection codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/08Arrangements for detecting or preventing errors in the information received by repeating transmission, e.g. Verdan system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/12Arrangements for detecting or preventing errors in the information received by using return channel
    • H04L1/16Arrangements for detecting or preventing errors in the information received by using return channel in which the return channel carries supervisory signals, e.g. repetition request signals
    • H04L1/1607Details of the supervisory signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L2001/0092Error control systems characterised by the topology of the transmission link
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/02Traffic management, e.g. flow control or congestion control
    • H04W28/04Error control

Definitions

  • a communication device which is applied to a distributed learning system, and the distributed learning system includes at least two distributed nodes, and the at least two distributed nodes include at least one first distributed node and the the communication device.
  • the communication device may implement the communication method in the second aspect above.
  • the communication device may be a chip or a device.
  • the above method can be realized by software, hardware, or by executing corresponding software by hardware.
  • the apparatus further includes: a processing unit, configured to determine a second transmit power; and the transceiving unit, further configured to send the The first data; wherein, the second transmit power is the smaller value of the first maximum transmit power allowed by the communication device and the first transmit power; or the second transmit power is the value allowed by the communication device The smaller value of the first maximum transmit power and the second maximum transmit power, wherein the second maximum transmit power is the multiple received by the communication device from the multiple at least one first distributed nodes The maximum value of the above-mentioned first transmit power.
  • Fig. 1 is a schematic diagram of a distributed learning system involved in the present application
  • FIG. 6 is a schematic diagram of an example of adaptive modulation and coding
  • FIG. 9 is a schematic flowchart of another communication method provided by the embodiment of the present application.
  • FIG. 11 is a schematic flowchart of another communication method provided by the embodiment of the present application.
  • FIG. 14 is a schematic flowchart of another communication method provided in the embodiment of the present application.
  • FIG. 15 is a schematic flowchart of another communication method provided in the embodiment of the present application.
  • FIG. 19 is a schematic structural diagram of a communication device provided by an embodiment of the present application.
  • FIG. 1 shows a schematic diagram of a distributed learning system involved in this application.
  • the distributed learning system 1000 includes at least two distributed nodes, and the at least two distributed nodes include a first distributed node 101 (which may be referred to as a target node v), and at least one second distributed node adjacent to the first distributed node 101 Two distributed nodes 102 (the second distributed nodes u1 ⁇ uk shown in the figure may be referred to as neighbor nodes of the target node v).
  • the first distributed node 101 and at least one second distributed node 102 can communicate with each other, and can be applied to wireless communication systems such as mobile communication, satellite communication, and wireless sensor network.
  • the distributed learning system 1000 may also include a central node 103 .
  • the first distributed node 101 and at least one second distributed node 102 may be connected to the central node 103 .
  • the first distributed node 101 and at least one second distributed node 102 can communicate directly, and the signaling/data between them can also be forwarded through the central node 103 .
  • the first distributed node/the second distributed node may be an access network device, or various types of terminals.
  • FIG. 2 it is a schematic structural diagram of a specific distributed learning system as an example.
  • both the first distributed node and the second distributed node are terminals.
  • the terminal has distributed learning capability.
  • the specific distributed learning system on the left side of Figure 2 can be expressed as a schematic diagram of the distributed learning system on the right side of Figure 2 .
  • the above-mentioned access network device may be any node with a wireless transceiver function. Including but not limited to: base station NodeB, evolved base station eNodeB, base station in 5G communication system, base station or network node in future communication system, access node in WiFi system, wireless relay node, wireless backhaul node, etc.
  • the foregoing access network device may also be a wireless controller in a cloud radio access network (cloud radio access network, CRAN) scenario.
  • cloud radio access network cloud radio access network, CRAN
  • the above-mentioned access network equipment can also be small stations, transmission reference points (transmission reference point, TRP), transmission points (transmitting point, TP), mobile switching centers, and device-to-device (Device-to-Device, D2D), vehicle outreach (vehicle-to-everything, V2X), machine-to-machine (machine-to-machine, M2M) communication equipment that undertakes the base station function, etc.
  • TRP transmission reference point
  • TP transmission point
  • TP transmission point
  • D2D device-to-device
  • vehicle outreach vehicle-to-everything
  • machine-to-machine machine-to-machine
  • M2M machine-to-machine
  • the terminal is a node with wireless transceiver function, which can be deployed on land, including indoor or outdoor, handheld, wearable or vehicle-mounted; it can also be deployed on water, such as on ships, etc.; it can also be deployed in the air, such as aircraft, wireless Man-machines, balloons and satellites, etc.
  • the terminal can be a mobile phone, a tablet computer (pad), a computer with wireless transceiver function, a terminal in device-to-device communication (device-to-device, D2D), a vehicle to everything (V2X) terminals, virtual reality (virtual reality, VR) terminal equipment, augmented reality (augmented reality, AR) terminal equipment, wireless terminals in industrial control (industrial control), wireless terminals in self-driving (self-driving), remote Wireless terminals in remote medical, wireless terminals in smart grid, wireless terminals in transportation safety, wireless terminals in smart city, smart home wireless terminals, etc.
  • the embodiments of the present application do not limit the application scenarios.
  • a terminal may sometimes also be referred to as user equipment (user equipment, UE), access terminal equipment, UE unit, mobile station, mobile station, remote station, remote terminal equipment, mobile equipment, wireless communication equipment, UE proxy or UE device, etc.
  • the existing wireless transmission mechanism aims to improve the throughput of the system.
  • distributed reasoning has a certain tolerance for transmission errors.
  • Using the existing wireless transmission mechanism may waste communication resources and increase system delay. Therefore, a communication scheme suitable for distributed inference is urgently needed to improve inference performance.
  • this technique uses the reliability of the transmission as the criterion for retransmission.
  • the task of the system is to ensure the robustness of the reasoning results and have a certain tolerance for transmission errors (that is, a certain degree of error has no effect on the reasoning results of the distributed learning system).
  • using the retransmission technology to perform retransmission will waste communication resources and increase system delay.
  • FIG. 5 which is a schematic flowchart of a centralized power control method as an example
  • the traditional cellular network architecture often performs centralized power control by the base station.
  • the problem of power control is modeled as a mathematical optimization problem.
  • This problem is generally a complex non-convex optimization problem, which can be solved by methods such as fractional programming and weighted minimum mean square error.
  • Another idea is to implement power control based on reinforcement learning, that is, deploy an agent implemented by a neural network on the base station of each cell, and continuously adjust the power control strategy through interaction with the environment to complete the task of power control.
  • the power control method based on a mathematical optimization algorithm usually has a high solution complexity, and generally requires an iterative algorithm to solve it.
  • the power control method based on reinforcement learning has high complexity in the model training stage and is difficult to converge; and the scalability is extremely poor.
  • the agent needs to be retrained.
  • the system needs to adjust the power quickly to adapt to the complex and changeable wireless environment. Using this power control scheme to adjust cannot meet this requirement.
  • FIG. 6 it is a schematic diagram of an example of adaptive modulation and coding (adaptive modulation and coding, AMC).
  • MCS modulation and coding scheme
  • the terminal performs channel state measurement through the reference signal sent by the base station, and uses the channel quality indicator (CQI) to report the channel state (or called channel quality) is fed back to the base station.
  • CQI channel quality indicator
  • the base station determines the MCS level with reference to the CQI, and sends it to the terminal through downlink control information (DCI), indicating the MCS level it should use.
  • DCI downlink control information
  • the base station directly measures the channel state through the reference signal sent by the terminal, determines the MCS level, and sends it to the terminal through DCI.
  • the base station will adaptively adjust the MCS level. For example, when the channel state becomes worse, the base station will lower the MCS level to reduce the throughput of the communication link to ensure the correct reception and demodulation of communication information; when the channel state becomes better, the base station will increase the MCS level to improve communication link throughput.
  • the method takes the throughput of the communication system as the performance index for adjusting the modulation and coding scheme.
  • the task of the system is to ensure the robustness of the reasoning results.
  • adjustment using the adaptive modulation and coding scheme cannot meet this requirement.
  • the present application provides a communication solution, which is applied to a distributed learning system, and the distributed learning system includes at least two distributed nodes, and the at least two distributed nodes include a first distributed node and at least one second distributed node.
  • the method includes: the first distributed node sends communication mechanism indication information to at least one second distributed node adjacent to the first distributed node, and the communication mechanism indication information is based on the robustness of the distributed learning system
  • the first distributed node receives at least one first data of at least one second distributed node, and the at least one first data is transmitted by at least one second distributed node based on the communication mechanism indication information; and the first The distributed nodes perform inference using a distributed learning model based on the second data of the first distributed node and the at least one first data.
  • This scheme is aimed at improving the robustness of distributed reasoning.
  • FIG. 7 it is a schematic flow chart of a communication method provided by the embodiment of the present application, the method is applied to a distributed learning system, the distributed learning system includes at least two distributed nodes, and the at least two distributed nodes A first distributed node and at least one second distributed node are included.
  • This embodiment is described by taking an interaction process between the first distributed node and any one of the at least one second distributed node as an example.
  • the following interaction process between the first distributed node and each second distributed node may be performed simultaneously or separately, which is not limited in this application.
  • the method may include the steps of:
  • the first distributed node sends communication mechanism indication information to a second distributed node adjacent to the first distributed node.
  • the second distributed node receives the communication mechanism indication information.
  • the first distributed node 101 can obtain the second data, and the second data can be at least one of the following: data samples collected by the first distributed node through its own data collection module, intermediate results of local reasoning, and final results of local reasoning .
  • the second data is used for an inference task of the machine learning model.
  • information interaction may be required between the first distributed node 101 and the adjacent second distributed node 102, and the content of the interaction may include at least one of the following: Data samples, intermediate results of local inference, final results of local inference.
  • This information interaction needs to be completed through wireless communication, so the performance of wireless communication will affect the completion of machine learning tasks.
  • the first distributed node 101 sends communication mechanism indication information to the second distributed node 102 .
  • the communication mechanism indication information is used to indicate the communication mechanism adopted by the second distributed node 102 when transmitting data. Wherein, the communication mechanism indication information is obtained based on the robustness requirements of the distributed learning system.
  • the first distributed node receives the first data of the second distributed node.
  • the second distributed node 102 After receiving the communication mechanism indication information sent by the first distributed node 101, the second distributed node 102 transmits its own first data to the first distributed node 101 based on the communication mechanism indication information. That is, the first data is transmitted by the second distributed node 102 based on the communication mechanism indication information.
  • the first distributed node 101 receives the first data transmitted by the second distributed node 102 .
  • the first data includes at least one of the following: a data sample collected by the second distributed node 102, an intermediate result of local reasoning, and a final result of local reasoning.
  • the first distributed node uses the distributed learning model to perform inference based on the second data and the first data of the first distributed node.
  • the method proposed in this embodiment takes the robustness of distributed reasoning as the performance index, and is more suitable for carrying distributed learning mission wireless communication system.
  • the target node indicates the communication mechanism to the neighbor nodes based on the robustness requirements of the distributed learning system, and the neighbor nodes transmit data according to the communication mechanism, which improves the efficiency and robustness of distributed reasoning sex.
  • This method aims at improving the robustness of distributed inference rather than improving the throughput of the system. This method improves the robustness of distributed reasoning with an efficient wireless transmission mechanism when comprehensively considering wireless transmission errors.
  • FIG. 8 it is a schematic flowchart of another communication method provided by the embodiment of the present application.
  • the method is applied to a distributed learning system.
  • the distributed learning system includes at least two distributed nodes, and the at least two distributed The nodes include a first distributed node and at least one second distributed node.
  • This embodiment is described by taking an interaction process between the first distributed node and any one of the at least one second distributed node as an example.
  • the following interaction process between the first distributed node and each second distributed node may be performed simultaneously or separately, which is not limited in this application.
  • the method may include the steps of:
  • the first distributed node sends second indication information to a second distributed node adjacent to the first distributed node.
  • the second distributed node receives the second indication information.
  • the first distributed node is the target node, which can be the first distributed node 101 in the distributed learning system shown in Figure 1, and the second distributed node can be the second distributed node in the distributed learning system shown in Figure 1 Distributed nodes 102.
  • the first distributed node 101 is adjacent to the second distributed node 102, and the second distributed node 102 is also called a neighbor node of the first distributed node.
  • the first distributed node 101 may directly broadcast or unicast the second indication information, or the first distributed node 101 may send third indication information to the central node 103 for instructing the central node 103 to broadcast or unicast the Second instruction message.
  • the second indication information is used to indicate that the distributed learning system is in the machine learning reasoning mode.
  • broadcasting the second indication information may be adding a MLInference field in a system information block x (system information block, SIBx) (for example, SIB1).
  • SIBx system information block
  • the unicast second indication information may be unicast interference configuration (Infernce-Config) radio resource control (radio resource control, RRC) signaling, and the RRC signaling includes identification information of inference tasks and time-frequency resource pre-allocation information wait.
  • the first distributed node 101/central node 103 sends the RRC signaling to the nodes participating in the machine learning reasoning task.
  • the first distributed node sends the first indication information to the second distributed node.
  • the second distributed node receives the first indication information.
  • the first distributed node 101 sends the first indication information to the second distributed node 102 .
  • the first indication information is used to instruct the second distributed node to send the third data to the first distributed node.
  • the first indication information may be carried in learning trigger information (learning trigger information, LTI) signaling.
  • the first indication information includes at least one of the following information: resource scheduling information for transmitting the third data, inference task information, requested data amount, or requested data type.
  • the resource scheduling information includes resource allocation indication, MCS and so on.
  • the reasoning task information includes task content or task identification.
  • the requested data volume includes the data volume of the third data that the first distributed node requests the second distributed node 102 to send.
  • the type of the requested data includes the data type of the third data that the first distributed node requests the second distributed node 102 to send.
  • the data type of the requested third data includes at least one of the following: data samples collected by the second distributed node 102 through its own data collection module, intermediate results of local reasoning, and final results of local reasoning.
  • the requested data amount may be in bits.
  • the second distributed node 102 obtains multiple samples of original data, intermediate results of multiple inferences, and final results of multiple inferences, they can be sent together once or together.
  • S802 may also be that the first distributed node sends the first indication information to the central node, so that the central node forwards the first indication information to the second distributed node. After receiving the first indication information, the central node may forward the first indication information to the second distributed node 102 in a unicast, multicast or broadcast manner.
  • the second distributed node sends the third data to the first distributed node.
  • the second distributed node 102 after receiving the first indication information, sends the third data to the first distributed node according to the first indication information.
  • the third data includes at least one of the following: a data sample collected by the second distributed node 102, an intermediate result of local reasoning, and a final result of local reasoning.
  • the third data may be understood as initial data transmitted by the second distributed node 102 to the first distributed node.
  • the first distributed node uses the distributed learning model to perform reasoning based on the second data and the third data, and determines that the reasoning result is not robust.
  • the first distributed node performs inference using a distributed learning model based on the second data and the third data.
  • execute S805 executes S805; otherwise, obtain an inference result.
  • the first distributed node judges the robustness of the reasoning result, and when the reasoning result is not robust, sends a communication mechanism indication based on robustness requirements to the second distributed node; when the reasoning result is robust , obtain and/or output the inference result.
  • the first distributed node determines that the reasoning result is not robust, including any of the following:
  • the first distributed node determines that the robust probability is less than the set target robust probability, where the robust probability is the probability that the number of bits in at least one first data transmission error is less than the maximum number of error bits, and the maximum number of error bits is to satisfy the distributed learning The maximum number of erroneous bits that are allowed to be transmitted when required by the robustness of the system; or
  • the first distributed node determines that the bit error rate of at least one second distributed node is greater than a target bit error rate, and the target bit error rate is a maximum allowable bit error rate that satisfies the robustness requirements of the distributed learning system;
  • the first distributed node determines that the maximum inference deviation is greater than the set inference deviation, and the maximum inference deviation is the maximum value of all possible inference deviations.
  • the training data of each distributed node has a label c v , which can be continuous or discrete.
  • the task of machine learning is to process the data through the machine learning model, so that the obtained processing result is the same as the data label c v .
  • Each distributed node locally stores p-dimensional features related to the problem, x v ⁇ ⁇ 0, 1 ⁇ p . This feature is usually stored in the form of a binary vector for subsequent transmission. If the original features are continuous, their binary form can be obtained by quantization. For different machine learning tasks, the physical meanings of x v and c v may be different.
  • x v can be image data, c v is the category corresponding to the image content;
  • x v can be channel status, interference information, power upper limit and other information, c v is the corresponding
  • cv is the corresponding
  • xv can be node weight, interference information, quality of service (QoS) requirements, etc., cv corresponds to link activation indication.
  • Machine learning adjusts the parameters of the machine learning model through training to solve the following problems:
  • F( ⁇ , ⁇ ) is the system optimization target (need to be maximized or minimized), including but not limited to system throughput, system delay, system energy consumption, etc.
  • G( ⁇ , ⁇ ) is the system optimization constraints, including but not limited to power constraints, QoS requirements, fairness requirements, channel resource constraints and so on.
  • distributed learning that is, using a distributed machine learning model (which can be implemented using a neural network) to fit the relationship between ⁇ x v ⁇ v ⁇ V and ⁇ c v ⁇ v ⁇ V , where V A collection of vertices for the model. After the model is trained, each distributed node stores the model locally.
  • the target distributed node When a target distributed node v needs to infer its corresponding label, the target distributed node will send a transmission request to the distributed node u ⁇ N(v) adjacent to the target distributed node, N(v) is The set of distributed nodes adjacent to the target distributed node v. After receiving the transmission request, the adjacent distributed nodes will send their characteristics to the target distributed node. After receiving signals from all neighboring distributed nodes, the target distributed node v compares the local feature x v with the received neighbor feature As input, run the machine learning model stored locally and get the inference result
  • q v [q vu , u ⁇ N(v)], q vu represents the number of error bits that may appear in the signal received by the target node v from the adjacent node u; Dis( ⁇ , ) defines the distance between two inference results.
  • the physical meaning of the above definition is explained as follows: is the information vector (or matrix) of the neighbor node u in the neighbor information matrix, and its elements are 0/1 bits; With A vector (or matrix) with the same dimension, its elements are also 0/1 bits.
  • the first constraint says and The number of different bits in is less than q vu , ie equivalent to being in Based on the introduction of errors less than q vu bits obtained.
  • corresponding of all neighbor nodes put together to get Will Enter the machine learning model to get an inference result Indicates that the calculation of the inference result and the The inference results obtained as input to the learning model (i.e. ) between the gaps.
  • the optimization problem is to traverse all possible The inference results obtained by using them as the input of the machine learning model and the largest gap. That is to say, Defines the maximum deviation of the inference results when the number of wrong bits on the communication links between all neighbor nodes and the target node is within qv .
  • the real neighbor information matrix is H v ;
  • the neighbor information matrix actually received through channel transmission is a
  • the problem will be transformed into linear programming, convex optimization or other optimization problems, and the corresponding commonly used algorithms will be used to solve it.
  • Non-interruptible system the bits on the communication link are wrong with a certain probability (bit error rate, BER), and the calculation of BER on the communication link from node u to node v is:
  • Q(.) is the Q function
  • P u is the transmit power of node u
  • h vu is the channel gain from node u to node v
  • the maximum number of erroneous bits that can be transmitted by the neighbor nodes of the target node v that is, the maximum number of erroneous bits
  • the number of erroneous bits transmitted by each neighbor node of the target node v is less than the maximum number of erroneous bits
  • the probability (robust probability) of is where BER is
  • the maximum number of erroneous bits is the maximum value of all possible first erroneous bit numbers q′v , which is the inference bias
  • the communication link transmits at least one third data to allow the maximum number of erroneous bits.
  • the reasoning deviation is the first reasoning result obtained when the first distributed device uses a machine learning model to reason based on the first data and at least one second data and the second inference result obtained when the first distributed device performs inference using a machine learning model based on the first data and at least one fourth data
  • the number of different bits between; at least one fourth data is data whose different bit number is less than or equal to the first error bit number with at least one second data, and the first maximum inference deviation (D) is less than or equal to the set inference Positive integer value of the deviation (D max ).
  • the inference bias can be The requirements for the robust probability request, request less than target robust probability
  • BER can be required to be less than the target where the target can be solved by get.
  • the BER of the neighbor nodes of the target node v is greater than , then the inference is not robust.
  • the target node v determines the robust probability less than the set target robust probability Then the target node v determines that the reasoning result is not robust.
  • the robustness probability is the probability that the number of erroneous bits transmitted by the third data is less than the maximum number of erroneous bits, and the maximum number of erroneous bits is the maximum number of erroneous bits allowed to be transmitted when the robustness requirements of the distributed learning system are met.
  • the target node v determines that the bit error rate of the neighbor node u is greater than the target BER, the target node v determines that the reasoning result is not robust.
  • the target bit error rate is the maximum allowable bit error rate that meets the robustness requirements of the distributed learning system.
  • the first distributed node sends communication mechanism indication information to the second distributed node.
  • the second distributed node receives the communication mechanism indication information.
  • the adjustable communication mechanism includes triggering retransmission, adjusting transmit power, adjusting MCS, and so on.
  • the first distributed node 101 sends the communication mechanism indication information to the second distributed node 102, which can be implemented in the following ways:
  • the first distributed node broadcasts (or multicasts) the communication mechanism indication information.
  • the first distributed node 101 determines that the reasoning result is not robust, calculates the required communication quality requirement, and broadcasts (or multicasts) learning quality information (LQI) to the second distributed node 102 .
  • the second distributed node is a neighbor node that does not meet the communication quality requirements; the LQI carries the above communication quality requirements (for example, target ).
  • the communication quality requirement includes a first bit error rate, wherein the first bit error rate is a maximum allowable bit error rate that satisfies the robustness requirement of the distributed learning system
  • Another implementation is that the first distributed node sends the communication mechanism indication information to the central node, so that the central node broadcasts the communication mechanism indication information.
  • the first distributed node sends the communication mechanism indication information to the second distributed node.
  • the first distributed node 101 determines that the reasoning result is not robust, and calculates the communication mechanism (for example, whether to perform retransmission, required transmit power, required required MCS level, etc.), and send learning control information (learning control information, LCI) to the second distributed node that does not meet the communication quality requirements. Adjust the communication mechanism.
  • the retransmission indication information includes an indication of data reception failure and/or transmission resources used for next data transmission.
  • the adjustment information of the communication mechanism includes a suggested first transmission power and/or a transmission resource used for the next data transmission, where the first transmission power and the distance between the first distributed node and the second distributed node
  • the first channel state is associated with the target bit error rate; or the first transmission power is associated with the second channel information between the first distributed node and the second distributed node and the first transmission rate of the second distributed node.
  • the adjustment information of the communication mechanism includes the recommended first modulation and coding mode level and/or the transmission resource used for the next data transmission, the first modulation and coding mode level and the difference between the first distributed node and the second distributed node
  • the third channel information between is associated with the second transmission rate of the second distributed node.
  • the communication mechanism indication information includes communication mechanism adjustment information, specifically including suggested first transmission power and/or transmission resources used for next data transmission.
  • the second distributed node 102 determines a transmit power with reference to the first transmit power suggested by the first distributed node 101 and/or transmit power suggested by other distributed nodes adjacent to the second distributed node 102 .
  • the second distributed node 102 retransmits the first data to the first distributed node 101 on the transmission resource indicated by the communication mechanism indication information, using the determined transmit power.
  • the first distributed node uses the distributed learning model to perform reasoning again based on the second data and the first data of the first distributed node.
  • a communication method when the first distributed node uses the distributed learning model to perform inference based on the second data and the third data, and determines that the inference result is not robust, a communication is sent to the second distributed node Mechanism indication information, the communication mechanism indication information is obtained based on the robustness requirement of the distributed learning system, and the second distributed node transmits the second data based on the communication mechanism indication information.
  • This method improves the robustness of distributed reasoning with an efficient wireless transmission mechanism when comprehensively considering wireless transmission errors.
  • the neighbor node u1 sends the first data x 1 to the target node v, and the neighbor node u2 sends the first data x 2 to the target node v.
  • the neighbor node u1 may broadcast the first data x 1 .
  • the neighbor node u1 may unicast the first data x 1 to the target node v.
  • the neighbor node u1 may send the first data x 1 to the target node v and other neighbor nodes respectively.
  • step S804 for the reasoning and calculation process, reference may be made to step S804 in the above-mentioned embodiment.
  • step S804 For the calculation process of , reference may be made to step S804 in the above embodiment.
  • outputting the first inference result refers to outputting the inference result corresponding to the maximum probability after obtaining the probability of the inference result category corresponding to the inference task.
  • information such as channel state, interference information, and power upper limit is input, and the first reasoning result corresponds to a power control decision.
  • the target node v sends the LQI to the neighbor node u1.
  • the target node v can directly broadcast (or multicast) the LQI, which includes the target It can also include the channel information estimated by the target node v and the neighbor node u1; in another implementation, the target node v can also send the LQI to the central node, and the central node will broadcast (or multicast) To the neighbor nodes of target node v.
  • the LQI signaling can be carried on a pre-configured transmission resource (for example, a physical learning control channel (physical learning control channel, PLCCH)) and sent.
  • the neighbor node u1 receives the channel information and target node v of the target node It can also receive channel information and BER requirements sent by other neighbor nodes.
  • the neighbor node u1 comprehensively determines the adjusted communication mechanism according to the received channel information and BER requirements corresponding to the neighbor nodes.
  • the neighbor node u1 further calculates the required communication mechanism (for example, whether to perform retransmission, required transmit power, required MCS level, etc.) according to the target BER, and adjusts the communication mechanism.
  • the required communication mechanism for example, whether to perform retransmission, required transmit power, required MCS level, etc.
  • the target node or the central node broadcasts (or multicasts) the target BER, which can improve communication efficiency; when the method comprehensively considers wireless transmission errors, it realizes the use of an efficient wireless transmission mechanism to improve distribution Robustness of formulaic reasoning.
  • FIG. 11 it is a schematic flowchart of another communication method provided by the embodiment of the present application, which mainly involves adjustment of a communication mechanism in a point-to-point manner.
  • the method may include the steps of:
  • step S804 for the reasoning and calculation process, reference may be made to step S804 in the above-mentioned embodiment.
  • the target node v estimates the channel with the neighbor node u1, and determines the adjusted communication mechanism of the neighbor node u1.
  • the target node v sends communication mechanism indication information to the neighbor node u1.
  • the target node v when it is necessary to instruct the neighbor node u1 to perform retransmission, the target node v sends an LCI including an inference-negative response (R-NACK) to the neighbor node u1 .
  • the R-NACK is used to indicate that the reasoning result is not robust, and the LCI including the R-NACK may also include the transmission resource used for the next data transmission. Then the neighbor node u1 retransmits the first data to the target node v on the transmission resource indicated by the LCI.
  • the target node v may also send an LCI including an inference-positive response (R-ACK) to the neighbor node u2.
  • R-ACK inference-positive response
  • the target node v when it is necessary to instruct the neighbor node u1 to perform power adjustment, the target node v sends an LCI to the neighbor node u1, where the LCI includes the suggested first transmit power and/or the transmission resource used for the next data transmission.
  • the neighbor node u1 determines a transmit power with reference to the first transmit power suggested by the target node v and/or transmit power suggested by other distributed nodes adjacent to the neighbor node u1.
  • the neighbor node u1 retransmits the first data to the target node v on the transmission resource indicated by the communication mechanism indication information, using the determined transmission power.
  • the target node v when it is necessary to instruct the neighbor node u1 to adjust the MCS level, the target node v sends an LCI to the neighbor node u1, where the LCI includes the suggested first MCS level and/or the transmission resources used for the next data transmission.
  • the neighbor node u1 determines an MCS level with reference to the first MCS level suggested by the target node v and/or the MCS levels suggested by other distributed nodes adjacent to the neighbor node u1.
  • the neighbor node u1 retransmits the first data to the target node v using the determined MCS level on the transmission resource indicated by the communication mechanism indication information.
  • the neighbor node u1 receives the communication mechanism indication information of the target node v, and may also receive the communication mechanism indication information of other neighbor nodes.
  • the neighbor node u1 comprehensively determines the adjusted communication mechanism according to the communication mechanism indication information of one or more neighbor nodes.
  • the neighbor node u1 adjusts the communication mechanism, it can also inform the target node v of its adjusted communication mechanism.
  • the target node v uses the received retransmitted first data x1 to update the first data of the neighbor node u1.
  • the neighbor node u1 sends the first data x 1 to the target node v, and the neighbor node u2 sends the first data x 2 to the target node v.
  • step S1002 For the specific implementation of this step, reference may be made to step S1002 in the foregoing embodiments.
  • the target node v After receiving the first data x 1 sent by the neighbor node u1 and the first data x 2 sent by the neighbor node u2, the target node v performs inference with the locally stored machine learning model to obtain the first inference result and calculate the robust probability
  • step S804 for the reasoning and calculation process, reference may be made to step S804 in the above-mentioned embodiment.
  • step S804 For the calculation process of , reference may be made to step S804 in the above embodiment.
  • the target node v determines the bit error rate of the neighbor node u1 Bit error rate of neighbor node u2
  • the target node v sends the LCI including the R-NACK to the neighbor node u1.
  • the target node v When it is necessary to instruct the neighbor node u1 to perform retransmission, the target node v sends an LCI including an inference-negative response (R-NACK) to the neighbor node u1 .
  • R-NACK is used to indicate that the reasoning result is not robust, and the LCI including the R-NACK may also include the transmission resource used for the next data transmission. Then the neighbor node u1 retransmits the first data to the target node v on the transmission resource indicated by the LCI.
  • the target node v may also send an LCI including an inference-positive response (R-ACK) to the neighbor node u2.
  • R-ACK inference-positive response
  • the foregoing LCI including R-NACK/R-ACK may be carried on the PLCCH and sent.
  • Neighboring node u1 receives the LCI containing R-NACK of target node v.
  • the neighbor node u1 may receive LCIs of multiple neighbor nodes.
  • the neighbor node u1 retransmits the first data x 1 to the target node v.
  • the neighbor node may broadcast the first data x 1 .
  • the neighbor node u1 receives LCIs from multiple neighbor nodes, the first data that the neighbor node u1 needs to transmit to different target nodes is the same, and the transmission power and MCS are determined, then the neighbor node u1 can broadcast (or Multicast) to transmit its first data x 1 to its neighbor nodes.
  • the neighbor node may unicast the first data x 1 . If the neighbor node u1 only receives the LCI including R-NACK from one target node, the neighbor node u1 may transmit its first data x 1 to the target node in a unicast manner.
  • the target node v uses the received retransmitted first data x1 to update the first data of the neighbor node u1.
  • step S1009 For the specific implementation of this step, reference may be made to step S1009 in the foregoing embodiment.
  • the retransmission mechanism proposed in this embodiment aims at the robustness of distributed inference results, and formulates a reasonable retransmission mechanism and stop mechanism, which can obtain quasi-robust distributed inference results with a relatively low number of retransmissions .
  • the existing retransmission mechanism uses reliability as the criterion for retransmission, and it needs to stop after all adjacent point signals are correctly transmitted. And distributed learning has a certain tolerance for transmission errors. Therefore, this embodiment avoids the waste of communication resources and reduces the delay for implementing robust reasoning by formulating a brand-new retransmission judgment standard and stop mechanism.
  • the aim is to satisfy the robustness of distributed reasoning, and the robustness of distributed reasoning is improved by instructing neighboring nodes that do not meet the communication requirements to retransmit the first data.
  • the target node v sends an initial transmission request to the neighbor node u1 and the neighbor node u2.
  • the neighbor node u1 sends the first data x 1 to the target node v, and the neighbor node u2 sends the first data x 2 to the target node v.
  • step S1002 For the specific implementation of this step, reference may be made to step S1002 in the foregoing embodiment.
  • the target node v When it is necessary to instruct the neighbor node u1 to perform retransmission, the target node v sends an LCI including an inference-negative response (R-NACK) to the neighbor node u1 .
  • R-NACK is used to indicate that the reasoning result is not robust, and the LCI including the R-NACK may also include the transmission resource used for the next data transmission. Then the neighbor node u1 retransmits the first data to the target node v on the transmission resource indicated by the LCI.
  • the target node v may also send an LCI including an inference-positive response (R-ACK) to the neighbor node u2.
  • R-ACK inference-positive response
  • the foregoing LCI including R-NACK/R-ACK may be carried on the PLCCH and sent.
  • the neighbor node u1 retransmits the first data x 1 to the target node v.
  • the target node v sends an initial transmission request to the neighbor node u1 and the neighbor node u2.
  • step S1001 For the specific implementation of this step, reference may be made to step S1001 in the foregoing embodiments.
  • the neighbor node u1 sends the first data x 1 to the target node v, and the neighbor node u2 sends the first data x 2 to the target node v.
  • step S1002 For the specific implementation of this step, reference may be made to step S1002 in the foregoing embodiment.
  • step S804 For the calculation process of , reference may be made to step S804 in the above embodiment.
  • the target node v determines the bit error rate of the neighbor node u1 Bit error rate of neighbor node u2
  • the target node v estimates the channel with the neighbor node u1, and calculates the suggested first transmit power
  • the target terminal v will estimate the channel state h vu1 from the neighbor terminal u1 that needs to be adjusted to it, and then according to Get the power level that the neighbor terminal u1 should adjust to
  • the target node v sends the LCI to the neighbor node u1, and correspondingly, the neighbor node u1 receives the LCI sent by the target node v.
  • the target node v When it is necessary to instruct the neighbor node u1 to perform power adjustment, the target node v sends an LCI to the neighbor node u1, where the LCI includes the suggested first transmit power and/or the transmission resources used for the next data transmission.
  • the neighbor node u1 may receive LCIs of multiple neighbor nodes, and the LCIs of the multiple neighbor nodes include the transmit power suggested by multiple neighbor nodes. etc.
  • the neighbor node u1 according to the received first transmit power and/or the transmit power suggested by other neighboring nodes, and adjust its transmit power.
  • the neighbor node u1 receives the first transmission power sent by the target node v and/or the transmission power suggested by other neighboring nodes, at this time, the neighboring node u1 has two adjustment schemes, namely S1407 and S1407':
  • the neighboring node u1 will respectively adjust the power according to its requirements and then unicast its first data or encoded first data to the corresponding neighboring nodes.
  • Neighbor node u1 adjusts the transmission power according to the transmission power suggested by each target node, which can be adjusted in a targeted manner and avoid energy waste.
  • the target node v uses the received retransmitted first data x1 to update the first data of the neighbor node u1.
  • step S1009 For the specific implementation of this step, reference may be made to step S1009 in the foregoing embodiments. The above process will be repeated until the target robust probability is reached.
  • the power control mechanism proposed in this embodiment formulates a new power adjustment standard and calculation method, avoids a highly complex mathematical optimization process, and achieves the goal of ensuring the robustness of distributed reasoning through efficient power adjustment.
  • the existing power control mechanism usually aims at maximizing the throughput of the system, and completes the control through complex mathematical optimization or reinforcement learning.
  • the goal of power control is to ensure the robustness and immediacy of inference results. Therefore, this embodiment implements fast and efficient power control by formulating a new power adjustment standard and calculation method, reduces the delay in realizing accurate and robust inference, and avoids waste of resources.
  • the robustness of distributed reasoning is improved by instructing neighboring nodes that do not meet communication requirements to adjust transmission power.
  • FIG. 15 it is a schematic flowchart of another communication method provided by the embodiment of the present application, which is applied to a power control scenario of an outage system.
  • the method may include the steps of:
  • the target node v sends an initial transmission request to the neighbor node u1 and the neighbor node u2.
  • step S1001 For the specific implementation of this step, reference may be made to step S1001 in the foregoing embodiments.
  • the neighbor node u1 sends the first data x 1 to the target node v, and the neighbor node u2 sends the first data x 2 to the target node v.
  • step S1002 For the specific implementation of this step, reference may be made to step S1002 in the foregoing embodiment.
  • the target node v After receiving the first data x 1 sent by the neighbor node u1 and the first data x 2 sent by the neighbor node u2, the target node v performs inference with the locally stored machine learning model to obtain the first inference result And calculate the robustness.
  • step S804 for the reasoning and calculation process, reference may be made to step S804 in the above-mentioned embodiment.
  • the target node v determines that the neighbor node u1 is interrupted, and the neighbor node u2 is not interrupted. Estimate the channel with the neighbor node u1 and the transmission rate of the neighbor node u1, and calculate the recommended first transmit power
  • the target node v sends the LCI to the neighbor node u1, and correspondingly, the neighbor node u1 receives the LCI sent by the target node v.
  • the target node v When it is necessary to instruct the neighbor node u1 to perform power adjustment, the target node v sends an LCI to the neighbor node u1, where the LCI includes the suggested first transmit power and/or the transmission resources used for the next data transmission.
  • the neighbor node u1 receives the LCI of the target node v.
  • the neighbor node u1 may receive multiple neighbor node LCIs, and the multiple neighbor node LCIs include the transmit power suggested by multiple neighbor nodes. etc.
  • Neighbor node u1 adjusts the transmit power to in is the maximum transmission power of neighbor node u1, and broadcasts its first data x1 to all neighbor nodes.
  • the neighbor node u1 comprehensively considers the received transmit power suggested by one or more neighbor nodes, adjusts the transmit power, improves the reliability of communication, and ensures the reasoning performance of the target node v.
  • Neighbor node u1 adjusts the transmission power to And unicast its first data x 1 to the target node v.
  • the neighboring node u1 will respectively adjust the power according to its requirements and then unicast its first data or encoded first data to the corresponding neighboring nodes.
  • the target node v uses the received retransmitted first data x1 to update the first data of the neighbor node u1.
  • step S1009 For the specific implementation of this step, reference may be made to step S1009 in the foregoing embodiment.
  • the above process will be repeated until a robust inference result is achieved, namely smaller than the set reasoning deviation D max .
  • the power control mechanism proposed in this embodiment formulates a new power adjustment standard and calculation method, avoids a highly complex mathematical optimization process, and achieves the goal of ensuring the robustness of distributed reasoning through efficient power adjustment.
  • the existing power control mechanism usually aims at maximizing the throughput of the system, and completes the control through complex mathematical optimization or reinforcement learning.
  • the goal of power control is to ensure the robustness and immediacy of inference results. Therefore, this embodiment implements fast and efficient power control by formulating a new power adjustment standard and calculation method, reduces the delay in realizing accurate and robust inference, and avoids waste of resources.
  • FIG. 16 it is a schematic flowchart of another communication method provided by the embodiment of the present application, which is applied to an MCS adjustment scenario of a non-interruptible system.
  • the method may include the steps of:
  • the target node v sends an initial transmission request to the neighbor node u1 and the neighbor node u2.
  • step S1002 For the specific implementation of this step, reference may be made to step S1002 in the foregoing embodiment.
  • step S804 for the reasoning and calculation process, reference may be made to step S804 in the above-mentioned embodiment.
  • step S804 For the calculation process of , reference may be made to step S804 in the above embodiment.
  • the target node v determines the bit error rate of the neighbor node u1 Bit error rate of neighbor node u2
  • the target node v estimates the channel information with the neighbor node u1, and determines the suggested first MCS level.
  • the target node v sends the LCI to the neighbor node u1, and correspondingly, the neighbor node u1 receives the LCI sent by the target node v.
  • the target node v When it is necessary to instruct the neighbor node u1 to perform MCS adjustment, the target node v sends an LCI to the neighbor node u1, where the LCI includes the suggested first MCS level and/or the transmission resource used for the next data transmission.
  • the neighbor node u1 receives the LCI of the target node v.
  • neighbor node u1 may receive LCIs of multiple neighbor nodes, and the LCIs of multiple neighbor nodes include the MCS levels and/or proposed by multiple neighbor nodes. Or the transmission resource used for the next data transmission.
  • the neighbor node u1 adjusts its MCS level according to the received first MCS level and/or MCS levels suggested by other neighbor nodes.
  • the neighbor node u1 After the neighbor node u1 receives the first MCS level sent by the target node v and/or the MCS level suggested by other neighbor nodes, at this time, the neighbor node u1 has two adjustment schemes, namely S1607 and S1607':
  • the neighbor node u1 adopts the lowest MCS level among the received MCS levels suggested by one or more neighbor nodes, and broadcasts the first data x 1 re-encoded using the lowest MCS level to the one or more neighbors node. In addition, the neighbor node u1 also broadcasts the adjusted MCS level. The neighbor node u1 comprehensively considers the MCS level suggested by one or more neighbor nodes received, and adjusts to the lowest MCS level, which improves the reliability of communication and ensures the reasoning performance of the target node v.
  • the neighbor node u1 directly adopts the MCS level suggested by the neighbor node u1 that sends the MCS level suggestion to it.
  • Neighboring node u1 unicasts first data x 1 re-encoded by using each suggested MCS level to each neighboring node.
  • the neighbor node u1 also unicasts the adjusted MCS level.
  • Neighbor node u1 adjusts the MCS level according to the MCS level suggested by each target node, and can adjust the MCS level in a targeted manner, avoiding the waste of resources.
  • the target node v uses the received retransmitted first data x1 to update the first data of the neighbor node u1.
  • step S1009 for the specific implementation of this step, reference may be made to step S1009 in the foregoing embodiment. The above process will be repeated until the target robust probability is reached.
  • the modulation and coding scheme adjustment mechanism proposed in this embodiment establishes a reasonable adjustment standard and stop mechanism, and achieves the goal of ensuring the robustness of distributed inference results by dynamically adjusting the modulation and coding scheme.
  • the existing retransmission mechanism regards the throughput of the communication system as a performance indicator for adjusting the modulation and coding scheme, while in distributed inference, the task of the system is to ensure the robustness of the distributed inference results and have a certain tolerance for unreliable transmission . Therefore, this embodiment realizes rational utilization of communication resources and communication capabilities by formulating a brand-new adjustment standard and stop mechanism.
  • step S1001 For the specific implementation of this step, reference may be made to step S1001 in the foregoing embodiments.
  • the target node v After receiving the first data x 1 sent by the neighbor node u1 and the first data x 2 sent by the neighbor node u2, the target node v performs inference with the locally stored machine learning model to obtain the first inference result And calculate the robustness.
  • the target node v When it is necessary to instruct the neighbor node u1 to perform MCS adjustment, the target node v sends an LCI to the neighbor node u1, where the LCI includes the suggested first MCS level and/or the transmission resource used for the next data transmission.
  • the neighbor node u1 receives the LCI of the target node v.
  • the neighbor node u1 directly adopts the MCS level suggested by the neighbor node u1 that sends the MCS level suggestion to it.
  • Neighboring node u1 unicasts first data x 1 re-encoded by using each suggested MCS level to each neighboring node.
  • the neighbor node u1 also unicasts the adjusted MCS level.
  • Neighbor node u1 adjusts the MCS level according to the MCS level suggested by each target node, and can adjust the MCS level in a targeted manner, avoiding waste of resources.
  • the modulation and coding scheme adjustment mechanism proposed in this embodiment establishes a reasonable adjustment standard and stop mechanism, and achieves the goal of ensuring the robustness of distributed inference results by dynamically adjusting the modulation and coding scheme.
  • the existing retransmission mechanism regards the throughput of the communication system as a performance indicator for adjusting the modulation and coding scheme, while in distributed inference, the task of the system is to ensure the robustness of the distributed inference results and have a certain tolerance for unreliable transmission . Therefore, this embodiment realizes rational utilization of communication resources and communication capabilities by formulating a brand-new adjustment standard and stop mechanism.
  • neighbor nodes that do not meet the communication requirements are instructed to adjust the MCS level and retransmit the first data, which improves the robustness of distributed reasoning.
  • the present application also performs simulation verification on the above beneficial effects.
  • N terminal devices are randomly distributed in a square area with a side length of 2,000m. If the distance between two terminals is less than 500m, the two can exchange information.
  • the transmission loss model is 128.1+37.6log(d), where d is the distance between terminal devices in kilometers.
  • the small-scale fading is set to a Rayleigh distribution with uniform variance and a bandwidth of 10 MHz.
  • the distributed learning system is used for distributed learning, and each terminal device corresponds to a binary label, ⁇ -1, 1 ⁇ , which means focusing on the binary classification problem in the network.
  • the feature dimension of each terminal device and the output vector dimension of the distributed learning system are set to 32, which are generated under the Gaussian distribution.
  • Figure 18 shows the non-disruptive communication system in the target robust probability , the performance of the power control mechanism proposed in this application is adopted.
  • the left figure shows the classification error rate of the non-interruptible communication system with and without power control, and the classification error rate is close to 0% when there is power control;
  • the right figure shows the power adjustment times required for the non-interruptible communication system to achieve robustness .
  • this application can effectively reduce the error rate of inference results (from about 12% to about 0%) through a small number of power adjustments (as shown in the figure on the right, up to 3 times), and efficiently obtain a robust distribution Formula reasoning results avoid waste of communication resources and reduce system delay.
  • FIG. 19 and FIG. 20 are schematic structural diagrams of possible communication devices provided by the embodiments of the present application. These communication devices can be used to implement the functions of the first distributed node or the second distributed node in the above method embodiments, and thus can also realize the beneficial effects of the above method embodiments.
  • the communication device may be the first distributed node 101 shown in Figure 1, or one of the second distributed nodes 102 shown in Figure 1, or it may be a A module (such as a chip) of the first distributed node or the second distributed node.
  • a communication device 1900 includes a transceiver unit 191 and a processing unit 192 .
  • the communication device 1900 is configured to implement the functions of the first distributed node or the second distributed node in the method embodiments shown in FIGS. 7 to 17 above.
  • the transceiving unit 191 is further configured to send the first indication information to the at least one second distributed node; or the transceiving unit 191 is further configured to send the first indication information to the central node, making the central node forward the first indication information to the at least one second distributed node; wherein the first indication information is used to instruct the at least one second distributed node to send the communication device the
  • the at least one first data, the first indication information includes at least one of the following information: resource scheduling information for transmitting the at least one first data, inference task information, requested data amount, or requested data type.
  • the transceiving unit 191 is further configured to send second indication information to the at least one second distributed node, where the second indication information is used to indicate that the distributed learning system is in a machine learning reasoning mode.
  • the transceiving unit 191 is further configured to receive at least one third data of the at least one second distributed node; and the processing unit 192 is further configured to receive at least one third data based on the second data and the at least A third data uses the distributed learning model for reasoning, and it is determined that the reasoning result is not robust.
  • the communication mechanism indication information is used to instruct the at least one second distributed node to transmit the at least one first data, or the communication mechanism indication information is used to indicate the at least one second distributed node Adjusting the communication mechanism, and using the adjusted communication mechanism to transmit the at least one first data, where the at least one first data is retransmission data of the at least one third data.
  • the processing unit 192 is configured to perform any of the following: determining that the robustness probability is less than a set target robustness probability, where the robustness probability is that the number of bits of the at least one first data transmission error is less than the probability of a maximum number of erroneous bits, the maximum number of erroneous bits allowed to be transmitted when meeting the robustness requirements of the distributed learning system; or determining the bit errors of the at least one second distributed node The rate is greater than the target bit error rate, and the target bit error rate is the maximum allowable bit error rate that meets the robustness requirements of the distributed learning system; or it is determined that the maximum inference deviation is greater than the set inference deviation, and the maximum inference deviation is The maximum value of all possible inference biases.
  • the communication mechanism indication information includes at least one of the following: communication quality requirements; or retransmission indication information; or communication mechanism adjustment information.
  • the communication quality requirement includes a first bit error rate, wherein the first bit error rate is a maximum allowable bit error rate that satisfies the robustness requirement of the distributed learning system; or the retransmission
  • the indication information includes a data reception failure indication and/or the transmission resource used for the next data transmission; or the adjustment information of the communication mechanism includes the suggested first transmission power and/or the transmission resource used for the next data transmission, wherein,
  • the first transmit power is associated with a first channel state and a target bit error rate between the communication device and the at least one second distributed node; or the first transmit power is associated with the communication device and the The second channel state between at least one second distributed node is associated with the first transmission rate of the at least one second distributed node; or the adjustment information of the communication mechanism includes the suggested first modulation and coding mode level and/or or the transmission resource used for the next data transmission, the first modulation and coding mode level and the third channel state between the communication device and the at least one second distributed node and the at least one second distributed node A second transmission
  • the communication mechanism indication information is obtained based on the robustness requirements of the distributed learning system; and the transceiver unit 191 is further configured to send at least one first distributed node based on the communication mechanism indication information Send the first data.
  • the transceiving unit 191 is further configured to receive first indication information from the at least one first distributed node or the central node, where the first indication information is used to instruct the communication device to send The at least one first distributed node sends the first data; wherein, the first indication information includes at least one of the following information: resource scheduling information for transmitting the first data, reasoning task information, requested data volume, or request The kind of data.
  • the transceiving unit 191 is further configured to receive second indication information from the at least one first distributed node or central node, the second indication information is used to indicate that the distributed learning system is in the machine Learn reasoning patterns.
  • the processing unit 192 is configured to determine a second modulation and coding mode; and the transceiving unit 191 is further configured to send the at least one first distributed node to the at least one first distributed node in the second modulation and coding mode.
  • First data wherein, the second modulation and coding mode is of the same level as the first modulation and coding mode, or the second modulation and coding mode is obtained by the communication device from the at least one adjacent to the communication device The lowest level among the plurality of levels of the first modulation and coding mode received by the first distributed node.
  • transceiver unit 191 and processing unit 192 can be directly obtained by referring to related descriptions in the method embodiments shown in FIG. 7 to FIG. 17 , and will not be repeated here.
  • the processor 201 is used to implement the functions of the processing unit 192
  • the interface circuit 202 is used to implement the functions of the transceiver unit 191 .
  • the chip implements the function of the second distributed node in the above method embodiment.
  • the chip receives information from other modules (such as radio frequency modules or antennas) in the second distributed node, and the information is sent by the first distributed node to the second distributed node; or, the second distributed node chip sends information to the second distributed node Other modules (such as radio frequency modules or antennas) in the second distributed node send information, and the information is sent by the second distributed node to the first distributed node.
  • all or part of them may be implemented by software, hardware, firmware or any combination thereof.
  • software When implemented using software, it may be implemented in whole or in part in the form of a computer program product.
  • the computer program product comprises one or more computer programs or instructions. When the computer program or instructions are loaded and executed on the computer, the processes or functions described in the embodiments of the present application are executed in whole or in part.
  • the computer may be a general purpose computer, a special purpose computer, a computer network, a first distributed node, user equipment or other programmable devices.
  • the embodiment of the present application also provides a distributed learning system, the distributed learning system includes at least two distributed nodes, the at least two distributed nodes include the above-mentioned first distributed node, and a network adjacent to the first distributed node at least one second distributed node.
  • system and “network” in the embodiments of the present application may be used interchangeably.
  • Multiple means two or more, and in view of this, “multiple” can also be understood as “at least two” in the embodiments of the present application.
  • And/or describes the association relationship of associated objects, indicating that there may be three types of relationships, for example, A and/or B may indicate: A exists alone, A and B exist simultaneously, and B exists independently.
  • the character “/" unless otherwise specified, generally indicates that the associated objects before and after are in an "or” relationship.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本申请公开了一种通信方法及装置、系统、存储介质、程序产品。该方法包括:第一分布式节点向与第一分布式节点相邻的至少一个第二分布式节点发送通信机制指示信息,通信机制指示信息是基于分布式学习系统的鲁棒性需求得到的;第一分布式节点接收至少一个第二分布式节点的至少一个第一数据,至少一个第一数据是由至少一个第二分布式节点基于通信机制指示信息传输的;以及第一分布式节点基于第一分布式节点的第二数据和至少一个第一数据使用分布式学习模型进行推理。采用该方案,目标节点基于分布式学习系统的鲁棒性需求向邻居节点指示通信机制,邻居节点根据该通信机制传输数据,提高了分布式推理的效率和鲁棒性。

Description

通信方法及装置、系统、存储介质、程序产品
本申请要求于2021年10月21日提交中国国家知识产权局、申请号为202111231099.2、发明名称为“通信方法及装置、系统、存储介质、程序产品”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及通信技术领域,尤其涉及一种通信方法及装置、系统、存储介质、程序产品。
背景技术
随着网络计算能力的进一步提升和大数据的爆发,将人工智能(artificial intelligence,AI)技术引入到无线网络的设计中是突破传统无线技术瓶颈的重要方法之一。利用分布式推理可以有效地将获取数据的节点以及拥有算力资源的节点组织起来,完成分布式学习。
在分布式推理的过程中,邻点之间的信息交换需要通过无线通信来完成。由于无线信道的路径损耗、阴影、衰落以及噪声等影响,信号可能无法正确传输,从而影响推理性能。已有的无线传输机制,是以提高系统的吞吐量为目标,然而分布式推理对传输错误有一定的容忍度,采用现有的无线传输机制可能会浪费通信资源,增大系统延时。
因此,亟需一种适合分布式推理的通信方案来提高推理性能。
发明内容
本申请提供一种通信方法及装置、系统、存储介质、程序产品,以综合考虑无线传输差错时,实现以高效的无线传输机制保证分布式推理的性能。
第一方面,提供了一种通信方法,应用于分布式学习系统,所述分布式学习系统包括至少两个分布式节点,所述至少两个分布式节点包括第一分布式节点和至少一个第二分布式节点,所述方法包括:所述第一分布式节点向与所述第一分布式节点相邻的至少一个所述第二分布式节点发送通信机制指示信息,所述通信机制指示信息是基于所述分布式学习系统的鲁棒性需求得到的;所述第一分布式节点接收所述至少一个第二分布式节点的至少一个第一数据,所述至少一个第一数据是由所述至少一个第二分布式节点基于所述通信机制指示信息传输的;以及所述第一分布式节点基于所述第一分布式节点的第二数据和所述至少一个第一数据使用分布式学习模型进行推理。在第一方面中,该第一分布式节点可以是进行分布式推理的目标节点,至少一个第二分布式节点可以是该目标节点的邻居节点。目标节点基于分布式学习系统的鲁棒性需求向邻居节点指示通信机制,邻居节点根据该通信机制传输数据,提高了分布式推理的效率和鲁棒性。以分布式推理结果的鲁棒性为目标,复杂度低,通信资源利用合理,系统延时低。
在一种可能的实现中,所述方法还包括:所述第一分布式节点向所述至少一个第二分布式节点发送第一指示信息;或所述第一分布式节点向中心节点发送所述第一指示信息,使得所述中心节点向所述至少一个第二分布式节点转发所述第一指示信息;其中,所述第一指示信息用于指示所述至少一个第二分布式节点向所述第一分布式节点发送所述至少一个第一数据,所述第一指示信息包括以下至少一个信息:传输所述至少一个第一数据的资源调度信息,推理任务信息,请求数据量,或请求数据的种类。在该实现中,第一分布式节点通过第一指示信息明确指示至少一个第二分布式节点以下至少一个信息:传输所述至少一个第一数据的资源调度信息,推理任务信息,请求数据量,或请求数据的种类,使得至少一个第二分布式 节点根据上述信息来传输至少一个第一数据,从而保证分布式推理的性能。
在一种可能的实现中,所述方法还包括:所述第一分布式节点向所述至少一个第二分布式节点发送第二指示信息,所述第二指示信息用于指示所述分布式学习系统处于机器学习推理模式。在该实现中,通过第二指示信息明确指示了分布式学习系统处于机器学习推理模式。
在又一种可能的实现中,在所述第一分布式节点向所述至少一个第二分布式节点发送所述通信机制指示信息之前,所述方法还包括:所述第一分布式节点接收所述至少一个第二分布式节点的至少一个第三数据;以及所述第一分布式节点基于所述第二数据和所述至少一个第三数据使用所述分布式学习模型进行推理,确定推理结果不鲁棒。在该实现中,第一分布式节点进行推理时,如果确定推理结果不鲁棒,则向至少一个第二分布式节点发送通信机制指示信息,该通信机制指示信息是基于分布式学习系统的鲁棒性需求得到的,使得至少一个第二分布式节点基于该通信机制指示信息传输至少一个第一数据,以提高后续推理的鲁棒性。
在又一种可能的实现中,所述通信机制指示信息用于指示所述至少一个第二分布式节点传输所述至少一个第一数据,或所述通信机制指示信息用于指示所述至少一个第二分布式节点调整通信机制,并以调整后的通信机制传输所述至少一个第一数据,所述至少一个第一数据为所述至少一个第三数据的重传数据。在该实现中,可以有多种通信机制调整方式提高分布式推理的鲁棒性,例如,是否进行重传、所需的发射功率、所需的调制编码方案等级等。
在又一种可能的实现中,所述第一分布式节点确定推理结果不鲁棒,包括以下任意一项:所述第一分布式节点确定鲁棒概率小于设定目标鲁棒概率,其中,所述鲁棒概率是所述至少一个第一数据传输错误的比特数小于最大错误比特数量的概率,所述最大错误比特数量为满足所述分布式学习系统的鲁棒性需求时允许传输错误的比特的最大数量;或所述第一分布式节点确定所述至少一个第二分布式节点的误比特率大于目标误比特率,所述目标误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或所述第一分布式节点确定最大推理偏差大于设定推理偏差,所述最大推理偏差为所有可能的推理偏差的最大值。在该实现中,对于中断通信系统和非中断通信系统,提供了多种方式用于准确地判断推理结果是否鲁棒。
在又一种可能的实现中,所述通信机制指示信息包括以下至少一项:通信质量需求;或重传指示信息;或通信机制的调整信息。
在又一种可能的实现中,所述通信质量需求包括第一误比特率,其中,所述第一误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或所述重传指示信息包括数据接收失败指示和/或下次数据传输所使用的传输资源;或所述通信机制的调整信息包括建议的第一发射功率和/或下次数据传输所使用的传输资源,其中,所述第一发射功率与所述第一分布式节点与所述至少一个第二分布式节点之间的第一信道状态和目标误比特率关联;或所述第一发射功率与所述第一分布式节点与所述至少一个第二分布式节点之间的第二信道状态和所述至少一个第二分布式节点的第一传输速率关联;或所述通信机制的调整信息包括建议的第一调制编码模式等级和/或下次数据传输所使用的传输资源,所述第一调制编码模式等级与所述第一分布式节点与所述至少一个第二分布式节点之间的第三信道状态和所述至少一个第二分布式节点的第二传输速率关联。在该实现中,无线传输出现差错导致推理结果不鲁棒时,可以指示不满足通信需求的邻居节点重传第一数据、调整发射功率或调整调制编码模式等级,提高了分布式推理的鲁棒性。
第二方面,提供了一种通信方法,应用于分布式学习系统,所述分布式学习系统包括至少两个分布式节点,所述至少两个分布式节点包括至少一个第一分布式节点和第二分布式节 点,所述方法包括:所述第二分布式节点接收来自至少一个所述第一分布式节点的通信机制指示信息,所述通信机制指示信息是基于所述分布式学习系统的鲁棒性需求得到的;以及所述第二分布式节点基于所述通信机制指示信息向至少一个第一分布式节点发送第一数据。在第二方面中,该第一分布式节点可以是进行分布式推理的目标节点,至少一个第二分布式节点可以是该目标节点的邻居节点。目标节点基于分布式学习系统的鲁棒性需求向邻居节点指示通信机制,邻居节点根据该通信机制传输数据,提高了分布式推理的效率和鲁棒性。
在一种可能的实现中,所述方法还包括:所述第二分布式节点接收来自所述至少一个第一分布式节点或所述中心节点的第一指示信息,所述第一指示信息用于指示所述第二分布式节点向所述至少一个第一分布式节点发送所述第一数据;其中,所述第一指示信息包括以下至少一个信息:传输所述第一数据的资源调度信息,推理任务信息,请求数据量,或请求数据的种类。
在一种可能的实现中,所述方法还包括:所述第二分布式节点接收来自所述至少一个第一分布式节点或中心节点的第二指示信息,所述第二指示信息用于指示所述分布式学习系统处于机器学习推理模式。
在又一种可能的实现中,所述通信机制指示信息用于指示所述第二分布式节点传输所述第一数据,或所述通信机制指示信息用于指示所述第二分布式节点调整通信机制,并以调整后的通信机制传输所述第一数据,所述第一数据为重传的数据。
在又一种可能的实现中,所述通信机制指示信息包括以下至少一项:通信质量需求;或重传指示信息;或通信机制的调整信息。
在又一种可能的实现中,所述通信质量需求包括第一误比特率,其中,所述第一误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或所述重传指示信息包括数据接收失败指示和/或下次数据传输所使用的传输资源;或所述通信机制的调整信息包括建议的第一发射功率和/或下次数据传输所使用的传输资源,其中,所述第一发射功率与所述第二分布式节点与所述至少一个第一分布式节点之间的第一信道状态和目标误比特率关联,所述目标误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或所述第一发射功率与所述第二分布式节点与所述至少一个第一分布式节点之间的第二信道状态和所述第二分布式节点的第一传输速率关联;或所述通信机制的调整信息包括建议的第一调制编码模式等级和/或下次数据传输所使用的传输资源,所述第一调制编码模式等级与所述第二分布式节点与所述至少一个第一分布式节点之间的第三信道状态和所述第二分布式节点的第二传输速率关联。
在又一种可能的实现中,所述第二分布式节点基于所述通信机制指示信息向所述至少一个第一分布式节点发送第一数据,包括:所述第二分布式节点确定第二发射功率;以及所述第二分布式节点以所述第二发射功率向所述至少一个第一分布式节点发送所述第一数据;其中,所述第二发射功率为所述第二分布式节点允许的第一最大发射功率与所述第一发射功率中的较小值;或所述第二发射功率为所述第二分布式节点允许的第一最大发射功率与第二最大发射功率中的较小值,其中,所述第二最大发射功率为所述第二分布式节点从多个所述至少一个第一分布式节点接收到的多个所述第一发射功率中的最大值。
在又一种可能的实现中,所述第二分布式节点基于所述通信机制指示信息向所述至少一个第一分布式节点发送第一数据,包括:所述第二分布式节点确定第二调制编码模式;以及所述第二分布式节点以所述第二调制编码模式向所述至少一个第一分布式节点发送所述第一数据;其中,所述第二调制编码模式与所述第一调制编码模式等级相同,或所述第二调制编 码模式为所述第二分布式节点从与所述第二分布式节点相邻的所述至少一个第一分布式节点接收到的多个所述第一调制编码模式等级中的最低等级。
第三方面,提供了一种通信装置,应用于分布式学习系统,所述分布式学习系统包括至少两个分布式节点,所述至少两个分布式节点包括所述通信装置和至少一个第二分布式节点。所述通信装置可以实现上述第一方面中的通信方法。例如所述通信装置可以芯片或者设备。可以通过软件、硬件、者通过硬件执行相应的软件实现上述方法。
在一种可能的实现方式中,所述装置包括:收发单元和处理单元;其中,所述收发单元,用于向与所述通信装置相邻的至少一个所述第二分布式节点发送通信机制指示信息,所述通信机制指示信息是基于所述分布式学习系统的鲁棒性需求得到的;所述收发单元,还用于接收所述至少一个第二分布式节点的至少一个第一数据,所述至少一个第一数据是由所述至少一个第二分布式节点基于所述通信机制指示信息传输的;处理单元,用于基于所述通信装置的第二数据和所述至少一个第一数据使用分布式学习模型进行推理。
可选地,所述收发单元,还用于向所述至少一个第二分布式节点发送第一指示信息;或所述收发单元,还用于向中心节点发送所述第一指示信息,使得所述中心节点向所述至少一个第二分布式节点转发所述第一指示信息;其中,所述第一指示信息用于指示所述至少一个第二分布式节点向所述通信装置发送所述至少一个第一数据,所述第一指示信息包括以下至少一个信息:传输所述至少一个第一数据的资源调度信息,推理任务信息,请求数据量,或请求数据的种类。
可选地,所述收发单元,还用于向所述至少一个第二分布式节点发送第二指示信息,所述第二指示信息用于指示所述分布式学习系统处于机器学习推理模式。
可选地,所述收发单元,还用于接收所述至少一个第二分布式节点的至少一个第三数据;以及所述处理单元,还用于基于所述第二数据和所述至少一个第三数据使用所述分布式学习模型进行推理,确定推理结果不鲁棒。
可选地,所述通信机制指示信息用于指示所述至少一个第二分布式节点传输所述至少一个第一数据,或所述通信机制指示信息用于指示所述至少一个第二分布式节点调整通信机制,并以调整后的通信机制传输所述至少一个第一数据,所述至少一个第一数据为所述至少一个第三数据的重传数据。
可选地,所述处理单元用于执行以下任意一项:确定鲁棒概率小于设定目标鲁棒概率,其中,所述鲁棒概率是所述至少一个第一数据传输错误的比特数小于最大错误比特数量的概率,所述最大错误比特数量为满足所述分布式学习系统的鲁棒性需求时允许传输错误的比特的最大数量;或确定所述至少一个第二分布式节点的误比特率大于目标误比特率,所述目标误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或确定最大推理偏差大于设定推理偏差,所述最大推理偏差为所有可能的推理偏差的最大值。
可选地,所述通信机制指示信息包括以下至少一项:通信质量需求;或重传指示信息;或通信机制的调整信息。
可选地,所述通信质量需求包括第一误比特率,其中,所述第一误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或所述重传指示信息包括数据接收失败指示和/或下次数据传输所使用的传输资源;或所述通信机制的调整信息包括建议的第一发射功率和/或下次数据传输所使用的传输资源,其中,所述第一发射功率与所述通信装置与所述至少一个第二分布式节点之间的第一信道状态和目标误比特率关联;或所述第一发射功率与所述通信装置与所述至少一个第二分布式节点之间的第二信道状态和所述至少一个第二分布式 节点的第一传输速率关联;或所述通信机制的调整信息包括建议的第一调制编码模式等级和/或下次数据传输所使用的传输资源,所述第一调制编码模式等级与所述通信装置与所述至少一个第二分布式节点之间的第三信道状态和所述至少一个第二分布式节点的第二传输速率关联。
在另一种可能的实现方式中,该通信装置用于执行上述第一方面及其各种可能的实现中的方法。
第四方面,提供了一种通信装置,应用于分布式学习系统,所述分布式学习系统包括至少两个分布式节点,所述至少两个分布式节点包括至少一个第一分布式节点和所述通信装置。所述通信装置可以实现上述第二方面中的通信方法。例如所述通信装置可以芯片或者设备。可以通过软件、硬件、者通过硬件执行相应的软件实现上述方法。
在一种可能的实现中,所述装置包括:收发单元,还可以包括处理单元;其中,所述收发单元,用于接收来自至少一个所述第一分布式节点的通信机制指示信息,所述通信机制指示信息是基于所述分布式学习系统的鲁棒性需求得到的;以及所述收发单元,还用于基于所述通信机制指示信息向至少一个第一分布式节点发送第一数据。
可选地,所述收发单元,还用于接收来自所述至少一个第一分布式节点或所述中心节点的第一指示信息,所述第一指示信息用于指示所述通信装置向所述至少一个第一分布式节点发送所述第一数据;其中,所述第一指示信息包括以下至少一个信息:传输所述第一数据的资源调度信息,推理任务信息,请求数据量,或请求数据的种类。
可选地,所述收发单元,还用于接收来自所述至少一个第一分布式节点或中心节点的第二指示信息,所述第二指示信息用于指示所述分布式学习系统处于机器学习推理模式。
可选地,所述通信机制指示信息用于指示所述通信装置传输所述第一数据,或所述通信机制指示信息用于指示所述通信装置调整通信机制,并以调整后的通信机制传输所述第一数据,所述第一数据为重传的数据。
可选地,所述通信机制指示信息包括以下至少一项:通信质量需求;或重传指示信息;或通信机制的调整信息。
可选地,所述通信质量需求包括第一误比特率,其中,所述第一误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或所述重传指示信息包括数据接收失败指示和/或下次数据传输所使用的传输资源;或所述通信机制的调整信息包括建议的第一发射功率和/或下次数据传输所使用的传输资源,其中,所述第一发射功率与所述通信装置与所述至少一个第一分布式节点之间的第一信道状态和目标误比特率关联,所述目标误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或所述第一发射功率与所述通信装置与所述至少一个第一分布式节点之间的第二信道状态和所述通信装置的第一传输速率关联;或所述通信机制的调整信息包括建议的第一调制编码模式等级和/或下次数据传输所使用的传输资源,所述第一调制编码模式等级与所述通信装置与所述至少一个第一分布式节点之间的第三信道状态和所述通信装置的第二传输速率关联。
可选地,所述装置还包括:处理单元,用于确定第二发射功率;以及所述收发单元,还用于以所述第二发射功率向所述至少一个第一分布式节点发送所述第一数据;其中,所述第二发射功率为所述通信装置允许的第一最大发射功率与所述第一发射功率中的较小值;或所述第二发射功率为所述通信装置允许的第一最大发射功率与第二最大发射功率中的较小值,其中,所述第二最大发射功率为所述通信装置从多个所述至少一个第一分布式节点接收到的多个所述第一发射功率中的最大值。
可选地,所述装置还包括:处理单元,用于确定第二调制编码模式;以及所述收发单元,还用于以所述第二调制编码模式向所述至少一个第一分布式节点发送所述第一数据;其中,所述第二调制编码模式与所述第一调制编码模式等级相同,或所述第二调制编码模式为所述通信装置从与所述通信装置相邻的所述至少一个第一分布式节点接收到的多个所述第一调制编码模式等级中的最低等级。
在另一种可能的实现方式中,该通信装置用于执行上述第二方面及其各种可能的实现中的方法。
在又一种可能的实现方式中,上述第三方面或第四方面中的通信装置包括与存储器耦合的处理器;所述处理器被配置为支持所述装置执行上述通信方法中相应的功能。存储器用于与处理器耦合,其保存所述装置必要的计算机程序(或计算机可执行指令)和/或数据。可选的,所述通信装置还可以包括通信接口用于支持所述装置与其他网元之间的通信,例如数据和/或信号的发送或接收。示例性的,通信接口可以是收发器、电路、总线、模块或其它类型的通信接口。可选的,该存储器可以位于该通信装置内部,和处理器集成在一起;也可以位于该通信装置外部。
在又一种可能的实现方式中,上述第三方面或第四方面中的通信装置包括处理器和收发装置,所述处理器与所述收发装置耦合,所述处理器用于执行计算机程序或指令,以控制所述收发装置进行信息的接收和发送;当所述处理器执行所述计算机程序或指令时,所述处理器还用于通过逻辑电路或执行代码指令实现上述方法。其中,所述收发装置可以为收发器、收发电路或输入输出接口,用于接收来自所述通信装置之外的其它通信装置的信号并传输至所述处理器或将来自所述处理器的信号发送给所述通信装置之外的其它通信装置。当所述通信装置为芯片时,所述收发装置为收发电路或输入输出接口。
当上述第三方面或第四方面中的通信装置为芯片时,发送单元可以是输出单元,比如输出电路或者通信接口;接收单元可以是输入单元,比如输入电路或者通信接口。当所述通信装置为终端时,发送单元可以是发射器或发射机;接收单元可以是接收器或接收机。
第五方面,提供了一种分布式学习系统,所述分布式学习系统包括至少两个分布式节点,所述至少两个分布式节点包括如第三方面或第三方面的任一种实现所述的通信装置、以及至少一个如第四方面或第四方面的任一种实现所述的通信装置。
第六方面,提供了一种计算机可读存储介质,其上存储有计算机程序或指令,该程序或指令被处理器执行时,如第一方面或第一方面的任一种实现所述的方法被执行,或者,实现如第二方面或第二方面的任一种实现所述的方法被执行。
第七方面,提供了一种计算机程序产品,当其在计算设备上执行时,使得如第一方面或第一方面的任一种实现所述的方法被执行,或者如第二方面或第二方面的任一种实现所述的方法被执行。
附图说明
图1为本申请涉及的一种分布式学习系统的示意图;
图2为示例的一种具体的分布式学习系统的结构示意图;
图3为本申请实施例提供的一种无线通信系统的框图;
图4为示例的一种自动请求重发的流程示意图;
图5为示例的一种集中式功率控制的方法流程示意图;
图6为示例的一种自适应调制编码示意图;
图7为本申请实施例提供的一种通信方法的流程示意图;
图8为本申请实施例提供的又一种通信方法的流程示意图;
图9为本申请实施例提供的又一种通信方法的流程示意图;
图10为本申请实施例提供的又一种通信方法的流程示意图;
图11为本申请实施例提供的又一种通信方法的流程示意图;
图12为本申请实施例提供的又一种通信方法的流程示意图;
图13为本申请实施例提供的又一种通信方法的流程示意图;
图14为本申请实施例提供的又一种通信方法的流程示意图;
图15为本申请实施例提供的又一种通信方法的流程示意图;
图16为本申请实施例提供的又一种通信方法的流程示意图;
图17为本申请实施例提供的又一种通信方法的流程示意图;
图18为本申请实施例提供的仿真结果示意图;
图19为本申请实施例提供的一种通信装置的结构示意图;
图20为本申请实施例提供的又一种通信装置的结构示意图。
具体实施方式
下面结合本申请实施例中的附图对本申请实施例进行描述。
图1给出了本申请涉及的一种分布式学习系统的示意图。该分布式学习系统1000包括至少两个分布式节点,至少两个分布式节点包括第一分布式节点101(可以称为目标节点v)、以及与第一分布式节点101相邻的至少一个第二分布式节点102(如图中所示的第二分布式节点u1~uk,可以称为目标节点v的邻居节点)。第一分布式节点101和至少一个第二分布式节点102之间可以相互通信,可以应用于移动通信、卫星通信、无线传感器网络等无线通信系统中。例如,本申请提及的无线通信系统包括但不限于:窄带物联网系统(narrow band-internet ofthings,NB-IoT)、长期演进系统(long term evolution,LTE)、第五代(5 th generation,5G)移动通信系统的三大应用场景(增强移动宽带(enhanced mobile broadband,eMBB),高可靠和低延迟通信(ultra-reliable and low latency communications,URLLC)和大规模机器类型通信(massive machine type communication,mMTC)、以及下一代移动通信系统。
该分布式学习系统1000还可以包括中心节点103。第一分布式节点101和至少一个第二分布式节点102可以连接到该中心节点103。第一分布式节点101和至少一个第二分布式节点102之间可以直接通信,它们之间的信令/数据也可以通过中心节点103转发。
第一分布式节点/第二分布式节点可以是接入网设备,也可以是各种类型的终端。如图2所示,为示例的一种具体的分布式学习系统的结构示意图,在该分布式学习系统中,第一分布式节点/第二分布式节点均为终端。该终端具有分布式学习能力。图2左侧的具体的分布式学习系统可以表示为图2右侧的分布式学习系统示意图。
其中,上述接入网设备可以是任意一种具有无线收发功能的节点。包括但不限于:基站NodeB、演进型基站eNodeB、5G通信系统中的基站、未来通信系统中的基站或网络节点、WiFi系统中的接入节点、无线中继节点、无线回传节点等。上述接入网设备还可以是云无线接入网络(cloud radio access network,CRAN)场景下的无线控制器。上述接入网设备还可以是小站、传输点(transmission reference point,TRP)、发射点(transmitting point,TP)、移动交换中心以及设备到设备(Device-to-Device,D2D)、车辆外联(vehicle-to-everything,V2X)、机器到机器(machine-to-machine,M2M)通信中承担基站功能的设备等。本申请的实施例对 网络节点所采用的具体技术和具体节点形态不做限定。
终端是一种具有无线收发功能的节点,可以部署在陆地上,包括室内或室外、手持、穿戴或车载;也可以部署在水面上,如轮船上等;还可以部署在空中,如飞机、无人机、气球和卫星上等。终端可以是手机(mobile phone)、平板电脑(pad)、带无线收发功能的电脑、设备到设备通信(device-to-device,D2D)中的终端、车到一切(vehicle to everything,V2X)中的终端、虚拟现实(virtual reality,VR)终端设备、增强现实(augmented reality,AR)终端设备、工业控制(industrial control)中的无线终端、无人驾驶(self-driving)中的无线终端、远程医疗(remote medical)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端等等。本申请的实施例对应用场景不做限定。终端有时也可以称为用户设备(user equipment,UE)、接入终端设备、UE单元、移动站、移动台、远方站、远程终端设备、移动设备、无线通信设备、UE代理或UE装置等。
第一分布式节点/第二分布式节点可以通过自身的数据采集模块进行数据样本采集,所采集的样本用于训练机器学习模型完成给定机器学习任务。为了完成上述机器学习任务,第一分布式节点和至少一个第二分布式节点之间可能需要进行信息交互,交互的内容可以包括以下至少一项:各分布式节点采集的数据样本、本地推理的中间结果、本地推理的最终结果。这种信息交互需要通过无线通信完成,因此无线通信的性能会对机器学习任务的完成情况造成影响。
在分布式推理的过程中,邻点之间的信息交换需要通过无线通信来完成。通常来说,无线通信系统框图如图3所示。即,发送数据经过编码(包括信源编码和信道编码)和调制,得到调制符号后进行发送。
由于无线信道的路径损耗、阴影、衰落以及噪声等影响,信号可能无法正确传输,从而影响推理性能。已有的无线传输机制,是以提高系统的吞吐量为目标,然而分布式推理对传输错误有一定的容忍度,采用现有的无线传输机制可能会浪费通信资源,增大系统延时。因此亟需一种适合分布式推理的通信方案来提高推理性能。
如图4所示,为示例的一种自动请求重发(automatic repeat request,ARQ)的流程示意图,ARQ技术可以保证传输的可靠性。具体地,当接收方成功接收到传输信息时,接收方会反馈肯定响应(acknowledgement,ACK)信号给发送方。否则,接收方反馈否定响应(non-acknowledgement,NACK)信号给发送方,发送方重传信息,直至收到ACK信号或达到最大重传次数。
然而,该技术将传输的可靠性作为重传的判断标准。而在分布式学习系统中,系统的任务是保证推理结果的鲁棒性,对传输错误有一定的容忍度(即,一定程度的错误对于分布式学习系统的推理结果无影响)。此时,使用该重发技术进行重发会浪费通信资源,增大系统时延。
又如图5所示,为示例的一种集中式功率控制的方法流程示意图,传统的蜂窝网络架构往往由基站进行集中式的功率控制。具体来说,功率控制的问题会被建模成数学优化问题。该问题一般情况下为较复杂的非凸优化问题,可以通过分数规划、加权最小均方误差等方法进行求解。另一种思路是基于强化学习实现功率控制,即在每个小区的基站上都部署一个由神经网络实现的智能体,通过与环境的交互,不断调整功控策略,完成功率控制的任务。
然而,基于数学优化算法的功率控制方法通常求解复杂度很高,一般需要借助迭代式的算法进行求解。基于强化学习的功率控制方法在模型训练阶段的复杂度高,难收敛;而且可 扩展性极差,当环境中小区数发生改变时,需要对智能体进行重新训练。在分布式学习系统中,系统需要快速地调整功率,适应复杂多变的无线环境,使用该功率控制方案进行调整无法满足这一需求。
又如图6所示,为示例的一种自适应调制编码(adaptive modulation and coding,AMC)示意图。在通信系统中,调制编码方案(modulation and coding scheme,MCS)一般是基于信道状态进行选择的。通过调整MCS,可以实现对传输质量的控制。以LTE或新无线(new radio,NR)等蜂窝网络为例,下行通信中,终端通过基站发送的参考信号进行信道状态测量,并通过信道质量指示(channel quality indicator,CQI)将信道状态(或称信道质量)反馈给基站。基站参考CQI确定MCS等级,并通过下行控制信息(downlink control information,DCI)发送给终端,指示其应使用的MCS等级。上行通信中,基站直接通过终端发送的参考信号进行信道状态测量,并确定MCS等级,并通过DCI发送给终端。当上述信道测量时发生信道状态变化,基站将自适应地调整MCS等级。例如,当信道状态变差时,基站将调低MCS等级,降低通信链路上的吞吐,保证通信信息的正确接收和解调;当信道状态变好时,基站将调高MCS等级,提升通信链路的吞吐。
该方法将通信系统的吞吐作为调整调制编码方案的性能指标。而在分布式学习系统中,系统的任务是保证推理结果的鲁棒性。此时,使用该自适应调制编码方案进行调整无法满足这一需求。
有鉴于此,本申请提供了一种通信方案,应用于分布式学习系统,该分布式学习系统包括至少两个分布式节点,该至少两个分布式节点包括第一分布式节点和至少一个第二分布式节点,该方法包括:第一分布式节点向与第一分布式节点相邻的至少一个第二分布式节点发送通信机制指示信息,通信机制指示信息是基于分布式学习系统的鲁棒性需求得到的;第一分布式节点接收至少一个第二分布式节点的至少一个第一数据,至少一个第一数据是由至少一个第二分布式节点基于通信机制指示信息传输的;以及第一分布式节点基于第一分布式节点的第二数据和至少一个第一数据使用分布式学习模型进行推理。该方案是以提高分布式推理的鲁棒性为目标。采用本申请的方案,综合考虑无线传输差错时,实现了以高效的无线传输机制提高分布式推理的鲁棒性。
如图7所示,为本申请实施例提供的一种通信方法的流程示意图,该方法应用于分布式学习系统,该分布式学习系统包括至少两个分布式节点,该至少两个分布式节点包括第一分布式节点和至少一个第二分布式节点。本实施例以第一分布式节点和至少一个第二分布式节点中的其中任一个第二分布式节点的交互流程为例进行描述。第一分布式节点与各第二分布式节点的以下交互流程可以同时进行,也可以单独进行,本申请对此不作限制。该方法可以包括以下步骤:
S701.第一分布式节点向与第一分布式节点相邻的第二分布式节点发送通信机制指示信息。
相应地,第二分布式节点接收该通信机制指示信息。
该第一分布式节点为目标节点,可以是图1所示的分布式学习系统中的第一分布式节点101;第二分布式节点可以是图1所示的分布式学习系统中的第二分布式节点102。第一分布式节点101与第二分布式节点102相邻,第二分布式节点102又称为第一分布式节点的邻居节点。
第一分布式节点101可以获取第二数据,该第二数据可以是以下至少一项:第一分布式节点通过自身的数据采集模块采集的数据样本、本地推理的中间结果、本地推理的最终结果。 第二数据用于机器学习模型的推理任务。为了完成上述机器学习模型的推理,第一分布式节点101与相邻的第二分布式节点102之间可能需要进行信息交互,交互的内容可以包括以下至少一项:第二分布式节点采集的数据样本、本地推理的中间结果、本地推理的最终结果。这种信息交互需要通过无线通信完成,因此无线通信的性能会对机器学习任务的完成情况造成影响。在本实施例中,第一分布式节点101向第二分布式节点102发送通信机制指示信息。该通信机制指示信息用于指示第二分布式节点102传输数据时采用的通信机制。其中,该通信机制指示信息是基于分布式学习系统的鲁棒性需求得到的。
S702.第二分布式节点向第一分布式节点发送第一数据。
相应地,第一分布式节点接收第二分布式节点的第一数据。
第二分布式节点102接收到第一分布式节点101发送的通信机制指示信息后,基于该通信机制指示信息向第一分布式节点101分别传输自身的第一数据。即第一数据是由第二分布式节点102基于通信机制指示信息传输的。第一分布式节点101接收第二分布式节点102传输的第一数据。该第一数据包括以下至少一项:第二分布式节点102采集的数据样本、本地推理的中间结果、本地推理的最终结果。
S703.第一分布式节点基于第一分布式节点的第二数据和第一数据使用分布式学习模型进行推理。
第一分布式节点接收到第一数据后,将自身的第二数据和第一数据输入分布式学习模型进行推理。由于第二分布式节点102是基于通信机制指示信息传输第一数据的,该通信机制指示信息是基于分布式学习系统的鲁棒性需求得到的,因此,基于第二数据和第一数据使用分布式学习模型进行推理,可以提高分布式推理的鲁棒性。
与传统无线通信系统中的以系统吞吐、丢包率、时延为目标的通信机制调整不同,本实施例所提方法以分布式推理的鲁棒性为性能指标,更加适用于承载分布式学习任务的无线通信系统。
根据本申请实施例提供的一种通信方法,目标节点基于分布式学习系统的鲁棒性需求向邻居节点指示通信机制,邻居节点根据该通信机制传输数据,提高了分布式推理的效率和鲁棒性。
该方法是以提高分布式推理的鲁棒性为目标,而不是以提高系统的吞吐量为目标。该方法综合考虑无线传输差错时,实现了以高效的无线传输机制提高分布式推理的鲁棒性。
如图8所示,为本申请实施例提供的又一种通信方法的流程示意图,该方法应用于分布式学习系统,该分布式学习系统包括至少两个分布式节点,该至少两个分布式节点包括第一分布式节点和至少一个第二分布式节点。本实施例以第一分布式节点和至少一个第二分布式节点中的其中任一个第二分布式节点的交互流程为例进行描述。第一分布式节点与各第二分布式节点的以下交互流程可以同时进行,也可以单独进行,本申请对此不作限制。该方法可以包括以下步骤:
S801.第一分布式节点向与第一分布式节点相邻的第二分布式节点发送第二指示信息。
相应地,第二分布式节点接收该第二指示信息。
该第一分布式节点为目标节点,可以是图1所示的分布式学习系统中的第一分布式节点101,第二分布式节点可以是图1所示的分布式学习系统中的第二分布式节点102。第一分布式节点101与第二分布式节点102相邻,第二分布式节点102又称为第一分布式节点的邻居节点。
示例性地,第一分布式节点101可以直接广播或单播该第二指示信息,或者第一分布式 节点101向中心节点103发送第三指示信息,用于指示中心节点103广播或单播该第二指示信息。其中,第二指示信息用于指示分布式学习系统处于机器学习推理模式。其中,广播第二指示信息,可以是在系统信息块x(system information block,SIBx)(例如,SIB1)中增加MLInference字段。示例性地,当该MLInference字段取值为真(true)时,用于指示分布式学习系统处于机器学习推理模式。其中,单播第二指示信息,可以是单播干扰配置(Infernce-Config)无线资源控制(radio resource control,RRC)信令,该RRC信令包括推理任务的标识信息、时频资源预分配信息等。第一分布式节点101/中心节点103向参与机器学习推理任务的节点发送该RRC信令。
S802.第一分布式节点向第二分布式节点发送第一指示信息。
相应地,第二分布式节点接收该第一指示信息。
第一分布式节点101为获取与该第一分布式节点101相邻的第二分布式节点102的数据,向第二分布式节点102发送第一指示信息。其中,该第一指示信息用于指示第二分布式节点向第一分布式节点发送第三数据。该第一指示信息可以携带在学习触发信息(learning trigger information,LTI)信令中。该第一指示信息包括以下至少一个信息:传输第三数据的资源调度信息,推理任务信息,请求数据量,或请求数据的种类。其中,资源调度信息包括资源分配指示和MCS等。推理任务信息包括任务内容或任务标识等。请求数据量包括第一分布式节点请求第二分布式节点102发送的第三数据的数据量。请求数据的种类包括第一分布式节点请求第二分布式节点102发送的第三数据的数据种类。例如,请求的第三数据的数据种类包括以下至少一种:第二分布式节点102通过自身的数据采集模块采集的数据样本、本地推理的中间结果、本地推理的最终结果。请求数据量可以是以比特为单位。可选地,第二分布式节点102获得多个原始数据的样本、多次推理的中间结果、多次推理的最终结果后,可以单次一起发送,也可以一起发送。
可替换地,S802也可以为第一分布式节点向中心节点发送第一指示信息,使得中心节点向第二分布式节点转发第一指示信息。中心节点接收到该第一指示信息,可以以单播、组播或广播的方式转发该第一指示信息给第二分布式节点102。
S803.第二分布式节点向第一分布式节点发送第三数据。
相应地,第一分布式节点接收该第三数据。
示例性地,第二分布式节点102接收到上述第一指示信息后,根据第一指示信息向第一分布式节点发送第三数据。该第三数据包括以下至少一项:第二分布式节点102采集的数据样本、本地推理的中间结果、本地推理的最终结果。
示例性地,该第三数据可以理解为第二分布式节点102向第一分布式节点传输的初始数据。
S804.第一分布式节点基于第二数据和第三数据使用分布式学习模型进行推理,确定推理结果不鲁棒。
第一分布式节点基于第二数据和第三数据使用分布式学习模型进行推理。当确定不鲁棒时执行S805;否则,获得推理结果。换句话说,第一分布式节点判断推理结果的鲁棒性,当推理结果为不鲁棒时,向第二分布式节点发送基于鲁棒性需求确定的通信机制指示;当推理结果为鲁棒时,获得和/或输出该推理结果。
其中,第一分布式节点确定推理结果不鲁棒,包括以下任意一项:
第一分布式节点确定鲁棒概率小于设定目标鲁棒概率,其中,鲁棒概率是至少一个第一数据传输错误的比特数小于最大错误比特数量的概率,最大错误比特数量为满足分布式学习 系统的鲁棒性需求时允许传输错误的比特的最大数量;或
第一分布式节点确定至少一个第二分布式节点的误比特率大于目标误比特率,目标误比特率为满足分布式学习系统的鲁棒性需求的最大允许误比特率;或
第一分布式节点确定最大推理偏差大于设定推理偏差,最大推理偏差为所有可能的推理偏差的最大值。
关于分布式推理,在训练阶段,每个分布式节点的训练数据都有一个标签c v,该标签可以是连续的或者离散的。机器学习的任务就是通过机器学习模型对数据进行处理,使得得到的处理结果和数据标签c v相同。每个分布式节点都本地存储了与该问题相关的p维特征,x v∈{0,1} p。该特征通常是以二元向量的形式存储,便于后续传输。如果原始特征是连续的,可以通过量化得到其二元形式。针对不同的机器学习任务,x v和c v的物理意义可能不同。例如,针对图片分类任务,x v可以是图片数据,c v则是图片内容对应的类别;针对通信系统功率控制任务,x v可以是信道状态、干扰信息、功率上限等信息,c v则对应于功率控制决策;针对通信系统链路调控问题,x v可以是节点权重、干扰信息、服务质量(quality of service,QoS)要求等,c v则对应于链路激活指示。机器学习通过训练调整机器学习模型的参数,实现如下问题的求解:
min/max F({c v} v∈V,{x v) v∈V),s.t.G({c v} v∈V,{x v} v∈V)
其中,F(·,·)是系统优化目标(需要被最大化或最小化),包括但不仅限于系统吞吐量、系统延时、系统能耗等。G(·,·)是系统优化限制条件,包括但不仅限于功率限制、QoS要求、公平性要求、信道资源约束等。上述问题可以通过分布式学习来解决,即用分布式的机器学习模型(可以使用神经网络实现)拟合{x v} v∈V与{c v} v∈V之间的关系,其中,V为模型的顶点集合。当模型训练好之后,每个分布式节点都在本地存储该模型。当某个目标分布式节点v需要推理其对应的标签时,该目标分布式节点会向与该目标分布式节点相邻的分布式节点u∈N(v)发送传输请求,N(v)为与目标分布式节点v相邻的分布式节点集合。相邻的分布式节点在接收到传输请求之后,会将其特征发送给该目标分布式节点。在收到所有相邻的分布式节点的信号之后,目标分布式节点v会将本地特征x v与接收到的邻点特征
Figure PCTCN2022125651-appb-000001
作为输入,运行本地存储的机器学习模型,得到推理结果
Figure PCTCN2022125651-appb-000002
由于机器学习模型的训练往往需要大量的时间、算力、能耗开销,且训练阶段的模型输出准确度较低。因此,一种更合理的使用方式是离线对机器学习模型进行训练,并部署到实际系统中,随后进行在线的推理。在线推理时,系统只能获得机器学习模型输入所需的数据,而无法获得这些数据对应的标签。
由于推理阶段无法获得数据的标签,因此需要在无标签的情况下,定义模型推理的鲁棒性。
为了定义鲁棒性,记目标节点v和邻居节点u之间的通信链路上的误比特数量为q vu,则目标节点v和其所有邻居节点之间通信链路误比特数向量为
Figure PCTCN2022125651-appb-000003
其中u 1,u 2,...,u K∈N(v),N(v)表示目标节点v的所有邻居节点集合。假设已知q v,定义最大推理偏差
Figure PCTCN2022125651-appb-000004
为:
Figure PCTCN2022125651-appb-000005
Figure PCTCN2022125651-appb-000006
Figure PCTCN2022125651-appb-000007
其中,
Figure PCTCN2022125651-appb-000008
是待优化的变量,即通过调整
Figure PCTCN2022125651-appb-000009
的值使目标函数最大化;q v=[q vu,u∈N(v)],q vu表示目标节点v接收到的来自邻点节点u的信号中可能出现的错误比特数;Dis(·,·)定义了两个推理结果之间的距离。下面对上述定义的物理意义进行解释:
Figure PCTCN2022125651-appb-000010
是邻点信息矩阵中邻居节点u的信息向量(或矩阵),它的元素是0/1比特;
Figure PCTCN2022125651-appb-000011
是与
Figure PCTCN2022125651-appb-000012
维度相同的向量(或矩阵),它的元素也是0/1比特。第一个限制条件表示
Figure PCTCN2022125651-appb-000013
Figure PCTCN2022125651-appb-000014
中不同的比特的数量小于q vu,即
Figure PCTCN2022125651-appb-000015
相当于是在
Figure PCTCN2022125651-appb-000016
的基础上引入了小于q vu个比特的错误得到的。同样的,对于其他邻居节点,也可以构造相应的
Figure PCTCN2022125651-appb-000017
将所有邻居节点的
Figure PCTCN2022125651-appb-000018
组合在一起得到了
Figure PCTCN2022125651-appb-000019
Figure PCTCN2022125651-appb-000020
输入机器学习模型得到一个推理结果
Figure PCTCN2022125651-appb-000021
表示计算该推理结果与将
Figure PCTCN2022125651-appb-000022
作为学习模型输入得到的推理结果(即
Figure PCTCN2022125651-appb-000023
)之间的差距。而优化问题则是遍历所有可能的
Figure PCTCN2022125651-appb-000024
将它们作为机器学习模型的输入得到的推理结果与
Figure PCTCN2022125651-appb-000025
的最大差距。也就是说,
Figure PCTCN2022125651-appb-000026
定义了在所有邻居节点与目标节点的通信链路上错误的比特数在q v以内时,推理结果的最大偏差。当这个偏差
Figure PCTCN2022125651-appb-000027
小于一个设定推理偏差D max时,则认为分布式推理结果
Figure PCTCN2022125651-appb-000028
在错误限制q v下是鲁棒的。即如果
Figure PCTCN2022125651-appb-000029
小于设定推理偏差D max,则说明无论输出过程中哪几个比特错误了,对推理结果都没有影响,因此此时推理是鲁棒的。注意,这里的鲁棒性判断过程中,无需获得学习模型的输入数据对应的真实标签,而这个真实标签往往在推理阶段是无法获得的。因此,本实施例的方法具有更高的可行性。
例如,假设传输无差错时,真实的邻点信息矩阵是H v
经过信道传输实际接收到的邻点信息矩阵是
Figure PCTCN2022125651-appb-000030
q vu=1;
Figure PCTCN2022125651-appb-000031
有以下几种可能:
Figure PCTCN2022125651-appb-000032
Figure PCTCN2022125651-appb-000033
Figure PCTCN2022125651-appb-000034
Figure PCTCN2022125651-appb-000035
然后获取
Figure PCTCN2022125651-appb-000036
与上述可能的
Figure PCTCN2022125651-appb-000037
对应的推理结果
Figure PCTCN2022125651-appb-000038
的差距,并取差距中的最大值,如果该差距中的最大值小于设定推理偏差D max,则说明传输过程的比特错误对推理结果没有影响,此时推理是鲁棒的。
由于机器学习模型中可能包含非线性操作(例如神经网络中的非线性激活),求解上述问题获得
Figure PCTCN2022125651-appb-000039
可以采取如图9所示的流程,包括以下步骤:
S901.对机器学习模型中的非线性激活函数进行线性拟合或者凸包拟合。
S902.将二元优化变量松弛为0到1之间的连续变量。
S903.判断优化问题类型,用相应算法进行求解。
具体地,经过上述两步松弛和拟合,该问题会变为线性规划、凸优化或者其他优化问题,用相应的常用算法进行求解。
S904.获取次优解或最优解。
本实施例主要考虑两种通信系统:
(1)中断系统:当通信链路的质量(例如,信噪比(signal-noise ratio,SNR))较差时,接收端译码失败,将丢弃数据包中的全部比特,此时,我们称发生了中断;
(2)非中断系统:通信链路上的比特以一定概率(误比特率(bit error rate,BER))错误,节点u到节点v的通信链路上的BER的计算为:
Figure PCTCN2022125651-appb-000040
其中,Q(.)为Q函数,P u为节点u的发射功率,h vu为节点u到节点v的信道增益,
Figure PCTCN2022125651-appb-000041
为噪声功率。
在中断系统中,目标节点v可以计算邻居节点u发送过来的信号的SNR,并判断是否发生中断(SNR是否小于解调门限SNR)。如果发生中断,则q vu=p,即全部p个比特都丢失;如果没有发生中断,则q vu=0。对目标节点v的每个邻居节点都做上述是否中断的判断,则可以得到错误比特数向量q v,进而计算
Figure PCTCN2022125651-appb-000042
并判断其是否小于D max。因此,中断系统中,可以通过如下方法判断推理是否鲁棒:
获得各邻居节点到目标节点的传输误比特数,计算最大推理偏差
Figure PCTCN2022125651-appb-000043
并与设定推理偏差D max做比较。当目标节点v确定最大推理偏差大于设定推理偏差,则确定推理结果不鲁棒。
在非中断系统中,注意到,
Figure PCTCN2022125651-appb-000044
是假设q v已知的情况下计算的,因此反过来,可以在给定
Figure PCTCN2022125651-appb-000045
的限制条件(如小于给定门限D max)下,求得通信链路上最多可以错多少个比特,即求解如下问题:
Figure PCTCN2022125651-appb-000046
Figure PCTCN2022125651-appb-000047
Figure PCTCN2022125651-appb-000048
求得的
Figure PCTCN2022125651-appb-000049
即为目标节点v的邻居节点最多可以传错的比特数,即最大错误比特数量,则目标节点v的每个邻居节点传错的比特数都小于最大错误比特数量
Figure PCTCN2022125651-appb-000050
的概率(鲁棒概率)为
Figure PCTCN2022125651-appb-000051
其中BER为
Figure PCTCN2022125651-appb-000052
Figure PCTCN2022125651-appb-000053
最大错误比特数量为所有可能的第一错误比特数量q′ v中的最大值,第一错误比特数量q′ v是推理偏差
Figure PCTCN2022125651-appb-000054
小于第一最大推理偏差(D)时,通信链路传输至少一个第三数据允许错误的比特的最大数量。推理偏差是第一分布式设备基于第一数据和至少一个第 二数据使用机器学习模型进行推理时得到的第一推理结果
Figure PCTCN2022125651-appb-000055
与第一分布式设备基于第一数据和至少一个第四数据使用机器学习模型进行推理时得到的第二推理结果
Figure PCTCN2022125651-appb-000056
之间的不同的比特的数量;至少一个第四数据为与至少一个第二数据的不同比特数量小于等于第一错误比特数量的数据,第一最大推理偏差(D)为小于或等于设定推理偏差(D max)的正整数值。
此时,可以将对推理偏差
Figure PCTCN2022125651-appb-000057
的要求转化为对鲁棒概率
Figure PCTCN2022125651-appb-000058
的要求,即要求
Figure PCTCN2022125651-appb-000059
小于目标鲁棒概率
Figure PCTCN2022125651-appb-000060
Figure PCTCN2022125651-appb-000061
进一步的,可以要求BER小于目标
Figure PCTCN2022125651-appb-000062
其中目标
Figure PCTCN2022125651-appb-000063
可以通过求解
Figure PCTCN2022125651-appb-000064
Figure PCTCN2022125651-appb-000065
得到。当目标节点v的邻居节点的BER大于
Figure PCTCN2022125651-appb-000066
时,则推理是不鲁棒的。
因此,非中断系统中,可以通过如下两个方法判断推理是否鲁棒:
(1)根据推理偏差的要求
Figure PCTCN2022125651-appb-000067
计算鲁棒概率
Figure PCTCN2022125651-appb-000068
并与设定目标鲁棒概率
Figure PCTCN2022125651-appb-000069
比较。当目标节点v确定鲁棒概率
Figure PCTCN2022125651-appb-000070
小于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000071
则目标节点v确定推理结果不鲁棒。其中,鲁棒概率是第三数据传输错误的比特数小于最大错误比特数量的概率,最大错误比特数量为满足分布式学习系统的鲁棒性需求时允许传输错误的比特的最大数量。
(2)计算各邻居节点到目标节点的传输BER,与目标
Figure PCTCN2022125651-appb-000072
比较。当目标节点v确定邻居节点u的误比特率大于目标BER,则目标节点v确定推理结果不鲁棒。其中,目标误比特率为满足分布式学习系统的鲁棒性需求的最大允许误比特率。
S805.第一分布式节点向第二分布式节点发送通信机制指示信息。
相应地,第二分布式节点接收该通信机制指示信息。
由上可见,由于无线信道的损耗、衰落以及噪声的影响,分布式节点v接收到的邻点信息矩阵
Figure PCTCN2022125651-appb-000073
通常不等于真实值H v,相应得到的推理结果
Figure PCTCN2022125651-appb-000074
的鲁棒性也会受到影响。因此,建立通信机制与模型推理鲁棒性的关系,就可以通过调整通信机制,提高模型推理的鲁棒性。其中,可调整的通信机制包括触发重传、调整发射功率、调整MCS等。
因此,当第一分布式节点101确定推理结果不鲁棒时,第一分布式节点101向第二分布式节点102发送通信机制指示信息。该通信机制指示信息用于指示第二分布式节点102传输数据时采用的通信机制。其中,该通信机制指示信息是基于分布式学习系统的鲁棒性需求得到的。
第一分布式节点101向第二分布式节点102发送通信机制指示信息,可以有以下几种实现方式:
一种实现为,第一分布式节点广播(或组播)通信机制指示信息。具体地,第一分布式节点101确定推理结果不鲁棒,计算其所需的通信质量需求,向第二分布式节点102广播(或组播)学习质量信息(learning quality information,LQI)。可选的,该第二分布式节点为不满足通信质量需求的邻居节点;该LQI携带上述通信质量需求(例如,目标
Figure PCTCN2022125651-appb-000075
)。示例性地,该通信质量需求包括第一误比特率,其中,第一误比特率为满足分布式学习系统的鲁棒性需求的最大允许误比特率
Figure PCTCN2022125651-appb-000076
另一种实现为,第一分布式节点向中心节点发送该通信机制指示信息,使得中心节点广播该通信机制指示信息。
又一种实现为,第一分布式节点向第二分布式节点发送该通信机制指示信息。具体地,第一分布式节点101确定推理结果不鲁棒,为不满足通信质量需求的第二分布式节点计算其应采用的通信机制(例如,是否进行重传、所需的发射功率、所需的MCS等级等),并向不满足通信质量需求的第二分布式节点发送学习控制信息(learning control information,LCI),该LCI携带重传指示信息或通信机制的调整信息,令其根据LCI调整通信机制。示例性地,重传指示信息包括数据接收失败指示和/或下次数据传输所使用的传输资源。示例性地,通信机制的调整信息包括建议的第一发射功率和/或下次数据传输所使用的传输资源,其中,第一发射功率和第一分布式节点与第二分布式节点之间的第一信道状态和目标误比特率关联;或第一发射功率和第一分布式节点与第二分布式节点之间的第二信道信息和第二分布式节点的第一传输速率关联。示例性地,通信机制的调整信息包括建议的第一调制编码模式等级和/或下次数据传输所使用的传输资源,第一调制编码模式等级和第一分布式节点与第二分布式节点之间的第三信道信息和第二分布式节点的第二传输速率关联。
具体如何调整通信机制,将在下文详细描述。
S806.第二分布式节点向第一分布式节点发送第一数据。
相应地,第一分布式节点接收第二分布式节点的第一数据。
第二分布式节点102接收到第一分布式节点101发送的通信机制指示信息后,基于该通信机制指示信息向第一分布式节点101传输自身采集到的第一数据。即第一数据是由第二分布式节点102基于通信机制指示信息传输的。第一分布式节点101接收第二分布式节点102传输的第一数据。该第一数据包括以下至少一项:第二分布式节点102采集的数据样本、本地推理的中间结果、本地推理的最终结果。
示例性地,该通信质量需求包括第一误比特率,第二分布式节点102根据该通信质量需求,进一步计算所需的通信机制(例如,是否进行重传、所需的发射功率、所需的MCS等级等),并调整通信机制。
示例性地,通信机制指示信息包括重传指示信息,该重传指示信息包括数据接收失败指示和/或下次数据传输所使用的传输资源,则第二分布式节点102在该重传指示信息所指示的传输资源上向第一分布式节点101重传第一数据。
示例性地,通信机制指示信息包括通信机制的调整信息,具体包括建议的第一发射功率和/或下次数据传输所使用的传输资源。第二分布式节点102参考第一分布式节点101建议的第一发射功率和/或其它与第二分布式节点102相邻的分布式节点建议的发射功率,确定一个发射功率。第二分布式节点102在该通信机制指示信息所指示的传输资源上,采用确定的发射功率,向第一分布式节点101重传第一数据。
示例性地,通信机制指示信息包括通信机制的调整信息,具体包括建议的第一MCS等级和/或下次数据传输所使用的传输资源。第二分布式节点102参考第一分布式节点101建议的第一MCS等级和/或其它与第二分布式节点102相邻的分布式节点建议的MCS等级,确定一个MCS等级。第二分布式节点102在该通信机制指示信息所指示的传输资源上,采用确定的MCS等级,向第一分布式节点101重传第一数据。
S807.第一分布式节点基于第一分布式节点的第二数据和第一数据使用分布式学习模型再次进行推理。
第一分布式节点接收到第一数据后,将自身的第二数据和第一数据输入分布式学习模型 再次进行推理。由于第二分布式节点102是基于通信机制指示信息传输第一数据的,该通信机制指示信息是基于分布式学习系统的鲁棒性需求得到的,因此,基于第二数据和第一数据使用分布式学习模型进行推理,可以提高分布式推理的鲁棒性。
根据本申请实施例提供的一种通信方法,在第一分布式节点基于第二数据和第三数据使用分布式学习模型进行推理,确定推理结果不鲁棒时,向第二分布式节点发送通信机制指示信息,该通信机制指示信息是基于分布式学习系统的鲁棒性需求得到的,第二分布式节点基于该通信机制指示信息传输第二数据。该方法综合考虑无线传输差错时,实现了以高效的无线传输机制提高分布式推理的鲁棒性。
如图10所示,为本申请实施例提供的又一种通信方法的流程示意图,主要涉及广播(或组播)方式的通信机制调整,一般用于非中断通信系统。该方法可以包括以下步骤:
S1001.目标节点v向邻居节点u1、邻居节点u2发送初次传输请求。
本实施例以目标节点v具有两个邻居节点(邻居节点u1、邻居节点u2)为例进行描述,事实上,目标节点v的邻居节点可以具有一个或多个邻居节点。
相应地,邻居节点u1接收目标节点v的初次传输请求,此外,邻居节点u1还可以接收其它邻居节点的传输请求。同样地,邻居节点u2接收目标节点v的初次传输请求,此外,邻居节点u2还可以接收其它邻居节点的传输请求。
S1002.邻居节点u1向目标节点v发送第一数据x 1,以及邻居节点u2向目标节点v发送第一数据x 2
在本实施例中,以邻居节点u1发送第一数据x 1为例,由于邻居节点u1接收到目标节点v以及其它邻居节点的传输请求,则邻居节点u1可以广播第一数据x 1。在另外的实施例中,如果邻居节点u1只接收到目标节点v的传输请求,则邻居节点u1可以单播第一数据x 1给目标节点v。在另外的实施例中,如果邻居节点u1接收到目标节点v以及其它邻居节点的传输请求,则邻居节点u1可以分别向目标节点v以及其它邻居节点发送第一数据x 1
S1003.目标节点v接收到邻居节点u1发送的第一数据x 1以及邻居节点u2发送的第一数据x 2后,用本地存储的机器学习模型进行推理,得到第一推理结果
Figure PCTCN2022125651-appb-000077
并计算鲁棒概率
Figure PCTCN2022125651-appb-000078
该推理及计算过程可参考上述实施例中的步骤S804。
S1004.当鲁棒概率
Figure PCTCN2022125651-appb-000079
大于或等于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000080
时,输出第一推理结果
Figure PCTCN2022125651-appb-000081
在本轮推理过程中不进行后续的重传、更新操作;当鲁棒概率
Figure PCTCN2022125651-appb-000082
小于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000083
时,目标节点v计算目标误比特率
Figure PCTCN2022125651-appb-000084
目标
Figure PCTCN2022125651-appb-000085
的计算过程可参考上述实施例中的步骤S804。
在另外的实施例中,也可以是当鲁棒概率
Figure PCTCN2022125651-appb-000086
大于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000087
时,输出第一推理结果
Figure PCTCN2022125651-appb-000088
在本轮推理过程中不进行后续的重传、更新操作;当鲁棒概率
Figure PCTCN2022125651-appb-000089
小于或等于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000090
时,目标节点v计算目标误比特率
Figure PCTCN2022125651-appb-000091
其中,输出第一推理结果是指,在获得推理任务对应的推理结果类别的概率后,输出最大概率对应的推理结果。例如,针对通信系统功率控制任务,输入信道状态、干扰信息、功率上限等信息,第一推理结果则对应于功率控制决策。
S1005.假设邻居节点u1的误比特率
Figure PCTCN2022125651-appb-000092
邻居节点u2的误比特率
Figure PCTCN2022125651-appb-000093
则目标节点v估计与邻居节点u1之间的信道。
S1006.目标节点v向邻居节点u1发送LQI。
如果目标节点v有多个邻居节点的BER大于目标BER,在一个实现中,目标节点v可以直接广播(或组播)LQI,该LQI包括目标
Figure PCTCN2022125651-appb-000094
还可以包括目标节点v估计出的与邻居 节点u1之间的信道信息;在另一个实现中,目标节点v也可以向中心节点发送该LQI,由中心节点再以广播(或组播)的方式给目标节点v的邻居节点。在这两个实现中,LQI信令均可以被承载在预先配置好的传输资源(例如,物理学习控制信道(physical learning control channel,PLCCH))上进行发送。
S1007.邻居节点u1接收目标节点v的信道信息和目标
Figure PCTCN2022125651-appb-000095
还可以接收其它邻居节点发送的信道信息和BER要求。邻居节点u1根据接收到的邻居节点对应的信道信息和BER要求,综合确定调整后的通信机制。
具体地,邻居节点u1根据目标BER,进一步计算所需的通信机制(例如,是否进行重传、所需的发射功率、所需的MCS等级等),并调整通信机制。
S1008.邻居节点u1采用确定调整后的通信机制,向目标节点v重传第一数据x 1
此外,邻居节点u1调整通信机制后,还可以告知目标节点v其调整后的通信机制。
S1009.目标节点v采用接收到的重传的第一数据x 1更新邻居节点u1的第一数据。
目标节点v接收到所有需要重传的第一数据后,可以对来自同一个邻居节点的多次传输的第一数据进行合并,例如采用最大比合并(maximal-ratio combing,MRC),得到等效信号,并重新估计该邻居节点的BER。
目标节点v基于自身的第二数据以及更新后的至少一个第一数据,用本地存储的机器学习模型再次进行推理,得到新的推理结果,并计算该结果的鲁棒概率。上述过程将重复至达到目标鲁棒概率。
根据本申请实施例提供的一种通信方法,目标节点或中心节点广播(或组播)目标BER,可以提高通信效率;该方法综合考虑无线传输差错时,实现了以高效的无线传输机制提高分布式推理的鲁棒性。
如图11所示,为本申请实施例提供的又一种通信方法的流程示意图,主要涉及点对点方式的通信机制调整。该方法可以包括以下步骤:
S1101.目标节点v向邻居节点u1、邻居节点u2发送初次传输请求。
该步骤的具体实现可参考上述实施例中的步骤S1001。
S1102.邻居节点u1向目标节点v发送第一数据x 1,以及邻居节点u2向目标节点v发送第一数据x 2
该步骤的具体实现可参考上述实施例中的步骤S1002。
S1103.目标节点v接收到邻居节点u1发送的第一数据x 1以及邻居节点u2发送的第一数据x 2后,用本地存储的机器学习模型进行推理,得到第一推理结果
Figure PCTCN2022125651-appb-000096
并计算鲁棒概率
Figure PCTCN2022125651-appb-000097
该推理及计算过程可参考上述实施例中的步骤S804。
S1104.当鲁棒概率
Figure PCTCN2022125651-appb-000098
大于或等于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000099
时,输出第一推理结果
Figure PCTCN2022125651-appb-000100
在本轮推理过程中不进行后续的重传、更新操作;当鲁棒概率
Figure PCTCN2022125651-appb-000101
小于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000102
时,目标节点v估计与邻居节点u1之间的BER,与目标误比特率
Figure PCTCN2022125651-appb-000103
比较。
目标
Figure PCTCN2022125651-appb-000104
的计算过程可参考上述实施例中的步骤S804。
在另外的实施例中,也可以是当鲁棒概率
Figure PCTCN2022125651-appb-000105
大于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000106
时,输出第一推理结果
Figure PCTCN2022125651-appb-000107
在本轮推理过程中不进行后续的重传、更新操作;当鲁棒概率
Figure PCTCN2022125651-appb-000108
小于或等于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000109
时,目标节点v计算目标误比特率
Figure PCTCN2022125651-appb-000110
S1105.假设邻居节点u1的误比特率
Figure PCTCN2022125651-appb-000111
邻居节点u2的误比特率
Figure PCTCN2022125651-appb-000112
则目标节点v估计与邻居节点u1之间的信道,并确定邻居节点u1的调整后的通信机制。
S1106.目标节点v向邻居节点u1发送通信机制指示信息。
具体地,目标节点v可以采用点对点的方式向不满足通信质量需求的邻居节点发送通信机制指示信息;或者目标节点v可以向中心节点发送通信机制指示信息,由中心节点采用点对点的方式向不满足通信质量需求的邻居节点发送通信机制指示信息。根据通信机制指示信息所指示调整的通信机制不同,发送通信机制指示信息的信令有所不同:
示例性地,当需要指示邻居节点u1进行重传时,目标节点v向邻居节点u1发送包含推理-否定响应(R-NACK)的LCI。R-NACK用于指示推理结果不鲁棒,包含R-NACK的LCI还可以包括下次数据传输所使用的传输资源。则邻居节点u1在该LCI所指示的传输资源上向目标节点v重传第一数据。此外,当目标节点v接收到邻居节点u2初次发送的第一数据x 2,且邻居节点u2的误比特率
Figure PCTCN2022125651-appb-000113
则目标节点v也可以向邻居节点u2发送包含推理-肯定响应(R-ACK)的LCI。
其中,R-ACK/R-NACK可以为新定义的重传控制信令字段,当目标节点v收到邻居节点的第三数据,且经过鲁棒性判断得到推理鲁棒的结果时,可以向相应的邻居节点发送包含R-ACK的LCI;相反,当推理结果不鲁棒时,则发送包含R-NACK的LCI,触发邻居节点重传数据。
示例性地,当需要指示邻居节点u1进行功率调整时,目标节点v向邻居节点u1发送LCI,该LCI包括建议的第一发射功率和/或下次数据传输所使用的传输资源。邻居节点u1参考目标节点v建议的第一发射功率和/或其它与邻居节点u1相邻的分布式节点建议的发射功率,确定一个发射功率。邻居节点u1在该通信机制指示信息所指示的传输资源上,采用确定的发射功率,向目标节点v重传第一数据。
示例性地,当需要指示邻居节点u1进行MCS等级调整时,目标节点v向邻居节点u1发送LCI,该LCI包括建议的第一MCS等级和/或下次数据传输所使用的传输资源。邻居节点u1参考目标节点v建议的第一MCS等级和/或其它与邻居节点u1相邻的分布式节点建议的MCS等级,确定一个MCS等级。邻居节点u1在该通信机制指示信息所指示的传输资源上,采用确定的MCS等级,向目标节点v重传第一数据。
上述LCI可以被承载在PLCCH上发送。
S1107.邻居节点u1接收目标节点v的通信机制指示信息,还可以接收其它邻居节点的通信机制指示信息。邻居节点u1根据一个或多个邻居节点的通信机制指示信息,综合确定调整后的通信机制。
S1108.邻居节点u1采用确定调整后的通信机制,向目标节点v重传第一数据x 1
此外,邻居节点u1调整通信机制后,还可以告知目标节点v其调整后的通信机制。
S1109.目标节点v采用接收到的重传的第一数据x 1更新邻居节点u1的第一数据。
该步骤的具体实现可参考上述实施例中的步骤S1009。上述过程将重复至达到目标鲁棒概率。根据本申请实施例提供的一种通信方法,在点对点方式中,目标节点确定不满足通信质量要求的邻居节点的调整后的通信机制,并发送通信机制指示信息给邻居节点,可以提高通信效率,并减少邻居节点的工作量;该方法综合考虑无线传输差错时,实现了以高效的无线传输机制提高分布式推理的鲁棒性。
下面将详细描述具体的通信机制调整方法,且以点对点方式调整为示例。实际上,对于非中断通信系统,也可以以广播(或组播)的方式进行调整。
如图12所示,为本申请实施例提供的又一种通信方法的流程示意图,应用于非中断系统的重传场景。该方法可以包括以下步骤:
S1201.目标节点v向邻居节点u1、邻居节点u2发送初次传输请求。
该步骤的具体实现可参考上述实施例中的步骤S1001。
S1202.邻居节点u1向目标节点v发送第一数据x 1,以及邻居节点u2向目标节点v发送第一数据x 2
该步骤的具体实现可参考上述实施例中的步骤S1002。
S1203.目标节点v接收到邻居节点u1发送的第一数据x 1以及邻居节点u2发送的第一数据x 2后,用本地存储的机器学习模型进行推理,得到第一推理结果
Figure PCTCN2022125651-appb-000114
并计算鲁棒概率
Figure PCTCN2022125651-appb-000115
该推理及计算过程可参考上述实施例中的步骤S804。
S1204.当鲁棒概率
Figure PCTCN2022125651-appb-000116
大于或等于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000117
时,输出第一推理结果
Figure PCTCN2022125651-appb-000118
在本轮推理过程中不进行后续的重传、更新操作;当鲁棒概率
Figure PCTCN2022125651-appb-000119
小于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000120
时,目标节点v估计与邻居节点u1之间的BER,与目标误比特率
Figure PCTCN2022125651-appb-000121
比较。
目标
Figure PCTCN2022125651-appb-000122
的计算过程可参考上述实施例中的步骤S804。
在另外的实施例中,也可以是当鲁棒概率
Figure PCTCN2022125651-appb-000123
大于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000124
时,输出第一推理结果
Figure PCTCN2022125651-appb-000125
在本轮推理过程中不进行后续的重传、更新操作;当鲁棒概率
Figure PCTCN2022125651-appb-000126
小于或等于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000127
时,目标节点v计算目标误比特率
Figure PCTCN2022125651-appb-000128
S1205.目标节点v确定邻居节点u1的误比特率
Figure PCTCN2022125651-appb-000129
邻居节点u2的误比特率
Figure PCTCN2022125651-appb-000130
S1206.目标节点v向邻居节点u1发送包含R-NACK的LCI。
当需要指示邻居节点u1进行重传时,目标节点v向邻居节点u1发送包含推理-否定响应(R-NACK)的LCI。R-NACK用于指示推理结果不鲁棒,包含R-NACK的LCI还可以包括下次数据传输所使用的传输资源。则邻居节点u1在该LCI所指示的传输资源上向目标节点v重传第一数据。此外,当目标节点v接收到邻居节点u2初次发送的第一数据x 2,且邻居节点u2的误比特率
Figure PCTCN2022125651-appb-000131
则目标节点v也可以向邻居节点u2发送包含推理-肯定响应(R-ACK)的LCI。
上述包含R-NACK/R-ACK的LCI可以被承载在PLCCH上发送。
邻居节点u1接收目标节点v的包含R-NACK的LCI。
此外,系统中可能存在多个目标节点同步进行推理,因此,邻居节点u1可能会收到多个邻居节点的LCI。
S1207.邻居节点u1向目标节点v重传第一数据x 1
一种可能的实现中,邻居节点可以广播第一数据x 1。例如,若邻居节点u1收到多个邻居节点的LCI,邻居节点u1需要传输给不同的目标节点的第一数据相同,且发射功率和MCS都是确定的,则邻居节点u1可以以广播(或组播)的方式将其第一数据x 1传输给其邻居节点。
一种可能的实现中,邻居节点可以单播第一数据x 1。若邻居节点u1只收到一个目标节点的包含R-NACK的LCI,则邻居节点u1可以通过单播的方式将其第一数据x 1传输给该目标节点。
S1208.目标节点v采用接收到的重传的第一数据x 1更新邻居节点u1的第一数据。
该步骤的具体实现可参考上述实施例中的步骤S1009。本实施例提出的重传机制,以分布式推理结果的鲁棒性为目标,制定了合理的重传机制和停止机制,能以较低的重传次数,获得准鲁棒的分布式推理结果。现有的重传机制以可靠性作为重传的判断标准,需要在所有邻点信号都被正确传输之后才会停止。而分布式学习对传输错误有一定的容忍度。因此,本实施例通过制定全新的重传判断标准和停止机制,避免了通信资源的浪费,降低了实现鲁棒推理的延时。
根据本申请实施例提供的一种通信方法,以满足分布式推理的鲁棒性为目标,通过指示不满足通信需求的邻居节点重传第一数据,提高了分布式推理的鲁棒性。
如图13所示,为本申请实施例提供的又一种通信方法的流程示意图,应用于中断系统的重传场景。该方法可以包括以下步骤:
S1301.目标节点v向邻居节点u1、邻居节点u2发送初次传输请求。
该步骤的具体实现可参考上述实施例中的步骤S1001。
S1302.邻居节点u1向目标节点v发送第一数据x 1,以及邻居节点u2向目标节点v发送第一数据x 2
该步骤的具体实现可参考上述实施例中的步骤S1002。
S1303.目标节点v接收到邻居节点u1发送的第一数据x 1以及邻居节点u2发送的第一数据x 2后,用本地存储的机器学习模型进行推理,得到第一推理结果
Figure PCTCN2022125651-appb-000132
并计算鲁棒性。
该推理及计算过程可参考上述实施例中的步骤S804。
S1304.当最大推理偏差
Figure PCTCN2022125651-appb-000133
小于设定推理偏差D max时,输出第一推理结果
Figure PCTCN2022125651-appb-000134
在本轮推理过程中不进行后续的重传、更新操作;当
Figure PCTCN2022125651-appb-000135
大于设定推理偏差D max时,目标节点v判断接收信号是否发生中断。
S1305.假设,目标节点v确定邻居节点u1发生中断,邻居节点u2未发生中断。
S1306.目标节点v向邻居节点u1发送包含R-NACK的LCI。
当需要指示邻居节点u1进行重传时,目标节点v向邻居节点u1发送包含推理-否定响应(R-NACK)的LCI。R-NACK用于指示推理结果不鲁棒,包含R-NACK的LCI还可以包括下次数据传输所使用的传输资源。则邻居节点u1在该LCI所指示的传输资源上向目标节点v重传第一数据。此外,当目标节点v接收到邻居节点u2初次发送的第一数据x 2,且邻居节点u2的误比特率
Figure PCTCN2022125651-appb-000136
则目标节点v也可以向邻居节点u2发送包含推理-肯定响应(R-ACK)的LCI。
上述包含R-NACK/R-ACK的LCI可以被承载在PLCCH上发送。
邻居节点u1接收目标节点v的包含R-NACK的LCI。
此外,系统中可能存在多个目标节点同步进行标签推理,因此,邻居节点u1可能会收到多个邻居节点的LCI。
S1307.邻居节点u1向目标节点v重传第一数据x 1
若邻居节点u1收到多个邻居节点的包含R-NACK的LCI,邻居节点u1需要传输给不同的目标节点的第一数据相同,且发射功率和MCS都是确定的,则邻居节点u1可以以广播(或组播)的方式将其第一数据x 1传输给其邻居节点。
若邻居节点u1只收到一个目标节点的包含R-NACK的LCI,则邻居节点u1可以通过单播的方式将其第一数据x 1传输给该目标节点。
S1308.目标节点v采用接收到的重传的第一数据x 1更新邻居节点u1的第一数据。
该步骤的具体实现可参考上述实施例中的步骤S1009。上述过程将重复至达到鲁棒的推理结果,即
Figure PCTCN2022125651-appb-000137
小于设定推理偏差D max
本实施例提出的重传机制,以分布式推理结果的鲁棒性为目标,制定了合理的重传机制和停止机制,能以较低的重传次数,获得准鲁棒的分布式推理结果。现有的重传机制以可靠性作为重传的判断标准,需要在所有邻点信号都被正确传输之后才会停止。而分布式学习对 传输错误有一定的容忍度。因此,本实施例通过制定全新的重传判断标准和停止机制,避免了通信资源的浪费,降低了实现鲁棒推理的延时。
根据本申请实施例提供的一种通信方法,以满足分布式推理的鲁棒性为目标通过指示不满足通信需求的邻居节点重传第一数据,提高了分布式推理的鲁棒性。
如图14所示,为本申请实施例提供的又一种通信方法的流程示意图,应用于非中断系统的功率控制场景。该方法可以包括以下步骤:
S1401.目标节点v向邻居节点u1、邻居节点u2发送初次传输请求。
该步骤的具体实现可参考上述实施例中的步骤S1001。
S1402.邻居节点u1向目标节点v发送第一数据x 1,以及邻居节点u2向目标节点v发送第一数据x 2
该步骤的具体实现可参考上述实施例中的步骤S1002。
S1403.目标节点v接收到邻居节点u1发送的第一数据x 1以及邻居节点u2发送的第一数据x 2后,用本地存储的机器学习模型进行推理,得到第一推理结果
Figure PCTCN2022125651-appb-000138
并计算鲁棒概率
Figure PCTCN2022125651-appb-000139
该推理及计算过程可参考上述实施例中的步骤S804。
S1404.当鲁棒概率
Figure PCTCN2022125651-appb-000140
大于或等于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000141
时,输出第一推理结果
Figure PCTCN2022125651-appb-000142
在本轮推理过程中不进行后续的发射功率调整、重传、更新操作;当鲁棒概率
Figure PCTCN2022125651-appb-000143
小于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000144
时,目标节点v估计与邻居节点u1之间的BER,与目标误比特率
Figure PCTCN2022125651-appb-000145
比较。
目标
Figure PCTCN2022125651-appb-000146
的计算过程可参考上述实施例中的步骤S804。
在另外的实施例中,也可以是当鲁棒概率
Figure PCTCN2022125651-appb-000147
大于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000148
时,输出第一推理结果
Figure PCTCN2022125651-appb-000149
在本轮推理过程中不进行后续的发射功率调整、重传、更新操作;当鲁棒概率
Figure PCTCN2022125651-appb-000150
小于或等于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000151
时,目标节点v计算目标误比特率
Figure PCTCN2022125651-appb-000152
S1405.目标节点v确定邻居节点u1的误比特率
Figure PCTCN2022125651-appb-000153
邻居节点u2的误比特率
Figure PCTCN2022125651-appb-000154
目标节点v估计与邻居节点u1之间的信道,并计算建议的第一发射功率
Figure PCTCN2022125651-appb-000155
具体地,目标终端v会估计从需要调整的邻点终端u1到其的信道状态h vu1,然后根据
Figure PCTCN2022125651-appb-000156
得到邻点终端u1应该调整到的功率水平
Figure PCTCN2022125651-appb-000157
S1406.目标节点v向邻居节点u1发送LCI,相应的,邻居节点u1接收目标节点v发送的LCI。
当需要指示邻居节点u1进行功率调整时,目标节点v向邻居节点u1发送LCI,该LCI包括建议的第一发射功率和/或下次数据传输所使用的传输资源。
邻居节点u1接收目标节点v的LCI。
此外,系统中可能存在多个目标节点同步进行标签推理,因此,邻居节点u1可能会收到多个邻居节点的LCI,该多个邻居节点的LCI分别包括多个邻居节点建议的发射功率
Figure PCTCN2022125651-appb-000158
Figure PCTCN2022125651-appb-000159
等等。
邻居节点u1根据接收到的第一发射功率
Figure PCTCN2022125651-appb-000160
和/或其它邻居节点建议的发射功率,调整其发射功率。
邻居节点u1接收到目标节点v发送的第一发射功率
Figure PCTCN2022125651-appb-000161
和/或其它邻居节点建议的发射功率后,此时,邻居节点u1有两种调整方案,分别为S1407和S1407’:
S1407.邻居节点u1将发射功率调整至
Figure PCTCN2022125651-appb-000162
其中
Figure PCTCN2022125651-appb-000163
为 邻居节点u1的最大发射功率,以及广播其第一数据x 1至其它邻居节点。邻居节点u1综合考虑了接收到的一个或多个邻居节点建议的发射功率,调整了发射功率,提高了通信的可靠性,保证了目标节点v的推理性能。
S1407’.邻居节点u1将发射功率调整至
Figure PCTCN2022125651-appb-000164
以及单播其第一数据x 1至目标节点v。
类似地,针对其他邻居节点,邻居节点u1会分别根据其要求调整功率然后将其第一数据或者编码后的第一数据单播给相应的邻居节点。
邻居节点u1针对每个目标节点建议的发射功率进行发射功率调整,可以有针对性地进行发射功率调整,避免了能量的浪费。
S1408.目标节点v采用接收到的重传的第一数据x 1更新邻居节点u1的第一数据。
该步骤的具体实现可参考上述实施例中的步骤S1009。上述过程将重复至达到目标鲁棒概率。
本实施例提出的功率调控机制,制定了全新的功率调整标准和计算方式,避免了高复杂度的数学优化过程,实现了通过高效的功率调整保证分布式推理鲁棒性的目标。现有的功率控制机制通常以系统的吞吐量最大化为目标,通过复杂的数学优化或者基于强化学习的方式完成控制。而针对无线网络中的分布式推理,功率控制的目标是保证推理结果的鲁棒性以及即时性。因此,本实施例通过制定全新的功率调整标准和计算方式,实现了快速高效地功率控制,降低了实现准确、鲁棒推理的延时,避免了资源浪费。
根据本申请实施例提供的一种通信方法,以满足分布式推理的鲁棒性为目标通过指示不满足通信需求的邻居节点调整发射功率,提高了分布式推理的鲁棒性。
如图15所示,为本申请实施例提供的又一种通信方法的流程示意图,应用于中断系统的功率控制场景。该方法可以包括以下步骤:
S1501.目标节点v向邻居节点u1、邻居节点u2发送初次传输请求。
该步骤的具体实现可参考上述实施例中的步骤S1001。
S1502.邻居节点u1向目标节点v发送第一数据x 1,以及邻居节点u2向目标节点v发送第一数据x 2
该步骤的具体实现可参考上述实施例中的步骤S1002。
S1503.目标节点v接收到邻居节点u1发送的第一数据x 1以及邻居节点u2发送的第一数据x 2后,用本地存储的机器学习模型进行推理,得到第一推理结果
Figure PCTCN2022125651-appb-000165
并计算鲁棒性。
该推理及计算过程可参考上述实施例中的步骤S804。
S1504.当
Figure PCTCN2022125651-appb-000166
小于设定推理偏差D max时,输出第一推理结果
Figure PCTCN2022125651-appb-000167
在本轮推理过程中不进行后续的发射功率调整、重传、更新操作;当
Figure PCTCN2022125651-appb-000168
大于设定推理偏差D max时,目标节点v判断接收信号是否发生中断。
在另外的实施例中,也可以是当
Figure PCTCN2022125651-appb-000169
小于设定推理偏差D max时,输出第一推理结果
Figure PCTCN2022125651-appb-000170
在本轮推理过程中不进行后续的发射功率调整、重传、更新操作;当
Figure PCTCN2022125651-appb-000171
大于或等于设定推理偏差D max时,目标节点v判断接收信号是否发生中断。
S1505.目标节点v确定邻居节点u1发生中断,邻居节点u2未发生中断。估计与邻居节 点u1之间的信道以及邻居节点u1的传输速率,计算建议的第一发射功率
Figure PCTCN2022125651-appb-000172
在其它条件不变的情况下,第一发射功率越大,传输速率越快;反之,第一发射功率越小,传输速率越慢。
S1506.目标节点v向邻居节点u1发送LCI,相应的,邻居节点u1接收目标节点v发送的LCI。
当需要指示邻居节点u1进行功率调整时,目标节点v向邻居节点u1发送LCI,该LCI包括建议的第一发射功率和/或下次数据传输所使用的传输资源。
邻居节点u1接收目标节点v的LCI。
此外,系统中可能存在多个目标节点同步进行标签推理,因此,邻居节点u1可能会收到多个邻居节点的LCI,该多个邻居节点的LCI分别包括多个邻居节点建议的发射功率
Figure PCTCN2022125651-appb-000173
Figure PCTCN2022125651-appb-000174
等等。
邻居节点u1接收到目标节点v发送的第一发射功率
Figure PCTCN2022125651-appb-000175
和/或其它邻居节点建议的发射功率后,此时,邻居节点u1有两种调整方案,分别为S1507和S1507’:
S1507.邻居节点u1将发射功率调整至
Figure PCTCN2022125651-appb-000176
其中
Figure PCTCN2022125651-appb-000177
是邻居节点u1的最大发射功率,以及广播其第一数据x 1至所有邻居节点。邻居节点u1综合考虑了接收到的一个或多个邻居节点建议的发射功率,调整了发射功率,提高了通信的可靠性,保证了目标节点v的推理性能。
S1507’.邻居节点u1将发射功率调整至
Figure PCTCN2022125651-appb-000178
以及单播其第一数据x 1至目标节点v。
类似地,针对其他邻居节点,邻居节点u1会分别根据其要求调整功率然后将其第一数据或者编码后的第一数据单播给相应的邻居节点。
邻居节点u1针对每个目标节点建议的发射功率进行发射功率调整,可以有针对性地进行发射功率调整,避免了能量的浪费。
S1508.目标节点v采用接收到的重传的第一数据x 1更新邻居节点u1的第一数据。
该步骤的具体实现可参考上述实施例中的步骤S1009。上述过程将重复至达到鲁棒的推理结果,即
Figure PCTCN2022125651-appb-000179
小于设定推理偏差D max
本实施例提出的功率调控机制,制定了全新的功率调整标准和计算方式,避免了高复杂度的数学优化过程,实现了通过高效的功率调整保证分布式推理鲁棒性的目标。现有的功率控制机制通常以系统的吞吐量最大化为目标,通过复杂的数学优化或者基于强化学习的方式完成控制。而针对无线网络中的分布式推理,功率控制的目标是保证推理结果的鲁棒性以及即时性。因此,本实施例通过制定全新的功率调整标准和计算方式,实现了快速高效地功率控制,降低了实现准确、鲁棒推理的延时,避免了资源浪费。
根据本申请实施例提供的一种通信方法,无线传输差错时,指示不满足通信需求的邻居节点调整发射功率,提高了分布式推理的鲁棒性。
如图16所示,为本申请实施例提供的又一种通信方法的流程示意图,应用于非中断系统的MCS调整场景。该方法可以包括以下步骤:
S1601.目标节点v向邻居节点u1、邻居节点u2发送初次传输请求。
该步骤的具体实现可参考上述实施例中的步骤S1001。
S1602.邻居节点u1向目标节点v发送第一数据x 1,以及邻居节点u2向目标节点v发送 第一数据x 2
该步骤的具体实现可参考上述实施例中的步骤S1002。
S1603.目标节点v接收到邻居节点u1发送的第一数据x 1以及邻居节点u2发送的第一数据x 2后,用本地存储的机器学习模型进行推理,得到第一推理结果
Figure PCTCN2022125651-appb-000180
并计算鲁棒概率
Figure PCTCN2022125651-appb-000181
该推理及计算过程可参考上述实施例中的步骤S804。
S1604.当鲁棒概率
Figure PCTCN2022125651-appb-000182
大于或等于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000183
时,输出第一推理结果
Figure PCTCN2022125651-appb-000184
在本轮推理过程中不进行后续的MCS等级调整、重传、更新操作;当鲁棒概率
Figure PCTCN2022125651-appb-000185
小于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000186
时,目标节点v估计与邻居节点u1之间的BER,与目标误比特率
Figure PCTCN2022125651-appb-000187
比较。
目标
Figure PCTCN2022125651-appb-000188
的计算过程可参考上述实施例中的步骤S804。
在另外的实施例中,也可以是当鲁棒概率
Figure PCTCN2022125651-appb-000189
大于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000190
时,输出第一推理结果
Figure PCTCN2022125651-appb-000191
在本轮推理过程中不进行后续的MCS等级调整、重传、更新操作;当鲁棒概率
Figure PCTCN2022125651-appb-000192
小于或等于设定目标鲁棒概率
Figure PCTCN2022125651-appb-000193
时,目标节点v计算目标误比特率
Figure PCTCN2022125651-appb-000194
S1605.目标节点v确定邻居节点u1的误比特率
Figure PCTCN2022125651-appb-000195
邻居节点u2的误比特率
Figure PCTCN2022125651-appb-000196
目标节点v估计与邻居节点u1之间的信道信息,并确定建议的第一MCS等级。
具体地,目标终端v根据与邻居节点u1之间的信道信息,可以通过给定的链路自适应算法获得第一MCS等级。所述给定的链路自适应算法可以包括:基于目标终端v根据与邻居节点u1之间的信道信息,计算目标终端v和邻居节点u1之间的信噪比信息,通过信噪比信息与MCS等级的映射关系,获得对应的第一MCS等级。其中,信噪比信息与MCS等级的映射关系是预先确定的。
S1606.目标节点v向邻居节点u1发送LCI,相应的,邻居节点u1接收目标节点v发送的LCI。
当需要指示邻居节点u1进行MCS调整时,目标节点v向邻居节点u1发送LCI,该LCI包括建议的第一MCS等级和/或下次数据传输所使用的传输资源。
邻居节点u1接收目标节点v的LCI。
此外,系统中可能存在多个目标节点同步进行标签推理,因此,邻居节点u1可能会收到多个邻居节点的LCI,该多个邻居节点的LCI分别包括多个邻居节点建议的MCS等级和/或下次数据传输所使用的传输资源。
邻居节点u1根据接收到的第一MCS等级和/或其它邻居节点建议的MCS等级,调整其MCS等级。
邻居节点u1接收到目标节点v发送的第一MCS等级和/或其它邻居节点建议的MCS等级后,此时,邻居节点u1有两种调整方案,分别为S1607和S1607’:
S1607.邻居节点u1采用接收到的一个或多个邻居节点建议的MCS等级中最低的MCS等级,及广播其采用该最低的MCS等级重新编码后的第一数据x 1至该一个或多个邻居节点。此外,邻居节点u1还广播调整后的MCS等级。邻居节点u1综合考虑了接收到的一个或多个邻居节点建议的MCS等级,调整到了最低的MCS等级,提高了通信的可靠性,保证了目标节点v的推理性能。
S1607’.邻居节点u1针对给其发送MCS等级建议的邻居节点,邻居节点u1均直接采用其建议的MCS等级。邻居节点u1单播其采用各个建议的MCS等级重新编码后的第一数据x 1至各个邻居节点。此外,邻居节点u1还单播调整后的MCS等级。邻居节点u1针对每个目标 节点建议的MCS等级进行MCS等级调整,可以有针对性地进行MCS等级调整,避免了资源的浪费。
S1608.目标节点v采用接收到的重传的第一数据x 1更新邻居节点u1的第一数据。
该步骤的具体实现可参考上述实施例中的步骤S1009。上述过程将重复至达到目标鲁棒概率。
本实施例提出的调制编码方案调整机制,制定了合理的调整标准和停止机制,实现了通过动态调整调制编码方案来保证分布式推理结果的鲁棒性的目标。现有的重传机制将通信系统的吞吐作为调整调制编码方案的性能指标,而在分布式推理中,系统的任务是保证分布式推理结果的鲁棒性,对不可靠传输有一定的容忍度。因此,本实施例通过制定全新的调整标准和停止机制,实现了通信资源和通信能力的合理利用。
根据本申请实施例提供的一种通信方法,无线传输差错时,指示不满足通信需求的邻居节点调整MCS等级重传第一数据,提高了分布式推理的鲁棒性。
如图17所示,为本申请实施例提供的又一种通信方法的流程示意图,应用于中断系统的MCS调整场景。该方法可以包括以下步骤:
S1701.目标节点v向邻居节点u1、邻居节点u2发送初次传输请求。
该步骤的具体实现可参考上述实施例中的步骤S1001。
S1702.邻居节点u1向目标节点v发送第一数据x 1,以及邻居节点u2向目标节点v发送第一数据x 2
该步骤的具体实现可参考上述实施例中的步骤S1002。
S1703.目标节点v接收到邻居节点u1发送的第一数据x 1以及邻居节点u2发送的第一数据x 2后,用本地存储的机器学习模型进行推理,得到第一推理结果
Figure PCTCN2022125651-appb-000197
并计算鲁棒性。
该推理及计算过程可参考上述实施例中的步骤S804。
S1704.当
Figure PCTCN2022125651-appb-000198
小于设定推理偏差D max时,输出第一推理结果
Figure PCTCN2022125651-appb-000199
在本轮推理过程中不进行后续的MCS等级调整、重传、更新操作;当
Figure PCTCN2022125651-appb-000200
大于设定推理偏差D max时,目标节点v判断接收信号是否发生中断。
在另外的实施例中,也可以是当
Figure PCTCN2022125651-appb-000201
小于设定推理偏差D max时,输出第一推理结果
Figure PCTCN2022125651-appb-000202
在本轮推理过程中不进行后续的MCS等级调整、重传、更新操作;当
Figure PCTCN2022125651-appb-000203
大于或等于设定推理偏差D max时,目标节点v判断接收信号是否发生中断。
S1705.目标节点v确定邻居节点u1发生中断,邻居节点u2未发生中断。估计与邻居节点u1之间的信道信息,确定建议的第一MCS等级。
具体地,目标终端v根据与邻居节点u1之间的信道信息和传输速率信息,可以通过给定的链路自适应算法获得第一MCS等级。所述给定的链路自适应算法可以包括:基于目标终端v根据与邻居节点u1之间的信道信息,计算目标终端v和邻居节点u1之间的信噪比信息,通过信噪比信息与MCS等级的映射关系,获得对应的第一MCS等级。其中,信噪比信息与MCS等级的映射关系是预先确定的。
S1706.目标节点v向邻居节点u1发送LCI,相应的,邻居节点u1接收目标节点v发送的LCI。
当需要指示邻居节点u1进行MCS调整时,目标节点v向邻居节点u1发送LCI,该LCI包括建议的第一MCS等级和/或下次数据传输所使用的传输资源。
邻居节点u1接收目标节点v的LCI。
此外,系统中可能存在多个目标节点同步进行标签推理,因此,邻居节点u1可能会收到多个邻居节点的LCI,该多个邻居节点的LCI分别包括多个邻居节点建议的MCS等级和/或下次数据传输所使用的传输资源。
邻居节点u1根据接收到的第一MCS等级和/或其它邻居节点建议的MCS等级,调整其MCS等级。
邻居节点u1接收到目标节点v发送的第一MCS等级和/或其它邻居节点建议的MCS等级后,此时,邻居节点u1有两种调整方案,分别为S1707和S1707’:
S1707.邻居节点u1采用接收到的一个或多个邻居节点建议的MCS等级中最低的MCS等级,以及广播其采用该最低的MCS等级重新编码后的第一数据x 1至该一个或多个邻居节点。此外,邻居节点u1还广播调整后的MCS等级。邻居节点u1综合考虑了接收到的一个或多个邻居节点建议的MCS等级,调整到了最低的MCS等级,提高了通信的可靠性,保证了目标节点v的推理性能。
S1707’.邻居节点u1针对给其发送MCS等级建议的邻居节点,邻居节点u1均直接采用其建议的MCS等级。邻居节点u1单播其采用各个建议的MCS等级重新编码后的第一数据x 1至各个邻居节点。此外,邻居节点u1还单播调整后的MCS等级。邻居节点u1针对每个目标节点建议的MCS等级进行MCS等级调整,可以有针对性地进行MCS等级调整,避免了资源的浪费。
S1708.目标节点v采用接收到的重传的第一数据x 1更新邻居节点u1的第一数据。
该步骤的具体实现可参考上述实施例中的步骤S1009。上述过程将重复至达到鲁棒的推理结果,即
Figure PCTCN2022125651-appb-000204
小于设定推理偏差D max
本实施例提出的调制编码方案调整机制,制定了合理的调整标准和停止机制,实现了通过动态调整调制编码方案来保证分布式推理结果的鲁棒性的目标。现有的重传机制将通信系统的吞吐作为调整调制编码方案的性能指标,而在分布式推理中,系统的任务是保证分布式推理结果的鲁棒性,对不可靠传输有一定的容忍度。因此,本实施例通过制定全新的调整标准和停止机制,实现了通信资源和通信能力的合理利用。
根据本申请实施例提供的一种通信方法,无线传输差错时,指示不满足通信需求的邻居节点调整MCS等级重传第一数据,提高了分布式推理的鲁棒性。
本申请所提出的基于推理结果鲁棒性调整通信机制的上述方案均以分布式推理结果的鲁棒性为目标,复杂度低,通信资源利用合理,系统延时低。
本申请还对上述有益效果进行了仿真验证。考虑如下仿真场景:边长为2,000m的方形区域内随机分布N个终端设备,如果两个终端之间的距离小于500m,则两者可以交换信息。传输损耗模型为128.1+37.6log(d),其中d为终端设备之间的距离,单位为千米。小规模衰落设置为具有均匀方差的瑞利(Rayleigh)分布,带宽为10MHz。采用分布式学习系统进行分布式学习,每个终端设备对应了一个二元标签,{-1,1},即关注该网络中的二分类问题。每个终端设备的特征维度和分布式学习系统输出向量维度均设置为32,均服从高斯分布产生。
图18所示的是非中断通信系统在目标鲁棒概率
Figure PCTCN2022125651-appb-000205
时,采用本申请所提出的功率控制机制的性能。其中,左图为非中断通信系统有功率控制和无功率控制时的分类错误率,当有功率控制时分类错误率接近0%;右图为非中断通信系统达到鲁棒时需要的功率调整次数。 可见,本申请能通过少量次数的功率调整(如右图所示,最多3次),有效地降低推理结果的错误率(从12%左右降到约0%),高效地获得鲁棒的分布式推理结果,避免通信资源的浪费,降低系统的延时。
可以理解的是,为了实现上述实施例中的功能,第一分布式节点和第二分布式节点包括了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本申请中所公开的实施例描述的各示例的单元及方法步骤,本申请能够以硬件或硬件和计算机软件相结合的形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用场景和设计约束条件。
图19和图20为本申请实施例提供的可能的通信装置的结构示意图。这些通信装置可以用于实现上述方法实施例中第一分布式节点或第二分布式节点的功能,因此也能实现上述方法实施例所具备的有益效果。在本申请的实施例中,该通信装置可以是如图1所示的第一分布式节点101,也可以是如图1所示的第二分布式节点102中的一个,还可以是应用于第一分布式节点或第二分布式节点的模块(如芯片)。
如图19所示,通信装置1900包括收发单元191和处理单元192。通信装置1900用于实现上述图7~图17中所示的方法实施例中第一分布式节点或第二分布式节点的功能。
当通信装置1900用于实现图7~图17所示的方法实施例中第一分布式节点的功能时:所述收发单元191,用于向与所述通信装置相邻的至少一个所述第二分布式节点发送通信机制指示信息,所述通信机制指示信息是基于所述分布式学习系统的鲁棒性需求得到的;所述收发单元191,还用于接收所述至少一个第二分布式节点的至少一个第一数据,所述至少一个第一数据是由所述至少一个第二分布式节点基于所述通信机制指示信息传输的;处理单元192,用于基于所述通信装置的第二数据和所述至少一个第一数据使用分布式学习模型进行推理。
可选地,所述收发单元191,还用于向所述至少一个第二分布式节点发送第一指示信息;或所述收发单元191,还用于向中心节点发送所述第一指示信息,使得所述中心节点向所述至少一个第二分布式节点转发所述第一指示信息;其中,所述第一指示信息用于指示所述至少一个第二分布式节点向所述通信装置发送所述至少一个第一数据,所述第一指示信息包括以下至少一个信息:传输所述至少一个第一数据的资源调度信息,推理任务信息,请求数据量,或请求数据的种类。
可选地,所述收发单元191,还用于向所述至少一个第二分布式节点发送第二指示信息,所述第二指示信息用于指示所述分布式学习系统处于机器学习推理模式。
可选地,所述收发单元191,还用于接收所述至少一个第二分布式节点的至少一个第三数据;以及所述处理单元192,还用于基于所述第二数据和所述至少一个第三数据使用所述分布式学习模型进行推理,确定推理结果不鲁棒。
可选地,所述通信机制指示信息用于指示所述至少一个第二分布式节点传输所述至少一个第一数据,或所述通信机制指示信息用于指示所述至少一个第二分布式节点调整通信机制,并以调整后的通信机制传输所述至少一个第一数据,所述至少一个第一数据为所述至少一个第三数据的重传数据。
可选地,所述处理单元192用于执行以下任意一项:确定鲁棒概率小于设定目标鲁棒概率,其中,所述鲁棒概率是所述至少一个第一数据传输错误的比特数小于最大错误比特数量的概率,所述最大错误比特数量为满足所述分布式学习系统的鲁棒性需求时允许传输错误的比特的最大数量;或确定所述至少一个第二分布式节点的误比特率大于目标误比特率,所述目标误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或确定最大推 理偏差大于设定推理偏差,所述最大推理偏差为所有可能的推理偏差的最大值。
可选地,所述通信机制指示信息包括以下至少一项:通信质量需求;或重传指示信息;或通信机制的调整信息。
可选地,所述通信质量需求包括第一误比特率,其中,所述第一误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或所述重传指示信息包括数据接收失败指示和/或下次数据传输所使用的传输资源;或所述通信机制的调整信息包括建议的第一发射功率和/或下次数据传输所使用的传输资源,其中,所述第一发射功率与所述通信装置与所述至少一个第二分布式节点之间的第一信道状态和目标误比特率关联;或所述第一发射功率与所述通信装置与所述至少一个第二分布式节点之间的第二信道状态和所述至少一个第二分布式节点的第一传输速率关联;或所述通信机制的调整信息包括建议的第一调制编码模式等级和/或下次数据传输所使用的传输资源,所述第一调制编码模式等级与所述通信装置与所述至少一个第二分布式节点之间的第三信道状态和所述至少一个第二分布式节点的第二传输速率关联。
当通信装置1900用于实现图7~图17所示的方法实施例中第二分布式节点的功能时:所述收发单元191,用于接收来自至少一个所述第一分布式节点的通信机制指示信息,所述通信机制指示信息是基于所述分布式学习系统的鲁棒性需求得到的;以及所述收发单元191,还用于基于所述通信机制指示信息向至少一个第一分布式节点发送第一数据。
可选地,所述收发单元191,还用于接收来自所述至少一个第一分布式节点或所述中心节点的第一指示信息,所述第一指示信息用于指示所述通信装置向所述至少一个第一分布式节点发送所述第一数据;其中,所述第一指示信息包括以下至少一个信息:传输所述第一数据的资源调度信息,推理任务信息,请求数据量,或请求数据的种类。
可选地,所述收发单元191,还用于接收来自所述至少一个第一分布式节点或中心节点的第二指示信息,所述第二指示信息用于指示所述分布式学习系统处于机器学习推理模式。
可选地,所述通信机制指示信息用于指示所述通信装置传输所述第一数据,或所述通信机制指示信息用于指示所述通信装置调整通信机制,并以调整后的通信机制传输所述第一数据,所述第一数据为重传的数据。
可选地,所述通信机制指示信息包括以下至少一项:通信质量需求;或重传指示信息;或通信机制的调整信息。
可选地,所述通信质量需求包括第一误比特率,其中,所述第一误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或所述重传指示信息包括数据接收失败指示和/或下次数据传输所使用的传输资源;或所述通信机制的调整信息包括建议的第一发射功率和/或下次数据传输所使用的传输资源,其中,所述第一发射功率与所述通信装置与所述至少一个第一分布式节点之间的第一信道状态和目标误比特率关联,所述目标误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或所述第一发射功率与所述通信装置与所述至少一个第一分布式节点之间的第二信道状态和所述通信装置的第一传输速率关联;或所述通信机制的调整信息包括建议的第一调制编码模式等级和/或下次数据传输所使用的传输资源,所述第一调制编码模式等级与所述通信装置与所述至少一个第一分布式节点之间的第三信道状态和所述通信装置的第二传输速率关联。
可选地,所述处理单元192,用于确定第二发射功率;以及所述收发单元191,还用于以所述第二发射功率向所述至少一个第一分布式节点发送所述第一数据;其中,所述第二发射功率为所述通信装置允许的第一最大发射功率与所述第一发射功率中的较小值;或所述第 二发射功率为所述通信装置允许的第一最大发射功率与第二最大发射功率中的较小值,其中,所述第二最大发射功率为所述通信装置从多个所述至少一个第一分布式节点接收到的多个所述第一发射功率中的最大值。
可选地,所述处理单元192,用于确定第二调制编码模式;以及所述收发单元191,还用于以所述第二调制编码模式向所述至少一个第一分布式节点发送所述第一数据;其中,所述第二调制编码模式与所述第一调制编码模式等级相同,或所述第二调制编码模式为所述通信装置从与所述通信装置相邻的所述至少一个第一分布式节点接收到的多个所述第一调制编码模式等级中的最低等级。
有关上述收发单元191和处理单元192更详细的描述可以直接参考图7~图17所示的方法实施例中相关描述直接得到,这里不加赘述。
如图20所示,通信装置2000包括处理器201和接口电路202。处理器201和接口电路202之间相互耦合。可以理解的是,接口电路202可以为收发器或输入输出接口。可选的,通信装置2000还可以包括存储器203,用于存储处理器201执行的指令或存储处理器201运行指令所需要的输入数据或存储处理器201运行指令后产生的数据。
当通信装置2000用于实现图7~图17所示的方法时,处理器201用于实现上述处理单元192的功能,接口电路202用于实现上述收发单元191的功能。
当上述通信装置为应用于第二分布式节点的芯片时,该芯片实现上述方法实施例中第二分布式节点的功能。该芯片从第二分布式节点中的其它模块(如射频模块或天线)接收信息,该信息是第一分布式节点发送给第二分布式节点的;或者,该第二分布式节点芯片向第二分布式节点中的其它模块(如射频模块或天线)发送信息,该信息是第二分布式节点发送给第一分布式节点的。
当上述通信装置为应用于第一分布式节点的芯片时,该芯片实现上述方法实施例中第一分布式节点的功能。该芯片从第一分布式节点中的其它模块(如射频模块或天线)接收信息,该信息是第二分布式节点发送给第一分布式节点的;或者,该第一分布式节点芯片向第一分布式节点中的其它模块(如射频模块或天线)发送信息,该信息是第一分布式节点发送给第二分布式节点的。
可以理解的是,本申请的实施例中的处理器可以是中央处理单元(central processing unit,CPU),还可以是其它通用处理器、数字信号处理器(digital signal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(field programmable gate array,FPGA)或者其它逻辑电路、可编程逻辑器件、晶体管逻辑器件,硬件部件或者其任意组合。通用处理器可以是微处理器,也可以是任何常规的处理器。
本申请的实施例中的方法步骤可以通过硬件的方式来实现,也可以由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于随机存取存储器、闪存、只读存储器、可编程只读存储器、可擦除可编程只读存储器、电可擦除可编程只读存储器、寄存器、硬盘、移动硬盘、只读光盘存储器(compact disc read-only memory,CD-ROM)或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于第一分布式节点或第二分布式节点中。当然,处理器和存储介质也可以作为分立组件存在于第一分布式节点或第二分布式节点中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当 使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机程序或指令。在计算机上加载和执行所述计算机程序或指令时,全部或部分地执行本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、第一分布式节点、用户设备或者其它可编程装置。所述计算机程序或指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机程序或指令可以从一个网站站点、计算机、服务器或数据中心通过有线或无线方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是集成一个或多个可用介质的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,例如,软盘、硬盘、磁带;也可以是光介质,例如,数字视频光盘;还可以是半导体介质,例如,固态硬盘。
本申请实施例还提供了一种分布式学习系统,该分布式学习系统包括至少两个分布式节点,至少两个分布式节点包括上述第一分布式节点、以及与第一分布式节点相邻的至少一个第二分布式节点。
在本申请的各个实施例中,如果没有特殊说明以及逻辑冲突,不同的实施例之间的术语和/或描述具有一致性、且可以相互引用,不同的实施例中的技术特征根据其内在的逻辑关系可以组合形成新的实施例。
本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。在本申请的文字描述中,字符“/”,一般表示前后关联对象是一种“或”的关系;在本申请的公式中,字符“/”,表示前后关联对象是一种“相除”的关系。本申请中“第一”、“第二”仅为示例,“第一”、“第二”的数量可以是一个,也可以包括更多的数量。“第一”、“第二”仅用于区分同一类对象,第一对象和第二对象可以是同一个对象,也可以是不同的对象。
需要说明的是,本申请实施例中的术语“系统”和“网络”可被互换使用。“多个”是指两个或两个以上,鉴于此,本申请实施例中也可以将“多个”理解为“至少两个”。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,字符“/”,如无特殊说明,一般表示前后关联对象是一种“或”的关系。
可以理解的是,在本申请的实施例中涉及的各种数字编号仅为描述方便进行的区分,并不用来限制本申请的实施例的范围。上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定。

Claims (36)

  1. 一种通信方法,应用于分布式学习系统,所述分布式学习系统包括至少两个分布式节点,所述至少两个分布式节点包括第一分布式节点和至少一个第二分布式节点,其特征在于,所述方法包括:
    所述第一分布式节点向与所述第一分布式节点相邻的至少一个所述第二分布式节点发送通信机制指示信息,所述通信机制指示信息是基于所述分布式学习系统的鲁棒性需求得到的;
    所述第一分布式节点接收所述至少一个第二分布式节点的至少一个第一数据,所述至少一个第一数据是由所述至少一个第二分布式节点基于所述通信机制指示信息传输的;
    所述第一分布式节点基于所述第一分布式节点的第二数据和所述至少一个第一数据使用分布式学习模型进行推理。
  2. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
    所述第一分布式节点向所述至少一个第二分布式节点发送第一指示信息,或,所述第一分布式节点向中心节点发送所述第一指示信息,使得所述中心节点向所述至少一个第二分布式节点转发所述第一指示信息;
    所述第一指示信息用于指示所述至少一个第二分布式节点向所述第一分布式节点发送所述至少一个第一数据;
    其中,所述第一指示信息包括以下至少一个信息:传输所述至少一个第一数据的资源调度信息,推理任务信息,请求数据量,或请求数据的种类。
  3. 根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
    所述第一分布式节点向所述至少一个第二分布式节点发送第二指示信息,所述第二指示信息用于指示所述分布式学习系统处于机器学习推理模式。
  4. 根据权利要求1-3中任一项所述的方法,其特征在于,在所述第一分布式节点向所述至少一个第二分布式节点发送所述通信机制指示信息之前,所述方法还包括:
    所述第一分布式节点接收所述至少一个第二分布式节点的至少一个第三数据;
    所述第一分布式节点基于所述第二数据和所述至少一个第三数据使用所述分布式学习模型进行推理,确定推理结果不鲁棒。
  5. 根据权利要求4所述的方法,其特征在于,所述通信机制指示信息用于指示所述至少一个第二分布式节点传输所述至少一个第一数据,或所述通信机制指示信息用于指示所述至少一个第二分布式节点调整通信机制,并以调整后的通信机制传输所述至少一个第一数据,所述至少一个第一数据为所述至少一个第三数据的重传数据。
  6. 根据权利要求4或5所述的方法,其特征在于,所述第一分布式节点确定推理结果不鲁棒,包括以下任意一项:
    所述第一分布式节点确定鲁棒概率小于设定目标鲁棒概率,其中,所述鲁棒概率是所述至少一个第一数据传输错误的比特数小于最大错误比特数量的概率,所述最大错误比特数量为满足所述分布式学习系统的鲁棒性需求时允许传输错误的比特的最大数量;或
    所述第一分布式节点确定所述至少一个第二分布式节点的误比特率大于目标误比特率,所述目标误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或
    所述第一分布式节点确定最大推理偏差大于设定推理偏差,所述最大推理偏差为所有可能的推理偏差的最大值。
  7. 根据权利要求1-6中任一项所述的方法,其特征在于,所述通信机制指示信息包括以下至少一项:
    通信质量需求;或
    重传指示信息;或
    通信机制的调整信息。
  8. 根据权利要求7所述的方法,其特征在于,所述通信质量需求包括第一误比特率,其中,所述第一误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或
    所述重传指示信息包括数据接收失败指示和/或下次数据传输所使用的传输资源;或
    所述通信机制的调整信息包括建议的第一发射功率和/或下次数据传输所使用的传输资源,其中,所述第一发射功率与所述第一分布式节点与所述至少一个第二分布式节点之间的第一信道状态和目标误比特率关联;或所述第一发射功率与所述第一分布式节点与所述至少一个第二分布式节点之间的第二信道状态和所述至少一个第二分布式节点的第一传输速率关联;或
    所述通信机制的调整信息包括建议的第一调制编码模式等级和/或下次数据传输所使用的传输资源,所述第一调制编码模式等级与所述第一分布式节点与所述至少一个第二分布式节点之间的第三信道状态和所述至少一个第二分布式节点的第二传输速率关联。
  9. 一种通信方法,应用于分布式学习系统,所述分布式学习系统包括至少两个分布式节点,所述至少两个分布式节点包括至少一个第一分布式节点和第二分布式节点,其特征在于,所述方法包括:
    所述第二分布式节点接收来自至少一个所述第一分布式节点的通信机制指示信息,所述通信机制指示信息是基于所述分布式学习系统的鲁棒性需求得到的;
    所述第二分布式节点基于所述通信机制指示信息向至少一个第一分布式节点发送第一数据。
  10. 根据权利要求9所述的方法,其特征在于,所述方法还包括:
    所述第二分布式节点接收来自所述至少一个第一分布式节点或所述中心节点的第一指示信息,所述第一指示信息用于指示所述第二分布式节点向所述至少一个第一分布式节点发送所述第一数据;
    其中,所述第一指示信息包括以下至少一个信息:传输所述第一数据的资源调度信息,推理任务信息,请求数据量,或请求数据的种类。
  11. 根据权利要求9或10所述的方法,其特征在于,所述方法还包括:所述第二分布式节点接收来自所述至少一个第一分布式节点或中心节点的第二指示信息,所述第二指示信息用于指示所述分布式学习系统处于机器学习推理模式。
  12. 根据权利要求9或10所述的方法,其特征在于,所述通信机制指示信息用于指示所述第二分布式节点传输所述第一数据,或所述通信机制指示信息用于指示所述第二分布式节点调整通信机制,并以调整后的通信机制传输所述第一数据,所述第一数据为重传的数据。
  13. 根据权利要求9-12中任一项所述的方法,其特征在于,所述通信机制指示信息包括以下至少一项:
    通信质量需求;或
    重传指示信息;或
    通信机制的调整信息。
  14. 根据权利要求13所述的方法,其特征在于,
    所述通信质量需求包括第一误比特率,其中,所述第一误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或所述重传指示信息包括数据接收失败指示和/或下次数据传输所使用的传输资源;或
    所述通信机制的调整信息包括建议的第一发射功率和/或下次数据传输所使用的传输资源,其中,所述第一发射功率与所述第二分布式节点与所述至少一个第一分布式节点之间的第一信道状态和目标误比特率关联,所述目标误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或所述第一发射功率与所述第二分布式节点与所述至少一个第一分布式节点之间的第二信道状态和所述第二分布式节点的第一传输速率关联;或
    所述通信机制的调整信息包括建议的第一调制编码模式等级和/或下次数据传输所使用的传输资源,所述第一调制编码模式等级与所述第二分布式节点与所述至少一个第一分布式节点之间的第三信道状态和所述第二分布式节点的第二传输速率关联。
  15. 根据权利要求14所述的方法,其特征在于,所述第二分布式节点基于所述通信机制指示信息向所述至少一个第一分布式节点发送第一数据,包括:
    所述第二分布式节点确定第二发射功率;
    所述第二分布式节点以所述第二发射功率向所述至少一个第一分布式节点发送所述第一数据;
    其中,所述第二发射功率为所述第二分布式节点允许的第一最大发射功率与所述第一发射功率中的较小值;或
    所述第二发射功率为所述第二分布式节点允许的第一最大发射功率与第二最大发射功率中的较小值,其中,所述第二最大发射功率为所述第二分布式节点从多个所述至少一个第一分布式节点接收到的多个所述第一发射功率中的最大值。
  16. 根据权利要求14所述的方法,其特征在于,所述第二分布式节点基于所述通信机制指示信息向所述至少一个第一分布式节点发送第一数据,包括:
    所述第二分布式节点确定第二调制编码模式;
    所述第二分布式节点以所述第二调制编码模式向所述至少一个第一分布式节点发送所述第一数据;
    其中,所述第二调制编码模式与所述第一调制编码模式等级相同,或所述第二调制编码 模式为所述第二分布式节点从与所述第二分布式节点相邻的所述至少一个第一分布式节点接收到的多个所述第一调制编码模式等级中的最低等级。
  17. 一种通信装置,应用于分布式学习系统,所述分布式学习系统包括至少两个分布式节点,所述至少两个分布式节点包括所述通信装置和至少一个第二分布式节点,其特征在于,所述装置包括:
    收发单元,用于向与所述通信装置相邻的至少一个所述第二分布式节点发送通信机制指示信息,所述通信机制指示信息是基于所述分布式学习系统的鲁棒性需求得到的;
    所述收发单元,还用于接收所述至少一个第二分布式节点的至少一个第一数据,所述至少一个第一数据是由所述至少一个第二分布式节点基于所述通信机制指示信息传输的;
    处理单元,用于基于所述通信装置的第二数据和所述至少一个第一数据使用分布式学习模型进行推理。
  18. 根据权利要求17所述的装置,其特征在于:
    所述收发单元,还用于向所述至少一个第二分布式节点发送第一指示信息;或,
    所述收发单元,还用于向中心节点发送所述第一指示信息,使得所述中心节点向所述至少一个第二分布式节点转发所述第一指示信息;
    所述第一指示信息用于指示所述至少一个第二分布式节点向所述通信装置发送所述至少一个第一数据;
    其中,所述第一指示信息包括以下至少一个信息:传输所述至少一个第一数据的资源调度信息,推理任务信息,请求数据量,或请求数据的种类。
  19. 根据权利要求17或18所述的装置,其特征在于,所述收发单元,还用于向所述至少一个第二分布式节点发送第二指示信息,所述第二指示信息用于指示所述分布式学习系统处于机器学习推理模式。
  20. 根据权利要求17-19中任一项所述的装置,其特征在于:
    所述收发单元,还用于接收所述至少一个第二分布式节点的至少一个第三数据;
    所述处理单元,还用于基于所述第二数据和所述至少一个第三数据使用所述分布式学习模型进行推理,确定推理结果不鲁棒。
  21. 根据权利要求20所述的装置,其特征在于,所述通信机制指示信息用于指示所述至少一个第二分布式节点传输所述至少一个第一数据,或所述通信机制指示信息用于指示所述至少一个第二分布式节点调整通信机制,并以调整后的通信机制传输所述至少一个第一数据,所述至少一个第一数据为所述至少一个第三数据的重传数据。
  22. 根据权利要求20或21所述的装置,其特征在于,所述处理单元用于执行以下任意一项:
    确定鲁棒概率小于设定目标鲁棒概率,其中,所述鲁棒概率是所述至少一个第一数据传输错误的比特数小于最大错误比特数量的概率,所述最大错误比特数量为满足所述分布式学习系统的鲁棒性需求时允许传输错误的比特的最大数量;或
    确定所述至少一个第二分布式节点的误比特率大于目标误比特率,所述目标误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或
    确定最大推理偏差大于设定推理偏差,所述最大推理偏差为所有可能的推理偏差的最大值。
  23. 根据权利要求17-22中任一项所述的装置,其特征在于,所述通信机制指示信息包括以下至少一项:
    通信质量需求;或
    重传指示信息;或
    通信机制的调整信息。
  24. 根据权利要求23所述的装置,其特征在于,所述通信质量需求包括第一误比特率,其中,所述第一误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或
    所述重传指示信息包括数据接收失败指示和/或下次数据传输所使用的传输资源;或
    所述通信机制的调整信息包括建议的第一发射功率和/或下次数据传输所使用的传输资源,其中,所述第一发射功率与所述通信装置与所述至少一个第二分布式节点之间的第一信道状态和目标误比特率关联;或所述第一发射功率与所述通信装置与所述至少一个第二分布式节点之间的第二信道状态和所述至少一个第二分布式节点的第一传输速率关联;或
    所述通信机制的调整信息包括建议的第一调制编码模式等级和/或下次数据传输所使用的传输资源,所述第一调制编码模式等级与所述通信装置与所述至少一个第二分布式节点之间的第三信道状态和所述至少一个第二分布式节点的第二传输速率关联。
  25. 一种通信装置,应用于分布式学习系统,所述分布式学习系统包括至少两个分布式节点,所述至少两个分布式节点包括至少一个第一分布式节点和所述通信装置,其特征在于,所述装置包括:
    收发单元,用于接收来自至少一个所述第一分布式节点的通信机制指示信息,所述通信机制指示信息是基于所述分布式学习系统的鲁棒性需求得到的;
    所述收发单元,还用于基于所述通信机制指示信息向至少一个第一分布式节点发送第一数据。
  26. 根据权利要求25所述的装置,其特征在于,所述收发单元,还用于接收来自所述至少一个第一分布式节点或所述中心节点的第一指示信息,所述第一指示信息用于指示所述通信装置向所述至少一个第一分布式节点发送所述第一数据;
    其中,所述第一指示信息包括以下至少一个信息:传输所述第一数据的资源调度信息,推理任务信息,请求数据量,或请求数据的种类。
  27. 根据权利要求25或26所述的装置,其特征在于,所述收发单元,还用于接收来自所述至少一个第一分布式节点或中心节点的第二指示信息,所述第二指示信息用于指示所述分布式学习系统处于机器学习推理模式。
  28. 根据权利要求25-27中任一项所述的装置,其特征在于,所述通信机制指示信息用于 指示所述通信装置传输所述第一数据,或所述通信机制指示信息用于指示所述通信装置调整通信机制,并以调整后的通信机制传输所述第一数据,所述第一数据为重传的数据。
  29. 根据权利要求25-28中任一项所述的装置,其特征在于,所述通信机制指示信息包括以下至少一项:
    通信质量需求;或
    重传指示信息;或
    通信机制的调整信息。
  30. 根据权利要求29所述的装置,其特征在于,
    所述通信质量需求包括第一误比特率,其中,所述第一误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或所述重传指示信息包括数据接收失败指示和/或下次数据传输所使用的传输资源;或
    所述通信机制的调整信息包括建议的第一发射功率和/或下次数据传输所使用的传输资源,其中,所述第一发射功率与所述通信装置与所述至少一个第一分布式节点之间的第一信道状态和目标误比特率关联,所述目标误比特率为满足所述分布式学习系统的鲁棒性需求的最大允许误比特率;或所述第一发射功率与所述通信装置与所述至少一个第一分布式节点之间的第二信道状态和所述通信装置的第一传输速率关联;或
    所述通信机制的调整信息包括建议的第一调制编码模式等级和/或下次数据传输所使用的传输资源,所述第一调制编码模式等级与所述通信装置与所述至少一个第一分布式节点之间的第三信道状态和所述通信装置的第二传输速率关联。
  31. 根据权利要求30所述的装置,其特征在于,所述装置还包括:
    处理单元,用于确定第二发射功率;
    所述收发单元,还用于以所述第二发射功率向所述至少一个第一分布式节点发送所述第一数据;
    其中,所述第二发射功率为所述通信装置允许的第一最大发射功率与所述第一发射功率中的较小值;或
    所述第二发射功率为所述通信装置允许的第一最大发射功率与第二最大发射功率中的较小值,其中,所述第二最大发射功率为所述通信装置从多个所述至少一个第一分布式节点接收到的多个所述第一发射功率中的最大值。
  32. 根据权利要求30所述的装置,其特征在于,所述装置还包括:
    处理单元,用于确定第二调制编码模式;
    所述收发单元,还用于以所述第二调制编码模式向所述至少一个第一分布式节点发送所述第一数据;
    其中,所述第二调制编码模式与所述第一调制编码模式等级相同,或所述第二调制编码模式为所述通信装置从与所述通信装置相邻的所述至少一个第一分布式节点接收到的多个所述第一调制编码模式等级中的最低等级。
  33. 一种通信装置,其特征在于,包括处理器,所述处理器与存储器耦合,所述处理器用 于读取所述存储器中的指令,以实现如权利要求1-8中任一项所述的方法,或者,实现如权利要求9-16中任一项所述的方法。
  34. 一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一项所述的方法、实现如权利要求9-16中任一项所述的方法。
  35. 一种计算机程序产品,用于当在计算设备上执行时,执行如权利要求1-8中任一项所述的方法、执行如权利要求9-16中任一项所述的方法。
  36. 一种通信系统,其特征在于,包括如权利要求17-24中任一项所述的通信装置,以及如权利要求25-32中任一项所述的通信装置。
PCT/CN2022/125651 2021-10-21 2022-10-17 通信方法及装置、系统、存储介质、程序产品 Ceased WO2023066193A1 (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP22882799.4A EP4412287A4 (en) 2021-10-21 2022-10-17 Communication method and apparatus, system, storage medium, and program product
US18/641,026 US20240284203A1 (en) 2021-10-21 2024-04-19 Communication method, apparatus, and system, storage medium, and program product

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202111231099.2A CN116017496A (zh) 2021-10-21 2021-10-21 通信方法及装置、系统、存储介质、程序产品
CN202111231099.2 2021-10-21

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US18/641,026 Continuation US20240284203A1 (en) 2021-10-21 2024-04-19 Communication method, apparatus, and system, storage medium, and program product

Publications (1)

Publication Number Publication Date
WO2023066193A1 true WO2023066193A1 (zh) 2023-04-27

Family

ID=86023950

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2022/125651 Ceased WO2023066193A1 (zh) 2021-10-21 2022-10-17 通信方法及装置、系统、存储介质、程序产品

Country Status (4)

Country Link
US (1) US20240284203A1 (zh)
EP (1) EP4412287A4 (zh)
CN (1) CN116017496A (zh)
WO (1) WO2023066193A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119835658B (zh) * 2023-10-13 2025-12-30 中国移动通信有限公司研究院 自适应调制编码方法、网络设备、网元及存储介质
CN118019068B (zh) * 2024-04-10 2024-06-18 中国电子科技集团公司第十研究所 一种基于神经网络的链路在线自适应速率控制方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107872775A (zh) * 2016-09-26 2018-04-03 阿尔卡特朗讯 基于v2v传感器共享方法的动态交通指示
CN110135575A (zh) * 2017-12-29 2019-08-16 英特尔公司 用于分布式机器学习的通信优化
US20200167258A1 (en) * 2020-01-28 2020-05-28 Intel Corporation Resource allocation based on applicable service level agreement
CN112188504A (zh) * 2020-09-30 2021-01-05 中国人民解放军陆军工程大学 多用户协同抗干扰系统及动态频谱协同抗干扰方法
AU2020103326A4 (en) * 2020-11-09 2021-01-14 Southwest University A robust diffusion kernel risk-sensitive loss (d-KRSL) algorithm for asynchronous networks

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107872775A (zh) * 2016-09-26 2018-04-03 阿尔卡特朗讯 基于v2v传感器共享方法的动态交通指示
CN110135575A (zh) * 2017-12-29 2019-08-16 英特尔公司 用于分布式机器学习的通信优化
US20200167258A1 (en) * 2020-01-28 2020-05-28 Intel Corporation Resource allocation based on applicable service level agreement
CN112188504A (zh) * 2020-09-30 2021-01-05 中国人民解放军陆军工程大学 多用户协同抗干扰系统及动态频谱协同抗干扰方法
AU2020103326A4 (en) * 2020-11-09 2021-01-14 Southwest University A robust diffusion kernel risk-sensitive loss (d-KRSL) algorithm for asynchronous networks

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP4412287A4

Also Published As

Publication number Publication date
EP4412287A4 (en) 2025-01-08
EP4412287A1 (en) 2024-08-07
US20240284203A1 (en) 2024-08-22
CN116017496A (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
US10932235B2 (en) System and method for virtual multi-point transceivers
US10382896B2 (en) Auxiliary content delivery
CN115225231B (zh) 通信方法及装置
CN110380835B (zh) 用于动态可配置空中接口的系统和方法
US20240214329A1 (en) Data processing method and apparatus
US10367623B2 (en) Data traffic management in virtual access point (VAP) enabled networks
US12376142B2 (en) Methods for enhanced sidelink communications with clustered or peer-to-peer federated learning
US20240284203A1 (en) Communication method, apparatus, and system, storage medium, and program product
US10230650B2 (en) Joint radio link control (RLC) signaling with network coding
CN104105072B (zh) 混合多播方法和混合多播系统
CN112740780A (zh) 终端装置、无线通信装置、无线通信系统和无线通信方法
US20240267933A1 (en) Apparatus and method for transmitting or receiving signal in wireless communication system
CN114902568B (zh) 协议数据单元(pdu)错误概率反馈
CN112152761B (zh) 一种通信方法、装置及存储介质
WO2018015612A1 (en) Determining a modulation and coding scheme for a broadcast or multicast transmission
CN111373771A (zh) 车辆消息传递
US9277512B2 (en) Method and apparatus for distributed transmission power control in wireless networks
CN115102675B (zh) 通信方法及装置
US20250232216A1 (en) Iterative learning with adapted transmission and reception
Bhadauria et al. Evaluation of nr-sidelink for cooperative industrial agvs
Laya et al. Reliable machine-to-machine multicast services with multi-radio cooperative retransmissions
WO2023066111A1 (zh) 数据重传方法及相关产品
EP2954622A1 (en) Determining a cluster set of mobile devices
CN113747372A (zh) 一种基于d2d的组播重传方法及系统
CN111865480A (zh) 一种直通链路传输方法和终端

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22882799

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2022882799

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2022882799

Country of ref document: EP

Effective date: 20240503

NENP Non-entry into the national phase

Ref country code: DE