WO2024197810A1

WO2024197810A1 - 一种数据处理方法、模型的训练方法以及相关设备

Info

Publication number: WO2024197810A1
Application number: PCT/CN2023/085467
Authority: WO
Inventors: 张公正; 徐晨; 王坚; 李榕
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2023-03-31
Filing date: 2023-03-31
Publication date: 2024-10-03
Anticipated expiration: 2025-09-30
Also published as: CN120641917A; EP4668175A4; EP4668175A1

Abstract

一种数据处理方法、模型的训练方法以及相关设备，可以将人工智能技术应用于通信领域中，方法包括：获取T的取值，T代表第一机器学习模型的输出数据包括的子数据的个数；将第一数据输入第一机器学习模型，得到第一机器学习模型生成的第二数据，第二数据包括T个子数据，其中，第一机器学习模型包括一个或多个模块，每调用第一机器学习模型中的模块至少一次得到一个子数据；可以根据T的取值灵活调整第一机器学习模型中模块的调用次数，以生成T个子数据，从而第一机器学习模型能够兼容T的多种取值，不再需要存储多个机器学习模型，减少了存储空间的开销。

Description

一种数据处理方法、模型的训练方法以及相关设备

技术领域

本申请涉及通信领域，尤其涉及一种数据处理方法、模型的训练方法以及相关设备。

背景技术

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

将人工智能技术应用于无线通信领域中是人工智能的一个应用方式，例如通过机器学习模型执行调制、编码或其他任务等。示例性地，可以将待处理数据输入机器学习模型，得到该模型输出的处理后数据，前述处理后数据包括T个子数据,T为大于或等于1的整数。

但T的取值可以根据实际情况灵活确定，而相关技术中，每个机器学习模型的输出通道的数量是固定的，导致该机器学习模型只能输出固定个数的子数据；当T发生改变时，就需要采用另一个机器学习模型进行处理，则需要存储多个机器学习模型，导致存储空间开销很大，因此，一种能够兼容T的多种取值的机器学习模型亟待推出。

发明内容

本申请实施例提供了一种数据处理方法、模型的训练方法以及相关设备，每调用第一机器学习模型中的模块至少一次就能得到一个子数据，则可以根据T的取值灵活调整第一机器学习模型中模块的调用次数，以生成T个子数据，从而第一机器学习模型能够兼容T的多种取值，不再需要存储多个机器学习模型，减少了存储空间的开销。

本申请第一方面提供一种数据处理方法，可以将人工智能技术应用于通信领域中，所述方法应用于第一装置侧，第一装置可以是设备，也可以是可配置于设备中的组件(如，芯片、芯片系统等)，所述方法包括：第一装置获取T的取值，T代表第一机器学习模型的输出数据包括的子数据的个数，T为大于或等于1的整数；第一装置将第一数据输入第一机器学习模型，得到第一机器学习模型生成的第二数据，第二数据包括T个子数据。其中，第一机器学习模型包括一个或多个模块，每调用第一机器学习模型中的模块至少一次得到一个子数据；示例性地，每次调用第一机器学习模型中的模块时可以调用第一机器学习模型中的一个模块，也可以调用多个模块。本实现方式中，由于每调用第一机器学习模型中的模块至少一次就能得到一个子数据，则在获取到T的取值之后，可以根据T的取值灵活调整第一机器学习模型中模块的调用次数，以生成T个子数据，从而第一机器学习模型能够兼容T的多种取值，则不再需要存储多个机器学习模型，减少了存储空间的开销。

在一种可能实现方式中，第一机器学习模型的功能包括如下任一项或多项的组合：编码、调制、生成参考信号。例如，若第一机器学习模型的功能是编码，则第一数据为需要编码的数据，第二数据为编码后的数据。又例如，若第一机器学习模型的功能是调制，则第一数据为需要调制的数据，第二数据为调制后的数据。又例如，若第一机器学习模型的功能是生成参考信号，则第一数据可以为多个参考信号的索引号，第二数据可以为参考信号。又例如，第一机器学习模型的功能是编码和调制，则第一数据为需要编码和调制的数据，第二数据为编码以及调制后的数据等。

本实现方式中，提供了第一机器学习模型的多种功能，扩展了本方案的应用场景，提高了本方案的实现灵活性。

在一种可能实现方式中，第一机器学习模型中的多个模块包括第一模块和至少一个第二模块，第一装置将第一数据输入第一机器学习模型，得到第一机器学习模型输出的第二数据，包括：第一装置将第一数据输入第一模块，得到第一模块生成的第一子数据，第一子数据为T个子数据中的一个；将第一数据的第一特征信息输入第二模块，得到第二模块生成的第二子数据，第二子数据为T个子数据中的一个。其中，第一特征信息包括上一次调用第一机器学习模型中的模块进行数据处理时生成的特征信息；示例性地，第一特征信息可以为上一次调用第一机器学习模型中的第一模块进行数据处理时生成的特征信息，也可以为上一次调用第一机器学习模型中的第二模块进行数据处理时生成的特征信息。

本实现方式中，第一机器学习模型包括第一模块和至少一个第二模块，第一机器学习模型的第一模块的输入为整个第一数据，第二模块的输入为上一次调用第一机器学习模型的模块时得到的特征信息，则第一次调用第二模块时输入的为通过第一模块对整个第一数据进行处理时得到的特征信息，从而每次输入第二模块的特征信息均参考了整个第一数据，也即在生成T个子数据中的每个子数据时均参考了整个第一数据的信息，有利于得到性能更好的第二数据；且每调用第二模块一次就能够得到T个子数据中的一个第二子数据，有利于快速的得到第二数据中包括的T个子数据。

在一种可能实现方式中，第一机器学习模型中的多个模块包括第一模块和至少一个第三模块，第一装置将第一数据输入第一机器学习模型，得到第一机器学习模型输出的第二数据，包括：第一装置将第一数据输入第一模块，通过第一模块生成第一子数据，第一子数据为T个子数据中的一个，通过第一模块生成第一子数据的过程中包括对第一数据进行特征提取，也即在通过第一模块生成第一子数据的过程中能够得到第一数据的特征信息；第一装置调用第三模块多次，得到第三模块生成的第三子数据，第三子数据为T个子数据中的一个，其中，第三模块的输入包括第一数据的特征信息，在调用第三模块多次的过程中对第一数据的特征信息进行多次更新。示例性地，第一装置在第一次调用第三模块时，向第三模块输入的第一数据的特征信息是在第一模块生成第一子数据的过程中得到的；第一装置在第二次及以后再调用第三模块时，向第三模块输入的第一数据的特征信息是上一次调用第三模块的过程中得到的。

本实现方式中，调用第三模块多次以对第一数据的特征信息进行多次更新之后，才根据最后的第一数据的更新后的特征信息，生成一个第三子数据，在对第一数据的多次更新之后，有利于更加透彻的了解第一数据，从而生成性能更好的子数据。

在一种可能实现方式中，第一装置将第一特征信息输入第二模块，得到第二模块生成的第二子数据，包括：第一装置通过第二模块对第一特征信息进行线性变换，并采用第一激活函数进行处理，得到变换后的特征信息；对变换后的特征信息进行线性变换，并采用第二激活函数进行处理，得到第二子数据。

本实现方式中，由于上述方式简单且易于实现，不仅有利于减少在生成第二数据的过程中消耗的计算机资源；且上述方式示出的第二模块中采用的参数量较少，有利于降低在传输第一机器学习模型的参数时消耗的通信资源。

在一种可能实现方式中，至少一个第二模块包括多个第二模块，其中，多个第二模块中至少两个第二模块采用的参数不同；也即第一装置每调用第二模块一次能够生成一个第二子数据，但在生成T-1个第二数据的过程中调用的可以为不同的第二模块。示例性地，“采用的参数不同的两个第二模块”的含义可以包括如下任一种不同：两个第二模块中采用了相同类型的参数，但两个第二模块中采用的参数值不完全相同；或者，两个第二模块中采用的参数的类型不完全相同等。

本实现方式中，第一机器学习模型中可以采用多个第二模块，多个第二模块中存至少两个第二模块采用的参数不同，也即T-1个第二子数据是由不同的第二模块生成的，有利于第二模块的参数和生成的第二子数据之间的匹配度，从而有利于得到性能更好的第二数据。

在一种可能实现方式中，第一装置将第一数据输入第一模块，得到第一模块生成的第一子数据，可以包括：第一装置通过调用第一模块一次或多次的方式，得到第一模块生成的第一子数据。可选地，第一装置每次调用第一模块对输入数据进行处理时，可以包括：第一装置通过第一模块对输入数据进行线性变换，并采用第三激活函数进行处理，得到变换后的输入数据；对变换后的输入数据进行线性变换，并采用第四激活函数进行处理，得到第一模块的处理结果。第一模块的输入数据可以为第一数据或者第一数据的特征信息。

在一种可能实现方式中，第一装置将第一数据输入第一机器学习模型之前，方法还包括：第一装置获取待处理数据和H的取值，H为大于或等于1的整数，H指示第一数据的长度；若待处理数据的长度小于H，则对待处理数据进行填充，得到第一数据，第一数据的长度为H。本实现方式中，当待处理数据的长度小于H时，对待处理数据进行填充得到长度为H的第一数据，再将长度为H的第一数据输入第一机器学习模型中，从而无论待处理数据的长度是多少，第一机器学习模型处理的都是长度为H的第一数据，不仅有利于兼容任意长度的待处理数据，且有利于降低第一机器学习模型在进行数据处理时的难度，以得到性能更好的第二数据。

在一种可能实现方式中，第一数据包括待处理数据和填充数据，填充数据包括第一标识信息，第一标识信息用于标识T的取值和/或K的取值，K为待处理数据的长度，K为大于或等于1的整数，也即第一标识信息可以用于标识T的取值和K的取值，也可以用于标识T的取值，也可以用于标识K的取值。示例性地，第一装置在获取到T的取值和/或K的取值之后，可以采用第一函数对T的取值和/或K的取值进行处理，以得到第一标识信息。第一函数需要满足的条件包括：将第一标识信息的取值限制在预设范围内，且，能够将不同T的取值和/或K的取值映射为不同的值，也即通过该第一函数生成的值能够唯一的标识某一个T的取值和/或K的取值，又或者说通过该第一函数生成的值能够对不同的T的取值和/或K的取值进行区分。

本实现方式中，在第一数据中携带有用于标识T的取值和/或K的取值的第一标识信息，则第一机器学习模型能够根据T的取值和/或K的取值，即根据第一机器学习模型的输出数据的长度和/或真实的待处理数据的长度处理第一数据，进而通过第一机器学习模型输出的第二数据，有利于得到性能更好的第二数据。

在一种可能实现方式中，第一机器学习模型中的参数的尺寸与H的取值以及G的取值相关，G为每个子数据的长度。本实现方式中，根据第一数据的长度以及T个子数据中每个子数据的长度来设计第一机器学习模型中参数的尺寸，有利于在满足输出要求的前提下，减少第一机器学习模型中的参数量，有利于进一步减少传输第一机器学习模型的参数所消耗的通信资源。

在一种可能实现方式中，与第一机器学习模型对应的参数和/或前述参数的标识信息可以携带于信令中，以实现与第一机器学习模型对应的参数和/或前述参数的标识信息在不同装置之间传输。可选地，与第一机器学习模型对应的参数携带于如下一种或多种信息中：下行控制信息DCI、上行控制信息UCI、侧行链路控制信息SCI、无线资源控制RRC信令或者媒体访问控制的控制元素MAC CE。和/或，参数的标识信息携带于如下任一种或多种信息中：DCI、UCI、SCI、RRC信令、MAC CE、物理广播信道PBCH或者物理随机接入信道PRACH。

本实现方式中，相比于将第一机器学习模型的至少一组参数和/或每组参数的标识信息携带于数据包中传输，将前述至少一组参数和/或每组参数的标识信息携带于信令中传输，传输效率更高，且消耗的计算机资源更少；此外，本方案中提供了多种能够用于传输前述至少一组参数和/或每组参数的标识信息的信令，提高了本方案的实现灵活性。

在一种可能实现方式中，第二装置为第二数据的接收端，第二装置中有与第一机器学习模型对应的多组参数以及每组参数的标识信息，方法还包括：第一装置向第二装置发送第二标识信息，第二标识信息用于指示第一装置中的第一机器学习模型采用的一组参数。本实现方式中，第二装置中存在第一机器学习模型的多组参数以及每组参数的标识信息，第一装置仅需要向第二装置发送第二标识信息，第二装置就能够得知第一装置中的第一机器学习模型采用的是哪组参数，而传输第二标识信息所占用的通信资源较少，有利于减少所消耗的通信资源。

第二方面，本申请提供了一种数据处理方法，可以将人工智能技术应用于通信领域中，所述方法应用于第二装置侧，第二装置可以是设备，也可以是可配置于设备中的组件(如，芯片、芯片系统等)，所述方法包括：第二装置获取第二数据，进而根据第二数据，生成第一数据。其中，第二数据包括T个子数据，T为大于或等于1的整数，第二数据由第一装置中的第一机器学习模型生成，第一机器学习模型包括一个或多个模块，每调用第一机器学习模型中的模块至少一次得到一个子数据。示例性地，第二装置在获取到接收信号之后，可以对接收信号进行去噪，并从去噪后的接收信号中获取接收的第二数据(也即估计的第二数据)。例如，若第二数据为编码后的数据，也即第一机器学习模型的功能为编码，则对去噪后的接收信号进行解调制之后得到接收的第二数据；又例如，若第二数据为调制后的数据，也即第一机器学习模型的功能为调制，或者，第一机器学习模型的功能为编码和调制，则可以直接将去噪后的接收信号确定为第二数据。

在一种可能实现方式中，与第一机器学习模型对应的参数携带于如下一种或多种信息中：下行控制信息DCI、上行控制信息UCI、侧行链路控制信息SCI、无线资源控制RRC信令或者媒体访问控制的控制元素MAC CE；和/或，参数的标识信息携带于如下任一种或多种信息中：DCI、UCI、SCI、RRC信令、MAC CE、物理广播信道PBCH或者物理随机接入信道PRACH。

在一种可能实现方式中，第二装置中有第三数据，第三数据包括与第一机器学习模型对应的多组参数以及每组参数的标识信息，方法还包括：第二装置接收第一装置发送的第二标识信息；根据第二标识信息和第三数据，确定第一装置中的第一机器学习模型采用的一组参数。第二装置根据第二数据，生成第一数据，包括：第二装置可以根据第一装置中的第一机器学习模型采用的一组参数，对接收的第二数据进行解调制和/或解码，以生成估计的第一数据。

本申请第二方面的各个可能实现方式中的步骤的具体实现方式、名词的含义以及所带来的有益效果，均可以参阅第一方面，此处不再赘述。

第三方面，本申请提供了一种模型的训练方法，可以将人工智能技术应用于通信领域中，所述方法应用于训练装置，训练装置可以是设备，也可以是可配置于设备中的组件(如，芯片、芯片系统等)，所述方法包括：训练装置从训练数据集合中获取训练数据，其中，训练数据用于得到第一数据和T的取值，T为大于或等于1的整数；示例性地，训练数据可以包括待处理数据和T的取值，待处理数据用于得到第一数据，例如待处理数据和第一数据相同，或者，在对待处理数据进行填充后得到第一数据；T用于指示第一机器学习模型的输出数据中包括的子数据的数量，训练数据集合中至少两个训练数据包括的T的取值不同。训练装置将第一数据输入第一机器学习模型，得到第一机器学习模型生成的第二数据，第二数据包括T个子数据，其中，第一机器学习模型包括多个模块，每调用第一机器学习模型中的模块至少一次，得到模块生成的一个子数据；基于第二数据和损失函数，对第一机器学习模型进行训练，得到训练后的第一机器学习模型。

在一种可能实现方式中，在第一机器学习模型的功能包括编码和/或调制的情况下，第二数据用于确定待发送的信号，训练装置基于第二数据和损失函数，对第一机器学习模型进行训练，包括：训练装置获取与该待发送的信号对应的接收信号，对与待发送的信号对应的接收信号进行解调制和/或解码以得到与待处理数据对应的估计数据；训练装置根据估计数据和损失函数，对第一机器学习模型进行训练，损失函数指示估计数据和待处理数据之间的相似度。

示例性地，训练装置获取与该待发送的信号对应的接收信号可以包括：训练装置将该待发送的信号与信道矩阵相乘，并将前述相乘的结果与噪声相加，得到该接收信号，前述步骤是为了模拟该待发送的信号经过信道传输的过程。或者，前述步骤由两个训练装置配合完成，则训练装置获取与该待发送的信号对应的接收信号可以包括：第一训练装置将待发送的信号发送给第二训练装置，第二训练装置接收到了该接收信号。

本实现方式中，提供了在第一机器学习模型的功能包括编码和/或调制的情况下，对第一机器学习模型进行训练的具体实现方式，降低了本方案的实现难度，且损失函数采用的是估计数据和待处理数据之间的相似度，也即损失函数的目标是获得性能更好的估计数据，该损失函数更加符合装置之间发送数据时的实际需求，则训练后的第一机器学习模型输出的第二数据更符合实际的需求。

在一种可能实现方式中，在第二数据为参考信号的情况下，训练装置基于第二数据和损失函数，对第一机器学习模型进行训练，包括：训练装置获取与参考信号对应的接收的参考信号，根据与参考信号对应的接收的参考信号，生成预测的信道信息；训练装置根据损失函数，对第一机器学习模型进行训练，损失函数指示预测的信道信息和正确的信道信息之间的相似度。

示例性地，训练装置获取与参考信号对应的接收的参考信号可以包括：训练装置将参考信号与信道矩阵相乘，并将前述相乘的结果与噪声相加，得到该接收的参考信号，前述步骤是为了模拟参考信号经过信道传输的过程。或者，前述步骤由两个训练装置配合完成，则训练装置获取与参考信号对应的接收的参考信号可以包括：第一训练装置将参考信号发送给第二训练装置，第二训练装置接收到了该接收的参考信号。

本实现方式中，还提供了在第一机器学习模型的功能为生成参考信号的情况下，对第一机器学习模型进行训练的具体实现方式，扩展了本方案的应用场景，提高了本方案的实现灵活性。

本申请第三方面中，训练装置还可以用于执行第一方面以及第一方面的各个可能实现方式中第一装置执行的步骤，第三方面的各个可能实现方式中的步骤的具体实现方式、名词的含义以及所带来的有益效果，均可以参阅第一方面，此处不再赘述。

第四方面，本申请提供了一种数据处理装置，可以将人工智能技术应用于通信领域中，数据处理装置包括处理模块；其中，处理模块，用于获取T的取值，T为大于或等于1的整数，T代表第一机器学习模型的输出数据包括的子数据的个数；

处理模块，还用于将第一数据输入第一机器学习模型，得到第一机器学习模型生成的第二数据，第二数据包括T个子数据，其中，第一机器学习模型包括一个或多个模块，每调用第一机器学习模型中的模块至少一次得到一个子数据。

在一种可能实现方式中，第一机器学习模型的功能包括如下任一项或多项的组合：编码、调制或生成参考信号。

在一种可能实现方式中，第一机器学习模型中的多个模块包括第一模块和至少一个第二模块，处理模块，具体用于：将第一数据输入第一模块，得到第一模块生成的第一子数据，第一子数据为T个子数据中的一个；将第一特征信息输入第二模块，得到第二模块生成的第二子数据，其中，第一特征信息包括上一次调用第一机器学习模型中的模块进行数据处理时生成的特征信息，第二子数据为T个子数据中的一个，上一次调用的第一机器学习模型中的模块为第一模块或者第二模块。

在一种可能实现方式中，第一机器学习模型中的多个模块包括第一模块和至少一个第三模块，处理模块，具体用于：将第一数据输入第一模块，通过第一模块生成第一子数据，第一子数据为T个子数据中的一个，通过第一模块生成第一子数据的过程中包括对第一数据进行特征提取；调用第三模块多次，得到第三模块生成的第三子数据，第三子数据为T个子数据中的一个，其中，第三模块的输入包括第一数据的特征信息，在调用第三模块多次的过程中对第一数据的特征信息进行多次更新。

在一种可能实现方式中，处理模块，具体用于：通过第二模块对第一特征信息进行线性变换，并采用第一激活函数进行处理，得到变换后的特征信息；对变换后的特征信息进行线性变换，并采用第二激活函数进行处理，得到第二子数据。

在一种可能实现方式中，至少一个第二模块包括多个第二模块，其中，多个第二模块中至少两个第二模块采用的参数不同。

在一种可能实现方式中，处理模块，还用于获取待处理数据和H的取值，H为大于或等于1的整数，H指示第一数据的长度；处理模块，还用于若待处理数据的长度小于H，则对待处理数据进行填充，得到第一数据，第一数据的长度为H。

在一种可能实现方式中，第一数据包括待处理数据和填充数据，填充数据包括第一标识信息，第一标识信息用于标识T的取值和/或K的取值，K为待处理数据的长度，K为大于或等于1的整数。

在一种可能实现方式中，第一机器学习模型中的参数的尺寸与H的取值以及G的取值相关，G为每个子数据的长度。

在一种可能实现方式中，数据处理装置应用于第一装置，第二装置为第二数据的接收端，第二装置中有与第一机器学习模型对应的多组参数以及每组参数的标识信息，数据处理装置还包括：收发模块，用于向第二装置发送第二标识信息，第二标识信息用于指示第一装置中的第一机器学习模型采用的一组参数。

本申请第四方面中，第四方面的各个可能实现方式中的步骤的具体实现方式、名词的含义以及所带来的有益效果，均可以参阅第一方面，此处不再赘述。

第五方面，本申请提供了一种数据处理装置，可以将人工智能技术应用于通信领域中，数据处理装置包括处理模块；其中，处理模块用于获取第二数据；根据第二数据，生成第一数据。其中，第二数据包括T个子数据，T为大于或等于1的整数，第二数据由第一装置中的第一机器学习模型生成，第一机器学习模型包括一个或多个模块，每调用第一机器学习模型中的模块至少一次得到一个子数据。

在一种可能实现方式中，该数据处理装置应用于第二装置，第二装置中有第三数据，第三数据包括与第一机器学习模型对应的多组参数以及每组参数的标识信息，数据处理装置还包括：收发模块，用于接收第一装置发送的第二标识信息；处理模块，还用于根据第二标识信息和第三数据，确定第一装置中的第一机器学习模型采用的一组参数。处理模块，具体用于根据第一装置中的第一机器学习模型采用的一组参数和第二数据，生成第一数据。

本申请第五方面中，第五方面的各个可能实现方式中的步骤的具体实现方式、名词的含义以及所带来的有益效果，均可以参阅第二方面，此处不再赘述。

第六方面，本申请提供了一种模型的训练装置，可以将人工智能技术应用于通信领域中，模型的训练装置包括处理模块；其中，处理模块，用于从训练数据集合中获取训练数据，其中，训练数据用于得到第一数据和T的取值，T为大于或等于1的整数，训练数据集合中至少两个训练数据包括的T的取值不同；处理模块，还用于将第一数据输入第一机器学习模型，得到第一机器学习模型生成的第二数据，第二数据包括T个子数据，其中，第一机器学习模型包括多个模块，每调用第一机器学习模型中的模块至少一次，得到模块生成的一个子数据；处理模块，还用于基于第二数据和损失函数，对第一机器学习模型进行训练，得到训练后的第一机器学习模型。

在一种可能实现方式中，处理模块，还用于从训练数据中获取待处理数据；处理模块，还用于获取H的取值，H为大于或等于1的整数，H指示第一数据的长度；处理模块，还用于若待处理数据的长度小于H，则对待处理数据进行填充，得到第一数据，第一数据的长度为H。

在一种可能实现方式中，在第一机器学习模型的功能包括编码和/或调制的情况下，第二数据用于确定待发送的信号，处理模块，具体用于：对与待发送的信号对应的接收信号进行解调制和/或解码以得到与待处理数据对应的估计数据；根据估计数据和损失函数，对第一机器学习模型进行训练，损失函数指示估计数据和待处理数据之间的相似度。

在一种可能实现方式中，在第二数据为参考信号的情况下，基于第二数据和损失函数，处理模块，具体用于：根据与参考信号对应的接收的参考信号，生成预测的信道信息；根据损失函数，对第一机器学习模型进行训练，损失函数指示预测的信道信息和正确的信道信息之间的相似度。

本申请第六方面中，第六方面的各个可能实现方式中的步骤的具体实现方式、名词的含义以及所带来的有益效果，均可以参阅第一方面，此处不再赘述。

第七方面，本申请提供了一种通信系统，可以将人工智能技术应用于通信领域中，通信系统可以包括如第四方面的数据处理装置以及如第五方面的数据处理装置。

在一种可能实现方式中，通信系统还包括如第五方面的模型的训练装置。

第八方面，本申请提供了一种数据处理方法，可以将人工智能技术应用于通信领域中，方法包括：第三装置获取第一信令，其中，第一信令中携带有第一机器学习模型采用的至少一组参数以及每组参数所对应的指示信息，指示信息用于指示每组参数包括的多个参数在第一机器学习模型中的位置；向第一装置发送第一信令。第三装置与第二装置可以为同一装置，也可以为不同的装置，本申请中不做限定。

本实现方式中，当通过信令传输第一机器学习模型的至少一组参数时，信令中不仅携带前述至少一组参数，还会携带每组参数所对应的指示信息，该指示信息用于指示每组参数包括的多个参数在第一机器学习模块中的位置，从而第一装置在接收到该信令之后，就能够明白如何使用信令中携带的参数，且采用信令的方式传输第一机器学习模型的至少一组参数，有利于降低参数传输过程中所消耗的通信资源，且提高参数传输过程的效率。

在一种可能实现方式中，第一信令为如下任一种：下行控制信息DCI、上行控制信息UCI、侧行链路控制信息SCI、无线资源控制RRC信令或者媒体访问控制的控制元素MAC CE。

第九方面，本申请提供了一种数据处理方法，可以将人工智能技术应用于通信领域中，方法包括：第一装置接收第一信令，其中，第一信令中携带有第一机器学习模型采用的至少一组参数以及每组参数所对应的指示信息，指示信息用于指示每组参数包括的多个参数在第一机器学习模型中的位置。

第十方面，本申请实施例提供了一种装置，包括至少一个处理器，至少一个处理器与存储器耦合，存储器用于存储程序或指令；至少一个处理器用于执行程序或指令，使得前述装置执行上述任一方面中的方法。

第十一方面，本申请实施例提供了一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，当其在计算机上运行时，使得计算机执行上述任一方面中的方法。

第十二方面，本申请实施例提供了一种计算机程序产品，计算机程序产品包括程序，当该程序在计算机上运行时，使得计算机执行上述任一方面中的方法。

第十三方面，本申请提供了一种芯片系统，该芯片系统包括处理器，用于支持通信装置实现上述方面中所涉及的功能，例如，发送或处理上述方法中所涉及的数据和/或信息。在一种可能的设计中，芯片系统还包括存储器，存储器，用于保存通信装置必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包括芯片和其他分立器件。

附图说明

图1为本申请实施例提供的无线通信系统的一种架构示意图；

图2为本申请实施例提供的无线通信系统的另一种架构示意图；

图3为本申请实施例提供的数据处理方法的一种流程示意图；

图4为本申请实施例提供的数据处理方法的另一种示意图；

图5为本申请实施例提供的第一装置和第二装置确定第一机器学习模型采用的一组参数的一种流程示意图；

图6为本申请实施例提供的第一装置获取第一机器学习模型采用的一组参数的一种流程示意图；

图7为本申请实施例提供的第一数据的一种示意图；

图8为本申请实施例提供的利用第一机器学习模型生成T个子数据的一种示意图；

图9为本申请实施例提供的模型的训练方法的一种示意图；

图10为本申请实施例提供的数据处理装置的一种结构示意图；

图11为本申请实施例提供的数据处理装置的另一种结构示意图；

图12为本申请实施例提供的模型的训练装置的一种示意图；

图13为本申请的实施例提供的装置的一种示意图；

图14为本申请的实施例提供的装置的另一种示意图；

图15为本申请实施例提供的芯片的一种结构示意图。

具体实施方式

下面结合附图，对本申请的实施例进行描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。本领域普通技术人员可知，随着技术的发展和新场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象(例如，区分同一实施例中的对象)，而不必用于描述特定的顺序或先后次序，且在不同实施例中“第一”、“第二”等限定的对象(如“第一装置”和“第二装置”)可能指代不同的对象，应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。

此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。在本申请中出现的对步骤进行的命名或者编号，并不意味着必须按照命名或者编号所指示的时间/逻辑先后顺序执行方法流程中的步骤，已经命名或者编号的流程步骤可以根据要实现的技术目的变更执行次序，只要能达到相同或者相类似的技术效果即可。

本申请实施例中的“发送”和“接收”，表示信号传递的走向。例如，“向XX设备发送信息”可以理解为该信息的目的端是XX设备，可以包括通过空口直接发送，也包括其他单元或模块通过空口间接发送。“接收来自YY设备的信息”可以理解为该信息的源端是YY设备，可以包括通过空口直接从YY设备接收，也可以包括通过空口从其他单元或模块间接地从YY设备接收。“发送”也可以理解为芯片接口的“输出”，“接收”也可以理解为芯片接口的“输入”。换言之，发送和接收可以是在设备之间进行的，也可以是在设备内进行的，例如，通过总线、走线或接口在设备内的部件之间、模组之间、芯片之间、软件模块或者硬件模块之间发送或接收。可以理解的是，信息在信息发送的源端和目的端之间可能会被进行必要的处理，比如编码、调制等，但目的端可以理解来自源端的有效信息。本申请中类似的表述可以做相似的理解，不再赘述。

在本申请实施例中，“指示”可以包括直接指示和间接指示，也可以包括显式指示和隐式指示。将某一信息(如下文所述的指示信息)所指示的信息称为待指示信息，则具体实现过程中，对待指示信息进行指示的方式有很多种，例如但不限于，可以直接指示待指示信息，如待指示信息本身或者该待指示信息的索引等。也可以通过指示其他信息来间接指示待指示信息，其中该其他信息与待指示信息之间存在关联关系；还可以仅仅指示待指示信息的一部分，而待指示信息的其他部分则是已知的或者提前约定的，例如可以借助预先约定(例如协议预定义)的各个信息的排列顺序来实现对特定信息的指示，从而在一定程度上降低指示开销。本申请对于指示的具体方式不作限定。可以理解的是，对于该指示信息的发送方来说，该指示信息可用于指示待指示信息，对于指示信息的接收方来说，该指示信息可用于确定待指示信息。

本申请可以将人工智能技术应用于通信领域中，可选地，可以将人工智能技术应用于信号发送这一应用场景中。示例性地，可以利用机器学习模型执行如下任一项或多项任务：编码、调制、生成参考信号或通信领域的其他任务等。

在对本申请提供的数据处理方法进行详细说明之前，先对本申请实施例提供的方法所应用的场景进行介绍。请先参阅图1，图1为本申请实施例提供的无线通信系统的一种架构示意图。本申请提供的方法可以应用于无线通信系统中，如图1所示，无线通信系统中包括网络设备101和移动台(mobile station，MS)102。其中，网络设备101与各个终端设备之间可以建立无线连接，各个终端设备之间也可以建立有无线连接。

网络设备101可以是指无线网络中提供无线接入服务的设备。示例性地，网络设备101可以为将移动台102接入到无线网络的设备，又可以称为基站；前述基站可以为各种形式的宏基站、微基站、中继站或接入点等等。在采用不同的无线接入技术的无线通信系统中，具备基站功能的网络设备101的名称可能会有所不同，例如，基站可以为称为演进型节点B(evolved Node B，eNB)、节点B(Node B，NB)、第五代(5th generation，5G)通信系统中的下一代基站(the next Generation Node B，gNB)、家庭基站(例如，home evolved Node B，或home Node B，HNB)、基带单元(base band unit，BBU)、无线保真(wireless fidelity，Wi-Fi)接入点(Access Point，AP)、传输接收点(transmission reception point，TRP)或无线网络控制器(radio network controller，RNC)等等。在另一种可能的场景中，由多个网络节点协作协助实现无线接入，不同网络节点分别实现基站的部分功能。例如，网络节点可以是集中式单元(central unit，CU)，分布式单元(distributed unit，DU)，CU-控制面(control plane，CP)，CU-用户面(user plane，UP)，或者无线单元(radio unit，RU)等。CU和DU可以是单独设置，或者也可以包括在同一个网元中，例如基带单元(baseband unit，BBU)中。RU可以包括在射频设备或者射频单元中，例如包括在射频拉远单元(remote radio unit，RRU)、有源天线处理单元(active antenna unit，AAU)或远程射频头(remote radio head，RRH)中。在不同系统中，CU(或CU-CP和CU-UP)、DU或RU也可以有不同的名称，但是本领域的技术人员可以理解其含义。例如，在ORAN系统中，CU也可以称为开放式CU(O-CU)，DU也可以称为开放式DU(O-DU)，CU-CP也可以称为开放式CU-CP(O-CU-CP)，CU-UP也可以称为开放式CU-UP(O-CU-UP)，RU也可以称为开放式RU(O-RU)。其中，CU(或CU-CP、CU-UP)、DU和RU中的任一单元，可以是通过软件模块、硬件模块、或者软件模块与硬件模块结合来实现。本申请实施例对网络设备101的具体设备形态不做限定。

移动台102是指能够接收网络设备101发送的调度信息和指示信息的无线终端设备(terminal)。移动台102可以是具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备。

移动台102可以经无线接入网(wireless access network，RAN)与一个或多个核心网或者互联网进行通信。例如，移动台102可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置，它们与无线接入网交换语音和/或数据。示例性地，移动台102可以是用户单元(user agent)、蜂窝电话(cellular phone)、智能手机(smart phone)、个人数字助理(personal digital assistant，PDA)、平板电脑(Tablet Personal Computer，Tablet PC)、无线调制解调器(modem)、手持设备(handset)、膝上型电脑(laptop computer)、个人通信业务(personal communication service，PCS)电话、远程站(remote station)、接入点(access point，AP)、远程终端设备(remote terminal)、接入终端设备(access terminal)、用户端设备(customer premises equipment，CPE)、终端(terminal)、用户设备(user equipment，UE)或移动终端(mobile terminal，MT)等等。

又例如，移动台102还可以是可穿戴设备，是应用穿戴式技术对日常穿戴进行智能化设计、开发出可以穿戴的设备的总称，如眼镜、手套、手表、服饰及鞋等。可穿戴设备即直接穿在身上，或是整合到用户的衣服或配件的一种便携式设备。可穿戴设备不仅仅是一种硬件设备，更是通过软件支持以及数据交互、云端交互来实现强大的功能。广义穿戴式智能设备包括功能全、尺寸大、可不依赖智能手机实现完整或者部分的功能，例如：智能手表或智能眼镜等，以及只专注于某一类应用功能，需要和其它设备如智能手机配合使用，如各类进行体征监测的智能手环、智能头盔、智能首饰等。

又例如，移动台102还可以是无人机、机器人、设备到设备通信(device-to-device，D2D)中的终端设备、车到一切(vehicle to everything，V2X)中的终端设备、虚拟现实(virtual reality，VR)设备、增强现实(augmented reality，AR)设备、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的终端设备、远程医疗(remote medical)中的终端设备、智能电网(smart grid)中的终端设备、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的终端设备等。

此外，移动台102也可以是5G通信系统之后的通信系统(例如第六代(6th generation， 6G)通信系统等)中的终端设备或者未来演进的公共陆地移动网络(public land mobile network，PLMN)中的终端设备等等，本申请实施例不限定移动台102的设备形态。

在一些应用场景中，网络设备101可以向各个终端设备发送下行数据，或者，各个终端设备也可以向网络设备101发送上行数据；网络设备101或各个终端设备在发送数据的过程中可能会利用机器学习模型，则可以采用本申请提供的数据处理方法。

在另一些应用场景中，各个终端设备之间还可以互相发送数据，在各个终端设备在发送数据的过程中可能会利用机器学习模型，则可以采用本申请提供的数据处理方法。

请继续参阅图2，图2为本申请实施例提供的无线通信系统的另一种架构示意图。如图2所示，在智能家居场景中，各种智能家居产品之间通过无线网络连接，以实现智能家居产品之间能够互相传输数据。在图2中，以智慧电视、智能空气净化器、智能饮水机、智能音箱以及扫地机器人等智能家居产品为例，这些智能家居产品均通过无线路由器连接至同一个无线网络中，从而实现各个智能家居产品之间的数据交互。除了上述示例的智能家居产品之外，在实际应用中还可以包括其他类型的智能家居产品，例如智能冰箱、智能抽油烟机、智能窗帘等智能家居产品，本实施例并不对智能家居产品的类型进行限定。

此外，不同的智能家居产品之间也可以是直接进行无线连接，而不需要通过无线路由器接入到同一个无线网络中。例如，各个智能家居产品之间通过蓝牙来实现无线连接。

除了上述图1和图2所介绍的场景以外，本申请实施例提供的方法还可以应用于其他的通信系统场景下。例如，在智能工厂场景中，不同的设备(例如智能机器人、车床、搬运车辆等设备)之间通过无线网络进行连接，并通过无线网络互相传递数据。本申请实施例并不对数据处理方法所应用的具体场景进行限定。

需要说明的是，本申请实施例所提及的无线通信系统包括但不限于：第五代移动通信技术(5th Generation Mobile Communication Technology，5G)通信系统、6G通信系统、卫星通信系统、短距通信系统、窄带物联网系统(Narrow Band-Internet of Things，NB-IoT)、全球移动通信系统(Global System for Mobile Communications，GSM)、增强型数据速率GSM演进系统(Enhanced Data rate for GSM Evolution，EDGE)、宽带码分多址系统(Wideband Code Division Multiple Access，WCDMA)、码分多址2000系统(Code Division Multiple Access，CDMA2000)、时分同步码分多址系统(Time Division-Synchronization Code Division Multiple Access，TD-SCDMA)以及长期演进系统(Long Term Evolution，LTE)等通信系统。本申请实施例并不对无线通信系统的具体架构进行限定。

在上述种种应用场景中，当某一装置需要发送数据时，均可以采用本申请提供的数据处理方法，具体的，请参阅图3，图3为本申请实施例提供的数据处理方法的一种流程示意图。如图3所示，301、第一装置获取T的取值，T为大于或等于1的整数，T代表第一机器学习模型的输出数据包括的子数据的个数。302、第一装置将第一数据输入第一机器学习模型，得到第一机器学习模型生成的第二数据，第二数据包括T个子数据；其中，第一机器学习模型包括一个或多个模块，每调用第一机器学习模型中的模块至少一次得到T个子数据中的一个子数据；示例性地，每次调用第一机器学习模型中的模块时可以调用第一机器学习模型中的一个模块，也可以调用多个模块。

示例性地，第一装置可以为上述多个应用场景中任意一个需要发送数据的设备；例如，第一装置可以为图1中的网络设备101或移动台102；又例如，第一装置可以为图2中的智能家居或无线路由器；或者，第一装置也可以为其他需要发送数据的设备等，本申请实施例中不对第一装置的形态进行限定。

可选地，第一机器学习模型的功能包括如下任一项或多项的组合：编码、调制、生成参考信号或其他功能等。例如，若第一机器学习模型的功能是编码，则第一数据为需要编码的数据，第二数据为编码后的数据。又例如，若第一机器学习模型的功能是调制，则第一数据为需要调制的数据，第二数据为调制后的数据。又例如，若第一机器学习模型的功能是生成参考信号，则第一数据可以为多个参考信号的索引号，第二数据可以为参考信号。又例如，第一机器学习模型的功能是编码和调制，则第一数据为需要编码和调制的数据，第二数据为编码以及调制后的数据等。当第一机器学习模型为其他功能时，第一数据和第二数据可以表现为其他类型的数据等，本申请实施例中不做限定。

本申请实施例中，由于每调用第一机器学习模型中的模块至少一次就能得到一个子数据，则在获取到T的取值之后，可以根据T的取值灵活调整第一机器学习模型中模块的调用次数，以生成T个子数据，从而第一机器学习模型能够兼容T的多种取值，则不再需要存储多个机器学习模型，减少了存储空间的开销。

本申请实施例中，以下先对上述第一机器学习模型的推理阶段的详细实现过程进行介绍，再介绍第一机器学习模型的训练阶段的详细实现过程。其中，“第一机器学习模型的推理阶段”为利用第一机器学习模型进行数据处理的过程；“第一机器学习模型的训练阶段”为利用训练数据对第一机器学习模型进行迭代训练的过程。在对第一机器学习模型进行迭代训练的过程也是对第一机器学习模型采用的参数进行迭代更新的过程，则在利用训练数据对第一机器学习模型进行迭代训练之后能够得到与第一机器学习模型对应的一组或多组训练后的参数，训练阶段得到的前述参数将在推理阶段使用。

一、推理阶段

具体的，请参阅图4，图4为本申请实施例提供的数据处理方法的另一种示意图，如图4所示，该数据处理方法包括步骤401至411。

401、第一装置获取第一机器学习模型采用的一组参数。

本申请实施例中，第一装置在利用第一机器学习模型进行数据处理之前，需要先确定第一机器学习模型采用的一组训练后的参数；示例性地，前述一组训练后的参数包括第一机器学习模型中的所有模块需要的参数。

第一装置可以通过多种方式获取到第一机器学习模型采用的一组参数。在一种实现方式中，可以预先定义第一机器学习模型的多组训练后的参数，以及每组训练后的参数的标识信息，示例性地，“每组训练后的参数的标识信息”也可以称为每组训练后的参数的索引号。

为更直观地理解本方案，如下通过表1示出第一机器学习模型的多组训练后的参数与每组训练后的参数的标识信息之间的对应关系，表1中以第一机器学习模型中采用到的一组参数包括如下多个参数为例：U、W、θ_s、V以及θ₀。示例性地，在对第一机器学习模型的输入数据进行特征提取以得到输入数据的特征信息的过程中使用的参数包括U和θ_s，在对输入数据的特征信息进行特征更新的过程中使用的参数包括W和θ_s，在根据输入数据的特征信息生成第一机器学习模型的输出数据中的多个子数据的过程中使用的参数包括V和θ₀。

表1

其中，在表1的第二行中，Matrix(矩阵)-U0代表参数U的一个取值，Matrix-W0代表参数W的一个取值，Vector(向量)-s0代表参数θ_s的一个取值，Matrix-V0代表参数V的一个取值，Vector-o0代表参数θ₀的一个取值，Matrix-U0、Matrix-W0、Vector-s0、Matrix-V0以及Vector-o0代表第一机器学习模型的一组参数，表1的第二行中的索引号“0”代表前述一组参数的标识信息。表1中第三行以及第四行可以参阅上述对表1中第一行的解释进行理解，需要说明的是，表1中的示例仅为方便理解，第一机器学习模型的多组参数中每组参数与标识信息之间的对应关系，不用于限定本方案。

可选地，第一机器学习模型的多组训练后的参数中不同组参数与至少一种第一预设指标的不同指标范围对应。例如，至少一种第一预设指标可以包括如下任一个或多个指标：终端设备的移动速度、多径时延扩展的最大值、峰值平均功率比(peak to average power ratio，PAPR)或其他指标等等，本申请实施例中不限定具体采用哪些指标。

例如，当终端设备的移动速度大于或等于速度阈值时所对应的一组参数，和，当终端设备的移动速度小于速度阈值时所对应的一组参数不同。又例如，多径时延扩展的最大值大于阈值1时所对应的一组参数，和，多径时延扩展的最大值小于阈值1时所对应的一组参数不同。又例如，PAPR的值位于范围1内时所对应的一组参数，和，PAPR的值位于范围2内时所对应的一组参数不同。

为更直观地理解本方案，如下通过表2示出多组不同的训练后的参数与不同的场景以及第一预设指标的不同指标范围之间的对应关系。

表2

其中，高速移动场景代表终端设备的移动速度大于或等于速度阈值，低速移动场景代表终端设备的移动速度小于速度阈值，多径时延扩展大代表多径时延扩展的最大值大于阈值1，多径时延扩展小代表多径时延扩展的最大值小于阈值1，表2中以预先定义第一机器学习模型的8组参数为例，8组参数分别为参数1、参数2、参数3、参数4、参数5、参数6、参数7以及参数8，第一机器学习模型的8组参数中不同组参数与不同的场景以及第一预设指标的不同指标范围对应，需要说明的是，表2中的示例仅为方便理解第一机器学习模型的多组训练后的参数中不同组参数之间的关系，具体预先定义的参数的组数以及具体的使用方式可以结合实际场景灵活设定，此处不做限定。

在一种情况中，若第一装置为终端设备，在一种实现方式中(为方便描述，后续称为实现方式一)，在执行步骤401之前，第一装置(也即终端设备)中部署有与第一机器学习模型的参数对应的多个标识信息以及第一规则，第一规则指示与第一机器学习模型的参数对应的多个标识信息中不同的标识信息至少一种第一预设指标的不同指标范围之间的对应关系，由于与第一机器学习模型的参数对应的多个标识信息包括第一机器学习模型的多组参数中每组参数的标识信息，第一规则的含义可以参阅上述描述中公开的“多组训练后的参数中不同组参数与至少一种第一预设指标的不同指标范围之间的对应关系”进行理解，此处不做赘述；第一装置可以根据至少一种第一预设指标的值以及第一规则，从与第一机器学习模型的参数对应的多个标识信息中确定一个第二标识信息，第二标识信息为第一装置中的第一机器学习模型采用的一组参数的标识信息。需要说明的是，“第一标识信息”这一概念将在后续描述中使用，对于第一标识信息的含义也将在后续描述中说明，此处先不做赘述；基站和终端设备的多种形态，可以参阅上述描述，此处不再赘述。

第一装置可以向基站发送第二标识信息，基站在接收到第一装置发送的第二标识信息之后，可以向第一装置发送第二标识信息指向的一组训练后的参数，前述由基站发送的一组训练后的参数为第一装置中的第一机器学习模型采用的一组训练后的参数。步骤401可以包括：第一装置能够获取到基站发送的前述一组训练后的参数，从而将获取到的前述一组参数确定为第一机器学习模型采用的一组参数。

可选地，基站可以向第一装置发送第二标识信息以及该第二标识信息指向的一组参数。对应的，第一装置能够获取到第二标识信息以及第二标识信息指向的一组参数，第一装置将获取到的前述一组参数确定为第一机器学习模型采用的一组参数。

需要说明的是，在上述实现方式中，若与第一装置(也即上述终端设备)进行数据通信的第二装置为上述基站，则在第一装置获取第一机器学习模型采用的一组训练后的参数的过程中，第二装置也已经确定第一装置中的第一机器学习模型采用的是哪组参数。

若与第一装置(也即上述终端设备)进行数据通信的第二装置为另一个终端设备，则在步骤401之后，第一装置还可以将第一机器学习模型采用的一组参数(为方便描述，后续称为“一组目标参数”)发送给第二装置，从而第二装置能够确定第一装置中的第一机器学习模型采用的是哪一组参数。

若第一装置为终端设备，在另一种实现方式中(为方便描述，后续称为实现方式二)，第一装置中可以配置有与第一机器学习模型的参数对应的至少一个第三标识信息，前述至少一个第三标识信息中每个第三标识信息为第一机器学习模型能够采用的一组参数的标识信息，前述至少一个第三标识信息中每个第三标识信息指向的一组参数均符合第一装置的硬件能力，也即第一装置的硬件能力能够支持每个第三标识信息指向的一组参数被执行。在执行步骤401之前，第一装置可以向基站发送上述配置的所有第三标识信息，对应的，基站在接收到第一装置发送的至少一个第三标识信息之后，可以获取每个第三标识信息指向的一组训练后的参数(也即第一机器学习模型能够采用的一组参数)。基站向第一装置发送前述与至少一个第三标识信息一一对应的第一机器学习模型的至少一组训练后的参数，第一装置接收到前述与至少一个第三标识信息一一对应的至少一组参数。

步骤401可以包括：第一装置可以从前述与至少一个第三标识信息一一对应的至少一组参数中选择第一机器学习模型采用的一组目标参数。

示例性地，至少一个第三标识信息中不同的第三标识信息可以与至少一种第二预设指标的不同指标范围对应，第一装置可以根据至少一种第二预设指标的值，从与第一机器学习模型的参数对应的多个第三标识信息中确定一个第二标识信息，进而从与至少一个第三标识信息一一对应的至少一组参数中选择与一个第二标识信息对应的一组目标参数。

其中，“第一装置可以根据至少一种第二预设指标的值，从与第一机器学习模型的参数对应的多个第三标识信息中确定一个第二标识信息”的具体实现方式可以参阅上述对“第一装置可以根据至少一种第一预设指标的值，从与第一机器学习模型的参数对应的多个标识信息中确定一个第二标识信息”的具体实现方式的描述，此处不做赘述。

“至少一种第二预设指标”的含义和“至少一种第一预设指标”的类别可以相同或不同，具体“至少一种第二预设指标”的类别可以根据实际情况灵活设定，此处不做限定。

可选地，若与第一装置(也即上述终端设备)进行数据通信的第二装置为上述基站，则在步骤401之后，第一装置还可以向基站(也即第二装置的一个示例)发送上述第一装置从至少一个第三标识中确定出的一个第二标识信息，对应的，基站接收第一装置发送的一个第二标识信息，从而第二装置能够确定第一装置中的第一机器学习模型采用的是哪一组参数。

若与第一装置(也即上述终端设备)进行数据通信的第二装置为另一个终端设备，则在步骤401之后，第一装置还可以将第一机器学习模型采用的一组目标参数发送给第二装置，从而第二装置能够确定第一装置中的第一机器学习模型采用的是哪一组参数。

在另一种情况中，若第一装置为基站(为方便描述，后续称为实现方式三)，与第一装置进行数据通信的第二装置为终端设备，由于基站中可以部署有第一机器学习模型的多组训练后的参数，以及每组训练后的参数的标识信息，则步骤401可以包括：基站(也即第一装置的一个示例)可以根据至少一种第一预设指标的值，从与第一机器学习模型的多组训练后的参数中确定第一机器学习模型采用的一组目标参数。

示例性地，第一装置(也即基站)可以根据至少一种第一预设指标的值，从与第一机器学习模型对应的多个标识信息中确定一个第二标识信息，进而确定第二标识信息指向的一组参数，从而确定了第一机器学习模型采用的一组目标参数。

可选地，在步骤401之后，第一装置(也即基站)还可以将前述第一机器学习模型采用的一组目标参数发送给第二装置(也即与该基站通信的终端设备)，从而第二装置能够确定第一装置中的第一机器学习模型采用的是哪一组参数。

在另一种实现方式中(为方便描述，后续称为实现方式四)，在第一装置和第二装置进行数据通信之前，第一装置和第二装置中均已经有第一机器学习模型的多组训练后的参数以及每组训练后的参数的标识信息。示例性地，第一装置可以将第一机器学习模型的多组训练后的参数以及每组训练后的参数的标识信息发送给第二装置。例如，基站(第一装置的一个示例)可以将第一机器学习模型的多组训练后的参数以及每组训练后的参数的标识信息发送给终端设备(第二装置的一个示例)；又例如，终端设备(第一装置的一个示例)可以将第一机器学习模型的多组训练后的参数以及每组训练后的参数的标识信息发送给基站(第二装置的一个示例)；又例如，第一终端设备(第一装置的一个示例)可以将第一机器学习模型的多组训练后的参数以及每组训练后的参数的标识信息发送给第二终端设备(第二装置的一个示例)

或者，无线通信系统中的网络设备和移动台中均已经预先配置了第一机器学习模型的多组训练后的参数以及每组训练后的参数的标识信息，无线通信系统中的网络设备和移动台包括第一装置和第二装置。

则步骤401可以包括：第一装置可以从第一机器学习模型的多组训练后的参数中获取一组目标参数。示例性地，第一装置可以根据至少一种第一预设指标的值，从与第一机器学习模型的参数对应的多个标识信息中确定一个第二标识信息，进而确定第二标识信息指向的一组参数，从而确定了第一机器学习模型采用的一组参数。前述步骤的具体实现方式可以参阅上述描述，此处不做赘述。

可选地，在步骤401之后，第一装置还可以向第二装置发送前述一个第二标识信息，对应的，第二装置接收第一装置发送的一个第二标识信息。第二装置可以根据接收到的一个第二标识信息和第三数据，确定第一装置中的第一机器学习模型采用的是哪一组参数，第三数据包括第二装置中的与第一机器学习模型对应的多组参数以及每组参数的标识信息。对于第一装置和第二装置的具体形态可以结合实际应用场景灵活确定，此处不做限定。

为了更直观地理解本方案，请参阅图5，图5为本申请实施例提供的第一装置和第二装置确定第一机器学习模型采用的一组参数的一种流程示意图。如图5所示，501、第一装置向第二装置发送第一机器学习模型的多组参数以及每组参数的标识信息。502、第一装置向第二装置发送第二标识信息。503、第二装置根据第二标识和第三数据，确定第一装置中的第一机器学习模型采用的一组所述参数，第三数据包括第一机器学习模型的多组参数以及每组参数的标识信息，应理解，图5中的示例仅为方便理解本方案，不用于限定本方案。

本申请实施例中，第二装置中存在第一机器学习模型的多组参数以及每组参数的标识信息，第一装置仅需要向第二装置发送第二标识信息，第二装置就能够得知第一装置中的第一机器学习模型采用的是哪组参数，而传输第二标识信息所占用的通信资源较少，有利于减少所消耗的通信资源。

需要说明的是，本申请实施例中不限定上述“第二装置确定第一装置中的第一机器学习模型采用的是哪一组参数”这一操作与后续步骤402至411之间的执行顺序，“第二装置确定第一装置中的第一机器学习模型采用的是哪一组参数”这一操作可以在步骤402至411中任一步骤之前或之后执行。

在另一种实现方式中，可以预先仅定义第一机器学习模型的一组训练后的参数，前述第一机器学习模型的一组训练后的参数可以预先配置在第一装置中，则当第一装置需要使用第一机器学习模型时，可以直接从本地获取第一机器学习模型采用的一组参数。

本申请实施例中，为了使得第一装置获取到第一机器学习模型采用的一组训练后的参数，以及，为了使得与第一装置进行数据通信的第二装置能够确定第一装置中的第一机器学习模型采用的是什么样的参数，不同装置之间可能会需要发送与第一机器学习模型对应的训练后的参数和/或前述参数的标识信息。

例如，在上述实现方式一中，终端设备(也即第一装置的一个示例)可以向基站发送第二标识信息(也即与第一机器学习模型对应的训练后的参数的标识信息)。又例如，基站可以向终端设备发送第二标识信息指向的一组训练后的参数，也即第一机器学习模型采用的一组目标参数。又例如，终端设备(也即第一装置的一个示例)可以向另一个终端设备(也即第二装置的一个示例)发送第一机器学习模型采用的一组目标参数。

又例如，在上述实现方式二中，终端设备(也即第一装置的一个示例)可以向基站发送至少一个第三标识信息(也即与第一机器学习模型对应的训练后的参数的标识信息)。又例如，基站向终端设备(也即第一装置的一个示例)发送前述与至少一个第三标识信息一一对应的第一机器学习模型的至少一组训练后的参数。又例如，若与第一装置(也即上述终端设备)进行数据通信的第二装置为上述基站，第一装置还可以向基站(也即第二装置的一个示例)发送前述一个第二标识信息。又例如，若与第一装置(也即上述终端设备)进行数据通信的第二装置为另一个终端设备，第一装置还可以将第一机器学习模型采用的一组目标参数发送给第二装置等等，此处不再对上述实现方式三和实现方式四中的情况进行一一列举，具体可以参阅上述种种实现方式中的描述。

在一种实现方式中，与第一机器学习模型对应的训练后的参数和/或前述参数的标识信息可以携带于信令中，也即在上述种种实现方式中，不同装置之间通过发送信令的方式来发送与第一机器学习模型对应的训练后的参数和/或前述参数的标识信息。

当不同装置之间通过发送信令的方式来传输与第一机器学习模型对应的训练后的参数时，每个信令可以携带第一机器学习模型的至少一组训练后的参数。可选地，与第一机器学习模型对应的训练后的参数可以携带于如下一种或多种信息中：下行控制信息(downlink control information，DCI)、上行控制信息(uplink control information，UCI)、侧行链路控制信息(sidelink control information，SCI)、无线资源控制(radio resource control，RRC)信令、媒体访问控制的控制元素(media access control control element，MAC CE)或者其他类型的信令中，此处不做穷举。

例如，在上述实现方式一中，基站可以将携带有该第二标识信息指向的一组训练后的参数的DCI、RRC或MAC CE发送给终端设备(也即第一装置的一种示例)；对应的，第一装置可以从前述DCI、RRC或MAC CE中获取该第二标识信息指向的一组训练后的参数。

又例如，在上述实现方式一中，终端设备(也即第一装置的一种示例)可以将第一机器学习模型采用的一组目标参数携带于SCI、RRC或MAC CE发送给另一个终端设备(也即第二装置的一种示例)；对应的，第二装置可以从SCI、RRC或MAC CE中获取前述第一机器学习模型采用的一组目标参数。

又例如，在上述实现方式二中，基站可以将每个第三标识信息以及每个第三标识信息指向的一组训练后的参数携带于DCI、RRC或MAC CE中发送给终端设备(也即第一装置的一个示例)；对应的，第一装置可以从DCI、RRC或MAC CE中获取每个第三标识信息以及每个第三标识信息指向的一组训练后的参数。

又例如，在上述实现方式四中，终端设备(第一装置的一个示例)可以将第一机器学习模型的每组训练后的参数以及每组训练后的参数的标识信息携带于UCI、RRC或MAC CE中发送给基站(第二装置的一个示例)；对应的，基站可以从UCI、RRC或MAC CE中获取第一机器学习模型的每组训练后的参数以及每组训练后的参数的标识信息等等。

需要说明的是，此处不对上述种种实现方式中通过信令携带与第一机器学习模型对应的训练后的参数的情况一一进行赘述，上述种种实现方式中其他通过信令携带与第一机器学习模型对应的训练后的参数的情况可参阅前述描述进行理解。

示例性地，当通过信令(为方便描述，后续称为“第一信令”)携带第一机器学习模型的至少一组训练后的参数时，第一信令中可以携带有第一机器学习模型采用的至少一组参数以及每组参数所对应的指示信息，每组参数所对应的指示信息用于指示每组参数包括的多个参数在第一机器学习模型中的位置。可选地，第一信令为如下任一种：DCI、UCI、SCI、RRC、MAC CE或其他类型的信令等。

例如，在上述实现方式一中，当基站需要向第一装置发送第二标识信息指向的一组训练后的参数时，基站可以向第一装置发送第一信令，对应的，第一装置可以接收基站发送的第一信令，并从第一信令中获取第一机器学习模型采用的一组参数。

又例如，在上述实现方式二中，当基站需要向第一装置发送每个第三标识信息指向的一组训练后的参数时，基站可以向第一装置发送一个或多个第一信令，每个第一信令中携带一个第三标识信息以及该一个第三标识信息指向的一组参数等等，此处不再上述种种实现方式中的其他情况进行一一列举。

本申请实施例中，当通过信令传输第一机器学习模型的至少一组参数时，信令中不仅携带前述至少一组参数，还会携带每组参数所对应的指示信息，该指示信息用于指示每组参数包括的多个参数在第一机器学习模块中的位置，从而第一装置在接收到该信令之后，就能够明白如何使用信令中携带的参数，且采用信令的方式传输第一机器学习模型的至少一组参数，有利于降低参数传输过程中所消耗的通信资源，且提高参数传输过程的效率。

可选地，每组参数所对应的指示信息可以包括每组参数中每个参数在第一机器学习模型的层数，以及该层中运算时所采用的参数值。示例性地，第一信令中每个参数的名称和第一机器学习模型中的每个参数的名称可以一致，第一信令携带的信息可以包括如下内容：

{层[1]：{矩阵U1_1：{u11(1,1),u11(1,2),u11(2,1),u11(2,2),…}，矩阵U1_2：{u12(1,1),u12(1,2),u12(1,3),u12(2,1),…}，向量b1_1:{b11(1),b11(2),…}}

层[2,3,4]：{矩阵U2_1：{u21(1,1),u12(1,2),u21(2,1),u12(2,2),…}，矩阵U2_2：{u22(1,1),u22(1,2),u22(1,3),u22(2,1),…}，向量b2_1:{b21(1),b21(2),…}}

层[5]：{矩阵U3_1：{u31(1,1),u31(1,2),u31(1,3),…}，矩阵U3_2：{u32(1,1),u32(1,2),u33(2,1),…}，向量b3_1:{b31(1),b31(2),…}}}

上述信息代表第一机器学习模型中第一个神经网络层采用的参数包括矩阵U1_1、矩阵U1_2和向量b1_1，矩阵U1_1的值为{u11(1,1),u11(1,2),u11(2,1),u11(2,2),…}，矩阵U1_2的值为{u12(1,1),u12(1,2),u12(1,3),u12(2,1),…}，向量b1_1的值为b11(1),b11(2),…}等，对于第一机器学习模型的第二个神经网络层至第五个神经网络层采用的参数的含义可以结合前述描述进行理解，此处不做赘述。

为了更直观地理解本方案，如下以第一信令为MAC CE和RRC为例，展示了在MAC CE和RRC中携带第一机器学习模型的一组参数时的具体格式。先参阅如下表3，表3中示出了第一机器学习模型的一组参数在MAC CE中的格式。

表3

表3中的R代表无意义的参数，也即第一机器学习模型中不会采用R，表3中以第一机器学习模型包括2个神经网络层为例，在表3的第一行(也即MAC CE的第一行)先声明第一机器学习模型的第1个神经网络层采用的参数包括U₀、W₀、θ_s0、V₀以及θ_o0，并在第二行至第六行中分别示出了第一机器学习模型的第1个神经网络层采用的5个参数的值。在表3的第七行(也即MAC CE的第七行)声明了第一机器学习模型的第2个神经网络层采用的参数包括U₁、W₁、θ_s1、V₁以及θ_o1，并在第八行至第十二行示出了第一机器学习模型的第2个神经网络层采用的5个参数的值，由于第一装置的第一机器学习模型中采用的参数也是U₀、W₀、θ_s0、V₀、θ_o0、U₁、W₁、θ_s1、V₁以及θ_o1，则第一装置在接收到MAC CE之后，能够确定第一机器学习模型中每个参数的取值，应理解，表3中的示例仅为方便理解本方案，不用于限定本方案。

接下来介绍当通过RRC携带第一机器学习模型的一组或多组参数时，RRC中携带的内容可以如下：

其中，matrixU SEQUENCE{}代表{}中的参数的值均为矩阵，Ui0j0代表第一机器学习模型的参数matrixU的第i0行第j0列的参数，Ui0j0,REAL中的REAL代表的是Ui0j0这一参数的值的类型是实数；同理，Ui1j1代表第一机器学习模型的参数matrixU的第i1行第j1列的参数，Ui1j1,REAL中的REAL代表的是Ui1j1这一参数的值的类型是实数。vector SEQUENCE{}代表{}中的参数的值均为向量，v0为第一机器学习模型的参数vector的第0个参数，v0,REAL中的REAL代表的是v0这一参数的值的类型是实数；v1为第一机器学习模型的参数vector的第1个参数，v1,REAL中的REAL代表的是v1这一参数的值的类型是实数。采用前述方式RRC中可以携带第一机器学习模型的一组参数，且在获取到RRC之后，还可以知道一组参数中的每个参数在第一机器学习模型中的位置，应理解，上述举例仅为方便理解本方案，不用于限定本方案。

为更直观地理解本方案，请参阅图6，图6为本申请实施例提供的第一装置获取第一机器学习模型采用的一组参数的一种流程示意图。601、第一装置向基站发送UCI，该UCI中携带有第二标识信息。602、基站获取第二标识信息指向的一组参数，也即第一机器学习模型采用的一组参数。603、基站获取DUI，该DUI中携带有第二标识信息指向的一组参数以及前述一组参数所对应的指示信息，前述一组参数所对应的指示信息用于指示前述一组参数包括的多个参数在第一机器学习模型中的位置。604、基站向第一装置发送该DUI，对应的，第一装置接收该DUI。需要说明的是，图6中的UCI和DUI也可以替换为其他类型的信令，图6中的示例仅为方便理解本方案，不用于限定本方案。

当不同装置之间通过发送信令的方式来传输与第一机器学习模型对应的训练后的参数的标识信息时，可选地，参数的标识信息携带于如下任一种或多种信息中：DCI、UCI、SCI、RRC信令、MAC CE、物理广播信道(physical broadcast channel，PBCH)、物理随机接入信道(physiacal random access channel，PRACH)或其他类型的信令中，此处不做穷举。

例如，在上述实现方式一中，终端设备(也即第一装置的一个示例)可以将第二标识信息携带于UCI、MAC CE或PRACH中发送给基站。又例如，在上述实现方式四中，若第一装置为基站，第二装置为终端设备，则基站可以将第二标识信息携带于DCI、MAC CE或PBCH中发送给终端设备。又例如，在上述实现方式四中，若第一装置和第二装置均为终端设备，则第一终端设备可以将第二标识信息携带于SCI或MAC CE中发送给第二终端设备等等；需要说明的是，此处不对上述种种实现方式中通过信令携带与第一机器学习模型对应的训练后的参数的标识信息情况一一进行赘述，上述种种实现方式中其他通过信令携带前述标识信息的情况可参阅前述描述进行理解。

本申请实施例中，相比于将第一机器学习模型的至少一组参数和/或每组参数的标识信息携带于数据包中传输，将前述至少一组参数和/或每组参数的标识信息携带于信令中传输，传输效率更高，且消耗的计算机资源更少；此外，本方案中提供了多种能够用于传输前述至少一组参数和/或每组参数的标识信息的信令，提高了本方案的实现灵活性。

在另一种实现方式中，与第一机器学习模型对应的训练后的参数和/或前述参数的标识信息可以携带于数据包中，也即在上述种种实现方式中，不同装置之间通过发送数据包的方式来发送与第一机器学习模型对应的训练后的参数和/或前述参数的标识信息，

例如，在上述实现方式一中，终端设备(也即第一装置的一个示例)可以向基站发送携带第二标识信息的第一数据包，对应的，基站可以从第一数据包中获取到第二标识信息。又例如，基站可以向终端设备(也即第一装置的一个示例)发送第二数据包，第二数据包中携带第二标识信息指向的一组训练后的参数；终端设备可以从第二数据包中获取第一机器学习模型采用的前述一组目标参数。又例如，终端设备(也即第一装置的一个示例)可以向另一个终端设备(也即第二装置的一个示例)发送第三数据包，第三数据包中携带第一机器学习模型采用的一组目标参数；第二装置可以从第三数据包中获取第一装置中的第一机器学习模型采用的一组目标参数等等。

需要说明的是，此处不再对实现方式二、实现方式三以及实现方式四中的具体实现方式进行一一赘述，实现方式二、实现方式三以及实现方式四中的具体实现方式可以参阅上述对实现方式一种的描述进行理解。

可选地，在第一装置和第二装置进行数据传输的过程中，可以对第一机器学习模型进行再次训练，以优化第一机器学习模型中采用的参数，第一装置在得到第一机器学习模型的一组更新后的参数。可选地，在第一装置得到第一机器学习模型的一组更新后的参数之后，可以把第一机器学习模型的一组更新后的参数发送给第二装置。

示例性地，在一种实现方式中，无论第一装置是终端设备还是基站，均由基站对第一机器学习模型进行再次训练，得到第一机器学习模型的一组更新后的参数。在一种情况中，若第一装置为终端设备，则第一装置可以向基站发送请求，前述请求用于请求基站对第一机器学习模型进行再次训练，基站将第一机器学习模型的一组更新后的参数发送给第一装置。可选地，第一装置还可以向第二装置发送前述一组更新后的参数。

在另一种情况中，若第一装置为基站，则基站在得到第一机器学习模型的一组更新后的参数之后，还可以向第二装置发送前述一组更新后的参数，从而第二装置能够确定第一装置中的第一机器学习模型采用的一组更新后的参数。

在另一种实现方式中，由第一装置对第一机器学习模型进行再次训练，得到第一机器学习模型的一组更新后的参数。可选地，第一装置还会将第一机器学习模型的一组更新后的参数发送给第二装置。

例如，若第一装置为终端设备，第二装置为基站，则终端设备在对第一机器学习模型进行再次训练，得到第一机器学习模型的一组更新后的参数之后，可以将前述一组更新后的参数发送给基站。又例如，若第一装置为第一终端设备，第二装置为第二终端设备，则第一终端设备在对第一机器学习模型进行再次训练，得到第一机器学习模型的一组更新后的参数之后，可以将前述一组更新后的参数发送给第二终端设备等等，此处不对各种情形进行穷举。

需要说明的是，上述各种实现方式中各个装置之间发送“第一机器学习模型的一组更新后的参数”的方式可以参阅上述描述，此处不做赘述。

402、第一装置获取T的取值，T为大于或等于1的整数，T代表第一机器学习模型的输出数据包括的子数据的个数。

本申请实施例中，T代表第一机器学习模型的输出数据包括的子数据的个数。例如，若采用第一机器学习模型执行的任务是调制，则第一机器学习模型的输出数据是调制后的数据，调制后的数据可以包括T组调制后的符号。又例如，若采用第一机器学习模型执行的任务是编码，则第一机器学习模型的输出数据是编码后的数据，编码后的数据可以包括T组编码后的比特数据。又例如，若采用第一机器学习模型执行的任务是生成参考信号，则第一机器学习模型的输出数据是参考信号，T代表的可以为前述参考信号的长度，示例性地，参考信号的长度可以指示参考信号包括的符号的数量。

403、第一装置获取待处理数据。

404、第一装置判断待处理数据的长度是否小于H，若判断结果为是，则进入步骤405；若判断结果为否，则进入步骤406，H指示第一数据的长度。

本申请实施例中，步骤404为可选步骤，第一装置还可以获取待处理数据的长度和H的取值，待处理数据的长度可以为K，K为大于或等于1的整数，H指示第一数据的长度，也即H指示第一机器学习模型的输入数据的期望长度，H为大于或等于1的整数。

第一装置在获取到K和H的取值之后，可以判断K是否小于H；若判断结果为是，则进入步骤405；若判断结果为否，则进入步骤406。

可选地，待处理数据的长度可以为待处理数据的比特位数。例如，若采用第一机器学习模型执行的任务是编码，则待处理数据为需要编码的数据，待处理数据的长度可以为需要编码的数据的比特位数。又例如，若采用第一机器学习模型执行的任务是调制，则待处理数据为需要调制的数据，待处理数据的长度可以为需要调制的数据的比特位数。又例如，若采用第一机器学习模型执行的任务是编码和调制，则待处理数据为需要编码和调制的数据，待处理数据的长度为需要执行编码和调制的数据的比特位数。又例如，若采用第一机器学习模型执行的任务是生成参考信号，则待处理数据包括多个参考信号的索引号，待处理数据的长度为前述多个参考信号的索引号的比特位数等等。

或者，若采用第一机器学习模型执行的任务是生成参考信号，则待处理数据包括多个参考信号的索引号，待处理数据的长度可以为前述多个参考信号的个数等等，“待处理数据的长度”的含义可以结合实际情况灵活确定，此处不做限定。

405、第一装置对待处理数据进行填充，得到第一数据，第一数据的长度为H。

本申请实施例中，步骤405为可选步骤，若第一装置确定待处理数据的长度小于H，则第一装置可以对待处理数据进行填充，得到第一数据，第一数据的长度为H，则第一数据可以包括待处理数据和填充数据。本申请实施例中，当待处理数据的长度小于H时，对待处理数据进行填充得到长度为H的第一数据，再将长度为H的第一数据输入第一机器学习模型中，从而无论待处理数据的长度是多少，第一机器学习模型处理的都是长度为H的第一数据，不仅有利于兼容任意长度的待处理数据，且有利于降低第一机器学习模型在进行数据处理时的难度，以得到性能更好的第二数据。

在一种情况中，填充数据可以包括第一标识信息，第一标识信息用于标识T的取值和/或K的取值，也即第一标识信息可以用于标识T的取值和K的取值，也可以用于标识T的取值，也可以用于标识K的取值。其中，T的取值为第一机器学习模型的输出数据包括的子数据的个数，K为待处理数据的长度，T和K均为大于或等于1的整数。

示例性地，第一装置在获取到T的取值和/或K的取值之后，可以采用第一函数对T的取值和/或K的取值进行处理，以得到第一标识信息。第一函数需要满足的条件包括：将第一标识信息的取值限制在预设范围内，且，能够将不同T的取值和/或K的取值映射为不同的值，也即通过该第一函数生成的值能够唯一的标识某一个T的取值和/或K的取值，又或者说通过该第一函数生成的值能够对不同的T的取值和/或K的取值进行区分。

示例性地，第一函数可以为二元函数、线性函数或非线性函数。例如，此处以第一标识信息用于标识T的取值和K的取值为例，如下公开了第一函数的一个示例：
f(T,K)＝1–2*((K-3)*11+(T-4))/98； (1)

其中，f(T,K)代表第一函数的一个示例，式(1)中的示例仅为方便理解本方案，不用于限定本方案。

本申请实施例中，在第一数据中携带有用于标识T的取值和/或K的取值的第一标识信息，则第一机器学习模型能够根据T的取值和/或K的取值，即根据第一机器学习模型的输出数据的长度和/或真实的待处理数据的长度处理第一数据，进而通过第一机器学习模型输出的第二数据，有利于得到性能更好的第二数据。

可选地，若填充数据在携带了第一标识信息之后还有剩余空间，则在一种情况中，填充数据还可以携带第一装置的标识信息。示例性地，若第一装置为终端设备，则第一装置可以为该终端设备的标识信息；若第一装置为基站，则第一装置可以为该基站的标识信息；例如，第一装置的标识信息可以为无线网络临时标识(radio network tempory identity，RNTI)、小区(cell)标识(identity，ID)、物理小区标识(physical cell identity,PCI)或其他类型的标识信息等，此处不做穷举。

在另一种情况中，填充数据中还可以携带无效信息，示例性地，填充数据中的剩余空间中可以均填充为0、1或其他数值等，此处示例仅为方便理解本方案，不用于限定本方案。

为了进一步理解本方案，如下公开了第一装置在执行上述填充操作时采用的代码的一个示例，待处理数据为b₀,b₁,…,b_K-1：

参阅上述代码可知，在对待处理数据进行填充的过程中，对i从0到H-1依次取值，若i小于K，则从待处理数据中获取b_i，并将b_i转换为c_i并放入第一数据中，c_i代表第一数据中第i+1个数据；若i大于或等于K且小于H-1，则将0填充至第一数据中；若i等于H-1，则将第一标识信息填充至第一数据中，第一标识信息的含义可以参阅上述描述，此处不做赘述，应理解，此处示例仅为方便理解本方案，不用于限定本方案。

为更直观地理解本方案，请参阅图7，图7为本申请实施例提供的第一数据的一种示意图。如图7所示，第一数据包括待处理数据、用于填充的0以及第一标识信息，图7中的示例仅为方便理解本方案，不用于限定本方案。

在另一种情况中，填充数据中可以包括第一装置的标识信息，且不包括第一标识信息。在另一种情况中，填充数据中携带的可以均为无效信息。

406、第一装置将第一标识信息和待处理数据进行融合，得到第一数据，第一标识信息用于标识T的取值和/或K的取值，K为待处理数据的长度，K为大于或等于1的整数。

本申请实施例中，步骤406为可选步骤，若第一装置确定待处理数据的长度等于H，第一装置还可以将第一标识信息和待处理数据进行融合，得到第一数据；对于第一标识信息的含义可以参阅上述描述，此处不做赘述。

示例性地，“将第一标识信息和待处理数据进行融合”包括但不限于：将第一标识信息和待处理数据进行拼接、相加或其他融合方式等等，此处不做限定。

需要说明的是，步骤404至406均为可选步骤，若步骤404至406均不执行，则可以直接将待处理数据确定为第一数据。或者，也可以不执行步骤404和405，仅执行步骤406。

或者，也可以执行步骤404和405，且不执行步骤406，则当第一装置确定待处理数据的长度等于H时，也可以直接将待处理数据确定为第一数据。

407、第一装置将第一数据输入第一机器学习模型，得到第一机器学习模型生成的第二数据，第二数据包括T个子数据，其中，第一机器学习模型包括一个或多个模块，每调用第一机器学习模型中的模块至少一次得到一个子数据。

本申请实施例中，第一装置在获取到第一数据之后，在一种实现方式中，第一装置可以直接将第一数据输入第一机器学习模型中。在另一种实现方式中，第一装置还可以采用第一装置的标识信息对第一数据进行加扰，并将加扰后的第一数据输入第一机器学习模型中，对于第一装置的标识信息的含义可以参阅上述描述，此处不做赘述。

“每调用第一机器学习模型中的模块至少一次得到一个子数据”代表每调用第一机器学习模型中的一个模块至少一次能够得到T个子数据中的一个子数据，或者，每调用第一机器学习模型中的多个模块至少一次能够得到T个子数据中的一个子数据。

第一机器学习模型的功能包括如下任一项或多项的组合：编码、调制或生成参考信号。例如，若第一机器学习模型的功能为编码，则T个子数据代表T组编码后的比特数据，每组编码后的比特数据可以包括一个或多个比特数据。又例如，若第一机器学习模型的功能是调制，则T个子数据代表T组调制后的符号，每组调制后的符号可以包括一个或多个符号。又例如，若第一机器学习模型的功能是编码和调制，则T个子数据代表T组编码和调制后的符号，每组编码和调制后的符号可以包括一个或多个符号。又例如，若第一机器学习模型的功能是生成参考信号，则T个子数据可以代表参考信号中的T组符号等，应理解，此处举例仅为方便理解本方案，不用于限定本方案。

本申请实施例中，提供了第一机器学习模型的多种功能，扩展了本方案的应用场景，提高了本方案的实现灵活性。

在一种情况中，第一机器学习模型可以包括第一模块和至少一个第二模块，第一模块和第二模块的区别包括：第一模块的初始输入为第一数据或加扰后的第一数据，第二模块的初始输入为第一数据(或加扰后的第一数据)的特征信息。

示例性地，每调用第一机器学习模型中的第二模块一次，就能够得到T个子数据中的一个子数据，则步骤407可以包括：第一装置将第一数据(或加扰后的第一数据)输入第一模块，得到第一模块生成的第一子数据，第一子数据为T个子数据中的一个；第一装置在利用第一模块生成第一子数据的过程中能够得到第一数据的特征信息。第一装置将第一特征信息输入第二模块，得到第二模块生成的第二子数据，其中，第一特征信息包括上一次调用第一机器学习模型中的模块进行数据处理时生成的特征信息，第二子数据为T个子数据中的一个。本申请实施例中，第一机器学习模型包括第一模块和至少一个第二模块，第一机器学习模型的第一模块的输入为整个第一数据，第二模块的输入为上一次调用第一机器学习模型的模块时得到的特征信息，则第一次调用第二模块时输入的为通过第一模块对整个第一数据进行处理时得到的特征信息，从而每次输入第二模块的特征信息均参考了整个第一数据，也即在生成T个子数据中的每个子数据时均参考了整个第一数据的信息，有利于得到性能更好的第二数据；且每调用第二模块一次就能够得到T个子数据中的一个第二子数据，有利于快速的得到第二数据中包括的T个子数据。

针对“第一子数据”的获取过程，具体的，第一装置可以通过调用第一模块一次或多次的方式，得到第一模块生成的第一子数据；可选地，若第一装置通过调用第一模块多次的方式，得到第一模块生成的第一子数据，则第一次调用第二模块时输入的第一特征信息为最后一次调用第一模块时生成的特征信息。在一种实现方式中，第一装置在将第一数据(或加扰后的第一数据)输入第一模块中，通过第一模块对第一数据(或加扰后的第一数据)进行处理之后，直接输出第一子数据。

示例性地，第一模块可以选用卷积神经网络、循环神经网络、全连接神经网络或其他类型的神经网络等等，此处均不做限定。

可选地，第一装置利用第一模块对第一数据(或加扰后的第一数据)进行处理的过程可以包括：第一装置通过第一模块对第一数据(或加扰后的第一数据)进行线性变换，并采用第三激活函数进行处理，得到第一数据(或加扰后的第一数据)的特征信息；对第一数据(或加扰后的第一数据)的特征信息进行线性变换，并采用第四激活函数进行处理，得到第一模块生成的第一子数据。

示例性地，第一机器学习模块中的激活函数可以为如下任一种：tanh(x)、max(min(a*x,+1),-1)、sin(x)或其他类型的激活函数等等，此处举例仅为证明本方案的可实现性，不用于限定本方案。

第三激活函数和第四激活函数可以采用相同的激活函数，也可以采用不同的激活函数，具体可以结合实际情况灵活设定，本申请实施例中不做限定。

在另一种实现方式中，第一装置在将第一数据(或加扰后的第一数据)输入第一模块中，通过第一模块对第一数据(或加扰后的第一数据)进行处理。第一装置获取前述处理过程中得到的第一数据(或加扰后的第一数据)的第二特征信息，将第二特征信息再次输入第一模块，通过第一模块对第二特征信息进行处理；第一装置重复执行前述“获取上一次调用第一模块进行数据处理的过程中得到的第二特征信息，将第二特征信息再次输入第一模块，通过第一模块对第二特征信息进行处理”的步骤至少一次，将最后一次调用第一模块对第二特征信息进行处理时的处理结果作为第一子数据。

示例性地，第一装置每次利用第一模块对输入数据进行处理的过程可以包括：第一装置通过第一模块对输入数据进行线性变换，并采用第三激活函数进行处理，得到变换后的输入数据；对变换后的输入数据进行线性变换，并采用第四激活函数进行处理，得到第一模块的处理结果。其中，第一模块的输入数据可以为第一数据(或加扰后的第一数据)，或者，为第一数据(或加扰后的第一数据)的特征信息。

针对“每个第二子数据”的获取过程，具体的，第一装置每次调用第二模块时，会将第一特征信息输入第二模块中，通过第二模块对第一特征信息进行处理，得到第二模块生成的第二子数据，第二子数据为T个子数据中的一个。

其中，第一特征信息为上一次调用第一机器学习模型中的模块进行数据处理时生成的特征信息；示例性地，第一特征信息可以为上一次调用第一机器学习模型中的第一模块进行数据处理时生成的特征信息，也可以为上一次调用第一机器学习模型中的第二模块进行数据处理时生成的特征信息。

示例性地，每个第二模块可以选用卷积神经网络、循环神经网络、全连接神经网络或其他类型的神经网络等等，此处均不做限定。

可选地，第一装置每次利用第二模块对第一特征信息进行处理的过程可以包括：第一装置通过第二模块对第一特征信息进行线性变换，并采用第一激活函数进行处理，得到变换后的特征信息；对变换后的特征信息进行线性变换，并采用第二激活函数进行处理，得到第二模块生成的第二子数据。其中，第一激活函数和第二激活函数均为第一机器学习模型内的激活函数，具体采用哪种激活函数可以结合实际情况灵活设定。

本申请实施例中，提供了第二模块进行数据处理时的具体实现方式，由于上述方式简单且易于实现，不仅有利于减少在生成第二数据的过程中消耗的计算机资源；且上述方式示出的第二模块中采用的参数量较少，有利于降低在传输第一机器学习模型的参数时消耗的通信资源。

为了进一步理解本方案，如下公开了第一装置生成T个子数据的代码的一种示例，T个子数据包括x⁽⁰⁾,x⁽¹⁾,…,x^(T-1)，如下代码中以第一机器学习模型包括一个第一模块和一个第二模块，通过调用第一模块一次得到一个第一子数据，通过调用第二模块T-1次得到T-1个第二子数据：

参阅上述代码，第一模块中采用的参数包括U、θ_s、V和θ_o，第二模块中采用的参数包括W、θ_s、V和θ_o，θ′_s代表θ_s的转置，θ′_o代表θ_o的转置，此处示例中以第一模块和第二模块采用的参数的值相同为例，也即第一模块中的U和第二模块中的W的取值相同。其中，c代表第一数据，c′代表第一数据的转置，Uc′+θ′_s代表对转置后的第一数据进行线性变换， s′₀＝tanh(Uc′+θ′_s)代表对转置后的第一数据进行线性变换之后并采用第三激活函数进行处理，得到变换后的第一数据s′₀(也即第一数据的特征信息s′₀)。o′₀＝Vs′₀+θ′_o代表对第一数据的特征信息s′₀进行线性变换之后得到o′₀，o₀代表o′₀的转置，exp(j2πo₀)代表利用第四激活函数对o₀进行处理，得到第一子数据x₀。

对于每个1 to T-1这T-1个第二子数据，s′_t-1代表第一特征信息，也即上一次调用第一机器学习模型中的模块进行数据处理时生成的特征信息，与第一模块的处理方式类似，s′_t＝tanh(Ws′_t-1+θ′_s)代表对第一特征信息进行线性变换之后并采用第一激活函数进行处理，得到变换后的特征信息s′_t；o′_t＝Vs′_t+θ′_o代表对变换后的特征信息s′_t进行线性变换之后得到o′_t，o_t代表o′_t的转置，exp(j2πo_t)代表利用第二激活函数对o_t进行处理，得到一个第二子数据x_t，重复调用第二模块T-1次，能够得到T-1个第二子数据。

需要说明的是，此处以第一机器学习模型仅包括一个第一模块和一个第二模块，且第一模块和第二模块中采用的参数一致为例，仅为方便理解本方案的一个示例，在实际应用的过程中，第一模块和第二模块采用的参数也可以不一致，第一机器学习模型中也可以包括多个第二模块。

为更直观地理解本方案，请参阅图8，图8为本申请实施例提供的利用第一机器学习模型生成T个子数据的一种示意图。图8中以每调用第一机器学习模型中的模块(也即第一模块或第二模块)一次，能够得到T个子数据中的一个子数据为例，如图8所示，在将第一数据输入第一机器学习模型之后，可以通过第一模块对第一数据进行线性变换，并利用第三激活函数进行处理得到S₀(也即第一数据的特征信息)，对S₀进行线性变换得到O₀，对O₀进行处理之后得到第一模块生成的一个第一子数据。

将调用第一模块对第一数据进行处理的过程中生成的S₀输入第一机器学习模型的第二模块，通过第二模块对S₀进行线性变换，并利用第一激活函数进行处理得到S₁(也即第一数据的更新后的特征信息)，对S₁进行线性变换得到O₁，对O₁进行处理之后得到第二模块生成的第一个第二子数据。

在生成T-1个第二子数据的过程中，均将上一次调用第一机器学习模型的模块进行处理时生成的特征信息(也即S_t-1)输入第二模块，示例性地，若为第一次调用第一机器学习模型的第二模块，则将调用第一机器学习模型的第一模块进行处理时生成的特征信息(S_t-1的一个示例)输入第二模块；若为第二次至第T-1次调用第二模块，则将上一次调用第二模块进行处理时生成的特征信息(S_t-1的另一个示例)输入当前次调用的第二模块。通过第二模块对S_t-1进行线性变换，并利用第一激活函数进行处理得到S_t(也即第一数据的更新后的特征信息)，对S_t进行线性变换得到O_t，对O_t进行处理之后得到第二模块生成的第T个子数据，则可以通过调用第二模块T-1次的方式得到T-1个第二子数据，T-1个第二子数据和1个第一子数据可以组成第二数据中的T个子数据，图8中的示例仅为方便理解本方案，不用于限定本方案。

可选地，第一机器学习模型可以包括多个第二模块，其中，多个第二模块中至少两个第二模块采用的参数不同。也即第一装置每调用第二模块一次能够生成一个第二子数据，但在生成T-1个第二数据的过程中调用的可以为不同的第二模块。

“采用的参数不同的两个第二模块”的含义可以包括如下任一种不同：两个第二模块中采用了相同类型的参数，但两个第二模块中采用的参数值不完全相同；或者，两个第二模块中采用的参数的类型不完全相同等，此处不做穷举。“两个第二模块采用的参数相同”代表两个第二模块不仅采用的参数的类型完全一致，而且每个参数的取值也完全一致。

例如，多个第二模块可以包括第二模块1、第二模块2和第二模块3，T的取值为8，则需要生成7个第二子数据，可以每个第二模块用来生成相同数量(例如3个)的第二子数据，也即在生成前3个第二数据时采用第二模块1，在生成第4个、第5个和第6个第二子数据时采用第二模块2，在生成第7个第二子数据时采用第二模块3。

又例如，多个第二模块可以包括第二模块1、第二模块2和第二模块3，T的取值为8，则需要生成7个第二子数据，可以每个第二模块生成的第二子数据的个数也可以不同，也即在生成前3个第二数据时采用第二模块1，在生成第4个和第5个第二子数据时采用第二模块2，在生成第6个和第7个第二子数据时采用第二模块3，需要说明的是，此处举例均仅为方便理解本方案，不用于限定本方案。

为了进一步理解本方案，如下公开了第一装置采用多个第二模块生成T-1个第二子数据时的代码的一种示例：

其中，对于s′_t-1、W、θ′_s、V以及θ′_o的含义均可以参阅上述描述，此处不做赘述，x_t代表第二数据包括的T个子数据中第t+1个子数据，不同的第二模块采用的θ_s和θ_o相同，不同的第二模块采用的W和V不同，W_t mod τ和V_t mod τ代表周期性调用τ个第二模块，τ个第二模块中存在τ组不同的参数，W_t mod τ具体可以表现为W₀、W₁…W_τ-1，V_t mod τ具体可以表现为V₀、V₁…V_τ-1，τ组不同的参数分别包括W₀和V₀、W₁和V₁…W_τ-1和V_τ-1，一个周期通过τ个第二模块生成τ个第二子数据，下一周期重新采用该τ个第二模块，例如，第一机器学习模型可以包括第二模块1、第二模块2以及第二模块3这三个第二模块，则可以循环调用这3个第二模块，先通过第二模块1(也即采用了W₁和V₁)生成1个第二子数据之后，再通过第二模块2(也即采用了W₂和V₂)生成1个第二子数据之后，再通过第二模块3(也即采用了W₀和V₀)生成1个第二子数据之后，可以再一次调用第二模块1，以此类推等等，应理解，此处示例仅为方便理解本方案，不用于限定本方案。

本申请实施例中，第一机器学习模型中可以采用多个第二模块，多个第二模块中存至少两个第二模块采用的参数不同，也即T-1个第二子数据是由不同的第二模块生成的，有利于第二模块的参数和生成的第二子数据之间的匹配度，从而有利于得到性能更好的第二数据。

在另一种情况中，第一机器学习模型可以包括第一模块和至少一个第三模块，第一模块和第三模块的区别包括：第一模块的初始输入为第一数据或加扰后的第一数据，第三模块的初始输入为第一数据(或加扰后的第一数据)的特征信息。“第三模块”和“第二模块”的含义类似，可参阅上述描述理解，此处不做赘述。

示例性地，每调用第一机器学习模型中的第三模块多次，能够得到T个子数据中的一个子数据，则步骤407可以包括：第一装置将第一数据(或干扰后的第一数据)输入第一模块，通过第一模块生成第一子数据，第一子数据为T个子数据中的一个；前述步骤的具体实现方式可参阅上述描述，此处不做赘述。第一装置调用第三模块多次，得到第三模块生成的第三子数据，第三子数据为T个子数据中的一个，其中，第三模块的输入包括第一数据的特征信息，在调用第三模块多次的过程中对第一数据(或干扰后的第一数据)的特征信息进行多次更新。

其中，“第三模块对输入数据进行处理的过程”与“第二模块对输入数据进行处理的过程”类似，区别在于，第一装置每调用第二模块一次，就会将第二模块生成的处理结果作为一个第二子数据；而第一装置需要调用一个第三模块多次，在调用第三模块多次的过程中对第一数据(或干扰后的第一数据)的特征信息进行多次更新，才会将最后一次调用第三模块得到的处理结果作为一个第三子数据。第三子数据、第二子数据以及第一子数据均为第二数据中包括的子数据，对于子数据的含义可以参阅上述描述，此处不做赘述。

示例性地，第一装置将第一数据(或干扰后的第一数据)的特征信息输入第三模块中，通过第三模块对第一数据进行处理，前述处理过程包括对第一数据的特征信息进行更新。第一装置将第一数据(或干扰后的第一数据)的更新后的特征信息再次输入第三模块中，再次通过第三模块对第一数据(或干扰后的第一数据)的更新后的特征信息进行处理，前述处理过程包括对第一数据(或干扰后的第一数据)的特征信息进行再次更新；第一装置重复执行前述操作至少一次，在利用第三模块对第一数据(或干扰后的第一数据)的特征信息进行处理的次数达到预设次数时，得到该第三模块生成的一个第三子数据。

为了进一步理解本方案，如下公开了利用一个第三模块生成一个第三子数据时采用的代码的一个示例：

其中，对于W、θ′_s、V、θ′_o以及x_t的含义均可以参阅上述描述，此处不做赘述，s′_tl-1代表上一次调用第三模块时生成的第一数据的特征信息，s′_tN代表对第一数据的特征信息更新N次后生成的第一数据的更新后的特征信息，x_t代表对第三模块调用N次后生成的一个第三子数据，N为大于或等于2的整数，此处示例仅为方便理解本方案，不用于限定本方案，

本申请实施例中，调用第三模块多次以对第一数据的特征信息进行多次更新之后，才根据最后的第一数据的更新后的特征信息，生成一个第三子数据，在对第一数据的多次更新之后，有利于更加透彻的了解第一数据，从而生成性能更好的子数据。

可选地，第一机器学习模型中的参数的尺寸与H的取值以及G的取值相关，H为第一数据的长度，G为T个子数据中每个子数据的长度。

例如，若第一机器学习模型的功能为编码，则T个子数据代表T组编码后的比特数据，G代表每组编码后的比特数据中的比特位数。又例如，若第一机器学习模型的功能是调制，则T个子数据代表T组调制后的符号，G代表每组调制后的符号中符号的个数。又例如，若第一机器学习模型的功能是编码和调制，则T个子数据代表T组调制后的符号，G代表每组调制后的符号中符号的个数。又例如，若第一机器学习模型的功能是生成参考信号，则T个子数据可以代表参考信号中T组符号，G代表每组符号中符号的个数等，应理解，此处举例仅为方便理解本方案，不用于限定本方案。

例如，H的取值为12，G的取值为12，第一机器学习模型中采用的参数可以包括U、W、θ_s、V以及θ_o，则可以为也即U为12乘12的矩阵，U的尺寸为长和宽均为12，W和V的尺寸与U的尺寸相同，θ_s为1乘12的向量，θ_s的尺寸为宽是1且长为12，θ_o的尺寸与θ_s的尺寸相同。

又例如，H的取值为6，G的取值为6，第一机器学习模型中采用的参数可以包括U、W、θ_s、V以及θ_o，则可以为也即U为6乘6的矩阵，U的尺寸为长和宽均为6，W和V的尺寸与U的尺寸相同，θ_s为1乘6的向量，θ_s的尺寸为宽是1且长为6，θ_o的尺寸与θ_s的尺寸相同。

又例如，H的取值为12，G的取值为6，第一机器学习模型中采用的参数可以包括U、W、θ_s、V以及θ_o，则可以为对于、W、θ_s、V以及θ_o的尺寸的解释可以参阅上述描述，此处不再赘述。需要说明的是，此处举例仅为方便理解本方案，不用于限定本方案。

本申请实施例中，根据第一数据的长度以及T个子数据中每个子数据的长度来设计第一机器学习模型中参数的尺寸，有利于在满足输出要求的前提下，减少第一机器学习模型中的参数量，有利于进一步减少传输第一机器学习模型的参数所消耗的通信资源。

408、第一装置根据第二数据确定待发送的信号。

本申请实施例中，第一装置在通过第一机器学习模型生成第二数据之后，还可以根据第二数据确定待发送的信号。例如，若第一机器学习模型的功能为编码，则第二数据为编码后的数据，第一装置还需要对第二数据进行调制得到待发送的信号。

又例如，若第一机器学习模型的功能是调制，则第二数据为调制后的数据，第一装置还可以采用截断的方式对第二数据进行速率匹配，以得到该待发送的信号。

又例如，若第一机器学习模型的功能是编码和调制，则第二数据为编码和调制后的数据，第一装置还可以采用截断的方式对第二数据进行速率匹配，以得到该待发送的信号。

又例如，若第一机器学习模型的功能是生成参考信号，则第二数据为参考信号，第一装置可以将参考信号确定为待发送的信号。

需要说明的是，第一装置在得到第二数据，根据第二数据确定待发送的信号的过程中还可以执行其他操作，此处不做限定。

409、第一装置向第二装置发送该待发送的信号。

410、第二装置获取第二数据，第二数据包括T个子数据，T为大于或等于1的整数，第二数据由第一装置中的第一机器学习模型生成，第一机器学习模型包括一个或多个模块，每调用第一机器学习模型中的模块至少一次得到一个子数据。

本申请实施例中，在一些应用场景中，若第一机器学习模型的功能为编码和/或调制，第二装置在获取到与该待发送的信号对应的接收信号之后，可以对接收信号进行去噪，并从去噪后的接收信号中获取接收的第二数据(也即估计的第二数据)，对于第二数据的含义可以参阅上述描述，此处不做赘述。

例如，若第二数据为编码后的数据，也即第一机器学习模型的功能为编码，则对去噪后的接收信号进行解调制之后得到接收的第二数据。又例如，若第二数据为调制后的数据，也即第一机器学习模型的功能为调制，或者，第一机器学习模型的功能为编码和调制，则可以直接将去噪后的接收信号确定为第二数据。

在另一些应用场景中，若第一机器学习模型的功能为生成参考信号，则第二装置在获取到与该待发送的信号对应的接收信号(也即接收到的第二数据)之后，可以根据接收信号确定估计的信道信息。

411、第二装置根据第二数据，生成第一数据。

本申请实施例中，第二装置在获取到接收的第二数据之后，可以根据接收的第二数据，生成估计的第一数据。可选地，第二装置可以获取第一装置中的第一机器学习模型采用的一组参数，前述步骤的具体实现方式可以参阅步骤401中的描述。第二装置可以根据第一装置中的第一机器学习模型采用的一组参数，对第二数据进行解调制和/或解码，以生成估计的第一数据。

示例性地，在一种实现方式中，第二装置根据第一装置中的第一机器学习模型采用的一组参数，对第二数据进行解调制和/或解码，可以包括：第二装置在获取到第一机器学习模型采用的一组参数之后，可以确定第一装置利用第一机器学习模型对第一数据执行了哪些操作，则可以采用估计算法对第二数据执行逆操作，以实现对第二数据的解调制和/或解码，前述逆操作为利用第一机器学习模型对第一数据执行的操作的逆操作。

例如，估计算法可以为如下任一种：最大似然估计算法、最大后验概率估计或其他类型的估计算法等等，此处举例仅为方便理解本方案，不用于限定本方案。

在另一种实现方式中，第二装置根据第一装置中的第一机器学习模型采用的一组参数，对第二数据进行解调制和/或解码，可以包括：第二装置在获取到第一机器学习模型采用的一组参数之后，可以获取与第一机器学习模型对应的一个第二机器学习模型，将第二数据输入第二机器学习模型中，通过第二机器学习模型对第二数据进行解调制和/或解码。需要说明的是，第二装置还可以采用其他方式得到估计的第一数据，此处举例仅为证明本方案的可实现性，不用于限定本方案。

二、训练阶段

具体的，请参阅图9，图9为本申请实施例提供的模型的训练方法的一种示意图，如图9所示，该模型的训练方法包括步骤901至903。

901、从训练数据集合中获取训练数据，其中，训练数据用于得到第一数据和T的取值，T为大于或等于1的整数，训练数据集合中至少两个训练数据包括的T的取值不同。

本申请实施例中，训练装置中可以存在训练数据集合，在每次训练过程中，训练装置可以从训练数据集合中获取一个或多个训练数据。其中，每个训练数据中可以包括T的取值，T代表第一机器学习模型的输出数据包括的子数据的数量，训练数据集合中至少两个训练数据包括的T的取值不同。

示例性地，每个训练数据中还可以包括待处理数据，训练装置可以直接将前述待处理数据确定为第一数据；或者，也可以基于前述待处理数据采用图4对应实施例中步骤403至406中示出的方式得到第一数据，具体实现方式可以参阅上述图4对应实施例中的描述，步骤901中名词的含义也可以结合图4对应实施例中的描述进行理解，此处均不做赘述。

902、将第一数据输入第一机器学习模型，得到第一机器学习模型生成的第二数据，第二数据包括T个子数据，其中，第一机器学习模型包括多个模块，每调用第一机器学习模型中的模块至少一次，得到模块生成的一个子数据。

本申请实施例中，训练装置将第一数据输入第一机器学习模型，得到第一机器学习模型生成的第二数据，步骤902的具体实现方式以及步骤902中名词的含义均可以参阅图4对应实施例中步骤407中的描述，此处不做赘述。需要说明的是，步骤901和902中的训练装置可以为终端设备，也可以为基站，具体可以根据实际情况灵活设定。

903、基于第二数据和损失函数，对第一机器学习模型进行训练，得到训练后的第一机器学习模型。

本申请实施例中，训练装置在得到第二数据之后，可以基于第二数据和损失函数，对第一机器学习模型进行训练，得到训练后的第一机器学习模型。需要说明的是，步骤903可以由同一个设备执行，也可以由不同的设备执行。

在一种实现方式中，步骤903由同一设备执行，则步骤903中的训练装置可以为终端设备，也可以为基站。在一种情况下，第一机器学习模型的功能包括编码和/或调制，步骤903包括：对与待发送的信号对应的接收信号进行去噪后得到去噪后的接收信号，对去噪后的接收信号进行解调制和/或解码以得到与待处理数据对应的估计数据；根据估计数据和第一损失函数，对第一机器学习模型进行训练，第一损失函数指示估计数据和待处理数据之间的相似度。

具体的，在一种实现方式中，第一机器学习模型的功能为调制，训练装置在得到第二数据(也即调制后的数据)之后，可以直接将第二数据确定为待发送的信号；训练装置获取与该待发送的信号对应的接收信号，对该接收信号进行去噪后得到去噪后的接收信号，对去噪后的接收信号进行解调制以得到与待处理数据对应的估计数据。训练装置生成待处理数据和估计数据之间的相似度，也即得到第一损失函数的函数值，利用第一损失函数的函数值对第一机器学习模型的权重参数进行更新，实现了对第一机器学习模型的一次训练。示例性地，第一损失函数可以为交叉熵损失函数、L1损失函数或其他类型的损失函数等等，具体可以结合实际应用场景灵活确定，本申请实施例中不做限定。

示例性地，训练装置获取与该待发送的信号对应的接收信号可以包括：训练装置将该待发送的信号与信道矩阵相乘，并将前述相乘的结果与噪声相加，得到该接收信号，前述步骤是为了模拟该待发送的信号经过信道传输的过程。

需要说明的是，在对第一机器学习模型进行多次训练的过程中，可以均采用相同的信道矩阵和噪声，也可以采用不同的信道矩阵和/或不同的噪声，不同的信道矩阵和/或不同的噪声用于模拟不同的信噪比的信道环境。

在另一种实现方式中，第一机器学习模型的功能为编码，训练装置在得到第二数据(也即编码后的数据)之后，也可以对第二数据进行调制得到待发送的信号；训练装置获取与该待发送的信号对应的接收信号，对接收信号进行去噪后得到去噪后的接收信号，并对该去噪后的接收信号进行解调制和解码以得到与训练数据中的待处理数据对应的估计数据。训练装置根据待处理数据、估计数据和第一损失函数对第一机器学习模型进行训练；前述步骤以及“训练装置获取与该待发送的信号对应的接收信号”的具体实现方式可以参阅上述描述，此处不做赘述。

在另一种实现方式中，第一机器学习模型的功能为调制，训练装置在得到第二数据(也即调制后的数据)之后，可以采用截断的方式对第二数据进行速率匹配，以得到该待发送的信号；训练装置获取与该待发送的信号对应的接收信号，对接收信号进行去噪后得到去噪后的接收信号，并对该去噪后的接收信号进行解调制以得到与训练数据中的待处理数据对应的估计数据。训练装置执行的后续步骤可以参阅上述描述，此处不做赘述。

在另一种实现方式中，第一机器学习模型的功能为编码和调制，训练装置在得到第二数据(也即编码以及调制后的数据)之后，可以采用截断的方式对第二数据进行速率匹配，以得到该待发送的信号；训练装置获取与该待发送的信号对应的接收信号，对接收信号进行去噪后得到去噪后的接收信号，并对该去噪后的接收信号进行解调制和解码以得到与训练数据中的待处理数据对应的估计数据。训练装置执行的后续步骤可以参阅上述描述，此处不做赘述

在另一种情况中，第一机器学习模型的功能为生成参考信号，则第二数据为参考信号。训练装置可以生成与参考信号对应的接收的参考信号，根据与参考信号对应的接收的参考信号，生成预测的信道信息。其中，“训练装置生成与参考信号对应的接收的参考信号”的具体实现方式与“训练装置生成与待发送的信号对应的接收信号”的具体实现方式类似，区别在于将“待发送的信号”替换为“参考信号”，将“接收信号”替换为“接收的参考信号”，此处不再赘述。

训练装置根据第二损失函数，对第一机器学习模型进行训练，第二损失函数指示预测的信道信息和正确的信道信息之间的相似度。示例性地，训练装置计算预测的信道信息和正确的信道信息之间的相似度，以得到第二损失函数的函数值，利用第二损失函数的函数值对第一机器学习模型的权重参数进行更新，实现了对第一机器学习模型的一次训练。

在另一种实现方式中，步骤903由两个训练装置(为方面描述，后续称为第一训练装置和第二训练装置)共同执行。例如，第一训练装置可以为基站，第二训练装置为请求基站对第一机器学习模型进行再次训练的终端设备；又例如第一训练装置可以为第一装置，第二训练装置可以为第二装置。

在一种情况中，第一机器学习模型的功能包括编码和/或调制，相比于步骤903由同一个设备执行，本实现方式的区别之处主要在于“获取与待发送的信号对应的接收信号”的实现方式，示例性地，第一训练装置在基于第二数据得到待发送的信号之后，将待发送的信号发送给第二训练装置，第二训练装置接收到了该接收信号，进而由第二训练装置获取与待处理数据对应的估计数据；根据估计数据和第一损失函数，对第一机器学习模型进行训练。

本申请实施例中，提供了在第一机器学习模型的功能包括编码和/或调制的情况下，对第一机器学习模型进行训练的具体实现方式，降低了本方案的实现难度，且损失函数采用的是估计数据和待处理数据之间的相似度，也即损失函数的目标是获得性能更好的估计数据，该损失函数更加符合装置之间发送数据时的实际需求，则训练后的第一机器学习模型输出的第二数据更符合实际的需求。

在另一种情况中，第一机器学习模型的功能为生成参考信号，相比于步骤903由同一个设备执行，本实现方式的区别之处主要在于“获取与参考信号对应的接收的参考信号”的实现方式，示例性地，第一训练装置在得到参考信号之后，将参考信号发送给第二训练装置；第二训练装置获取到接收的参考信号之后，根据接收的参考信号生成预测的信道信息；第二训练装置根据损失函数，对第一机器学习模型进行训练。

本申请实施例中，还提供了在第一机器学习模型的功能为生成参考信号的情况下，对第一机器学习模型进行训练的具体实现方式，扩展了本方案的应用场景，提高了本方案的实现灵活性。

训练装置重复执行步骤901至903，以对第一机器学习模型进行迭代训练，直至满足第一损失函数的收敛条件，得到第一机器学习模型的一组训练后的参数。

此外，训练装置还可以采用多个不同的训练数据集合，分别对第一机器学习模型进行训练，从而得到第一机器学习模型的多组训练后的参数。

本申请实施例中，不仅提供了第一机器学习模型推理阶段的实现方式，还提供了第一机器学习模型在训练阶段的实现方式，降低了本方案的实现难度。

在上述图1至图9对应的实施例的基础上，请参阅图10，图10为本申请实施例提供的数据处理装置的一种示意图。该数据处理装置1000可以实现上述方法实施例中第一装置的功能，因此也能实现上述方法实施例所具备的有益效果。数据处理装置1000可以包括处理模块1001；其中，处理模块1001，用于获取T的取值，T为大于或等于1的整数，T代表第一机器学习模型的输出数据包括的子数据的个数；处理模块1001，还用于将第一数据输入第一机器学习模型，得到第一机器学习模型生成的第二数据，第二数据包括T个子数据，其中，第一机器学习模型包括一个或多个模块，每调用第一机器学习模型中的模块至少一次得到一个子数据。

可选地，第一机器学习模型的功能包括如下任一项或多项的组合：编码、调制、生成参考信号。

可选地，第一机器学习模型中的多个模块包括第一模块和至少一个第二模块，处理模块1001，具体用于：将第一数据输入第一模块，得到第一模块生成的第一子数据，第一子数据为T个子数据中的一个；将第一特征信息输入第二模块，得到第二模块生成的第二子数据，其中，第一特征信息包括上一次调用第一机器学习模型中的模块进行数据处理时生成的特征信息，第二子数据为T个子数据中的一个，上一次调用的第一机器学习模型中的模块为第一模块或者第二模块。

可选地，第一机器学习模型中的多个模块包括第一模块和至少一个第三模块，处理模块1001，具体用于：将第一数据输入第一模块，通过第一模块生成第一子数据，第一子数据为T个子数据中的一个，通过第一模块生成第一子数据的过程中包括对第一数据进行特征提取；调用第三模块多次，得到第三模块生成的第三子数据，第三子数据为T个子数据中的一个，其中，第三模块的输入包括第一数据的特征信息，在调用第三模块多次的过程中对第一数据的特征信息进行多次更新。

可选地，处理模块1001，具体用于：通过第二模块对第一特征信息进行线性变换，并采用第一激活函数进行处理，得到变换后的特征信息；对变换后的特征信息进行线性变换，并采用第二激活函数进行处理，得到第二子数据。

可选地，至少一个第二模块包括多个第二模块，其中，多个第二模块中至少两个第二模块采用的参数不同。

可选地，处理模块1001，还用于获取待处理数据和H的取值，H为大于或等于1的整数，H指示第一数据的长度；处理模块1001，还用于若待处理数据的长度小于H，则对待处理数据进行填充，得到第一数据，第一数据的长度为H。

可选地，第一数据包括待处理数据和填充数据，填充数据包括第一标识信息，第一标识信息用于标识T的取值和/或K的取值，K为待处理数据的长度，K为大于或等于1的整数。

可选地，第一机器学习模型中的参数的尺寸与H的取值以及G的取值相关，G为每个子数据的长度。

可选地，与第一机器学习模型对应的参数携带于如下一种或多种信息中：下行控制信息DCI、上行控制信息UCI、侧行链路控制信息SCI、无线资源控制RRC信令或者媒体访问控制的控制元素MAC CE；和/或，参数的标识信息携带于如下任一种或多种信息中：DCI、UCI、SCI、RRC信令、MAC CE、物理广播信道PBCH或者物理随机接入信道PRACH。

可选地，数据处理装置1000应用于第一装置，第二装置为第二数据的接收端，第二装置中有与第一机器学习模型对应的多组参数以及每组参数的标识信息，请参阅图10，数据处理装置1000还可以包括：收发模块1002，用于向第二装置发送第二标识信息，第二标识信息用于指示第一装置中的第一机器学习模型采用的一组参数。

请参阅图11，图11为本申请实施例提供的数据处理装置的另一种示意图。该数据处理装置1100可以实现上述方法实施例中第二装置的功能，因此也能实现上述方法实施例所具备的有益效果。数据处理装置1100可以包括处理模块1101；其中，处理模块1101用于获取第二数据；根据第二数据，生成第一数据。其中，第二数据包括T个子数据，T为大于或等于1的整数，第二数据由第一装置中的第一机器学习模型生成，第一机器学习模型包括一个或多个模块，每调用第一机器学习模型中的模块至少一次得到一个子数据。

在一种可能实现方式中，该数据处理装置应用于第二装置，第二装置中有第三数据，第三数据包括与第一机器学习模型对应的多组参数以及每组参数的标识信息，请参阅图11，数据处理装置1100还可以包括：收发模块1102，用于接收第一装置发送的第二标识信息；处理模块1101，还用于根据第二标识信息和第三数据，确定第一装置中的第一机器学习模型采用的一组参数。处理模块1101，具体用于根据第一装置中的第一机器学习模型采用的一组参数和第二数据，生成第一数据。

请参阅图12，图12为本申请实施例提供的模型的训练装置的一种示意图。模型的训练装置1200可以实现上述方法实施例中模型的训练装置的功能，因此也能实现上述方法实施例所具备的有益效果。模型的训练装置1200可以包括处理模块1201；其中，处理模块1201，用于从训练数据集合中获取训练数据，其中，训练数据用于得到第一数据和T的取值，T为大于或等于1的整数，训练数据集合中至少两个训练数据包括的T的取值不同；处理模块1201，还用于将第一数据输入第一机器学习模型，得到第一机器学习模型生成的第二数据，第二数据包括T个子数据，其中，第一机器学习模型包括多个模块，每调用第一机器学习模型中的模块至少一次，得到模块生成的一个子数据；处理模块1201，还用于基于第二数据和损失函数，对第一机器学习模型进行训练，得到训练后的第一机器学习模型。

在一种可能实现方式中，第一机器学习模型中的多个模块包括第一模块和至少一个第二模块，处理模块1201，具体用于：将第一数据输入第一模块，得到第一模块生成的第一子数据，第一子数据为T个子数据中的一个；将第一特征信息输入第二模块，得到第二模块生成的第二子数据，其中，第一特征信息包括上一次调用第一机器学习模型中的模块进行数据处理时生成的特征信息，第二子数据为T个子数据中的一个，上一次调用的第一机器学习模型中的模块为第一模块或者第二模块。

在一种可能实现方式中，处理模块1201，还用于从训练数据中获取待处理数据；处理模块1201，还用于获取H的取值，H为大于或等于1的整数，H指示第一数据的长度；处理模块1201，还用于若待处理数据的长度小于H，则对待处理数据进行填充，得到第一数据，第一数据的长度为H。

在一种可能实现方式中，在第一机器学习模型的功能包括编码和/或调制的情况下，第二数据用于确定待发送的信号，处理模块1201，具体用于：对与待发送的信号对应的接收信号进行解调制和/或解码以得到与待处理数据对应的估计数据；根据估计数据和损失函数，对第一机器学习模型进行训练，损失函数指示估计数据和待处理数据之间的相似度。

在一种可能实现方式中，在第二数据为参考信号的情况下，基于第二数据和损失函数，处理模块1201，具体用于：根据与参考信号对应的接收的参考信号，生成预测的信道信息；根据损失函数，对第一机器学习模型进行训练，损失函数指示预测的信道信息和正确的信道信息之间的相似度。

请参阅图13，图13为本申请的实施例提供的装置的一种示意图。该通信装置1300具体可以为上述实施例中的作为终端设备的装置，图13所示示例为终端设备通过终端设备(或者终端设备中的部件)实现。

其中，该通信装置1300的一种可能的逻辑结构示意图，该通信装置1300可以包括但不限于至少一个处理器1301以及通信端口1302。

可选地，该装置还可以包括存储器1303、总线1304中的至少一个，在本申请的实施例中，该至少一个处理器1301用于对通信装置1300的动作进行控制处理。

此外，处理器1301可以是中央处理器单元，通用处理器，数字信号处理器，专用集成电路，现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。该处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，数字信号处理器和微处理器的组合等等。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

需要说明的是，当上述实施例中所涉及的第一装置、第二装置或训练设备具体表现为终端设备时，可以采用图13中示出的装置1300实现前述方法实施例中终端设备所实现的步骤，图13所示装置1300执行前述步骤的具体实现方式，均可以参考前述方法实施例中的叙述，此处不再一一赘述。

请参阅图14，图14为本申请的实施例提供的装置的另一种示意图。该装置1400具体可以为上述实施例中的作为网络设备的装置，图14所示示例为网络设备通过网络设备(或者网络设备中的部件)实现；也即当上述实施例中所涉及的第一装置、第二装置或训练设备具体表现为网络设备时，可以采用图14中示出的装置1400实现；示例性地，当第一装置、第二装置或训练设备为基站时，可以采用图14中示出的装置1400实现。

其中，该通信装置的结构可以参考图14所示的结构。装置1400包括至少一个处理器1411以及至少一个网络接口1412。进一步可选地，该通信装置还包括至少一个存储器1414、至少一个收发器1413和一个或多个天线1415。处理器1411、存储器1414、收发器1413和网络接口1412相连，例如通过总线相连，在本申请实施例中，该连接可包括各类接口、传输线或总线等，本实施例对此不做限定。天线1415与收发器1413相连。网络接口1412用于使得通信装置通过通信链路，与其它通信设备通信。例如网络接口1412可以包括通信装置与核心网设备之间的网络接口，例如S1接口，网络接口可以包括通信装置和其他通信装置(例如其他网络设备或者核心网设备)之间的网络接口，例如X2或者Xn接口。

处理器1411主要用于对通信协议以及通信数据进行处理，以及对整个通信装置进行控制，执行软件程序，处理软件程序的数据，例如用于支持通信装置执行实施例中所描述的动作。通信装置可以包括基带处理器和中央处理器，基带处理器主要用于对通信协议以及通信数据进行处理，中央处理器主要用于对整个终端设备进行控制，执行软件程序，处理软件程序的数据。图14中的处理器1411可以集成基带处理器和中央处理器的功能，本领域技术人员可以理解，基带处理器和中央处理器也可以是各自独立的处理器，通过总线等技术互联。本领域技术人员可以理解，终端设备可以包括多个基带处理器以适应不同的网络制式，终端设备可以包括多个中央处理器以增强其处理能力，终端设备的各个部件可以通过各种总线连接。该基带处理器也可以表述为基带处理电路或者基带处理芯片。该中央处理器也可以表述为中央处理电路或者中央处理芯片。对通信协议以及通信数据进行处理的功能可以内置在处理器中，也可以以软件程序的形式存储在存储器中，由处理器执行软件程序以实现基带处理功能。

存储器主要用于存储软件程序和数据。存储器1414可以是独立存在，与处理器1411相连。可选地，存储器1414可以和处理器1411集成在一起，例如集成在一个芯片之内。其中，存储器1414能够存储执行本申请实施例的技术方案的程序代码，并由处理器1411来控制执行，被执行的各类计算机程序代码也可被视为是处理器1411的驱动程序。

图14仅示出了一个存储器和一个处理器。在实际的终端设备中，可以存在多个处理器和多个存储器。存储器也可以称为存储介质或者存储设备等。存储器可以为与处理器处于同一芯片上的存储元件，即片内存储元件，或者为独立的存储元件，本申请实施例对此不做限定。

收发器1413可以用于支持通信装置与终端之间射频信号的接收或者发送，收发器1413可以与天线1415相连。收发器1413包括发射机Tx和接收机Rx。具体地，一个或多个天线1415可以接收射频信号，该收发器1413的接收机Rx用于从天线接收该射频信号，并将射频信号转换为数字基带信号或数字中频信号，并将该数字基带信号或数字中频信号提供给该处理器1411，以便处理器1411对该数字基带信号或数字中频信号做进一步的处理，例如解调处理和译码处理。此外，收发器1413中的发射机Tx还用于从处理器1411接收经过调制的数字基带信号或数字中频信号，并将该经过调制的数字基带信号或数字中频信号转换为射频信号，并通过一个或多个天线1415发送该射频信号。具体地，接收机Rx可以选择性地对射频信号进行一级或多级下混频处理和模数转换处理以得到数字基带信号或数字中频信号，该下混频处理和模数转换处理的先后顺序是可调整的。发射机Tx可以选择性地对经过调制的数字基带信号或数字中频信号时进行一级或多级上混频处理和数模转换处理以得到射频信号，该上混频处理和数模转换处理的先后顺序是可调整的。数字基带信号和数字中频信号可以统称为数字信号。

收发器1413也可以称为收发单元、收发机、收发装置等。可选地，可以将收发单元中用于实现接收功能的器件视为接收单元，将收发单元中用于实现发送功能的器件视为发送单元，即收发单元包括接收单元和发送单元，接收单元也可以称为接收机、输入口、接收电路等，发送单元可以称为发射机、发射器或者发射电路等。

示例性地，当上述实施例中所涉及的第一装置、第二装置或训练设备具体表现为基站时，可以采用图14中示出的装置1400实现前述方法实施例中基站所实现的步骤，图14所示装置1400执行前述步骤的具体实现方式，均可以参考前述方法实施例中的叙述，此处不再一一赘述。

本申请实施例中还提供一种计算机可读存储介质，该计算机可读存储介质中存储有用于进行信号处理的程序，当其在计算机上运行时，使得计算机执行如前述图3至图8所示实施例描述的方法中第一装置所执行的步骤，或者，使得计算机执行如前述图3至图8所示实施例描述的方法中第二装置所执行的步骤，或者，使得计算机执行如前述图9所示实施例描述的方法中训练设备所执行的步骤。

本申请实施例中还提供一种包括计算机程序产品，当其在计算机上运行时，使得计算机执行如前述图3至图8所示实施例描述的方法中第一装置所执行的步骤，或者，使得计算机执行如前述图3至图8所示实施例描述的方法中第二装置所执行的步骤，或者，使得计算机执行如前述图9所示实施例描述的方法中训练设备所执行的步骤。

本申请实施例提供的第一装置、第二装置、训练设备、数据处理装置或模型的训练装置具体可以为芯片，芯片包括：处理单元和通信单元，所述处理单元例如可以是处理器，所述通信单元例如可以是输入/输出接口、管脚或电路等。该处理单元可执行存储单元存储的计算机执行指令，以使芯片执行上述图3至图8所示实施例描述的数据处理方法，或者，以使芯片执行上述图9所示实施例描述的模型的训练方法。可选地，所述存储单元为所述芯片内的存储单元，如寄存器、缓存等，所述存储单元还可以是所述无线接入设备端内的位于所述芯片外部的存储单元，如只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)等。

具体的，请参阅图15，图15为本申请实施例提供的芯片的一种结构示意图，所述芯片可以表现为神经网络处理器NPU 150，NPU 150作为协处理器挂载到主CPU(Host CPU)上，由Host CPU分配任务。NPU的核心部分为运算电路150，通过控制器1504控制运算电路1503提取存储器中的矩阵数据并进行乘法运算。

在一些实现中，运算电路1503内部包括多个处理单元(Process Engine,PE)。在一些实现中，运算电路1503是二维脉动阵列。运算电路1503还可以是一维脉动阵列或者能够执行例如乘法和加法这样的数学运算的其它电子线路。在一些实现中，运算电路1503是通用的矩阵处理器。

举例来说，假设有输入矩阵A，权重矩阵B，输出矩阵C。运算电路从权重存储器1502中取矩阵B相应的数据，并缓存在运算电路中每一个PE上。运算电路从输入存储器1501中取矩阵A数据与矩阵B进行矩阵运算，得到的矩阵的部分结果或最终结果，保存在累加器(accumulator)1508中。

统一存储器1506用于存放输入数据以及输出数据。权重数据直接通过存储单元访问控制器(Direct Memory Access Controller，DMAC)1505，DMAC被搬运到权重存储器1502中。输入数据也通过DMAC被搬运到统一存储器1506中。

BIU为Bus Interface Unit即，总线接口单元1510，用于AXI总线与DMAC和取指存储器(Instruction Fetch Buffer，IFB)1509的交互。

总线接口单元1510(Bus Interface Unit，简称BIU)，用于取指存储器1509从外部存储器获取指令，还用于存储单元访问控制器1505从外部存储器获取输入矩阵A或者权重矩阵B的原数据。

DMAC主要用于将外部存储器DDR中的输入数据搬运到统一存储器1506或将权重数据搬运到权重存储器1502中或将输入数据数据搬运到输入存储器1501中。

向量计算单元1507包括多个运算处理单元，在需要的情况下，对运算电路的输出做进一步处理，如向量乘，向量加，指数运算，对数运算，大小比较等等。主要用于神经网络中非卷积/全连接层网络计算，如Batch Normalization(批归一化)，像素级求和，对特征平面进行上采样等。

在一些实现中，向量计算单元1507能将经处理的输出的向量存储到统一存储器1506。例如，向量计算单元1507可以将线性函数和/或非线性函数应用到运算电路1503的输出，例如对卷积层提取的特征平面进行线性插值，再例如累加值的向量，用以生成激活值。在一些实现中，向量计算单元1507生成归一化的值、像素级求和的值，或二者均有。在一些实现中，处理过的输出的向量能够用作到运算电路1503的激活输入，例如用于在神经网络中的后续层中的使用。

控制器1504连接的取指存储器(instruction fetch buffer)1509，用于存储控制器 1504使用的指令；

统一存储器1506，输入存储器1501，权重存储器1502以及取指存储器1509均为On-Chip存储器。外部存储器私有于该NPU硬件架构。

其中，第一机器学习模型中各层的运算可以由运算电路1503或向量计算单元1507执行。

其中，上述任一处提到的处理器，可以是一个通用中央处理器，微处理器，ASIC，或一个或多个用于控制上述第一方面方法的程序执行的集成电路。

另外需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本申请提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下，凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现，而且，用来实现同一功能的具体硬件结构也可以是多种多样的，例如模拟电路、数字电路或专用电路等。但是，对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘、U盘、移动硬盘、ROM、RAM、磁碟或者光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，训练设备，或者网络设备等)执行本申请各个实施例所述的方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、训练设备或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、训练设备或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的训练设备、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(Solid State Disk，SSD))等。

Claims

一种数据处理方法，其特征在于，所述方法包括：

获取T的取值，所述T为大于或等于1的整数，所述T代表第一机器学习模型的输出数据包括的子数据的个数；

将第一数据输入所述第一机器学习模型，得到所述第一机器学习模型生成的第二数据，所述第二数据包括所述T个子数据，其中，所述第一机器学习模型包括一个或多个模块，每调用所述第一机器学习模型中的模块至少一次得到一个所述子数据。
根据权利要求1所述的方法，其特征在于，所述第一机器学习模型的功能包括如下任一项或多项的组合：编码、调制、生成参考信号。
根据权利要求1或2所述的方法，其特征在于，所述第一机器学习模型中的多个模块包括第一模块和至少一个第二模块，所述将第一数据输入所述第一机器学习模型，得到所述第一机器学习模型输出的第二数据，包括：

将所述第一数据输入所述第一模块，得到所述第一模块生成的第一子数据，所述第一子数据为所述T个子数据中的一个；

将第一特征信息输入所述第二模块，得到所述第二模块生成的第二子数据，其中，所述第一特征信息包括上一次调用所述第一机器学习模型中的模块进行数据处理时生成的特征信息，所述第二子数据为所述T个子数据中的一个，所述上一次调用的所述第一机器学习模型中的模块为所述第一模块或者所述第二模块。
根据权利要求1或2所述的方法，其特征在于，所述第一机器学习模型中的多个模块包括第一模块和至少一个第三模块，所述将第一数据输入所述第一机器学习模型，得到所述第一机器学习模型输出的第二数据，包括：

将所述第一数据输入所述第一模块，通过所述第一模块生成第一子数据，所述第一子数据为所述T个子数据中的一个，所述通过所述第一模块生成第一子数据的过程中包括对所述第一数据进行特征提取；

调用所述第三模块多次，得到所述第三模块生成的第三子数据，所述第三子数据为所述T个子数据中的一个，其中，所述第三模块的输入包括所述第一数据的特征信息，在所述调用所述第三模块多次的过程中对所述第一数据的特征信息进行多次更新。
根据权利要求3所述的方法，其特征在于，所述将第一特征信息输入所述第二模块，得到所述第二模块生成的第二子数据，包括：

通过所述第二模块对所述第一特征信息进行线性变换，并采用第一激活函数进行处理，得到变换后的特征信息；

对所述变换后的特征信息进行线性变换，并采用第二激活函数进行处理，得到所述第二子数据。
根据权利要求3所述的方法，其特征在于，所述至少一个第二模块包括多个所述第二模块，其中，所述多个第二模块中至少两个第二模块采用的参数不同。
根据权利要求1或2所述的方法，其特征在于，所述将第一数据输入所述第一机器学习模型之前，所述方法还包括：

获取待处理数据和H的取值，H为大于或等于1的整数，所述H指示所述第一数据的长度；

若所述待处理数据的长度小于所述H，则对所述待处理数据进行填充，得到所述第一数据，所述第一数据的长度为所述H。
根据权利要求7所述的方法，其特征在于，所述第一数据包括所述待处理数据和填充数据，所述填充数据包括第一标识信息，所述第一标识信息用于标识所述T的取值和/或K的取值，所述K为所述待处理数据的长度，所述K为大于或等于1的整数。
根据权利要求7所述的方法，其特征在于，所述第一机器学习模型中的参数的尺寸与所述H的取值以及G的取值相关，所述G为每个所述子数据的长度。
根据权利要求1或2所述的方法，其特征在于，与所述第一机器学习模型对应的参数携带于如下一种或多种信息中：下行控制信息DCI、上行控制信息UCI、侧行链路控制信息SCI、无线资源控制RRC信令或者媒体访问控制的控制元素MAC CE；和/或，

所述参数的标识信息携带于如下任一种或多种信息中：DCI、UCI、SCI、RRC信令、MAC CE、物理广播信道PBCH或者物理随机接入信道PRACH。
根据权利要求1或2所述的方法，其特征在于，所述方法应用于第一装置侧，第二装置为所述第二数据的接收端，所述第二装置中有与所述第一机器学习模型对应的多组参数以及每组所述参数的标识信息，所述方法还包括：

向所述第二装置发送第二标识信息，所述第二标识信息用于指示所述第一装置中的所述第一机器学习模型采用的一组所述参数。
一种数据处理方法，其特征在于，所述方法包括：

获取第二数据，其中，所述第二数据包括T个子数据，所述T为大于或等于1的整数，所述第二数据由第一装置中的第一机器学习模型生成，所述第一机器学习模型包括一个或多个模块，每调用所述第一机器学习模型中的模块至少一次得到一个所述子数据；

根据所述第二数据，生成第一数据。
根据权利要求12所述的方法，其特征在于，与所述第一机器学习模型对应的参数携带于如下一种或多种信息中：下行控制信息DCI、上行控制信息UCI、侧行链路控制信息SCI、无线资源控制RRC信令或者媒体访问控制的控制元素MAC CE；和/或，

所述参数的标识信息携带于如下任一种或多种信息中：DCI、UCI、SCI、RRC信令、MAC CE、物理广播信道PBCH或者物理随机接入信道PRACH。
根据权利要求12所述的方法，其特征在于，所述方法应用于第二装置侧，所述第二装置中有第三数据，所述第三数据包括与所述第一机器学习模型对应的多组参数以及每组所述参数的标识信息，所述方法还包括：

接收所述第一装置发送的第二标识信息；

根据所述第二标识信息和所述第三数据，确定所述第一装置中的所述第一机器学习模型采用的一组所述参数；

所述根据所述第二数据，生成第一数据，包括：

根据所述第一装置中的所述第一机器学习模型采用的一组所述参数和所述第二数据，生成所述第一数据。
一种模型的训练方法，其特征在于，所述方法包括：

从训练数据集合中获取训练数据，其中，所述训练数据用于得到第一数据和T的取值，所述T为大于或等于1的整数，所述训练数据集合中至少两个所述训练数据包括的所述T的取值不同；

将所述第一数据输入所述第一机器学习模型，得到所述第一机器学习模型生成的第二数据，所述第二数据包括所述T个子数据，其中，所述第一机器学习模型包括多个模块，每调用所述第一机器学习模型中的模块至少一次，得到所述模块生成的一个所述子数据；

基于所述第二数据和损失函数，对所述第一机器学习模型进行训练，得到训练后的所述第一机器学习模型。
根据权利要求15所述的方法，其特征在于，所述第一机器学习模型的功能包括如下任一项或多项的组合：编码、调制、生成参考信号。
根据权利要求15或16所述的方法，其特征在于，所述第一机器学习模型中的多个模块包括第一模块和至少一个第二模块，所述将第一数据输入所述第一机器学习模型，得到所述第一机器学习模型输出的第二数据，包括：

将所述第一数据输入所述第一模块，得到所述第一模块生成的第一子数据，所述第一子数据为所述T个子数据中的一个；

将第一特征信息输入所述第二模块，得到所述第二模块生成的第二子数据，其中，所述第一特征信息包括上一次调用所述第一机器学习模型中的模块进行数据处理时生成的特征信息，所述第二子数据为所述T个子数据中的一个，所述上一次调用的所述第一机器学习模型中的模块为所述第一模块或者所述第二模块。
根据权利要求15或16所述的方法，其特征在于，所述将第一数据输入所述第一机器学习模型之前，所述方法还包括：

从所述训练数据中获取待处理数据；

获取H的取值，H为大于或等于1的整数，所述H指示所述第一数据的长度；

若所述待处理数据的长度小于所述H，则对所述待处理数据进行填充，得到所述第一数据，所述第一数据的长度为所述H。
根据权利要求18所述的方法，其特征在于，在所述第一机器学习模型的功能包括编码和/或调制的情况下，所述第二数据用于确定待发送的信号，所述基于所述第二数据和损失函数，对所述第一机器学习模型进行训练，包括：

对与所述待发送的信号对应的接收信号进行解调制和/或解码以得到与所述待处理数据对应的估计数据；

根据所述估计数据和所述损失函数，对所述第一机器学习模型进行训练，所述损失函数指示所述估计数据和所述待处理数据之间的相似度。
根据权利要求15或16所述的方法，其特征在于，在所述第二数据为参考信号的情况下，所述基于所述第二数据和损失函数，对所述第一机器学习模型进行训练，包括：

根据与所述参考信号对应的接收的参考信号，生成预测的信道信息；

根据所述损失函数，对所述第一机器学习模型进行训练，所述损失函数指示所述预测的信道信息和正确的信道信息之间的相似度。
一种数据处理装置，其特征在于，所述数据处理装置包括处理模块和收发模块；

所述处理模块用于执行如权利要求1至11中任一项所述的处理操作，所述收发模块用于执行如权利要求1至11中任一项所述的收发操作。
一种数据处理装置，其特征在于，所述数据处理装置包括处理模块和收发模块；

所述处理模块用于执行如权利要求12至14中任一项所述的处理操作，所述收发模块用于执行如权利要求12至14中任一项所述的收发操作。
一种模型的训练装置，其特征在于，所述数据处理装置包括处理模块，所述处理模块用于执行如权利要求15至20中任一项所述的处理操作。
一种通信系统，其特征在于，所述通信系统包括：如权利要求21所述的数据处理装置以及如权利要求22所述的数据处理装置。
根据权利要求24所述的系统，其特征在于，所述通信系统还包括：如权利要求23所述的模型的训练装置。
一种装置，其特征在于，所述装置包括至少一个处理器，所述至少一个处理器与存储器耦合，所述存储器用于存储程序或指令；

所述至少一个处理器用于执行所述程序或指令，以使所述装置实现如权利要求1至11中任一项所述的方法；或者，实现如权利要求12至14中任一项所述的方法；或者，实现如权利要求15至20中任一项所述的方法。
一种计算机可读存储介质，其特征在于，所述可读存储介质存储有指令，当所述指令被计算机执行时，使得权利要求1至11中任一项所述的方法被执行；或者，使得权利要求12至14中任一项所述的方法被执行；或者，使得权利要求15至20中任一项所述的方法被执行。
一种计算机程序产品，其特征在于，所述计算机程序产品包括指令，当所述指令在计算机上运行时，使得权利要求1至11中任一项所述的方法被执行；或者，使得权利要求12至14中任一项所述的方法被执行；或者，使得权利要求15至20中任一项所述的方法被执行。