WO2024164694A1

WO2024164694A1 - 图像压缩方法、装置、电子设备、计算机程序产品及存储介质

Info

Publication number: WO2024164694A1
Application number: PCT/CN2023/138206
Authority: WO
Inventors: 吕悦; 项进喜; 张军; 韩骁
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2023-02-09
Filing date: 2023-12-12
Publication date: 2024-08-15
Anticipated expiration: 2025-08-09
Also published as: US20250227272A1; EP4568246A4; CN116980611A; WO2024164694A9; EP4568246A1

Abstract

本申请提供了一种图像压缩方法、装置、电子设备、计算机程序产品及存储介质，方法包括：对待压缩图像进行编码，得到所述待压缩图像对应的第一隐变量；确定所述第一隐变量对应的超先验概率估计值；根据所述超先验概率估计值，对所述第一隐变量进行部分解码，得到所述第一隐变量的部分解码结果；基于所述第一隐变量的部分解码结果及所述待压缩图像对应的第一隐变量，确定所述待压缩图像对应的压缩后图像，所述压缩后图像的数据量小于所述待压缩图像的数据量。

Description

图像压缩方法、装置、电子设备、计算机程序产品及存储介质

相关申请的交叉引用

本申请基于申请号为2023101368433、申请日为2023年02月09日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本申请涉及计算机技术，尤其涉及一种图像压缩方法、装置、电子设备、计算机程序产品及计算机存储介质。

背景技术

相关技术中，深度神经网络在许多计算机视觉任务中获得了非常好的性能。但是在通过神经网络模型对图像进行压缩时，相关技术中使用基础的卷积网络对进行图像变换，在压缩率较低时，需要从字节流中恢复隐变量重建高质量图像，而图像非线性变换网络的能力限制网络重建高质量图像的能力；同时相关技术中的上下文模型使用PixelCNN串行解码，使得图像压缩的效率较低。

发明内容

有鉴于此，本申请实施例提供一种图像压缩方法、装置、电子设备、计算机程序产品及计算机存储介质，能够通过利用图像处理模型的提升图像压缩的效率，同时经过压缩的图像的体积更小，降低了图像的存储成本。

本申请实施例的技术方案是这样实现的：

本申请实施例提供了一种图像压缩方法，所述方法包括：

对待压缩图像进行编码，得到所述待压缩图像对应的第一隐变量；

确定所述第一隐变量对应的超先验概率估计值；

据所述超先验概率估计值，对所述第一隐变量进行部分解码，得到所述第一隐变量的部分解码结果；

基于所述第一隐变量的部分解码结果及所述待压缩图像对应的第一隐变量，生成所述待压缩图像对应的压缩后图像，所述压缩后图像的数据量小于所述待压缩图像的数据量。

本申请实施例还提供了一种图像压缩装置，所述装置包括：

编码模块，配置为对待压缩图像进行编码，得到所述待压缩图像对应的第一隐变量；

信息处理模块，配置为确定所述第一隐变量对应的超先验概率估计值；

所述信息处理模块，还配置为根据所述超先验概率估计值，对所述第一隐变量进行部分解码，得到所述第一隐变量的部分解码结果；

所述信息处理模块，还配置为基于所述第一隐变量的部分解码结果及所述待压缩图像对应的第一隐变量，生成所述待压缩图像对应的压缩后图像，所述压缩后图像的数据量小于所述待压缩图像的数据量。

本申请实施例还提供了一种电子设备，所述训练装置包括：

存储器，配置为存储可执行指令；

处理器，配置为运行所述存储器存储的可执行指令时，实现前述的图像压缩方法。

本申请实施例还提供了一种计算机程序产品，所述计算机程序或指令被处理器执行时，实现前述的图像压缩方法。

本申请实施例还提供了一种计算机可读存储介质，存储有可执行指令，所述可执行指令被处理器执行时实现前述的图像压缩方法。

本申请实施例具有以下有益效果：

本申请实施例通过对待压缩图像进行编码，得到第一隐变量，根据第一隐变量确定超先验概率估计值；若编码得到的第一隐变量服从某种固有的先验概率，得到的超先验概率估计值可作为后续部分解码的参考，使得解码得到的解码结果的准确度更高，同时提升图像压缩的性能，使得经过解码得到压缩后图像的体积更小，降低了图像的存储成本。根据超先验概率估计值，对第一隐变量进行部分解码，得到部分解码结果；对第一隐变量进行部分解码，也即对一部分像素进行解码，使得后续再对其它像素进行解码时，可基于该部分解码结果进行预测(解码)，如此，节省了压缩图像的耗时，同时提高了压缩效率。

附图说明

图1为本申请实施例提供的一种图像压缩方法的使用环境示意图；

图2为本申请实施例提供的电子设备的组成结构示意图；

图3A为本申请实施例提供的图像压缩方法的流程示意图一；

图3B为本申请实施例提供的图像压缩方法的流程示意图二；

图4为本申请实施例提供的图像处理模型的数据流转示意图；

图5为本申请实施例提供的图像处理模型的模型结构示意图；

图6为本申请实施例提供的空间深度转换层和深度空间转换层的工作过程示意图；

图7为本申请实施例提供的转移窗口注意力机制模块的组成结构示意图；

图8为本申请实施例提供的转移窗口注意力机制模块的计算原理示意图；

图9为本申请实施例提供的上下文网络的自回归示意图；

图10为本申请实施例提供的图像处理模型训练方法的流程示意图；

图11为本申请实施例提供的图像处理模型的效果测试示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请详细描述，所描述的实施例不应视为对本申请的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

对本申请实施例进行详细说明之前，对本申请实施例中涉及的名词和术语进行说明，本申请实施例中涉及的名词和术语适用于如下的解释。

1)Wasserstein distance：一种距离度量函数，主要用于衡量两个分布之间的差异。

2)人工神经网络：简称神经网络(Neural Network，NN)，在机器学习和认知科学领域，是一种模仿生物神经网络结构和功能的数学模型或计算模型，用于对函数进行估计或近似。

3)模型参数：是使用通用变量来建立函数和变量之间关系的一个数量。在人工神经网络中，模型参数通常是实数矩阵。

4)模型训练，对图像数据集进行多分类学习。该模型可采用Tensor Flow、torch等深度学习框架进行构建，使用CNN等神经网络层的多层结合组成多图像分类模型。模型的输入为图像经过openCV等工具读取形成的三通道或原通道矩阵，模型输出为多分类概率，通过softmax等算法最终输出图像压缩结果。在训练时，模型通过交叉熵等目标函数向正确趋势逼近。

5)变分自编码器(VAE)，变分自编码器是图像压缩中的常用网络架构，它对输入的高维图像进行图像变换，生成低维度的隐变量(latent code)。隐变量服从某种固有的先验概率，输入图像服从以隐变量为条件的条件概率，则低维变量可描述输入图像包含的信息，并可以通过采样重建高维的输入图像。在对图像进行压缩时，变分自编码器压缩低维隐变量，减少信息冗余。

6)超先验(hyper prior)。在输入图片通过编码器得到的隐变量的基础上，超先验使用轻量级网络对隐变量中的每一个点进行标熵模型建模，通过对特征值的熵模型获取特征点的出现情况以用于码率估计和熵编码。超先验将隐变量的概率建模使用较小的字节量进行存储，解码时优先解码超先验模块存储的字节流，接着使用从字节流中解码的概率恢复隐变量重建图像。

7)上下文模型(context model)。上下文模型通常使用自回归的方式，利用已解码的像素信息预测未解码像素点信息，减少信息冗余。常用的自回归模型利用滑动窗口线性串行预测，复杂度随输入数据的维度成倍增长。尽管自回归的上下文模型能够极大地提高模型的性能，但压缩模型的计算复杂度也随之大幅增加。

8)熵编码：即编码过程中按熵原理不丢失任何信息的无损编码方式，也是有损编码中的一个关键模块，处于编码器的末端。信息熵为信源的平均信息量(不确定性的度量)。常见的熵编码有：香农(Shannon)编码、哈夫曼(Huffman)编码，指数哥伦布编码(Exp-Golomb)和算术编码(arithmetic coding)。由于熵编码的是编码器通过量化、变换、运动、预测等一系列操作之后得到的需要编码的符号，根据编码符号的分布情况选择适合的熵编码模型，因此熵编码是一个相对独立的单元，可以不止适用于视频编解码，在其他编码器，如图像编码、点云编码中同样适用。

在介绍本申请实施例提供的图像压缩方法之前，首先对相关技术中的图像压缩方法的缺陷进行说明；相关技术中，图像编码方法需要手工设置图像特征，如JPEG、BPG和VVC-intra使用正交线性变换，如离散余弦变换(DCT)和离散小波变换(DWT)在量化和编码之前对图像像素进行去相关。其中JPEG压缩基于人眼对颜色敏感而对亮度较为敏感的前提对Y、Cb、Cr分别进行压缩。例如，对于一张自然图片，jpeg对其每个8*8的patch进行DCT分解，得到64个DCT参数，根据能量聚合原理，较为重要的参数基本集中在低频区域，故无需全部参数即可将图片恢复到可接受的质量范围内。将DCT参数进行量化后可使用变长编码和哈夫曼编码压缩冗余。但是，在压缩率较低时，需要从字节流中恢复隐变量重建高质量图像，而图像非线性变换网络的能力限制网络重建高质量图像的能力；同时相关技术中的上下文模型使用PixelCNN串行解码，解码效率较低。

基于此，本申请实施例提供了一种图像压缩方法，利用包括图像变换网络、超先验网络和上下文网络的图像处理模型对图像进行压缩，提升压缩效率的同时，提高压缩图像的质量。

图1为本申请实施例提供的图像压缩方法的使用场景示意图，参考图1，终端(包括终端10-1和终端10-2)上设置有具有图像处理功能的客户端或者具有视频处理功能的客户端，用户通过所设置的图像处理客户端可以输入相应的待处理图像，图像处理客户端也可以接收相应的压缩后图像，并将所接收的压缩后图像向用户进行展示；视频处理客户端可以通过本申请实施例提供的图像处理模型对视频中的每一帧图像进行压缩，以减少视频所占用的服务器存储空间。终端通过网络300连接服务器200，网络300可以是广域网或者局域网，又或者是二者的组合，使用无线链路实现数据传输。

作为一个示例，服务器200配置为布设图像处理模型并对图像处理模型进行训练，以确定图像处理模型中图像变换网络、超先验网络和上下文网络的网络参数；并在图像处理模型训练完成后通过终端(终端10-1和/或终端10-2)展示图像处理模型所生成的与待处理图像相对应的压缩后图像。

当然在通过图像处理模型对待处理图像进行压缩之前，还需要对图像处理模型进行训练，以确定图像变换网络、超先验网络和上下文网络的网络参数。

下面对实施本申请实施例提供的图像压缩方法的电子设备的结构做详细说明，电子设备可以各种形式来实施，如带有图像压缩功能的专用终端，也可以为设置有图像压缩功能的服务器，例如前述图1中的服务器200。图2为本申请实施例提供的电子设备的组成结构示意图，可以理解，图2仅仅示出了电子设备的示例性结构而非全部结构，根据需要可以实施图2示出的部分结构或全部结构。

本申请实施例提供的电子设备包括：至少一个处理器201、存储器202、用户接口203和至少一个网络接口204。电子设备20中的各个组件通过总线系统205耦合在一起。可以理解，总线系统205配置为实现这些组件之间的连接通信。总线系统205除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图2中将各种总线都标为总线系统205。

其中，用户接口203可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。

可以理解，存储器202可以是易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。本申请实施例中的存储器202能够存储数据以支持终端(如10-1)的操作。这些数据的示例包括：用于在终端(如10-1)上操作的任何计算机程序，如操作系统和应用程序。其中，操作系统包含各种系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务。应用程序可以包含各种应用程序。

在一些实施例中，本申请实施例提供的图像压缩装置可以采用软硬件结合的方式实现，作为示例，本申请实施例提供的图像压缩装置可以是采用硬件译码处理器形式的处理器，其被编程以执行本申请实施例提供的图像压缩方法。例如，硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC，Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD，Programmable Logic Device)、复杂可编程逻辑器件(CPLD，Complex Programmable Logic Device)、现场可编程门阵列(FPGA，Field-Programmable Gate Array)或其他电子元件。

作为本申请实施例提供的图像压缩装置采用软硬件结合实施的示例，本申请实施例所提供的图像压缩装置可以直接体现为由处理器201执行的软件模块组合，软件模块可以位于存储介质中，存储介质位于存储器202，处理器201读取存储器202中软件模块包括的可执行指令，结合必要的硬件(例如，包括处理器201以及连接到总线205的其他组件)完成本申请实施例提供的图像压缩方法。

作为示例，处理器201可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

作为本申请实施例提供的图像压缩装置采用硬件实施的示例，本申请实施例所提供的装置可以直接采用硬件译码处理器形式的处理器201来执行完成，例如，被一个或多个应用专用集成电路(ASIC，Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD，Programmable Logic Device)、复杂可编程逻辑器件(CPLD，Complex Programmable Logic Device)、现场可编程门阵列(FPGA，Field-Programmable Gate Array)或其他电子元件执行实现本申请实施例提供的图像压缩方法。

本申请实施例中的存储器202配置为存储各种类型的数据以支持电子设备20的操作。这些数据的示例包括：用于在电子设备20上操作的任何可执行指令，如可执行指令，实现本申请实施例的从图像压缩方法的程序可以包含在可执行指令中。

在另一些实施例中，本申请实施例提供的图像压缩装置可以采用软件方式实现，图2示出了存储在存储器202中的图像压缩装置，其可以是程序和插件等形式的软件，并包括一系列的模块，作为存储器202中存储的程序的示例，图像压缩装置中包括以下的软件模块：编码模块2081和信息处理模块2082。

当图像压缩装置中的软件模块被处理器201读取到随机存储器(Random Access Memory，RAM)中并执行时，将实现本申请实施例提供的图像压缩方法，下面介绍本申请实施例中图像压缩装置中各个软件模块的功能，其中，

编码模块2081，配置为对待压缩图像进行编码，得到待压缩图像对应的第一隐变量；

信息处理模块2082，配置为确定第一隐变量对应的超先验概率估计值；

信息处理模块2082，配置为据超先验概率估计值，对第一隐变量进行部分解码，得到第一隐变量的部分解码结果；

信息处理模块2082，还配置为基于第一隐变量的部分解码结果及待压缩图像对应的第一隐变量，生成待压缩图像对应的压缩后图像，压缩后图像的数据量小于待压缩图像的数据量。

在一些实施例中，信息处理模块2082，还配置为根据部分解码结果对第二隐变量进行自回归，得到第二隐变量的均值和方差；

信息处理模块2082，还配置为利用均值和方差对第二隐变量进行解码，得到压缩后图像。

在一些实施例中，信息处理模块2082，配置为对第一隐变量进行编码，得到第三隐变量；

信息处理模块2082，配置为对第三隐变量进行熵编码，得到第三隐变量的熵编码；

信息处理模块2082，配置为对第三隐变量的熵编码进行解码，得到第四隐变量；

信息处理模块2082，配置为对第四隐变量进行解码，得到超先验概率估计值。

在一些实施例中，信息处理模块2082，配置为对第二隐变量进行分组，得到至少两组子隐变量；

信息处理模块2082，配置为通过棋盘格对每一组子隐变量进行空间自回归；

信息处理模块2082，配置为当每一组子隐变量完成空间自回归后，通过部分解码结果预测未解码的通道组，直至第二隐变量完全完成自回归，得到第二隐变量的均值和方差。

在一些实施例中，信息处理模块2082，还配置为利用均值和方差对第二隐变量进行解码，得到第二隐变量的解码结果；

信息处理模块2082，配置为对第二隐变量的解码结果交替进行分割和注意力机制转移，直至第二隐变量的解码结果完全分割，得到压缩后图像。

在一些实施例中，信息处理模块2082，还配置为通过图像处理模型的图像变换网络对待压缩图像进行编码，得到第一隐变量；

通过超先验网络，根据第一隐变量确定超先验概率估计值；

通过上下文网络根据超先验概率估计值，对第一隐变量进行部分解码，得到部分解码结果；

通过上下文网络，根据部分解码结果对第二隐变量进行自回归，得到第二隐变量的均值和方差；

通过图像变换网络利用均值和方差对第二隐变量进行解码，得到压缩后图像。

在一些实施例中，信息处理模块2082，还配置为获取与图像处理模型对应的第一训练样本集合，第一训练样本集合包括至少一组无噪声的训练样本；

信息处理模块2082，还配置为第一训练样本集合配置随机噪声，得到第二训练样本集合；

信息处理模块2082，还配置为获取图像处理模型的初始参数；

信息处理模块2082，还配置为基于图像处理模型的初始参数和图像处理模型的损失函数，通过第一训练样本集合和第二训练样本集合，对图像处理模型进行训练，以确定图像处理模型的图像变换网络参数、超先验网络参数和上下文网络参数。

在一些实施例中，信息处理模块2082，配置为当图像处理模型的使用环境为视频图像压缩时，确定与图像处理模型的使用环境相匹配的动态噪声数量阈值；

根据动态噪声数量阈值，为第一训练样本配置动态数量的随机噪声，得到与动态噪声阈值相匹配的第二训练样本集合。

在一些实施例中，信息处理模块2082，配置为当图像处理模型的使用环境为医疗图像压缩时，确定与图像处理模型的使用环境相匹配的固定噪声数量阈值；

根据固定噪声数量阈值，为第一训练样本配置固定数量的随机噪声，得到与固定噪声阈值相匹配的第二训练样本集合。

在一些实施例中，信息处理模块2082，配置为获取压缩后图像和待压缩图像的像素差值；获取对图像处理模型中第二隐变量和第四隐变量进行存储时的字节数；根据像素差值和字节数确定图像处理模型的融合损失函数。

本申请实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机可执行指令，该计算机可执行指令存储在计算机可读存储介质中。计算机设备或电子设备的处理器从计算机可读存储介质读取该计算机可执行指令，处理器执行该计算机可执行指令，使得该计算机设备执行上述图像压缩方法所提供的不同实施例及实施例的组合。

当图像处理模型训练完成之后，可以部署在服务器中或者云服务器网络中，本申请所提供的图像压缩装置也可以部署在图2所示的电子设备中，执行本申请实施例提供的图像压缩方法。

结合图2示出的电子设备20说明本申请实施例提供的图像压缩方法，参见图3A，图3A为本申请实施例提供的图像压缩方法的流程示意图，包括以下步骤：

步骤3001：对待压缩图像进行编码，得到待压缩图像对应的第一隐变量。

这里，待压缩图像可以是自然图像，在实际应用中，可以通过用于进行图像编码的图像变换网络，如通过变分自编码器对待压缩图像进行编码，得到待压缩图像对应的第一隐变量，该第一隐变量是指在模型中存在但无法直接观测到的随机变量，用于表示输入数据的潜在特征，在实际实施时，第一隐变量可以是图像变换网络的隐藏层(即图像变换网络的输入层和输出层之间的中间层)的输出。

这里，图像变换网络可以为用于对待压缩图像进行编码的神经网络模型，包括输入层、至少一个隐藏层及输出层，通过图像变换网络对待压缩图像进行编码，得到待压缩图像对应的第一隐变量。

以电子游戏应用场景为例，由于游戏图像数量较多，为了压缩图像，通常会对电子游戏中的高清图片分批进行4倍的压缩处理，例如：原始游戏图像的分辨率为1024*1024，进行4倍压缩处理后，形成分辨率为256*256的低分辨率游戏图像。但是通过本申请的图像压缩方法可以批量地将图片资源转化为适配于终端的图形处理器(Graphics Processing Unit，GPU)运行的压缩后图像，进而减少终端侧的内存开销和图像传输时的网络开销，例如将分辨率为1024*1024原始游戏图像，进行8倍压缩处理，使得经过解码得到压缩后图像的体积更小，降低了图像的存储成本。

步骤3002：确定第一隐变量对应的超先验概率估计值。

在一些实施例中，基于编码得到的第一隐变量，可通过如下方式确定超先验概率估计值：对第一隐变量进行编码，得到编码结果，并对该编码结果进行量化，得到量化结果，然后对该量化结果进行解码，得到超先验概率估计值。

其中，对第一隐变量进行编码可通过超先验编码器实现，对量化结果进行解码可通过超先验解码器实现，该超先验编码器及超先验解码器可包含于Transformer模型中。如此，若编码得到的第一隐变量服从某种固有的先验概率，得到的超先验概率估计值可作为后续部分解码的参考，使得解码得到的解码结果的准确度更高。

这里，超先验概率估计可以为对先验分布的参数进行估计的过程，其中，先验分布的参数取决于先验分布的形式，如当先验分布形式为正态分布时，相应的先验分布的参数可以为均值和方差，也即当第一隐变量的先验分布为正态分布时，相应的先验分布的参数可以为均值和方差；超先验概率估计值即为对先验分布的参数估计所得到的值。

步骤3003：根据超先验概率估计值，对第一隐变量进行部分解码，得到第一隐变量的部分解码结果。

这里，在实际应用中，利用超先验概率估计值作为解码的参考信息，对第一隐变量进行部分解码，也即对一部分像素进行解码，使得后续再对其它像素进行解码时，可基于该部分解码结果进行预测(解码)。

示例性地，在通道维度上对第一隐变量进行分组，得到对应于各个通道维度的多个通道隐变量组，然后，可采用自回归(如棋盘格自回归)的方式，对得到的多个通道隐变量组中的部分通道隐变量组(如一个通道隐变量组)进行解码，得到第一隐变量的部分解码结果，进而使用该部分解码结果作为预测参考信息，对下一个未解码的通道隐变量组进行解码。其中，对于解码的通道隐变量组的选取，可以为随机选取。

这里，通道是指构成彩色图像的颜色信息的分量，或者用于表示图像的特征分量。针对RGB色彩模型，彩色图像由红色(R)、绿色(G)和蓝色(B)三个颜色通道组成；针对HSV色彩模型，彩色图像由色调、饱和度、亮度三个通道组成。

在一些实施例中，当通道维度对应的是颜色维度时，包括红色(R)维度、绿色(G)维度和蓝色(B)维度，基于这三个颜色维度，对第一隐变量进行分组，得到对应红色(R)维度的通道隐变量组、对应绿色(G)维度的通道隐变量组及对应蓝色(B)维度的通道隐变量组、每个隐变量组中包括多个像素。

如此，在通道维度上对第一隐变量进行分组后，在每个隐变量分组内部使用棋盘格自回归代替串行自回归，实现了在空间和通道维度上正交地交替进行自回归的处理，并用先解码的通道组预测未解码的通道组。

步骤3004：基于第一隐变量的部分解码结果及待压缩图像对应的第一隐变量，生成待压缩图像对应的压缩后图像。

其中，压缩后图像的数据量小于待压缩图像的数据量。

在一些实施例中，基于第一隐变量的部分解码结果及待压缩图像对应的第一隐变量，可以通过如下方式生成待压缩图像对应的压缩后图像：基于第一隐变量的部分解码结果及待压缩图像对应的第一隐变量，通过对图像的每个像素进行自回归建模来生成新的图像，该过程可以包括Masked卷积和逐像素的条件概率建模，例如，对于每个卷积层，通过用合适的mask(掩码)来遮盖未来像素，保证在训练时只能利用已知的像素值来预测当前像素的像素值的概率分布，通过使用一系列的卷积层来对每个像素进行条件建模，每个卷积层负责对输入图像的一个子集进行建模，通过建模每个像素的条件概率分布(给定其左边和上方的像素值)，可以利用已知像素来预测当前像素的可能取值。

这里，条件概率分布指的是在给定变量X的情况下，变量Y取各个可能取值的概率分布，即给定X的条件下，Y的分布情况。建模每个像素的条件概率分布，也即针对每个像素，如目标像素来说，在给定目标像素的关联像素(如该像素的左边和上方的像素值)的像素值的情况下，目标像素的可能的像素值的分布。

在一些实施例中，基于第一隐变量的部分解码结果及待压缩图像对应的第一隐变量，可以通过如下方式生成待压缩图像对应的压缩后图像：对第一隐变量进行量化，得到第二隐变量；根据部分解码结果对第二隐变量进行自回归，得到第二隐变量的均值和方差；利用均值和方差对第二隐变量进行解码，得到压缩后图像。

在一些实施例中，对第一隐变量进行量化的过程可以看做是对第一隐变量进行降维的过程，例如，将第一隐变量映射到预设的低维空间，得到第二隐变量；这里的低维空间指的是相对第一隐变量的维度来说为低维空间，在实际应用中，可以采用非线性降维的方式或量化矩阵的方式对第一隐变量进行量化，对第一隐变量进行量化的操作还可通过向量量化器实现，向量量化器是一个将连续或离散向量序列映射为适合在数字信道上通信或存储的数字序列的系统，通过对第一隐变量进行量化，在保持数据必要保真度的同时，实现了数据压缩。

在一些实施例中，根据部分解码结果对第二隐变量进行自回归，得到第二隐变量的均值和方差的过程可以通过如下方式实现：根据部分解码结果及第二隐变量，构建序列数据，通过自回归模型或者条件异方差模型中至少之一，对该序列数据进行拟合，得到第二隐变量的均值动态模型及方差动态模型中至少之一，通过最大似然估计或者其他参数估计方法，分别对第二隐变量的均值动态模型及方差动态模型进行参数估计，得到第二隐变量的均值和方差。

这里对自回归模型进行说明。自回归模型属于平稳时间序列模型的一种，可以用于预测和分析具有自相关性的数据，通过构建自回归模型，可以研究不同时间点上的数据是否存在依赖关系，以及这种依赖关系的强度，利用自回归模型对序列数据进行拟合和分析，可以预测未来时刻的随机变量值的平均趋势变化，得到第二隐变量的均值动态模型。

对条件异方差模型进行说明。条件异方差模型是一种用于描述时间序列/序列数据中存在异方差(即方差不恒定)的模型。在实际应用中，数据的方差可能会随着时间或其他因素的改变而发生明显的变化，条件异方差模型能够更好地捕捉这种异方差性，通过条件异方差模型对序列数据进行拟合能够得到方差动态模型。

对第二隐变量的均值动态模型及方差动态模型进行说明。该均值动态模型一种描述时间序列数据平均趋势变化的模型，用于描述序列数据的平均趋势变化，指示序列数据中的动态特征。方差动态模型是一种用于描述时间序列数据方差变化的模型，用于时间序列数据的方差的动态变化。

在一些实施例中，利用均值和方差，可采用如下方式对第二隐变量进行解码，得到压缩后图像：根据隐变量的均值和方差，构建一个多变量高斯分布，在构建高斯分布时，需要确保分布的维度与隐变量的维度相同；从构建的高斯分布中抽取一定数量的样本。这些样本代表了在给定隐变量均值和方差条件下，隐变量可能取得的值；将抽取的样本值作为隐变量的输入，通过解码器进行解码，该解码器通常是一个与编码器相对应的神经网络结构，它能够将隐变量映射回原始图像空间，通过解码器将输入映射为生成的图像。

在一些实施例中，利用均值和方差，还可采用如下方式对第二隐变量进行解码，得到压缩后图像：利用该均值和方差对第二隐变量进行解码，得到第二隐变量的解码结果；对第二隐变量的解码结果交替进行分割和注意力机制转移，直至第二隐变量的解码结果完全分割，得到压缩后图像。其中，第二隐变量通过对第一隐变量进行量化所得到，第二隐变量相较于第一隐变量包含了用于解码或重建图像的更抽象、压缩后的信息，进而使得基于第二隐变量进行针对待压缩图像的压缩，能够提高图像压缩效率。

对第二隐变量的解码结果进行分割也即将第二隐变量的解码结果分割成不同的区域或块，如此可以并行处理以提高效率，使用注意力机制来专注于分割后区域中的特定部分，能够更集中资源处理图像的相关部分，提高图像重建的精确度；在一些实施例中，对第二隐变量的解码结果交替进行分割和注意力机制转移，直至第二隐变量的解码结果完全分割，得到压缩后图像，包括：

将第二隐变量的解码结果分割成目标数量的不同的区域，并针对每个区域应用注意力机制；

迭代执行上述处理，直至第二隐变量的解码结果被分割成的块的数量达到数量阈值(即第二隐变量的解码结果被完全分割)，得到多个图像区域；

将得到的上述多个图像区域进行组合，得到压缩后图像。

通过图3A所示的处理处理步骤，从空间维度和通道维度上交替进行自回归，大幅提高了压缩效率。对于一张输入图像，在压缩过程中首先对所输入的图像进行图像变换，生成低维度的隐变量(latent code)，接着对隐变量进行概率估计建模，最终根据计算概率使用熵编码的处理方式将隐变量压缩为比特流；在解压过程中首先根据比特流解码恢复隐变量，然后根据隐变量重建图像，实现图像的高效压缩。

图3A所示的处理步骤在实际使用时，可以利用图像处理模型所实现，不同于相关技术中的图像处理模型，本申请所提供的图像压缩方法中所使用的图像处理模型包括：图像变换网络、超先验网络和上下文网络，下面对图像处理模型包括：图像变换网络、超先验网络和上下文网络的工作过程分别进行说明。

参见图3B，图3B为本申请实施例提供的图像压缩方法的流程示意图，可以理解地，图3B所示的步骤可以由运行图像压缩装置的各种电子设备执行，例如可以是如带有图像压缩功能的服务器或者服务器集群，用于通过图像处理模型对接收的图像或者接收的视频中每一个图像帧进行压缩，减少图像存储所占用的存储空间。下面针对图3B示出的步骤进行说明。

步骤301：电子设备通过图像处理模型的图像变换网络对待压缩图像进行编码，得到第一隐变量。

参考图4，图4为本申请实施例中图像处理模型的数据流转示意图，本申请中的图像处理模型包括：图像变换网络、超先验网络和上下文网络；作用如下：

1)图像变换网络的作用是利用高分辨率的自然图像生成低维度的隐变量(latent code)，假定第一隐变量服从某种固有的先验概率，输入的待压缩图像服从以隐变量为条件的条件概率，图像变换网络应使编码器和解码器构造的概率估计足够接近，使隐变量重建出的图像接近原始图像。

2)超先验网络在隐变量的基础上使用编码器结构和解码器结构对隐变量中的每一个点进行熵值建模，通过特征值的熵模型获取过程中熵值特征点的出现情况来对压缩后图像的码率进行估计并进行熵编码。超先验网络可以将隐变量的概率建模使用较小的字节量进行存储，为后续上下文网络的解码提供辅助参考。

3)上下文网络使用自回归的方式，利用已解码的像素信息预测未解码像素点信息，最终将预测结果输入图像变换网络的解码器网络中进行解码处理，得到压缩后图像，上下文网络可以实现减少信息冗余，提升图像压缩的效率。

下面对图像处理模型所包括的图像变换网络、超先验网络和上下文网络的模型结构和工作原理分别进行说明。

参考图5，图5为本申请实施例中图像处理模型的模型结构示意图，其中，图像变换网络包括：图像编码器网络和图像解码器网络；图像编码器网络包括：转移窗口注意力机制模块(Swin Transformer Block)和块融合模块(Patch Merge Block)，其中，块融合模块依次包括：空间深度转换层(Space-to-Depth)、归一化层(LayerNorm)和映射层(Linear)；图像解码器网络包括：转移窗口注意力机制模块(Swin Transformer Block)和块分割模块(Patch Split Block)，其中，块分割模块依次包括：映射层(Linear)、归一化层(LayerNorm)和深度空间转换层(Depth-to-Space)。

参考图6，图6为本申请实施例中空间深度转换层和深度空间转换层的工作过程示意图，由于图像处理模型需要对待压缩图像进行压缩，使得压缩后图像的体积小于待压缩图像，但是分辨率接近待压缩图像，因此，编码器网络中的空间深度转换层(Space-to-Depth)配置为进行下采样，解码器网络中的深度空间转换层(Depth-to-Space)配置为进行上采样，如图6所示，对于一个4*4的待压缩图像，Space-to-Depth将每个2*2的相邻像素划分为一个块(patch)，将每个块中相同位置(同一阴影)像素拼接后沿通道方向进行连接，得到4个2*2块。Depth-to-Space为Space-to-Depth的逆向操作，通过上采样将4个2*2块转换为4*4的图像。

参考图7，图7为本申请实施例中转移窗口注意力机制模块的组成结构示意图，其中，转移窗口注意力机制模块(Swin-Transformer block)主要包括层标准化、多层感知器以及一个正常的窗口多注意力以及一个转移窗口的多头注意力机制，值得注意的是利用窗口注意力机制相对于传统注意力机制可以有效地降低运算过程中的计算复杂度，大大提高计算的效率，使得注意力机制可以应用在大图像的处理过程中。然而如果只利用正常的窗口注意力机制严重限制框架的感受野，因此通过添加转移窗口注意力机制在不增加计算复杂度的前提下大大提高了注意力机制的感受野。转移窗口注意力机制模块通过合并更深层的图像块来构建分层特征图，并且由于只在每个局部窗口内计算注意力，因此对于输入图像大小具有线性计算复杂度。如图7所示，本申请中，转移窗口注意力机制模块在特征图的每个非重叠窗口内执行局部自注意力，并保留特征大小。图7展示了两个连续Swin Transformer Block的内部结构，包含Layer Norm、多头自注意力和全连接层，内部使用short cut进行连接。图像变换网络的编码器网络和解码器网络使用的窗口大小为8，通道数依次为128,192,256,320，转移窗口注意力机制模块络叠加个数依次为2，2，6，2。

参考图8，图8为本申请实施例中转移窗口注意力机制模块的计算原理示意图，其中，将输入图片(Images)HxWx3划分为不重合的patch集合，其中每个patch尺寸为4x4，那么每个patch的特征维度为4x4x3＝48，patch块的数量为H/4 x W/4；如图8所示，stage1：先通过一个linear embedding将划分后的patch特征维度变成C，然后送入转移窗口注意力机制模块；stage2-stage4操作相同，先通过一个patch merging，将输入按照2x2的相邻patches合并，这样子patch块的数量就变成了H/8 x W/8，特征维度就变为4C，如图8所示，每一个转移窗口注意力机制模块的处理结果如下：stage1：【H/4 x W/4，C】，stage2：【H/8 x W/8，2C】stage3：【H/16 x W/16，4C】stage4：【H/32 x W/32，8C】，转移窗口注意力机制模块随着网络深度的加深数量会逐渐减少并且每个块的感知范围会扩大，这个设计是为了方便转移窗口注意力机制模块的层级构建，并且能够适应视觉任务的多尺度。

步骤302：通过超先验网络根据第一隐变量确定超先验概率估计值。

如图4所示，超先验网络的编码器网络包括：转移窗口注意力机制模块和块融合模块；超先验网络的解码器网络包括：转移窗口注意力机制模块和块分割模块，窗口大小为4，通道数依次为192，192，转移窗口注意力机制模块叠加个数依次为5，1。

在一些实施例中，超先验网络根据第一隐变量确定超先验概率估计值，可以通过以下方式实现：

通过超先验网络的超先验编码器对第一隐变量y进行编码，得到第三隐变量z；通过超先验网络的量化模块(Q)、算数编码模块(AE)以及算数解码模块(AD)确定第一隐变量对应的超先验概率估计值，通过超先验网络的量化模块(Q)对第三隐变量z进行量化，得到第四隐变量压缩时使用算术编码模块对第四隐变量进行熵编码，得到字节流(即第四隐变量的熵编码)。解压缩时使用算术解码器从字节流中解码第四隐变量，如图4所示，第四隐变量是对第三隐变量z进行量化后获得的。压缩时是对第四隐变量进行压缩以获得字节流，解压缩时从字节流恢复第四隐变量，通过图4所示的超先验网络的解码器网络对第四隐变量进行解码，得到超先验概率估计值N(μ,σ)。

在一些实施例中，由于在使用高斯分布参数对压缩后隐变量进行算数编码和算数解码的阶段都需要解码点的出现概率或者累计概率分布(CDF)，故而需要将出现概率或者累计概率分布传输到解码端用于正确的熵解码。因此超先验网络的编码器需要对概率或者累计概率分布先压缩成z，通过对z进行量化熵编码传输至超先验网络的编码器的解码端，通过解码端解码学习潜在表示y的建模参数。通过超先验网络的编码器获取得到y潜在表示的建模分布后，通过对其建模并且对量化后的第二隐变量进行熵编码得到压缩后的码流文件，而算术解码从字节流中得到再将熵解码结果输入到解码模块，得到最终的压缩后图像。

步骤303：对所述第一隐变量进行量化后得到第二隐变量，并将第二隐变量输入上下文网络。

步骤304：通过上下文网络对第二隐变量进行自回归，得到第二隐变量的均值和方差。

其中，电子设备通过上下文网络计算得到第二隐变量的均值和方差之后，算术编码器根据第二隐变量的概率分布进行建模，得到字节流。

其中，电子设备通过上下文网络根据部分解码结果对第二隐变量进行自回归，对第二隐变量进行概率建模，计算第二隐变量的均值和方差，之后，算术编码器根据第二隐变量的概率分布进行建模，得到字节流。

其中，参考图9，图9为本申请实施例中上下文网络的自回归示意图，在一些实施例中，上下文网络根据部分解码结果对第二隐变量进行自回归，得到第二隐变量的均值和方差，可以通过以下方式实现：

对第二隐变量进行分组，得到至少两组子隐变量；通过棋盘格对每一组子隐变量进行空间自回归；当每一组子隐变量完成空间自回归后，通过部分解码结果预测未解码的通道组，直至第二隐变量完全完成自回归，得到第二隐变量的概率分布。

这里，空间自回归通常假设一个空间位置的特征与其周围邻近位置的特征是相关的。这种相关性可以通过权重矩阵(通常称为空间权重矩阵)来表示，该矩阵描述了空间上各点之间的空间关系，可通过空间权重矩阵描述子隐变量与预测结果间的关联。

例如，空间维度的自回归可以通过以下方式实现：将当前解码符号与已解码符号相关联，变量进行概率建模，根据所有可观测的相邻符号使用空间方向上的自回归卷积g_sp预测在第i个位置的上下文表达Φ_sp,i，其中上下文网络中的上下文表达的计算参考公式1：

通道维度自回归可以通过以下方式实现：将第二隐变量的通道分为K组进行自回归以减少通道间的冗余，使用先解码的通道组进行通道方向上的自回归卷积g_ch预测未解码的通道组的上下文表达过程参考公式2：

在通道自回归中，通道分组个数的设置对于平衡压缩性能和运行速度至关重要。分组数k越大，计算粒度越细腻，率失真性能越好，但参数估计越慢，k＝5作为分组数为本申请图像处理模型的优选值。

如图9所示，结合棋盘格的空间上下文自回归模型和通道上下文自回归模型，实现了一种在空间和通道维度上正交地交替进行自回归的加速运算。在实际应用中，在通道维度上对隐变量进行分组，在每个隐变量分组内部使用棋盘格自回归代替串行自回归，待该组第二隐变量内部完成空间自回归后，使用通道自回归用先解码的通道组预测未解码的通道组。在自回归初始阶段，上下文网络根据超先验的概率建模进行自回归预测，首先预测出第一个通道分组中的棋盘格第一部分，接着以当前预测出的棋盘格结果来对剩余棋盘格部分进行预测。在两次棋盘格自回归过后，第一个通道分组已完成预测。在预测第二组通道分组时，第一组已预测的结果将作为后续概率建模的信息参考共同进行运算。整个运算过程在空间和通道维度上正交交替地进行自回归，由此，有效提升图像的压缩速率。

步骤305：通过图像变换网络，利用均值和所述方差对第二隐变量进行解码，得到压缩后图像。

结合前述图4所示，通过图像变换网络的解码器网络的转移窗口注意力机制模块对第二隐变量进行解码，得到第二隐变量的解码结果；利用第二隐变量交替通过转移窗口注意力机制模块和块分割模块得到压缩后图像，其中压缩后图像的体积小于待压缩图像。

图10为本申请实施例提供的图像处理模型训练方法的流程示意图，可以理解地，图10所示的步骤可以由运行图像处理模型训练装置的各种电子设备执行，例如可以是如带有图像处理功能的专用终端、带有图像处理模型训练功能的服务器或者服务器集群。下面针对图10示出的步骤进行说明。

步骤1001：图像处理模型训练装置获取第一训练样本集合，第一训练样本集合包括至少一组无噪声的训练样本。

步骤1002：图像处理模型训练装置为第一训练样本集合配置随机噪声，得到第二训练样本集合。

在一些实施例中，为第一训练样本集合配置随机噪声，得到第二训练样本集合，可以通过以下方式实现：

当图像处理模型的使用环境为小程序游戏图像生成时，确定与图像处理模型的使用环境相匹配的动态噪声数量阈值；根据动态噪声数量阈值，为第一训练样本配置动态数量的随机噪声，以形成与动态噪声阈值相匹配的第二训练样本集合。其中，由于小程序游戏图像的使用环境多种多样，例如可以是角色扮演类小程序游戏图像，可以是终端采集的用户的图像作为小程序游戏图像，也可以是视频图像帧中截取的图像作为小程序游戏图像，由于训练样本来源于不同的数据源，数据源中包括各类型应用场景的数据作为相应的训练本的数据来源，针对这些图像处理模型的不同使用场景，可以使用与动态噪声阈值相匹配的第二训练样本集合对图像处理模型进行针对性的训练。

当图像处理模型的使用环境为医疗图像生成时，确定与图像处理模型的使用环境相匹配的固定噪声数量阈值；根据固定噪声数量阈值，为第一训练样本配置固定数量的随机噪声，以形成与固定噪声阈值相匹配的第二训练样本集合。由于训练样本来源于固定的数据源，数据源中包括固定场景的数据作为相应的训练本的数据来源(例如任一种产生医疗图像的电子设备)，例如，本申请所提供的图像处理模型可以作为软件模块封装于移动检测电子设备中，也可以封装于不同的固定医疗检查设备中(包括但不限于：手持诊断仪，病房中央监测系统，床边监测系统)，当然也可以固化于智能机器人的硬件设备中，针对这些图像处理模型的不同使用场景，可以使用固定噪声阈值相匹配的第二训练样本集合对图像处理模型进行针对性的训练，以提升图像处理模型的训练速度。

步骤1003：图像处理模型训练装置计算图像处理模型的损失函数。

在本申请的一些实施例中，首先，获取压缩后图像的和待压缩图像的像素差值；之后获取对图像处理模型中第二隐变量和第四隐变量进行存储时的字节数；最后根据像素差值和字节数计算图像处理模型的融合损失函数。图像处理模型的损失函数参考公式3：
L＝R+λD 公式3

其中，R表示rate，为第二隐变量和第四隐变量存储所需字节。D表示distortion，通常用计算压缩后图像与待压缩图像之间的差异，其中d通常为均方误差MSE。λ为控制rate和distortion的参数，λ一般越大，对应模型的像素深度(BPP Bits Per Pixel)越大，图像的重建质量越高。

步骤1004：基于图像处理模型的初始参数和图像处理模型的损失函数，通过第一训练样本集合和第二训练样本集合，对图像处理模型进行训练。

这里，通过对图像处理模型训练，以确定图像处理模型的图像变换网络参数、超先验网络参数和上下文网络参数。

训练完成的测试阶段，图11为本申请实施例提供的图像处理模型的效果测试示意图，其中，在标准数据集Kodak上进行了性能测试，以bpp为横坐标，PSNR(Peak Signal to Noise Ratio峰值信噪比)为纵坐标绘制模型在不同压缩率下的率失真性能。其中本申请的图像处理模型中四个测试点的λ取值依次为0.002、0.005、0.02以及0.04，可见本申请的图像处理模型的提升图像压缩的效率，同时经过压缩的图像的体积更小，相同的PSNR＝32时，本申请的bpp＝0.4大于相关技术的bpp＝0.25。

本申请具有以下有益技术效果：

1)本申请实施例通过图像处理模型的图像变换网络对待压缩图像进行编码，得到第一隐变量，超先验网络根据第一隐变量确定超先验概率估计值；由此，利用转移窗口注意力机制所构建的图像变换网络和超先验网络对图像进行处理，可以提升图像压缩的性能，使得经过解码得到压缩后图像的体积更小，降低了图像的存储成本。

2)上下文网络根据超先验概率估计值，对第一隐变量进行部分解码，得到部分解码结果；上下文网络根据所述部分解码结果对所述第二隐变量进行自回归，得到第二隐变量的均值和方差；利用所述均值和所述方差对所述第二隐变量进行解码，得到压缩后图像，其中，所述压缩后图像的体积小于所述待压缩图像，由此，上下文网络用先解码的通道分组信息作为后续待解码的通道分组的先验知识减少后续的压缩冗余，节省了压缩图像的耗时，同时，上下文网络可以从空间维度和通道维度上交替进行自回归，提高了压缩效率。

3)图像处理模型在训练时，可以根据不同的使用需求，灵活地调整训练样本集合，使得图像处理模型能够适用于不同的图像压缩环境中。

以上，仅为本申请的实施例而已，并非用于限定本申请的保护范围，凡在本申请的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本申请的保护范围之内。

Claims

一种图像压缩方法，所述方法由电子设备执行，所述方法包括：

对待压缩图像进行编码，得到所述待压缩图像对应的第一隐变量；

确定所述第一隐变量对应的超先验概率估计值；

根据所述超先验概率估计值，对所述第一隐变量进行部分解码，得到所述第一隐变量的部分解码结果；

基于所述第一隐变量的部分解码结果及所述待压缩图像对应的第一隐变量，生成所述待压缩图像对应的压缩后图像，所述压缩后图像的数据量小于所述待压缩图像的数据量。
根据权利要求1所述的方法，其中，所述基于所述第一隐变量的部分解码结果及所述待压缩图像对应的第一隐变量，生成所述待压缩图像对应的压缩后图像，包括：

对所述第一隐变量进行量化，得到第二隐变量；

根据所述部分解码结果对所述第二隐变量进行自回归，得到第二隐变量的均值和方差；

利用所述均值和所述方差对所述第二隐变量进行解码，得到所述压缩后图像。
根据权利要求2所述的方法，其中，所述根据所述部分解码结果对所述第二隐变量进行自回归，得到第二隐变量的均值和方差，包括：

对所述第二隐变量进行分组，得到至少两组子隐变量；

通过棋盘格对每一组子隐变量进行空间自回归；

当每一组子隐变量完成空间自回归后，通过所述部分解码结果预测未解码的通道组，直至所述第二隐变量完全完成自回归，得到所述第二隐变量的均值和方差。
根据权利要求2所述的方法，其中，所述利用所述均值和所述方差对所述第二隐变量进行解码，得到所述压缩后图像，包括：

利用所述均值和所述方差对所述第二隐变量进行解码，得到所述第二隐变量的解码结果；

对所述第二隐变量的解码结果交替进行分割和注意力机制转移，直至所述第二隐变量的解码结果完全分割，得到所述压缩后图像。
根据权利要求2所述的方法，其中，所述方法基于图像处理模型所实现，所述图像处理模型包括：图像变换网络、超先验网络和上下文网络，所述对待压缩图像进行编码，得到所述待压缩图像对应的第一隐变量，包括：

通过图像处理模型的图像变换网络对待压缩图像进行编码，得到第一隐变量；

所述确定所述第一隐变量对应的超先验概率估计值，包括：

通过所述超先验网络，根据所述第一隐变量确定所述超先验概率估计值；

所述根据所述超先验概率估计值，对所述第一隐变量进行部分解码，得到所述第一隐变量的部分解码结果，包括：

通过所述上下文网络根据所述超先验概率估计值，对所述第一隐变量进行部分解码，得到所述部分解码结果；

所述根据所述部分解码结果对所述第二隐变量进行自回归，得到第二隐变量的均值和方差，包括：

通过所述上下文网络，根据所述部分解码结果对所述第二隐变量进行自回归，得到第二隐变量的均值和方差；

所述利用所述均值和所述方差对所述第二隐变量进行解码，得到所述压缩后图像，包括：

通过所述图像变换网络利用所述均值和所述方差对所述第二隐变量进行解码，得到所述压缩后图像。
根据权利要求5所述的方法，其中，所述图像变换网络包括：图像编码器网络和图像解码器网络；

所述图像编码器网络包括：转移窗口注意力机制模块和块融合模块，其中，所述块融合模块依次包括：空间深度转换层、归一化层和映射层；

所述图像解码器网络包括：转移窗口注意力机制模块和块分割模块，其中，所述块分割模块依次包括：映射层、归一化层和深度空间转换层。
根据权利要求5所述的方法，其中，所述方法还包括：

获取与所述图像处理模型对应的第一训练样本集合，所述第一训练样本集合包括至少一组无噪声的训练样本；

为所述第一训练样本集合配置随机噪声，得到第二训练样本集合；

获取所述图像处理模型的初始参数；

基于所述图像处理模型的初始参数和所述图像处理模型的损失函数，通过所述第一训练样本集合和所述第二训练样本集合，对所述图像处理模型进行训练，以确定所述图像处理模型的图像变换网络参数、超先验网络参数和上下文网络参数。
根据权利要求7所述的方法，其中，所述为所述第一训练样本集合配置随机噪声，得到第二训练样本集合，包括：

当所述图像处理模型的使用环境为视频图像压缩时，确定与所述图像处理模型的使用环境相匹配的动态噪声数量阈值；

根据所述动态噪声数量阈值，为所述第一训练样本配置动态数量的随机噪声，得到与所述动态噪声阈值相匹配的第二训练样本集合。
根据权利要求7所述的方法，其中，所述为所述第一训练样本集合配置随机噪声，得到第二训练样本集合，包括：

当所述图像处理模型的使用环境为医疗图像压缩时，确定与所述图像处理模型的使用环境相匹配的固定噪声数量阈值；

根据所述固定噪声数量阈值，为所述第一训练样本配置固定数量的随机噪声，得到与所述固定噪声阈值相匹配的第二训练样本集合。
根据权利要求7所述的方法，其中，所述方法还包括：

获取所述压缩后图像和所述待压缩图像的像素差值；

获取对所述图像处理模型中第二隐变量和第四隐变量进行存储时的字节数；

根据所述像素差值和所述字节数确定所述图像处理模型的融合损失函数。
根据权利要求1至10任一项所述的方法，其中，所述确定所述第一隐变量对应的超先验概率估计值，包括：

对所述第一隐变量进行编码，得到第三隐变量；

对所述第三隐变量进行熵编码，得到所述第三隐变量的熵编码；

对所述第三隐变量的熵编码进行解码，得到第四隐变量；

对所述第四隐变量进行解码，得到所述超先验概率估计值。
一种图像压缩装置，所述装置包括：

编码模块，配置为对待压缩图像进行编码，得到所述待压缩图像对应的第一隐变量；

信息处理模块，配置为确定所述第一隐变量对应的超先验概率估计值；

所述信息处理模块，还配置为根据所述超先验概率估计值，对所述第一隐变量进行部分解码，得到所述第一隐变量的部分解码结果；

所述信息处理模块，还配置为基于所述第一隐变量的部分解码结果及所述待压缩图像对应的第一隐变量，生成所述待压缩图像对应的压缩后图像，所述压缩后图像的数据量小于所述待压缩图像的数据量。
一种电子设备，所述电子设备包括：

存储器，配置为存储可执行指令；

处理器，配置为运行所述存储器存储的可执行指令时实现权利要求1至11任一项所述的图像压缩方法。
一种计算机程序产品，包括计算机程序或指令，所述计算机程序或指令被处理器执行时，实现权利要求1至11任一项所述的图像压缩方法。
一种计算机可读存储介质，存储有可执行指令，所述可执行指令被处理器执行时实现权利要求1至11任一项所述的图像压缩方法。