ES2965422T3

ES2965422T3 - Un aparato y método de codificación de imágenes basado en una derivación de un parámetro de cuantificación

Info

Publication number: ES2965422T3
Application number: ES21195707T
Authority: ES
Inventors: Seunghwan Kim; Jaehyun Lim
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2018-04-01
Filing date: 2019-03-05
Publication date: 2024-04-15
Anticipated expiration: 2039-03-05
Also published as: JP7727025B2; EP4283989A1; KR20220057652A; JP2021506157A; PL3688986T3; KR20200051850A; KR102547644B1; US20230007258A1; EP4283989B1; EP3688986A1; SI3941052T1; CN116320456A; EP3941052A1; WO2019194422A1; KR20240073164A; EP3941052B1; FI3941052T3; EP3688986B1; ES2902481T3; CN116320455B

Abstract

Según una realización de la presente invención, se proporciona un método de decodificación de imágenes realizado por un aparato de decodificación. El método comprende: decodificar información de imagen que comprende información sobre un parámetro de cuantificación (QP), derivar un valor de luma promedio esperado de un bloque actual a partir de muestras vecinas disponibles, derivar un desplazamiento de parámetro de cuantificación (desplazamiento de QP) para derivar un parámetro de cuantificación de luma (luma QP).) basado en el valor de luma promedio esperado y la información sobre el QP, derivando el QP de luma basado en el desplazamiento de QP, realizando una cuantificación inversa para un grupo de cuantificación que comprende el bloque actual basado en el QP de luma derivado, generando muestras residuales para el QP actual bloque basado en la cuantificación inversa, generando muestras de predicción para el bloque actual basándose en la información de la imagen y generando muestras reconstruidas para el bloque actual basándose en las muestras residuales para el bloque actual y las muestras de predicción para el bloque actual. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Un aparato y método de codificación de imágenes basado en una derivación de un parámetro de cuantificación [Campo técnico]

La presente invención se refiere a una técnica de codificación de imágenes. Más específicamente, la presente invención se refiere a un aparato de codificación de imágenes y método del mismo basándose en una derivación de parámetro de cuantificación en un sistema de codificación de imágenes.

[Antecedentes de la técnica]

La demanda de imágenes de alta resolución y alta calidad tales como imágenes en alta definición (HD) e imágenes en ultra alta definición (UHD) ha crecido recientemente en diversos campos. Ya que los datos de imagen tienen alta resolución y alta calidad, la cantidad de información o bits que hay que transmitir aumenta en relación con los datos de imagen existentes. Por lo tanto, cuando los datos de imagen se transmiten usando un medio tal como una línea de banda ancha por cable/inalámbrica, o cuando se almacenan, pueden aumentarse los costes de transmisión y los costes de almacenamiento.

Por consiguiente, existe una necesidad de una técnica de compresión de imagen altamente eficiente para transmitir, almacenar y reproducir de forma eficiente información de imágenes de alta resolución y alta calidad.

El documento WO 2016/199409 A1 describe un dispositivo de codificación de vídeo configurado para recibir datos de vídeo generados basándose en un error de correlación de rango. Un error de correlación de rango puede resultar de una función de transferencia de luminancia que corresponde a datos de vídeo de Alto Rango Dinámico (HDR) que se usa para transformar datos de vídeo que no son HDR. El dispositivo de codificación de vídeo puede configurarse para mitigar el error de correlación de rango. El dispositivo de codificación de vídeo puede recorrelacionar datos de vídeo. El dispositivo de codificación de vídeo puede realizar técnicas de codificación que mitigan el error de recorrelación. Divulgación

[Problema técnico]

La presente invención proporciona un método y aparato para mejorar la eficiencia de codificación de vídeo.

La presente invención proporciona también un método y un aparato para aumentar la eficiencia de cuantificación. La presente invención proporciona también un método y aparato para derivar de forma eficiente un parámetro de cuantificación.

La invención se establece en el conjunto de reivindicaciones adjunto.

Solución técnica

Se presenta la materia objeto de las reivindicaciones independientes. Las características de realizaciones ilustrativas están definidas en las reivindicaciones dependientes. De acuerdo con un ejemplo, se proporciona un método de decodificación de instantáneas realizado por un aparato de decodificación. El método comprende: decodificar información de imagen que comprende información sobre un parámetro de cuantificación (QP), derivar un valor de luminancia promedio esperado de un bloque actual a partir de muestras disponibles vecinas, derivar un desplazamiento de parámetro de cuantificación (desplazamiento de QP) para derivar un parámetro de cuantificación de luminancia (QP de luminancia) basándose en el valor de luminancia promedio esperado y la información sobre el QP, derivar el QP de luminancia basándose en el desplazamiento de QP, realizar una cuantificación inversa para un grupo de cuantificación que comprende el bloque actual basándose en el QP de luminancia derivado, generar muestras residuales para el bloque actual basándose en la cuantificación inversa, generar muestras de predicción para el bloque actual basándose en la información de imagen y generar muestras reconstruidas para el bloque actual basándose en las muestras residuales para el bloque actual y las muestras de predicción para el bloque actual.

De acuerdo con un ejemplo, se proporciona un aparato de decodificación que decodifica una instantánea. El aparato de decodificación comprende: un módulo de decodificación por entropía configurado para decodificar información de imagen que comprende información sobre un parámetro de cuantificación (QP), un módulo de cuantificación inversa configurado para derivar un valor de luminancia promedio esperado de un bloque actual a partir de muestras disponibles vecinas, derivar un desplazamiento de parámetro de cuantificación (desplazamiento de QP) para derivar un parámetro de cuantificación de luminancia (QP de luminancia) basándose en el valor de luminancia promedio esperado y la información sobre el QP, derivar el QP de luminancia basándose en el desplazamiento de QP, y realizar una cuantificación inversa para un grupo de cuantificación que comprende el bloque actual basándose en el QP de luminancia derivado, un módulo de transformación inversa configurado para generar muestras residuales para el bloque actual basándose en la cuantificación inversa, un módulo de predicción configurado para generar muestras de predicción para el bloque actual basándose en la información de imagen y un módulo de reconstrucción configurado para generar muestras reconstruidas para el bloque actual basándose en las muestras residuales para el bloque actual y las muestras de predicción para el bloque actual.

De acuerdo con un ejemplo, se proporciona un método de codificación de instantáneas realizado para un aparato de codificación. El método comprende: derivar un valor de luminancia promedio esperado de un bloque actual a partir de muestras disponibles vecinas, derivar un desplazamiento de parámetro de cuantificación (desplazamiento de QP) para derivar un parámetro de cuantificación de luminancia (QP de luminancia) basándose en el valor de luminancia promedio esperado e información sobre el QP, derivar el QP de luminancia basándose en el desplazamiento de QP, realizar una cuantificación para un grupo de cuantificación que comprende el bloque actual basándose en el QP de luminancia derivado y codificar información de imagen que comprende la información sobre el QP.

De acuerdo con un ejemplo de la invención, se proporciona un aparato de codificación que codifica una instantánea. El aparato de codificación comprende: un módulo de cuantificación configurado para derivar un valor de luminancia promedio esperado de un bloque actual a partir de muestras disponibles vecinas, derivar un desplazamiento de parámetro de cuantificación (desplazamiento de QP) para derivar un parámetro de cuantificación de luminancia (QP de luminancia) basándose en el valor de luminancia promedio esperado e información sobre el QP, derivar el QP de luminancia basándose en el desplazamiento de QP, y realizar una cuantificación para un grupo de cuantificación que comprende el bloque actual basándose en el QP de luminancia derivado, y módulo de codificación por entropía configurado para codificar información de imagen que comprende la información sobre el QP.

Por ejemplo, el desplazamiento de QP se deriva basándose en la siguiente ecuación

Luma_avg_qp = A*(avg_luma-M)+B

En donde, Luma avg_qp representa en la ecuación el desplazamiento de QP, avg_luma representa en la ecuación el valor de luminancia promedio esperado, la A representa en la ecuación un factor de escalado para correlacionar una diferencia de valor de píxel respecto a una diferencia QP, la M representa en la ecuación un valor predefinido relacionado con una profundidad de bit, y la B representa en la ecuación un valor desplazado, y en donde la A y la B son valores predeterminados o valores incluidos en la información de imagen.

Por ejemplo, el desplazamiento de QP se deriva de una tabla de correspondencia que se basa en el valor de luminancia promedio esperado, en donde la tabla de correspondencia se determina utilizando el valor de luminancia promedio esperado como entrada.

En un ejemplo, el desplazamiento de QP se deriva de una tabla de correspondencia que se basa en el valor de luminancia promedio esperado, en donde la tabla de correspondencia se determina utilizando un valor obtenido dividiendo el valor de luminancia promedio esperado entre un valor constante predefinido.

En un ejemplo, las muestras vecinas disponibles comprenden al menos una de al menos una muestra de luminancia adyacente al límite izquierdo del grupo de cuantización y al menos una muestra de luminancia adyacente al límite superior del grupo de cuantización.

En un ejemplo, la al menos una muestra de luminancia adyacente al límite izquierdo del grupo de cuantización se incluye en una columna de muestra de luminancia directamente adyacente al límite izquierdo del grupo de cuantización, en donde la al menos una muestra de luminancia adyacente al límite superior del grupo de cuantización se incluye en una fila de muestra de luminancia directamente adyacente al límite superior del grupo de cuantización.

En un ejemplo, las muestras vecinas disponibles comprenden una muestra de luminancia adyacente al lado izquierdo de la muestra superior izquierda del grupo de cuantización, en donde las muestras vecinas disponibles comprenden una muestra de luminancia adyacente al lado superior de la muestra superior izquierda del grupo de cuantización.

En un ejemplo, las muestras vecinas disponibles comprenden al menos una de las muestras vecinas reconstruidas, muestras incluidas en al menos uno de los bloques vecinos reconstruidos, muestras vecinas predichas y muestras incluidas en al menos uno de los bloques vecinos predichos.

En un ejemplo, la información sobre el QP comprende al menos un elemento de sintaxis relacionado con el desplazamiento de QP, en donde la derivación del desplazamiento de QP basándose en el al menos uno de los valores de luminancia promedio esperados y la información sobre el QP comprende la derivación del desplazamiento de QP basándose en al menos un elemento de sintaxis relacionado con el desplazamiento de QP.

En un ejemplo, la realización de la cuantización inversa para el grupo de cuantización comprende:

derivar un QP de crominancia a partir del QP de luminancia derivado basándose en al menos una tabla de correspondencia de QP de crominancia; y

realizar la cuantización inversa para el grupo de cuantización basándose en el QP de luminancia derivado y el QP de crominancia derivado,

en donde la al menos una tabla de correspondencia de QP de crominancia se basa en el rango dinámico de crominancia y en el desplazamiento de QP.

En un ejemplo, la al menos una tabla de correspondencia de QP de crominancia comprende al menos una tabla de correspondencia de QP de Cb y al menos una tabla de correspondencia de QP de Cr.

En un ejemplo, la información sobre el QP se señaliza a nivel de Conjunto de Parámetros de Secuencia, (SPS).

En un ejemplo, la información de imagen comprende información sobre Parámetros de Rango de Datos Efectivos (EDRP), y en donde y la información sobre los EDRP comprende al menos uno de un valor de entrada mínimo, un valor de entrada máximo, un rango dinámico de valor de entrada, información de correlación para relacionar el valor de entrada mínimo con brillo, información de correlación para relacionar el valor de entrada máximo con brillo e información de identificación de la función de transferencia.

[Efectos ventajosos]

De acuerdo con la presente invención, puede aumentarse la eficiencia de compresión de imagen/vídeo general.

De acuerdo con la presente invención, puede aumentarse la eficiencia de cuantificación.

De acuerdo con la presente invención, el parámetro de cuantificación puede derivarse de forma eficiente.

Breve descripción de los dibujos

La Figura 1 es un diagrama esquemático que ilustra una configuración de un aparato de codificación de acuerdo con una realización.

La Figura 2 es un diagrama esquemático que ilustra una configuración de un aparato de decodificación de acuerdo con una realización.

La Figura 3 ilustra un ejemplo de un diagrama de cromaticidad.

La Figura 4 ilustra un ejemplo de correlación de valores de luz lineales para representaciones de SDR y HDR. La Figura 5 es un diagrama de flujo que ilustra un proceso de reconstrucción de una instantánea de acuerdo con una realización.

La Figura 6 es un diagrama de flujo que ilustra un proceso de reconstrucción de una instantánea de acuerdo con otra realización.

La Figura 7 es un diagrama de flujo que ilustra una operación de un aparato de codificación de acuerdo con una realización.

La Figura 8 es un diagrama de bloques que ilustra una configuración de un aparato de codificación de acuerdo con una realización.

La Figura 9 es un diagrama de flujo que ilustra una operación de un aparato de decodificación de acuerdo con una realización.

La Figura 10 es un diagrama de bloques que ilustra una configuración de un aparato de decodificación de acuerdo con una realización.

Mejor modo

De acuerdo con una realización de la presente invención, se proporciona un método de decodificación de instantáneas realizado por un aparato de decodificación. El método comprende: decodificar información de imagen que comprende información sobre un parámetro de cuantificación (QP), derivar un valor de luminancia promedio esperado de un bloque actual a partir de muestras disponibles vecinas, derivar un desplazamiento de parámetro de cuantificación (desplazamiento de QP) para derivar un parámetro de cuantificación de luminancia (QP de luminancia) basándose en el valor de luminancia promedio esperado y la información sobre el QP, derivar el QP de luminancia basándose en el desplazamiento de QP, realizar una cuantificación inversa para un grupo de cuantificación que comprende el bloque actual basándose en el QP de luminancia derivado, generar muestras residuales para el bloque actual basándose en la cuantificación inversa, generar muestras de predicción para el bloque actual basándose en la información de imagen y generar muestras reconstruidas para el bloque actual basándose en las muestras residuales para el bloque actual y las muestras de predicción para el bloque actual.

Modo para la invención

La presente invención puede modificarse de diversas formas, y en los dibujos se describirán y mostrarán realizaciones específicas de la misma. Sin embargo, las realizaciones no pretenden limitar la invención. Los términos usados en la siguiente descripción se usan para describir solamente realizaciones específicas, pero no pretenden limitar la invención. Una expresión de un número singular incluye una expresión del número plural, siempre que se lea claramente de manera diferente. Los términos tales como "incluir" y "tener" pretenden indicar que existen características, números, etapas, operaciones, elementos, componentes o combinaciones de los mismos utilizados en la siguiente descripción y, por lo tanto, debe entenderse que no se excluye la posibilidad de existencia o adición de una o más características, números, etapas, operaciones, elementos, componentes o combinaciones de los mismos diferentes.

Por otra parte, elementos en los dibujos descritos en la invención se dibujan independientemente para el propósito de conveniencia de explicación de diferentes funciones específicas en un dispositivo de codificación/decodificación de imagen y no significa que los elementos se incorporan por hardware independiente o software independiente. Por ejemplo, dos o más elementos de los elementos pueden combinarse para formar un único elemento, o un elemento puede dividirse en varios elementos. Las realizaciones en las que se combinan y/o dividen los elementos pertenecen a la invención sin alejarse del concepto de la invención.

En lo sucesivo, se describirán en detalle realizaciones ilustrativas de la invención con referencia a los dibujos adjuntos. Además, los mismos números de referencia se usan para indicar los mismos elementos a lo largo de los dibujos, y se omitirán las mismas descripciones de los elementos similares.

La siguiente descripción puede aplicarse en el campo técnico que trata con vídeo o imagen. Por ejemplo, el método o realización divulgada en la siguiente descripción puede aplicarse a diversas normas de codificación de vídeo tales como la norma Codificación de Vídeo Versátil (VVC) (ITU-T Rec. H.266), la norma de codificación de vídeo/imagen de próxima generación después de VVC, o la norma de codificación de vídeo/imagen de generación anterior antes de VVC tal como la norma de Codificación de Vídeo de Alta Eficiencia (HEVC) (ITU-T Rec. H.265) y así sucesivamente.

En la presente memoria descriptiva, vídeo puede significar un conjunto de imágenes de acuerdo con el tiempo. Una instantánea generalmente se refiere a una unidad que representa una imagen en un periodo de tiempo específico, y un corte es una unidad que constituye una parte de una instantánea en codificación. Una instantánea puede componerse de una pluralidad de cortes, y pueden usarse instantáneas y cortes en combinación si fuera necesario. También, en algunos casos, el término "imagen" puede significar un concepto que incluye una imagen fija y un vídeo que es un conjunto de imágenes fijas de acuerdo con el flujo de tiempo. También, "vídeo" no significa necesariamente únicamente un conjunto de imágenes fijas de acuerdo con el tiempo, sino que puede interpretarse como un concepto que comprende el significado de una imagen fija en algunas realizaciones.

Un píxel o un pel puede significar una unidad mínima de una instantánea (o imagen). También, puede usarse una 'muestra' como un término que corresponde a un píxel. Una muestra puede representar generalmente un píxel o valor de píxel y puede representar únicamente un píxel/valor de píxel de un componente de luminancia o únicamente un píxel/valor de píxel de un componente de crominancia.

Una unidad representa una unidad básica de procesamiento de imágenes. Una unidad puede incluir al menos uno de un área específica de una instantánea e información relacionada con el área. La unidad puede usarse en combinación con términos tales como un bloque o un área. En general, un bloque de MxN puede representar un conjunto de muestras o coeficientes de transformada que constan de M columnas y N filas.

La Figura 1 explica esquemáticamente una configuración de un aparato de codificación de acuerdo con una realización.

En lo sucesivo, el aparato de codificación/decodificación puede incluir un aparato de codificación/decodificación de vídeo y/o un aparato de codificación/decodificación de imagen. Un aparato de codificación/decodificación de vídeo puede usarse como un concepto que incluye un aparato de codificación/decodificación de imagen, y un aparato de codificación/decodificación de imagen puede usarse como un concepto que incluye un aparato de codificación/decodificación de vídeo.

Haciendo referencia a la Figura 1, un aparato de codificación 100 puede incluir un módulo de particionamiento de instantánea 105, un módulo de predicción 110, un módulo de procesamiento residual 120, un módulo de codificación por entropía 130, un sumador 140, un módulo de filtrado 150 y una memoria 160. La unidad de procesamiento residual 120 puede incluir un restador 121, un módulo de transformada 122, un módulo de cuantificación 123, un módulo de reorganización 124, un módulo de cuantificación inversa 125 y un módulo de transformación inversa 126.

El módulo de particionamiento de instantánea 105 puede dividir la instantánea introducida en al menos una unidad de procesamiento.

En un ejemplo, la unidad de procesamiento puede denominarse como una unidad de codificación (CU). En este caso, la unidad de codificación puede particionarse de forma recursiva de acuerdo con una estructura de árbol cuádruple árbol binario (QTBT) de la unidad de codificación más grande (LCU). Por ejemplo, una unidad de codificación puede dividirse en una pluralidad de unidades de codificación de profundidad más profunda basándose en una estructura de árbol cuádruple, una estructura de árbol binario y/o una estructura de árbol ternario.

En este caso, por ejemplo, la estructura de árbol cuádruple se aplica primero, y la estructura de árbol binario y la estructura de árbol ternario pueden aplicarse posteriormente. O una estructura de árbol binario/estructura de árbol ternario puede aplicarse primero. El procedimiento de codificación de acuerdo con la presente invención puede realizarse basándose en la unidad de codificación final que no se divide adicionalmente. En este caso, la unidad de codificación máxima puede usarse directamente como la unidad de codificación final basándose en la eficiencia de codificación o similar dependiendo de las características de imagen, o la unidad de codificación puede dividirse de forma recursiva en unidades de codificación de menor profundidad y puede usarse como la unidad de codificación final. En este punto, el procedimiento de codificación puede incluir un procedimiento tal como predicción, conversión, y restauración, que se describirá posteriormente.

Como otro ejemplo, la unidad de procesamiento puede incluir una unidad de codificación (CU), módulo de predicción (PU) o una unidad de transformación (TU). La unidad de codificación puede dividirse de la unidad de codificación más grande (LCU) en unidades de codificación de profundidad más profunda a lo largo de la estructura de árbol cuádruple. En este caso, la unidad de codificación máxima puede usarse directamente como la unidad de codificación final basándose en la eficiencia de codificación o similar dependiendo de las características de imagen, o la unidad de codificación puede dividirse de forma recursiva en unidades de codificación de menor profundidad y puede usarse como la unidad de codificación final. Cuando se establece una unidad de codificación (SCU) más pequeña, la unidad de codificación no puede dividirse en unidades de codificación más pequeñas que la unidad de codificación mínima.

En este documento, el término "unidad de codificación final" significa una unidad de codificación en la que el módulo de predicción o la unidad de conversión se particiona o divide. Un módulo de predicción es una unidad que se particiona de una unidad de codificación, y puede ser una unidad de predicción de muestra. En este momento, el módulo de predicción puede dividirse en subbloques. La unidad de conversión puede dividirse a lo largo de la estructura de árbol cuádruple de la unidad de codificación, y puede ser una unidad para derivar un coeficiente de conversión y/o una unidad para derivar una señal residual a partir del factor de conversión.

En lo sucesivo, la unidad de codificación puede denominarse como un bloque de codificación (CB), el módulo de predicción puede denominarse como un bloque de predicción (PB) y la unidad de conversión puede denominarse como un bloque de transformación (TB). El bloque de predicción o módulo de predicción puede referirse a un área específica en forma de un bloque en una instantánea y puede incluir una matriz de muestras de predicción. También, un bloque de transformación o unidad de transformación puede referirse a una región específica en forma de un bloque dentro de una instantánea, y puede incluir una matriz de coeficientes de transformada o muestras residuales.

El módulo de predicción 110 predice un bloque actual o un bloque residual y genera un bloque predicho que incluye muestras de predicción que el bloque actual puede hacer. La unidad de predicción realizada en el módulo de predicción 110 puede ser un bloque de codificación, un bloque de transformación o un bloque de predicción.

El módulo de predicción 110 predice un bloque actual o un bloque residual y genera un bloque predicho que incluye muestras de predicción del bloque actual. La unidad de predicción realizada en el módulo de predicción 110 puede ser un bloque de codificación, un bloque de transformación o un bloque de predicción.

El módulo de predicción 110 puede determinar si se aplica intra predicción o inter predicción al bloque actual. Por ejemplo, el módulo de predicción 110 puede determinar si se aplica intra predicción o inter predicción en unidades de CU.

En el caso de intra predicción, el módulo de predicción 110 puede derivar una muestra de predicción para un bloque actual basándose en una muestra de referencia fuera del bloque actual en una instantánea a la que pertenece el bloque actual (en lo sucesivo denominado una instantánea actual).

En este caso, el módulo de predicción 110 puede derivar una muestra de predicción basándose en (caso (i)) un promedio o interpolación de muestras de referencia vecinas del bloque actual, (caso (ii)) la muestra de predicción puede derivarse basándose en una muestra de referencia que existe en una dirección (de predicción) específica con respecto a la muestra de predicción entre las muestras.

El caso (i) puede denominarse como un modo no direccional o un modo no angular, y el caso (ii) puede denominarse como un modo direccional o un modo angular. En la intra predicción, el modo de predicción puede tener, por ejemplo, 65 modos de predicción direccionales y al menos dos modos no direccionales. El modo no direccional puede incluir un modo de predicción de CC y un modo plano (modo plano). El módulo de predicción 110 puede determinar un modo de predicción aplicado a un bloque actual usando un modo de predicción aplicado a un bloque vecino.

En el caso de inter predicción, el módulo de predicción 110 puede derivar una muestra de predicción para un bloque actual basándose en una muestra especificada por un vector de movimiento en una instantánea de referencia. El módulo de predicción 110 puede derivar una muestra de predicción para un bloque actual aplicando uno de un modo de salto, un modo de fusión y un modo de predicción de vector de movimiento (MVP). En el modo de salto y el modo de fusión, el módulo de predicción 110 puede usar información de movimiento de un bloque vecino como información de movimiento de un bloque actual.

En el modo de salto, una diferencia (residual) entre la muestra predicha y la muestra original no se transmite a diferencia del modo de fusión. En el modo de MVP, un vector de movimiento de un bloque actual puede derivarse usando un vector de movimiento de un bloque vecino como un predictor de vector de movimiento para usar como un predictor de vector de movimiento de un bloque actual.

En el caso de inter predicción, un bloque vecino puede incluir un bloque vecino espacial que existe en una instantánea actual y un bloque vecino temporal que existe en una instantánea de referencia. La instantánea de referencia que incluye el bloque vecino temporal puede denominarse como una instantánea colocada (colPic). La información de movimiento puede incluir un vector de movimiento y un índice de instantánea de referencia. Información tal como información de modo de predicción e información de movimiento puede codificarse (por entropía) y emitirse en forma de un flujo de bits.

Cuando la información de movimiento de los bloques vecinos temporales se usa en el modo de salto y el modo de fusión, la instantánea más alta en la lista de instantáneas de referencia puede usarse como una instantánea de referencia. Las instantáneas de referencia incluidas en el recuento de orden de instantáneas pueden clasificarse sobre la base de la diferencia de recuento de orden de instantáneas (POC) entre la instantánea actual y la correspondiente instantánea de referencia. El POC corresponde al orden de visualización de las instantáneas y puede distinguirse del orden de codificación.

El restador 121 genera muestras residuales que son la diferencia entre la muestra original y la muestra predicha. Cuando se aplica el modo de salto, una muestra residual puede no generarse como se ha descrito anteriormente.

El módulo de transformación 122 transforma las muestras residuales sobre una base de bloque de transformación para generar un coeficiente de transformada. La unidad de transformación 122 puede realizar la transformación de acuerdo con el tamaño del bloque de transformación y un modo de predicción aplicado al bloque de codificación o el bloque de predicción que solapa espacialmente el bloque de transformación.

Por ejemplo, si se aplica intra predicción al bloque de codificación o el bloque de predicción que solapa el bloque de transformación y el bloque de transformación es una matriz residual de 4 X 4, la muestra residual se transforma en una transformada de seno discreta (DST). En otros casos, las muestras residuales pueden convertirse usando un núcleo de conversión de DCT (Transformada de Coseno Discreta).

La unidad de cuantificación 123 puede cuantificar los coeficientes de transformada para generar coeficientes de transformada cuantificados.

El módulo de redisposición 124 redispone los coeficientes de transformada cuantificados. El módulo de redisposición 124 puede redisponer los coeficientes de transformada cuantificados con forma de bloque en una forma de vector unidimensional de un método de exploración de coeficientes. El módulo de redisposición 124 puede ser una parte del módulo de cuantificación 123, aunque el módulo de redisposición 124 se describe como una configuración alternativa.

El módulo de codificación por entropía 130 puede realizar codificación por entropía en los coeficientes de transformada cuantificados. La codificación por entropía puede incluir, por ejemplo, un método de codificación tal como Golomb exponencial, codificación de longitud variable adaptativa según contexto (CAVLC), codificación aritmética binaria adaptativa según contexto (CABAC). El módulo de codificación por entropía 130 puede codificar información necesaria para la restauración de vídeo (por ejemplo, valores de un elemento de sintaxis, etc.) y los coeficientes de transformada cuantificados juntos o de forma separada de acuerdo con una codificación por entropía o un método predeterminado.

La información codificada puede transmitirse o almacenarse en unidades de unidades de NAL (capa de abstracción de red) en forma de un flujo de bits. El flujo de bits puede transmitirse a través de una red o almacenarse en un medio de almacenamiento digital. La red puede incluir una red de difusión y/o una red de comunicación, y el medio de almacenamiento digital puede incluir diversos medios de almacenamiento tales como USB, SD, CD, DVD, Blu-ray, HDD y SSD.

El módulo de cuantificación inversa 125 cuantifica inversamente los valores cuantificados (coeficientes de transformada cuantificados) obtenidos del módulo de cuantificación 123 y el módulo de transformación inversa 126 cuantifica inversamente los valores inversamente cuantificados obtenidos del módulo de cuantificación inversa 125 para generar muestras residuales.

El sumador 140 combina la muestra residual y la muestra predicha para reconstruir la instantánea. Las muestras residuales y las muestras de predicción se añaden en unidades de bloques de modo que puede generarse un bloque de reconstrucción. En este punto, el sumador 140 puede ser una parte del módulo de predicción 110, mientras tanto, el sumador 140 puede denominarse como un módulo de reconstrucción o una unidad de generación de bloques de reconstrucción.

Para la instantánea reconstruida, el módulo de filtrado 150 puede aplicar un filtro de desbloqueo y/o un desplazamiento adaptativo de muestra. A través de filtrado de desbloqueo y/o desplazamientos adaptativos de muestras, pueden corregirse artefactos en el límite de bloque en la instantánea reconstruida o distorsión en el proceso de cuantificación. El desplazamiento adaptativo de muestra puede aplicarse sobre una base de muestra por muestra y puede aplicarse después de que se completa el proceso de filtrado de desbloqueo. El módulo de filtrado 150 puede aplicar un ALF (Filtro de Bucle Adaptativo) a la instantánea restaurada. El ALF puede aplicarse a la instantánea reconstruida después de que se aplica el filtro de desbloqueo y/o desplazamiento adaptativo de muestra.

La memoria 160 puede almacenar instantáneas restauradas (instantáneas decodificadas) o información necesaria para codificar/decodificar. En este punto, la instantánea reconstruida puede ser una instantánea reconstruida cuyo procedimiento de filtrado se ha completado por el módulo de filtrado 150. La instantánea restaurada almacenada puede usarse como una instantánea de referencia para (inter) predicción de otra instantánea. Por ejemplo, la memoria 160 puede almacenar instantáneas (de referencia) usadas para inter predicción. En este momento, las instantáneas usadas para inter predicción pueden designarse por un conjunto de instantáneas de referencia o una lista de instantáneas de referencia.

La Figura 2 explica esquemáticamente una configuración de un aparato de decodificación de acuerdo con una realización.

Haciendo referencia a la Figura 2, el aparato de decodificación 200 puede incluir un módulo de decodificación por entropía 210, un módulo de procesamiento residual 220, un módulo de predicción 230, un sumador 240, un módulo de filtrado 250 y una memoria 260. En este punto, el módulo de procesamiento residual 220 puede incluir un módulo de reorganización 221, un módulo de cuantificación inversa 222 y un módulo de transformación inversa 223. También, aunque no se muestra, el aparato de decodificación de vídeo 200 puede incluir un receptor para recibir un flujo de bits que incluye información de vídeo. La unidad de recepción puede ser un módulo separado o puede incluirse en el módulo de decodificación por entropía 210.

Cuando se introduce un flujo de bits que incluye información de vídeo/imagen, el aparato de decodificación (de vídeo) 200 puede restaurar el vídeo/imagen/instantánea en respuesta al proceso en el que la información de vídeo/imagen se procesa en el aparato de codificación (de vídeo) 100.

Por ejemplo, el aparato de decodificación de vídeo 200 puede realizar decodificación de vídeo usando una unidad de procesamiento aplicada en el aparato de codificación de vídeo. Por lo tanto, el bloque de unidad de procesamiento de decodificación de vídeo puede ser, por ejemplo, una unidad de codificación y, en otro ejemplo, una unidad de codificación, un módulo de predicción o una unidad de conversión. La unidad de codificación puede dividirse de la unidad de codificación máxima a lo largo de una estructura de árbol cuádruple, una estructura de árbol binario y/o una estructura de árbol ternario.

Pueden usarse adicionalmente un módulo de predicción y una unidad de conversión según pueda ser el caso. El bloque de predicción puede ser un bloque derivado o particionado a partir de la unidad de codificación. La unidad de conversión puede dividirse a lo largo de la estructura de árbol cuádruple de la unidad de codificación y puede ser una unidad que deriva el factor de conversión o una unidad que deriva la señal residual a partir del factor de conversión.

El módulo de decodificación por entropía 210 puede analizar el flujo de bits y emitir información necesaria para la restauración de vídeo o restauración de instantánea. Por ejemplo, el módulo de decodificación por entropía 210 decodifica información en un flujo de bits basándose en un método de codificación tal como codificación de Golomb exponencial, CAVLC, o CABAC, y calcula un valor de un elemento de sintaxis necesario para restauración de vídeo y un valor de coeficiente cuantificado con respecto a residuales.

Más específicamente, el método de decodificación por entropía de CABAC comprende recibir un bin que corresponde a cada elemento de sintaxis en un flujo de bits, determinando un modelo de contexto basándose en el elemento de sintaxis objetivo de decodificación y la información de decodificación de objetivo de decodificación, predecir la probabilidad de ocurrencia de un bin de acuerdo con el modelo de contexto determinado, y realizar decodificación aritmética del bin para generar un símbolo que corresponde al valor de cada elemento de sintaxis. En este momento, el método de decodificación por entropía de CABAC puede actualizar el modelo de contexto usando la información del símbolo/bin decodificado para el modelo de contexto del siguiente símbolo/bin después de determinar el modelo de contexto.

La información sobre la predicción de la información decodificada en el módulo de decodificación por entropía 210 se proporciona al módulo de predicción 230 y el valor residual en el que la decodificación por entropía se realiza en el módulo de decodificación por entropía 210 puede introducirse al módulo de redisposición 221.

El módulo de redisposición 221 puede redisponer los coeficientes de transformada cuantificados en una forma de bloque bidimensional. El módulo de redisposición 221 puede realizar una reordenación en respuesta a la exploración de coeficiente realizada en el aparato de codificación. El módulo de redisposición 221 puede ser una parte del módulo de cuantificación inversa 222, aunque el módulo de redisposición 221 se ha descrito como una configuración alternativa.

El módulo de cuantificación inversa 222 puede decuantificar los coeficientes de transformada cuantificados basándose en los parámetros de cuantificación (inversa), y emitir los coeficientes de transformada. En este momento, la información para derivar el parámetro de cuantificación puede señalizarse a partir del dispositivo de codificación.

El módulo de transformación inversa 223 puede invertir los coeficientes de transformada para derivar las muestras residuales.

El módulo de predicción 230 puede predecir un bloque actual y puede generar un bloque predicho que incluye muestras de predicción del bloque actual. La unidad de predicción realizada por el módulo de predicción 230 puede ser un bloque de codificación, un bloque de transformación o un bloque de predicción.

El módulo de predicción 230 puede determinar si tiene que aplicarse intra predicción o inter predicción basándose en la información de predicción. En este caso, una unidad para determinar si aplicar intra predicción o inter predicción puede diferir de una unidad para generar una muestra de predicción. Además, las unidades para generar muestras de predicción en inter predicción e intra predicción también pueden ser diferentes. Por ejemplo, si tiene que aplicarse inter predicción o intra predicción puede determinarse en unidades de CU. También, por ejemplo, en la inter predicción, el modo de predicción puede determinarse en unidades de PU para generar muestras de predicción. En intra predicción, un modo de predicción puede determinarse en unidades de PU, y pueden generarse muestras de predicción en unidades de TU.

En el caso de intra predicción, el módulo de predicción 230 puede derivar una muestra de predicción para el bloque actual basándose en las muestras de referencia vecinas en la instantánea actual. El módulo de predicción 230 puede aplicar un modo direccional o un modo no direccional basándose en las muestras de referencia vecinas del bloque actual para derivar una muestra de predicción para el bloque actual. En este caso, un modo de predicción que hay que aplicar al bloque actual puede determinarse usando el modo de intra predicción del bloque vecino.

En el caso de inter predicción, el módulo de predicción 230 puede derivar una muestra de predicción para un bloque actual basándose en una muestra especificada en una instantánea de referencia por un vector de movimiento en una instantánea de referencia. El módulo de predicción 230 puede derivar una muestra de predicción para un bloque actual aplicando un modo de salto, un modo de fusión o un modo de MVP. En este momento, información de movimiento necesaria para inter predicción de un bloque actual proporcionado en el aparato de codificación, por ejemplo, información sobre un vector de movimiento, un índice de instantánea de referencia y similares, puede adquirirse o derivarse basándose en la información de predicción.

En el modo de salto y el modo de fusión, información de movimiento de un bloque vecino puede usarse como información de movimiento del bloque actual. En este caso, el bloque vecino puede incluir un bloque vecino espacial y un bloque vecino temporal.

El módulo de predicción 230 puede construir una lista de candidatos de fusión usando la información de movimiento de los bloques vecinos disponibles y usar la información indicada por el índice de fusión en la lista de candidatos de fusión como el vector de movimiento del bloque actual. El índice de fusión puede señalizarse a partir del dispositivo de codificación. La información de movimiento puede incluir un vector de movimiento y una instantánea de referencia. Cuando la información de movimiento de bloques vecinos temporales se usa en el modo de salto y el modo de fusión, la instantánea más alta en la lista de instantáneas de referencia puede usarse como una instantánea de referencia.

En el modo de salto, a diferencia del modo de fusión, no se transmite la diferencia entre la muestra predicha y la muestra original (residual).

En el modo de MVP, un vector de movimiento de un bloque actual puede derivarse usando un vector de movimiento de un bloque vecino como un predictor de vector de movimiento. En este caso, el bloque vecino puede incluir un bloque vecino espacial y un bloque vecino temporal.

Por ejemplo, cuando se aplica el modo de fusión, puede generarse una lista de candidatos de fusión usando un vector de movimiento del bloque vecino espacial reconstruido y/o un vector de movimiento que corresponde a un bloque Col que es un bloque temporalmente vecino. En el modo de fusión, el vector de movimiento del bloque candidato seleccionado en la lista de candidatos de fusión se usa como el vector de movimiento del bloque actual. La información de predicción puede incluir un índice de fusión que indica un bloque candidato que tiene un vector de movimiento óptimo seleccionado de entre los bloques candidatos incluidos en la lista de candidatos de fusión. En este momento, el módulo de predicción 230 puede derivar el vector de movimiento del bloque actual usando el índice de fusión.

Como otro ejemplo, cuando se aplica un modo de predicción de vector de movimiento (MVP), se genera una lista de candidatos de predictor de vector de movimiento usando un vector de movimiento del bloque vecino espacial reconstruido y/o un vector de movimiento que corresponde a un bloque Col que es un bloque temporalmente vecino. Es decir, el vector de movimiento del bloque vecino espacial reconstruido y/o el vector de movimiento que corresponde al bloque vecino Col puede usarse como un candidato de vector de movimiento. La información sobre la predicción puede incluir un índice de vector de movimiento predicho que indica un vector de movimiento óptimo seleccionado de entre los candidatos de vector de movimiento incluidos en la lista.

En este momento, el módulo de predicción 230 puede usar el índice de vector de movimiento para seleccionar un vector de movimiento predictivo del bloque actual de entre los candidatos de vector de movimiento incluidos en la lista de candidatos de vector de movimiento. La unidad de predicción del aparato de codificación puede obtener la diferencia de vector de movimiento (MVD) entre el vector de movimiento del bloque actual y el predictor de vector de movimiento, y puede emitir la misma como un flujo de bits. Es decir, puede obtenerse la MVD restando el predictor de vector de movimiento del vector de movimiento del bloque actual. En este caso, el módulo de predicción 230 puede obtener la diferencia de vector de movimiento incluida en la información sobre la predicción, y derivar el vector de movimiento del bloque actual a través de la adición de la diferencia de vector de movimiento y el predictor de vector de movimiento. El módulo de predicción también puede adquirir o derivar un índice de instantánea de referencia o similar que indica la instantánea de referencia a partir de la información sobre la predicción.

El sumador 240 puede añadir una muestra residual y una muestra de predicción para reconstruir un bloque actual o una instantánea actual. El sumador 240 puede añadir las muestras residuales y las muestras de predicción sobre una base bloque a bloque para reconstruir la instantánea actual. Cuando se aplica el modo de salto, dado que la residual no se transmite, la muestra predicha puede ser la muestra restaurada. En este punto, el sumador 240 se ha descrito como una configuración alternativa, pero el sumador 240 puede ser una parte del módulo de predicción 230. Mientras tanto, el sumador 240 puede denominarse como un módulo de reconstrucción o una unidad de generación de bloques de reconstrucción.

El módulo de filtrado 250 puede aplicar desplazamientos adaptativos de muestras con filtrado de desbloqueo, y/o ALF, a las instantáneas reconstruidas. En este momento, el desplazamiento adaptativo de muestra puede aplicarse sobre una base de muestra por muestra y puede aplicarse después del filtrado de desbloqueo. El ALF puede aplicarse después del filtrado de desbloqueo y/o desplazamientos adaptativos de muestras.

La memoria 260 puede almacenar instantáneas reconstruidas (instantáneas decodificadas) o información necesaria para la decodificación. En este punto, la instantánea reconstruida puede ser una instantánea reconstruida cuyo procedimiento de filtrado se ha completado por el módulo de filtrado 250. Por ejemplo, la memoria 260 puede almacenar instantáneas usadas para inter predicción. En este momento, las instantáneas usadas para inter predicción pueden designarse por un conjunto de instantáneas de referencia o una lista de instantáneas de referencia. La instantánea reconstruida puede usarse como una instantánea de referencia para otra instantánea. Además, la memoria 260 puede emitir la instantánea reconstruida de acuerdo con el orden de emisión.

La Figura 3 ilustra un ejemplo de un diagrama de cromaticidad.

Esta realización se refiere a la codificación de vídeo y, más particularmente, a técnicas para optimizar la codificación de vídeo de acuerdo con condiciones dadas, tales como función de transferencia de luminancia definida o esperada, rango dinámico de vídeo y valor de luminancia de un bloque de codificación.

Como se usa en este documento el término función de transferencia de luminancia puede referirse a una función de transferencia óptico-eléctrica (OETF) o una función de transferencia electro-óptica (EOTF). Debería observarse que una función de transferencia óptico-eléctrica puede denominarse como una función de transferencia electro-óptica inversa y una función de transferencia electro-óptica puede denominarse como una función de transferencia ópticoeléctrica inversa, aunque las dos funciones de transferencia no son exactamente inversas entre sí.

Las técnicas descritas en este documento pueden usarse para compensar un rendimiento de codificación de vídeo no óptimo que se produce cuando la correlación de valores de luminancia con palabras de código digitales no se está considerando en igual importancia. Por ejemplo, en la práctica una OETF puede permitir más bits a un área oscura en comparación con un área brillante (o viceversa). En este caso, un codificador/decodificador de vídeo diseñado basándose en una suposición de que todas las palabras de código digitales que hay que codificar con igual importancia habitualmente no realizaría codificación de vídeo de una manera óptima.

Debería observarse que, aunque las técnicas de esta divulgación se describen con respecto a la norma H.264 de ITU-T y la norma de H.265 ITU-T, las técnicas de esta divulgación son aplicables generalmente a cualquier norma de codificación de vídeo.

Las tecnologías de compresión de vídeo se han desplegado en una amplia variedad de dispositivos, incluyendo televisiones digitales, ordenadores de sobremesa o portátiles, ordenadores de tableta, dispositivos de grabación digital, reproductores de medios digitales, dispositivos de videojuegos, teléfonos inteligentes y así sucesivamente. El vídeo digital puede codificarse de acuerdo con una norma de codificación de vídeo, tal como H.264 de ITU-T conocida como ISO/IEC MPEG-4 AVC y Codificación de Vídeo de Alta Eficiencia (HEVC). Las normas de codificación de vídeo pueden permitir un formato específico (es decir, YUV420) que hay que codificar.

Una cámara de vídeo digital convencional genera inicialmente datos sin procesar que corresponden a señales generadas por cada uno de sus sensores de imagen. Por ejemplo, dispositivos de captura de imágenes digitales graban una imagen como un conjunto de valores de luminancia relacionados linealmente. Sin embargo, la visión humana no reconoce cambios en valores de luminancia de una manera lineal. Es decir, por ejemplo, un área de una imagen asociada con un valor de luminancia de 100 cd/m2 no se percibe necesariamente el doble de brillante que un área de una imagen asociada con un valor de luminancia de 200 cd/m2. Como tal, una función de transferencia de luminancia (por ejemplo, una función de transferencia óptico-eléctrica (OETF) o una función de transferencia electroóptica (EOTF)) puede usarse para convertir datos de luminancia lineal a datos que pueden percibirse de una manera significativa. Una función de transferencia óptico-eléctrica (OETF) puede correlacionar valores de luminancia lineales absolutos con palabras de código digitales de una manera no lineal. Las palabras de código digitales resultantes pueden convertirse a formato de vídeo soportado por una norma de codificación de vídeo.

El sistema de codificación/visualización de vídeo tradicional, tal como entornos de distribución de vídeo de televisión convencionales, ha proporcionado Rango Dinámico Estándar (SDR), que soporta habitualmente un rango de brillo de aproximadamente 0,1 a 100 cd/m2 (a menudo denominado como "nits"). Este rango es significativamente más pequeño que el rango encontrado en la vida real. Por ejemplo, una bombilla de luz puede tener más de 10.000 cd/m2, superficies iluminadas en la luz solar pueden tener un brillo superior a cientos de miles de cd/m2, mientras que el cielo nocturno puede ser de 0,005 cd/m2 o menor.

En años recientes, las pantallas de LCD y OLED se han usado ampliamente y las tecnologías de estos dispositivos habilitan una mayor luminancia y reproducción de espacio de color amplia. El brillo y rangos dinámicos conseguibles y deseables de diversas pantallas pueden ser significativamente diferentes de los de los dispositivos de captura y creación (SDR) convencionales. Por ejemplo, un sistema de creación de contenido puede ser capaz de crear o capturar contenido con un contraste de 1.000.000:1. Se espera que la televisión y otros entornos de distribución de vídeo proporcionen una experiencia de visualización que está más cerca de una experiencia de la vida real, para proporcionar al usuario con una sensación más fuerte de "estar ahí". En lugar del rango de brillo de SDR existente (que puede ser desde 0,1 a 100 cd/m2) puede considerarse un rango de brillo mayor (desde 0,005 a 10.000 cd/ m2). Por ejemplo, cuando se visualiza contenido de HDR en una pantalla, que soporta brillo mínimo y máximo de 0,01 y 2.000 cd/m2 respectivamente, puede tener un rango dinámico de 200.000:1. Obsérvese que el rango dinámico de una escena puede describirse como la relación de la intensidad de luz máxima con la intensidad de luz mínima.

Además, la Televisión de Ultra Alta Definición (UHDTV) se dirige para proporcionar a un usuario una sensación de "realidad". Aumentar solo la resolución puede no ser suficiente para conseguir completamente este objetivo, también sin crear, capturar y visualizar contenido que tiene un brillo pico mucho mayor y valores de contraste mucho mayores que la TV de hoy. Además, una mayor sensación de realidad requiere la renderización de colores que son más ricos que los proporcionados por las gamas de color usadas comúnmente hoy, por ejemplo, BT.709. Por lo tanto, el nuevo contenido no tendrá únicamente órdenes de magnitud brillo y contrastes mayores, sino también una gama de colores significativamente más amplia (por ejemplo, BT.2020 o posiblemente incluso más amplia en el futuro). Los diversos rangos de gama de colores se representan en la Figura 1.

Entendiéndose más allá de estas evoluciones tecnológica más recientes, la reproducción de imagen/vídeo de HDR (Alto Rango Dinámico) puede conseguirse ahora usando funciones de transferencia (OETF/EOTF) apropiadas tanto para el lado de producción como el lado de consumidor.

La Figura 4 ilustra un ejemplo de correlación de valores de luz lineales para representaciones de SDR y HDR.

Una función de transferencia puede describirse como una correlación entre una entrada y una salida en el rango (de punto flotante) con valoración real [0,0, 1,0]. Un ejemplo de funciones de transformación de luminancia que corresponden a datos de HDR incluyen las así denominadas Funciones de Transferencia de Alto Rango Dinámico (HDR) de SMPTE (Sociedad de Cine y Televisión), que puede denominarse como SMPTE ST 2084. Otro ejemplo de funciones de transformación de luminancia que corresponden a datos de HDR incluye una Función de Transferencia Log Gamma Híbrido para una señal HDR (también conocida como ITU-R BT.2100). Específicamente, las Funciones de Transferencia de H<d>R de SMPTE incluyen una EOTF y una EOTF inversa. La EO<t>F inversa de SMPTE ST 2084 se describe de acuerdo con el siguiente conjunto de figuras matemáticas.

[Figura matemática 1]

Lc = R/10.000

[Figura matemática 2]

V = ((d+c2* Lcn)/(1+ca* Lcn))m

En la Figura matemática 1 y la Figura matemática 2, c1 = c3 - c2 1 = 3424 / 4096 = 0,8359375, c2 = 32 * 2413 / 4096 = 18,8515625, c3 = 32 * 2392 / 4096 = 18,6875, m = 128 * 2523 / 4096 = 78,84375, y n = 0,25 * 2610 / 4096 = 0,1593017578125.

La EOTF de SMPTE ST 2084 puede describirse de acuerdo con el siguiente conjunto de figuras matemáticas.

[Figura matemática 3]

Lc = ((máx[(V1/m- - ci), 0] )/(c2-C3* V1/m))1/n

[Figura matemática 4]

R = 10.000*Lc

En las ecuaciones anteriores, R es un valor de luminancia con un rango expandido de 0 a 10.000 cd/m2 Por ejemplo, Lc igual a 1 se concibe para corresponder a un nivel de luminancia de 10.000 cd/m2. R puede indicar valor de luminancia lineal absoluto. Además, en las ecuaciones anteriores, V puede denominarse como valor de luminancia (o valor de curva perceptual). Dado que una OETF puede correlacionar valores de curva perceptuales con palabras de código digitales. Por lo tanto, V puede correlacionarse con palabras de código de 2N bits. Un ejemplo de una función que puede usarse para correlacionar V con palabras de código de N bits puede definirse como:

[Figura matemática 5]

Valor Digital = INT ((2N-1)*V)

En la Figura matemática 5, INT(x) genera un valor entero redondeando hacia abajo valores fraccionales menores de 0,5 y redondeando hacia arriba valores fraccionales mayores que o iguales a 0,5.

Como un ejemplo ilustrativo, la Figura 2 compara un sistema de SDR de 8 bits capaz de representar 0,1 a 100 cd/m2 con una función de transferencia de estilo BT.709 (curva verde) a un sistema de HDR de 10 bits capaz de representar 0,005 a 10.000 cd/m2 con otra función de transferencia (SMPTE ST 2084). Los diagramas en esta figura son diagramas aproximados. No capturan la forma exacta de la curva y se muestran únicamente para propósitos de ilustración. En la figura, los niveles de código enteros están a lo largo del eje horizontal y los valores de luz lineales (escalados a log10) están a lo largo del eje vertical. Esta correlación ilustrativa incluye proporciones de rango de nivel de código tradicionales para acomodar tanto margen inferior (muestras "negativas" por debajo del rango con valor real [0,0, 1,0]) y margen superior (muestras por encima del valor real 1,0). Debido a las propiedades de diseño, la función de transferencia de HDR de 10 bits mostrada en este punto asigna aproximadamente el doble de niveles de código [119 a 509] ya que la función de transferencia de SDR de 8 bits asigna [16 a 235] en el rango de SDR, mientras proporciona un número similar de nuevos niveles de código [510 a 940] para extender el brillo. Se asignan nuevos niveles de código [64 a 118] para intensidades oscuras por debajo de 0,01 cd/m2.

En un sentido, el sistema de HDR de 10 bits ilustrado en este punto distribuye los 2 bits adicionales a través de vídeo de "SDR" de 8 bits de consumidor tradicional asignando aproximadamente 1 bit adicional de precisión dentro del rango de intensidad de SDR tradicional, mientras aplica el otro bit adicional para extender la curva a intensidades mayores de 100 cd/m2. Para comparación, también se representa la función de transferencia de SDR de 10 bits (curva discontinua roja).

Aunque las normas de codificación de vídeo actuales pueden codificar datos de vídeo sin considerar funciones de transferencia de luminancia, el rendimiento de una norma de codificación de vídeo puede verse afectada por funciones de transferencia de luminancia porque la distribución de palabras de código puede depender de funciones de transferencia de luminancia. Por ejemplo, una norma de codificación de vídeo puede basarse en una suposición de que cada palabra de código se correlaciona generalmente con igual importancia en el aspecto de sensibilidad visual humana (HVS). Sin embargo, no siempre puede ser cierto en realidad. Hay disponibles muchas funciones de transferencia y cada función de transferencia tiene su propia regla de correlación que no es universal. Por lo tanto, esto puede resultar en un rendimiento no óptimo de un codificador de vídeo, tal como HEVC. Por ejemplo, y como se describe en mayor detalle a continuación, las técnicas en HEVC y el sistema de compresión de vídeo existente que se basan en valores de parámetro de cuantificación pueden no funcionar óptimamente dado que cuantifica todo el rango de palabras de código en igual importancia independientemente del valor de luminancia.

Mientras tanto, en la Tabla 1 a continuación se describen algunos ejemplos con respecto a normas para soportar procesamiento/codificación de vídeo de HDR.

T l 11

La Figura 5 es un diagrama de flujo que ilustra un proceso de reconstrucción de una instantánea de acuerdo con una realización.

El contenido de vídeo habitualmente incluye secuencias de vídeo comprendidas de un grupo de instantáneas/fotogramas (GOP). Cada fotograma o instantánea de vídeo puede incluir múltiples cortes, donde un corte incluye una pluralidad de bloques de vídeo. Un bloque de vídeo puede definirse como la mayor matriz de valores de píxel (también denominada muestras) que pueden codificarse de forma predictiva. Un codificador/decodificador de vídeo aplica codificación predictiva en bloques de vídeo y subdivisiones de los mismos. ITU-T H.264 especifica un macrobloque que incluye muestras de luminancia de 16 x 16. ITU-T H.265 (o comúnmente conocida como HEVC) especifica una estructura de Unidad de Árbol de Codificación (CTU) análoga en la que una instantánea puede dividirse en CTU de igual tamaño y cada CTU puede incluir Bloques de Codificación (CB) que tienen muestras de luminancia de 16 x 16, 32 x 32 o 64 x 64. En JEM, que es un modelo de exploración para más allá de HEVC, una CTU puede incluir Bloques de Codificación que tienen 128x128, 128x64, 128x32, 64x64 o 16x16 y así sucesivamente. En este punto, el bloque de codificación, el bloque de predicción y el bloque de transformación pueden ser el mismo. Específicamente, el Bloque de Codificación (bloque de predicción y bloque de transformación) pueden ser bloques cuadrados o no cuadrados.

De acuerdo con una realización, un aparato de decodificación puede recibir un flujo de bits (S500), realizar decodificación por entropía (S510), realizar cuantificación inversa (S520), determinar si realizar transformación inversa (S530), realizar transformación inversa (S540), realizar predicción (S550) y generar muestras reconstruidas (S560). Más descripciones específicas con respecto a la realización son como se muestran a continuación.

Como se ha descrito anteriormente, elementos de sintaxis de predicción pueden asociar un bloque de codificación de los mismos con correspondientes muestras de referencia. Por ejemplo, para codificación de intra predicción, un modo de intra predicción puede especificar la ubicación de muestras de referencia. En ITU-T H.265, posibles modos de intra predicción para un componente de luminancia incluyen un modo de predicción plano (predMode: 0), una predicción de CC (predMode: 1), y múltiples modos de predicción angular (predMode: 2-N, en este punto N puede ser 34 o 65 o más). Uno o más elementos de sintaxis pueden identificar uno de los modos de intra predicción previa. Para codificación de inter predicción, un vector de movimiento (MV) identifica muestras de referencia en una instantánea distinta de la instantánea de un bloque de codificación que hay que codificar y de este modo explota la redundancia temporal en vídeo. Por ejemplo, un bloque de codificación actual puede predecirse a partir de un bloque de referencia ubicado en un fotograma codificado anteriormente y puede usarse un vector de movimiento para indicar la ubicación del bloque de referencia. Un vector de movimiento y datos asociados pueden describir, por ejemplo, un componente horizontal del vector de movimiento, un componente vertical del vector de movimiento, una resolución para el vector de movimiento (por ejemplo, precisión de píxel de un cuarto), una dirección de predicción y/o un valor de índice de instantánea de referencia. Además, una norma de codificación, tal como, por ejemplo, HEVC, puede soportar predicción de vector de movimiento. La predicción de vector de movimiento habilita que se especifique un vector de movimiento usando vectores de movimiento de bloques vecinos.

El codificador de vídeo puede generar datos residuales restando un bloque de vídeo predictivo de un bloque de vídeo de fuente. El bloque de vídeo predictivo puede ser intra predicho o inter predicho (vector de movimiento). Los datos residuales se obtienen en el dominio de píxel. Los coeficientes de transformada se obtienen aplicando una transformada, tal como una transformada de coseno discreta (DCT), una transformada de seno discreta (DST), o una transformada conceptualmente similar, al bloque residual para producir un conjunto de coeficientes de transformada residuales. El generador de coeficientes de transformada puede emitir coeficientes de transformada residuales a la unidad de cuantificación de coeficientes.

El proceso de derivación de parámetro de cuantificación (QP) se resume como se indica a continuación.

La primera etapa es derivación de QP de luminancia. a) Encontrar parámetro de cuantificación de luminancia predicho (qPY_pRED) basándose en parámetros de cuantificación (disponibles) anteriormente codificados, b) obtener desplazamiento de cu_delta_QP que indica la diferencia entre QP predicho (obtenido en a) y QP real, y c) Determinación de QP de valor de luminancia basándose en profundidad de bits, QP predicho y cu_delta_QP.

La segunda etapa es derivación de QP de crominancia. a) QP de crominancia se deriva a partir de QP de luminancia, b) Desplazamiento de QP de crominancia se encuentra a partir de desplazamiento de nivel de PPS (es decir, pps_cb_qp_offset, pps_cr_qp_offset) y desplazamiento de QP de crominancia de nivel de corte (es decir, slice_cb_qp_offset, slice_cr_qp_offset).

Los siguientes son detalles de los procesos mencionados anteriormente.

El parámetro de cuantificación de luminancia predicho qPY_PRED se deriva como se indica a continuación.

[Figura matemática 6]

qPY_PRED - ( qPY_A qPY_B 1)>>1

Donde, la variable qPY_A y qPY_B indica parámetros de cuantificación de un grupo de cuantificación anterior. En este punto qPY_A se establece igual al parámetro de cuantificación de luminancia de la unidad de codificación que contiene el bloque de codificación de luminancia que cubre (xQg - 1, yQg). En este punto, la ubicación de luminancia (xQg, yQg) especifica la muestra de luminancia superior izquierda del grupo de cuantificación actual en relación con la muestra de luminancia superior izquierda de la instantánea actual. Donde, las variables qPY_A y qPY_B indican parámetros de cuantificación de grupos de cuantificación anteriores. Específicamente qPY_A se establece igual al parámetro de cuantificación de luminancia de la unidad de codificación que contiene el bloque de codificación de luminancia que cubre (xQg -1 , yQg). En este punto, la ubicación de luminancia (xQg, yQg) especifica la muestra de luminancia superior izquierda del grupo de cuantificación actual en relación con la muestra de luminancia superior izquierda de la instantánea actual. La variable qPY_B se establece igual al parámetro de cuantificación de luminancia QpY de la unidad de codificación que contiene el bloque de codificación de luminancia que cubre (xQg, yQg - 1). Cuando qPY A o qPY_B no está disponible, se establece igual a qPY_PREv. En este punto, qPY_PREv se establece igual al parámetro de cuantificación de luminancia QpY de la última unidad de codificación en el grupo de cuantificación anterior en orden de decodificación.

Una vez que se determina qPY_PRED, a continuación, se actualiza el parámetro de cuantificación de luminancia añadiendo CuQpDeltaVal como se indica a continuación;

[Figura matemática 7]

QpY - ( ( qPY_PRED+CuQpDeltaVal 52 2 * QpBdOffsetY )%( 52 QpBdOffsetY) ) - QpBdOffsetY

Donde el valor CuQpDeltaVal se transmite a través de flujo de bits a través de dos elementos de sintaxis, tales como cu_qp_delta_abs y cu_qp_delta_sign_flag. QpBdOffsetY especifica el valor del desplazamiento de rango de parámetro de cuantificación de luminancia y depende de bit_depth_luma_minus8 (es decir, profundidad de bit de luminancia -8) como se indica a continuación.

[Figura matemática 8]

QpBdOffsetY - 6 * bit_depth_luma_minus8

Finalmente, el parámetro de cuantificación de luminancia QpV se deriva como se indica a continuación.

[Figura matemática 9]

El parámetro de cuantificación de luminancia QpV - QpY QpBdOffsetY

El QP de crominancia se deriva a partir del QP de luminancia que considera desplazamientos de nivel de PPS (pps_cb_qp_offset, pps_cr_qp_offset) y desplazamientos de nivel de corte (slice_cb_qp_offset, slice_cr_qp_offset) como se indica a continuación.

[Figura matemática 10]

qPicb - Clip3(-QpBdOffsetc, 57, QpY pps_cb_qp_offset slice_cb_qp_offset )

qPicr - Clip3( -QpBdOffsetc, 57, QpY pps_cr_qp_offset slice_cr_qp_offset)

Los qPicb y qPicr anteriores se actualizan adicionalmente, basándose en la Tabla 2 y la Tabla 3 a continuación, a qPcb y qPCr, respectivamente. [

T l 21

La Tabla 2 representa la correlación de qPicb con qPcb.

T l 1

La Tabla 3 representa la correlación de qPicr con qPcr.

Finalmente, los parámetros de cuantificación de crominancia para los componentes Cb y Cr, Qp'cb y Qp'cr, se derivan como se indica a continuación.

[Figura matemática 11]

Qp'cb = qPcb QpBdOffsetc

Qp'cr = qPcr QpBdOffsetc

QpBdOffsetc especifica el valor del desplazamiento de rango de parámetro de cuantificación de crominancia y depende de bit_depth_chroma_minus8 (es decir, profundidad de bit de crominancia -8) como se indica a continuación.

[Figura matemática 12]

QpBdOffsetc = 6 * bit_depth_chroma_minus8

Mientras tanto, la Tabla 4 representa las definiciones de los elementos de sintaxis que se usan en las presentes descripciones.

______________________________________________[Tabla 41________________________________________ init_qp_minus26 especifica el valor inicial menos 26 de SliceQpY para cada corte. El valor inicial se modifica en la capa de segmento de corte cuando se decodifica un valor distinto de cero de slice_qp_delta, y se modifica adicionalmente cuando se decodifica un valor distinto de cero de cu_qp_delta_abs en la capa de unidad de codificación. El valor de init_qp_minus26 estará en el intervalo de -(26 QpBdOffsetY) a 25, inclusives.

slice_qp_delta especifica el valor inicial de QpY que hay que usar para los bloques de codificación en el segmento hasta que se modifica por el valor de cuQpDeltaVal en la capa de unidad de codificación. El valor inicial del parámetro de cuantificación QpY para el corte, SliceQpY, se deriva como se indica a continuación:

SliceQpY = 26 init_qp_minus26 slice_qp_delta.

El valor de SliceQpY estará en el intervalo de -QpBdOffsetY a 51, inclusives.

Slice_cb_qp_offset especifica una diferencia que hay que añadir al valor de pps_cb_qp_offset cuando se determina el valor del parámetro de cuantificación QP'cb. El valor de slice_cb_qp_offset estará en el intervalo de -12 a 12, inclusives. cuando slice_cb_qp_offset no está presente, se infiere que es igual a 0. El valor de pps_cb_qp_offset slice_cb_qp_offset estará en el intervalo de -12 a 12, inclusives.

slice_cr_qp_offset especifica una diferencia que hay que añadir al valor de pps_cr_qp_offset cuando se determina el valor del parámetro de cuantificación QP'cr. El valor de slice_cr_qp_offset estará en el intervalo de -12 a 12, inclusives. cuando slice_cr_qp_offset no está presente, se infiere que es igual a 0. El valor de pps_cr_qp_offset slice_cr_qp_offset estará en el intervalo de -12 a 12, inclusives.

cu_qp_delta_abs especifica el valor absoluto de la diferencia cuQpDeltaVal entre el parámetro de cuantificación de luminancia de la unidad de codificación actual y su predicción._________________________ continuación

Ya que S600, S610 y S630 a S670 se corresponden a S500 a S560 de la Figura 5, se omitirá o simplificará una descripción detallada que se solape con la anterior descripción.

De acuerdo con una realización, un aparato de decodificación puede recibir un flujo de bits (S600), realizar decodificación por entropía (S610), realizar cuantificación inversa (S630), determinar si realizar transformación inversa (S640), realizar transformación inversa (S650), realizar predicción (S660) y generar muestras reconstruidas (S670). Y, además, un aparato de decodificación puede derivar el desplazamiento de QP (S620) basándose en la decodificación por entropía y realizar cuantificación inversa basándose en la derivación del desplazamiento de QP.

S620 puede especificarse como se muestra a continuación. A continuación, el desplazamiento de QP puede representarse por "Luma_avg_qp".

Una vez que se determina qPY_PRED, a continuación, el parámetro de cuantificación de luminancia puede actualizarse añadiendo Luma_avg_qp como se indica a continuación.

[Figura matemática 13]

QpY = ( ( qPY_PRED CuQpDeltaVal Luma_avg_qp+ 52 2 * QpBdOffsetY )%( 52 QpBdOffsetY ) ) -QpBdOffsetY

En un ejemplo, Luma_avg_qp puede derivarse (o inferirse) a partir de valores de luminancia de píxeles (o bloques) vecinos que ya están decodificados y disponibles. Luma_avg_qp puede determinarse a partir de los valores de píxeles vecinos basándose en una regla de derivación predefinido. Por ejemplo, Luma_avg_qp puede derivarse como se indica a continuación.

[Figura matemática 14]

Luma_avg_qp = A*(avg_luma-M) B

En la Figura matemática 14, avg_luma: el valor de luminancia promedio esperado obtenido de píxeles (o bloques) vecinos (decodificados) disponibles,

M: un valor predefinido que puede depender de la profundidad de bits,

A: factor de escalado para correlacionar una diferencia de valor de píxel con diferencia de qp (puede predefinirse o transmitirse en flujo de bits). Indica la pendiente de la correlación de qp, y

B: valor de desplazamiento que puede predefinirse o transmitirse en un flujo de bits.

La derivación de Luma_avg_qp a partir del valor de avg_luma puede no estar restringida por la fórmula expresada anteriormente que es una de su pluralidad. En otro ejemplo, Luma_avg_qp puede obtenerse de una tabla de correspondencia como se indica a continuación.

[Figura matemática 15]

Luma_avg_qp = Mapping_Table_from_luma_to_QP [avg_luma]

donde avg_luma se introduce en la tabla y la salida de la tabla es Luma_avg_qp. Para reducir el tamaño de tabla, el rango de valor de entrada (avg_luma) puede reducirse adicionalmente como se indica a continuación.

[Figura matemática 16]

Luma_avg_qp = Mapping_Table_from_luma_to_QP [avgJuma/D]

donde D es un valor constante predefinido para reducir el rango de valores de entrada.

En una realización, Luma_avg_qp puede derivarse basándose en información sobre el QP. El aparato de decodificación puede obtener la información sobre el QP del flujo de bits. En un ejemplo, la información sobre el QP puede comprender init_qp_minus26, slice_qp_delta, slice_cb_qp_offset, slice_cr_qp_offset, cu_qp_delta_abs y cu_qp_delta_sign_flag. Además, la información sobre el QP no está limitada por los ejemplos listados anteriormente.

La Figura 7 es un diagrama de flujo que ilustra una operación de un aparato de codificación de acuerdo con una realización, y la Figura 8 es un diagrama de bloques que ilustra una configuración de un aparato de codificación de acuerdo con una realización.

Cada etapa divulgada en la Figura 7 puede realizarse por el aparato de codificación 100 divulgado en la Figura 1. Más específicamente, S700 a S730 pueden realizarse por el módulo de cuantificación 123 mostrado en la Figura 1, y S740 puede realizarse por el módulo de codificación por entropía 130 mostrado en la Figura 1. Además, las operaciones de acuerdo con S700 a S740 se basan en algunas de las descripciones descritas anteriormente en la Figura 6. Por lo tanto, se omitirá o simplificará una descripción detallada que se solapa con los contenidos anteriormente descritos en la Figura 1 y la Figura 6.

Como se ilustra en la Figura 8, el aparato de codificación de acuerdo con una realización puede comprender el módulo de cuantificación 123 y el módulo de codificación por entropía 130. Sin embargo, en algunos casos, todos los componentes mostrados en la Figura 8 pueden no ser componentes esenciales del aparato de codificación puede implementarse por más o menos componentes que los mostrados en la Figura 8.

El módulo de cuantificación 123 y el módulo de codificación por entropía 130 en el aparato de decodificación de acuerdo con una realización pueden implementarse como chips separados, o al menos dos o más componentes pueden implementarse a través de un chip.

El aparato de codificación de acuerdo con una realización puede derivar un valor de luminancia promedio esperado de un bloque actual a partir de muestras disponibles vecinas (S700). Más específicamente, el módulo de cuantificación 123 del aparato de codificación puede derivar un valor de luminancia promedio esperado de un bloque actual a partir de muestras disponibles vecinas.

El aparato de codificación de acuerdo con una realización puede derivar un desplazamiento de QP para derivar un QP de luminancia basándose en el valor de luminancia promedio esperado e información sobre un QP (S710). Más específicamente, el módulo de cuantificación 123 del aparato de codificación puede derivar un desplazamiento de QP para derivar un QP de luminancia basándose en el valor de luminancia promedio esperado e información sobre un QP.

El aparato de codificación de acuerdo con una realización puede derivar el QP de luminancia basándose en el desplazamiento de QP (S720). Más específicamente, el módulo de cuantificación 123 del aparato de codificación puede derivar el QP de luminancia basándose en el desplazamiento de QP.

El aparato de codificación de acuerdo con una realización puede realizar una cuantificación para un grupo de cuantificación que comprende el bloque actual basándose en el QP de luminancia derivado (S730). Más específicamente, el módulo de cuantificación 123 del aparato de codificación puede realizar una cuantificación para un grupo de cuantificación que comprende el bloque actual basándose en el QP de luminancia derivado.

El aparato de codificación de acuerdo con una realización puede codificar información de imagen que comprende la información sobre el QP (S740). Más específicamente, el módulo de codificación por entropía 130 puede codificar información de imagen que comprende la información sobre el QP.

De acuerdo con la Figura 7 y la Figura 8, el aparato de codificación de acuerdo con una realización puede derivar un valor de luminancia promedio esperado de un bloque actual a partir de muestras disponibles vecinas (S700), derivar un desplazamiento de QP para derivar un QP de luminancia basándose en el valor de luminancia promedio esperado e información sobre un QP (S710), realizar una cuantificación para un grupo de cuantificación que comprende el bloque actual basándose en el QP de luminancia derivado (S730), y codificar información de imagen que comprende la información sobre el QP (S740). En consecuencia, el parámetro de cuantificación puede derivarse de forma eficiente y puede mejorarse la eficiencia de codificación general.

La Figura 9 es un diagrama de flujo que ilustra una operación de un aparato de decodificación de acuerdo con una realización, y la Figura 10 es un diagrama de bloques que ilustra una configuración de un aparato de decodificación de acuerdo con una realización.

Cada etapa divulgada en la Figura 9 puede realizarse por el aparato de decodificación 200 divulgado en la Figura 2.

Más específicamente, S900 puede realizarse por el módulo de decodificación por entropía 210 mostrado en la Figura 2, S910 a S940 pueden realizarse por el módulo de cuantificación inversa 222 mostrado en la Figura 2, S950 puede realizarse por el módulo de transformación inversa 223 como se muestra en la Figura 2, S960 puede realizarse por el módulo de predicción 230 como se muestra en la Figura 2 y S970 puede realizarse por el sumador 240 mostrado en la Figura 2. Además, las operaciones de acuerdo con S900 a S970 se basan en algunas de las descripciones descritas anteriormente en la Figura 6. Por lo tanto, se omitirá o simplificará una descripción detallada que se solapa con los contenidos anteriormente descritos en la Figura 2 y la Figura 6.

Como se ilustra en la Figura 10, el aparato de decodificación de acuerdo con una realización puede comprender el módulo de decodificación por entropía 210, el módulo de cuantificación inversa 222, el módulo de transformación inversa 223, el módulo de predicción 230 y el sumador 240. Sin embargo, en algunos casos, todos los componentes mostrados en la Figura 10 pueden no ser componentes esenciales del aparato de codificación puede implementarse por más o menos componentes que los mostrados en la Figura 10.

El módulo de decodificación por entropía 210, el módulo de cuantificación inversa 222, el módulo de transformación inversa 223, el módulo de predicción 230 y el sumador 240 en el aparato de decodificación de acuerdo con una realización pueden implementarse como chips separados, o al menos dos o más componentes pueden implementarse a través de un chip.

El aparato de decodificación de acuerdo con una realización puede decodificar información de imagen que comprende información sobre un QP (S900). Más específicamente, el módulo de decodificación por entropía 210 en el aparato de decodificación puede decodificar información de imagen que comprende información sobre un QP.

En una realización, la información sobre el QP se señaliza a nivel de Conjunto de Parámetros de Secuencia (SPS).

En una realización, la información de imagen comprende información sobre Parámetros de Rango de Datos Efectivos (EDRP), y la información sobre los EDRP comprende al menos uno de un valor de entrada mínimo, un valor de entrada máximo, rango dinámico de valor de entrada, información de correlación para relacionar el valor de entrada mínimo con brillo, información de correlación para relacionar el valor de entrada máximo con brillo e información de identificación de función de transferencia. Este método puede indicarse como coincidencia de rango.

Más específicamente, esta invención puede utilizarse para codificar de forma eficiente contenidos de imagen/vídeo en los que el rango de palabras de código (valor de entrada) está restringido. Puede producirse a menudo en contenido de HDR debido a que el uso de función de transferencia soporta alta luminancia. También puede suceder cuando se transforman datos de SDR usando funciones de transformación de luminancia que corresponden a datos de HDR. En estos casos, un codificador de vídeo puede configurarse para señalizar parámetros de rango de datos efectivos (EDRP). Y el decodificador puede configurarse para recibir EDRP asociados con los datos de vídeo, y utilizan datos de EDRP en el proceso de decodificación. Los datos de EDRP pueden incluir, por ejemplo, valor de entrada mínimo, valor de entrada máximo, rango dinámico del valor de entrada (indica la diferencia entre valor de entrada máximo y valor de entrada mínimo), información de correlación entre valor de entrada mínimo y su correspondiente brillo, información de correlación entre valor de entrada máximo y su correspondiente brillo, identificación de función de transferencia (funciones de transferencia conocidas pueden identificarse por su número de ID asignado y la información de correlación detallada para cada función de transferencia puede estar disponible), y así sucesivamente.

Por ejemplo, los datos de EDRP pueden señalizarse en un encabezamiento de corte, un conjunto de parámetros de instantánea (PPS) o conjunto de parámetros de secuencia (SPS). De esta manera, los datos de EDRP pueden usarse para modificar adicionalmente valores codificados durante el proceso de decodificación.

Esta invención introduce un parámetro de control de calidad (QCP) para especificar un ajuste adicional del parámetro de cuantificación. Y el decodificador puede configurarse para recibir QCP asociados con los datos de vídeo, y utilizan datos de QCP en el proceso de decodificación.

El aparato de decodificación de acuerdo con una realización puede derivar un valor de luminancia promedio esperado de un bloque actual a partir de muestras disponibles vecinas (S910). Más específicamente, el módulo de cuantificación inversa 222 en el aparato de decodificación puede derivar un valor de luminancia promedio esperado de un bloque actual a partir de muestras disponibles vecinas.

El aparato de decodificación de acuerdo con una realización puede derivar un desplazamiento de QP para derivar un QP de luminancia basándose en el valor de luminancia promedio esperado y la información sobre el QP (S920). Más específicamente, el módulo de cuantificación inversa 222 en el aparato de decodificación puede derivar un desplazamiento de QP para derivar un QP de luminancia basándose en el valor de luminancia promedio esperado y la información sobre el QP.

En una realización, el desplazamiento de QP se deriva basándose en una ecuación a continuación.

[Figura matemática 17]

Luma_avg_qp = A*(avg_luma-M)+B

en donde el Luma_avg_qp en la ecuación representa el desplazamiento de QP, la avgjum a en la ecuación representa el valor de luminancia promedio esperado, la A en la ecuación representa un factor de escalado para correlacionar una diferencia de valor de píxel con una diferencia de QP, la M en la ecuación representa un valor predefinido relacionado con una profundidad de bit, y la B en la ecuación representa un valor de desplazamiento, y en donde la A y la B son valores predeterminados o valores incluidos en la información de imagen.

En una realización, el desplazamiento de QP se deriva a partir de una tabla de correspondencia que se basa en el valor de luminancia promedio esperado, y la tabla de correspondencia se determina usando el valor de luminancia promedio esperado como una entrada.

En una realización, el desplazamiento de QP se deriva a partir de una tabla de correspondencia que se basa en el valor de luminancia promedio esperado, y la tabla de correspondencia se determina usando un valor obtenido dividiendo el valor de luminancia promedio esperado con un valor constante predefinido.

En una realización, las muestras disponibles vecinas comprenden al menos una de al menos una muestra de luminancia adyacente al límite izquierdo del grupo de cuantificación y al menos una muestra de luminancia adyacente al límite superior del grupo de cuantificación.

En una realización, la al menos una muestra de luminancia adyacente al límite izquierdo del grupo de cuantificación se incluye en una columna de muestras de luminancia directamente adyacente al límite izquierdo del grupo de cuantificación, y la al menos una muestra de luminancia adyacente al límite superior del grupo de cuantificación se incluye en una fila de muestra de luminancia directamente adyacente al límite superior del grupo de cuantificación.

En una realización, las muestras disponibles vecinas comprenden una muestra de luminancia adyacente al lado izquierdo de una muestra superior izquierda del grupo de cuantificación, y las muestras disponibles vecinas comprenden una muestra de luminancia adyacente al lado superior de una muestra superior izquierda del grupo de cuantificación.

En una realización, las muestras disponibles vecinas comprenden al menos una de muestras vecinas reconstruidas, muestras incluidas en al menos uno de un bloque vecino reconstruido, muestras vecinas predichas y muestras incluidas en al menos uno de un bloque vecino predicho.

En una realización, avg_luma puede derivarse a partir de valores de píxeles vecinos (bloques). avg_luma indica el valor de luminancia promedio esperado obtenido a partir de píxeles (o bloques) vecinos (ya decodificados).

i) Los píxeles vecinos disponibles pueden incluir:

- Píxeles ubicados en (xQg - 1, yQg K). En este punto, la ubicación de luminancia (xQg, yQg) especifica la muestra de luminancia superior izquierda del grupo de cuantificación actual en relación con la muestra de luminancia superior izquierda de la instantánea actual. (la línea muy a la izquierda al bloque actual).

- Píxeles ubicados en (xQg K, yQg -1). En este punto, la ubicación de luminancia (xQg, yQg) especifica la muestra de luminancia superior izquierda del grupo de cuantificación actual en relación con la muestra de luminancia superior izquierda de la instantánea actual. (la línea muy por encima al bloque actual).

- En lugar de una línea, pueden usarse múltiples líneas.

ii) Bloque vecino disponible puede usarse para calcular avg_luma:

- Puede usarse un bloque que incluye un píxel ubicado en (xQg -1 , yQg).

- Puede usarse un bloque que incluye un píxel ubicado en (xQg, yQg -1).

iii) El valor de avg_luma puede calcularse basándose en píxeles/bloques vecinos reconstruidos.

iv) El valor de avg_luma puede calcularse basándose en píxeles/bloques vecinos predichos.

En una realización, la información sobre el QP comprende al menos un elemento de sintaxis relacionado con el desplazamiento de QP, y la derivación del desplazamiento de QP basándose en el al menos uno del valor de luminancia promedio esperado y la información sobre el QP comprende derivar el desplazamiento de QP basándose en al menos un elemento de sintaxis relacionado con el desplazamiento de QP.

Puede introducirse un nuevo elemento de sintaxis para considerar Luma_avg_qp. Por ejemplo, el valor de Luma_avg_qp puede transmitirse a través de un flujo de bits. Puede especificarse adicionalmente a través de dos elementos de sintaxis, tales como Luma_avg_qp_abs y Luma_avg_qp_flag.

Luma_avg_qp puede indicarse por dos elementos de sintaxis (luma_avg_qp_delta_abs y luma_avg_qp_delta_sign_flag).

luma_avg_qp_delta_abs especifica el valor absoluto de la diferencia CuQpDeltaLumaVal entre el parámetro de cuantificación de luminancia de la unidad de codificación actual y su parámetro de cuantificación de luminancia derivado sin considerar la luminancia.

luma_avg_qp_delta_sign_flag especifica el signo de CuQpDeltaLumaVal como se indica a continuación:

si luma_avg_qp_delta_sign_flag es igual a 0, el correspondiente CuQpDeltaLumaVal tiene un valor positivo.

De lo contrario (luma_avg_qp_delta_sign_flag es igual a 1), el correspondiente CuQpDeltaLumaVal tiene un valor negativo.

Cuando luma_avg_qp_delta_sign_flag no está presente, se infiere que es igual a 0.

Cuando luma_avg_qp_delta_sign_flag está presente, las variables Is-CuQpDeltaLumaCoded y CuQpDeltaLumaVal se derivan como se indica a continuación:

[Figura matemática 18]

IsCuQpDeltaLumaCoded = 1

CuQpDeltaLumaVal = cu_qp_delta_abs * ( 1 - 2 * luma_avg_qp_delta_sign_flag)

CuQpDeltaLumaVal especifica la diferencia entre un parámetro de cuantificación de luminancia para la unidad de codificación que contiene Luma_avg_qp y un parámetro de cuantificación de luminancia para la unidad de codificación sin Luma_avg_qp.

En una realización, los elementos de sintaxis descritos anteriormente pueden transmitirse en un nivel de grupo de cuantificación (o nivel de unidad de cuantificación) (por ejemplo, CU, CTU o unidad de bloque predefinida).

El aparato de decodificación de acuerdo con una realización puede derivar el QP de luminancia basándose en el desplazamiento de QP (S930). Más específicamente, el módulo de cuantificación inversa 222 en el aparato de decodificación puede derivar el QP de luminancia basándose en el desplazamiento de QP.

El aparato de decodificación de acuerdo con una realización puede realizar una cuantificación inversa para un grupo de cuantificación que comprende el bloque actual basándose en el QP de luminancia derivado (S940). Más específicamente, el módulo de cuantificación inversa 222 en el aparato de decodificación puede realizar una cuantificación inversa para un grupo de cuantificación que comprende el bloque actual basándose en el QP de luminancia derivado.

En una realización, el aparato de decodificación puede derivar un QP de crominancia a partir del QP de luminancia derivado basándose en al menos una tabla de correspondencia de QP de crominancia y realizar la cuantificación inversa para el grupo de cuantificación basándose en el QP de luminancia derivado y el QP de crominancia derivado, en donde la al menos una tabla de correspondencia de QP de crominancia se basa en rango dinámico de crominancia y el desplazamiento de QP.

En una realización, en lugar de una tabla de correspondencia de QP de crominancia, pueden existir múltiples tablas de correspondencia de QP de crominancia. Puede requerirse información adicional para especificar qué tabla de correspondencia de QP usar. Lo siguiente es un ejemplo de otra tabla de derivación de QP de crominancia.

T l

En una realización, la al menos una tabla de correspondencia de QP de crominancia comprende al menos una tabla de correspondencia de QP de Cb y al menos una tabla de correspondencia de QP de Cr.

El aparato de decodificación de acuerdo con una realización puede generar muestras residuales para el bloque actual basándose en la cuantificación inversa (S950). Más específicamente, el módulo de transformación inversa 223 en el aparato de decodificación puede generar muestras residuales para el bloque actual basándose en la cuantificación inversa.

El aparato de decodificación de acuerdo con una realización puede generar muestras de predicción para el bloque actual basándose en la información de imagen (S960). Más específicamente, el módulo de predicción 230 en el aparato de decodificación puede generar muestras de predicción para el bloque actual basándose en la información de imagen.

El aparato de decodificación de acuerdo con una realización puede generar muestras reconstruidas para el bloque actual basándose en las muestras residuales para el bloque actual y las muestras de predicción para el bloque actual (S970). Más específicamente, el sumador en el aparato de decodificación puede generar muestras reconstruidas para el bloque actual basándose en las muestras residuales para el bloque actual y las muestras de predicción para el bloque actual.

De acuerdo con la Figura 9 y la Figura 10, el aparato de decodificación de acuerdo con una realización puede decodificar información de imagen que comprende información sobre un QP (S900), derivar un valor de luminancia promedio esperado de un bloque actual a partir de muestras disponibles vecinas (S910), derivar un desplazamiento de QP para derivar un QP de luminancia basándose en el valor de luminancia promedio esperado y la información sobre el QP (S920), derivar el QP de luminancia basándose en el desplazamiento de QP (S930), realizar una cuantificación inversa para un grupo de cuantificación que comprende el bloque actual basándose en el QP de luminancia derivado (S940), generar muestras residuales para el bloque actual basándose en la cuantificación inversa (S950), generar muestras de predicción para el bloque actual basándose en la información de imagen (S960) y generar muestras reconstruidas para el bloque actual basándose en las muestras residuales para el bloque actual y las muestras de predicción para el bloque actual (S970). En consecuencia, el parámetro de cuantificación puede derivarse de forma eficiente y puede mejorarse la eficiencia de codificación general.

El método anteriormente descrito de acuerdo con la presente invención puede implementarse en software, y el aparato de codificación y/o aparato de decodificación de acuerdo con la presente invención puede incluirse en un aparato de procesamiento de imagen tal como una TV, un ordenador, un teléfono inteligente, dispositivo de visualización, etc.

Cuando las realizaciones de la presente invención se implementan en software, el método anteriormente descrito puede implementarse por un módulo (un proceso, una función y similares) que realiza las funciones descritas anteriormente. El módulo se almacena en memoria y puede ejecutarse por el procesador. La memoria puede ser interna o externa al procesador y puede acoplarse al procesador mediante cualquiera de varios medios bien conocidos. El procesador puede incluir un circuito integrado específico de la aplicación (ASIC), otro conjunto de chips, circuitería lógica y/o un dispositivo de procesamiento de datos. La memoria puede incluir memoria de solo lectura (ROM), memoria de acceso aleatorio (RAM), memoria flash, tarjetas de memoria, medios de almacenamiento y/u otros dispositivos de almacenamiento.

Claims

REIVINDICACIONES

1. Un método de decodificación de instantáneas, realizado por un aparato de descodificación, que comprende

obtener información de imagen que incluye información relacionada con un parámetro de cuantificación, QP, desde un flujo de bits, en donde la información relacionada con el QP incluye información relacionada con un QP de luminancia e información relacionada con unos QP de crominancia;

derivar el QP de luminancia basándose en la información relacionada con el QP de luminancia;

derivar los QP de crominancia basándose en la información relacionada con los QP de crominancia, en donde los QP de crominancia incluyen un primer QP de crominancia para un componente de Cb y un segundo QP de crominancia para un componente de Cr;

generar una instantánea reconstruida que incluye muestras reconstruidas basándose en el QP de luminancia, el primer QP de crominancia para el componente de Cb y el segundo QP de crominancia para el componente de Cr, en donde derivar el QP de luminancia basándose en la información relacionada con el QP de luminancia comprende:

derivar un QP de luminancia predicha basándose en parámetros de cuantificación previamente codificados, derivar un valor delta de QP basándose en información sobre un valor absoluto del valor delta de QP e información sobre un signo del valor delta de QP, en donde la información sobre el valor absoluto del valor delta de QP y la información sobre el signo del valor delta de QP está incluida en la información relacionada con el QP de luminancia; y

derivar el QP de luminancia basándose en el QP de luminancia predicha y el valor delta de QP, caracterizado por que derivar los QP de crominancia comprende:

derivar el primer QP de crominancia para el componente de Cb basándose en el QP de luminancia y una primera tabla de correspondencia de QP de crominancia para el componente de Cb; y

derivar el segundo QP de crominancia para el componente de Cr basándose en el QP de luminancia una segunda tabla de correspondencia de QP de crominancia para el componente de Cr,

en donde tanto una entrada de la primera tabla de correspondencia de QP de crominancia como una entrada de la segunda tabla de correspondencia de crominancia se basan en el QP de luminancia,

en donde la primera tabla de correspondencia de QP de crominancia para el componente de Cb es una tabla separada de correspondencia de la segunda tabla de correspondencia de QP de crominancia para el componente de Cr.

2. El método de la reivindicación 1,

en donde la información relacionada con el QP se señaliza a nivel de Conjunto de Parámetros de Secuencia, SPS.

3. El método de la reivindicación 1,

en donde la información de imagen comprende información sobre Parámetros de Rango de Datos Efectivos, EDRP, y

en donde la información sobre los EDRP comprende al menos uno de un valor de entrada mínimo, un valor de entrada máximo, rango dinámico de valor de entrada, información de correlación para relacionar el valor de entrada mínimo con brillo, información de correlación para relacionar el valor de entrada máximo con brillo e información de identificación de función de transferencia.

4. Un método de codificación de instantáneas, que comprende:

derivar un parámetro de cuantificación de luminancia, QP, para un bloque actual;

derivar unos QP de crominancia, en donde los QP de crominancia incluyen un primer QP de crominancia para un componente de Cb y un segundo QP de crominancia para un componente de Cr para el bloque actual; generar información relacionada con el QP; y

codificar información de imagen que comprende la información relacionada con el QP,

en donde la información relacionada con el QP incluye información relacionada con el QP de luminancia e información relacionada con los QP de crominancia,

en donde el QP de luminancia se representa basándose en un QP de luminancia predicho y un valor delta de QP, en donde el QP de luminancia predicho se deriva basándose en parámetros de cuantificación previamente codificados,

en donde la información relacionada con el QP de luminancia incluye información sobre un valor absoluto de un valor delta de QP e información sobre un signo del valor delta de QP,

caracterizado por que derivar los QP de crominancia comprende:

derivar el segundo QP de crominancia para el componente de Cr basándose en el QP de luminancia y una segunda tabla de correspondencia de QP de crominancia para el componente de Cr,

en donde tanto una entrada de la primera tabla de correspondencia de QP de crominancia como una entrada de la segunda tabla de correspondencia de crominancia se basan en el QP de luminancia, en donde la primera tabla de correspondencia de QP de crominancia para el componente de Cb es una tabla separada de correspondencia de la segunda tabla de correspondencia de QP de crominancia para el componente de Cr.

5. Un medio de almacenamiento legible por ordenador no transitorio que almacena información codificada de imagen generada por método de decodificación de instantáneas, comprendiendo el método:

caracterizado por que derivar los QP de crominancia comprende:

6. Un método de transmisión de datos que comprende un fujo de bits para una instantánea, comprendiendo el método:

obtener el flujo de bits para la instantánea, en donde el flujo de bits se genera realizando la derivación de un parámetro de cuantificación de luminancia, QP, para un bloque actual, la derivación de QP de crominancia, en donde los QP de crominancia incluyen un primer Q<p>de crominancia para un componente de Cb y un segundo QP de crominancia para un componente de Cr para el bloque actual, la generación de información relacionada con el QP, y la codificación de información de imagen que comprende la información relacionada con el QP para generar el flujo de bits; y

transmitir los datos que comprenden el flujo de bits,

caracterizado por que derivar los QP de crominancia comprende: