ES2974520T3 - Reducción de artefactos de formación de bandas en formación de imagen HDR por mediación de funciones adaptativas de remodelación de SDR a HDR - Google Patents
Reducción de artefactos de formación de bandas en formación de imagen HDR por mediación de funciones adaptativas de remodelación de SDR a HDR Download PDFInfo
- Publication number
- ES2974520T3 ES2974520T3 ES19756075T ES19756075T ES2974520T3 ES 2974520 T3 ES2974520 T3 ES 2974520T3 ES 19756075 T ES19756075 T ES 19756075T ES 19756075 T ES19756075 T ES 19756075T ES 2974520 T3 ES2974520 T3 ES 2974520T3
- Authority
- ES
- Spain
- Prior art keywords
- function
- interval
- input
- bin
- banding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/98—Adaptive-dynamic-range coding [ADRC]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
- G06T5/92—Dynamic range modification of images or parts thereof based on global image properties
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20072—Graph-based image processing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
- G06T2207/20208—High dynamic range [HDR] image processing
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Se describen métodos y sistemas para reducir los artefactos de bandas cuando se muestran imágenes de alto rango dinámico. Dada una imagen de entrada en un primer rango dinámico, y una función de remodelación hacia atrás de entrada que asigna palabras de código desde el primer rango dinámico a un segundo rango dinámico, en donde el segundo rango dinámico es igual o mayor que el primer rango dinámico, se obtienen datos estadísticos basados en la entrada. La imagen y la función de remodelación hacia atrás de entrada se generan para estimar el riesgo de artefactos de bandas en una imagen objetivo en el segundo rango dinámico generado aplicando la función de remodelación hacia atrás de entrada a la imagen de entrada. Se aplican algoritmos de alivio de bandas separados en las partes oscuras y resaltadas del primer rango dinámico para generar una función de remodelación hacia atrás modificada, que cuando se aplica a la imagen de entrada para generar la imagen de destino elimina o reduce las bandas en la imagen de destino. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Reducción de artefactos de formación de bandas en formación de imagen HDR por mediación de funciones adaptativas de remodelación de SDR a HDR
Solicitudes relacionadas
Esta solicitud reivindica prioridad sobre la solicitud de patente provisional de Estados Unidos número 62/717.070, presentada el 10 de agosto de 2018 y sobre la solicitud de patente europea número 18188468.5, presentada el 10 de agosto de 2018.
Tecnología
El presente documento se refiere en general a imágenes. Más particularmente, una realización de la presente invención se refiere a la reducción de artefactos de formación de bandas en imágenes reconstruidas de alto intervalo dinámico (HDR) por medio de la conveniente adaptación de las funciones de remodelación de intervalo dinámico estándar (SDR) a HDR.
Antecedentes
Como se usa en el presente documento, el término 'intervalo dinámico' (DR) puede relacionarse con la capacidad del sistema visual humano (HVS) para percibir un intervalo de intensidad (por ejemplo, luminancia, luma) en una imagen, por ejemplo desde los grises más oscuros (los negros) hasta los blancos más brillantes (los resaltados). En este sentido, el DR se relaciona con una intensidad "referida a la escena". El DR también puede estar relacionado con la capacidad de un dispositivo de exhibición visual para representar de manera adecuada o aproximada un intervalo de intensidad de un espectro particular. En este sentido, el DR se relaciona con una intensidad "referida a la visualización". A menos que se especifique explícitamente que un sentido particular tiene un significado particular en cualquier punto de la descripción del presente documento, se debe inferir que el término puede usarse en cualquiera de estos sentidos, por ejemplo, indistintamente.
Como se utiliza en el presente documento, el término alto intervalo dinámico (HDR) se relaciona con un espectro de DR que abarca los 14-15 órdenes de magnitud del sistema visual humano (HVS). En la práctica, el DR sobre el cual un ser humano puede percibir simultáneamente un extenso espectro en el intervalo de intensidad puede estar algo truncado, en relación con el HDR. Como se usa en el presente documento, los términos intervalo dinámico visual (VDR) o intervalo dinámico perfeccionado (EDR) pueden relacionarse individual o indistintamente con el DR que es perceptible dentro de una escena o imagen por un sistema visual humano (HVS) que incluye movimientos oculares, lo que permite algunos cambios de adaptación de la luz en la escena o imagen. Tal como se utiliza en el presente documento, VDR puede relacionarse con un DR que abarca de 5 a 6 órdenes de magnitud. De este modo, aunque quizás sean algo más estrechos en relación con la escena real referida, HDR, VDR o EDR representan un espectro amplio de DR, y se les puede también llamar HDR.
En la práctica, las imágenes comprenden uno o más componentes de color (por ejemplo, luma Y y croma Cb y Cr) en donde cada componente de color está representado por una precisión de n bits por píxel (por ejemplo, n=8). Al utilizar la codificación de luminancia lineal, las imágenes en las quen< 8 (por ejemplo, imágenes JPEG en color de 24 bits) se consideran imágenes de intervalo dinámico estándar, mientras que las imágenes en las quen> 8 pueden considerarse imágenes de intervalo dinámico perfeccionado. Las imágenes HDR también se pueden almacenar y distribuir utilizando formatos de punto flotante de alta precisión (por ejemplo, 16 bits), tal como el formato de archivo OpenEXR desarrollado por Industrial Light and Magic.
La mayoría de los dispositivos de exhibición visual de escritorio de consumo soportan actualmente una luminancia de 200 a 300 cd/m2 o nits. La mayoría de los televisores de alta definición de consumo oscilan entre 300 y 500 nits, y los modelos nuevos alcanzan los 1000 nits (cd/m2). De este modo, tales dispositivos de exhibición visual convencionales caracterizan un intervalo dinámico más bajo (LDR), también denominado intervalo dinámico estándar (SDR), en relación con HDR. A medida que aumenta la disponibilidad de contenido HDR debido a los avances tanto en los equipos de captura (por ejemplo, en las cámaras) como en los dispositivos de exhibición visual HDR (por ejemplo, en el monitor de referencia profesional PRM-4200 de Dolby Laboratories), el contenido HDR puede graduarse en color y exhibirse visualmente en dispositivos de exhibición visual HDR que soporten intervalos dinámicos más altos (por ejemplo, de 1000 nits a 5000 nits o más).
En una canalización de imágenes tradicional, las imágenes capturadas se cuantifican utilizando una función optoelectrónica no lineal (OETF), que convierte la luz de escena lineal en una señal de vídeo no lineal (por ejemplo, RGB con codificación gamma o YCbCr). Luego, en el receptor, antes de exhibirse visualmente en el dispositivo de exhibición visual, la señal es procesada por una función de transferencia electroóptica (EOTF) que traduce los valores de la señal de vídeo en valores de color de la pantalla de salida. Tales funciones no lineales incluyen la tradicional curva "gamma", documentada en Rec. UIT-R. BT.709 y BT. 2020, la curva "PQ" (cuantización perceptual) descrita en SMPTE ST 2084, y la curva "HíbridaLog-gamma" o "HLG" descrita en y Rec. UIT-R BT. 2100.
Como se utiliza en el presente documento, el término "remodelación directa" denota un proceso de mapeo de muestra a muestra o de palabra de código a palabra de código de una imagen digital desde su profundidad de bits original y distribución o representación de palabras de código originales (por ejemplo, gamma o PQ o HLG, y similares) a una imagen de la misma o diferente profundidad de bits, y una distribución o representación de palabras de código diferente. La remodelación permite mejorar la compresibilidad o la calidad de la imagen a una velocidad de bits fija. Por ejemplo, sin limitación, se puede aplicar remodelación a vídeo HDR codificado PQ de 10 o 12 bits para mejorar la eficiencia de codificación en una arquitectura de codificación de vídeo de 10 bits. En un receptor, después de descomprimir la señal recibida (que puede remodelarse o no), el receptor puede aplicar una "función de remodelación revertida (o invertida)" para restaurar la señal a su distribución de palabra de código original y/o conseguir un intervalo dinámico más alto.
Tal como se utiliza aquí, el término "formación de bandas" (también denominado "formación de bandas de color") se refiere a un artefacto visual en formación de imágenes y en vídeos donde tonos del mismo color se exhiben visualmente como bandas de luminancia variable. Cuando es visible, la formación de bandas es visualmente molesta, y a menudo se considera un indicador de codificación de baja calidad o de un dispositivo de exhibición visual de baja calidad. Como aprecian los inventores en este caso, se desean técnicas mejoradas para reducir la formación de bandas cuando se exhibe visualmente contenido de vídeo, especialmente contenido HDR.
Los enfoques descritos en esta sección son enfoques que podrían implantarse, pero no necesariamente enfoques que hayan sido concebidos o aplicados previamente. Por lo tanto, a menos que se indique lo contrario, no se debe asumir que cualquiera de los enfoques descritos en esta sección califica como técnica anterior simplemente en virtud de su inclusión en esta sección. De manera similar, no se debe asumir que las cuestiones identificadas con respecto a uno o más enfoques han sido reconocidas en ninguna técnica anterior sobre la base de esta sección, a menos que se indique lo contrario. PU F ET AL: "Comments on Reshaping for HDR/WCG compression",113. MPEG MEETING; 19-10-2015-23-10-2015; GINEBRA; (MOTION PICTURE EXPERT GROUP OR ISO/IEC JTC1/SC29/WG11), núm. m37267, 21 de octubre de 2015 (2015-10-21), divulga cómo la remodelación, en diversas formas, ha demostrado su capacidad para mejorar el rendimiento de codificación subjetiva del vídeo HDR/WCG. El documento US 2018/098094 A1, divulga un método para facilitar mapeos de luma/croma inversos en un sistema visual humano de alto intervalo dinámico, que implica transmisión de imágenes acompañada de metadatos inversos a dispositivos receptores, donde los metadatos de remodelación inversos se generan en función.
Breve descripción de los dibujos
Una realización de la presente invención se ilustra a modo de ejemplo, y no a modo de limitación, en las figuras de los dibujos que se acompañan y en las que números de referencia similares se refieren a elementos similares y en los que:
La figura 1A representa un codificador de una sola capa de ejemplo para datos HDR que utiliza una función de remodelación de acuerdo con una realización de esta invención;
la figura 1B representa un decodificador HDR de ejemplo correspondiente al codificador de la figura 1A, de acuerdo con una realización de esta invención;
la figura 2 representa un proceso de ejemplo para reducir los artefactos de formación de bandas de acuerdo con una realización de esta invención;
la figura 3 representa un proceso de ejemplo para derivar parámetros relacionados con la reducción de artefactos de formación de bandas de acuerdo con una realización de esta invención;
la figura 4 representa un proceso de ejemplo para aliviar la formación de bandas en regiones oscuras de acuerdo con una realización de esta invención;
la figura 5 representa un proceso de ejemplo para aliviar la formación de bandas en regiones resaltadas de acuerdo con una realización de esta invención;
la figura 6A representa ejemplos de una BLUT original y una BLUT modificada para reducir la formación de bandas en los oscuros de acuerdo con una realización de esta invención; y
la figura 6B representa ejemplos de una BLUT original y una BLUT modificada para reducir la formación de bandas en los resaltados de acuerdo con una realización de esta invención.
Descripción de realizaciones de ejemplo
En el presente documento se describe la reducción de artefactos de formación de bandas en contenido de imágenes y vídeos HDR por medio de la adaptación conveniente de una función de mapeo de imágenes de remodelación. Dada una imagen SDR y una función de remodelación revertida, se deriva una función de remodelación actualizada de modo que una imagen HDR de salida generada aplicando la función de remodelación actualizada a la imagen de entrada tenga artefactos de formación de bandas reducidos o nulos. En la siguiente descripción, con fines explicativos, se exponen numerosos detalles específicos para proporcionar una comprensión profunda de las diversas realizaciones de la presente invención. Será evidente, sin embargo, que las diversas realizaciones de la presente invención se pueden poner en práctica sin estos detalles específicos. En otros casos, las estructuras y dispositivos bien conocidos no se describen con detalle exhaustivo.
Sumario
Las realizaciones de ejemplo descritas en el presente documento se relacionan con la reducción de artefactos de formación de bandas en imágenes HDR. La invención está definida por las reivindicaciones independientes. Las reivindicaciones dependientes definen realizaciones ventajosas.
Ejemplo de sistema de codificación HDR
Como se describe en la solicitud de patente de EE.UU. n° de serie 15/725.101, (la 'solicitud 101') "Inverse luma/chroma mappings with histogram transfer and approximation", por B. Wen, et al., presentada el 4 de octubre de 2017 y publicada como publicación de solicitud de patente de EE.UU. US 2018/0098094, la figura 1A y la figura 1B ilustran un marco de códec de gestión de exhibición visual inverso de una sola capa (SLiDM) de ejemplo que utiliza la remodelación de imágenes. Más específicamente, la figura 1A ilustra una arquitectura de códec de lado del codificador de ejemplo, que puede implantarse con uno o más procesadores informáticos en un codificador de vídeo de aguas arriba. la figura 1B ilustra un ejemplo de arquitectura de códec del lado del decodificador, que puede también implantarse con uno o más procesadores informáticos en uno o más decodificadores de vídeo de aguas abajo.
Bajo este marco, el contenido (117) de SDR se codifica y transmite en una sola capa de una señal (144) de vídeo codificada mediante un dispositivo de codificación de aguas arriba que implanta la arquitectura de códec de lado del codificador. El contenido de SDR se recibe y decodifica, en la capa única de la señal de vídeo, mediante un dispositivo de decodificación de aguas abajo que implanta la arquitectura de códec del lado del decodificador. Los metadatos (152) de remodelación revertida también se codifican y transmiten en la señal de vídeo con el contenido de SDR para que los dispositivos de exhibición visual HDR puedan reconstruir el contenido de HDR en base al contenido de SDR y a los metadatos de remodelación revertida.
En algunas realizaciones, como se ilustra en la figura 1A, las imágenes SDR retrocompatibles, tales como las imágenes SDR (117), se reciben como entrada en el lado del codificador del marco de códec. En este caso, el término "imágenes SDR retrocompatibles" puede referirse a imágenes SDR que están específicamente optimizadas o clasificadas en color para dispositivos de exhibición visual SDR.
Un bloque 142 de compresión (por ejemplo, un codificador implantado de acuerdo con cualquier algoritmo de codificación de vídeo conocido, como AVC, HEVC, AV1 y similares) comprime/codifica las imágenes SDR (117) en una única capa 144 de una señal de vídeo. A modo de ilustración, pero no de limitación, se utiliza un módulo 146 de mapeo de intervalo dinámico (DM) inverso —que puede representar una herramienta de conversión de SDR a HDR— para convertir las imágenes SDR (117) en imágenes HDR 148 de referencia. En algunas realizaciones, el módulo de DM inverso también puede denominarse herramienta de mapeo de tonos inversa. En algunas realizaciones, en lugar de convertir las imágenes SDR (117) en las imágenes HDR objetivo (148), el contenido HDR (148) puede derivarse directamente del mismo contenido de vídeo de fuente/entrada utilizado para derivar las imágenes SDR (117) (no se muestra).
Independientemente de si las imágenes HDR objetivo (148) se derivan de las imágenes SDR (117) o no, un generador 150 de función de remodelación revertida recibe tanto las imágenes SDR (117) como las imágenes HDR (148) de referencia como entrada, realiza una optimización para encontrar funciones óptimas de remodelación revertida, de modo que las imágenes remodeladas revertidas, generadas al remodelar revirtiendo las imágenes SDR (117) con las funciones óptimas de remodelación revertida, estén lo más cerca posible de las imágenes HDR (148) de referencia. Las funciones óptimas de remodelación revertida pueden representarse o especificarse con metadatos revertida 152 de remodelación.
Los ejemplos de metadatos de remodelación revertida que representan/especifican las funciones óptimas de remodelación revertida pueden incluir, pero sin estar necesariamente limitados a, cualquier elemento de entre: función de mapeo de tono inverso, funciones de mapeo de luma inverso, funciones de mapeo de croma inverso, tablas de consulta (LUT), polinomios, coeficientes/parámetros de DM inverso, etc. En diversas realizaciones, las funciones de remodelación revertida de luma y las funciones de remodelación revertida de croma pueden derivarse/optimizarse de forma conjunta o por separado, pueden derivarse usando técnicas de aproximación/transferencia de histograma de funciones de distribución acumulativa (CDF), y puede obtenerse utilizando una variedad de técnicas como se describe en la solicitud 101 y/o en la solicitud PCT n° de serie PCT/US2018/037313, presentada el 13 de junio de 2018, "Efficient end-to-end single layer inverse display management coding", por N.J. Gadgil et al.
Los metadatos (152) de remodelación revertida, generados por el generador (150) de funciones de remodelación revertida, en base a las imágenes SDR (117) y a las imágenes HDR objetivo (148), se pueden multiplexar como parte de la señal 144 de vídeo.
En algunas realizaciones, los metadatos (152) de remodelación revertida se transportan en la señal de vídeo como parte de los metadatos de imagen globales, que se transportan por separado en la señal de vídeo de la capa única en la que las imágenes SDR están codificadas en la señal de vídeo. Por ejemplo, los metadatos (152) de remodelación revertida pueden codificarse en una corriente de componentes en la corriente de bits codificada, corriente de componentes que puede o no estar separado de la capa única (de la corriente de bits codificada) en la que se encuentran las imágenes SDR (117) codificadas.
De este modo, los metadatos (152) de remodelación revertida se pueden generar o pregenerar en el lado del codificador para aprovechar potentes recursos informáticos y flujos de codificación fuera de línea (incluidos, pero sin estar necesariamente limitados a, múltiples pasadas adaptativas de contenido, funciones de anticipación, mapeo inverso de luma, mapeo inverso de croma, aproximación y/o transferencia de histograma basada en CDF, etc.) disponibles en el lado del codificador.
La arquitectura del lado del codificador de la figura 1A se puede utilizar para evitar codificar directamente las imágenes HDR de destino (148) en imágenes HDR codificadas/comprimidas en la señal de vídeo; en su lugar, los metadatos (152) de remodelación revertida en la señal de vídeo se pueden usar para permitir que los dispositivos de decodificación de aguas abajo remodelen revertiendo las imágenes SDR (117) (que están codificadas en la señal de vídeo) en imágenes reconstruidas que son idénticas o se aproximan con mucha cercanía/óptimamente a las imágenes HDR (148) de referencia.
En algunas realizaciones, como se ilustra en la figura 1B, la señal de vídeo codificada con las imágenes SDR (117) en la capa única (144) y los metadatos revertida (152) de remodelación como parte de los metadatos de imagen globales se reciben como entrada en el lado del decodificador del marco del códec. Un bloque 154 de descompresión descomprime/decodifica datos de vídeo comprimidos en la única capa (144) de la señal de vídeo en las imágenes SDR decodificadas (156). La descompresión 154 corresponde típicamente a la inversión de la compresión 142. Las imágenes SDR decodificadas (156) pueden ser las mismas que las imágenes SDR (117), sujetas a errores de cuantificación en el bloque (142) de compresión y en el bloque (154) de descompresión, que puede haber sido optimizado para dispositivos de exhibición visual s Dr . Las imágenes SDR decodificadas (156) pueden emitirse en una señal de vídeo SDR de salida (por ejemplo, a través de una interfaz HDMI, a través de un enlace de vídeo, etc.) para ser representadas en un dispositivo de exhibición visual SDR.
Además, un bloque 158 de remodelación revertida extrae los metadatos (152) de remodelación revertida de la señal de vídeo de entrada, construye las funciones de remodelación revertida óptimas en base a los metadatos (152) de remodelación revertida y realiza funciones de remodelación revertida en las imágenes SDR decodificadas (156) en base a las funciones óptimas de remodelación revertida para generar las imágenes remodeladas revertidas (160) (o imágenes HDR reconstruidas). En algunas realizaciones, las imágenes remodeladas revertidas representan imágenes HDR con calidad de producción o con calidad casi de producción que son idénticas o se aproximan con mucha cercanía/óptimamente a las imágenes HDR (148) de referencia. Las imágenes remodeladas revertidas (160) pueden emitirse en una señal de vídeo HDR de salida (por ejemplo, a través de una interfaz HDMI, a través de un enlace de vídeo, etc.) para ser representadas en un dispositivo de exhibición visual HDR.
En algunas realizaciones, las funciones de gestión de exhibición visual específicas para el dispositivo de exhibición visual HDR se pueden realizar en las imágenes remodeladas revertidas (160) como parte de las funciones de representación de imágenes HDR que representan las imágenes remodeladas revertidas (160) en el dispositivo de exhibición visual HDR.
Ejemplo de sistema para reducir artefactos de formación de bandas
La figura 2 representa un flujo (200) de datos de ejemplo para reducir los artefactos de formación de bandas de acuerdo con una realización. Como se representa en la figura 2, las entradas a este flujo de trabajo son una imagen SDR (202) (por ejemplo, parte de la secuencia 117 de vídeo de entrada) y una tabla de consulta de reversión de referencia (BLUT) o función 204 de remodelación revertida (por ejemplo, una diseñada de acuerdo con el bloque 150 descrito anteriormente). El proceso construirá una nueva BLU<t>(227), que cuando se aplique a los datos SDR en el decodificador (véase, por ejemplo, la figura 1B) reducirá la formación de bandas en la imagen HDR resultante.
El método propuesto funciona con cualquier BLUT de referencia válida que esté diseñada para aplicarse en una imagen SDR para producir una salida HDR. Por ejemplo, una condición para una BLUT válida requiere que una función de remodelación sea monótonamente no decreciente. Por consiguiente, la metodología propuesta es independiente del método utilizado para generar la BLUT (204) de referencia.
El método propuesto también funcionará si la imagen SDR (202) de entrada se reemplaza por una imagen VDR o HDR de menor intervalo dinámico que la imagen HDR objetivo (por ejemplo, la imagen HDR 160).
SeaIsla imagen SDR de entrada que tiene píxeles de luma dePde profundidad de bits deSbits.El número total de palabras de código de SDR viene dado porNs=2sbits.Sea este espacio de palabras de código de luma dividido enNlcontenedores (por ejemplo,Nl= 64) que contiene el mismo número de palabras de código enL H
cada contenedor. Sea(sb >sb) la palabra de código SDR mínima y máxima en el contenedorb.Obsérvese queH _ L_ i
para todos menos para el último contenedor. SeaTREFla tabla de consulta de reversión de referencia (BLUT) paraIs.Obsérvese que, sin limitación,TREFespecifica un mapeo de referencia a partir de una palabra de código SDR a su correspondiente palabra de código HDR normalizada (entre 0 y 1). En este documento, s indica un índice de palabras de código ybindica un índice de contenedor.
Recopilación de estadísticas
En el bloque 205, se recopilan datos estadísticos de la entrada SDR (202) y de la entrada BLUT (204) oTREF,como sigue:
a) Se calculahNS,un histograma de luma de la entrada de SDR.
Denótese comos, y,ii
el valor normalizado entre 0 y 1, del /-ésimo píxel de luma enIs,entonces la tabla 1 proporciona en pseudocódigo un ejemplo de implantación de histograma:
— ■
b) Se calcula , una métrica basada en bloques de la desviación estándar de SDR en los contenedores de luma deNl.Sea que la imagenIsque contienePpíxeles esté compuesta por bloques cuadrados noP
N b = -superpuestos dewb<* wb>píxeles de luma (por ejemplo,wb<=>4). En total, hay( w r<X w « )>bloques que no se superponen en la imagen de entrada. Para una imagen donde su dimensión horizontal o vertical no es divisible porwb,se pueden excluir sus bloques de píxeles fraccionarios al escanear la imagen en orden de escaneo rasterizado. Por ejemplo, se puede excluir la columna más a la derecha y/o la fila más inferior de bloques
fraccionarios. SeaB/pel y'-ésimo bloque no superpuesto deIs.Sea<v>M<’"">el /(-ésimo valor de píxel de luma normalizado entre 0 y 1, en ely'-ésimo bloque de píxeles. Además, sea '1Anl
el histograma de luma deNlcontenedores deIs.Sean A”y el promedio de luma de bloque y la desviación estándar paraB
Dados losNlcontenedores de luma, un algoritmo de ejemplo para calcular datos estadísticos (por ejemplo, promedio, varianza o desviación estándar) para cada bloque se muestra en la tabla 2.
Tabla 2: Reco ilación de desviaciones estándar basadas en blo ues en contenedores de luma
En la tabla 2, el términoINVÁLIDOindica que el valor de un parámetro no está definido o no es válido. A efectos prácticos, esto puede ser simplemente un valor negativo grande.
c)Se calculaRvel intervalo HDR normalizado en cada uno de los contenedores de luma SDR. En este paso,n V
TREF,la BLUT de referencia, se utiliza para calcular , el intervalo HDR normalizado correspondiente a cada contenedor de luma SDR. Sea
nV /■Kth■/'K t t
Rb ~ Ts"E '- i<(2)>
El primer contenedor se puede manejar de forma diferente, ya que no existe una palabra de código para -1 y el
intervalo HDR se calcula desdesoL = ohasta,ou. Para todos los demás contenedores, el intervalo HDR secalcula desde,b¿ - ihasta bH
. La tabla 3 proporciona un ejemplo de implantación.
Tabla 3: Cálculo de Rvh
señ señ
SeanS* 5
min y max las palabras de código SDR mínima y máxima del intervalo de palabras de código deseñal activaque se refiere a un intervalo completo (por ejemplo, [0,2Sbits-1]) oal intervalo SMPTE más estrecho (por ejemplo, [16, 235] para datos de 8 bits).
usen j s e ñ
Sean min y ^max los índices inicial y final de los contenedores que contienen las palabras de código mínima y r>'
máxima de laseñalactiva. u para todos los contenedores que no son de señal, porque no hay palabras de código HDR asignadas fuera del intervalo deseñal(esto se aplica principalmente al intervalo SMPTE). Sea\jCtt
el número de palabras de código deseñalen el contenedor b.
Se puede utilizar simplementeNCWsi se hace referencia al caso no límite del número de palabras de código en cada contenedor de luma. El intervalo SMPTE es el caso más común, por lo que se ha utilizado en algunos de los ejemplos.
Estimación del riesgo de formación de bandas
Dados los datos estadísticos recopilados en el paso 205, el paso 210 en la figura 2 calcula una medida de "riesgo de formación de bandas". Cuando esta medida es positiva, entonces se pueden aplicar esquemas de alivio de formación de bandas (por ejemplo, pasos 215 y 220), que se describirán con más detalle más adelante; de lo contrario, se pueden omitir estos pasos.
SeacZ buna estimación de la desviación estándar en la señal HDR reconstruida en el contenedorbde luma, considerando una señal de intervalo completo. Para los contenedores con —INVALIDOd e ^ o a que ninguna palabra de código SDR cae en tales contenedores, entonces— INVALIDOtambién. Sea ^ el número estimado de palabras de código HDR necesarias para evitar la formación de bandas en el contenedor de lumaben la señal HDR sin comprimir. SeaZbel riesgo estimado de formación de bandas en el contenedorbde luma. En una realización, los valores se pueden estimar en cada contenedor deseñalutilizando una ecuación de transferencia estadística basada en los valores calculados y^b.Por ejemplo, se puede utilizar la pendiente local de 7*®" en el contenedorbpara mapear a Se puede utilizar un valor de factor de escala, denotadosc_factor,para convertir el intervalo SMPTE a un intervalo completo, ya que se desea la señal HDR de
se_ fa c to r =( | ^ Jcw,nintervalo completo para el siguiente paso. Para señales SMPTE SDR, Sea1 bel número de palabras de código SDR normalizadas en el contenedorb.De este modo, para cada contenedorb,dado que
r :
N C W ,n
donden brepresenta la pendiente local deTREFen el contenedorb.Esta ecuación convierte los valores de desviación estándar de SDR para un intervalo de luma particular en la desviación estándar en la señal HDR resultante cuando se aplica 7*®" a la señal SDR. Intuitivamente, denota el valor de la desviación estándar para el contenido HDR generado como resultado del contenido del contenedor de luma b-ésimo SDR, ajustado (si es necesario) para el intervalo SMPTE. Para señales de entrada en el intervalo completosc_factor= 1.
S'V_Q1 \ i -V'nV
SeaJ■b ’ ^b >definido como una función de y de'h ,que mapea para cada contenedorbde señal, la desviación estándar de HDR y el intervalo de HDR a una cantidad requerida de palabras de código para evitar la formación de bandas. En una realización, dada la desviación estándar de la señal, se puede utilizar la tabla de mapeo experimental utilizada en la solicitud de patente estadounidense n° de serie 15/648.125, "Single-pass and multi-pass-based polynomial approximations for reshaping functions", por H. Kadu et al., presentada el 12 de julio de 2017, también publicada como publicación de solicitud de patente de EE.UU. n° de serie 2017/0308996, para estimar el número requerido de palabras de código para representar la señal HDR para evitar la formación de
bandas. Entoncesx lla estimación del riesgo de formación de bandas para el contenedorb,se puede derivar
como la diferencia entre £ , la cantidad requerida de palabras en código HDR para evitar formación de bandas,
y, N b ~, el número de palabras de código HDR enb,o
s rvese que para os conene ores on e - ,, -am n. El pseudocódigo para este paso se describe en la tabla 4 a continuación:
El procedimientointerpolate_table_lookup() proporciona un valor de salida interpolado usando una interpolación lineal simple de los datos de mapeo experimental: pares Gv .exp '<¿ V.EXP>(por ejemplo, véase tabla 4) y el valor 1 de entrada. Cada para \ v , 'exp > rvv ,■EXPes un mapeo entre la desviación estándar HDR para todo el intervalo HDR (entre 0 y 1) y su correspondiente número requerido de palabras de código para evitar formación de
bandas. Cada *-7 calculado corresponde a un una parte del intervalo de palabras en código HDR derivadas usandoTREF.
ATCW PV
Intuitivamente, cuando el número de palabras de código deTREFen un contenedor ó es menor que =&, el aV
número mínimo de palabras de código necesarias para evitar la formación de bandas, & , el riesgo de formación de bandas, resulta positivo. Esto implica que probablemente haya una apariencia visual de formación de bandas mientras se mira el contenido de ese contenedor de luminancia de la imagen HDR. Cuanto mayor sea el valor dez lmayores son las posibilidades de que aparezcan formación de bandas en su intervalo de luminancia
correspondiente. Alternativamente, cuandoN.para el contenedor b es mayor quea, esto significa que elnúmero de palabras de código asignadas enTREFpara el ó-ésimo contenedor es mayor que el número estimado de palabras de código necesarias para evitar la formación de bandas. Por consiguiente, esta parte deTREFestá marcada como "segura de formación de bandas", lo que implica que no causará una apariencia visual de formación de bandas en la imagen HDR resultante. Por consiguiente, el objetivo de este paso es identificar y cuantificar la posible formación de bandas en la imagen HDR para cada contenedor de ¡urna SDR. El límite p \ > inferior del número de palabras de código para cada contenedor también se puede calcular en términos de .
Alivio de formación de bandas
Como apreciaron los inventores, se observó que reducir los artefactos de formación de bandas requería diferentes estrategias entre las áreas oscuras (los negros) y los resaltados. Para reducir la formación de bandas en las zonas oscuras, es importante conservar la respuesta de remodelación para intensidades más altas; de lo contrario, toda la imagen puede verse más oscura. Así, la BLUT modificada necesita alcanzar el nivel original de intensidad HDR, ya que reduce la formación de bandas en las regiones más oscuras. Una de las características principales de la reconstrucción de imágenes/vídeos HDR es su capacidad para mostrar altos niveles de intensidades, por lo que existe el deseo de mantener el "aspecto HDR" conservando el brillo general en las partes más altas. Por lo tanto, es importante mantener inalterado el "brillo promedio" o el global en la región afectada mientras se modifica la BLUT original. Por ejemplo, una solución más simple, como el recorte de resaltados, normalmente no es adecuada, ya que no puede conservar el brillo objetivo. En base a estas observaciones, se proponen algoritmos separados para reducir la formación de bandas en zonas oscuras y resaltados, indicados en la figura 2 como pasos 215 y 220 respectivamente. En el bloque 225, los resultados de los bloques 215 y 220 se fusionan para construir la función de remodelación revertida modificada (BLUT) final (227). En la figura 3 se resumen algunos pasos preliminares y notación, aplicables a ambos pasos, y se describen a continuación.
En primer lugar, la BLUT se divide en regiones oscuras y resaltadas. Asumiendo datos codificados en PQ, sea A ^ po el umbral expresado como un valor de cuantificación perceptual (PQ) que, cuando se aplica enTREF,determina las regiones oscuras y resaltadas SDR (paso 305). (Si el SDR de entrada está codificado usando
A' gamma, HLG o algún otro EOTF, entonces se puede usar un umbral alternativo apropiado). Seanyoso jóse Jy0SC
'^ max las palabras de código SDR mínima y máxima de la parte oscura. Sean min y max sus correspondientes
de contenedor. Seans bríll brill
índices min y max |as palabras de código mínima y máxima SDR de la parte resaltada.
£^>r/ff 7brill
Sean min y ^max sus correspondientes índices de contenedor. Todos estos valores pueden derivarse en el
A {,
paso 310. En el paso 315, los valores de las estimaciones de riesgo de formación de bandas para el contenedorbde luma se pueden utilizar para identificar los contenedores afectados por formación de bandasf osc p bri"
oscuras y brillantes. Seanriessyries9marcas de riesgo con formación de bandas oscuras y brillantes que indiquen (por ejemplo, cuando se establece en 1) si hay un valor positivo%>>en al menos un contenedor de entreb M".
los contenedores oscuro y brillante respectivamente. Seanesg_mme\fndice de contenedor más bajo en el quep brill brill
£ > opara la parte de brillos. Los valoresriesg ríesgyriesg_m¡npUeden derivarse comprobando los valores tanto en la parte oscura como en la brillante. En la tabla 5 se muestra un pseudocódigo de ejemplo para derivar estos parámetros.
Tabla5:Ejemplo de algoritmo para calcular parámetros relacionados con límite entre oscurosyresaltados
contenedores de interés (por ejemplo, en las áreas oscuras o resaltadas marcadas como con riesgo dej?M O D’Tn’M/vOD
formación de bandas). Sea la dLUT modificada y sea la BLUT modificada construida usandoSM0D nOSC ^hnii
para aliviar la formación de bandas. Las marcasF ries9yFr/eLsg ¡ndican el riesgo de posibles formaciones de bandas en la imagen HDR compuesta y activan los algoritmos de reducción de formación de bandas que se presentan a continuación. En la tabla 6 se muestra un ejemplo de construcción de una LUT de diferencial.
Tabla 6: Eem lo de construcción de una BLUT de diferencial o dLUT
La idea general es a) disminuir la dLUT (o la pendiente de BLUT) en contenedores que tienen riesgo positivo de formación de bandas y b) compensar la caída en el nivel de intensidad HDR aumentando la dLUT en los contenedores libres de riesgo. Esto provoca una disminución en la diferencia de intensidades HDR de formación de bandas adyacentes, aliviando la apariencia de la formación de bandas, haciendo, de este modo, que el cambio de intensidad sea más suave.
En un enfoque de dos pasadas, como se representa en la figura 4, en la primera pasada (pasos 405 y 410) la pendiente de la BLUT original se reduce en todos los contenedores caracterizados como " propensión a riesgo de formación de bandas". A continuación, en una segunda pasada (paso 420), las palabras de código restantes se reasignan para compensar la caída de intensidad. Finalmente (paso 425), se genera la BLUT modificada.
Aos° f oscDenótese comoLMel número de palabras de código que deciden lamarca de rolr ro ll,,b,donde cada contenedor está marcado como "propenso a riesgo de formación de bandas", "en el límite de riesgo de formación
de bandas" o "riesgo de formación de bandas desconocido". Sea<A o>B<sc>Rel número de palabras de código que se agregarán al número de palabras de código requeridas para reducir el riesgo de formación de bandas en los contenedores propensos a riesgos. Entonces la tabla 7 representa un conjunto de condiciones de ejemplo y las acciones y parámetros correspondientes que se aplicarán al ajustar la dLUT de diferencial (por ejemplo, como parte del paso 405). En una realización, sin ninguna limitación, se utilizan los siguientes parámetros elegidos ^osc ¿\osc
empíricamente:BR =24, _ 4 |a ta|->|a-¡^□ parámetro opcionalOproporciona un nivel adicional de ajuste fino del algoritmo. En base a experimentos,9= 1,2 produce buenos resultados experimentales.
Tabla 7: Reducción de formación de bandas en dos pasadas en los oscuros: condiciones y acciones
Como se muestra en la tabla 7, para contenedores "propensos a riesgos", cuando%<>es positivo, el valor de
dLUT debe reducirse de modo que< 61El multiplicador de dLUT ("¡«¡s) para el contenedorben este
caso depende del número de palabras de código requeridas (c=5b&v), el número de palabras de código asignadas en, N cw
la BLUT de referencia(í<b), y la agresividad del algoritmo de reducción de formación de bandas (BR).El valor dLUT original se reduce mediante el uso de un multiplicador definido como la proporción de palabras de
código asignadasnb ™a las palabras de código requeridasC5 bvmás elA°BscR. De este modo, en los contenedoresrMOD_/yosc .5\REF
de recuperación, la dLUT se ajusta como°s ~«V° s.
A,v A osc
Cuandoz l- 0, peroZh+CMel contenido de este contenedor de luma tiene un riesgo límite de formación de bandas y, por consiguiente, no se puede aumentar la dLUT para compensar la caída de intensidad.
En caso deZ<~>hv+<A>CM<0, el contenido de este contenedor está suficientemente por debajo del riesgo de formación de bandas, por lo que la dLUT en este contenedor se puede aumentar para compensar la intensidadc m o d > <?r e faosc
de la caída y conservar la parte no oscura. Así que,°b — ° b .De este modo,CMde alguna manera refleja la sensibilidad de la modificación de dLUT a la detección de riesgos. Por último, cuando no hay informacióng M O D _ g R E F
sobre la estadística de riesgo en un contenedor, y no se realizan ajustes a la dLUT original.
Denótese como ^ el balance de palabras de código HDR normalizado. Se inicializa como 0, y el objetivo es hacer que este balance sea 0 al final de la reducción de la formación de bandas oscuras. En el primer paso a través de contenedores oscuros, la pendiente BLUT se reduce en todos los contenedores propensos a formar formación de bandas (donde el riesgo es positivo). En la segunda pasada, las palabras en código HDR restantes se asignan en contenedores libres de riesgo para compensar la caída de intensidad. Esto asegura mantener el<¡
specto HDR en la parte no oscura. D este modo, en una realización,m o d _ r y osc . § REF
a~recuperación * .
En algunos casos extremos, la caída de intensidad (T1) puede no recuperarse por completo, lo que lleva a T1 < 0 después de realizar dos pasadas, pero esta ocurrencia es típicamente rara y ocurre en imágenes muy pobres que tienen una gran cantidad de formación de bandas oscuras repartidas en varios contenedores. La tabla 8 representa en pseudocódigo una implantación de ejemplo del proceso representado en la figura 4.
Tabla 8: Ejemplo de implantación del método de alivio de formación de bandas en dos pasadas en los r
Reducción de formación de bandas en los resaltados
pbriH
Si la marcaries3se establece (por ejemplo, en 1), se construye luego una nueva BLUT en la parte de resaltados para reducir la formación de bandas mientras se intenta mantener el brillo promedio. En la figura 5. La idea principal es ubicar la palabra de código SDR propensa al riesgo de formación de bandas más baja en la parte resaltada y comenzar a construir la BLUT utilizando las estimaciones de riesgo de abajo hacia arriba, es decir, primero se construye la curva dLUT mínima requerida, y a continuación se asigna las restantes palabras de código. Durante este proceso, se monitoriza la pérdida de brillo general de la imagen en comparación con la BLUT de referencia. La pérdida total de brillo se compensa modificando la BLUT de referencia para las palabras de código SDR sin riesgo de formación de bandas.
, brillObrill
Sea W m in el contenedor de luma desde el cual se comienza a modificar BLUT. Seaa vascentUn número fijo de contenedores que se utilizan como compensación, de tal manera que
cMOL ljbn“
A partir del paso 505, la dLUT modificada,°s, se construirá a partir de1mod_minj que se tendrá como el
comienzo de la parte dealivio,hasta el contenedorbmbraUxl/> =
de luma de mayor intensidad. Seas Lla palabra de código SDR inicial de la modificación de dLUT. Considérese<Ate">, un parámetro variable aditivo que
cambia linealmente con el índice b de contenedor entreAbrir<y>Abr¡", los valores mínimo y máximo que<Iylb rill /J yr ill>
. Un ejemplo de cálculo de (paso 510) se representa en la tabla 9. En una realización, los.b r i l lA M (
valores típicos que se utilizan son A m¡n = 8 y max 16. Parece que estos valores funcionan bien independientemente de la profundidad de bits de entrada o de los valores de resolución espacial luma.
T l E m l l ri m r l l r f r i i r r l
La pérdida de brillo global de imagen se basa enhNS,el histograma luminoso dels(por ejemplo, véase la tabla1,'v5fiMOD cREF
1). Usando yu¡se puede calcular la pérdida de brillo para cada palabra de código ajustada y sumarla para realizar un seguimiento de la pérdida de brillo global de la imagen HDR resultante. Para mejorar la eficiencia de cálculo, en una realización,h<RC),denotado como elhistograma acumulativo inversode la imagen,
que es una estadística derivada deh ¡N¡s, esta construido. En una realización, la perdida de brillo para la palabra de códigobse calcula usando el histograma SDR y las dos funciones de remodelación comoiN$/rj-rREF rj-rMOD\
. El histograma acumulativo inverso precalculado obvia la necesidad de construir BLUT utilizando dLUT para cada palabra de código, es decir, que se puede demostrar que /RC / j^ REF <?MOD\iN$/yREFyMOZ)\
. Dadoh(RC),definido como
U(RC) - UiRC),JNS u r o _ ,NS
o v í+i v .donde w5-iNs-\en la tabla 10 se muestra un algoritmo de ejemplo para calcular sus valores.
Tabla 10: Cálculo de histograma de luina acumulativo de reversión
cREF eMODParte de alivio: Denótese como 0 la pérdida de brillo HDR promedio debida a la diferencia en°*y " . En el
paso 535, la dLUT sin formación de bandas para la parte de alivio se puede calcular usandor v’r=> *vyAbriilpara todas las palabras s de código SDR que comienzan en s = como:
En el paso 520, la pérdida de brillo para el contenedorb(0b) se calcula usandoK RC) S?EF y ¿?OD:
y
Parte de recuperación: en esta parte, O puede usarse comopresupuestode brillo objetivo para asignar palabras de código HDR adicionales en una parte derecuperación,es decir, se establece el justo antes de la "parte de alivio" que se usa para compensar la caída de brillo (paso 525) (por ejemplo, véase la figura 6B). Seayel comienzo de esta parte de recuperación, es decir, la palabra de código SDR a partir de la cual se comienza aSMOD
construir° shasta¡3-1. / se determina en función del presupuesto <t>. Generalmente, para un presupuesto mas alto, se necesita un intervalo mas amplio de palabras de codigo para la compensación. SeaJ fr sla fracción del intervalo de palabras de código SDR que se utilizará para la compensación basada en O. La parte derecuperaciónde brillo: [<y>, 3) se construye utilizando un polinomio de primer orden. El término de primer orden se utiliza de forma decreciente. La función decreciente se utiliza considerando que la parte de recuperación debería contribuir con menos palabras de código a medida que se acerca a la parte de alivio del riesgo de formación de bandas. Comience el polinomio desde y con un valor máximo, disminuyendo linealmente a 0 en3-1:
S r D=o0 al{ f i - l - S) S r -(13)
Dado el presupuesto de brillo y la tabla de consulta, primero se obtieneJ?usando interpolación, entoncesy.
r = p - f ; < * z -P)-(14)
Para recuperar la caída del brillo general, el presupuesto debe obedecer a la siguiente ecuación:
Los parámetros ao, ai deben calcularse usando el presupuesto de palabras de código (ver paso 530). Asumiendo que la mitad del presupuesto será consumida por el término constante (ao) y la otra mitad por el término de primer orden (ai), entonces:
?M O D
Usando a o, a1se puede construir° spara la parte derecuperaciónde brillo de acuerdo con la ecuación (13). Un ejemplo de todo el proceso se muestra en la tabla 11.
formación de bandas de oscuros. Debido a este recorte máximo, el brillo puede no preservarse para algunos casos.
La figura 6A representa un ejemplo de una BLUT original (605) y de una BLUT modificada (610) generado de acuerdo con una realización para ajustar potenciales artefactos de formación de bandas en los oscuros.
La figura 6B representa un ejemplo de una BLUT original (615) y de una BLUT modificada (620) generado de acuerdo con una realización para ajustar potenciales artefactos de formación de bandas en los resaltados. En la figura 6B, la región 625 indica el intervalo de recuperación (comenzando eny)y la región 630 denota el intervalo de alivio (comenzando en £).
Como se observa en la figura 2, el proceso 200 aplica algoritmos de alivio de formación de bandas separados en las zonas oscuras y en los resaltados. En una realización, cuando se necesitan ambos pasos, el paso (215) de alivio de la formación de bandas oscuras se aplica antes de aplicar el paso (220) de alivio de los resaltados. De este modo, si se necesitan ambos pasos, el paso 220 se aplica a la BLUT modificada (217) generada por el paso 215 para generar la BLUT 222 modificada. Si se omite el paso 215, entonces el paso 220 se aplica a la BLUT 204 original para generar la BLUT 222 modificada. Si se omite el paso 220, la entrada al paso 225 es la salida del paso 215, BLUT 217, de lo contrario es BLUT 222. En algunas realizaciones, la salida de los bloques de alivio de formación de bandas 215 y 220 puede filtrarse o suavizarse adicionalmente por el bloque 225 para generar la BLUT 227 de salida final. Se pueden encontrar ejemplos de dicho posprocesamiento de BLUT en la solicitud de patente provisional de EE.UU. n° de serie 62/636.388, "Linear Encoder for Image/Video Processing", de N.J. Gadgil y G-M. Su, presentada el 28 de febrero de 2018.
En una realización, el proceso 200 para reducir los artefactos de formación de bandas se realiza en un codificador (por ejemplo, como parte del codificador representado en la figura 1A). En tal escenario, la función 227 de remodelación revertida actualizada (mostrada en la figura 2) reemplazará la generada por el bloque 150, y su representación codificada se enviará en sentido aguas abajo a un decodificador como metadatos 152.
En otra realización, el proceso 200 se puede realizar en un decodificador (por ejemplo, como parte del decodificador representado en la figura 1B). En tal escenario, la entrada 202 de SDR mostrada con referencia a la figura 2 representará la salida 156 de SDR reconstruida, mostrada con referencia a la figura 1B después de la descompresión, y la BLUT 204 de entrada mostrada con referencia a la figura 2 representará la BLUT generada en función de los metadatos (152) de entrada. Después de completar el proceso 200 de la figura 2, la BLUT de entrada será reemplazada por la BLUT 227 modificada, que se usará en el decodificador de la figura 1B en el paso 158 para reconstruir la señal 160 de HDR reconstruida sin formación de bandas.
Ejemplo de implantación de sistema informático
Las realizaciones de la presente invención se pueden implantar con un sistema informático, sistemas configurados en circuitos y componentes electrónicos, un dispositivo de circuito integrado (IC) tal como un microcontrolador, una matriz de puertas programables en campo (FPGA) u otro dispositivo lógico configurable o programable (PLD), un procesador de señales digitales o de tiempo discreto (DSP), un IC de aplicación específica (ASIC) y/o un aparato que incluya uno o más de dichos sistemas, dispositivos o componentes. El ordenador y/o el IC pueden realizar, controlar o ejecutar instrucciones relacionadas con la reducción de artefactos de formación de bandas, como los descritos en el presente documento. El ordenador y/o el IC pueden calcular cualquiera de entre una variedad de parámetros o valores que se relacionan con la reducción de artefactos de formación de bandas como se describe en el presente documento. Las realizaciones de extensión del intervalo dinámico de imagen y vídeo pueden implantarse en hardware, software, firmware y diversas combinaciones de los mismos.
Ciertas implantaciones de la invención comprenden procesadores de ordenador que ejecutan instrucciones de software que hacen que los procesadores realicen un método. Por ejemplo, uno o más procesadores en un dispositivo de exhibición visual, un codificador, un decodificador, un transcodificador o similares pueden implantar métodos de reducción de artefactos de formación de bandas como se describe anteriormente ejecutando instrucciones de software en una memoria de programa accesible a los procesadores. También se puede proporcionar una realización. en forma de producto de programa. El producto del programa puede comprender cualquier medio tangible y no transitorio que transporte un conjunto de señales legibles por ordenador que comprenden instrucciones que, cuando las ejecuta un procesador de datos, hacen que el procesador de datos ejecute un método de una realización de la invención. Los productos de programa de acuerdo con una realización de la invención pueden estar en cualquiera de una amplia variedad de formas tangibles y no transitorias. El producto del programa puede comprender, por ejemplo, medios físicos tales como medios de almacenamiento de datos magnéticos que incluyen disquetes, unidades de disco duro, medios de almacenamiento de datos ópticos que incluyen CD ROM, DVD, medios de almacenamiento de datos electrónicos que incluyen ROM, RAM de flash o similares. Las señales legibles por ordenador en el producto del programa pueden opcionalmente comprimirse o cifrarse.
Cuando se hace referencia anteriormente a un componente (por ejemplo, a un módulo de software, a un procesador, a un conjunto, a un dispositivo, circuito, etc.), a menos que se indique lo contrario, la referencia a ese componente (incluida una referencia a un "medio") debe interpretarse como incluyendo como equivalentes de ese componente cualquier componente que realice la función del componente descrito (por ejemplo, que sea funcionalmente equivalente), incluyéndose componentes que no sean estructuralmente equivalentes a la estructura divulgada que realiza la función en las realizaciones de ejemplo ilustradas de la invención.
Equivalentes, ampliaciones, alternativas y varios
De este modo, se describen realizaciones de ejemplo que se relacionan con la reducción de artefactos de formación de bandas para imágenes HDR. En la memoria descriptiva anterior, se han descrito realizaciones de la presente invención con referencia a numerosos detalles específicos que pueden variar de una implantación a otra. De este modo, el único y exclusivo indicador de lo que es la invención, y lo que los solicitantes pretenden que sea la invención, es el conjunto de reivindicaciones que se expeditan de esta solicitud, en la forma específica en que tales reivindicaciones se expeditan, incluyéndose cualquier corrección posterior. Cualquier definición expresamente establecida en este documento para los términos contenidos en tales reivindicaciones regirá el significado de tales términos tal como se utilizan en las reivindicaciones. Por consiguiente, ningún o ninguna limitación, elemento, propiedad, característica, ventaja o atributo que no esté expresamente mencionado en una reivindicación debe limitar el alcance de tal reivindicación de ninguna manera. Por consiguiente, la memoria descriptiva y los dibujos deben considerarse en un sentido ilustrativo y no restrictivo.
Claims (15)
- REIVINDICACIONES 1. Un método para reducir artefactos de formación de bandas en una imagen objetivo, comprendiendo el método: recibir una función (204) de remodelación revertida monótonamente no decreciente (BLUT) de entrada que mapea palabras de código desde un primer intervalo dinámico a un segundo intervalo dinámico, en donde el segundo intervalo dinámico es igual o mayor que el primer intervalo dinámico; recibir una imagen (202) de entrada en el primer intervalo dinámico; generar (205) datos estadísticos en base a la imagen de entrada y a la función de remodelación revertida de entrada, en el que generar datos estadísticos comprende: calcular desviaciones estándar basadas en contenedores a partir de un histograma de valores de luminancia en la imagen de entrada; para cada grupo de valores de luminancia en el primer intervalo dinámico, calcular un segundo intervalo dinámico normalizado, entre 0 y 1, utilizando la función de remodelación revertida de entrada, y mapear las desviaciones estándar de luminancia basadas en contenedores calculadas desde el primer intervalo dinámico al segundo intervalo dinámico utilizando una ecuación de transferencia estadística en base al segundo intervalo dinámico normalizado calculado y a las desviaciones estándar basadas en contenedores calculadas, para generar estimaciones de valores de desviación estándar de luminancia basados en contenedores en una imagen reconstruida en el segundo intervalo dinámico, en el que la imagen objetivo se genera aplicando la función de remodelación revertida de entrada a la imagen de entrada; dividir el primer intervalo dinámico en contenedores de palabras de código; dividir el primer intervalo dinámico en un intervalo de oscuros y un intervalo de resaltados; calcular (210) valores de riesgo de formación de bandas que representan una probabilidad de tener artefactos de formación de bandas para los contenedores en el intervalo de oscuros y los contenedores en el intervalo de resaltados en base a una diferencia entre un primer valor y un segundo valor, en el que, para cada contenedor de palabras de código, el primer valor es estimar un número menor de palabras de código requeridas para reconstruir convenientemente una imagen en el segundo intervalo dinámico sin formación de bandas, en el que, para cada contenedor de palabras de código, el número menor de palabras de código requeridas para reconstruir convenientemente una imagen en el segundo intervalo dinámico sin formación de bandas es estimado mediante interpolación lineal de datos de mapeo predeterminados con el valor de desviación estándar de luminancia estimado para el contenedor de palabras de código, en el que los datos de mapeo predeterminados mapean la desviación estándar de luminancia y el número inferior de palabras de código para el segundo intervalo dinámico completo, y el segundo valor se calcula como el número de palabras de código en el segundo intervalo dinámico usado para mapear las desviaciones estándar de luminancia basadas en contenedores calculadas en el contenedor; y generar una función de remodelación revertida de salida mediante: ajustar (410) una pendiente de la función de remodelación revertida de entrada para los contenedores de palabras de código en el intervalo de oscuros para el cual la diferencia es positiva, para reducir los artefactos de formación de bandas en el intervalo de oscuros, en donde ajustar la pendiente de la función de remodelación revertida de entrada en el intervalo de oscuros comprende: para cada contenedor en el intervalo de oscuros, si la diferencia para el contenedor es positiva, reducir entonces la pendiente de la función de remodelación revertida de entrada (BLUT), en el que la pendiente de la función de remodelación revertida de entrada (BLUT) se reduce en función de un primer factor multiplicadorcc ■ en el que, el primer factor multiplicador risk multiplica la pendiente de la función de remodelación revertida de entrada en el contenedor, en el quen*Fdenota el número de palabras de código utilizadas en el contenedorb,t: denota una estimación de las palabras de código requeridas en el contenedorbpara evitar la formación deose bandas, yb rdenota el número de palabras de código que se añadirán a t: para reducir el valor de riesgo de formación de bandas en el contenedor de oscuros, y compensar (420) la pendiente de la función de remodelación revertida de entrada para los contenedores en el A “ *c intervalo de oscuros para los cuales la suma de la diferencia con una segunda constante es menor o igual a cero, reasignando las palabras de código restantes en el contenedor en el que la pendiente de la función de remodelación revertida de entrada se ha ajustado a los contenedores para los cuales la suma de la diferencia es menor o igual a cero, en el que la reasignación implica multiplicar la pendiente de la función de remodelación revertida de entrada en el contenedor con un segundo factor multiplicador:jijCW en el quebdenota el número de palabras de código en la imagen de entrada en el contenedorb,t: denota una estimación de las palabras de código requeridas en el contenedorbpara evitar formación de bandas,CMdenota la segunda constante que representa un margen de seguridad de palabras de código añadidas a t: para reducir la formación de bandas en el intervalo de oscuros, yGdenota un valor pequeño constante igual a 1,2; y reemplazar la función de remodelación revertida de entrada con la función de remodelación revertida de salida.
- 2. El método de la reivindicación 1, en el que la imagen de entrada comprende una imagen de intervalo dinámico estándar y la imagen objetivo comprende una imagen de alto intervalo dinámico y/o en el que, si la diferencia en un intervalo completo de la imagen objetivo es positiva, entonces se genera la función de remodelación revertida de salida.
- 3. El método de la reivindicación 1 ó 2, en el que, si la diferencia en un intervalo completo de la imagen objetivo no es positiva, entonces se omite el paso de generar la función de remodelación revertida de salida.
- 4. El método de cualquiera de las reivindicaciones 1 a 3, en el que los valores de luminancia se agrupan en contenedores y las desviaciones estándar se calculan para cada contenedor.
- 5. El método de una cualquiera de las reivindicaciones 1 a 4, en el que calcular las desviaciones estándar de los valores de luminancia en la imagen de entrada comprende: calcular un histograma de valores de luminancia en la imagen de entrada; dividir la imagen de entrada en bloques que no se superpongan; calcular las desviaciones estándar basadas en bloques de los valores de luminancia para uno o más bloques de imágenes; calcular los valores de desviación estándar basados en contenedores para cada contenedor en el primer intervalo dinámico en base a las desviaciones estándar basadas en bloques; calcular los valores de desviación estándar basados en contenedores normalizados para cada contenedor en base al histograma de valores de luminancia y a los valores de desviación estándar basados en contenedores.
- 6. El método de una cualquiera de las reivindicaciones 1 a 4, en el que generar datos estadísticos comprende adicionalmente escalar los valores de desviación estándar basados en contenedores normalizados para convertirlos a un segundo intervalo dinámico completo.
- 7. El método de una cualquiera de las reivindicaciones anteriores, en el que no se realiza ningún ajuste a la pendiente de la función de remodelación revertida (BLUT) de entrada dentro de un contenedor, si la diferencia para el contenedor es negativa y la suma de la diferencia para el contenedor añadida al segundo valor constante es mayor que cero.
- 8. El método de cualquiera de las reivindicaciones anteriores, en el que ajustar la pendiente de la función de remodelación revertida de entrada en el intervalo de resaltados comprende: determinar un valor inicial de un intervalo de alivio dentro del intervalo de resaltados en base al valor más pequeño de contenedor en el intervalo de resaltados con una diferencia positiva; ajustar la pendiente de una función de remodelación revertida (BLUT) existente dentro del intervalo de alivio.
- 9. El método de la reivindicación 8, en el que compensar la pendiente ajustada de la función de remodelación revertida de entrada en el intervalo de resaltados comprende: determinar un valor de pérdida de brillo debido al ajuste de la pendiente de la función de remodelación revertida (BLUT) existente en el intervalo de alivio; determinar un valor inicial para un intervalo de recuperación que abarca contenedores en el primer intervalo dinámico entre el valor inicial del primer intervalo dinámico y el valor inicial del intervalo de alivio; determinar un polinomio para la conservación del brillo en base al valor de pérdida de brillo; y ajustar la pendiente de la función de remodelación revertida (BLUT) existente dentro del intervalo de recuperación en base al polinomio para la conservación del brillo.
- 10. El método de la reivindicación 9, en el que si la pendiente de la función de remodelación revertida de entrada en el intervalo de oscuros no se ajusta, entonces la función de remodelación revertida (BLUT) existente comprende la función (204) de remodelación revertida de entrada; de lo contrario, la función de remodelación revertida existente comprende la función (217) de remodelación revertida de salida generada para los contenedores de palabras de código en el intervalo de oscuros.
- 11. El método de acuerdo con una cualquiera de las reivindicaciones 8 a 10, en el que la función de remodelación revertida (BLUT) existente para un contenedorbdentro del intervalo de alivio se ajusta de acuerdo con el factor añadidodonderb *vdenota una estimación de las palabras de código requeridas en el contenedorbpara evitar formacióntbrill de bandas, % denota una constante que representa un margen de seguridad de palabras de código añadidasPf ZJ1 a5bbnpa rra pe\v/iitta rrffnorrm arc.iiónn rdíea hba n rdlas aen Ilons rreasa lltta rdlon s, yv^ bdenota un valor de intervalo normalizado en el segundo intervalo dinámico correspondiente al contenedorben el primer intervalo dinámico.
- 12. El método de acuerdo con una cualquiera de las reivindicaciones 8 a 10, en el que la función de remodelación revertida (BLUT) existente para palabras de código dentro del intervalo de recuperación se ajusta de acuerdo con el factor añadido ?MOD = a0 cix(P-1 -s) S* donde¡3denota el valor inicial del intervalo de alivio, denota la pendiente de la función de remodelación revertida (BLUT) existente, a0 y a1 son coeficientes polinómicos determinados en base al valor de pérdida de brillo, y s denota una palabra de código dentro del intervalo de recuperación, y opcionalmente en donde la función de remodelación revertida (BLUT) existente se ajusta en el intervalo de recuperación como: para (s =y+1; s <¡3; s +) l rr s MOD =T rjS.M_iOD+. s MOD -<MOD donde denota el valor ajustado de la función de remodelación revertida (BLUT) correspondiente a la palabra de código de entrada s, yydenota el valor inicial del intervalo de recuperación.
- 13. El método de una cualquiera de las reivindicaciones 11 a 12, en el que la función de remodelación revertida (BLUT) existente se ajusta en el intervalo de alivio como: para (s= p l - s < s ^ ;s++) rrMOD rpMOD.<?MOD rjiMOD dondeAsdenota el valor modificado de la función de remodelaclón revertida (BLUT) correspondiente a lahrill palabra de código de entrada s, /3 denota el valor Inicial del Intervalo de alivio, y Amax denota el Intervalo de luminancia máximo en la imagen de entrada.
- 14. Un aparato que comprende un procesador y configurado para realizar uno cualquiera de los métodos enumerados en las reivindicaciones 1-13.
- 15. Un medio de almacenamiento no transitorio legible por ordenador que tiene almacenadas en él instrucciones ejecutables por ordenador para ejecutar con uno o más procesadores un método de acuerdo con cualquiera de las reivindicaciones 1-13.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201862717070P | 2018-08-10 | 2018-08-10 | |
| EP18188468 | 2018-08-10 | ||
| PCT/US2019/045541 WO2020033573A1 (en) | 2018-08-10 | 2019-08-07 | Reducing banding artifacts in hdr imaging via adaptive sdr-to-hdr reshaping functions |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2974520T3 true ES2974520T3 (es) | 2024-06-27 |
Family
ID=67667938
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES19756075T Active ES2974520T3 (es) | 2018-08-10 | 2019-08-07 | Reducción de artefactos de formación de bandas en formación de imagen HDR por mediación de funciones adaptativas de remodelación de SDR a HDR |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US11341624B2 (es) |
| EP (1) | EP3834411B1 (es) |
| JP (1) | JP7049526B2 (es) |
| CN (1) | CN112585969B (es) |
| ES (1) | ES2974520T3 (es) |
| WO (1) | WO2020033573A1 (es) |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11277646B2 (en) | 2018-10-03 | 2022-03-15 | Dolby Laboratories Licensing Corporation | Reducing banding artifacts in backward-compatible HDR imaging |
| JP7249417B2 (ja) | 2018-12-19 | 2023-03-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 適応的スパースフィルタリングを用いた画像のデバンディング |
| EP3734588B1 (en) | 2019-04-30 | 2022-12-07 | Dolby Laboratories Licensing Corp. | Color appearance preservation in video codecs |
| CN116034394A (zh) * | 2020-08-06 | 2023-04-28 | 杜比实验室特许公司 | 假轮廓减轻的自适应流式传输 |
| US11475549B1 (en) * | 2021-06-04 | 2022-10-18 | Nvidia Corporation | High dynamic range image generation from tone mapped standard dynamic range images |
| WO2023069585A1 (en) | 2021-10-21 | 2023-04-27 | Dolby Laboratories Licensing Corporation | Context-based reshaping algorithms for encoding video data |
| CN114363702B (zh) * | 2021-12-28 | 2023-09-08 | 上海网达软件股份有限公司 | Sdr视频转换为hdr视频的方法、装置、设备及存储介质 |
| CN114722330B (zh) * | 2022-03-09 | 2025-07-15 | 西安交通大学 | 基于混合策略sns的盐场蒸发计算方法、系统、终端及介质 |
| US12541832B2 (en) | 2022-12-28 | 2026-02-03 | Samsung Electronics Co., Ltd. | Image-statistics-based de-banding in SDR to HDR conversion |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6081360B2 (ja) | 2010-09-16 | 2017-02-15 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 改善された画像の符号化及び/又は復号のための装置、方法並びに画像データ記憶媒体 |
| PL4421797T3 (pl) | 2011-09-27 | 2025-09-01 | Koninklijke Philips N.V. | Urządzenie i sposób do przekształcenia zakresu dynamiki obrazów |
| PT3324629T (pt) * | 2014-05-28 | 2019-10-08 | Koninklijke Philips Nv | Métodos e aparelhos para codificação de imagens hdr e métodos e aparelhos para utilização de tais imagens codificadas |
| US9747673B2 (en) * | 2014-11-05 | 2017-08-29 | Dolby Laboratories Licensing Corporation | Systems and methods for rectifying image artifacts |
| US10223774B2 (en) | 2016-02-02 | 2019-03-05 | Dolby Laboratories Licensing Corporation | Single-pass and multi-pass-based polynomial approximations for reshaping functions |
| US10032262B2 (en) | 2016-02-02 | 2018-07-24 | Dolby Laboratories Licensing Corporation | Block-based content-adaptive reshaping for high dynamic range images |
| JP6805968B2 (ja) | 2016-08-01 | 2020-12-23 | 株式会社リコー | 画像処理装置、画像投影装置、及び画像処理方法 |
| US10264287B2 (en) | 2016-10-05 | 2019-04-16 | Dolby Laboratories Licensing Corporation | Inverse luma/chroma mappings with histogram transfer and approximation |
| EP3340167A1 (en) | 2016-12-22 | 2018-06-27 | Thomson Licensing | Displaying method for displaying an image on a first display device and at least a portion of the same image on a second display device |
| WO2018231968A1 (en) | 2017-06-16 | 2018-12-20 | Dolby Laboratories Licensing Corporation | Efficient end-to-end single layer inverse display management coding |
| US10609372B2 (en) * | 2017-09-29 | 2020-03-31 | Dolby Laboratories Licensing Corporation | Up-conversion to content adaptive perceptual quantization video signals |
| US11310537B2 (en) | 2018-02-28 | 2022-04-19 | Dolby Laboratories Licensing Corporation | Linear encoder for image/video processing |
-
2019
- 2019-08-07 WO PCT/US2019/045541 patent/WO2020033573A1/en not_active Ceased
- 2019-08-07 EP EP19756075.8A patent/EP3834411B1/en active Active
- 2019-08-07 JP JP2021507041A patent/JP7049526B2/ja active Active
- 2019-08-07 CN CN201980053583.5A patent/CN112585969B/zh active Active
- 2019-08-07 ES ES19756075T patent/ES2974520T3/es active Active
- 2019-08-07 US US17/267,369 patent/US11341624B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| CN112585969B (zh) | 2023-03-28 |
| JP2021524647A (ja) | 2021-09-13 |
| CN112585969A (zh) | 2021-03-30 |
| WO2020033573A1 (en) | 2020-02-13 |
| EP3834411A1 (en) | 2021-06-16 |
| JP7049526B2 (ja) | 2022-04-06 |
| US20210350511A1 (en) | 2021-11-11 |
| EP3834411B1 (en) | 2024-02-14 |
| US11341624B2 (en) | 2022-05-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2974520T3 (es) | Reducción de artefactos de formación de bandas en formación de imagen HDR por mediación de funciones adaptativas de remodelación de SDR a HDR | |
| JP7246542B2 (ja) | 異なる表示機能の間で知覚ルミナンス非線形性ベースの画像データ交換を改善する装置および方法 | |
| JP6181259B2 (ja) | エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成 | |
| EP3203442B1 (en) | Block-based content-adaptive reshaping for high dynamic range images | |
| CN110301134A (zh) | 整合的图像整形和视频编码 | |
| CN113016182B (zh) | 减少后向兼容hdr成像中的条带伪影 | |
| JP2019530309A (ja) | シングルレイヤー後方互換性コーデックのリアルタイム再構成 | |
| EP3200457B1 (en) | Content-adaptive reshaping for high dynamic range images | |
| CN113170205A (zh) | 整形函数的插值 | |
| WO2018044803A1 (en) | Real-time reshaping of single-layer backwards-compatible codec | |
| CN114747224B (zh) | 一种用于生成整形函数的方法、装置以及存储介质 | |
| KR101818900B1 (ko) | 향상된 동적 범위를 갖는 신호들에 대한 계층간 예측 | |
| US10742986B2 (en) | High dynamic range color conversion correction | |
| US10715772B2 (en) | High dynamic range color conversion correction | |
| HK1217393B (zh) | 用於增强动态范围信号的分层编码的自适应整形 |