ES3020385T3 - Video coding and decoding with marking of a picture as non-reference picture or reference picture - Google Patents

Video coding and decoding with marking of a picture as non-reference picture or reference picture Download PDF

Info

Publication number
ES3020385T3
ES3020385T3 ES19183291T ES19183291T ES3020385T3 ES 3020385 T3 ES3020385 T3 ES 3020385T3 ES 19183291 T ES19183291 T ES 19183291T ES 19183291 T ES19183291 T ES 19183291T ES 3020385 T3 ES3020385 T3 ES 3020385T3
Authority
ES
Spain
Prior art keywords
picture
layer
information
flag
reference picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19183291T
Other languages
English (en)
Inventor
Jung Won Kang
Ha Hyun Lee
Jin Soo Choi
Jin Woong Kim
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=49635785&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES3020385(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Application granted granted Critical
Publication of ES3020385T3 publication Critical patent/ES3020385T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Control Of El Displays (AREA)

Abstract

La presente invención se refiere a un método de decodificación de información de imagen. Este método incluye la recepción de un flujo de bits que incluye una unidad de capa de abstracción de red (NAL) con información relacionada con una imagen codificada, y el análisis de la cabecera de la unidad NAL. Esta cabecera puede no incluir información de bandera de 1 bit que indique si una imagen es una imagen de referencia o no de referencia en todo el flujo de bits durante la codificación. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Codificación y decodificación de vídeo con marcado de una imagen como imagen no de referencia o imagen de referencia
Campo técnico
La presente invención se refiere al procesamiento de codificación y decodificación de vídeo y, más en particular, a un método y un aparato para decodificar información de vídeo dentro de un tren de bits.
Antecedentes
Según se extiende y se ofrece a escala nacional y a escala mundial la radiodifusión de alta definición (HD, por sus siglas en inglés), muchos usuarios se están acostumbrando al vídeo de alta resolución y alta SNR (relación señalruido). Por consiguiente, muchas organizaciones han realizado numerosos intentos de desarrollar los dispositivos de vídeo de próxima generación. Además, dado que hay un interés creciente en la ultra alta definición (UHD, por sus siglas en inglés) con una resolución 4 veces mayor que la HDTV junto con la HDTV, existe la necesidad de una tecnología en la que se comprima y se procese un vídeo con una mayor resolución y una mayor SNR.
Para comprimir un vídeo, pueden utilizarse una tecnología de interpredicción, en la que un valor de un píxel incluido en una imagen actual se predice a partir de imágenes anteriores y/o posteriores en el tiempo, una tecnología de intrapredicción, en la que un valor de un píxel incluido en una imagen actual se predice utilizando información sobre un píxel incluido en la imagen actual, una tecnología de codificación entrópica, en la que se asigna un código corto a un símbolo que tiene una alta frecuencia de aparición y se asigna un código largo a un símbolo que tiene una baja frecuencia de aparición, etc.
La tecnología de compresión de vídeo incluye tecnología en la que se proporciona un ancho de banda de red específico en el entorno de funcionamiento limitado delhardwaresin tener en cuenta un entorno de red flexible. Sin embargo, para comprimir datos de vídeo aplicados a un entorno de red que incluya un ancho de banda que varíe con frecuencia, es necesaria una nueva tecnología de compresión. Con este fin puede utilizarse un método de codificación/decodificación de vídeo escalable.
El documento WO 2007/ 042914 A1 describe un método de gestión de una memoria intermedia de imagen decodificada para codificación de vídeo escalable. El método el documento WO 2007/ 042914 A1 comprende recibir una primera imagen decodificada que pertenece a una primera capa en un tren de bits en la memoria intermedia de imagen decodificada, recibir una segunda imagen decodificada que pertenece a una segunda capa; determinar si la primera imagen decodificada es requerida para la referencia de predicción intercapa a la luz de la recepción de la segunda imagen decodificada; y si la primera imagen decodificada ya no es requerida para referencia de predicción intercapa, la referencia de interpredicción y la salida futura, retirar la primera imagen decodificada de la memoria intermedia de imagen decodificada. El documento KR 2008 0007086 A describe un método y un aparato para decodificar/codificar señales de vidrio proporcionadas para realizar la codificación más eficiente cuando se codifica separadamente una imagen de ancla y una imagen de no ancla de acuerdo con la información de identificación de imagen de ancla debido a que la dependencia y intervista entre la imagen de ancla y la imagen que no ancla son diferentes entre sí. Un método de decodificación de señal del video del documento KR 20080007086 A comprende las etapas de obtener información de indicación que indica si una señal de vídeo es un tren de bits codificado de vídeo multivista; si es así, obtener información de identificación que indica si una imagen codificada de una capa de abstracción de red (NAL por sus siglas en inglés) es una imagen de ancla o no; e información de decodificación acerca del vídeo multivista de acuerdo con la información de identificación. H. SCHWARZ ET AL, "Overview of the Scalable Video Coding Extension of the H.264/AVC Standard", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, INSTITUTE OF ELECTRICAL AND ELECTRONICS ENGINEERS, US, vol. 17, no. 9, 1 septiembre de 2007 (2007-09-01), páginas 1103-1120, doi: 10.1109/TCSVT.2007.905532 proporciona una visión general de los conceptos básicos para extender H.264/AVC hacia SVC. Las herramientas básicas para proporcionar escalabilidad temporal, espacial, y de calidad también se describen y analizan experimentalmente en ese documento con respecto a su eficiencia y complejidad.
R. SJOBERG ET AL, "Overview of HEVC high-level syntax and reference picture management", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, vol. 22, no. 12, 5 octubre de 2012 (2012-10-05), páginas 1-14, doi: 10.1109/TCSVT.2012.2223052 presenta una visión general de la sintaxis de alto nivel HEVC, que incluye encabezamientos de unidad de capa de abstracción de red, conjuntos de parámetros, esquemas de partición de imagen, gestión de imagen de referencia, y mensajes de información de mejora complementaria.
El documento WO 2012/122176 A1 describe técnicas que se refieren generalmente a la gestión de la memoria intermedia de imagen decodificada. Una o más imágenes almacenadas en la memoria intermedia de imagen decodificada el documento WO 2012/122176 A1 se pueden utilizar para la predicción, y otras no. Las imágenes que son utilizables para la predicción ser pueden denominar como imágenes de referencia. Las técnicas a modo de ejemplo descritas en el documento WO 2012/122176 A1 pueden determinar si una imagen de referencia, que está actualmente indicada para ser utilizable para interpredicción, debería ser indicada como que no es utilizable para interpredicción.
Divulgación
Problema técnico
Un objetivo de la presente invención es proporcionar un método y un aparato para describir información de extracción y escalabilidad dentro de trenes de bits en capas.
Otro objetivo de la presente invención es proporcionar un método y un aparato para representar información de escalabilidad sobre el uso de diversos trenes de bits de una manera flexible.
Otro objetivo más de la presente invención es proporcionar un método y un aparato para proporcionar información de extracción y escalabilidad dentro de un tren de bits en capas, de manera que la información de extracción y escalabilidad pueda transformarse de forma adaptativa en un nivel de paquete.
Solución técnica
De acuerdo con un primer aspecto de la presente invención se proporciona un aparato de decodificación de vídeo como se expone en la reivindicación independiente 1. De acuerdo con un segundo aspecto de la presente invención se proporciona un aparato de codificación de vídeo como se expone en las reivindicación independiente 2.; Efectos ventajosos
De acuerdo con una realización de la presente invención, pueden proporcionarse un método y un aparato para describir información de extracción y escalabilidad dentro de trenes de bits en capas.
De acuerdo con una realización de la presente invención, pueden proporcionarse un método y un aparato para representar información de escalabilidad sobre el uso de diversos trenes de bits de una manera flexible.
De acuerdo con otra realización de la presente invención, pueden proporcionarse un método y un aparato para proporcionar información de extracción y escalabilidad dentro de trenes de bits en capas, de manera que la información de extracción y escalabilidad pueda transformarse de forma adaptativa en un nivel de paquete.Descripción de los dibujos
La Figura 1 es un diagrama de bloques que muestra un ejemplo de una estructura de un aparato de codificación de vídeo según una realización ejemplar;
la Figura 2 es un diagrama de bloques que muestra un ejemplo de una estructura de un aparato de decodificación de vídeo según una realización ejemplar;
la Figura 3 es un diagrama conceptual que muestra esquemáticamente una realización ejemplar de una estructura de codificación de vídeo escalable (SVC, por sus siglas en inglés) que utiliza múltiples capas a la que puede aplicarse la presente invención;
la Figura 4 es un diagrama de flujo de control que ilustra un método de codificación de información de vídeo de acuerdo con la presente invención; y
la Figura 5 es un diagrama de flujo de control que ilustra un método de decodificación de información de vídeo de acuerdo con la presente invención.
Modo para la invención
Se describen en detalle con referencia a los dibujos adjuntos algunas realizaciones ejemplares de la presente invención. Sin embargo, al describir las realizaciones de esta especificación, se omitirá una descripción detallada de funciones y constituciones muy conocidas si se considera que hará innecesariamente impreciso lo esencial de la presente invención.
En esta especificación, cuando se diga que un elemento está ‘conectado’ o ‘acoplado’ al otro elemento, puede significar que dicho elemento puede estar directamente conectado o acoplado al otro elemento o que un tercer elemento puede estar ‘conectado’ o ‘acoplado’ entre los dos elementos. Además, en esta especificación, cuando se diga que un elemento específico está ‘incluido’, puede significar que no estén excluidos elementos que no sean el elemento específico y que pueden estar incluidos elementos adicionales en las realizaciones ejemplares de la presente invención o el alcance técnico de la presente invención.
Pueden utilizarse términos, tales como el primer y el segundo, para describir diversos elementos, pero los elementos no están restringidos por los términos. Los términos se utilizan sólo para distinguir un elemento de otro elemento. Por ejemplo, un primer elemento puede denominarse segundo elemento sin apartarse del alcance de la presente invención. Asimismo, un segundo elemento puede denominarse primer elemento.
Además, las unidades de elemento descritas en las realizaciones ejemplares de la presente invención se muestran independientemente para indicar una diferencia y funciones características, y esto no significa que cada una de las unidades de elemento esté formada por una parte dehardwareseparado o una parte desoftware.Es decir que las unidades de elemento están dispuestas e incluidas para mayor comodidad de descripción, y al menos dos de las unidades de elemento pueden formar una unidad de elemento, o un elemento puede dividirse en una pluralidad de unidades de elemento y la pluralidad de unidades de elemento dividido pueden realizar funciones. En el alcance de la presente invención se incluye también una realización en la que los elementos estén integrados o realizaciones de las que se hayan separado algunos elementos, a no ser que éstas se aparten de la esencia de la presente invención.
Además, en la presente invención, algunos elementos no son elementos esenciales para realizar funciones esenciales, sino que pueden ser elementos opcionales para mejorar sólo el rendimiento. La presente invención puede implementarse utilizando sólo elementos esenciales para implementar la esencia de la presente invención que no sean elementos utilizados para mejorar sólo el rendimiento, y en el alcance de la presente invención se incluye una estructura que incluya sólo elementos esenciales que no sean elementos opcionales utilizados para mejorar sólo el rendimiento.
La Figura 1 es un diagrama de bloques que muestra un ejemplo de una estructura de un aparato de codificación de vídeo según una realización ejemplar. Un método o aparato de codificación/decodificación de vídeo escalable puede implementarse mediante una ampliación de un método o aparato de codificación/decodificación de vídeo común que no proporcione escalabilidad. El diagrama de bloques de la Figura 1 muestra una realización ejemplar de un aparato de codificación de vídeo que puede convertirse en una base para un aparato de codificación de vídeo escalable.
Remitiéndonos a la Figura 1, el aparato 100 de codificación de vídeo incluye un módulo 111 de predicción de movimiento, un módulo 112 de compensación de movimiento, un módulo 120 de intrapredicción, un conmutador 115, un substractor 125, un módulo 130 de transformación, un módulo 140 de cuantificación, un módulo 150 de codificación entrópica, un módulo 160 de descuantificación, un módulo 170 de transformación inversa, un sumador 175, un filtro 180 y una memoria intermedia 190 de imágenes de referencia.
El aparato 100 de codificación de vídeo puede realizar una codificación en una imagen de entrada en intramodo o intermodo y dar salida a un tren de bits como resultado de la codificación. En esta especificación, intrapredicción tiene el mismo significado que predicción intraimagen, e interpredicción tiene el mismo significado que predicción interimagen. En el caso del intramodo, el conmutador 115 puede conmutar a intramodo. En el caso del intermodo, el conmutador 115 puede conmutar a intermodo. El aparato 100 de codificación de vídeo puede generar un bloque predicho para el bloque de entrada de una imagen de entrada y luego codificar el remanente entre el bloque de entrada y el bloque predicho.
En el caso del intramodo, el módulo 120 de intrapredicción puede generar el bloque predicho realizando una predicción espacial utilizando valores de píxel de bloques cercanos, a un bloque actual, que ya estén codificados.
En el caso del intermodo, el módulo 111 de predicción de movimiento puede obtener un vector de movimiento buscando en una imagen de referencia, almacenada en la memoria intermedia 190 de imágenes de referencia, una zona que sea la más coincidente con el bloque de entrada en un proceso de estimación de movimiento. El módulo 112 de compensación de movimiento puede generar el bloque predicho realizando una compensación de movimiento utilizando el vector de movimiento y la imagen de referencia almacenada en la memoria intermedia 190 de imágenes de referencia.
El substractor 125 puede generar un bloque remanente sobre la base del remanente entre el bloque de entrada y el bloque predicho generado. El módulo 130 de transformación puede realizar una transformación en el bloque remanente y dar salida a un coeficiente de transformación según el bloque transformado. Además, el módulo 140 de cuantificación puede dar salida a un coeficiente cuantificado, cuantificando el coeficiente de transformación recibido utilizando un parámetro de cuantificación y/o una matriz de cuantificación.
El módulo 150 de codificación entrópica puede realizar una codificación entrópica en símbolos según una distribución de probabilidad sobre la base de valores calculados por el módulo 140 de cuantificación o valores de parámetro de codificación calculados en un proceso de codificación y dar salida a un tren de bits como resultado de la codificación entrópica. El método de codificación entrópica es un método para recibir símbolos que tienen diversos valores y representar los símbolos en forma de una cadena de números binarios decodificables eliminando al mismo tiempo la redundancia estadística de los símbolos.
Aquí, el símbolo se refiere a un elemento de sintaxis y un parámetro de codificación que se ha de codificar o decodificar, un valor de una señal remanente, etc. El parámetro de codificación es un parámetro necesario para la codificación y decodificación. El parámetro de codificación puede incluir no sólo información codificada mediante un codificador y luego comunicada a un decodificador junto con un elemento de sintaxis, sino también información que puede inducirse en un proceso de codificación o decodificación. El parámetro de codificación significa información necesaria para codificar o decodificar vídeo. El parámetro de codificación puede incluir, por ejemplo, un valor o estadísticas de modo intrapredicción/interpredicción, un vector de movimiento, un índice de imagen de referencia, un patrón de bloque de codificación, información sobre si está presente o no una señal remanente, un coeficiente de transformación, un coeficiente de transformación cuantificado, un parámetro de cuantificación, un tamaño de bloque, e información de división de bloque.
Además, la señal remanente puede significar una diferencia entre la señal original y una señal predicha. Además, la señal remanente puede significar una señal obtenida transformando una diferencia entre la señal original y una señal predicha o una señal obtenida transformando y cuantificando una diferencia entre la señal original y una señal predicha. La señal remanente puede denominarse bloque remanente en una unidad de bloque.
Si se utiliza codificación entrópica, el tamaño de un tren de bits para un símbolo que se haya de codificar puede reducirse, porque el símbolo se representa asignando un número pequeño de bits a un símbolo que tenga una alta frecuencia de aparición y un número grande de bits a un símbolo que tenga una baja frecuencia de aparición. Por consiguiente, mediante la codificación entrópica es posible mejorar el rendimiento de compresión de la codificación de vídeo.
Para la codificación entrópica pueden utilizarse métodos tales como Golomb exponencial, codificación de longitud variable adaptativa según el contexto (CAVLC, por sus siglas en inglés) y codificación aritmética binaria adaptativa según el contexto (CABAC, por sus siglas en inglés). Por ejemplo, en el módulo 150 de codificación entrópica puede estar almacenada una tabla para realizar una codificación entrópica, tal como una tabla de codificación/código de longitud variable (VLC, por sus siglas en inglés), y el módulo 150 de codificación entrópica puede realizar una codificación entrópica utilizando la tabla VLC almacenada. Además, el módulo 150 de codificación entrópica puede obtener un método de binarización para un símbolo objetivo y un modelo de probabilidad para unbin/símboloobjetivo y realizar una codificación entrópica utilizando el método de binarización o el modelo de probabilidad obtenido.
El coeficiente cuantificado se descuantifica mediante el módulo 160 de descuantificación y luego se transforma inversamente mediante el módulo 170 de transformación inversa. El coeficiente descuantificado e inversamente transformado puede sumarse al bloque predicho a través del sumador 175, generando así un bloque reconstruido.
El bloque reconstruido experimenta el filtro 180. El filtro 180 puede aplicar al bloque reconstruido o a la imagen reconstruida uno o más de los siguientes: un filtro de desbloqueo, una compensación adaptativa de muestra (SAO, por sus siglas en inglés) y un filtro de bucle adaptativo (ALF, por sus siglas en inglés). El bloque reconstruido que ha experimentado el filtro 180 puede almacenarse en la memoria intermedia 190 de imágenes de referencia.
La Figura 2 es un diagrama de bloques que muestra un ejemplo de una estructura de un aparato de decodificación de vídeo según una realización ejemplar. Como se ha descrito anteriormente con referencia a la Figura 1, un método o aparato de codificación/decodificación de vídeo escalable puede implementarse mediante una ampliación de un método o aparato de codificación/decodificación común que no proporcione escalabilidad. El diagrama de bloques de la Figura 2 muestra una realización ejemplar de un aparato de decodificación de vídeo que puede convertirse en una base para un aparato de decodificación de vídeo escalable.
Remitiéndonos a la Figura 2, el aparato 200 de decodificación de vídeo incluye un módulo 210 de decodificación entrópica, un módulo 220 de cuantificación inversa, un módulo 230 de transformación inversa, un módulo 240 de intrapredicción, un módulo 250 de compensación de movimiento, un filtro 260 y una memoria intermedia 270 de imágenes de referencia.
El aparato 200 de decodificación de vídeo puede recibir un tren de bits que haya salido de un codificador, realizar una decodificación del tren de bits en un intramodo o intermodo y dar salida a una imagen reconstruida, es decir una imagen reconstruida. En el caso del intramodo, un conmutador puede conmutar a intramodo. En el caso del intermodo, el conmutador puede conmutar a intermodo. El aparato 200 de decodificación de vídeo puede obtener un bloque remanente reconstruido del tren de bits recibido, generar un bloque predicho y luego generar un bloque reconstruido, es decir un bloque reconstruido sumando el bloque remanente reconstruido al bloque predicho.
El módulo 210 de decodificación entrópica puede generar símbolos que incluyen un símbolo que tiene forma de un coeficiente cuantificado, realizando una decodificación entrópica en el tren de bits recibido según una distribución de probabilidad. El método de decodificación entrópica es un método para recibir una cadena de números binarios y generar cada símbolo utilizando la cadena de números binarios. El método de decodificación entrópica es similar al método de codificación entrópica descrito anteriormente.
El coeficiente cuantificado se descuantifica mediante el módulo 220 de cuantificación inversa y se transforma inversamente mediante el módulo 230 de transformación inversa. Como resultado de la descuantificación/transformación inversa del coeficiente cuantificado puede generarse un bloque remanente.
En el caso del intramodo, el módulo 240 de intrapredicción puede generar un bloque predicho realizando una predicción espacial utilizando valores de píxel de bloques ya decodificados cercanos al bloque actual. En el caso del intermodo, el módulo 250 de compensación de movimiento puede generar un bloque predicho realizando una compensación de movimiento utilizando un vector de movimiento y una imagen de referencia almacenada en la memoria intermedia 270 de imágenes de referencia.
El bloque remanente y el bloque predicho se suman mediante un sumador 255. El bloque sumado experimenta el filtro 260. El filtro 260 puede aplicar al bloque reconstruido o a la imagen reconstruida al menos uno de los siguientes: un filtro de desbloqueo, una SAO y un ALF. El filtro 260 da salida a una imagen reconstruida, es decir una imagen reconstruida. La imagen reconstruida puede almacenarse en la memoria intermedia 270 de imágenes de referencia y puede utilizarse para una predicción intertrama.
De entre el módulo 210 de decodificación entrópica, el módulo 220 de cuantificación inversa, el módulo 230 de transformación inversa, el módulo 240 de intrapredicción, el módulo 250 de compensación de movimiento, el filtro 260 y la memoria intermedia 270 de imágenes de referencia incluidos en el aparato 200 de decodificación de vídeo, los elementos directamente relacionados con la decodificación de vídeo, por ejemplo el módulo 210 de decodificación entrópica, el módulo 220 de cuantificación inversa, el módulo 230 de transformación inversa, el módulo 240 de intrapredicción, el módulo 250 de compensación de movimiento y el filtro 260, pueden representarse como un módulo de decodificación con el fin de distinguirlos de otros elementos.
Además, el aparato 200 de decodificación de vídeo puede incluir adicionalmente un módulo de análisis sintáctico (no mostrado) para analizar sintácticamente información relacionada con vídeo codificado incluida en un tren de bits. El módulo de análisis sintáctico puede incluir el módulo 210 de decodificación entrópica, o el módulo de análisis sintáctico puede estar incluido en el módulo 210 de decodificación entrópica. El módulo de análisis sintáctico puede representarse como uno de los elementos del módulo de decodificación.
La Figura 3 es un diagrama conceptual que muestra esquemáticamente una realización ejemplar de una estructura de codificación de vídeo escalable (SVC) que utiliza múltiples capas a la que puede aplicarse la presente invención. En la Figura 3, las siglas GOP(Group of Picture)indican un grupo de imágenes.
Para enviar datos de vídeo es necesario un medio de transmisión, y un medio de transmisión tiene un rendimiento diferente dependiendo de diversos entornos de red. Para aplicaciones a los diversos medios de transmisión o entornos de red, puede emplearse un método de codificación de vídeo escalable (SVC).
El método SVC es un método de codificación para mejorar el rendimiento de codificación/decodificación eliminando la redundancia entre capas utilizando información de textura, información de movimiento, una señal remanente, etc. entre las capas. El método SVC puede proporcionar diversas escalabilidades desde los puntos de vista espacial, temporal y de relación señal-ruido (SNR) dependiendo de las condiciones circundantes, tales como una velocidad de transmisión de bits, una tasa de errores de transmisión y los recursos del sistema.
La SVC puede realizarse utilizando una estructura multicapa, de manera que pueda proporcionarse un tren de bits aplicable a diversas condiciones de red. Por ejemplo, una estructura de SVC puede incluir una capa base cuyos datos de vídeo puedan comprimirse y procesarse utilizando un método de codificación de vídeo común y puede incluir una capa de mejora cuyos datos de vídeo puedan comprimirse y procesarse utilizando tanto información de codificación de la capa base como un método de codificación de vídeo común.
Aquí, una capa significa un conjunto de imágenes y trenes de bits clasificados sobre la base de una resolución espacial (por ejemplo un tamaño de imagen), una resolución temporal (por ejemplo orden de codificación, orden de salida de las imágenes y una frecuencia de imagen), SNR y complejidad. Además, la capa base puede significar una capa de referencia, y la capa de mejora puede significar una capa de mejora. Además, múltiples capas pueden tener dependencia entre sí.
Remitiéndonos a la Figura 3, por ejemplo, una capa base puede estar definida por una definición estándar (SD, por sus siglas en inglés), una frecuencia de imagen de 15 Hz y una velocidad de transmisión de bits de 1 Mbps. Una primera capa de mejora puede estar definida por una alta definición (HD), una frecuencia de imagen de 30 Hz y una velocidad de transmisión de bits de 3,9 Mbps. Una segunda capa de mejora puede estar definida por una ultra alta definición (UHD) 4K, una frecuencia de imagen de 60 Hz y una velocidad de transmisión de bits de 27,2 Mbps. Un formato, una frecuencia de imagen, una velocidad de transmisión de bits, etc. son sólo realizaciones ejemplares y pueden estar determinados de un modo diferente si es necesario. Además, el número de capas utilizado no está limitado a la presente realización ejemplar y puede estar determinado de un modo diferente según las circunstancias.
Por ejemplo, si un ancho de banda de transmisión es de 4 Mbps, la frecuencia de imagen de la primera capa HD de mejora puede reducirse a menos de 15 Hz. El método SVC puede proporcionar escalabilidades temporales, espaciales y de SNR según el método descrito anteriormente en relación con la realización ejemplar de la Figura 3.
SVC tiene el mismo significado que codificación de vídeo escalable desde el punto de vista de la codificación y tiene el mismo significado que decodificación de vídeo escalable desde el punto de vista de la decodificación.
Como se ha descrito anteriormente, la escalabilidad se ha convertido actualmente en una importante función de un formato de vídeo debido a las redes de comunicación heterogéneas y a una diversidad de terminales. La SVC, es decir un estándar de ampliación de la codificación de vídeo avanzada (AVC, por sus siglas en inglés), se desarrolló para generar un tren de bits que tuviera una amplia gama de velocidades de transmisión de bits, manteniendo al mismo tiempo el máximo grado de eficacia de compresión. Para satisfacer las características y los cambios de diversos dispositivos y redes, un tren de bits SVC puede extraerse fácilmente de diversas formas. Es decir que el estándar SVC proporciona escalabilidad espacial, temporal y de SNR.
Entretanto, un tren de bits que incluye múltiples capas consta de unidades de capa de abstracción de red (NAL) que permiten el transporte adaptativo de vídeo a través de una red con conmutación de paquetes. Como en una multicapa, una relación entre una pluralidad de vistas en una codificación de vídeo multivista que incluya una pluralidad de vídeos multivista dentro de un tren de bits es similar a una relación entre capas espaciales en vídeo que soporte múltiples capas.
Para transformar un tren de bits eficazmente y eficientemente en todos los nodos en una ruta de distribución de contenido, la información de escalabilidad sobre el tren de bits es muy importante. En un estándar actual para la codificación de vídeo para una sola capa (es decir codificación de vídeo de alta eficiencia), en un encabezamiento de unidad de NAL (denominada en lo que sigue ‘NALU’) están presentes dos campos relacionados con la información de capa, es decir temporal_id y reserved_one_5bits. El campo ‘temporal_id’, que tiene una longitud de 3 bits, indica la capa temporal de un tren de bits de vídeo, y el campo ‘reserved_one_5bits’ corresponde a un área para indicar otra información de capa subsiguiente.
La capa temporal significa la capa de un tren de bits temporalmente escalable que incluye una NALU de capa de codificación de vídeo (VCL, por sus siglas en inglés), y la capa temporal tiene un valor temporal_id específico.
La presente invención se refiere a un método para describir eficazmente información de extracción e información de escalabilidad sobre una imagen dentro de un tren de bits que soporta múltiples capas y señalizar la información de extracción y la información de escalabilidad, y a un aparato para implementar el método.
En la presente invención, un tren de bits está dividido en dos tipos: un tipo base que soporta sólo escalabilidad temporal y un tipo ampliado capaz de tener escalabilidad que soporta espacial/SNR/multivista.
El primer tipo de tren de bits se refiere a un tren de bits que soporta un vídeo de una sola capa, y el segundo tipo del mismo se refiere a una capa de mejora en una codificación de vídeo en capas basada en HEVC. A continuación, se propone un método mejorado para representar información de escalabilidad sobre los dos tipos de tren de bits. De acuerdo con la presente invención, en el tipo ampliado, puede utilizarse ‘reserved_one_5bits’ de 5 bits como layer_id indicativo del identificador de una capa escalable.
Eliminación de nal_ref_flag del encabezamiento NALU
nal_ref_flag se utiliza para indicar una imagen no de referencia. Esta información indica una prioridad aproximada entre una imagen no de referencia y una imagen de referencia, pero el uso de nal_ref_flag está algo limitado.
Una imagen de referencia significa una imagen que incluye muestras que pueden utilizarse para una predicción interimagen cuando se decodifican imágenes subsiguientes en el orden de decodificación.
Una imagen no de referencia significa una imagen que incluye muestras no utilizadas para la predicción interimagen cuando se decodifican imágenes subsiguientes en el orden de decodificación.
nal_ref_flag es un indicativo de etiqueta de información que indica si una NALU correspondiente es una imagen no de referencia o una imagen de referencia en la totalidad del tren de bits en el momento de la codificación.
Cuando un valor de nal_ref_flag es 1, una NALU significa que incluye un conjunto de parámetros de secuencia (SPS, por sus siglas en inglés), un conjunto de parámetros de imagen (PPS, por sus siglas en inglés), un conjunto de parámetros de adaptación (APS, por sus siglas en inglés), o la porción(slice)de una imagen de referencia. Cuando un valor de nal_ref_flag es 0, una NALU significa que incluye una porción que incluye parte o la totalidad de la imagen no de referencia.
Aquí, una NALU en la que un valor de nal_ref_flag sea 1 puede incluir la porción de una imagen de referencia. nal_ref_flag tiene un valor de 1 para las NALU de un conjunto de parámetros de vídeo (VPS, por sus siglas en inglés), un conjunto de parámetros de secuencia (SPS) o un conjunto de parámetros de imagen (PPS). Si un valor de nal_ref_flag es 0 en una de las NALU de VCL de una imagen específica, nal_ref_flag tiene un valor de 0 para todas las NALU de VCL de la imagen.
Entretanto, si se extraen todas las imágenes de no referencia, en particular imágenes de no referencia correspondientes principalmente a la capa temporal superior, el nal_ref_flag de todas las imágenes restantes después de la extracción adopta el valor 1.
Sin embargo, algunas imágenes de un tren de bits transformado de manera adaptativa, es decir imágenes correspondientes a la capa temporal superior en los trenes de bits restantes, pasan a ser imágenes de no referencia aunque un valor de nal_ref_flag sea 1.
En otras palabras, otro elemento de sintaxis (por ejemplo temporal_id) de un encabezamiento de NALU puede ser más eficaz a la hora de soportar una transformación adaptativa (o extracción). Es decir que un tren de bits que incluya una capa temporal deseada puede extraerse utilizando el número total de capas temporales que incluyan un tren de bits y un valor de temporal_id de un encabezamiento de NALU.
Además, nal_ref_flag también puede utilizarse para indicar si una imagen correspondiente se utilizará o no posteriormente como imagen de referencia a la hora de decodificar (reconstruir) una imagen formada por una NALU que incluya nal_ref_flag y luego almacenar la imagen decodificada en una memoria, tal como una memoria intermedia de imágenes decodificadas (DPB, por sus siglas en inglés). Si el valor de nal_ref_flag es 1, indica que una imagen correspondiente se utilizará posteriormente como imagen de referencia. Si el valor de nal_ref_flag es 0, indica que una imagen correspondiente no se utilizará posteriormente como imagen de referencia.
Una imagen decodificada puede indicarse como una imagen de referencia a la hora de almacenar la imagen decodificada en la DPB sin determinar si una NALU correspondiente es o no una imagen de no referencia o una imagen de referencia sobre la base de nal_ref_flag. En este caso, aunque la imagen decodificada sea una imagen de no referencia, pero esté indicada como una imagen de referencia, no hay problema alguno porque la imagen correspondiente no se incluirá en la lista de imágenes de referencia entregada en el encabezamiento de porción de una imagen siguiente a la hora de decodificar la imagen siguiente a la imagen correspondiente en el orden de decodificación.
Es decir que el que una imagen previamente decodificada sea o no una imagen de referencia o una imagen de no referencia se indica sobre la base de la lista de imágenes de referencia incluida en el encabezamiento de porción de una imagen siguiente, a la hora de decodificar la imagen siguiente. Por consiguiente, no hay problema alguno en determinar si una imagen decodificada es o no una imagen de referencia o una imagen de no referencia, aunque la imagen decodificada se indique como la imagen de referencia sin tener en cuenta nal_ref_flag.
La presente invención propone que se borre nal_ref_flag de un encabezamiento de NALU o que se cambie la semántica de nal_ref_flag. Una realización relacionada con el borrado de nal_ref_flag es como se indica a continuación.
Realización 1
La etiqueta ‘nal_ref_flag’ se cambia a slice_ref_flag, y la posición de la etiqueta se mueve de un encabezamiento de NALU a un encabezamiento de porción. La sintaxis del encabezamiento de porción puede modificarse como en la Tabla 1.
Tabla 1
En la Tabla 1, cuando un valor de slice_ref_flag es 1, indica que una porción es parte de una imagen de referencia. Cuando un valor de slice_ref_flag es 0, indica que la porción es parte de una imagen de no referencia.
Realización 2
La etiqueta ‘nal_ref_flag’ se cambia a au_ref_flag, y la posición de la etiqueta se mueve de un encabezamiento de NALU a un delimitador de unidad de acceso. La sintaxis del delimitador de unidad de acceso puede ser la misma que en la Tabla 2.
Tabla 2
access_unit_delimiter_rbsp() {Descriptor
}
En la Tabla 2, cuando un valor de au_ref_flag es 1, indica que una unidad de acceso incluye una imagen de referencia. Cuando un valor de au_ref_flag es 0, indica que una unidad de acceso incluye una imagen de no referencia.
Realización 3
No se mueve nal_ref_flag a otra sintaxis, pero se borra nal_ref_flag de un encabezamiento de NALU.
Si se borra nal_ref_flag, es decir la información de etiqueta de 1 bit que indica si una imagen es una imagen no de referencia o una imagen de referencia en la totalidad del tren de bits a la hora de decodificar la imagen, puede realizarse una determinación de si una imagen es o no una imagen de referencia a través de nal_ref_flag a través de otro proceso. Después de decodificar una imagen recibida, la imagen decodificada se indica incondicionalmente como una imagen de referencia en una memoria intermedia de imágenes decodificadas (DPB). Es decir que puede no determinarse si una imagen decodificada es o no una imagen de referencia, pero la imagen decodificada puede indicarse como una imagen de referencia.
Después, se analiza sintácticamente el encabezamiento de porción de una imagen siguiente a la imagen decodificada, y el que la imagen decodificada sea una imagen de referencia o una imagen no de referencia puede indicarse sobre la base de información de imagen de referencia incluida en el encabezamiento de porción. Realización 4
Puede borrarse nal_ref_flag de un encabezamiento de NALU y puede utilizarse temporal_id para indicar que la NALU es una imagen no de referencia. Para indicar una imagen no de referencia, temporal_id puede ser ‘7’, un número máximo de capas temporales-1 (es decir max_temporal_layers_minus1) incluido en un tren de bits, o un valor prefijado distinto de ‘0’.
Realización 5
Puede borrarse nal_ref_flag de un encabezamiento de NALU y puede utilizarse reserved_one_5bits como elemento priority_id para indicar que la NALU es una imagen no de referencia. priority_id es un identificador que indica una prioridad de la NALU correspondiente y se utiliza para proporcionar una función de extracción de tren de bits sobre la base de una prioridad, sin tener en cuenta un espacial, un temporal o una SNR diferente.
Es decir que si temporal_id = Ta es el identificador de la capa temporal superior, se utiliza temporal_id = Ta y la NALU, es decir priority_id = 31 (u otro valor específico), para indicar que la NALU es la NALU de una imagen no de referencia.
1 bit utilizado para señalizar nal_ref_flag puede utilizarse como una de las siguientes cosas.
(1) Dicho 1 bit puede utilizarse para indicar nal_unit_type. nal_unit_type puede convertirse en una señal de 7 bits y puede duplicarse el número de tipos de NALU.
(2) Dicho 1 bit puede utilizarse para indicar temporal_id. temporal_id puede convertirse en una señal de 4 bits y puede duplicarse un número máximo de capas temporales.
(3) Dicho 1 bit puede utilizarse para indicar layer_id. layer_id significa el identificador de la capa escalable de un tren de bits en capas y puede señalizarse mediante un elemento de sintaxis reserved_one_5bits. 1 bit utilizado para señalizar nal_ref_flag puede sumarse a 5 bits de reserved_one_5bits utilizados para identificar una capa escalable y, por lo tanto, layer_id puede convertirse en una señal de 6 bits. Si se utilizan 6 bits, pueden identificarse 64 capas escalables.
(4) Dicho 1 bit puede utilizarse como una etiqueta que informe de si reserved_one_5bits indica o no prioridad. (5) Dicho 1 bit puede utilizarse como reserved_bit.
Si no se borra nal_ref_flag de un encabezamiento de NALU, la semántica de nal_ref_flag puede modificarse de la siguiente manera.
Cuando el valor de nal_ref_flag es 0, indica que una NALU incluye sólo la porción de una imagen no de referencia. Cuando el valor de nal_ref_flag es 1, indica que una NALU puede incluir la porción de una imagen de referencia o de una imagen no de referencia.
Señalización de activación de conjunto de parámetros de vídeo (VPS)
Un VPS incluye la información más básica para decodificar vídeo y puede incluir contenidos presentes en el SPS existente.
El VPS puede incluir información sobre una subcapa que indique una capa temporal que soporta escalabilidad temporal e información sobre múltiples capas que soporten una escalabilidad espacial, de calidad y de vista. Es decir que el VPS puede incluir información multicapa, es decir sintaxis para una ampliación de HEVC.
A. Conjunto de parámetros de vídeo
Las sintaxis para un VPS son iguales que en la Tabla 3.
Tabla 3
En la Tabla 3, la mayoría de las sintaxis tienen la misma semántica que las sintaxis de SPS aplicadas a un tren de bits que incluye una sola capa, y las partes adicionales son como se indica a continuación.
- video_parameter_set_id significa el identificador de un VPS y puede hacerse referencia a video_parameter_set_id en un conjunto de parámetros de secuencia (SPS), información de mejora suplementaria (SEI, por sus siglas en inglés) o delimitadores de unidad de acceso.
- Cuando el valor de priority_id_flag es 1, indica que reserved_one_5bits puede utilizarse idénticamente con priority_id de un estándar SVC. Cuando el valor de priority_id_flag es 0, significa que reserved_one_5bits puede utilizarse como layer_id.
- Cuando el valor de extension_info_flag es 0, indica que un tren de bits cumple un estándar de una sola capa de HEVC. Cuando el valor de extension_info_flag es 1, indica una capa de mejora para soportar escalabilidad (es decir cuando se soporta una ampliación de HEVC) y se proporciona información relacionada con una capa. B. Modificación de conjunto de parámetros de secuencia (SPS)
Como en la Tabla 4, parte de una sintaxis existente puede incorporarse a un VPS y puede borrarse de un SPS. Entretanto, puede añadirse al SPS un elemento de sintaxis vps_id. Una sintaxis de SPS a la que se le haya añadido vps_id es igual que en la Tabla 4. En la Tabla 4, una sintaxis borrada se indica mediante una línea que pasa por el centro de la sintaxis.
vps_id indica un identificador para identificar un VPS al que puede hacerse referencia en el SPS y puede tener un margen de 0 a X.
Tabla 4
C. Señalización de activación para VPS
Un encabezamiento de porción incluye información de índice sobre un conjunto de parámetros de imagen (PPS) al que se refiere una porción correspondiente, y un PPS incluye información de índice sobre un conjunto de parámetros de secuencia (SPS) al que se refiere una imagen correspondiente. El SPS incluye información sobre un conjunto de parámetros de vídeo (VPS) al que se refiere una secuencia correspondiente. Como se ha descrito anteriormente, cuando se analiza sintácticamente información sobre un conjunto de parámetros y, luego, se hace referencia a información sobre el conjunto de parámetros analizado sintácticamente, se denomina activación.
Para utilizar información sobre un conjunto de parámetros específico, es decir para activar el conjunto de parámetros, es necesario analizar sintácticamente de forma gradual el conjunto de parámetros a partir de un encabezamiento de porción. Esto significa que es necesario analizar todos los encabezamientos de porción y un PPS relacionado para saber qué SPS se activa.
Cuando se extrae parte de una subcapa (es decir capa temporal) de un tren de bits que incluye una sola capa, un extractor necesita analizar (o analizar sintácticamente) un encabezamiento de NALU y una pluralidad de conjuntos de parámetros.
Si en un VPS o un SPS está incluida información para la extracción de una NALU, el extractor necesita analizar sintácticamente de forma secuencial un conjunto de parámetros mayor a partir de un encabezamiento de porción. Esto significa que el extractor necesita entender todos los elementos de sintaxis de los conjuntos de parámetros y el encabezamiento de porción.
Por otra parte, sin un proceso de análisis sintáctico complicado incluso en un proceso de decodificación de vídeo, puede buscarse vps_id o sps_id y pueden activarse sólo los conjuntos de parámetros necesarios. En este caso, si un VPS o un SPS incluye información de índice de parámetro que se haya de activar, puede reducirse un procedimiento de análisis sintáctico para un encabezamiento de porción complicado y un PPS relacionado.
Entretanto, sólo algunos de los elementos de las sintaxis pueden incluir datos necesarios para extraer un tren de bits. Sin embargo, analizar todos los elementos de sintaxis puede convertirse en una gran carga en un extractor. Para solucionar este problema, se propone el método siguiente.
En la presente invención, la activación de un conjunto de parámetros significa que se realiza una señalización de manera que un extractor pueda saber qué conjunto de parámetros se activa sin analizar un encabezamiento de porción y un conjunto de parámetros de imagen (PPS) relacionado.
De acuerdo con la presente invención, puede señalizarse adicionalmente qué VPS, SPS o PPS está activo, de manera que se reduzca una carga en un extractor que necesite analizar todos los encabezamientos de porción y un PPS relacionado.
Un VPS puede actualizarse. Puede utilizarse uno de los siguientes tres métodos, de manera que un extractor pueda estar al corriente de un VPS activo y un SPS o PPS relacionado sin analizar un encabezamiento de porción.
(1) vps_id, sps_id y pps_id pueden incluirse en un delimitador de unidad de acceso. vps_id, sps_id y pps_id indican los identificadores de los VPS, SPS y PPS respectivos utilizados para NALU de una AU relacionada.
Para indicar si los identificadores están o no presentes en el delimitador de unidad de acceso se utilizan vps_id_present_flag, sps_id_present_flag y pps_id_present_flag. La sintaxis de un delimitador de unidad de acceso propuesto es la misma que en la Tabla 5.
Tabla 5
(1-1) En otro método, se excluyen sps_id y pps_id y puede incluirse sólo vps_id en un delimitador de unidad de acceso como en la Tabla 6.
Tabla 6
(2) Otro método para la señalización de activación de un VPS es utilizar un nuevo mensaje de SEI ‘parameter_set_reference’. El mensaje de SEI incluye una sintaxis para informar de si están o no presentes vps_id, sps_id y pps_id indicativos de los identificadores de un VPS, un SPS y un PPS utilizados para NALU dentro de una AU relacionada.
Para indicar si los identificadores están o no presentes, puede utilizarse una sintaxis de vps_id_present_flag, sps_id_present_flag y pps_id_present_flag, y una sintaxis de SEI es igual que en la Tabla 7.
Tabla 7
(2-1) Además, puede informarse de la activación de un VPS y un SPS excluyendo pps_id e incluyendo sps_id y vps_id en un mensaje de SEI como en la Tabla 8. sps_id y vps_id en un mensaje de SEI pueden incluir sps_id y vps_id a los que se refiera la NALU de capa de codificación de vídeo de una unidad de acceso asociada con el mensaje de SEI. Por consiguiente, sps_id y vps_id pueden indicar información sobre un conjunto de parámetros que tenga una posibilidad de activación.
Tabla 8
En la Tabla 8, vps_id indica video_parameter_set_id de un VPS ahora activado. Un valor de vps_id puede tener un valor de 0~15.
Si sps_id_present_flag tiene un valor de 1, indica que sequence_parameter_set_id de un SPS ahora activado está incluido en un mensaje de SEI correspondiente. Si sps_id_present_flag tiene un valor de 0, indica que sequence_parameter_set_id de un SPS ahora activado no está incluido en un mensaje de SEI correspondiente. sps_id indica sequence_parameter_set_id de un SPS ahora activado. sps_id puede tener un valor de 0~31, de forma más limitada un valor de 0~15.
Cuando el valor de psr_extension_flag es 0, indica que un elemento de sintaxis de ampliación de mensaje de SEI de referencia de conjunto de parámetros no está incluido en un mensaje de SEI de referencia de conjunto de parámetros. Cuando el valor de psr_extension_flag es 1, indica que un elemento de sintaxis de ampliación de mensaje de SEI de referencia de conjunto de parámetros que incluye un mensaje de SEI de referencia de conjunto de parámetros está ampliado y es utilizado.
psr_extension_length indica la longitud de psr_extension_data. psr_extension_length puede tener un valor que oscila entre 0 y 256, y psr_extension_data_byte puede tener cualquier valor.
(2-2) Además, en un mensaje de SEI pueden incluirse uno o más sps_id y vps_id distintos de pps_id, que luego pueden señalizarse como en la Tabla 9.
Tabla 9
En la Tabla 9, vps_id indica video_parameter_set_id de un VPS activo. vps_id puede tener un valor de 0~15. num_reference_sps indica el número de SPS que se refieren a vps_id activos.
sps_id(i) indica sequence_parameter_set_id de un SPS activo, y sps_id puede tener un valor de 0~31, de forma más limitada un valor de 0~15.
(2-3) Además, en un mensaje de SEI pueden incluirse sólo vps_id distintos de sps_id y pps_id, que luego pueden señalizarse como en la Tabla 10.
Tabla 10
(3) Otro método para la señalización de activación de un VPS es incluir información, que informe de vps_id, sps_id y pps_id, en un mensaje de SEI de periodo de almacenamiento en la memoria intermedia. La Tabla 11 muestra una sintaxis que incluye vps_id_present_flag, sps_id_present_flag y pps_id_present_flag que indican si están o no presentes vps_id, sps_id y pps_id.
Tabla 11
(3-1) Además, como se indica en la Tabla 12, la activación de un VPS puede señalizarse incluyendo sólo vps_id distintos de sps_id y pps_id en el mensaje de SEI de periodo de almacenamiento en la memoria intermedia.
Tabla 12
(4) Otro método para la señalización de activación de un conjunto de parámetros es incluir información, que informe de vps_id, sps_id y pps_id, en un mensaje de SEI de punto de recuperación. La Tabla 13 muestra una sintaxis que incluye vps_id_present_flag, sps_id_present_flag y pps_id_present_flag que indican si están o no presentes vps_id, sps_id y pps_id.
Tabla 13
(4-1) Además, como se indica en la Tabla 14, puede haber un método para informar de vps_id, sps_id y pps_id incluyendo sólo vps_id distintos de sps_id y pps_id en el mensaje de SEI de punto de recuperación.
Tabla 14
Los mensajes para entregar vps_id o sps_id pueden incluirse en una unidad de acceso de punto de acceso aleatorio interno (IRAP, por sus siglas en inglés).
Si se incluye en una unidad de acceso y se utiliza cualquiera de los métodos de señalización de información anteriormente descritos, un extractor puede identificar valores vps_id, sps_id y pps_id a través del método de señalización anteriormente descrito para extraer un tren de bits y puede gestionar uno o más vps/sps/pps.
Además, un aparato de decodificación o un módulo de decodificación para realizar una decodificación puede identificar valores vps_id, sps_id y pps_id a través del método de señalización anteriormente descrito y, con el método de señalización, activando los conjuntos de parámetros, puede decodificar las AU asociadas.
Representación de un tren de bits en un tipo ampliado
A continuación se proponen extension_info() de VPS y un nuevo mensaje de SEI para describir y señalizar información sobre una capa escalable si está incluido un tren de bits que soporte una ampliación de capa. Para representar un tren de bits en el tipo ampliado, puede señalizarse la siguiente información.
layer_id señaliza si entrega o no un valor de prioridad de una capa.
Aquí, una capa espacial (identificada mediante un valor dependency_id), una capa de SNR (identificada mediante un valor quality_id), vistas (identificadas mediante un valor view_id), etc. pueden señalizarse en respuesta a cada valor layer_id, y una capa temporal puede identificarse mediante temporal_id de un encabezamiento de NALU.
Además, la zona de vídeo relacionada con layer_id puede señalizarse mediante region_id.
Además, pueden señalizarse una información de dependencia, una información de velocidad de transmisión de bits para cada capa escalable y una información de calidad para cada capa escalable.
La sintaxis de extension_info es igual que en la Tabla 15.
Tabla 15
La semántica de la sintaxis de la Tabla 15 es como se indica a continuación.
- num_frame_sizes_minus1 plus 1 indica una cantidad máxima de información de tamaño (por ejemplo pic_width_in_luma_samples[i], pic_height_in_luma_samples[i], pic_cropping_flag[i], pic_cropping_flag[i], pic_crop_left_offset[i], pic_crop_right_offsetv[i], pic_crop_top_offset[i] y pic_crop_bottom_offset[i]) de otros tipos de imágenes incluidas en una secuencia de vídeo codificada. El valor de num_frame_sizes_minus1 puede ser 0~X. Otros tipos de imágenes pueden incluir imágenes que tengan resoluciones diferentes.
- num_rep_formats_minus1 plus 1 indica un número máximo de tipos diferentes de profundidades de bits y formatos de crominancia (por ejemplo bit_depth_luma_minus8[i], bit_depth_chroma_minus8[i] y valores[i] de chroma_format_idc) incluidos en una secuencia de vídeo codificada. El valor de num_rep_formats_minus1 puede estar en un intervalo de 0~X.
- pic_width_in_luma_samples[i], pic_height_in_luma_samples[i], pic_cropping_flag[i], pic_cropping_flag[i], p i c_c ro p_l eft_offset [i], pic_crop_right_offsetv[i], pic_crop_top_offset[i] y pic_crop_bottom_offset[i] indican valores de orden i de pic_width_in_luma_samples, pic_height_in_luma_samples, pic_cropping_flag, pic_cropping_flag, pic_crop_left_offset, pic_crop_right_offsetv, pic_crop_top_offset, pic_crop_bottom_offset de una secuencia de vídeo codificada.
- bit_depth_luma_minus8[i], bit_depth_chroma_minus8[i] y chroma_format_idc[i] indican valores de orden i de bit_depth_luma_minus8, bit_depth_chroma_minus8 y chroma_format_idc de una secuencia de vídeo codificada. - num_layers_minus1 indica el número de capas escalables disponibles en un tren de bits.
- Cuando el valor de dependency_id_flag es 1, indica que están presentes uno o más valores dependency_id relacionados con un valor layer_id.
- Cuando el valor de quality_id_flag es 1, indica que están presentes uno o más valores quality_id relacionados con un valor layer_id.
- Cuando el valor de view_id_flag es 1, indica que están presentes uno o más valores view_id relacionados con un valor layer_id.
- Cuando el valor de region_id_flag es 1, indica que están presentes uno o más valores region_id relacionados con un valor layer_id.
- Cuando el valor de layer_dependency_info_flag es 1, indica que se proporciona información de dependencia de una capa escalable.
- frame_size_idx[i] indica un índice para un conjunto de tamaños de trama aplicado a una capa que tiene un valor layer_id de i. frame_size_idx[i] tiene un valor que oscila entre 0 y X.
- rep_format_idx[i] indica un índice para un conjunto de una profundidad de bits y un formato de crominancia aplicado a una capa que tiene un valor layer_id de i. rep_format_idx[i] tiene un valor que oscila entre 0 y X. - Cuando el valor de one_dependency_id_flag[i] es 1, indica que hay sólo un dependency_id asociado con una capa cuyo layer_id es i. Cuando el valor de one_dependency_id_flag[i] es 0, indica que hay dos o más dependency_id asociados con una capa cuyo layer_id es i.
- dependency_id[i] indica un valor de dependency_id asociado con una capa cuyo layer_id es i.
- dependency_id_min[i] y dependency_id_max[i] indican un valor dependency_id mínimo y un valor dependency_id máximo asociados con una capa cuyo layer_id es il, respectivamente.
- Cuando el valor de one_quality_id_flag[i] es 1, indica que hay sólo un quality_id asociado con una capa cuyo layer_id es i. Cuando el valor de one_quality_id_flag[i] es 0, indica que hay dos o más valores quality_id asociados con una capa cuyo layer_id es i.
- quality_id[i] indica un valor de quality id asociado con una capa cuyo layer_id es i.
- quality_id_min[i] y quality_id_max[i] indican un valor quality_id mínimo y un valor quality_id máximo asociados con una capa cuyo layer_id es I, respectivamente.
- Cuando el valor de one_view_id_flag[i] es 1, indica que hay un view_id asociado con una capa cuyo layer_id es i. Cuando el valor de one_view_id_flag[i] es 0, indica que hay dos o más valores view_id asociados con una capa cuyo layer_id es i.
- view_id[i] indica un valor de view_id asociado con una capa cuyo layer_id es i.
- Cuando el valor de depth_flag[i] es 1, indica que una capa escalable cuyo layer_id es i incluye información de profundidad de un tren de bits de vídeo 3-D.
- view_id_min[i] y view_id_max[i] indican un valor view_id mínimo y un valor view_id máximo asociados con una capa cuyo layer_id es i.
- num_regions_minus1 plus1 indica el número de zonas asociadas con una capa cuyo layer_id es i.
- region_id[j] indica el identificador de una zona j asociada con una capa cuyo layer_id es i.
- num_directly_dependent_layers[i] indica el número de capas escalables (es decir el número de capas necesarias para generar una señal predicha cuando se realiza una decodificación) con las que una capa escalable i actual está directamente asociada.
- directly_dependent_layer_id_delta_minus1[i][j] plus 1 indica una diferencia entre layer_id[i], es decir una capa escalable actual, y el identificador de capa de una capa escalable de orden j con la que la capa escalable actual está directamente asociada. El identificador de capa de la capa escalable de orden j con la que la capa escalable actual está directamente asociada es igual que (layer_id[i]-directly_dependent_layer_id_delta_minus1[i][j] - 1).
Una sintaxis de extension_info() según otra realización es igual que en la Tabla 16.
Tabla 16
Como se muestra en la Tabla 16, p¡c_w¡dth_in_luma_samples[¡] y p¡c_he¡ght_in_luma_samples[¡], bit_depth_luma_m¡nus8[¡], b¡t_depth_chroma_m¡nus8[¡] y chroma_format_¡dc[¡] pueden señal¡zarse a través de ¡nformac¡ón sobre d¡ferentes formatos de representac¡ón.
De acuerdo con otra real¡zac¡ón, p¡c_w¡dth_¡n_luma_samples[¡], p¡c_he¡ght_¡n_luma_samples[¡], b¡t_depth_luma_m¡nus8[¡], b¡t_depth_chroma_m¡nus8[¡] y chroma_format_¡dc[¡] pueden señal¡zarse a través de ¡nformac¡ón sobre ¡mágenes d¡ferentes, es dec¡r ¡mágenes que t¡enen resoluc¡ones d¡ferentes.
Una s¡ntax¡s para un mensaje de SEI de act¡vac¡ón para la señal¡zac¡ón de una veloc¡dad de transm¡s¡ón de bits e ¡nformac¡ón de cal¡dad es ¡gual que en la Tabla 17.
Tabla 17
La semánt¡ca de la s¡ntax¡s de la Tabla 17 es como se ¡nd¡ca a cont¡nuac¡ón.
- num_layers_m¡nus1 ¡nd¡ca el número de capas escalables que pueden proporc¡onarse en un tren de b¡ts. - Cuando el valor de b¡t rate_¡nfo_flag es 1, ¡nd¡ca que se proporc¡ona ¡nformac¡ón de la veloc¡dad de transm¡s¡ón de b¡ts para capa escalable.
- Cuando el valor de qual¡ty_¡nfo_flag es 1, ¡nd¡ca que se proporc¡ona ¡nformac¡ón de un valor de cal¡dad de cada capa escalable.
- Cuando el valor de qual¡ty_type_flag es 1, ¡nd¡ca que se proporc¡ona ¡nformac¡ón de un t¡po de cal¡dad para cada capa escalable.
- max_b¡t rate[¡] ¡nd¡ca una veloc¡dad máx¡ma de transm¡s¡ón de b¡ts de una capa escalable cuyo valor layer_¡d es ¡, y average_ b¡t rate[¡] ¡nd¡ca una veloc¡dad med¡a de transm¡s¡ón de b¡ts de una capa escalable cuyo valor layer_¡d es ¡.
- qual¡ty_value[¡] ¡nd¡ca un valor de cal¡dad de una capa escalable ¡.
- quality_type_uri[QualityTypeUrildx] indica un identificador universal de recursos (URI, por sus siglas en inglés) que tiene QualityTypeUrildx bytes de una cadena terminada en 0 nulo codificada en caracteres UTF-8 y que indica la inclusión de una expresión para el tipo de valores de calidad.
A continuación se propone una idea para mejorar un conjunto de parámetros de vídeo (VPS) con el fin de extraer eficazmente un tren de bits.
Referenciación de capas
Un método que indique una relación entre layer_id y un ID de dimensión de escalabilidad en un tren de datos que soporte múltiples capas puede incluir el primer método y el segundo método. El primer método informa de un método de mapeo entre layer_id y el ID de dimensión de escalabilidad. El segundo método parte o une los bits de layer_id y luego informa de qué tipo de dimensión está presente en el bit partido o unido.
En un tren de bits que soporte múltiples capas, un tipo de dimensión puede significar el tipo de escalabilidad, tal como la escalabilidad espacial y la escalabilidad de calidad, y un ID de dimensión puede significar un índice de una capa para un tipo de dimensión específico.
En un tren de bits que soporte múltiples capas, en general, una capa específica (para ayudar a entenderlo, por ejemplo en el caso en que se soporte la escalabilidad temporal en un tren de bits de una sola capa, una capa temporal (subcapa) 3) puede referirse directamente a la siguiente capa inferior (por ejemplo una capa temporal (subcapa)) en una dimensión específica.
Por ejemplo, en el caso de que se soporte la escalabilidad espacial, significa que una capa espacial 2 se refiere directamente a la siguiente capa espacial inferior 1.
Por consiguiente, para indicar el caso anterior, se propone que se describa en primer lugar una dimensión que tenga una dependencia directa por defecto.
Después, se describe detalladamente una dependencia específica en un bucle de descripción para una capa escalable.
A continuación se propone una idea para señalizar una referenciación de capas utilizando los dos métodos. Una sintaxis mejorada para vps_extension es igual que en las Tablas 18 a 21.
Tabla 18
La Tabla 18 muestra una sintaxis que mapea layer_id a un ID de dimensión de escalabilidad utilizando el primer método. La semántica de la sintaxis de la Tabla 18 es como se indica a continuación.
- Cuando el valor de all_default_dependency_flag es 1, indica que todas las dimensiones de capa tienen dependencia por defecto. Es decir, significa que, en una dimensión específica i, una capa que tiene ‘dimension_id[i] = n’ se refiere directamente a otra capa que tiene dimension_id[i] = n-1 por defecto.
Cuando el valor de all_default_dependency_flag es 0, indica que todas las dimensiones de capa pueden no tener dependencia por defecto. Cuando el valor de all_default_dependency_flag es 0, se señaliza el ‘num_default_dim_minus1 ’ siguiente.
- num_default_dim_minus1 indica el número de dimensiones que tienen dependencia por defecto.
- dimension[j] especifica el tipo de una dimensión de capa que tiene dependencia por defecto. Es decir que se señaliza información sobre el tipo de dimensión de capa que tiene dependencia por defecto, mientras se aumenta el número de dimensiones que tienen dependencia por defecto una a una. En una dimensión correspondiente, una capa superior (por ejemplo dimension_id = n) se referirá directamente a la siguiente capa inferior (por ejemplo dimension_id = n-1).
- Cuando el valor de specific_dependency_flag[i] es 1, significa que hay referencias/dependencias directas descritas detalladamente para una capa correspondiente. Por consiguiente, cuando el valor de specific_dependency_flag[i] es 1, se señalizan el número de capas y el ID de las capas a las que se refiere directamente una capa correspondiente.
Que una capa C se refiera directamente a una capa B significa que un decodificador necesita utilizar información (decodificada o no decodificada) de la capa B para decodificar la capa C. Si la capa B utiliza directamente información de una capa A, no se considera que la capa C se refiera directamente a la capa A.
Tabla 19
La Tabla 19 muestra una sintaxis en la que los bits de layer_id están asignados a un tipo de dimensión de escalabilidad y la longitud de un tipo de dimensión asignado se señaliza utilizando el segundo método. num_dimensions_minus1 descrito en la Tabla 19 indica el número de dimensiones de capa que están presentes en un encabezamiento de NALU. Es decir que se comprueba el número de dimensiones de capa presentes en el encabezamiento de NALU y se comprueban un tipo de capa presente en cada dimensión de capa correspondiente y el número de bits asignados al tipo de dimensión.
La sintaxis ‘all_default_dependency_flag, num_default_dim_minus1, dimension[j] y specific_dependency_flag[i]’ para la referenciación de capas descrita en la Tabla 19 tiene la misma semántica que la sintaxis descrita en la Tabla 18.
Las Tablas 20 y 21 describen sintaxis alternativas a las Tablas 18 y 19. La Tabla 20 muestra una sintaxis alternativa que indica dependencia por defecto cuando se utiliza el primer método, y la Tabla 21 muestra una sintaxis alternativa que indica dependencia por defecto cuando se utiliza el segundo método.
Tabla 20
Tabla 21
Entre las sintaxis de las Tablas 20 y 21 se omite la descripción de las sintaxis descritas en las Tablas 18 y 19. Una nueva sintaxis ‘default_dependency_flag[i]’ en las Tablas 20 y 21 indica si un tipo i de dimensión utiliza o no dependencia por defecto. En una dimensión correspondiente, una capa superior (por ejemplo dimension_id[i]=n) se refiere directamente a una capa situada justo debajo (por ejemplo dimension_id[i]=n-1).
Es decir que después de que num_dimensions_minus1 y dimension_type[i] designen un tipo de dimensión específico, se señaliza si el tipo de dimensión específico utiliza o no dependencia por defecto. Si no se señaliza, esto indica que se señaliza información de una capa a la que se refiere directamente la capa correspondiente. En la Tabla 22 figuran tipos de dimensión según la presente invención.
Tabla 22
De acuerdo con la presente invención, los tipos de dimensión 4 y 5, es decir los tipos indicativos de un ID de prioridad y un ID de zona, se han añadido en un tipo de dimensión existente.
dimension_type[i][j] puede tener un valor entre 0 y 5. Otros valores pueden definirse posteriormente, y un decodificador puede ignorar un valor de dimension_type[i][j] si dimension_type[i][j] no tiene un valor entre 0 y 5. Si dimension_type tiene un valor de 4, el dimension_id correspondiente indica el ID de una capa de prioridad de un tren de bits en el estándar SVC.
Si dimension_type tiene un valor de 5, el dimension_id correspondiente indica el ID de una zona específica de un tren de bits. La zona específica puede ser uno o más segmentos espacio-temporales en el tren de bits.
La Figura 4 es un diagrama de flujo de control que ilustra un método de codificación de información de vídeo de acuerdo con la presente invención.
Remitiéndonos a la Figura 4, el aparato de codificación codifica una unidad de capa de abstracción de red (NAL) que incluye información relacionada con vídeo en la etapa S401.
El encabezamiento de NALU de la NALU no incluye información que indique si la NALU incluye o no una porción que incluya al menos parte o la totalidad de la imagen no de referencia.
Entretanto, el encabezamiento de NALU incluye información de ID de capa para identificar una capa escalable en un tren de datos que soporte una capa escalable.
Aquí puede utilizarse para señalizar la información de ID de capa un bit utilizado para señalizar información que indique si una NALU, excepto el encabezamiento de NALU, incluye o no una porción que incluya al menos parte o la totalidad de la imagen no de referencia.
Además, la NALU puede incluir información sobre diversos conjuntos de parámetros necesarios para decodificar vídeo.
El aparato de codificación puede codificar un mensaje de información de mejora suplementaria (SEI), que incluya información sobre conjuntos de parámetros activos, como una NALU independiente.
La información sobre los conjuntos de parámetros activos puede incluir información sobre qué VPS activo está indexado y/o información sobre qué SPS activo está indexado.
Además, la información sobre conjuntos de parámetros activos puede incluir información sobre qué VPS activo está indexado, información sobre el número de SPS que se refieren al VPS activo e información sobre que SPS están indexados.
El aparato de decodificación puede utilizar la información sobre los conjuntos de parámetros para extraer una subcapa que proporcione escalabilidad temporal.
Además, el aparato de decodificación o un módulo de decodificación para realizar una decodificación puede utilizar la información sobre los conjuntos de parámetros a la hora de activar conjuntos de parámetros necesarios para decodificar una NALU de capa de codificación de vídeo.
El aparato de codificación envía la NALU, que incluye la información relacionada con el vídeo codificado, en forma de un tren de bits en la etapa S402.
La Figura 5 es un diagrama de flujo de control que ilustra un método de decodificación de información de vídeo de acuerdo con la presente invención
Remitiéndonos a la Figura 5, el aparato de decodificación recibe una NALU, que incluye información relacionada con un vídeo codificado, a través de un tren de bits en la etapa S501.
El aparato de decodificación analiza sintácticamente el encabezamiento y la carga útil de NAL de la NALU en la etapa S502. El análisis sintáctico de la información de vídeo puede realizarse mediante un módulo de decodificación entrópica o un módulo de análisis sintáctico adicional.
A través del análisis sintáctico, el aparato de decodificación puede obtener diversos datos incluidos en el encabezamiento y la carga útil de NAL de la NALU.
El encabezamiento de NALU puede incluir información de ID de capa para identificar una capa escalable en el tren de bits que soporta la capa escalable y puede no incluir información de etiqueta de 1 bit que indique si la NALU es una imagen no de referencia o una imagen de referencia en la totalidad del tren de bits a la hora de codificar los datos de vídeo.
Aquí puede utilizarse para señalizar la información de ID de capa un bit utilizado para señalizar información que indique si una NALU, excepto el encabezamiento de NALU, incluye o no una porción que incluya al menos parte o la totalidad de la imagen no de referencia.
Además, a través del análisis sintáctico, el aparato de decodificación puede obtener información sobre conjuntos de parámetros incluida en un mensaje de SEI. La información de los conjuntos de parámetros obtenida es necesaria para decodificar una NALU asociada con un mensaje de SEI.
La información sobre conjuntos de parámetros activos puede incluir información sobre qué VPS activo está indexado y/o información sobre qué SPS activo está indexado.
Además, la información sobre los conjuntos de parámetros activos puede incluir información sobre qué VPS activo está indexado, información indicativa del número de SPS que se refieren al VPS activo e información sobre que SPS están indexados.
El aparato de decodificación puede utilizar estos datos sobre conjuntos de parámetros para extraer una subcapa que proporcione escalabilidad temporal.
Además, los datos sobre conjuntos de parámetros pueden utilizarse a la hora de decodificar un tren de bits o en una negociación de sesión (por ejemplo una negociación de sesión en el momento de una transmisión en continuo(streaming)en una red IP).
En las realizaciones anteriormente mencionadas, aunque los métodos se han descrito sobre la base de los diagramas de flujo en forma de una serie de etapas o bloques, la presente invención no está limitada a la secuencia de las etapas, y algunas de las etapas pueden realizarse en un orden diferente del de otras etapas o pueden realizarse simultáneamente a otras etapas. Además, los expertos en la técnica entenderán que las etapas mostradas en el diagrama de flujo no son exclusivas y las etapas pueden incluir etapas adicionales o que una o más etapas del diagrama de flujo pueden borrarse sin afectar al alcance de la presente invención.
La invención está definida en las reivindicaciones adjuntas.

Claims (2)

REIVINDICACIONES
1. Un aparato (200) de decodificación de vídeo que comprende:
un módulo de análisis sintáctico configurado para analizar sintácticamente un encabezamiento de unidad de capa de abstracción de red (NAL) de una unidad (501) de NAL;
un módulo (210) de decodificación configurado para decodificar una primera imagen;
caracterizado porque comprende
una memoria intermedia (270) de imagen decodificada (DPB) configurada para almacenar la primera imagen decodificada marcada como una imagen de referencia,
en donde el módulo de análisis sintáctico está además configurado para analizar sintácticamente un encabezamiento de porción de una segunda imagen que es la imagen siguiente a la primera imagen en un orden de decodificación,
en donde el módulo (210) de decodificación está además configurado para remarcar la primera imagen como una imagen de referencia o una imagen de no referencia en función de la información de imagen de referencia comprendida en un encabezamiento de porción de la segunda imagen,
en donde el encabezamiento de unidad de NAL que corresponde a la unidad de NAL que comprende los datos codificados de la primera imagen no comprende información que indique si la primera imagen es una imagen de referencia o es una imagen de no referencia en la unidad de NAL.
2. Un aparato (100) de codificación de video que comprende:
una unidad (150) de codificación configurada para codificar un encabezamiento de unidad de capa de abstracción de red (NAL) de una unidad (501) de NAL, codificar una primera imagen y codificar un encabezamiento de porción de una segunda imagen,
caracterizado por que
el encabezamiento de porción de la segunda imagen incluye una información de imagen de referencia que indica si la primera imagen es una imagen de referencia o es una imagen de no referencia, y
el encabezamiento de unidad de NAL correspondiente a la unidad de NAL comprende datos codificados de la primera imagen que no comprenden información que indica si la primera imagen es una imagen de referencia o es la imagen de no referencia en la unidad de NAL,
en donde la segunda imagen es la imagen siguiente a la primera imagen en un orden de decodificación, en donde la unidad (150) de codificación está además configurada para marcar la primera imagen como una imagen de referencia, y
en donde la unidad (150) de codificación está además configurada para remarcar la primera imagen como una imagen de referencia o una imagen de no referencia en función de la información de imagen de referencia comprendida en el encabezamiento de porción de la segunda imagen cuando la segunda imagen está siendo codificada.
ES19183291T 2012-04-16 2013-04-16 Video coding and decoding with marking of a picture as non-reference picture or reference picture Active ES3020385T3 (en)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
KR20120038870 2012-04-16
KR20120066606 2012-06-21
KR20120067925 2012-06-25
KR20120071933 2012-07-02
KR20120077012 2012-07-16
KR1020120108925A KR20130116782A (ko) 2012-04-16 2012-09-28 계층적 비디오 부호화에서의 계층정보 표현방식
KR1020120112598A KR20130116783A (ko) 2012-04-16 2012-10-10 계층적 비디오 부호화에서의 계층정보 표현방식

Publications (1)

Publication Number Publication Date
ES3020385T3 true ES3020385T3 (en) 2025-05-22

Family

ID=49635785

Family Applications (3)

Application Number Title Priority Date Filing Date
ES19183291T Active ES3020385T3 (en) 2012-04-16 2013-04-16 Video coding and decoding with marking of a picture as non-reference picture or reference picture
ES25162780T Active ES3062931T3 (en) 2012-04-16 2013-04-16 Video coding and decoding with marking of a picture as non-reference picture or reference picture
ES13777676T Active ES2748463T3 (es) 2012-04-16 2013-04-16 Aparato de decodificación de vídeo

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES25162780T Active ES3062931T3 (en) 2012-04-16 2013-04-16 Video coding and decoding with marking of a picture as non-reference picture or reference picture
ES13777676T Active ES2748463T3 (es) 2012-04-16 2013-04-16 Aparato de decodificación de vídeo

Country Status (17)

Country Link
US (12) US10595026B2 (es)
EP (8) EP3086556A1 (es)
JP (30) JP5933815B2 (es)
KR (24) KR20130116782A (es)
CN (12) CN108769706B (es)
CY (1) CY1122257T1 (es)
DK (1) DK2840788T3 (es)
ES (3) ES3020385T3 (es)
HR (1) HRP20191726T1 (es)
HU (2) HUE070890T2 (es)
LT (1) LT2840788T (es)
PL (4) PL3570546T3 (es)
PT (1) PT2840788T (es)
RS (1) RS59596B1 (es)
SI (1) SI2840788T1 (es)
SM (1) SMT201900537T1 (es)
WO (2) WO2013157826A1 (es)

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130116782A (ko) * 2012-04-16 2013-10-24 한국전자통신연구원 계층적 비디오 부호화에서의 계층정보 표현방식
EP2876882A4 (en) * 2012-09-09 2016-03-09 Lg Electronics Inc IMAGE DECODING METHOD AND APPARATUS USING THE SAME
RU2610670C1 (ru) * 2012-12-21 2017-02-14 Телефонактиеболагет Л М Эрикссон (Пабл) Кодирование и декодирование многоуровневого видеопотока
US9942545B2 (en) * 2013-01-03 2018-04-10 Texas Instruments Incorporated Methods and apparatus for indicating picture buffer size for coded scalable video
US10129550B2 (en) * 2013-02-01 2018-11-13 Qualcomm Incorporated Inter-layer syntax prediction control
JP5680807B1 (ja) * 2013-06-05 2015-03-04 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 動画像符号化方法、動画像符号化装置、送信装置及びプログラム
CN105706451B (zh) * 2013-10-11 2019-03-08 Vid拓展公司 Hevc扩展的高级句法
KR102248848B1 (ko) * 2013-10-26 2021-05-06 삼성전자주식회사 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치
KR20150064676A (ko) * 2013-12-03 2015-06-11 주식회사 케이티 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
WO2015083988A1 (ko) * 2013-12-03 2015-06-11 주식회사 케이티 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
EP3086559A4 (en) * 2013-12-16 2017-08-02 LG Electronics Inc. Signal transmission/reception device and signal transmission/reception method for providing trick play service
WO2015105399A1 (ko) * 2014-01-13 2015-07-16 삼성전자 주식회사 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치.
JP5886341B2 (ja) 2014-03-07 2016-03-16 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
JP6150134B2 (ja) * 2014-03-24 2017-06-21 ソニー株式会社 画像符号化装置および方法、画像復号装置および方法、プログラム、並びに記録媒体
US10284867B2 (en) 2014-12-18 2019-05-07 Nokia Technologies Oy Apparatus, a method and a computer program for video coding and decoding
WO2016204374A1 (ko) * 2015-06-18 2016-12-22 엘지전자 주식회사 영상 코딩 시스템에서 영상 필터링 방법 및 장치
KR102602690B1 (ko) * 2015-10-08 2023-11-16 한국전자통신연구원 화질에 기반한 적응적 부호화 및 복호화를 위한 방법 및 장치
CN116170588A (zh) * 2016-03-30 2023-05-26 韩国电子通信研究院 使用画面划分信息对视频进行编码和解码的方法和设备
CN109565612B (zh) * 2016-08-22 2021-09-03 索尼公司 发送装置、发送方法、接收装置和接收方法
JP6350638B2 (ja) * 2016-11-16 2018-07-04 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US10692262B2 (en) 2017-01-12 2020-06-23 Electronics And Telecommunications Research Institute Apparatus and method for processing information of multiple cameras
US11496761B2 (en) * 2018-06-30 2022-11-08 Sharp Kabushiki Kaisha Systems and methods for signaling picture types of pictures included in coded video
US10904545B2 (en) * 2018-12-26 2021-01-26 Tencent America LLC Method for syntax controlled decoded picture buffer management
KR20210145736A (ko) * 2019-03-11 2021-12-02 브이아이디 스케일, 인크. 서브-픽처 비트스트림 추출 및 재배치
WO2020184673A1 (ja) * 2019-03-12 2020-09-17 ソニー株式会社 画像復号装置、画像復号方法、画像符号化装置、および画像符号化方法
US11310560B2 (en) 2019-05-17 2022-04-19 Samsung Electronics Co., Ltd. Bitstream merger and extractor
WO2020235552A1 (en) * 2019-05-19 2020-11-26 Sharp Kabushiki Kaisha Systems and methods for signaling picture property information in video coding
KR102615093B1 (ko) * 2019-05-28 2023-12-19 삼성전자주식회사 작은 크기의 인트라 블록을 방지하기 위한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
CN113950842A (zh) * 2019-06-20 2022-01-18 索尼半导体解决方案公司 图像处理装置和方法
US11457242B2 (en) * 2019-06-24 2022-09-27 Qualcomm Incorporated Gradual random access (GRA) signalling in video coding
US11032548B2 (en) * 2019-06-24 2021-06-08 Tencent America LLC Signaling for reference picture resampling
KR20220038332A (ko) * 2019-07-02 2022-03-28 브이아이디 스케일, 인크. 스트리밍 서비스에서의 입체 콘텐츠 컴포넌트 서브-비트스트림의 동적 적응
EP3987771A4 (en) 2019-07-08 2022-08-24 Huawei Technologies Co., Ltd. MIXED NAL UNIT IMAGE RESTRICTIONS IN VIDEO ENCODING
CN110446047A (zh) * 2019-08-16 2019-11-12 苏州浪潮智能科技有限公司 视频码流的解码方法及装置
US11310492B2 (en) * 2019-09-20 2022-04-19 Tencent America LLC Signaling of inter layer prediction in video bitstream
CN113875249B (zh) * 2019-09-20 2025-03-18 韩国电子通信研究院 图像编码/解码方法和设备以及存储比特流的记录介质
BR112022005411A2 (pt) 2019-09-24 2022-06-21 Huawei Tech Co Ltd Sinalização de cabeçalho de imagem em codificação de vídeo
MX2022004193A (es) * 2019-10-07 2022-05-02 Huawei Tech Co Ltd Un codificador, un decodificador y metodos correspondientes.
KR102518819B1 (ko) * 2019-10-07 2023-04-06 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
CN115104315B (zh) * 2019-12-23 2025-09-05 Lg电子株式会社 基于nal单元相关信息的图像或视频编码
KR20250114563A (ko) * 2019-12-23 2025-07-29 엘지전자 주식회사 Nal 유닛 타입 기반 영상 또는 비디오 코딩
KR102837057B1 (ko) 2019-12-23 2025-07-21 엘지전자 주식회사 슬라이스 또는 픽처에 대한 nal 유닛 타입 기반 영상 또는 비디오 코딩
KR20220120628A (ko) 2019-12-27 2022-08-30 알리바바 그룹 홀딩 리미티드 서브화상 파티셔닝 정보를 시그널링하기 위한 방법 및 장치
CN115211121A (zh) * 2020-01-02 2022-10-18 Lg电子株式会社 Ph nal单元编码相关图像解码方法及其装置
WO2021137588A1 (ko) 2020-01-02 2021-07-08 엘지전자 주식회사 픽처 헤더를 포함하는 영상 정보를 코딩하는 영상 디코딩 방법 및 그 장치
WO2021137592A1 (ko) * 2020-01-02 2021-07-08 엘지전자 주식회사 영상 디코딩 방법 및 그 장치
CN120529096A (zh) * 2020-01-14 2025-08-22 Lg电子株式会社 图像解码和编码方法、发送比特流的方法及介质
WO2021172956A1 (ko) * 2020-02-28 2021-09-02 엘지전자 주식회사 영상 특징 정보 시그널링을 위한 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
EP4117290A4 (en) * 2020-03-05 2024-03-20 LG Electronics, Inc. METHOD AND DEVICE FOR IMAGE ENCODING/DECODING BASED ON MIXED NAL UNIT TYPE AND METHOD FOR TRANSMITTING BIT STREAM
EP4104428A4 (en) 2020-03-16 2023-05-03 ByteDance Inc. DIRECT ACCESS POINT ACCESS UNIT IN SCALABLE VIDEO ENCODING
EP4111701A4 (en) 2020-03-17 2023-06-28 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods
KR102406846B1 (ko) * 2020-03-18 2022-06-10 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
KR20220157455A (ko) * 2020-03-20 2022-11-29 인터디지털 브이씨 홀딩스 프랑스 이미지 인코딩 및 디코딩을 위한 방법 및 디바이스
CN113453006B (zh) * 2020-03-25 2024-04-16 腾讯美国有限责任公司 一种图片封装方法、设备以及存储介质
KR20260037179A (ko) * 2020-03-30 2026-03-17 엘지전자 주식회사 Sps 내 ptl, dpb 및 hrd 관련 정보를 시그널링하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 컴퓨터 판독 가능한 기록 매체
WO2021210860A1 (ko) * 2020-04-12 2021-10-21 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
CN115552903B (zh) 2020-05-12 2025-09-16 Lg电子株式会社 视频解码方法、视频编码方法和发送图像数据的方法
CN116134823A (zh) * 2020-05-25 2023-05-16 Lg电子株式会社 基于多层的图像编码设备和方法
KR102421720B1 (ko) * 2020-05-29 2022-07-18 삼성전자주식회사 영상의 ai 부호화 및 ai 복호화를 위한 장치, 및 방법
US11223841B2 (en) * 2020-05-29 2022-01-11 Samsung Electronics Co., Ltd. Apparatus and method for performing artificial intelligence encoding and artificial intelligence decoding on image
WO2021251611A1 (en) 2020-06-11 2021-12-16 Samsung Electronics Co., Ltd. Apparatus and method for performing artificial intelligence encoding and decoding on image by using low-complexity neural network
WO2022213006A1 (en) * 2021-04-02 2022-10-06 Qualcomm Incorporated Picture orientation and quality metrics supplemental enhancement information message for video coding
US20220321918A1 (en) 2021-04-02 2022-10-06 Qualcomm Incorporated Picture orientation and quality metrics supplemental enhancement information message for video coding
EP4084474A1 (en) * 2021-04-28 2022-11-02 Koninklijke Philips N.V. Low complexity multilayer images with depth
WO2024167266A1 (ko) * 2023-02-09 2024-08-15 삼성전자 주식회사 전자 장치 및 전자 장치에서 스케일러블 코덱을 처리하는 방법
WO2025230284A1 (ko) * 2024-04-30 2025-11-06 경희대학교 산학협력단 적응적 복호화기 계산 기술 기반의 비디오 부호화 및 복호화를 위한 방법 및 장치
WO2026014804A1 (ko) * 2024-07-09 2026-01-15 엘지전자 주식회사 영상 부호화 방법, 영상 부호화 장치, 영상 복호화 방법, 영상 복호화 장치, 비트스트림을 전송하는 방법 및 비트스트림을 저장한 기록매체

Family Cites Families (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1578136A3 (en) * 1998-01-27 2005-10-19 AT&T Corp. Method and apparatus for encoding video shape and texture information
US6895048B2 (en) * 1998-03-20 2005-05-17 International Business Machines Corporation Adaptive encoding of a sequence of still frames or partially still frames within motion video
EP1500002A1 (en) * 2002-04-29 2005-01-26 Sony Electronics Inc. Supporting advanced coding formats in media files
US8752197B2 (en) * 2002-06-18 2014-06-10 International Business Machines Corporation Application independent system, method, and architecture for privacy protection, enhancement, control, and accountability in imaging service systems
CN100423581C (zh) * 2002-12-30 2008-10-01 Nxp股份有限公司 动态图形的编码/解码方法及其设备
JP4479160B2 (ja) * 2003-03-11 2010-06-09 チッソ株式会社 シルセスキオキサン誘導体を用いて得られる重合体
CA2547628C (en) 2003-12-01 2013-03-05 Samsung Electronics Co., Ltd. Method and apparatus for scalable video encoding and decoding
KR100596706B1 (ko) 2003-12-01 2006-07-04 삼성전자주식회사 스케일러블 비디오 코딩 및 디코딩 방법, 이를 위한 장치
US7415069B2 (en) * 2003-12-09 2008-08-19 Lsi Corporation Method for activation and deactivation of infrequently changing sequence and picture parameter sets
US7586924B2 (en) * 2004-02-27 2009-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream
ES2356745T3 (es) * 2004-06-02 2011-04-12 Panasonic Corporation Aparato de codificación de imagen y aparato de decodificación de imagen.
JP4575129B2 (ja) * 2004-12-02 2010-11-04 ソニー株式会社 データ処理装置およびデータ処理方法、並びにプログラムおよびプログラム記録媒体
KR20060068254A (ko) 2004-12-16 2006-06-21 엘지전자 주식회사 비디오 부호화 방법, 복호화 방법 그리고, 복호화 장치
JP2006203661A (ja) * 2005-01-21 2006-08-03 Toshiba Corp 動画像符号化装置、動画像復号装置及び符号化ストリーム生成方法
JP2006211274A (ja) * 2005-01-27 2006-08-10 Toshiba Corp 記録媒体、この記録媒体を再生する方法並びにその再生装置及び記録媒体に映像データを記録する記録装置並びにその記録方法
WO2006109117A1 (en) * 2005-04-13 2006-10-19 Nokia Corporation Method, device and system for effectively coding and decoding of video data
JP2008536420A (ja) 2005-04-13 2008-09-04 ノキア コーポレイション スケーラビリティ情報の符号化、格納およびシグナリング
KR100878811B1 (ko) 2005-05-26 2009-01-14 엘지전자 주식회사 비디오 신호의 디코딩 방법 및 이의 장치
WO2006126841A1 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method for providing and using information about inter-layer prediction for video signal
EP1773063A1 (en) 2005-06-14 2007-04-11 Thomson Licensing Method and apparatus for encoding video data, and method and apparatus for decoding video data
FR2888424A1 (fr) * 2005-07-07 2007-01-12 Thomson Licensing Sas Dispositif et procede de codage et de decodage de donnees video et train de donnees
CN101317459A (zh) * 2005-10-11 2008-12-03 诺基亚公司 用于可伸缩视频编码的有效解码图像缓存管理
US20100158133A1 (en) * 2005-10-12 2010-06-24 Peng Yin Method and Apparatus for Using High-Level Syntax in Scalable Video Encoding and Decoding
BRPI0616745A2 (pt) * 2005-10-19 2011-06-28 Thomson Licensing codificação / decodificação de vìdeo com múltiplas visualizações usando codificação / decodificação de vìdeo escalonável
KR100763196B1 (ko) 2005-10-19 2007-10-04 삼성전자주식회사 어떤 계층의 플래그를 계층간의 연관성을 이용하여부호화하는 방법, 상기 부호화된 플래그를 복호화하는방법, 및 장치
KR100889745B1 (ko) 2006-01-09 2009-03-24 한국전자통신연구원 날 유닛 타입 표시방법 및 그에 따른 비트스트림 전달장치및 리던던트 슬라이스 부호화 장치
JP4731343B2 (ja) * 2006-02-06 2011-07-20 富士通東芝モバイルコミュニケーションズ株式会社 復号装置
EP1827023A1 (en) * 2006-02-27 2007-08-29 THOMSON Licensing Method and apparatus for packet loss detection and virtual packet generation at SVC decoders
US8767836B2 (en) * 2006-03-27 2014-07-01 Nokia Corporation Picture delimiter in scalable video coding
JP2009531967A (ja) * 2006-03-29 2009-09-03 トムソン ライセンシング マルチビュービデオ符号化方法および装置
CN101491095B (zh) * 2006-03-30 2013-07-10 Lg电子株式会社 用于解码/编码视频信号的方法和装置
KR101450921B1 (ko) * 2006-07-05 2014-10-15 톰슨 라이센싱 멀티뷰 비디오 엔코딩 및 디코딩을 위한 방법 및 장치
KR20080007086A (ko) * 2006-07-14 2008-01-17 엘지전자 주식회사 비디오 신호의 디코딩/인코딩 방법 및 장치
WO2008023967A1 (en) 2006-08-25 2008-02-28 Lg Electronics Inc A method and apparatus for decoding/encoding a video signal
WO2008030067A1 (en) 2006-09-07 2008-03-13 Lg Electronics Inc. Method and apparatus for decoding/encoding of a video signal
CN101401433A (zh) * 2006-09-07 2009-04-01 Lg电子株式会社 用于解码/编码视频信号的方法及装置
JP5087627B2 (ja) * 2006-09-28 2012-12-05 トムソン ライセンシング 効果的なレート制御および拡張したビデオ符号化品質のためのρ領域フレームレベルビット割り当てのための方法
EP2077037A2 (en) * 2006-10-16 2009-07-08 Thomson Licensing Method for using a network abstract layer unit to signal an instantaneous decoding refresh during a video operation
CN101548550B (zh) * 2006-10-16 2014-08-27 诺基亚公司 用于在多视点视频编码中实施有效的已解码缓存器管理的系统和方法
AU2007309634A1 (en) * 2006-10-24 2008-05-02 Thomson Licensing Picture management for multi-view video coding
JP2009538084A (ja) * 2006-11-17 2009-10-29 エルジー エレクトロニクス インコーポレイティド ビデオ信号のデコーディング/エンコーディング方法及び装置
JP5157140B2 (ja) * 2006-11-29 2013-03-06 ソニー株式会社 記録装置、記録方法、情報処理装置、情報処理方法、撮像装置およびビデオシステム
EP2418852B1 (en) * 2006-12-21 2018-08-22 Thomson Licensing Methods and apparatus for improved signaling using high level syntax for multi-view video coding and decoding
BRPI0720702A2 (pt) 2007-01-05 2014-02-18 Thomson Licensing Decodificador hipotético de referência para codificação de vídeo escalável
EP1994721A4 (en) * 2007-01-12 2013-09-25 Univ Kyung Hee Univ Ind Coop Group PACKAGE FORMAT OF A NETWORK ABSTRACTION LAYER UNIT, ALGORITHM AND DEVICE FOR VIDEO ENCODING AND DECODING USING THIS FORMAT, ALGORITHM FOR SERVICE PROTECTION AND DEVICE FOR IPv6 LABEL BASED TRANSMISSION USING THIS FORMAT
JP5023739B2 (ja) * 2007-02-28 2012-09-12 ソニー株式会社 画像情報符号化装置及び符号化方法
JP5156088B2 (ja) 2007-03-23 2013-03-06 エルジー エレクトロニクス インコーポレイティド ビデオ信号のデコーディング/エンコーディング方法及び装置
EP3968642A1 (en) * 2007-04-12 2022-03-16 InterDigital VC Holdings, Inc. Methods and apparatus for video usability information (vui) for scalable video coding (svc)
US20100142613A1 (en) * 2007-04-18 2010-06-10 Lihua Zhu Method for encoding video data in a scalable manner
KR101556131B1 (ko) 2007-08-24 2015-09-30 엘지전자 주식회사 디지털 방송 시스템 및 데이터 처리 방법
WO2009048502A2 (en) * 2007-10-05 2009-04-16 Thomson Licensing Methods and apparatus for incorporating video usability information (vui) within a multi-view video (mvc) coding system
KR101345287B1 (ko) 2007-10-12 2013-12-27 삼성전자주식회사 스케일러블 영상 부호화 방법 및 장치와 그 영상 복호화방법 및 장치
CN102106146B (zh) 2008-07-22 2016-08-17 汤姆森许可贸易公司 可缩放视频解码中增强层分组丢失错误的隐藏方法
US8699562B2 (en) * 2008-10-06 2014-04-15 Lg Electronics Inc. Method and an apparatus for processing a video signal with blocks in direct or skip mode
US20100226227A1 (en) * 2009-03-09 2010-09-09 Chih-Ching Yu Methods and apparatuses of processing readback signal generated from reading optical storage medium
JP5332773B2 (ja) * 2009-03-18 2013-11-06 ソニー株式会社 画像処理装置および方法
CA2711311C (en) * 2009-08-10 2016-08-23 Seawell Networks Inc. Methods and systems for scalable video chunking
KR101124723B1 (ko) * 2009-08-21 2012-03-23 에스케이플래닛 주식회사 해상도 시그널링을 이용한 스케일러블 비디오 재생 시스템 및 방법
US8976871B2 (en) * 2009-09-16 2015-03-10 Qualcomm Incorporated Media extractor tracks for file format track selection
EA021750B1 (ru) 2009-10-30 2015-08-31 Панасоник Интеллекчуал Проперти Корпорэйшн оф Америка Способ декодирования, декодирующее устройство, способ кодирования и кодирующее устройство
EP2346261A1 (en) * 2009-11-18 2011-07-20 Tektronix International Sales GmbH Method and apparatus for multiplexing H.264 elementary streams without timing information coded
CN102103651B (zh) 2009-12-21 2012-11-14 中国移动通信集团公司 一种一卡通系统的实现方法和系统以及一种智能卡
US9185439B2 (en) 2010-07-15 2015-11-10 Qualcomm Incorporated Signaling data for multiplexing video components
KR20120015260A (ko) 2010-07-20 2012-02-21 한국전자통신연구원 스케일러빌리티 및 뷰 정보를 제공하는 스트리밍 서비스를 위한 방법 및 장치
KR20120038870A (ko) 2010-10-14 2012-04-24 정태길 클라우드 컴퓨팅 기반의 모바일 오피스 프린팅 부가 서비스 방법
KR101158244B1 (ko) 2010-12-14 2012-07-20 주식회사 동호 하천 친환경 생태 조성 구조체 및 시스템
JP2012142551A (ja) 2010-12-16 2012-07-26 Nisshin:Kk 加熱処理方法およびその装置
KR101740425B1 (ko) 2010-12-23 2017-05-26 에스케이텔레콤 주식회사 중계기 및 상기 중계기의 신호 중계 방법
KR101214465B1 (ko) 2010-12-30 2012-12-21 주식회사 신한엘리베이타 가볍고 방수성이 우수한 방수발판부재가 구비된 에스컬레이터 장치
CA2824741C (en) 2011-01-14 2016-08-30 Vidyo, Inc. Improved nal unit header
US20120230409A1 (en) * 2011-03-07 2012-09-13 Qualcomm Incorporated Decoded picture buffer management
AU2012225513B2 (en) * 2011-03-10 2016-06-23 Vidyo, Inc. Dependency parameter set for scalable video coding
JP5708124B2 (ja) 2011-03-25 2015-04-30 三菱電機株式会社 半導体装置
ES2595732T3 (es) 2011-06-30 2017-01-03 Telefonaktiebolaget Lm Ericsson (Publ) Señalización de imágenes de referencia
US20130114743A1 (en) 2011-07-13 2013-05-09 Rickard Sjöberg Encoder, decoder and methods thereof for reference picture management
US10034018B2 (en) 2011-09-23 2018-07-24 Velos Media, Llc Decoded picture buffer management
US10158873B2 (en) * 2011-11-30 2018-12-18 Qualcomm Incorporated Depth component removal for multiview video coding (MVC) compatible three-dimensional video coding (3DVC)
US9451252B2 (en) * 2012-01-14 2016-09-20 Qualcomm Incorporated Coding parameter sets and NAL unit headers for video coding
RS64003B1 (sr) 2012-04-13 2023-03-31 Ge Video Compression Llc Kodiranje slike sa niskim kašnjenjem
KR20130116782A (ko) 2012-04-16 2013-10-24 한국전자통신연구원 계층적 비디오 부호화에서의 계층정보 표현방식
US9426462B2 (en) * 2012-09-21 2016-08-23 Qualcomm Incorporated Indication and activation of parameter sets for video coding
RU2610670C1 (ru) * 2012-12-21 2017-02-14 Телефонактиеболагет Л М Эрикссон (Пабл) Кодирование и декодирование многоуровневого видеопотока
WO2014162739A1 (en) * 2013-04-05 2014-10-09 Sharp Kabushiki Kaisha Decoding of inter-layer reference picture set and reference picture list construction
US9565437B2 (en) * 2013-04-08 2017-02-07 Qualcomm Incorporated Parameter set designs for video coding extensions

Also Published As

Publication number Publication date
JP7367145B2 (ja) 2023-10-23
US20240205428A1 (en) 2024-06-20
PL3570546T3 (pl) 2025-05-12
KR101953703B1 (ko) 2019-03-05
JP7583890B2 (ja) 2024-11-14
KR20140071516A (ko) 2014-06-11
HRP20191726T1 (hr) 2020-01-24
JP2016178665A (ja) 2016-10-06
KR101904258B1 (ko) 2018-10-05
JP6871312B2 (ja) 2021-05-12
CN104303503B (zh) 2018-05-22
KR20130116782A (ko) 2013-10-24
US12267510B2 (en) 2025-04-01
CY1122257T1 (el) 2020-11-25
KR101739748B1 (ko) 2017-05-25
CN108769713A (zh) 2018-11-06
JP6841869B2 (ja) 2021-03-10
JP7305831B2 (ja) 2023-07-10
JP2021108492A (ja) 2021-07-29
JP6163230B2 (ja) 2017-07-12
JP6553245B2 (ja) 2019-07-31
JP2022160641A (ja) 2022-10-19
KR101673291B1 (ko) 2016-11-09
JP6553246B2 (ja) 2019-07-31
JP2018152872A (ja) 2018-09-27
JP6163229B2 (ja) 2017-07-12
EP3340630B1 (en) 2021-06-30
CN104303503A (zh) 2015-01-21
JP2018152868A (ja) 2018-09-27
KR101488493B1 (ko) 2015-02-03
EP4546788A3 (en) 2025-05-21
US20240155140A1 (en) 2024-05-09
US11949890B2 (en) 2024-04-02
JP2018152871A (ja) 2018-09-27
EP3893511A1 (en) 2021-10-13
KR101904242B1 (ko) 2018-10-05
CN108769687A (zh) 2018-11-06
JP2018152866A (ja) 2018-09-27
CN108769711B (zh) 2021-08-10
JP7041294B2 (ja) 2022-03-23
JP2016178664A (ja) 2016-10-06
JP2016174384A (ja) 2016-09-29
PL3340630T3 (pl) 2021-11-08
US12028538B2 (en) 2024-07-02
CN108769709A (zh) 2018-11-06
JP2016174385A (ja) 2016-09-29
KR101931719B1 (ko) 2018-12-24
KR101719344B1 (ko) 2017-03-24
KR20180035755A (ko) 2018-04-06
US20230035462A1 (en) 2023-02-02
CN108769705A (zh) 2018-11-06
KR20170117935A (ko) 2017-10-24
JP6556905B2 (ja) 2019-08-07
US11490100B2 (en) 2022-11-01
KR20180035758A (ko) 2018-04-06
CN108769713B (zh) 2023-09-26
US20250234017A1 (en) 2025-07-17
KR20190025584A (ko) 2019-03-11
KR101488496B1 (ko) 2015-02-03
PL4546788T3 (pl) 2026-04-13
EP3866472A1 (en) 2021-08-18
US20150063453A1 (en) 2015-03-05
US10958918B2 (en) 2021-03-23
JP7367142B2 (ja) 2023-10-23
SI2840788T1 (sl) 2020-01-31
JP2022091806A (ja) 2022-06-21
KR20180035760A (ko) 2018-04-06
KR101904255B1 (ko) 2018-10-05
CN108769686A (zh) 2018-11-06
JP6224163B2 (ja) 2017-11-01
JP2021093747A (ja) 2021-06-17
JP2016146636A (ja) 2016-08-12
JP2022160640A (ja) 2022-10-19
JP7367141B2 (ja) 2023-10-23
EP3570546B1 (en) 2025-03-19
JP2019198103A (ja) 2019-11-14
JP2022160642A (ja) 2022-10-19
JP2018152864A (ja) 2018-09-27
JP2022160679A (ja) 2022-10-19
EP2840788A4 (en) 2016-07-06
HUE070890T2 (hu) 2025-07-28
EP2840787A1 (en) 2015-02-25
KR101904234B1 (ko) 2018-10-05
KR101904247B1 (ko) 2018-10-05
US20250193420A1 (en) 2025-06-12
CN108769705B (zh) 2023-06-30
JP2017225148A (ja) 2017-12-21
EP3340630A1 (en) 2018-06-27
KR101904264B1 (ko) 2018-10-05
KR20140071514A (ko) 2014-06-11
CN108769707A (zh) 2018-11-06
KR101488495B1 (ko) 2015-02-03
EP4546788B1 (en) 2026-02-04
KR20180036927A (ko) 2018-04-10
CN108769710B (zh) 2021-04-30
US11483578B2 (en) 2022-10-25
KR101640583B1 (ko) 2016-07-19
KR20180035757A (ko) 2018-04-06
CN108769708B (zh) 2021-02-19
EP2840788B1 (en) 2019-08-14
CN108769687B (zh) 2022-10-04
US10958919B2 (en) 2021-03-23
CN108769709B (zh) 2021-02-19
JP7641416B2 (ja) 2025-03-06
CN108769708A (zh) 2018-11-06
US20230032927A1 (en) 2023-02-02
KR20140071515A (ko) 2014-06-11
WO2013157828A1 (ko) 2013-10-24
EP4546788A2 (en) 2025-04-30
JP7367143B2 (ja) 2023-10-23
US10602160B2 (en) 2020-03-24
US20200169741A1 (en) 2020-05-28
KR20180036928A (ko) 2018-04-10
CN108769712A (zh) 2018-11-06
JP7432668B2 (ja) 2024-02-16
JP2018152874A (ja) 2018-09-27
JP6224162B2 (ja) 2017-11-01
KR101843565B1 (ko) 2018-03-30
RS59596B1 (sr) 2020-01-31
JP2022160644A (ja) 2022-10-19
JP2023179726A (ja) 2023-12-19
JP6549189B2 (ja) 2019-07-24
JP2018152867A (ja) 2018-09-27
US20200177895A1 (en) 2020-06-04
JP7123210B2 (ja) 2022-08-22
US20210176481A1 (en) 2021-06-10
US10595026B2 (en) 2020-03-17
JP6556907B2 (ja) 2019-08-07
US20150092836A1 (en) 2015-04-02
JP7431290B2 (ja) 2024-02-14
JP6556904B2 (ja) 2019-08-07
JP6549283B2 (ja) 2019-07-24
KR20170017965A (ko) 2017-02-15
KR20140074875A (ko) 2014-06-18
CN108769711A (zh) 2018-11-06
HUE045980T2 (hu) 2020-02-28
ES3062931T3 (en) 2026-04-14
JP2024050775A (ja) 2024-04-10
JP7367144B2 (ja) 2023-10-23
PL2840788T3 (pl) 2020-06-01
DK2840788T3 (da) 2019-10-07
KR20130118254A (ko) 2013-10-29
KR101488494B1 (ko) 2015-02-03
KR20160086806A (ko) 2016-07-20
JP2022160645A (ja) 2022-10-19
KR20140071517A (ko) 2014-06-11
EP2840788A1 (en) 2015-02-25
EP4546788C0 (en) 2026-02-04
JP2018152873A (ja) 2018-09-27
KR20130118253A (ko) 2013-10-29
US12289459B2 (en) 2025-04-29
JP5933815B2 (ja) 2016-06-15
CN108769706B (zh) 2023-04-14
KR101904237B1 (ko) 2018-10-05
WO2013157826A1 (ko) 2013-10-24
CN108769686B (zh) 2021-07-27
CN108769712B (zh) 2021-11-19
KR101378861B1 (ko) 2014-04-02
JP6549282B2 (ja) 2019-07-24
CN108769710A (zh) 2018-11-06
EP3570546C0 (en) 2025-03-19
SMT201900537T1 (it) 2020-01-14
KR20180035754A (ko) 2018-04-06
JP2018152865A (ja) 2018-09-27
JP6556903B2 (ja) 2019-08-07
JP2022160680A (ja) 2022-10-19
KR102062329B1 (ko) 2020-01-03
KR20180035759A (ko) 2018-04-06
JP6186026B2 (ja) 2017-08-23
EP3086556A1 (en) 2016-10-26
KR101719345B1 (ko) 2017-03-24
KR101843566B1 (ko) 2018-03-30
EP3570546A1 (en) 2019-11-20
JP2015517274A (ja) 2015-06-18
ES2748463T3 (es) 2020-03-16
JP2019198102A (ja) 2019-11-14
KR20160086805A (ko) 2016-07-20
KR20130116783A (ko) 2013-10-24
CN108769706A (zh) 2018-11-06
LT2840788T (lt) 2019-12-10
PT2840788T (pt) 2019-10-18
CN108769707B (zh) 2023-08-25
KR20160086807A (ko) 2016-07-20
KR20130129338A (ko) 2013-11-28
EP2840787A4 (en) 2016-03-16
JP6556906B2 (ja) 2019-08-07
US20210136393A1 (en) 2021-05-06

Similar Documents

Publication Publication Date Title
ES3020385T3 (en) Video coding and decoding with marking of a picture as non-reference picture or reference picture
HK40057082A (en) Video decoding apparatus and video encoding apparatus
HK40000119B (en) Video decoding method and device, and video coding method and device
HK40000113B (zh) 视频编码和解码方法、存储和生成位流的方法
HK40000121B (zh) 视频编码和解码方法、存储和生成位流的方法
HK40000111B (zh) 视频编码和解码方法、存储和生成位流的方法