ES2376540T3 - Compresión de imagen por dct de tamaño de bloque adaptativo en base a la varianza. - Google Patents

Compresión de imagen por dct de tamaño de bloque adaptativo en base a la varianza. Download PDF

Info

Publication number
ES2376540T3
ES2376540T3 ES00977131T ES00977131T ES2376540T3 ES 2376540 T3 ES2376540 T3 ES 2376540T3 ES 00977131 T ES00977131 T ES 00977131T ES 00977131 T ES00977131 T ES 00977131T ES 2376540 T3 ES2376540 T3 ES 2376540T3
Authority
ES
Spain
Prior art keywords
block
variance
data
pixel data
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES00977131T
Other languages
English (en)
Inventor
Kadayam Thyagarajan
Michael J. Merritt
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Application granted granted Critical
Publication of ES2376540T3 publication Critical patent/ES2376540T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un procedimiento para la determinación de una asignación de tamaño de bloque para un bloque entrante de píxeles de imagen que va a ser utilizado en la compresión de dicho bloque entrante, que comprende las etapas de: la lectura de un boque de datos de píxeles; la generación de una asignación de tamaño de bloque para el bloque de datos de píxeles en base a las varianzas de los valores de píxeles de dicho bloque de datos de píxeles y de bloques subdivididos de dicho bloque de datos de píxeles, en el que dicha etapa de generación comprende así mismo las etapas de: la determinación de una varianza de valores de píxeles para dicho bloque de datos de píxeles, en el que la varianza se calcula sobre todos los píxeles del bloque; la comparación de dicha varianza con un umbral, en el quel dicho umbral es una función del valor de píxel medio del bloque que está siendo evaluado; la toma de una decisión para subdividir dicho bloque si dicha varianza es mayor que dicho umbral; si dicha decisión es la de subdividir dicho bloque, entonces la repetición de las etapas de determinación, comparación y toma de decisión para cada bloque subdividido hasta que se satisfaga un criterio predeterminado; y la designación como dicha asignación de tamaño de bloque a cada bloque que no está más subdividido; y la provisión de una estructura de datos que contenga la información acerca de dicha asignación de tamaño de bloque.

Description

Compresion de imagen por DCT de tamaro de bloque adaptativo en base a la varianza
Antecedentes de la invención
I. Campo de la invención
La presente invencion se refiere al campo del procesamiento de imagen. Mas concretamente, la presente invencion se refiere a un esquema de compresion para serales de imagen que utiliza unos bloques y subbloques dimensionados de manera adaptativa de los datos de coeficientes codificados de la transformada de coseno discreta.
II. Descripción de la técnica relacionada
En el campo de la transmision y recepcion de serales de video tal y como se utilizan para la proyeccion de "filmes"
o "peliculas", se han realizado diversas mejoras respecto de las tecnicas de compresion de imagen. Muchos de los sistemas de video actuales y propuestos hacen uso de tecnicas de codificacion digital. La codificacion digital proporciona una robustez en el enlace de comunicaciones la cual ofrece resistencia a problemas tales como el desvanecimiento por multitrayectoria y la perturbacion o la transferencia de la seral, cada una de las cuales podria en otro caso provocar una seria degradacion de la calidad de la imagen. Asi mismo, las tecnicas digitales facilitan el uso de tecnicas de encriptacion de la seral, las cuales han resultado utiles o incluso necesarias en aplicaciones gubernamentales y en otras muchas de difusion comercial recientemente desarrolladas.
El video de alta definicion es un area que aprovecha las tecnicas mejoradas de compresion de imagenes. Cuando se propuso por primera vez, la transmision por las ondas del video de alta definicion (o incluso la transmision cableada o por fibra optica parecio escasamente practica debido a los excesivos condicionamientos del ancho de banda. Los sistemas de transmision inalambricos tipicos, o de otro tipo que se estaban diserando no se ajustaban con facilidad en la medida suficiente al ancho de banda. Sin embargo, se ha llegado al convencimiento de que la compresion de serales de video digitales puede conseguirse hasta un nivel que permita la transmision utilizando anchos de banda razonables. Dichos niveles de compresion de la seral, acoplados con la transmision digital de la seral, permitira un sistema de video que transmita con menor potencia y con una mayor inmunidad respecto de las perturbaciones del canal ocupando al tiempo un ancho de banda mas conveniente y util.
Una tecnica de compresion capaz de ofrecer niveles significativos de compresion preservando al tiempo el nivel de calidad deseado de las serales de video utiliza un bloque y unos subbloques dimensionados de forma adaptativa de los datos de coeficientes codificados de la Transformada de Coseno Discreta (DCT). Esta tecnica se designara en lo sucesivo como el procedimiento de la Transformada de Coseno Diferencial del Tamaro de Bloque Adaptativo (ABSDCT). Esta tecnica se divulga en la Patente estadounidense No. 5,021,891, titulada "Procedimiento y Sistema de Compresión de Imágenes del Tamaño de Bloque Adaptativo” ["Adaptative Block Size Image Compression Method And System”1 transferida al cesionario de la presente invencion. Las tecnicas de DCT se divulgan, asi mismo, en la Patente estadounidense No. 5,107,345, titulada "Procedimiento Y Sistema de Compresión de Imágenes del tamaño de Bloque Adaptativo” ["Adaptative Block Size Image Compression Method And System”1 transferida al cesionario de la presente invencion. Asi mismo, el uso de la tecnica ABSDCT en combinacion con la tecnica de la Transformada de Arbol Cuaternario Diferencial se analiza en la Patente estadounidense No. 5,452,104, titulada "Procedimiento Y Sistema de Compresión de Imágenes del tamaño de Bloque Adaptativo” ["Adaptative Block Size Image Compression Image Method And System”1, transferido, tambien al cesionario de la presente invencion. Los sistemas divulgados en estas patentes utilizan lo que se designa como una codificacion "intertramass", en la que cada trama de los datos de imagen es codificada sin consideracion al contenido de cualquier otra trama. Al utilizar la tecnica ABSDCT, puede ser reducida la tasa de transmision de datos obtenible desde alrededor de 1,5 miles de millones de bits por segundo hasta aproximadamente 50 millones de bits por segundo sin una degradacion apreciable de la calidad de la imagen.
La tecnica ABSDCT puede ser utilizada para comprimir una imagen o seral ya sea en blanco o negro o en color que represente la imagen. La seral entrante de color puede concretarse en un formato YIQ, siendo Y la luminancia, o el brillo, la muestra, y siendo I y Q la crominancia o el color, las muestras para cada bloque de pixeles de 4 x 4. Pueden, asi mismo, ser utilizados otros formatos conocidos como por ejemplo los formatos YUV o RGB. Debido a la baja sensibilidad espacial del ojo al color, la mayor parte de la investigacion ha mostrado que una submuestra de los componentes de color mediante un factor de cuatro en las direcciones horizontal y vertical es razonable. De acuerdo con ello, una seral de video puede ser representada por cuatro componentes de luminancia y dos componentes de crominancia.
Utilizando la ABSDCT, una seral de video resultara segmentada, en terminos generales, en bloques de pixeles para su procesamiento. Para cada bloque, los componentes de luminancia y crominancia son transferidos a un intercalador de bloques. Por ejemplo, un bloque de 16 x 16 (pixeles) puede ser presentado al intercalador de bloques, el cual ordena y organiza las muestras de imagenes dentro de cada bloque de 16 x 16 para producir bloques y subbloques compuestos de datos para el analisis de la transformada de coseno discreta (DCT). El operador de la DCT es un procedimiento de conversion de una seral muestreada en funcion del tiempo en una representacion frecuencial de la misma seral. Mediante la conversion en una representacion frecuencial, las tecnicas de la DCT se ha demostrado que permiten muy elevados niveles de compresion, en cuanto unos cuantificadores pueden ser diserados para aprovechar las caracteristicas de distribucion de frecuencias de una imagen. En una forma de realizacion, DCT de 16 x 16 es aplicada en una primera ordenacion, cuatro DCTs de 8 x 8 son aplicadas en una segunda ordenacion. 16 DCTs de 4 x 4 son aplicadas en una tercera ordenacion y 64 DCTs de 2 x 2 son aplicadas en una cuarta ordenacion.
La operacion de la DCT reduce la redundancia espacialinherente en la fuente de video. Despues de que se ha llevado a cabo la DCT, la mayoria de la energia de las serales de video tiende a concentrarse en unos pocos coeficientes de la DCT. Una transformada adicional, la Transformada de Arbol Cuaternario Diferencial (DQT), puede ser utilizada para reducir la redundancia entre dos coeficientes de la DCT.
Para el bloque de 16 x 16 y para cada subbloque, los valores de los coeficientes de la DCT y el valor de la DQT (si se ut iliza l a D QT) so n anal izados para d eterminar el numero d e bi ts r equerido par a co dificar el bloque o el subbloque. A continuacion, el bloque o la combinacion de subbloques que requiera la codificacion del menor numero posible de bits, es elegido para representar el segmento de imagen. Por ejemplo, dos subbloques de 8 x 8, seis subbloques de 4 x 4 y ocho subbloque de 2 x 2 pueden ser elegidos para representar el segmento de imagen.
El bloque o combinacion de subbloques elegido es, a continuacion, adecuadamente dispuesto por orden en un bloque de 16 x 16. Los valores de los coeficientes de las DCT / DQT pueden a continuacion ser sometidas a una ponderacion de frecuencias, a una codificacion y a una cuantificacion (como por ejemplo una codificacion de longitud variable) como preparacion para la transmision.
Aunque la tecnica ABSDCT descrita con anterioridad funciona sorprendentemente bien, es intensiva desde el punto de vista computacional. Asi, puede resultar dificil la implementacion de la tecnica con un hardware compacto. Se desea una tecnica alternativa que consiga una implementacion del hardware mas eficiente. Un procedimiento y un sistema de compresion de imagen que es mas eficiente desde el punto de vista computacional se proporciona mediante la presente invencion de la manera descrita en las lineas que siguen.
El trabajo "Compresion de Imagen Segmentacion de Tamaros de Bloque Variables" ["Image Compression with Variable Block Size Segmentation"1, de Vaisey J. et al., IEEE Transactions on SignalProcessing, vol. 40, No. 8 agosto de 1 992, p aginas 2040 - 2060 descr ibe un pr ocedimiento d e co mpresion de i magen m ediante la segmentacion de una imagen en zonas de tamaros diferentes.
Divulga un procedimiento para la determinacion de una asignacion de tamaro de bloque para un bloque de entrada de l os pixeles de imagen q ue va n a se r ut ilizados en l a co mpresion del b loque entrante, co mprendiendo e l procedimiento las etapas de lectura de un bloque de datos de pixeles, la generacion de una asignacion de tamaro de bloque para los bloques de los datos de pixeles basados en las varianzas de los valores de los pixeles de dichos bloque de datos de pixeles y de los bloques subdivididos de dicho bloque de datos de pixeles, en el que la etapa de generacion adicional comprende las etapas de la determinacion de una varianza de valores de pixeles para dicho bloque de datos de pixeles en el que la varianza se calcula sobre todos los pixeles del bloque; la comparacion de dicha varianza con un umbral; la toma de una decision para subdividir dicho bloque si dicha varianza es mayor que dicho um bral; si dicha decision es l a s ubdividir d icho bl oque, l a r epeticion e ntonces de l as etapas d e l a determinacion, la comparacion y la toma de decision para cada bloque subdividido hasta que se satisfaga un criterio predeterminado; y la designacion como asignacion del tamaro del bloque de cada bloque que no se subdivide mas; y la provision de una informacion que contiene una estructura de datos sobre dicha asignacion del tamaro del bloque.
Sumario de la invención
La presente invencion se refiere a un procedimiento para la determinacion de la asignacion del tamaro del bloque para un bloque entrante de pixeles de imagen de acuerdo con lo definido en la reivindicacion 1, y a un sistema de compresion de imagen de acuerdo con lo definido en la reivindicacion 12.
La presente invencion es un sistema y un procedimiento de compresion de imagen que utiliza unos bloques y unos subbloques dimensionados de manera adaptativa de unos datos de coeficientes de la Transformada de Coseno Discreta. E n u na f orma de r ealizacion, el bloque d e pi xeles de 16 x 16 es introducido e n un co dificador. E l codificador comprende un elemento de asignacion del tamaro del bloque, el cual segmenta el bloque de pixeles entrante para su procesamiento. La asignacion del tamaro del bloque se basa en las varianzas del bloque entrante y de los bloques subdivididos. En general, las areas con mayores varianzas seran subdivididas en bloques mas pequeros, mientras que las areas con varianzas menores no seran subdivididas, con tal de que los valores medios de los bloques y de los subbloques se incluyan en unos margenes diferentes predeterminados.
De esta manera, en primera lugar, el umbral de la varianza de un bloque es modificado a partir de su valor nominal, dependiendo de su valor medio y, a continuacion, la varianza del bloque es comparada con un umbral, y si la varianza es mayor que el umbral, entonces el bloque se subdivide.
La asignacion del tamaro del bloque se proporciona a un elemento de la transformada, el cual transforma los datos de pixeles en datos en el dominio secuencial. La transformada se lleva a cabo solo sobre el bloque y los subbloques seleccionados mediante la asignacion del tamaro del bloque. Los datos de la transformada, a continuacion, son sometidos a una cuantificacion y a una serializacion. Por ejemplo, puede ser utilizado un escaneo en zigzag para serializar los datos para producir un flujo de datos. El flujo de datos puede, a continuacion, ser codificado mediante un codificador de longitud variable como preparacion para la transmision. Los datos codificados son enviados a
5 traves de un canal de transmision hasta un descodificador, donde los datos de pixeles son reconstruidos como preparacion para su representacion.
Breve descripción de los dibujos
Las caracteristicas distintivas, los objetivos y las ventajas de la presente invencion se pondran de manifiesto de forma mas acabada a partir de la descripcion detallada expuesta en las lineas que siguen tomada en combinacion
10 con los dibujos, en los cuales los mismos caracteres de referencia identifican los correspondientes elementos a lo largo de todos los dibujos, y en los que:
La FIG. 1 es un diagrama de bloques de un sistema de procesamiento de imagen que incorpora el sistema y el procedimiento de la presente invencion de asignacion del tamaro del bloque en base a la varianza;
la FIG. 2 es un diagrama de flujo que ilustra las etapas de procesamiento implicadas en la asignacion del 15 tamaro del bloque en base a la varianza;
las FIGS. 3a, 3b y 3c ilustran u na asi gnacion del tamaro d el bloque ej emplar, l a co rrespondiente descomposicion de arbol cuaternario, y los correspondientes datos de PQR.
Descripción detallada de las formas de realización preferentes
Con el fin de facilitar la transmision digital de serales digitalesydisfrutar de los correspondientes beneficios,es
20 necesario, e n terminos generales, em plear al guna f orma de co mpresion de la seral. P ara co nseguir un a a lta definicion en la imagen resultante es, asi mismo, de importancia que se mantenga la alta calidad de la imagen. Asi mismo, se desea una eficiencia computacional para una implementacion con un hardware compacto, lo que es importante en muchas aplicaciones.
La presente invencion proporciona un sistema o un aparato y un procedimiento de compresion de imagen que toma
25 en cuenta tanto la calidad de la imagen como la eficiencia computacional en la ejecucion de la compresion de la imagen. La compresion de la imagen de la presente invencion se basa en tecnicas de la Transformada de Coseno Discreta (DCT). En general, una imagen que va a ser procesada en el dominio digital estaria compuesta por unos datos de pixeles en un conjunto de bloques no superpuestos, de tamaro N x N. Una DCT de dos dimensiones puede ejecutarse sobre cada bloque. La DCT de dos dimensiones se define mediante la siguiente relacion:
35 donde
40 x(m, n) es la localizacion de los pixeles (m, n) dentro de un bloque N x M, y
X (k, l) es el correspondiente coeficiente de la DCT.
Dado que los valores de los pixeles son no negativos, el componente x (0, 0) de la DCT es siempre positivo, y generalmente tiene la mayor energia. De hecho, para imagenes tipicas, la mayoria de la energia de la transformada se concentra alrededor del componente X (0, 0). Esta propiedad de compactacion de la energia hace que la tecnica
45 de la DCT sea un procedimiento de compresion tan atractivo.
La tecnica de compresion de la imagen de la presente invencion utiliza una codificacion adaptativa de contraste para conseguir una reduccion adicional de latasa de transmision de bits. Se ha observado que las imagenes mas naturales estan compuestas por unas areas planas de variacion relativamente lenta, y unas areas activas como por ejemplo en los limites del objeto y con una textura de gran contraste. Los esquemas de codificacion adaptativos de contraste utilizan este factor mediante la asignacion de mas bits a las areas activas y menos bits a las areas menos activas.
La codificacion ada ptativa de co ntraste, asi m ismo, es util par a l a r educcion de l ef ecto de bl oqueo. E n l a implementacion de otras tecnicas de codificacion de la DCT, el efecto de bloqueo es quizas la perturbacion mas importante para la calidad de la imagen. Asi mismo, el efecto de bloqueo tiende a ser mas perceptible enareas activas de la imagen. Sin embargo, se ha llegado a comprender que el efecto de bloqueo se reduce cuando se utiliza una DCT de menor tamaro. El efecto de bloqueo resulta virtualmente invisible cuando se utiliza una DCT de 2 x 2, aunque pueden resentirse las prestaciones de bit por pixel. De esta manera, la codificacion adaptativa de contraste puede reducir el efecto de bloqueo mediante la asignacion de tamaros de bloque mas pequeros (y con ello de mas bits) hacia las areas activas y tamaros de bloque mayores hacia las areas relativamente vacias.
�tra caracteristica distintivade la presente invencion es que utiliza una codificacion intertramas(procesamiento espacial) en lugar de la codificacion intertramas (procesamiento espacio temporal). Una razon para la adopcion de la codificacion intertramas es la gran complejidad del receptor requerida para procesar las serales de codificacion intertramas. La codificacion intertramas requiere de forma inherente multiples memorias intermedias de trama ademas de unos circuitos de procesamiento mas complejos. En muchas aplicaciones, se necesita una reduccion de la complejidad para la implementacion efectiva.
Una segunda razon para la utilizacion de la codificacion intertramas es que puede existir una situacion,o un material de programa, que pueda provocar que el esquema de codificacion espacio -temporal se estropee y lleve a cabo un rendimiento defectuoso. Por ejemplo, las peliculas de 24 tramas por segundo pueden incluirse dentro de esta categoria dado que el tiempo de integracion, debido al obturador mecanico es relativamente corto. El corto periodo de tiempo de integracion hace posible un grado mas alto de solapamiento temporal. La asuncion de la correlacion de trama a trama se rompe en el caso de un movimiento rapido en cuanto resulta entrecortado.
Una razon adicional para la utilizacion de la codificacion intertramas es un esquema de codificacion espacio temporal es mas dificil de estandarizar cuando estan implicadas frecuencias tanto a 50 �z como a 60 �z de la linea de transporte de energia. La televisionen la actualidad transmite serales ya sea a 50 �z o 60 �z. El uso de un esquema de intertramass, al ser un sistema digital, puede adaptar tanto el funcionamiento a 50 �z como a 60 �z, o incluso para peliculas de 24 tramas por segundo mediante la transaccion entre la tasa de tramas y la resolucion espacial.
A los fines del procesamiento de imagen, la operacion de la DCT se lleva a cabo sobre unos datos depixeles que son divididos en un conjunto de bloques no superpuestos. Notese que, aunque los tamaros de los bloques son analizados en la presente memoria teniendo un tamaro de N x N, se contempla que pueden ser utilizados tamaros de bloques diferentes. Por ejemplo, un tamaro de bloque N x M puede ser utilizado cuando tanto N como M sean numeros enteros, siendo M o bien mayor o menor que N. �tro importante aspecto es que el bloque es divisible en al menos un nivel de subbloques, como por ejemplo N /ixN /i, N / ixN/j , N/ixM/j, etc., cuando i y j sean numeros enteros. Asi mismo, el tamaro de bloque ejemplar, tal y como se analizaen la presente memoria es un bloque de pixeles de 16 x 16 con unos correspondientes bloques y subbloques de coeficientes de la DCT. Se contempla, asi mismo, que pueden ser utilizados otros distintos numeros enteros, como por ejemplo tanto valores de numeros pares como impares, por ejemplo, de 9 x 9.
Con referencia ahora a la FIG. 1, en ella se muestra un sistema 100 de procesamiento de imagen, el cual incorpora el sistema de compresion de la presente invencion. El sistema 100 d e procesamiento de i magen comprende un codificador 102 que comprime una seral de video recibida. La seral comprimida es transmitida por medio de un canal de transmision 104, y es recibida por un descodificador 106. El descodificador 106 descodifica la seral recibida en muestras de la imagen, las cuales pueden a continuacion se representadas.
En general, una imagen es dividida en bloques de pixeles para su procesamiento. Una seral de color puede ser convertida desde el espacio RGB hasta el espacio YC1 C2, siendo Y el componente de luminancia, o de brillo, y siendo C1 y C2 los componentes de la crominancia o el color. Debido a la baja sensibilidad espacial del ojo al color, muchos sistemas submuestrean los componentes C1 y C2 mediante un factor de cuatro en las direcciones horizontal y vertical. Sin embargo, el submuestreo no es necesario. Una imagen de resolucion total, conocida como el formato
4: 4: 4, puede ser o bien muy util o bien necesario en algunas aplicaciones, como por ejemplo las designadas como englobadoras del " cine digital". D os posibles representaciones de Y C1C2 son l a representacion Y IQ y l a representacion YUV, las dos bien conocidas en la tecnica. Asi mismo, es posible emplear una variante de la representacion YUV conocida como YCbCr.
En una forma de realizacion preferente, cada uno de los componentes Y, Cb y Cr es procesado sin submuestreo. De esta manera, se suministra una entrada de un bloque de pixeles de 16 x 16 al codificador 102. El codificador 102 comprende un elemento 108 de asignacion de tamaro de bloque, el cual efectua la asignacion del tamaro del bloque para la preparacion para la compresion del video. El elemento 108 de asignacion del tamaro del bloque determina la descomposicion del bloque del bloque de 16 x 16 en base a las caracteristicas preceptuales de la imagen del bloque. La asi gnacion del tamaro del bloque subdivide cada bloque de 16 x 16 en bloques mas pequeros en una forma de arbol cuaternario dependiendo de la actividad existente dentro de un bloque de 16 x 16. El elemento 108 de asignacion del tamaro del bloque genera unos datos de arbol cuaternario llamados los datos de PQR, cuya longitud puede oscilar entre 1 y 21 bits. De esta manera, si la asignacion del tamaro del bloque determina que un bloque de 16 x 16 va a ser dividido, se establece el bit R de los datos de PQR, seguidos por cuatro bits adicionales de datos P correspondientes a los cuatro bloquesdivididos de 8 x 8. Si la asignacion del tamaro del bloque determina que ninguno de los bloques de 8 x 8 va a ser subdividido, entonces se araden cuatro bits adicionales de los datos Q para cada bloque de 8 x 8.
Con referencia ahora a la FIG. 2, se ofrece un diagrama de flujo que muestra detalles de la interaccion del elemento 108 de asignacion del tamaro del bloque. El algoritmo utiliza la varianza de un bloque como una metrica en la decision de subdividir un bloque. Comenzando en la etapa 202, se lee un bloque de pixeles de 16 x 16. En la etapa 204, se computa la varianza, v16, del bloque de 16 x 16. La varianza se computa como sigue:
donde N = 16, y xij es el pixel de la fila iesima, la columna jotaesima dentro del bloque N x N. En la etapa 206, en primer lugar, se modifica el umbral de varianza T16 para proporcionar un nuevo umbral T'16 si el valor medio del bloque se situa entre dos valores predeterminados, a continuacion la varianza del bloque es comparada con el nuevo umbral, T'16.
Si la varianza v16 no es mayor que el umbral T16, entonces, en la etapa 208, se escribe la direccion de comienzo del bloque de 16 x 16, y el bit R de los datos de PQR se establece en 0 para indicar que el bloque de 16 x 16 no esta subdividido. El algoritmo a continuacion lee el siguiente bloque de pixeles de 16 x 16. Si la varianza v16 es mayor que el umbral T16, entonces, en la etapa 210, el bit R de los datos de PQR se establece en 1, para indicar que el bloque de 16 x 16 va a ser subdividido en cuatro bloques de 8 x 8.
Los cuatro bloques de 8 x 8 , i = 1: 4, son considerados de forma secuencial para una division ulterior, tal y como se muestra en la etapa 212. Para cada bloque de 8 x 8, la varianza, v8i, es computada, enla etapa 214. En la etapa 216, el primer umbral de varianza T8 es modificado para proporcionar un nuevoumbral T'8 si el valor medio del bloque se situa entre dos valores predeterminados, entonces la varianza del bloque se compara con este nuveo umbral.
Si la varianza v81no es mayor que el umbral T8 entonces, en la etapa 218 se escribe la direccion de inicio del bloque de 8 x 8, y el correspondiente bit Q, Qi se fija en 0. El siguiente bloque de 8 x 8 es entonces procesado. Si la varianza v8i es mayor que el umbral T8, entonces, en la etapa 220, el correspondiente bit Q, Qi, se establece en 1 para indicar que el bloque de 8 x 8 va a ser subdivido en cuatro bloques de 4 x 4.
Los cuatro bloques 4 x 4, ji = 1 : 4, son considerados de forma secuencial para una ulterior division, tal y como se muestra en la etapa 222. Para cada bloque de 4 x 4, la varianza, v4ij, es computada, en la etapa 224. En la etapa 226, en primer lugar el umbral de varianza T4 es modificada para proporcionar un nuevo umbral T'4 si el valor medio del bloque se situa entre dos valores predeterminados, a continuacion la varianza del bloque es comparada con este nuevo umbral.
Si la varianza v4ij no es mayor que el umbral T4, entonces, en la etapa 228, se escribe la direccion del bloque de 4 x 4, y el correspondiente bit P, Pij, se establece en 0. El siguiente bloque de 4 x 4 es a continuacion procesado. Si la varianza v4ij es mayor que el umbral T4, entonces, en la etapa 230, el correspondiente bit P, Pij, se establece en 0 para indicar que el bloque de 4 x 4 va a ser subdividido en 4 bloques de 2 x 2. Asi mismo, se escribe la direccion de los 4 bloques de 2 x 2.
Los umbrales T16, T8 y T4 pueden serunas constantes predeterminadas. Esto es conocido como decision dura. Como alternativa, puede ser implementada una decision adaptativa o suave. La decision suave varia los umbrales de las varianzas dependiendo del valor medio de los pixeles de los bloques 2N x 2N, donde N puede ser 8, 4 o 2. De esta manera, las funciones de los valores medios de los pixeles pueden ser utilizadas como umbrales.
Con fines ilustrativos, considerese el siguiente ejemplo. Supongase que los umbrales de varianza predeterminados del componente Y sean 50, 1100 y 880, respectivamente, para los bloques de 16 x 16, 8 x 8 y 4 x 4. En otras palabras, T16 = 50, T8 = 1100 yT14 = 880. Supongase que el rango de los valores medios sea de 80 y 100. Supongase que la varianza computada para el bloque de 16 x 16 es 60. Dado que 60 y su valor medio 90 es mayor que T16, el bloque de 16 x 16 es subdividido en cuatro subbloques de 8 x 8. Supongase que las varianzas computadas para los bloques de 8 x 8 son 1180, 935, 980, y 1210. Dado que dos de los bloques de 8 x 8 presentan unas varianzas que exceden de T8, estos dos bloques se dividen a su vez para obtener un total de ocho subbloques de 4 x 4. Finalmente, supongase que las varianzas de los ocho bloques de 4 x 4 son 620, 630, 670, 610, 590, 525, 930 y 690, con unos correspondientes valores medios de 90, 120, 110, 115. Dado que el valor medio del primer bloque de 4 x 4 cae en el rango (80, 100), su umbral se reducira hasta T''4 = 200 que es menor de 880. De esta manera, este bloque de 4 x 4 sera subdivido asi como el septimo bloque de 4 x 4. La asignacion de tamaros de bloques resultantes se muestra en la FIG. 3a. La correspondiente descomposicion de arbol cuaternario se muestra en la FIG. 3b. Asi mismo, los datos de PQR generados por esta asignacion de tamaros de bloques se muestra en la FIG. 3c.
Notese que un procedimiento similar es utilizado para asignar tamaros de bloques para los componentes de color C1 y C2. Los componentes de color pueden ser decimados horizontal, verticalmente, o en ambos sentidos.
Asi mismo, notese que, aunque la asignacion de tamaros de bloques ha sido descrita como un sistema de arriba abajo, en el cual el bloque de mayor tamaro (de 16 x 16 en el presente ejemplo), es utilizado en primer termino, puede utilizarse en su lugar un sistema de abajo arriba. El sistema de abajo arriba evaluara en primer termino los bloques mas pequeros, (de 2 x 2 en el presente ejemplo).
Con referencia de nuevo a la FIG. 1, se describira el resto del sistema 110 de procesamiento de imagen. Los datos de PQR, junto con las direcciones de los bloques seleccionados, se suministran a un elemento 110 de DCT de la DCT. El elemento 110 de la DCT utiliza los datos de PQR para llevar a cabo las transformadas de coseno discretas de l os tamaros apropiados so bre l os bloques seleccionados. S olo los bloques seleccionados necesitan se r sometidos al procesamiento de la DCT.
El sistema 100 de procesamiento de imagen puede de manera opcional comprender el elemento DCT 112 para la reduccion de la redundancia entre los coeficientes de DC de las DCTs. Un coeficiente de DC se encuentra en la esquina superior izquierda de cada bloque de la DCT. Los coeficientes de la DCT son, en general, de gran tamaro en comparacion con los coeficientes de AC. La discrepancia en cuanto a los tamaros hace dificil diserar un codificador d e l ongitud v ariable ef iciente. De acuerdo c on ello, es ve ntajoso r educir l a r edundancia entre los coeficientes DC.
El elemento 112 de la DQTlleva a cabounas DCTsde 2 -D sobre los coeficientesde DC, tomados 2 x 2 a un tiempo. Empezando por los bloques de 2 x 2 dentro de los bloques de 4 x 4 se lleva a cabo una DCT de 2 -D sobre cuatro coeficientes de DC. Esta DCT de 2 x 2 se denomina la transformada de arbol cuaternario diferencial, o DQT, de cuatro coeficientes de DC. A continuacion, el coeficiente de DC de la DQT junto con los tres coeficientes de DC con un bloqueo de 8 x 8 son utilizados para compactar la DQT del nivel siguiente. Finalmente, los coeficientes de DC de los cuatro bloques de 8 x 8 dentro de un bloque de 16 x 16 son utilizados para computar la DQT. De esta manera, en un bloque de 16 x 16, hay un autentico coeficiente de DC y el resto son coeficientes de AC correspondientes a la DCT y a la DQT.
Los coeficientes de la transformada ( tanto de la DCT como de la DQT), son suministrados a un cuantificador 114 para su c uantificacion. E n u na f orma d e r ealizacion preferente, los co eficientes de la D CT so n c uantificados utilizando unas mascaras de ponderacion de frecuencias (FWMs) y un factor de cuantificacion de escala. Una FWM es una tabla de ponderaciones de frecuencias de las mismas dimensiones que el bloque de los coeficientes de entrada de la DCT. Las ponderaciones de frecuencias aplican diferentes ponderaciones a los diferentes coeficientes de la DCT. Las ponderaciones estan diseradas para otorgar importancia a las muestras entrantes que presentan un contenido de frecuencias respecto de las cuales el sistema visual humano es mas sensible y para quitar importancia a las muestras que presentan un contenido de frecuencias a las que el sistema visual es menos sensible. Las ponderaciones pueden, asi mismo, ser diseradas en base a factores tales como las distancias de visualizacion, etc.
Las ponderaciones son seleccionadas en base a datos empiricos. Un procedimiento para diserar las mascaras de ponderacion para los coeficientes de la DCT de 8 x 8 se divulga en el documento IS� / IEC JTCA CD 10918 "Compresion y codificacion Digital de imagenes fijas de tono continuo -parte 1: Condiciones y directrices" ["Digital Compression and Encoding of Continuus - tone still images - part 1: Requirements and guidelines"1 International Standards �rganization, 1994. En general. Se diseran dos FWMs, una para el componente de luminancia y otra para los componentes de crominancia. Las tablas de FWM para los tamaros de bloques de 2 x 2 , 4 x 4 se obtienen por decimacion y el de 16 x 16 por interpolacion para el del bloque de 8 x 8. El factor de escala controla la calidad y la tasa de transmision de datos de los coeficientes cuantificados.
De esta manera, cada coeficiente de la DCT es cuantificado de acuerdo con la relacion: donde DTC (i, j) es el coeficiente de la DTC entrante , fwm (i, j) es la mascara de ponderacion de frecuencias, q es el factor de escala yDCTq (i,j) es el coeficiente cuantificado. Notese que, dependiendo del signo del coeficiente de la DCT, el primer termino situado dentro de los corchetes es redondeado arriba o abajo. Los coeficientes de la DQT son, asi mismo, cuantificados utilizando una mascara de ponderacion apropiada. Sin embargo, pueden ser utilizadas multiples tablas o mascaras, y aplicadas a cada uno de los componentes Y, Cb y Cr.
Los coeficientes cuantificados son suministrados a un serializador 116 de escaneo en zigzag. El serializador 116 escanea los bloques de los coeficientes cuantificados de una forma en zigzag para producir un flujo serializado de coeficientes cuantificados. Asi mismo puede ser escogida una pluralidad de pautas de escaneo en zigzag diferentes, asi como de pautas en zigzag distintas. Una tecnica preferente, emplea unos tamaros de bloque de 8 x 8 para el escaneo en zigzag aunque pueden ser empleados otros tamaros.
Notese que e l se rializador 116 de escaneo e n zi gzag pue de s er si tuado o bien antes o bi en despues del cuantificador 114. Los resultados netos son los mismos.
En cualquier caso, el flujo de coeficientes cuantificados es suministrado a un codificador 118 de longitud variable. El codificador 118 de longitud variable puede hacer uso de una codificacion de ceros de longitud de recorrido seguida por una codificacion de �uffman. Esta tecnica se analiza con detalle en las Patentes estadounidenses anteriormente mencionadas 5,021,891, 5,107,345 y 5,452,104, y ahora se expone de forma resumida en la presente memoria. Un codificador de longitud de recorrido tomaria los coeficientes cuantificados y separaria los coeficientes nulos de los no nulos. Los valores nulos son designados como valores de longitud de recorrido y son codificados mediante el sistema de �uffman. Los valores no nulos son codificados por el sistema �uffman de forma separada.
Una codificacion de �uffman modificada de los coeficientes cuantificados es, asi mismo, posible, y es utilizada en la forma de realizacion preferente. Aqui, despues del escaneo en zigzag, un codificador de longitud de recorrido determinara los pares de longitud de recorrido / tamaro dentro de cada bloque de 8 x 8. Estos pares de longitud de recorrido / tamaro son a continuacion codificados por el sistema de �uffman.
Los codigos de �uffman estan diserados a partir de estadisticas ya sea medidas o ya sea teoricas de una imagen. Se ha observado que las imagenes mas naturales estan compuestas por areas en blanco o por areas de variacion relativamente l enta, y p or ar eas ocupadas, co mo p or e jemplo los limites de dos ob jetos y l a t extura d e gr an contraste. Los codificadores de �uffman con transformadas en el dominio frecuencial, por ejemplo, la DCT, explotan estas caracteristicas mediante la asignacion de mas bits a las areas mas ocupadas y de menos bits a las areas en blanco. En general, los codificadores de �uffman hacen uso de tablas de consulta para codificar los valores de longitud de recorrido y los no nulos. En general se utilizan multiples tablas, siendo 3 tablas preferentes en la presente invencion, aunque, si se desea, pueden ser empleadas 1 o 2.
La seral de imagen comprimida generada por el codificador 102 es transmitida al descodificador 106 por medio del canal de transmision 104. Los datos de PQR, los cuales contienen la informacion de la asignacion de los tamaros de los bloques es, asi mismo, suministrada al descodificador 106. El descodificador 106 comprende un descodificador 120 de longitud variable, el cual descodifica los valores de longitud de recorrido y los valores no nulos.
La salida del descodificador 120 de longitud variable se suministra a un serializador inverso 122 de escaneo en zigzag que ordena los coeficientes de acuerdo con el esquema de escaneo empleado. El serializador inverso 122 de escaneo en zigzag recibe los datos de PQR para ayudar a la ordenacion adecuada de los coeficientes para obtener un bloque de coeficientes compuesto.
El bloque compuesto es suministrado a un codificador inverso 124 para deshacer el procesamiento debido al uso de las mascaras de ponderacion de frecuencias.
El bloque de coeficientes es a continuacion suministrado a un elemento 126 de la IDQT, seguido por un elemento 128 de la IDCT, si se ha aplicado la transformada de Arbol Cuaternario Diferencial. En otro caso, el bloque de coeficientes es suministrado directamente al elemento 128 de la IDCT. El elemento 126 de la IDQT y el elemento 128 de la IDCT efectuan una transformacion inversa de los coeficientes para producir un bloque de datos de pixeles . Los datos de pixeles , pueden, a continuacion, tener que ser interpolados,convertidos enformade RGB y, a continuacion, almacenados para su representacion futura.
De acuerdo con ello, se presenta un sistema y un procedimiento para la compresion de imagen que lleva a cabo una asignacion del tamaro de los bloques en base a una varianza de pixeles. La asignacion del tamaro de los bloques en base a la varianza ofrece diversas ventajas. Debido a que la Transformada de Coseno Discreta selleva a cabo despues de que los tamaros de los bloques son determinados, se consigue una computacion eficiente. La transformada intensiva de forma computacional solo necesita llevarse a cabo sobre los bloques seleccionados. Asi mismo, el procedimiento de seleccion de bloques es eficiente, en cuanto la varianza de los valores de los pixeles es matematicamente sencilla de calcular. �tra ventaja adicional de la asignacion del tamaro de los bloques en base a la varianza es que esta basada de forma perceptual. La varianza de los pixeles es una medida de la actividad existente en un bloque y, proporciona una indicacion de la presencia de los bordes, las texturas, etc. Tiende a captar los detalles de un bloque mucho mejor que mediciones tales como la media de los valores de los pixeles. De esta manera, el esquema en base a la varianza de la presente invencion asigna bloques mas pequeros a zonas con mas bordes y bloques de mayor tamaro a las zonas mas planas. Como resultado de ello, puede conseguirse una calidad sobresaliente de las imagenes reconstruidas.
�tra ventaja importante adicional es que, dado que la asignacion del tamaro de los bloques se efectua antes de la cuantificacion, se obtiene una flexibilidad mayor en el control de la tasa de transmision de bits y de la calidad. Dado 5 que el umbral de la varianza esta adaptado a la media local, se asignan bloques pequeros incluso en areas relativamente oscuras. Esto preserva los detalles en todas las areas que estan por encima exactamente del umbral de visibilidad perceptible. Asi mismo, la compresion de imagen en base a la varianza proporciona una degradacion vistosa de la calidad de la imagen cuando el factor de cuantificacion de escala se modifica de valores bajos a valores altos, a diferencia de procedimientos tales como el MPEG. Esto es especialmente critico en aplicaciones tales como
10 en el area del cine digital.
Dada la gran demanda de video digital, la pirateria es una serie amenaza. El marcado con agua digital es un requisito importante para disuadir la violacion de los derechos de autor y de la perdida de ingresos. El marcaje con agua se lleva a cabo en areas de una imagen que son perceptiblemente significativas, la asignacion de tamaros de bloques en base a la varianza es un candidato para el marcaje con agua.

Claims (15)

  1. REIVINDICACIONES
    1.- Un procedimiento para la determinacion de una asignacion de tamaro de bloquepara un bloque entrante de pixeles de imagen que va a ser utilizado en la compresion de dicho bloque entrante, que comprende las etapas de:
    la lectura de un boque de datos de pixeles; la generacion de una asignacion de tamaro de bloque para el bloque de datos de pixeles en base a las varianzas de los valores de pixeles de dicho bloque de datos de pixeles y de bloques subdivididos de dicho bloque de datos de pixeles, en el que dicha etapa de generacion comprende asi mismo las etapas de:
    la determinacion de una varianza de valores de pixeles para dicho bloque de datos de pixeles, en
    el que la varianza se calcula sobre todos los pixeles del bloque; la comparacion de dicha varianza con un umbral, en el quel dicho umbral es una funcion del valor de pixel medio del bloque que esta siendo evaluado;
    la toma de una decision para subdividir dicho bloque si dicha varianza es mayor que dicho umbral; si di cha d ecision es la de subdividir di cho bl oque, ent onces la r epeticion de l as etapas de
    determinacion, co mparacion y t oma de decision p ara c ada bloque s ubdividido has ta que s e satisfaga un criterio predeterminado; y la designacion como dicha asignacion de tamaro de bloque a cada bloque que no esta mas
    subdividido; y la provision de una estructura de datos que contenga la informacion acerca de dicha asignacion de tamaro de bloque. 2.- Un procedimiento para la compresionde un bloque de datos de pixeles de una imagen, que comprende las etapas de:
    la determinacion de una asignacion de tamaro de bloque para el bloque de datos de pixeles de acuerdo con el procedimiento de la reivindicacion 1; la transformacion de dichos datos de pixeles de bloques seleccionados de acuerdo con lo indicado por
    dicha estructura de datos en una representacion en el dominio frecuencial; la cuantificacion de dichos datos en el dominio frecuencial; el escaneo de dichos datos cuantificados para obtener un flujo serializado de datos; y la codificacion de dicho flujo serializado de datos en preparacion para una transmision.
  2. 3.- El procedimiento de la reivindicacion 2, en el que la Transformada de Coseno Discreta se lleva a cabo seguida
    por una Transformada de Arbol Cuaternario Diferencial durante dicha etapa de transformacion. 4.- El procedimiento de la reivindicacion 2, en el que una Transformada de Coseno Discreta se lleva a cabo seguida por una Transformada de Arbol Cuaternario Diferencial durante dicha etapa de transformacion.
  3. 5.- El procedimiento de la reivindicacion 2, en el que se lleva a cabo un escaneo en zigzag durante dicha etapa de
    escaneo. 6.- El procedimiento de la reivindicacion 5, en el que el escaneo en zigzag se lleva a cabo utilizando un tamaro de bloque de 8 x 8.
  4. 7.- El procedimiento de la reivindicacion 2, en el que se lleva a cabo una codificacion de �uffman durante dicha
    etapa de codificacion. 8.- El procedimiento de la reivindicacion 7, en el que dicha codificacion de �uffman emplea multiples tablas de consulta para codificar valores de longitud de recorrido y no nulos.
  5. 9.- El procedimiento de la reivindicacion 8, en el que hay tres tablas de consulta. 10.- El procedimiento de las reivindicaciones 1 o 2, en el que dicho umbral cambia para cada nivel de subdivision. 11.- El procedimiento de las reivindicaciones 1 o 2, en el que dicho criterio predeterminado para no seguir repitiendo
    las etapas de det erminacion, co mparacion y t oma d e deci siones, se basa en u n tamaro de b loque m inimo preseleccionado de datos de pixeles.
  6. 12.- Un sistema de compresion de imagen para comprimir un bloque de datos de pixeles, que comprende:
    un medio de asignacion detamaro de bloque para la seleccion de dicho bloque o de dichos bloques subdivididos de dicho bloque que va a ser comprimido en base a las varianzas de los valores de pixeles de dicho bloque de datos de pixeles y de bloques subdivididos de dicho bloque de datos de pixeles, en el que dicho medio de asignacion de tamaro de bloque:
    determina una varianza de valores de pixeles para dicho bloque de datos de pixeles, en el que la varianza se calcula sobre todos los pixeles del bloque, compara dicha varianza con un umbral, en el que dicho umbral es una funcion del valor de pixel medio del bloque que esta siendo evaluado;
    la toma de una decision para subdividir dicho bloque si dicha varianza es mayor que dicho umbral, si dicha decision es la de subdividir dicho bloque, a continuacion repite la determinacion de la varianza, la comparacion con un umbral, y la decision de subdividir para cada bloque subdivido hasta que satisfaga un criterio predeterminado; y
    designa como dicha asignacion de tamaro de bloque cada bloque que no se subdivide mas
    un medio de transformacion para la transformacion del tamaro de pixeles de dicho bloque seleccionado o de dichos bloques subdivididos en datos en el dominio frecuencial;
    un medio cuantificado para la cuantificacion de dichos datos en el dominio frecuencial;
    un medio de serializador para escanear dichos datos cuantificados para obtener un flujo serializado de datos; y
    un medio de codificacion de longitud variable para la codificacion de dicho flujo de datos serializado en preparacion para la transmision.
  7. 13.- El sistema de la reivindicacion 12, en el que dicho umbral cambia para cada nivel de subdivision.
  8. 14.- El sistema de la reivindicacion 12, en el que dicho criterio predeterminado para no seguir subdividendo se basa en un tamaro de bloque minimo preseleccionado de los datos de pixeles que estan siendo conseguidos.
  9. 15.- El sistema de la reivindicacion 12, en el que dicho medio de transformacion lleva a cabo una Transformada de Coseno Discreta.
  10. 16.- El sistema de la reivindicacion 12, en el que dicho medio de transformacion lleva a cabo una Transformada de Coseno Discreta seguida por una Transformada de Arbol Cuaternario Diferencial.
  11. 17.- El sistema de la reivindicacion 12, en el que dicho medio serializador comprende un escaneador en zigzag.
  12. 18.- El sistema de la reivindicacion 17, en el que el escaneador en zigzag emplea un tamaro de bloque de 8 x 8 para el escaneo en zigzag.
  13. 19.- El sistema de la reivindicacion 12, en el que dicho medio de codificacion de longitud variable comprende un codificador de �uffman,
  14. 20.- El sistema de la reivindicacion 19, en el que dicho codificador de �uffman emplea multiples tablas de consulta para codificar valores de longitud de recorrido y valores no nulos.
  15. 21.- El sistema de la reivindicacion 20, en el que hay tres tablas de consulta.
ES00977131T 1999-11-08 2000-11-08 Compresión de imagen por dct de tamaño de bloque adaptativo en base a la varianza. Expired - Lifetime ES2376540T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/436,085 US6529634B1 (en) 1999-11-08 1999-11-08 Contrast sensitive variance based adaptive block size DCT image compression
US436085 1999-11-08
PCT/US2000/030883 WO2001035673A1 (en) 1999-11-08 2000-11-08 Variance based adaptive block size dct image compression

Publications (1)

Publication Number Publication Date
ES2376540T3 true ES2376540T3 (es) 2012-03-14

Family

ID=23731055

Family Applications (1)

Application Number Title Priority Date Filing Date
ES00977131T Expired - Lifetime ES2376540T3 (es) 1999-11-08 2000-11-08 Compresión de imagen por dct de tamaño de bloque adaptativo en base a la varianza.

Country Status (17)

Country Link
US (1) US6529634B1 (es)
EP (1) EP1230804B1 (es)
JP (2) JP5289659B2 (es)
KR (1) KR100740818B1 (es)
CN (1) CN1186942C (es)
AR (1) AR033655A1 (es)
AT (1) ATE538598T1 (es)
AU (1) AU782176B2 (es)
BR (1) BR0015341B1 (es)
CA (1) CA2389410C (es)
ES (1) ES2376540T3 (es)
IL (2) IL149455A0 (es)
MX (1) MXPA02004577A (es)
RU (1) RU2273112C2 (es)
TW (1) TW517500B (es)
WO (1) WO2001035673A1 (es)
ZA (1) ZA200203276B (es)

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1033885B1 (en) * 1998-09-21 2009-06-24 Sony Corporation Encoding device and method, and decoding device and method
GB2401703B (en) * 2000-06-30 2005-01-19 Royal Mail Group Plc Image processing
US6972868B1 (en) * 2000-11-09 2005-12-06 Hewlett-Packard Development Company, L.P. Image data compression method
US7649947B2 (en) * 2001-06-05 2010-01-19 Qualcomm Incorporated Selective chrominance decimation for digital images
US6870963B2 (en) 2001-06-15 2005-03-22 Qualcomm, Inc. Configurable pattern optimizer
US6735254B2 (en) * 2001-06-29 2004-05-11 Qualcomm, Inc. DCT compression using Golomb-Rice coding
US6650784B2 (en) * 2001-07-02 2003-11-18 Qualcomm, Incorporated Lossless intraframe encoding using Golomb-Rice
US7483581B2 (en) * 2001-07-02 2009-01-27 Qualcomm Incorporated Apparatus and method for encoding digital image data in a lossless manner
US7630563B2 (en) * 2001-07-19 2009-12-08 Qualcomm Incorporated System and method for decoding digital image and audio data in a lossless manner
KR100921063B1 (ko) * 2001-08-02 2009-10-08 소니 가부시끼 가이샤 화상 처리 장치 및 방법, 화상 처리 프로그램을 기록한 기록 매체, 양자화 제어 장치 및 방법, 및 양자화 제어 프로그램을 기록한 기록 매체
AU2002335743A1 (en) * 2001-09-14 2003-04-01 The Regents Of The University Of Michigan Audio distributor
WO2003045069A2 (en) * 2001-11-16 2003-05-30 Qualcomm Incorporated Block size assignment using local contrast ratio
US7742525B1 (en) * 2002-07-14 2010-06-22 Apple Inc. Adaptive motion estimation
HK1079886A1 (zh) * 2002-07-29 2006-04-13 高通股份有限公司 数字图像编码
US6975773B1 (en) * 2002-07-30 2005-12-13 Qualcomm, Incorporated Parameter selection in data compression and decompression
JP3679083B2 (ja) * 2002-10-08 2005-08-03 株式会社エヌ・ティ・ティ・ドコモ 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、画像復号プログラム
ES2371871T3 (es) * 2002-11-15 2012-01-10 Qualcomm Incorporated Aparato y procedimiento para la codificación por múltiples descripciones.
KR100828353B1 (ko) * 2003-02-05 2008-05-08 삼성전자주식회사 영상 블록 분할 방법 및 그 장치
US7995849B2 (en) 2003-03-17 2011-08-09 Qualcomm, Incorporated Method and apparatus for improving video quality of low bit-rate video
TWI373734B (en) * 2003-03-17 2012-10-01 Qualcomm Inc Method and apparatus for improving video quality of low bit-rate video
KR100510137B1 (ko) * 2003-04-30 2005-08-26 삼성전자주식회사 고속 움직임 추정을 위한 참조 픽쳐 및 블록 모드 결정방법, 그 장치, 블록 모드 결정 방법 및 그 장치
HUP0301368A3 (en) * 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
KR100723400B1 (ko) * 2004-05-12 2007-05-30 삼성전자주식회사 복수의 룩업테이블을 이용한 디지털 신호 부호화 방법 및장치
US7852916B2 (en) * 2004-06-27 2010-12-14 Apple Inc. Efficient use of storage in encoding and decoding video data streams
US7792188B2 (en) * 2004-06-27 2010-09-07 Apple Inc. Selecting encoding types and predictive modes for encoding video data
CN101540912B (zh) * 2004-06-27 2011-05-18 苹果公司 对编码视频数据选择编码类型和预测模式
US8111752B2 (en) 2004-06-27 2012-02-07 Apple Inc. Encoding mode pruning during video encoding
US20050286777A1 (en) * 2004-06-27 2005-12-29 Roger Kumar Encoding and decoding images
FI20050113A7 (fi) * 2005-02-01 2006-08-02 Head Inhimillinen Tekijae Oy Menetelmä kuvainformaation käsittelemiseksi
US7609766B2 (en) * 2005-02-08 2009-10-27 Vixs Systems, Inc. System of intra-picture complexity preprocessing
US20070200738A1 (en) * 2005-10-12 2007-08-30 Yuriy Reznik Efficient multiplication-free computation for signal and data processing
US8595281B2 (en) 2006-01-11 2013-11-26 Qualcomm Incorporated Transforms with common factors
US8849884B2 (en) * 2006-03-29 2014-09-30 Qualcom Incorporate Transform design with scaled and non-scaled interfaces
WO2007148428A1 (ja) * 2006-06-20 2007-12-27 Nikon Corporation 画像処理方法、画像処理装置、及び画像処理プログラム
US8571340B2 (en) * 2006-06-26 2013-10-29 Qualcomm Incorporated Efficient fixed-point approximations of forward and inverse discrete cosine transforms
US8385424B2 (en) * 2006-06-26 2013-02-26 Qualcomm Incorporated Reduction of errors during computation of inverse discrete cosine transform
RU2496139C2 (ru) * 2006-06-26 2013-10-20 Квэлкомм Инкорпорейтед Эффективные аппроксимации с фиксированной запятой прямого и обратного дискретных косинусных преобразований
JP4906458B2 (ja) * 2006-09-29 2012-03-28 キヤノン株式会社 画像符号化装置、画像符号化方法
CN101523921B (zh) 2006-10-10 2011-04-06 日本电信电话株式会社 帧内预测编码控制方法和装置
US8542726B2 (en) * 2006-10-17 2013-09-24 Microsoft Corporation Directional and motion-compensated discrete cosine transformation
CN100542298C (zh) * 2007-09-29 2009-09-16 中国科学院计算技术研究所 一种柱面全景视频编码的块尺寸计算方法和传输方法
US8325796B2 (en) 2008-09-11 2012-12-04 Google Inc. System and method for video coding using adaptive segmentation
KR101619972B1 (ko) 2008-10-02 2016-05-11 한국전자통신연구원 이산 여현 변환/이산 정현 변환을 선택적으로 이용하는 부호화/복호화 장치 및 방법
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
RU2399953C1 (ru) * 2008-12-23 2010-09-20 Открытое Акционерное Общество "Конструкторское Бюро "Луч" Способ формирования и проверки заверенного цифровым водяным знаком электронного изображения
EP2418855B1 (en) * 2009-04-08 2017-12-27 Sharp Kabushiki Kaisha Method of selecting a transform size in a video decoding process
KR101456498B1 (ko) * 2009-08-14 2014-10-31 삼성전자주식회사 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101624649B1 (ko) * 2009-08-14 2016-05-26 삼성전자주식회사 계층적인 부호화 블록 패턴 정보를 이용한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101487686B1 (ko) * 2009-08-14 2015-01-30 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
WO2011126277A2 (en) 2010-04-05 2011-10-13 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus
WO2011126282A2 (en) 2010-04-05 2011-10-13 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using transformation index, and method and apparatus for decoding video by using transformation index
KR20110112168A (ko) * 2010-04-05 2011-10-12 삼성전자주식회사 내부 비트뎁스 확장에 기반한 비디오 부호화 방법 및 그 장치, 내부 비트뎁스 확장에 기반한 비디오 복호화 방법 및 그 장치
US9049450B2 (en) 2010-04-05 2015-06-02 Samsung Electronics Co., Ltd. Method and apparatus for encoding video based on internal bit depth increment, and method and apparatus for decoding video based on internal bit depth increment
EP3697089B1 (en) * 2010-04-13 2021-09-29 GE Video Compression, LLC Inheritance in sample array multitree subdivision
JP5479225B2 (ja) * 2010-05-27 2014-04-23 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP5765893B2 (ja) * 2010-06-16 2015-08-19 キヤノン株式会社 画像処理装置、撮像装置および画像処理プログラム
JP5741729B2 (ja) * 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
JP5741076B2 (ja) * 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
US8761245B2 (en) * 2010-12-21 2014-06-24 Intel Corporation Content adaptive motion compensation filtering for high efficiency video coding
JP2012238927A (ja) * 2011-05-09 2012-12-06 Sony Corp 画像処理装置及び画像処理方法
CN108924563B (zh) 2011-12-19 2022-11-15 索尼公司 图像处理设备和方法
CN103313046B (zh) * 2012-03-06 2019-06-14 中兴通讯股份有限公司 一种残差的表示方法和熵编码输入装置
CN103428485A (zh) * 2012-05-24 2013-12-04 富士通株式会社 图像编码方法及图像解码方法
US9258389B2 (en) 2012-08-13 2016-02-09 Gurulogic Microsystems Oy Encoder and method
US10333547B2 (en) 2012-08-13 2019-06-25 Gurologic Microsystems Oy Encoder and method for encoding input data using a plurality of different transformations or combinations of transformations
GB2503295B (en) * 2012-08-13 2014-08-06 Gurulogic Microsystems Oy Encoder and method
TW201419865A (zh) * 2012-11-13 2014-05-16 Hon Hai Prec Ind Co Ltd 影像切割系統及方法
TW201419862A (zh) * 2012-11-13 2014-05-16 Hon Hai Prec Ind Co Ltd 影像切割系統及方法
TW201419863A (zh) * 2012-11-13 2014-05-16 Hon Hai Prec Ind Co Ltd 影像切割系統及方法
US9177393B2 (en) * 2013-02-04 2015-11-03 Qualcomm Incorporated Mixed mode for frame buffer compression
JP5719410B2 (ja) 2013-07-25 2015-05-20 日本電信電話株式会社 画像符号化方法、画像符号化装置及び画像符号化プログラム
CN104331855A (zh) * 2014-05-22 2015-02-04 重庆大学 基于.net的鼠标拾取添加位置的数字图像自适应可见水印添加方法
US9392272B1 (en) 2014-06-02 2016-07-12 Google Inc. Video coding using adaptive source variance based partitioning
US9578324B1 (en) 2014-06-27 2017-02-21 Google Inc. Video coding using statistical-based spatially differentiated partitioning
US10554965B2 (en) 2014-08-18 2020-02-04 Google Llc Motion-compensated partitioning
US10291931B2 (en) 2016-10-13 2019-05-14 Ati Technologies Ulc Determining variance of a block of an image based on a motion vector for the block
EP3503548B1 (en) * 2017-12-19 2019-10-23 Axis AB Video encoding method and system
CN108335335B (zh) * 2018-02-11 2019-06-21 北京大学深圳研究生院 一种基于增强图变换的点云属性压缩方法
US10802285B2 (en) 2018-03-05 2020-10-13 Invensas Corporation Remote optical engine for virtual reality or augmented reality headsets
CN119094747A (zh) * 2019-01-02 2024-12-06 弗劳恩霍夫应用研究促进协会 统一变换类型信令和变换类型相关的变换系数水平编码
CN113114934B (zh) * 2021-03-31 2022-08-05 太原理工大学 尿红细胞多焦距视频采集方法与系统
CN117998094B (zh) * 2024-01-30 2024-09-06 广东科技学院 一种多媒体教学视频数据智能处理方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5241395A (en) * 1989-08-07 1993-08-31 Bell Communications Research, Inc. Adaptive transform coding using variable block size
US5107345A (en) 1990-02-27 1992-04-21 Qualcomm Incorporated Adaptive block size image compression method and system
US5021891A (en) * 1990-02-27 1991-06-04 Qualcomm, Inc. Adaptive block size image compression method and system
DK0587783T3 (da) * 1991-06-04 1998-05-04 Qualcomm Inc Billedkompressionssystem med adaptiv blokstørrelse
US5471248A (en) 1992-11-13 1995-11-28 National Semiconductor Corporation System for tile coding of moving images
KR100276427B1 (ko) * 1993-01-30 2000-12-15 윤종용 화상데이타의 압축 및 복원장치
TW224553B (en) * 1993-03-01 1994-06-01 Sony Co Ltd Method and apparatus for inverse discrete consine transform and coding/decoding of moving picture
DE69430877T2 (de) * 1993-04-09 2003-02-06 Sony Corp., Tokio/Tokyo Bildkodierungsverfahren und -vorrichtung
RU2122295C1 (ru) * 1994-04-29 1998-11-20 Виктор Павлович Дворкович Способ покадрового сжатия изображений
US5585944A (en) 1994-05-10 1996-12-17 Kaleida Labs, Inc. Method for compressing and decompressing images by subdividing pixel color distributions
JPH0811869A (ja) * 1994-06-27 1996-01-16 Dainippon Printing Co Ltd 紙カートン
KR960013055A (ko) * 1994-09-27 1996-04-20 김광호 조건부 퀴드트리 분할방식의 화상압축방법 및 장치
JPH08205140A (ja) * 1995-01-31 1996-08-09 Canon Inc 画像圧縮装置
RU2093968C1 (ru) * 1995-08-02 1997-10-20 Закрытое акционерное общество "Техно-ТМ" Способ кодирования-декодирования изображений и устройство для его осуществления
US6633611B2 (en) * 1997-04-24 2003-10-14 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for region-based moving image encoding and decoding
JP3570863B2 (ja) * 1997-08-05 2004-09-29 三菱電機株式会社 動画像復号化装置および動画像復号化方法
JPH11164325A (ja) * 1997-11-26 1999-06-18 Oki Electric Ind Co Ltd パノラマ画像生成方法及びそのプログラムを記録した記録媒体

Also Published As

Publication number Publication date
US6529634B1 (en) 2003-03-04
EP1230804B1 (en) 2011-12-21
CN1186942C (zh) 2005-01-26
AR033655A1 (es) 2004-01-07
KR20030036129A (ko) 2003-05-09
IL149455A (en) 2007-07-04
IL149455A0 (en) 2002-11-10
RU2273112C2 (ru) 2006-03-27
CA2389410A1 (en) 2001-05-17
MXPA02004577A (es) 2002-11-29
JP2012199963A (ja) 2012-10-18
TW517500B (en) 2003-01-11
WO2001035673A1 (en) 2001-05-17
ATE538598T1 (de) 2012-01-15
JP5384696B2 (ja) 2014-01-08
CA2389410C (en) 2011-06-28
ZA200203276B (en) 2003-07-24
JP5289659B2 (ja) 2013-09-11
AU1481101A (en) 2001-06-06
JP2003523652A (ja) 2003-08-05
CN1421102A (zh) 2003-05-28
HK1053565A1 (en) 2003-10-24
BR0015341A (pt) 2003-07-15
EP1230804A1 (en) 2002-08-14
AU782176B2 (en) 2005-07-07
BR0015341B1 (pt) 2015-01-06
KR100740818B1 (ko) 2007-07-19

Similar Documents

Publication Publication Date Title
ES2376540T3 (es) Compresión de imagen por dct de tamaño de bloque adaptativo en base a la varianza.
ES2584035T3 (es) Optimizador configurable de patrones
US6600836B1 (en) Quality based image compression
AU2002315160A1 (en) Configurable pattern optimizer
US6996283B2 (en) Block size assignment using local contrast ratio
AU2002305838A1 (en) Selective chrominance decimation for digital images
EP1400128A1 (en) Selective chrominance decimation for digital images
WO2003045069A2 (en) Block size assignment using local contrast ratio
HK1166429B (en) Configurable pattern optimizer