BRPI0609280A2

BRPI0609280A2 - codificação luma e croma usando um preditor comum

Info

Publication number: BRPI0609280A2
Application number: BRPI0609280-2A
Authority: BR
Inventors: Haoping Yu
Original assignee: Thomson Licensing
Priority date: 2005-04-13
Filing date: 2006-03-16
Publication date: 2010-03-09
Also published as: US8767826B2; KR20080006554A; JP2008536452A; JP2016026457A; EP1872586A1; MX2007012653A; KR101254355B1; MY163150A; US20200374561A1; JP2013214995A; JP6561101B2; JP2013214997A; WO2006112996A1; JP6345637B2; JP2016042721A; KR20080006553A; EP1869892B1; JP6538521B2; MY158264A; JP2013214996A

Abstract

CODIFICAçãO LUMA E CROMA USANDO UM PREDITOR COMUM. São descritos codificadores de video, decodificadores de vídeo e métodos correspondentes. Um codificador de vídeo para codificar dados de sinal de video para um bloco de imagem inclui um codificador (100) para codificar todos os componentes de cor dos dados de sinal de video usando um preditor comum (315) . Um decodificador de video para decodificar dados de sinal de vídeo para um bloco de imagem inclui um decodificador (200) para decodificar todos os componentes de cor dos dados de sinal de video usando um preditor comum (430) . Adicionalmente, um aparelho e método para codificar e decodificar dados de sinal para um bloco de imagem incluem um codificador e decodificador para codificar / decodificar componentes de cor dos dados de sinal de vídeo sem aplicar uma transformada de cor residual neles. Além do mais, um codificador e decodificador de vídeo para codificar / decodificar dados de sinal de video para um bloco de imagem incluem um codificador e decodificador para codificar / decodificar os dados de sinal de video usando preditores exclusivos para cada um dos componentes de cor dos dados de sinal de vídeo.

Description

"CODIFICAÇÃO LUMA E CROMA USANDO UM PREDITOR COMUM"

REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS

Este pedido reivindica o beneficio do pedido pro-visório US 60/671.255, depositado em 13 de abril de 2005, edo pedido provisório US 60/700.834, depositado em 20 de ju-lho de 2005, ambos os quais são aqui incorporados pela refe-rência em suas respectivas integras. Além do mais, este pe-dido está relacionado aos pedidos de patente, documentos ju-diciais PU060023, intitulado "METHOD AND APPARATUS FOR VÍDEOENCODING"; PU060029, PU060030, intitulados "METHOD AND APPA-RATUS FOR VÍDEO DECODING"; e PU05015 9, intitulado "METHODAND APPARATUS FOR VÍDEO ENCODING AND DECODING", cada um dosquais é depositado concorrentemente com este.

CAMPO TÉCNICO

A presente invenção diz respeito, no geral, a co-dificadores e decodificadores e, mais particularmente, a mé-todos e aparelhos para codificação e decodificação de video.

ANTECEDENTES DA INVENÇÃO

Atualmente, o formato 4:4:4 do padrão H.264 da U-nião Internacional de Telecomunicações, Setor de Telecomuni-cações (ITU-T) (doravante, o "padrão H.264") somente codifi-ca um de três canais como luma, com os outros dois canaissendo codificados como croma usando ferramentas menos efici-entes. Quando uma entrada de um codec está no formato 4:4:4com resolução completa em todos os componentes de entrada, acodificação de dois dos três componentes de entrada com oalgoritmo de codificação croma menos efetivo resulta no usode mais bits naqueles dois canais. Este problema particularé mais perceptível em intraquadros. Por exemplo, o padrãoH.2 64 executando no modo somente intra é menos eficiente queJPEG2k para qualidade de compressão completa em 40 dB (PSNR)e superiores.

Dessa maneira, é desejável e altamente vantajosoter métodos e aparelhos para codificação e decodificação devideo que superem as desvantagens supradescritas da tecnolo-gia anterior.

SUMÁRIO DA INVENÇÃO

Estes e outros inconvenientes e desvantagens datecnologia anterior são abordados pela presente invenção,que é direcionada para métodos e aparelhos para codificaçãoe decodificação de video.

De acordo com um aspecto da presente invenção, éprovido um codificador de video para codificar dados de si-nal de video para um bloco de imagens. O codificador de vi-deo inclui um codificador para codificar todos os componen-tes de cor dos dados de sinal de video usando um preditorcomum.

De acordo com um outro aspecto da presente inven-ção, é provido um método para codificar dados de sinal devideo para um bloco de imagens. O método inclui codificartodos os componentes de cor dos dados de sinal de video u-sando um preditor comum.

De acordo com um ainda outro aspecto da presenteinvenção, é provido um decodificador de video para decodifi-car dados de sinal de video para um bloco de imagens. O de-codificador de video inclui um decodificador para decodifi-car todos os componentes de cor dos dados de sinal de videousando um preditor comum.

De acordo com um ainda outro aspecto da presenteinvenção, é provido um método para decodificar dados de si-nal de video para um bloco de imagens. 0 método inclui deco-dificar todos os componentes de cor dos dados de sinal devideo usando um preditor comum.

Estes e outros aspectos, recursos e vantagens dapresente invenção ficarão aparentes a partir da seguintedescrição detalhada das modalidades exemplares, que deve serlida em conjunto com os desenhos anexos.

DESCRIÇÃO RESUMIDA DOS DESENHOS

A presente invenção pode ser mais bem entendida deacordo com as seguintes Figuras exemplares, nas quais:

A Figura 1 é um diagrama em blocos ilustrando umaparelho codificador de video exemplar no qual os presentesprincípios podem ser aplicados;

A Figura 2 é um diagrama em blocos ilustrando umaparelho decodificador de video exemplar no qual os presen-tes princípios podem ser aplicados;

A Figura 3 é um fluxograma ilustrando um processode codificação de video exemplar com um bloco de transforma-da de cor de pré-codif icação de acordo com os presentesprincípios;

A Figura 4 é um fluxograma ilustrando um processoexemplar de decodificação de video com um bloco de transfor-mada de cor inversa de pós-decodificação de acordo com ospresentes princípios;

A Figura 5 é um diagrama em blocos ilustrando ummodelo simplificado de transformada de cor residual (RCT);

As Figuras 6A e 6B são gráficos de PSNR médio emfunção da taxa de bit para ATV somente intra de acordo comos presentes princípios;

As Figuras 7A e 7B são gráficos de PSNR médio emfunção da taxa de bit para CT somente intra de acordo com ospresentes princípios;

As Figuras 8A e 8B são gráficos de PSNR médio emfunção da taxa de bit para DT somente intra de acordo com ospresentes princípios;

As Figuras 9A e 9B são gráficos de PSNR médio emfunção da taxa de bit para MIR_HD somente intra de acordocom os presentes princípios;

As Figuras 10A e 10B são gráficos de PSNR médio emfunção da taxa de bit para RT somente intra de acordo com ospresentes princípios;

As Figuras 11A e 11B são gráficos de PSNR médio emfunção de taxa de bit para STB_HD somente intra de acordocom os presentes princípios;

A Figura 12 é uma tabela ilustrando a sintaxe doparâmetro da seqüência H.264 de acordo com os presentesprincípios;

A Figura 13 é uma tabela ilustrando a sintaxe dedados residuais H.264 de acordo com os presentes princípios;

A Figura 14 é um fluxograma ilustrando um processode codificação de video exemplar com um bloco de transforma-da de cor de pré-codif icação de acordo com os presentesprincípios;

A Figura 15 é um fluxograma ilustrando um processoexemplar de decodificação de vídeo com um bloco de transfor-mada de cor inversa de pós-decodificação de acordo com ospresentes princípios; e

A Figura 16 é uma tabela ilustrando a sintaxe depredição de macrobloco H.264 de acordo com os presentesprincípios.

DESCRIÇÃO DETALHADA

A presente invenção é direcionada para métodos eaparelhos para codificação e decodificação de dados de sinalde vídeo. Percebe-se que, embora a presente invenção sejaessencialmente descrita com relação aos dados de sinal devídeo amostrados usando o formato 4:4:4 do padrão H.264 daUnião Internacional de Telecomunicações, Setor de Telecomu-nicações (ITU-T), a presente invenção também pode ser apli-cada aos dados de sinal de vídeo amostrados usando outrosformatos (por exemplo, o formato 4:2:2 e/ou o formato 4:2:0)do padrão H.264, bem como outros padrões de compressão devídeo, ao mesmo tempo em que mantém o escopo da presente in-venção .

Percebe-se que métodos e aparelhos de acordo comos presentes princípios não exigem o uso de nenhuma ferra-menta(s) inédita(s) para o algoritmo de compressão luma oucroma. Em vez disto, podem ser usadas as ferramentas de co-dificação luma existentes. Dessa maneira, um resultado van-tajoso a partir deste ponto é que o desempenho de codifica-ção do formato 4:4:4 pode ser maximizado ao mesmo tempo emque preserva compatibilidade com versões anteriores e mini-miza qualquer mudança do padrão H.264 existente (ou outroaplicável).

De acordo com os princípios da presente invenção,da forma configurada em uma modalidade, um algoritmo de co-dificação luma é usado para codificar todos os três canaiscomponentes, por exemplo, do conteúdo 4:4:4. Vantagens destamodalidade incluem uma melhoria no desempenho geral de codi-ficação para comprimir conteúdo 4:4:4 em relação à tecnolo-gia anterior. Atualmente, no padrão H.264 existente, somenteum dos três canais é codificado como luma, e os outros doissão codificados como croma usando ferramentas menos eficien-tes.

Adicionalmente, de acordo com os princípios dapresente invenção, da forma configurada em uma modalidade, atransformada de cor é realizada como uma etapa de pré-processamento. Assim, de acordo com esta modalidade, umatransformada de cor residual (RCT) não é realizada dentro dolaço de compressão. Vantagens desta modalidade incluem aprovisão de consistente arquitetura de codificador / decodi-ficador entre todos os formatos de cor.

Além do mais, de acordo com os princípios da pre-sente invenção, da forma configurada em uma modalidade, omodo de predição de movimento / espacial é usado para todosos três componentes. Vantagens desta modalidade incluem bai-xa complexidade de codec e compatibilidade com versões ante-riores .Também, de acordo com uma outra modalidade, em vezde usar o mesmo preditor para todos os três componentes, umconjunto (ou subconjunto) de três (3) preditores espaciaisrestritos pode ser utilizado para os três componentes. Van-tagens desta modalidade incluem uma melhoria no desempenhogeral de codificação para comprimir conteúdo 4:4:4 em rela-ção à tecnologia anterior.

Percebe-se que várias modalidades supradescritase, subseqüentemente, aqui descritas, podem ser implementadascomo modalidades independentes ou podem ser combinadas dequalquer maneira da forma prontamente percebida pelos versa-dos na técnica. Assim, por exemplo, em uma primeira modali-dade combinada, um algoritmo de codificação luma é vantajo-samente usado para codificar todos os três canais componen-tes, a transformada de cor é realizada como uma etapa depré-processamento, e um único preditor é usado para todos ostrês canais componentes. Em uma segunda modalidade combina-da, um algoritmo de codificação luma é vantajosamente usadopara codificar todos os três canais componentes, a transfor-mada de cor é realizada como uma etapa de pré-processamento,e um conjunto (ou subconjunto) de três (3) preditores espa-ciais restritos pode ser utilizado pelos três canais compo-nentes. Certamente, da forma exposta, outras combinações devárias modalidades também podem ser implementadas dados ospreceitos dos presentes princípios aqui providos, emboramantendo o escopo da presente invenção.

A presente descrição ilustra os princípios da pre-sente invenção. Assim, percebe-se que os versados na técnicaserão capazes de desenvolver vários arranjos que, embora nãoexplicitamente aqui descritos ou mostrados, incorporam osprincípios da invenção e estão incluídos no seu espirito eescopo.

Pretende-se que todos os exemplos e linguagem condicional aqui citados tenham propósitos pedagógicos para auxiliar o leitor no entendimento dos princípios da invenção edos conceitos contribuídos pelo inventor para promover atecnologia, e que sejam interpretados sem limitações a taisexemplos e condições especificamente citados.

Além do mais, pretende-se que todas as declaraçõesaqui citando princípios, aspectos e modalidades da invenção,bem como seus exemplos específicos, abranjam tanto seus equivalentes estruturais quanto funcionais. Adicionalmente,pretende-se que tais equivalentes incluam tanto os equivalentes atualmente conhecidos bem como os equivalentes desenvolvidos no futuro, isto é, todos os elementos desenvolvidosque realizem a mesma função, independentemente da estrutura.

Assim, por exemplo, versados na :técnica percebemque os diagramas em blocos aqui apresentados representam visões conceituais de conjuntos de circuitos ilustrativos incorporando os princípios da invenção. Similarmente, percebese que todos os fluxogramas, diagramas de fluxo, diagramasde transição de estado, pseudocódigos e semelhantes, representam vários processos que podem ser substancialmente representados em meio legível por computador e, portanto, executados por um computador ou processador, esteja este computador ou processador explicitamente mostrado ou não.As funções dos vários elementos mostrados nas Fi-guras podem ser providas por meio do uso de hardware dedica-do bem como por hardware capaz de executar suporte lógico emassociação com suporte lógico apropriado. Quando providaspor um processador, as funções podem ser providas por um ú-nico processador dedicado, por um único processador compar-tilhado, ou por uma pluralidade de processadores individu-ais, alguns dos quais podem ser compartilhados. Além domais, o uso explicito do termo "processador" ou "controla-dor" não deve ser interpretado dizendo respeito exclusiva-mente a hardware capaz de executar suporte lógico e pode in-cluir implicitamente, sem limitações, hardware processadorde sinal digital ("DSP"), memória exclusiva de leitura("ROM") para armazenar suporte lógico, memória de acesso a-leatório ("RAM") e armazenamento não volátil.

Outro hardware, convencional e/ou personalizado,também pode ser incluido. Similarmente, todos os comutadoresmostrados nas Figuras são somente conceituais. Suas funçõespodem ser realizadas por meio da operação de lógica de pro-grama, por meio de lógica dedicada, por meio da interação decontrole de programa e lógica dedicada, ou mesmo manualmen-te, a técnica particular sendo selecionável pelo implementa-dor da forma mais especificamente entendida pelo contexto.

Nas reivindicações deste, pretende-se que todo e-lemento expressado como um dispositivo para realizar umafunção especificada abranja qualquer maneira de realizar a-quela função incluindo, por exemplo,: a) uma combinação deelementos de circuito que realiza aquela função ou b) supor-te lógico em qualquer forma, incluindo, portanto, suportelógico embarcado, microcódigo ou semelhante, combinado comconjunto de circuito apropriado para executar aquele suportelógico para realizar a função. A invenção, da forma definidapor tais reivindicações, reside no fato de que as funciona-lidades providas pelos vários dispositivos citados são com-binadas e reunidas na maneira que as reivindicações exigem.Assim, percebe-se que qualquer dispositivo que possa proveraquelas funcionalidades é equivalente àqueles aqui mostrados.

Em relação à Figura 1, um aparelho de codificaçãode video exemplar é indicado, no geral, pelo número de refe-rência 199. O aparelho de codificação de video 199 inclui umcodificador de video 100 e um módulo de transformada de corde pré-codificação 105.

O módulo de transformada de cor de pré-codificação105 serve para realizar um pré-processamento de cor dos si-nais de video antes de dar entrada dos mesmos no codificadorde video 100. O pré-processamento de cor realizado pelo mó-dulo de transformada de cor de pré-codificação 105 é adicio-nalmente aqui descrito a seguir. Percebe-se que o módulo detransformada de cor de pré-codificação 105 pode ser omitidoem algumas modalidades.

Uma entrada do módulo de transformada de cor depré-codif icação 105 e uma entrada do codificador de video100 estão disponíveis como entradas do aparelho de codifica-ção de video 199.

Uma salda do módulo de transformada de cor de pré-codificação 105 é conectada em comunicação de sinal com aentrada do codificador de video 100.

A entrada do codificador de video 100 é conectadaem comunicação de sinal com uma entrada não invertida de umajunção de soma 110. A saida da junção de soma 110 é conectada em comunicação de sinal com um transformador / quantizador 120. A saida do transformador / quantizador 120 é conectada em comunicação de sinal com o codificador de entropia140.

Uma saida do codificador de entropia 140 está disponivel como uma saida do codificador de video 100 e também comouma saida do aparelho de codificação de video 199.

A saida do transformador / quantizador 120 é adicionalmente conectada em comunicação de sinal com um transformador / quantizador inverso 150. Uma saida do transformador / quantizador inverso 150 é conectada em comunicação desinal com uma entrada de um filtro de remoção de registro dobloco 160. Uma saida do filtro de remoção de registro dobloco 160 é conectada em comunicação de sinal com os repositórios de imagem de referência 170. Uma primeira saida dosrepositórios de imagem de referência 170 é conectada em comunicação de sinal com uma primeira entrada de um estimadorde predição de movimento e espacial 180. A entrada do codificador de video 100 é adicionalmente conectada em comunicação de sinal com uma segunda entrada do estimador de predição de movimento e espacial 180. A saida do estimador depredição de movimento e espacial 180 é conectada em comunicação de sinal com uma primeira entrada de um compensador depredição de movimento e espacial 190. Uma segunda saida dosrepositórios de imagem de referência 170 é conectada em comunicação de sinal com uma segunda entrada do compensador demovimento e espacial 190. A saida do compensador de movimento e espacial 190 é conectada em comunicação de sinal comuma entrada invertida da junção de soma 110.

Em relação à Figura 2, um aparelho de decodificação de video é indicado, no geral, pelo número de referência299. O aparelho de decodificação de video 299 inclui um decodificador de video 200 e um módulo de transformada de cor inversa de pós-decodificação 293.

Uma entrada do decodif icador de video 200 estádisponível como uma entrada do aparelho de decodificação devideo 299. A entrada do decodificador de video 200 é conectada em comunicação de sinal com uma entrada do decodificador de entropia 210. Uma primeira saida do decodificador deentropia 210 é conectada em comunicação de sinal com uma entrada de um quantizador / transformador inverso 220. Uma saida do quantizador / transformador inverso 220 é conectadaem comunicação de sinal com uma primeira entrada de uma junção de soma 240.

A saida da junção de soma 240 é conectada em comunicação de sinal com um filtro de remoção de registro dobloco 290. Uma saida do filtro de remoção de registro dobloco 290 é conectada em comunicação de sinal com repositórios de imagem de referência 250. O repositório de imagem dereferência 250 é conectado em comunicação de sinal com umaprimeira entrada de um compensador de predição de movimentoe espacial 260. Uma saida do compensador de predição de mo-vimento e espacial 2 60 é conectada em comunicação de sinalcom uma segunda entrada da junção de soma 24 0. Uma segundasaida do decodificador de entropia 210 é conectada em comunicação de sinal com uma segunda entrada do compensador demovimento 260. A saida do filtro de remoção de registro dobloco 290 está disponível como uma saida do decodificador devideo 2 00 e também como uma saida do aparelho de decodifÍcação de vídeo 299.

Além do mais, uma saída do módulo de transformadade cor inversa de pos-decodifícação 2 93 pode estar disponível como uma saída do aparelho de decodif ícação de vídeo299. Em um caso como este, a saída do decodificador de vídeo2 00 pode ser conectada em comunicação de sinal com uma entrada do módulo de transformada de cor inversa de pós-decodificação 293, que é um módulo de pós-processamento emrelação ao decodificador de vídeo 200. Uma saída do módulode transformada de cor inversa de pós-decodificação 2 93 prove um sinal transformado de cor inversa pós-processado emrelação à saída do decodificador de vídeo 200. Percebe-seque o uso do módulo de transformada de cor inversa de pósdecodificação 293 é opcional.

É agora apresentada uma descrição para melhor codificação 4:4:4 de acordo com os princípios da presente invenção. Uma primeira modalidade descrita é uma modalidadecombinada na qual o algoritmo de codificação luma é usadopara todos os componentes de cor, o mesmo modo de prediçãoespacial é usado para todos os componentes de cor, e . atransformada de cor residual (RCT) é omitida de dentro dolaço de compressão. Resultados de testes para esta modalida-de combinada também são providos. Posteriormente, é descritauma segunda modalidade combinada em que o algoritmo de codi-ficação luma é usado para todos os componentes de cor, umconjunto (ou subconjunto) de preditores espaciais restritosé usado para todos os componentes de cor (em vez de um únicomodo de predição espacial), e a transformada de cor residual(RCT) é omitida de dentro do laço de compressão. Assim, umadiferença entre a primeira e a segunda modalidades combina-das é o uso de um único modo de predição espacial para todosos componentes de cor na primeira modalidade combinada emoposição ao uso de um conjunto (ou subconjunto) de predito-res espaciais restritos para todos os componentes de cor nasegunda modalidade combinada. Certamente, diante do exposto,as modalidades aqui descritas podem ser implementadas comomodalidades independentes ou podem ser combinadas de qual-quer maneira, da forma prontamente percebida pelos versadosna técnica. Por exemplo, de acordo com os princípios da pre-sente ;invenção da forma configurada em ma modalidade, somen-te um.único modo de predição espacial é usado sem combinaçãocom outras modalidades, tal como a omissão da RCT do laço decompressão. Percebe-se que, dados os preceitos dos presentesprincípios aqui providos, estas e outras variações, imple-mentações e combinações das modalidades da presente invençãoficarão prontamente determináveis pelos versados na técnica,embora mantendo o escopo da presente invenção.

Em relação à Figura 3, um processo exemplar de co-dificação de video com um bloco de transformada de cor depré-codificação são indicados, no geral, pelos números dereferência 300 e 301, respectivamente.

Percebe-se que o bloco de transformada de cor depré-codif icação 301 inclui blocos 306, 308 e 310. Além domais, percebe-se que o bloco de transformada de cor de pré-odificação 301 é opcional e, assim, pode ser omitido em algumas modalidades da presente invenção.

O bloco de transformada de cor de pré-codificação301 inclui um bloco de limite de laço 306 que inicia um laço para cada bloco em uma imagem e passa o controle para umbloco de função 308. O bloco de função 308 realiza pré-prpcessamento de cor dos dados de sinal de video do bloco deimagem atual e passa o controle para um bloco de limite delaço 310. O bloco de limite de laço 310 termina o laço. Alémdo mais, o bloco de limite de laço 310 passa o controle paraum bloco de limite de laço 312, este último sendo incluidono processo de codificação de video 300.

O bloco de limite de laço 312 inicia um laço para; cada bloco na imagem e passa o controle para um bloco de. função 315. O bloco de função 315 forma uma predição de movimento compensado ou espacial do atual bloco de imagem usando um preditor comum para cada componente do atual blocode imagem e passa o controle para o bloco de função 320. Obloco de função 320 subtrai a predição de movimento compensado ou espacial do atual bloco de imagem para formar uma• predição residual e passa o controle para um bloco de função; 330. O bloco de função 330 transforma e quantiza a prediçãoresidual e passa o controle para um bloco de função 335. Obloco de função 335 realiza a transformada inversa e quanti-za a predição residual para formar uma predição residual co-dificada e passa o controle para um bloco de função 345. 0bloco de função 345 adiciona o residual codificado na predi-ção para formar um bloco de Figura codificado e passa o con-trole para um bloco de laço final 350. O bloco de laço final350 termina o laço e passa o controle para um bloco final355.

Em relação à Figura 4, um processo exemplar de de-codificação de video com um bloco de transformada de cor in-versa de pós-decodificação são indicados, no geral, pelosnúmeros de referência 400 e 460, respectivamente.

Percebe-se que o bloco de transformada de cor in-versa de pós-decodificação 460 inclui blocos 462, 464, 466 e468. Além do mais, percebe-se que o bloco de transformada decor inversa de pós-decodificação 460 é opcional e, assim,pode ser omitido em algumas modalidades da presente inven-ção .

O processo de decodificação 400 inclui um bloco delimite de laço 410 que inicia o laço para um bloco atual deuma imagem e passa o controle para um bloco de função 415. 0bloco de função 415 faz decodificação de entropia do residu-al codificado e passa o controle para um bloco de função420. O bloco de função 420 realiza a transformada inversa equantiza o residual decodificado para formar um residual co-dificado e passa o controle para um bloco de função 430. 0bloco de função 430 adiciona o residual codificado na predi-ção formada a partir de um preditor comum para cada compo-nente de cor para formar um bloco de Figura codificado epassa o controle para um bloco de limite de laço 435. 0 blo-co de limite de laço 435 termina o laço e passa o controlepara um bloco final 440.

Em algumas modalidades, o bloco de limite de laço435 opcionalmente passa o controle para o bloco de transfor-mada de cor inversa de pós-decodificação 460, em particular,o bloco de limite de laço 462 incluido no bloco de transfor-mada de cor inversa de pós-decodificação 460. 0 bloco de li-mite de laço 462 inicia um laço para cada bloco em uma ima-gem e passa o controle para um bloco de função 464. O blocode função 464 realiza um pós-processamento de cor inversodos dados de sinal de video do atual bloco de imagem e passao controle para um bloco de limite de laço 466. O bloco delimite de laço 466 termina o laço e passa o controle para umbloco final 468.

No formato 4:4:4 do H.264, cada canal de componen-te tem resolução completa. Assim, de acordo com a primeiramodalidade combinada apresentada anteriormente, o algoritmode codificação luma é usado em cada componente de cor paraalcançar a eficiência geral de compressão ideal. Dessa ma-neira, na modalidade, para intraquadros, cada componente decor pode ser comprimido, por exemplo, usando aqueles modosde predição listados na Tabela 8-2, Tabela 8-3 e Tabela 8-4em ISO/IEC 14496 10 Advanced Video Coding 3rd Edition (ITU-TRec. H.264), ISO/IEC JTC1/SC29/WG1 1 E ITU-T SG16 Q.6, Docu-mento N6540, julho de 2004.

Além do mais, na modalidade, o mesmo modo de pre-dição espacial é usado para todos os três componentes de pi-xel para reduzir adicionalmente a complexidade do codec emelhorar o desempenho. Por exemplo, o modo de predição ajustado pelos parâmetros prev_intra4x4_pred_mode_flag, remjntra4x4_pred_mode, prev_intra8x8_pred_mode_flag, erem_intra8x8_pred_mode para o luma no cabeçalho de prediçãodo macrobloco pode ser usado por todos os três componentes.Portanto, nenhum bit extra e elementos de sintaxe são necessários. Para os quadros (preditivos) B e P, os pixels de referência em locais fracionários de pixel podem ser calculados para todos os três canais. As mudanças detalhadas desintaxe e semântica ao padrão H.264 atual são adicionalmenteaqui discutidas a seguir.

A transformada de cor residual (RCT) foi adicionada ao codificador / decodificador no Alto Perfil 4:4:4. Emdecorrência disto, a estrutura de compressão para o formato4:4:4 é diferente daquela atualmente usada em todos os outros perfis no padrão H.264 para formatos 4:2:0 e 4:2:2. Isto resulta em alguma complexidade extra na implementação.

Além do mais, similar a qualquer outra transformada de cor,YCOCG nem sempre melhora o desempenho geral de compressão. Aefetividade do YCOCG é altamente dependente do conteúdo. Assim, para melhorar a compressão e robustez geral, na modalidade, a transformada de cor é colocada fora do laço de predição como uma parte do bloco de pré-processamento. Fazendoisto, selecionar uma transformada de cor ideal para uma tarefa de compressão especifica é um problema operacional e amelhor resposta para uma seqüência de entrada particular po-de ser encontrada entre inúmeras opções. De acordo com umamodalidade em que todos os três componentes estão usando osmesmos preditores espaciais para os intraquadros e os mesmosfiltros de interpolação para os quadros B e P (preditivo eintercodifiçado), ter a transformada de cor realizada nosresiduos de predição é idêntico a realizar a transformada decor nas imagens fonte fora do codec quando os erros de arre-dondamento / truncagem são ignorados. Isto será aqui discu-tido adicionalmente a seguir. Assim, o bloco RCT é removidoda estrutura de codificação para tornar a estrutura de codi-ficação consistente entre todos os formatos de cor.

Em relação à Figura 5, um modelo simplificado deRCT é indicado, no geral, pelo número de referência 500. Omodelo RCT 500 inclui um gerador de pixel de referência 510,uma junção de soma 520 e um módulo de transformação linear530. Entradas no gerador de pixel de referência 510 são con-figuradas para receber informação de movimento / borda e ve-tores [Xi] , [X2] ......... [Xn] . Uma saida do gerador de pi-xel de referência 510 é conectada em comunicação de sinalcom uma entrada invertida da junção de soma 520 que prove ovetor de predição [Xp] nele. Uma entrada não invertida dajunção de soma 520 é configurada para receber o vetor de en-trada [Xp]. Uma saida da junção de soma 520 é configurada emcomunicação de sinal com uma entrada do módulo de transfor-mação linear 530, que prove o vetor [Xd] nele. Uma saida domódulo de transformação linear 530 é configurada para provero vetor [Yd] .

No modelo simplificado da RCT 500, a transformadade cor representada por uma matriz 3x3 [A] (uma transforma-ção linear) é definida como segue:

<formula>formula see original document page21</formula>

[X„] , [Xd], [Xp], [Xf], [X2] ---- [X„] são vetores

3x1 representando os pixels no domínio RGB. [Yd] é um vetor3x1 representando o resultado da transformada de cor. Por-tanto,

<formula>formula see original document page 21</formula>

Posteriormente, na modalidade, os mesmos preditores espaciais e filtros de interpolação são usados para todos os três componentes em um macrobloco de acordo com osprincípios da presente invenção da forma configurada em umamodalidade, o pixel de referência [Xp] podendo ser expressocomo segue:

<formula>formula see original document page 21</formula>

onde um vetor nxl [C] representa as operações li-neares envolvidas nos preditores espaciais e filtros de in-terpolação definidos no padrão H.264. Aqui, presume-se que opixel de referência seja calculado usando um número total den pixels vizinhos [Xi] , [X2] , ... [Xn]

Substituir [Xp] da equação (3) na equação (2) resulta no seguinte:

<formula>formula see original document page 22</formula>

Ignorar os erros de arredondamento / truncagem eassumir que o mesmo modo de predição seja selecionado tantono domínio RGB quanto no dominio Y resulta no seguinte:

<formula>formula see original document page 22</formula>

Portanto,<formula>formula see original document page 23</formula>

Assim, a equação (6) mostra claramente que usarYUV como entrada para o codificador / decodificador, de a-cordo com os principios da presente invenção da forma confi-gurada nesta modalidade, é idêntico a realizar RCT.

Também, de acordo com os principios da presenteinvenção da forma configurada em uma modalidade, um inéditoperfil 4:4:4 é adicionado no padrão H.264, aqui referido co-mo "Advanced 4:4:4 Profile with profile_idc=l66". Este iné-dito profile_idc pode ser adicionado no cabeçalho de parâme-tro de seqüência e pode ser usado no cabeçalho de camada demacrobloco, bem como no cabeçalho de dados residuais.

Para suportar o uso de algoritmo luma para codifi-car todos os três componentes de cor, algumas mudanças podemser feitas na sintaxe de dados residuais. Além do mais, tam-bém podem ser feitas mudanças na semântica de alguns dos e-lementos no cabeçalho do macrobloco, no cabeçalho de dadosresiduais, e assim por diante. No geral, a sintaxe existentepara luma na especificação H.264 permanecerá inalterada eserá usada para codificar um dos três componentes. As mudan-ças são compatíveis com versões anteriores. As mudanças de-talhadas de sintaxe e semântica são aqui descritas a seguir.

Agora será dada uma descrição em relação aos re-sultados da simulação realizada de acordo com os princípiosda presente invenção da forma configurada em várias modali-dades .

Em relação às Figuras 6A e 6B, gráficos de PSNRmédio em função da taxa de bit para ATV somente intra sãoindicados, no geral, pelos números de referência 600 e 650,respectivamente.

Em relação às Figuras 7A e 7B, gráficos de PSNRmédio em função da taxa de bit para CT somente intra são in-dicados, no geral, pelos números de referência 700 e 750,respectivamente.

Em relação às Figuras 8A e 8B, gráficos de PSNRmédio em função da taxa de bit para DT somente intra são in-dicados, no geral, pelos números de referência 800 e 850.

Em relação às Figuras 9A e 9B, gráficos de PSNRmédio em função da taxa de bit para MIRJHD somente intra sãoindicados, no geral, pelos números de referência 900 e 950,respectivamente.

Em relação às Figuras 10A e 10B, gráficos ;de PSNRmédio em função da taxa de bit para RT somente intra .são in-dicados, no geral, pelos números de referência 1000 e 1050,respectivamente.

Em relação às Figuras 11A e 11B, gráficos de PSNRmédio em função da taxa de bit para STBJHD somente intra sãoindicados, no geral, pelos números de referência 1100 e1150.

Em particular, as Figuras 6A, 7A, 8A, 9A, 10 e 11Ailustram resultados de teste para o perfil avançado 4:4:4proposto (indicado e precedido pelo termo "inédito") em fun-ção de resultados de aproximação correspondentes a ele. Alémdo mais, as Figuras 6B, 7B, 8B, 9B, 10B e 11B ilustram re-sultados de teste para o perfil avançado 4:4:4 proposto (indicado e precedido pelo termo "inédito") em função deJPEK2k.

Em todas as Figuras 6A, 6B até 11A, 11B, o PSNR éindicado em decibéis (dB) e a taxa de bit é indicada em bitspor segundo (bps) . ATV, CT, DT, MIR, RT, STB são os nomesdos clipes de teste.

Todas as seqüências de teste JVT/FRExt descritasem JVT-J042, Seqüências de Teste Originadas de Filme, foramusadas nos testes. Todas elas são material de filme 4:4:4 de bits e cada clipe tem 58 quadros.

Os perfis avançados 4:4:4 propostos foram implementados no suporte lógico de referência JVT JM9.6. Tanto aestrutura de codificação somente intra quanto a estrutura decodificação IBBP foram usadas nos testes. O parâmetro dequantização foi ajustado em 6, 12, 18, 24, 30 :e 42 para cadauma das curvas R-D. A seleção do modo otimizado em RD foiusada.

O perfil avançado 4:4:4 proposto também foi compa-rado com os resultados que foram conseguidos executando osuporte lógico de referência com o TUVFormat=0(4:0:0) em ca-da componente de entrada individual. Três contagens de bitcomprimido individual separado foram simplesmente somadaspara obter o total de bits comprimidos para calcular a taxade bit comprimido.Em relação a JPEG2k, o suporte lógico KaKaduV2.2.3 foi usado nos testes. Os resultados do teste foramgerados usando 5 niveis de descompressão de ondeletas com ofiltro de ondeletas biortogonal de 9/7 derivações. Havia somente um ladrilho por quadro e a Otimização em RD para umadada taxa alvo também foi usada.

Todas as medidas PSNR foram feitas no dominio RGB.PSNR médio, definido como

(PSNR(red)+PSNR(green)+PSNR(blue))/3, é usado para comparar a qualidade geral de compressão. Isto ocorre, principalmente , em virtude de os dados comprimidos em JPEG2k serem computados usando um algoritmo de controle de taxa desconhecidoprovido pelo suporte lógico. Para alguns casos, os valoresRGB PSNR são completamente distantes um do outro, especialmente quando a transformada de cor JPEG2k foi usada.

A comparação de compressão foi realizada como segue :

* Newl: o perfil avançado 4:4:4 proposto com umúnico modo de predição. .

* New3: o perfil avançado 4:4.: 4 proposto com trêsmodos de predição.

* RCT-OFF: entrada RGB com RCT=off.

* RCT-ON: entrada RGB com RCT=on.

* YCOCG: conversão RGB para YCOCG foi feita forado codec. Então, o YCOCG convertido foi usado como a entrada

para o suporte lógico JVT.

* R+G+B: Método proposto aproximado comprimindo ossinais R, G e B separadamente.* Y+CO+CG: Método proposto aproximado comprimindoos sinais convertidos Y, CO, CG separadamente.

*J2k_RGB: A compressão JPEG2k foi feita no dominioRGB. A transformada de cor JPEG2k foi desligada.

*J2k_YUV: A compressão JPEG2k foi feita no dominioYUV. A transformada de cor JPEG2k foi usada.

De acordo com os resultados do teste, uma implementação de acordo com os princípios da presente invenção daforma configurada em uma modalidade, no geral, é muito similar ao JPEG2k em termos de eficiência geral de compressão.Em alguns casos, ela é ainda ligeiramente melhor.

Adicionalmente, uma implementação de acordo com osprincípios da presente invenção da forma configurada em umamodalidade prove desempenho (compressão) significativamentemelhor que o atual Alto Perfil 4:4:4 para qualidade acima de40 dB (PSNR). Especificamente, Newl-YCOCG ou New3-YC0CG émelhor que YCOCG e RCT-ON; Newl-RGB ou New3-RGB é melhor queRCT-OFF. Em um PSNR igual ou maior que 45 dB (PSNR), a melhoria média no PSNR médio é maior que 1,5 dB. No último exemplo, a melhoria pode ser traduzida em mais de 25% de economia de bit em um PSNR igual a 45 dB.

De acordo com os resultados do teste, parece queas transformações de cor ajudam no desempenho de codificaçãoquando o conteúdo é mais saturado de cor, tais como TP, RT.

Isto é, se a cor for neutra e menos saturada, codificar odominio RGB pode ser a escolha certa. A observação exposta éindependente de qual transformada;de cor é usada.

Comparando os resultados de Newl-YCOCG ou New3-YCOCG e JPEG-2k_YÜV, observou-se que o desempenho de umatransformada de cor específica em termos de melhorar a eficiência de codificação é muito dependente do conteúdo. Nemsempre a transformada de cor única é melhor. Portanto, nossos dados confirmaram que ter uma transformada de cor, talcomo RCT, dentro de um laço de codificação (ou decodificação) pode não ser uma boa idéia. Em vez disto, realizar atransformada de cor, se for necessária, fora do codificador/ decodificador pode fazer com que todo o sistema de compressão proveja um desempenho melhor e mais robusto.

Comparando YCOCG com RCT-ON, os resultados do teste não mostram nenhuma melhoria na eficiência de codificaçãoem relação a RCT. Além do mais, percebe-se que executar osuporte lógico de referência com a RCT ligada aumentou significativamente o tempo de codificação. O tempo de execuçãofoi mais de 2,5 vezes maior.

Agora, será dada uma descrição em relação a mudanças de sintaxe e semântica de acordo com os princípios dapresente invenção da forma configurada em uma modalidade.

Em relação à Figura 12, uma tabela para sintaxe deparâmetro de seqüência H.264 é indicada, no geral, pelo número de referência 1200. Mudanças na sintaxe de acordo comos princípios da presente invenção da forma configurada emuma modalidade são indicadas por texto em itálico.

Em relação à Figura 13, uma tabela para sintaxe dedados residuais H.264 é indicada, no geral, pelo número dereferência 1300. Adições / mudanças na sintaxe de acordo comos princípios da presente invenção da forma configurada emuma modalidade são indicadas por texto em itálico. Na tabela1300, a seção luma no cabeçalho de dados residuais junto comalgumas modificações de texto necessárias são repetidas duasvezes para suportar o lumal e luma2, respectivamente.

Conforme exposto, a supradescrita primeira modalidade combinada foi avaliada e testada implementando os presentes princípios no suporte lógico de referência JVT JM9.6.Os resultados de teste marcados com Newl-RGB ou Newl-YCOCGrepresentam a primeira modalidade combinada.

Conforme exposto, de acordo com os princípios dapresente invenção da forma configurada em uma modalidade, umconjunto (ou subconjunto) de três (3) preditores espaciaisrestritos é utilizado para os canais componentes (por exemplo, formatos RGB, YUV, YCrCb, e assim por diante) em vez deum único modo de predição espacial. Além do mais, conformeexposto, esta modalidade pode ser combinada com outras modalidades aqui descritas, tais como, por exemplo, o uso de somente o algoritmo de codificação luma para codificar todosos três canais componentes de conteúdo e/ou o uso de transformada de cor como uma etapa de pré-processamento.

Agora, será dada uma descrição em relação à supradescrita segunda modalidade combinada envolvendo o uso de umconjunto (ou subconjunto) de três (3) preditores espaciaisrestritos para os componentes de cor, o uso de somente o algoritmo de codificação luma para codificar todos os trêscomponentes de cor e o uso de transformada de cor como umaetapa de pré-processamento (isto é, sem RCT no laço de compressão) . Algumas variações desta modalidade também serãodescritas com isto.

Em relação à Figura 14, um processo exemplar decodificação de video com uma etapa de transformada de cor depré-codificação são indicados, no geral, pelos números dereferência 1400 e 1401, respectivamente.

Percebe-se que o bloco de transformada de cor depré-codificação 1401 inclui blocos 1406, 1408 e 1410. Alémdo mais, percebe-se que o bloco de transformada de cor depré-codificação 1401 é opcional e, assim, pode ser omitidoem algumas modalidades da presente invenção.

O bloco de transformada de cor de pré-codificação1401 inclui um bloco de limite de laço 1406 que inicia umlaço para cada' bloco em uma imagem e passa o controle paraum bloco de função 1408. O bloco de função 1408 desempenha opré-processamento de cor dos dados de sinal de video do atu-al bloco de imagem e passa o controle para um bloco de limi-te de laço 1410. O bloco de limite de laço 1410 termina olaço. Além do mais, o bloco de limite de laço 1410 passa ocontrole para :um bloco de limite de laço 1412, este últimosendo incluido.no processo de codificação de video 1400.

0 bloco de limite de laço 1412 inicia um laço paracada bloco na imagem e passa o controle para um bloco defunção 1415. 0 bloco de função 1415 forma uma predição demovimento compensada ou espacial do atual bloco de imagemusando um preditor comum para cada componente de cor do atu-al bloco de imagem e passa o controle para um bloco de fun-ção 1420. O bloco de função 1420 subtrai a predição de movi-mento compensada ou espacial da atual bloco de imagem paraformar uma predição residual e passa o controle para um bloco de função 1430. O bloco de função 1430 transforma e quantiza a predição residual e passa o controle para um bloco defunção 1435. 0 bloco de função 1435 realiza, a transformadainversa e quantiza a predição residual para formar uma predição residual codificada e passa o controle para um blocode função 1445. O bloco de função 1445 adiciona o residualcodificado na predição para formar um bloco de Figura e passa o controle para um bloco de laço final 1450. O bloco delaço final 1450 termina o laço e passa o controle para umbloco final 1455.

Em relação à Figura 15, um processo exemplar dedecodificação de video com uma etapa de transformada de corinversa de pós-decodificação são indicados, no geral, pelos números de referência 1500 e 1560, respectivamente.

Percebe-se que o bloco de transformada de cor inversa de pós-decodificação 1560 inclui blocos 1562, 1564,1566 e 1568. Além do mais, percebe-se que o bloco de transformada de cor inversa de pós-decodificação 1560 é opcional e, assim, pode ser omitido em algumas modalidades da presente invenção.

O processo de decodificação 1500 inclui um blocode limite de laço 1510 que inicia o laço para um bloco atualde uma imagem e passa o controle para um bloco de função 1515. O bloco de função 1515 faz decodificação de entropiado residual codificado e passa o controle para um bloco defunção 1520. O bloco de função 1520 realiza a transformadainversa e quantiza o residual decodificado para formar umresidual codificado e passa o controle para um bloco de fun-ção 1530. O bloco de função 1530 adiciona o residual codifi-cado na predição formada a partir de um preditor comum paracada componente de cor para formar um bloco de Figura codi-ficado e passa o controle para um bloco de limite de laço1535. O bloco de limite de laço 1535 termina o laço e passao controle para um bloco final 1540.

Em algumas modalidades, o bloco de limite de laço1535 opcionalmente passa o controle para o bloco de trans-formada de cor inversa de pós-decodificação 1560, em parti-cular, o bloco de limite de laço 1562 incluido no bloco detransformada de cor inversa de pós-decodificação 1560. Obloco de limite de laço 1562 inicia um laço para cada blocoem uma imagem e passa o controle para um bloco de função1564. O bloco de função 1564 realiza um pós-processamento decor inversa dos dados de sinal de video do atual bloco deimagem e passa o controle para um bloco de limite de laço1566. O bloco de limite de laço 1566 termina o laço e passao controle para um bloco final 1568.

Conforme exposto, é divulgado um perfil inédito(profile_idc=166) para o perfil avançado 4:4:4 . Este perfilinédito também pode ser usado para a segunda modalidade com-binada com mudanças de semântica e sintaxe correspondentesda forma aqui descrita a seguir para a segunda modalidadecombinada. Este inédito profile_idc é adicionado no Conjuntode Parâmetro de Seqüência e será usado, principalmente, noscabeçalhos subseqüentes para indicar que o formato de entra-da é 4:4:4 e todos os três canais de entrada são codificadosde forma similar a luma.

Para minimizar as mudanças necessárias ao padrãoH.264, nenhum tipo inédito de macrobloco é divulgado para oPerfil avançado 4:4:4. Em vez disto, todos os tipos de ma-crobloco juntos com os parâmetros de codificação associadoslistados na Tabela 7-11, Tabela 7-13 e Tabela 7-14 do padrãoH.264 ainda são válidos. Para o caso de intramacroblocos,todos os três canais de entrada, luma, Cr e Cb serão codifi-cados com base no MbPartPredMode definido na Tabela 7-11 dopadrão H.264. Por exemplo, um macrobloco Intra_4x4 no perfilavançado 4:4:4 significa que todos os canais componentes deentrada podem ser codificados usando todos os 9 possíveismodos de predição dados na Tabela 8-2 do padrão H.264. Parareferência, na atual Alto Padrão 4:4:4, dois dos canais paraum macrobloco Intra_4x4 serão tratados como croma e somenteum dos 4 possíveis modos de intrapredição na Tabela 8-5 dopadrão H.264 será usado. Para os macroblocos B e P, as mu-danças feitas no padrão avançado 4:4:4 ocorrem no processode interpolação para o cálculo do valor de pixel de referên-cia no local fracionário de pixel. Aqui, o procedimento des-crito na Seção 8.4.2.2.1 do padrão H.264, processo de inter-polação de amostra luma, será aplicado para luma, Cr e Cb.Novamente para referência, o atual Alto Padrão 4:4:4 usa aSeção 8.4.2.2.2 do padrão H.264, processo de interpolação deamostra croma, para dois dos canais de entrada.

No caso em que o CABAC é escolhido como o modo decodificação de entropia, dois conjuntos separados de modelosde contexto idênticos àqueles atualmente definidos para lumaserão criados para Cr e Cb. Eles também serão atualizadosindependentemente durante o curso da codificação.

Finalmente, na modalidade, uma vez que não há blo-co RCT no laço de codificação, a ResidueColorTransformFlag éremovida do conjunto de parâmetro de seqüência no perfil a-vançado 4:4:4.

Até este ponto, a maioria das mudanças de sintaxeocorre nos dados residuais da forma mostrada na Figura 13,onde a sintaxe original para luma é repetida duas vezes parasuportar Cr e Cb nos perfis avançados 4:4:4 propostos.

Em relação à tabela de camada de macrobloco H.2 64(não mostrada), mudanças de semântica na sintaxe correspon-dente incluem o seguinte.

coded_block_pattern (Add). Quando croma_format_idcfor igual a 3 e coded_block_pattern estiver presente, Coded-BlockPatternCroma deve ser ajustado em 0. Além do mais, Co-dedBlockPatternLuma especifica, para cada um dos doze blocos8x8 luma, Cb e Cr do macrobloco, um dos seguintes casos: (1)Todos os niveis de coeficiente da transformada dos doze blo-cos luma 4x4 nos blocos luma 8x8, Cb 8x8 e Cr 8x8 são iguaisa zero; (2) Um ou mais niveis de coeficiente da transformadade um ou mais dos blocos luma 4x4 nos blocos luma 8x8, Cb8x8 e Cr 8x8 devem receber valor não zero.

Agora, será dada uma descrição em relação à sele-ção do modo de predição espacial para os intrablocos de a-cordo com a segunda modalidade combinada (ou a única modali-dade relacionada ao uso do conjunto (ou subconjunto) de trêspreditores espaciais restritos).Para cada componente escolher seu melhor MbPart-PredMode e o subseqüente melhor modo de predição espacialindependentemente, como no caso enquanto está codificandocada canal de entrada separadamente, alguns tipos inéditosde intrablocos podem ser adicionados na Tabela 7-11 do padrão H.264. Em decorrência disto, será feita uma grandequantidade de mudanças no padrão H.264. Em uma modalidaderelacionada à segunda modalidade combinada, o mbjypes atualpermanece inalterado e é provida uma solução alternativa. Namodalidade, os três canais de entrada são restritos para sercodificados com o mesmo MbPartPredMode ou tipo de macrobloco. Então, uma pequena quantidade de elementos inéditos éadicionada na Sintaxe de Predição do Macrobloco para suportar três modos de predição separados. Portanto, cada componente ainda pode, teoricamente, escolher seu melhor modo depredição espacial independentemente a fim de minimizar o erro de predição para cada canal componente. Por exemplo, assumindo que um macrobloco Intra_4x4 seja escolhido como ombjype, luma, Cr ou Cb ainda podem encontrar seus própriosmelhores modos de predição espacial na Tabela 8-2 na Seção8.3.1.1 do padrão H.264, tal como, por exemplo, In-tra_4x4_Vertical para luma, Intra_4_4_Horizontal para Cr eIntra_4x4_Diagonal_Down_Left para Cb .

Uma outra abordagem, em relação à primeira modalidade combinada supradescrita, é compelir todos os três canais de entrada a compartilhar o mesmo modo de predição. Isto pode ser feito usando a informação de predição que é atu-almente suportado pelos elementos de sintaxe existentes,tais como prev_intra4x4_pre_mode_flag,

rem_intra4x4_pred_mode, pre_intra8x8_pred_mode_flag erem_intra8x8_pred_mode, na sintaxe de Predição do Macroblo-co. Esta opção irá resultar em menos mudanças no padrãoH.264 e, também, em alguma ligeira perda de eficiência decodificação.

Com base nos resultados de testes, usar três modosde predição pode melhorar o desempenho geral de codificaçãoem cerca de 0,2 dB em relação à primeira modalidade combina-da.

Em relação à Figura 16, uma tabela para a sintaxede predição do macrobloco H.264 é indicada, no geral, pelonúmero de referência 1700. Para referência, a Sintaxe dePredição de Macrobloco modificada para suportar o uso detrês modos de predição é listada a seguir, onde:

prev_intra4x4_pred_mode_flagO erem_intra4x4_pred_mode0 são para luma;

prev_intra4x4_pred_mode_flagl erem_intra4x4_pred_model são para Cr;

prev_intra4x4_pred_mode_flag2 erem_intra4x4_pred_mode2 são para Cb.

Agora, será dada uma descrição em relação aos re-sultados da simulação realizada de acordo com os princípiosda presente invenção da forma configurada em uma modalidade,para a segunda modalidade combinada.

Todas as seqüências de teste JVT/FRExt são descri-tas em JVT-J042, Seqüências de Teste Originadas de Filme,JVT-J039 (Viper). Todas elas são materiais 4:4:4 de 10 bitse cada clipe tem 58 quadros.

0 algoritmo proposto foi implementado no suportelógico de referência JVT JM9.6 e o suporte lógico modificadofoi usado nos testes. Tanto somente intra quanto IBRrBP fo-ram testados. Aqui, "Br" significa as Figuras B gravadas. 0caso somente intra foi feito para todas as seqüências com oparâmetro de quantização igual a 6, 12, 18, 24, 30, 36 e 42.Em função da grande quantidade de tempo envolvido na simula-ção, a estrutura IBRrBP GOP somente foi feita para os clipesde filme com um parâmetro de quantização igual a 12, 18, 24,30 e 36. De acordo com a discussão no AHG 4:4:4, os seguintes parâmetros chave foram usados nos testes:

SymbolMode = 1

RDOptimization = 1

ScalingMatrixPresentFlag = 0

OffsetMatrixPresentFlag = 1

QoffsetMatrixFile = "q_offset.cfg"

AdaptiveRounding = 1

AdaptRnd Period = 1

AdaptRndCroma = 1

AdaptRndWFactorX = 8

SearchRange = 64

UseFME = 1

Em relação a JPEG2k, o suporte lógico KaKaduV2.2.3 foi usado nos testes. Os resultados do teste foramgerados usando 5 niveis de descompressão de ondeletas com ofiltro de ondeletas biortogonal de 9/7 derivações. Havia somente um ladrilho por quadro e a Otimização em RD para umadada taxa alvo também foi usada.

As medições PSNR foram calculadas primariamente nodominio de cor original dos conteúdos fonte, que é RGB paraos clipes supradescritos. PSNR médio, definido como(PSNR(red)+PSNR(green)+PSNR(blue))/3, é usado para comparara qualidade geral de compressão.

A comparação de compressão foi realizada como segue :

Newl: o Perfil avançado 4:4:4 proposto com um único modo de predição.

New3: o Perfil avançado 4:4:4 proposto com trêsmodos de predição.

RCT-OFF: entrada RGB com RCT=off.

RCT-ON: entrada RGB com RCT=on.

YCOCG: conversão RGB para YCOCG foi feita fora docodec. Então, o YCOCG convertido foi usado como a entradapara o suporte lógico JVT.

R+G+B: Método proposto aproximado comprimindo ossinais R, G e B separadamente.

Y+CO+CG: Método proposto aproximado comprimindo ossinais Y, CO e CG convertidos separadamente.

JPEG2K_RGB: A compressão JPEG2k foi feita no domínio RGB. A transformada de cor JPEG2k foi desligada.

JPEG2k_YUV: A compressão JPEG2k foi feita no dominio YUV. A transformada de cor JPEG2k foi usada.

Para o caso somente intra, o perfil avançado 4:4:4proposto de acordo com os presentes princípios é muito similar ao JPEK2k em termos de eficiência geral de compressão.Em alguns casos, ele é mesmo ligeiramente melhor.

A abordagem de acordo com os princípios da presen-te invenção é claramente melhor que o atual Alto Perfil4:4:4. Em um PSNR igual e maior que 45 dB (PSNR), a melhoriamédia no PSNR médio é maior que 1,5 dB. Em alguns casos, amelhoria pode ser traduzida em mais de 25% de economia debit em um PSNR igual a 45 dB.

Agora, será dada uma descrição de alguns dos muitos recursos / vantagens presentes providos pelos princípiosdas modalidades da presente invenção.

Os resultados do teste demonstram que o perfil avançado 4:4:4 proposto utilizando as melhorias correspondentes aos princípios da presente invenção proporciona melhordesempenho comparado com o atual Alto Perfil 4:4:4. O ganhode desempenho é significativo. Além do mais, mover a transformada de cor para fora do codec tornará a arquitetura docodec consistente entre todos os formatos de cor. Em decorrência disto, isto torna a implementação mais fácil e reduzo custo. Isto também torna o codec mais robusto em termos deselecionar a transformada de cor ideal para alcançar melhoreficiência de codificação. Também, a abordagem proposta nãoadiciona nenhuma ferramenta de codificação inédita e exigesomente algumas ligeiras mudanças na sintaxe e na semântica.

Assim, de acordo com os princípios da presente invenção da forma configurada em uma modalidade, um método eaparelho são providos para codificação e decodificação devideo. São providas modificações no padrão H.264 existenteque melhoram o desempenho além daquele atualmente alcança-vel. Além do mais, o desempenho é melhorado ainda além doJPEG-2000 para aplicações de alta qualidade. De acordo comos princípios da presente invenção da forma configurada emuma modalidade, melhorias significativas de desempenho decodificação 4:4:4 no padrão H.264 podem ser alcançadas usando o algoritmo de codificação luma para codificar todos ostrês componentes de cor do conteúdo 4:4:4. Isto é, nenhumaferramenta inédita é necessária para o algoritmo de codificação luma (ou croma, que não é usado). Em vez disto, ferramentas de codificação luma existentes são utilizadas. Adicionalmente, mudanças de sintaxe e de semântica ao atualperfil 4:4:4 podem ser implementadas de acordo com os preentes princípios para suportar a codificação luma de todosos três canais componentes. Em testes conduzidos de acordocom uma modalidade da presente invenção, quando o conteúdofonte tem muitas texturas e bordas espaciais, as ferramentasde predição espacial usadas em luma, exibiram claramente seudesempenho superior àquelas usadas em croma. Para algumasdas seqüências de teste, quando cada componente de cor foicodificada como luma, foi observada mais de 30% de reduçãode bit em uma qualidade de compressão maior ou igual a 45 dB(PSNR médio).

Percebe-se que, embora a presente invenção tenhasido aqui descrita essencialmente em relação aos dados desinal de video amostrados usando o formato 4:4:4 do padrãoH.264, a presente invenção também pode ser prontamente implementada em relação aos dados de sinal de video amostradosusando outros formatos (por exemplo, o formato 4:2:0 e/ou oformato 4:2:2) do padrão H.2 64, bem como outros padrões decompressão de vídeo. Dados os preceitos da presente invençãoaqui providos, estas e outras variações da presente invençãotambém podem ser prontamente implementadas pelos versados natécnica, embora mantendo o escopo da presente invenção.

Estes e outros recursos e vantagens da presenteinvenção podem ser prontamente determinados pelos versadosna técnica com base nos preceitos aqui divulgados. Entende-se que os preceitos da presente invenção podem ser implemen-tados em várias formas de hardware, suporte lógico, suportelógico embarcado, processadores com propósito especial ousuas combinações.

Mais preferivelmente, os preceitos da presente in-venção são implementados como uma combinação de hardware esuporte lógico. Além do mais, o suporte lógico pode ser im-plementado como um programa de aplicação embutido de formatangível em uma unidade de armazenamento de programa. 0 pro-grama de aplicação pode ser carregado em uma máquina compre-endendo qualquer arquitetura adequada e executado por ela.Preferivelmente, a máquina é implementada em uma plataformade computador com hardware tais como uma ou mais unidadescentrais de processamento ("CPU"), uma memória de acesso a-leatório ("RAM") e interfaces de entrada / saída ("1/0"). Aplataforma de computador também pode incluir um sistema ope-racional e código de microinstrução. Os vários processos efunções aqui descritos podem ser tanto parte do código demicroinstrução quanto parte do programa de aplicação, ouqualquer combinação destes, que podem ser executadas por umaCPU. Além do mais, várias outras unidades periféricas podemser conectadas na plataforma do computador, tais como umaunidade de armazenamento de dados adicional e uma unidade deimpressão.

Entende-se adicionalmente que, em virtude de al-guns dos componentes e métodos constituintes do sistema re-presentado nos desenhos anexos ser, preferivelmente, imple-mentados em suporte lógico, as conexões reais entre os com-ponentes do sistema ou os blocos de função do processo podemdiferir dependendo da maneira na qual a presente invenção éprogramada. Dados os preceitos aqui divulgados, versados natécnica serão capazes de contemplar estas e similares imple-mentações ou configurações da presente invenção.

Embora as modalidades ilustrativas tenham sido a-qui descritas em relação aos desenhos anexos, entende-se quea presente invenção não está limitada a estas precisas moda-lidades e que várias mudanças e modificações podem ser nelasrealizadas pelos versados na técnica sem fugir do escopo edo espirito da presente invenção. Pretende-se que todas taismudanças e modificações estejam incluidas.no escopo da pre-sente invenção da forma apresentada nas reivindicações ane-xas .

Claims

1. Codificador de video para codificar dados desinal de video para um bloco de imagem, CARACTERIZADO pelofato de que o codificador de video compreende um codificador(100) para codificar todos os componentes de cor dos dadosde sinal de video usando um preditor comum.

2. Codificador de video, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que o preditor comum éum preditor luma usado tanto por componentes luma quanto porcomponentes croma dos dados de sinal de video.

3. Codificador de.video, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que o dito codificador(100) usa um modo de predição espacial comum para todos oscomponentes de cor dos dados de sinal de video.

4. Codificador de video, de acordo com a reivindicação 3, CARACTERIZADO pelo fato de que o modo de prediçãoespacial comum é ajustado pelos parâmetrosprev_intra_8x8_pred_mode_f lag, rem_intra8x8_pred__mode,prev_intra4x4_pred_mode_flag e rem_lntra4x4_pred_mode do padrão H.264 da União Internacional de Telecomunicações, Setorde Telecomunicações.

5. Codificador de video, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que o dito codificador(100) usa filtros de interpolação comuns para quadros B e Ppara todos os componentes de cor dos dados de sinal de vi-deo .

6. Codificador de video, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que o dito codificador(100) codifica todos os componentes de cor dos dados de sinal de video sem aplicar uma transformada de cor residualneles.

7. Codificador de video, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que a amostragem dos dados de sinal de video corresponde a qualquer um dos formatos 4:4:4, 4:2:2 e 4:2:0 do padrão H.264 da União Internacionalde Telecomunicações, Setor de Telecomunicações.

8. Método para codificar dados de sinal de videopara um bloco de imagem, CARACTERIZADO pelo fato de que ométodo compreende codificar (315) todos os componentes decor dos dados de sinal de video usando um preditor comum.

9. Método, de acordo com a reivindicação 8,CARACTERIZADO pelo fato de que o preditor comum é um preditor luma usado tanto para componentes luma quanto para componentes croma dos dados de sinal de video.

10. Método, de acordo com a reivindicação 8,CARACTERIZADO pelo fato de que um modo de predição espacialcomum é usado para todos os componentes de cor dos dados desinal de video.

11. Método, de acordo com a reivindicação 10,CARACTERIZADO pelo fato de que o modo de predição espacialcomum é ajustado pelos parâmetrosprev_intra8x8_pred_mode_flag, rem_intra8x8_pred_mode,prev_intra4x4_pred_mode_flag e rem_intra4x4_pred_mode do padrão H.264 da União Internacional de Telecomunicações, Setorde Telecomunicações.

12. Método, de acordo com a reivindicação 8,CARACTERIZADO pelo fato de que os filtros de interpolaçãocomuns são usados para quadros B e P para todos os componentes de cor dos dados de sinal de video.

13. Método, de acordo com a reivindicação 8,CARACTERIZADO pelo fato de que a dita etapa de codificaçãocodifica todos os componentes de cor dos dados de sinal devideo sem aplicar uma transformada de cor residual neles.

14. Método, de acordo com a reivindicação 8,CARACTERIZADO pelo fato de que compreende adicionalmente realizar (308) uma transformada de cor nos dados de sinal devideo em uma etapa de pré-processamento antes da dita etapade codificação.

15. Método, de acordo com a reivindicação 8,CARACTERIZADO pelo fato de que a amostragem dos dados de sinal de video corresponde a qualquer um dos formatos 4:4:4,4:2:2 e 4:2:0 do padrão H.264 da União Internacional de Telecomunicações , Setor de Telecomunicações.