BRPI0619193A2

BRPI0619193A2 - método de codificação de imagem / decodificação de imagem, aparelho de codificação de imagem / decodificação de imagem

Info

Publication number: BRPI0619193A2
Application number: BRPI0619193-2A
Authority: BR
Inventors: Akiyuki Tanizawa; Takeshi Chujoh
Original assignee: Toshiba Kk Toshiba Corp
Priority date: 2005-11-30
Filing date: 2006-11-27
Publication date: 2011-09-20
Also published as: CN101361370A; JP5044415B2; KR20080067363A; US20070121731A1; AU2006320064A1; CA2631336A1; KR100977101B1; CN101361370B; EP1965589A1; RU2369038C1; AU2006320064B2; US8149910B2; JPWO2007063808A1; RU2408161C1; WO2007063808A1

Abstract

MéTODO DE CODIFICAçãO DE IMAGEM / DECODIFICAçãO DE IMAGEM, APARELHO DE CODIFICAçãO DE IMAGEM / DECODIFICAçãO DE IMAGEM. A presente invenção refere-se a um método de codificação de imagem que inclui uma etapa para dividir um sinal de imagem de entrada correspondendo a uma imagem em vários sinais de bloco de pixeis, uma etapa de geração de sinal de imagem de predição para executar a intrapredição para extrapolar um pixel de predição em uma direção definida por cada um dos modos de predição utilizando os pixels de referência alterados em número de acordo com uma distância entre o pixel de predição e um pixel de referência codificado para gerar um sinal de imagem de predição e informação do modo de predição, uma etapa para calcular um sinal de erro de predição a partir do sinal de bloco de pixels e do sinal de imagem de predição, uma etapa para selecionar um modo de predição dentre os vários modos de predição utilizando o sinal de erro de predição, e uma etapa para codificar o sinal de imagem utilizando o sinal de erro de predição baseado no modo de predição selecionado.

Description

Relatório Descritivo da Patente de Invenção para "MÉTODO DE CODIFICAÇÃO DE IMAGEM / DECODIFICAÇÃO DE IMAGEM, APARE- LHO DE CODIFICAÇÃO DE IMAGEM / DECODIFICAÇÃO DE IMAGEM".

Campo Técnico

A presente invenção refere-se a um método de codificação de

imagem e a um método de decodificação de imagem para uso em imagens em movimento ou em imagens paradas, com um aparelho de codificação de imagem e com um aparelho de decodificação de imagem e com um progra- ma de codificação de imagem e a um programa de decodificação de ima- gem.

Antecedentes da Técnica

Em anos recentes, um método de codificação de vídeo pelo qual a eficiência da codificação é amplamente aperfeiçoada comparada com a técnica convencional é estimulado como ITU.TRec.H264 e ISO/IEC14496-10 (referido como Ή.264") juntamente com o ITU-T e ISO/IEC. O sistema de codificação convencional tal como ISO/IECMPEG-1, 2, 4, ITU-TH.261, H.263 executa a predição intraquadro em um domínio de freqüência transformada em ortogonal (coeficientes DCT) para reduzir o número de bits codificados dos coeficientes de transformação. A H.264 compreende uma predição dire- cional em uma região do espaço (região de pixel) (literatura que não é de patente 1) para realizar a alta eficiência de predição em comparação com a predição intraquadro de um sistema convencional de codificação de vídeo (ISO/IECMPEG-1, 2, 4).

Na H.264 de alto perfil, etc., três tipos de sistemas de predição intraquadro são definidos para um sinal de luminância, e um dos sistemas pode ser selecionado em unidades de macrobloco (blocos de 16 x 16 pixels). Os sistemas de predição são referidos como predição de 4 x 4 pixels, predi- ção de 8 x 8 pixels e predição de 16 x 16 pixels, respectivamente.

Quatro modos de codificação são definidos para a predição de 16 x 16 pixels, e referidos como uma predição vertical, uma predição de ní- vel, uma predição DC e uma predição plana. O valor do pixel dos macroblo- cos circundantes decodificados antes de serem sujeitos a um filtro de retira- da de agrupamento em blocos é utilizado como um valor de pixel de referên- cia e utilizado para um processo de predição.

A predição de 4 χ 4 pixels divide um sinal de luminância no ma- crobloco em blocos de 164 χ 4 pixels, e seleciona um dentre nove modos para cada bloco de 4 χ 4 pixels. Cada um dos nove modos possui uma dire- ção de predição em unidades de 22,5 graus exceto para a predição DC (mo- do 2) para predizer com uma média de pixels de referência disponíveis, e extrapola o macrobloco na direção de predição utilizando o pixel de referên- cia para gerar um valor predito. A informação de modo da predição de 4 χ 4 pixels precisa de 16 itens de informação por um macrobloco. Devido à predi- ção de 4 χ 4 pixels ser pequena em unidade de um processo de predição, a predição com eficiência comparativamente alta pode ser executada em rela- ção a uma imagem possuindo uma textura complicada. Entretanto, esta pre- dição de 4 χ 4 pixels é predição feita somente pela cópia de um valor de in- terpolação simplesmente na direção de predição, de modo que existe um problema pelo fato de que o erro de predição aumenta à medida que a dis- tância com respeito ao pixel de referência aumenta.

A predição de 8 χ 8 pixels divide um sinal de luminância no ma- crobloco em quatro blocos de 8 χ 8 pixels, e qualquer um dos nove modos é selecionado para cada bloco de 8 χ 8 pixels. O modo de predição de 8 χ 8 pixels é projetado pela mesma estrutura que a predição de 4 χ 4 pixels, exe- cuta a filtragem de três derivações em relação ao pixel de referência codifi- cado, e inclui um processo para tirar a média de uma distorção de codifica- ção por nivelar o pixel de referência utilizado para predição. Entretanto, exis- te um problema pelo fato de que a predição não se demonstra correta mais e mais com o aumento de uma distância com respeito ao pixel de referência da mesma forma que a predição de 4 χ 4 pixels. Existe um problema pelo fato de que a precisão da predição não pode ser esperada para uma ima- gem possuindo uma textura complicada desde que a distância com respeito ao pixels de referência se torna mais longa comparada com a predição de 4 χ 4 pixel.

A predição de 8 χ 8 pixels é uma unidade de predição recomen- dada somente por uma H.264 de alto perfil, e introduzida, em particularida- de, para o propósito de aperfeiçoar a eficiência da codificação com uma i- magem de alta resolução. Um tamanho de bloco transformado / quantizado de 4 χ 4 pixels é utilizado na predição de 4 χ 4 pixels, e um tamanho de blo- co transformado / quantizado de 8 χ 8 pixels é utilizado na predição de 8 χ 8 pixels. Em outras palavras, o tamanho do bloco transformado / quantizado é definido por um formato do bloco de predição. Devido à compatibilidade de um perfil principal com um alto perfil ser considerada para o formato do bloco de predição, a predição de 8 χ 8 pixels e a predição de 4 χ 4 pixels não po- 1d dem coexistir em um macrobloco em um padrão.

De modo a reduzir o número de bits codificados da informação de modo, a predição de 4 χ 4 pixels ou a predição de 8 χ 8 pixels da H.264 reduz o número de bits codificados por predizer a informação de modo utili- zando o nível de correlação da informação de modo de blocos adjacentes. Quando a predição da informação de modo se demonstra correta, um indi- cador de 1 bit é codificado, e quando não se demonstra correta, dados de 3 bits adicionais são codificados, por meio de que o número de bits codificados da informação de modo é reduzido. Entretanto, se a predição de 4 χ 4 pixels for selecionada em um momento quando o sinal de erro quase não é gerado no macrobloco, o mínimo de 16 bits (máximo de 16 bits) devem ser codifica- dos, resultando em amplamente deteriorar a eficiência da codificação.

A JP-A 2003-323736 (KOKAI) propõem um sistema para execu- tar a predição por associação de blocos em um quadro e o suplemento de um valor de predição de um bloco de predição a partir da imagem de refe- rência codificada. Este sistema é um método de predição estabelecendo como premissa que uma imagem de um bloco arbitrário codificado em um quadro é similar a esta de um bloco a ser predito, e tem um problema pelo fato de que a precisão da predição é ruim quando a correlação de blocos em um quadro é baixa. A quantidade de deslocamento de posição apresentando uma posição de uma imagem de referência utilizada na predição deve ser codificada, resultando em aumentar o número de bits codificados da infor- mação de modo. Descrição da Invenção

Como discutido acima, no caso onde os pixels interpolados de acordo com um modo de predição são gerados a partir de uma imagem de referência codificada por um método recomendado em uma H.264 de alto perfil, e um sinal de imagem de predição é gerado pela cópia dos pixels in- terpolados em uma direção recomendada por um modo de predição, ocorre um problema pelo fato de que um erro de predição aumenta à medida que a distância entre o pixel de predição e o pixel de referência aumenta na dire- ção de predição, resultando que os formatos do bloco de predição não po- dem coexistir no macrobloco, e que o número de bits codificados da infor- mação de modo não pode ser diminuído.

Um aspecto da presente invenção proporciona um método de codificação de imagem compreendo: dividir uma imagem de entrada em vá- rios sinais de bloco de pixels; executar intrapredição para extrapolar ou in- terpolar um pixel de predição utilizando pixels de referência alterados em número de acordo com uma distância entre o pixel de predição e um pixel de referência em vários modos de predição, cada um representando uma dire- ção de predição; gerar um sinal de imagem de predição por extrapolar ou interpolar o pixel de predição; calcular um sinal de erro de predição a partir do sinal de bloco de pixels e do sinal de imagem de predição; selecionar um modo de predição dentre os vários modos de predição utilizando o sinal de erro de predição; e executar a codificação de entropia utilizando o sinal de erro de predição baseado no modo de predição selecionado.

Um segundo aspecto da presente invenção proporciona um mé- todo de decodificação de imagem compreendendo: decodificar um sinal de imagem de entrada codificado para gerar um sinal de imagem decodificado incluindo a informação de modo de predição; alterar o número de pixels de referência para uso na predição e um procedimento para geração de pixel de predição de acordo com um modo de predição selecionado baseado na in- formação de modo de predição do sinal de imagem decodificado e em uma distância entre um pixel de referência codificado e um pixels de predição; gerar um sinal de imagem de predição por predição intra-imagem para ex- trapolar o sinal de imagem decodificado em unidades de pixel; gerar um si- nal de erro de predição baseado no sinal de imagem decodificado; e gerar uma imagem reconstruída pela adição do sinal de imagem de predição com o sinal de erro de predição.

Breve Descrição dos Desenhos

A Figura 1 é um diagrama de blocos de um aparelho de codifica- ção de vídeo de acordo com uma primeira modalidade.

A Figura 2 é um diagrama de blocos do preditor de acordo com a modalidade.

A Figura 3 é um fluxograma do aparelho de codificação de vídeo de acordo com a modalidade.

A Figura 4A é um diagrama ilustrando um esboço de uma ordem de predição relacionada com a modalidade.

A Figura 4B é um diagrama ilustrando um esboço de um formato de bloco relacionado com a modalidade.

A Figura 4C é um diagrama ilustrando um esboço de um formato de bloco relacionado com a modalidade.

A Figura 4D é um diagrama ilustrando um esboço de um formato de bloco relacionado com a modalidade.

A Figura 4E é um diagrama ilustrando um esboço de um formato de bloco relacionado com a modalidade.

A Figura 5A é um diagrama ilustrando uma predição direcional relacionada com a modalidade.

A Figura 5B é um diagrama ilustrando uma relação entre um bloco predito e uma imagem de referência em uma predição direcional rela- cionada com a modalidade.

A Figura 5C é um diagrama ilustrando um método de predição relacionado com a modalidade.

A Figura 5D é um diagrama ilustrando um método de predição relacionado com a modalidade.

A Figura 6A é um diagrama ilustrando uma relação entre um bloco de predição e uma imagem de referência em uma predição adaptativa de pixel relacionada com a modalidade.

A Figura 6B é um diagrama ilustrando uma predição vertical a- daptativa de pixel relacionada com a modalidade.

A Figura 6C é um diagrama ilustrando uma predição adaptativa de pixel relacionada com a modalidade.

A Figura 7 é um diagrama ilustrando uma tabela ponderada do número de imagens de referência e os coeficientes de filtro que são utiliza- dos na hora de uma predição vertical adaptativa de pixel de acordo com a modalidade.

A Figura 8 é um diagrama ilustrando blocos adjacentes utilizados no modo de predição de acordo com a modalidade.

A Figura 9 é um diagrama ilustrando a predição direcional e a predição adaptativa de pixel de acordo com a modalidade.

A Figura 10 é um diagrama de blocos ilustrando uma estrutura de um aparelho de codificação de vídeo de acordo com uma segunda moda- lidade.

A Figura 11 é um diagrama de ,blocos ilustrando uma estrutura do preditor intraquadro de acordo com a modalidade.

A Figura 12 é um fluxograma do aparelho de codificação de ví- deo de acordo com a modalidade.

A Figura 13 é uma ilustração esquemática de uma estrutura de sintaxe de acordo com a modalidade.

A Figura 14 é um diagrama ilustrando uma estrutura de dados de uma sintaxe de conjunto de parâmetros de seqüência de acordo com a modalidade

A Figura 15 é um diagrama ilustrando uma estrutura de dados de uma sintaxe de conjunto de parâmetros de imagem de acordo com a mo- dalidade.

A Figura 16 é um diagrama ilustrando uma estrutura de dados de uma sintaxe de cabeçalho de pedaço de acordo com a modalidade.

A Figura 17 é um diagrama ilustrando uma estrutura de dados de uma sintaxe de camada de macrobloco de acordo com a modalidade. A Figura 18 é um diagrama ilustrando uma estrutura de dados de uma sintaxe de conjunto de parâmetros de seqüência de acordo com a modalidade.

A Figura 19 é um diagrama ilustrando uma estrutura de dados de uma sintaxe de conjunto de parâmetros de imagem de acordo com a mo- dalidade.

A Figura 20 é um diagrama ilustrando uma estrutura de dados de uma sintaxe de cabeçalho de pedaço de acordo com a modalidade.

A Figura 21A é um diagrama ilustrando uma estrutura d dados de uma sintaxe de camada de macrobloco de acordo com a modalidade.

A Figura 21B é um diagrama ilustrando uma estrutura de dados de uma sintaxe de predição de macrobloco de acordo com a modalidade.

A Figura 22 é um diagrama de blocos ilustrando uma estrutura de um aparelho de codificação de vídeo de acordo com uma terceira modalidade.

A Figura 23 é um diagrama ilustrando uma estrutura de dados de uma sintaxe de conjunto de parâmetros de seqüência de acordo com a modalidade.

A Figura 24 é um diagrama ilustrando uma estrutura de dados de uma sintaxe de conjunto de parâmetros de imagem de acordo com a mo- dalidade.

A Figura 25 é um diagrama ilustrando uma estrutura de dados de uma sintaxe de cabeçalho de pedaço de acordo com a modalidade.

A Figura 26 é um diagrama ilustrando uma estrutura de dados de uma sintaxe de camada de macrobloco de acordo com a modalidade.

A Figura 27 é um diagrama ilustrando uma estrutura de dados de mb_type de acordo com a modalidade.

A Figura 28 A é um diagrama ilustrando uma estrutura de dados para a troca de tamanho de bloco de acordo com a modalidade.

A Figura 28 B é um diagrama ilustrando uma estrutura de dados para a troca de tamanho de bloco de acordo com a modalidade.

A Figura 29 é um diagrama de blocos ilustrando um aparelho de decodificação de vídeo de acordo com uma quarta modalidade.

A Figura 30 é um diagrama de blocos ilustrando uma estrutura de um preditor intraquadro do aparelho de decodificação de vídeo de acordo com a modalidade.

A Figura 31 é um diagrama de blocos ilustrando uma estrutura de um aparelho de decodificação de vídeo de acordo com uma quinta moda- lidade.

Melhor Modo Para Realizara Invenção

Agora, serão descritos, um método de codificação de vídeo, um aparelho de codificação de vídeo, um método de decodificação de vídeo e um aparelho de decodificação de vídeo, em detalhes se referindo aos dese- nhos acompanhantes Primeira Modalidade

O aparelho de codificação de vídeo 100 apresentado na Figura 1 é configurado para dividir um sinal de vídeo em vários blocos de pixels, e codificar os mesmos. Este aparelho de codificação de vídeo 100 prepara vários modos de predição de quadro que diferem em tamanho de bloco e método de geração de um sinal de imagem de predição uns em relação aos outros. A predição intraquadro é um sistema de predição no qual a predição é fechada em um quadro, e prediz um bloco a ser predito utilizando um pixel de referência já codificado. É assumido que um processo de codificação é executado a partir de uma esquerda superior até uma direita inferior como apresentado na Figura 4 A nesta modalidade.

O sinal de vídeo informado para o aparelho de codificação de vídeo 100 é dividido em vários blocos de pixels como um sinal de imagem de entrada 115 com um divisor de imagem 101. Uma parte do sinal de imagem de entrada dividido 115 é informada para um preditor de intraquadro 102, e finalmente codificada com um processador de codificação 107 via uma uni- dade de seleção de modo 103 e um transformador / quantizador 107 para emitir os dados codificados 113.

O divisor de imagem 101 divide um sinal de vídeo em vários blo- cos de pixels para gerar um bloco de 16 x 16 pixels para cada bloco de pi- xéls como apresentado na Figura 4(b). Este bloco de 16 χ 16 pixels é referi- do como um macrobloco, e se torna um tamanho básico do bloco de proces- so para o processo seguinte de codificação. O aparelho de codificação de vídeo 100 codifica o sinal de vídeo em unidades deste macrobloco.

O preditor intraquadro 102 extrapola o sinal de imagem para to- dos os modos de predição que podem ser selecionados em unidades de macrobloco para gerar um sinal de imagem de predição 114, utilizando o pixel de referência armazenado temporariamente na memória de imagem de referência 106. Em outras palavras, o preditor intraquadro 102 gera sinais de 1d imagem de predição 114 para todos os modos executáveis para o bloco de pixels de predição por predição intra-imagem, por exemplo, predição intra- quadro. Entretanto, quando a próxima predição não pode ser feita a não ser que uma imagem local decodificada seja gerada em um macrobloco tal co- mo a predição intraquadro da H.264 (predição de 4 χ 4 pixels (referindo-se à

Figura 4 C) ou a predição de 8 χ 8 pixels (referindo-se à Figura 4 D), a trans- formação e a quantização, a dequantização e a transformação inversa po- dem ser feitas no preditor intraquadro 102. Entretanto, um sinal de imagem de predição é gerado somente com o preditor de intraquadro 102.

O sinal de imagem de predição 114 gerado com o preditor intra- quadro 102 é enviado para o seletor de modo 103. O seletor de modo 103 gera um sinal de erro de predição 116 por subtrair o sinal de imagem de predição 114 de um sinal de imagem de entrada 115. O seletor de modo 103 seleciona um modo de predição baseado na informação de modo predita com o preditor de intraquadro 102 e no sinal de erro de predição 116. Expli- cando a modalidade de forma concreta, um custo expresso pela equação seguinte é utilizado.

<formula>formula see original document page 10</formula>

onde OH indica a informação de modo, SAD indica a soma absoluta de si- nais de erro de predição, e λ é uma constante, e determinada baseada em uma largura de quantização ou em um valor de parâmetro de quantização. O modo de predição é determinado por um custo obtido deste modo. O modo de predição pelo qual o custo k se torna mínimo é selecionado como um modo de predição ótimo.

Nesta modalidade, a informação de modo e a soma absoluta de erros de predição são utilizadas. Entretanto, somente a informação de modo ou somente a soma absoluta de erros de predição pode ser utilizada para selecionar um modo de predição. A informação de modo e a soma absoluta de erros de predição podem ser sujeitas à transformação de Hadamard, ou os valores similares a estes podem ser utilizados. Adicionalmente, o custo pode ser obtido utilizando a atividade de um sinal de imagem de entrada, e uma função de custo pode ser obtida utilizando uma largura de quantização e um parâmetro de quantização.

O seletor de modo 103 é conectado com o transformador / quan- tizador 104, e a informação de modo e o sinal de erro de predição selecio- nados com o seletor de modo 103 são informados para o transformador/ quantizador 104. O transformador / quantizador 104 executam a transforma- ção ortogonal em relação ao sinal de erro de predição de entrada para gerar dados de coeficiente de transformação. O transformador / quantizador 104 transforma o sinal de erro de predição em coeficientes utilizado a DCT, etc., na presente modalidade, mas pode transformar o sinal de erro de predição em coeficientes utilizando uma técnica, tal como uma transformação de on- daleta ou análise de componente independente. O transformador / quantiza- dor 104 quantiza os coeficientes de transformação. Õ parâmetro de quanti- zação necessário para quantização é estabelecido com um controlador de codificação 108.

O coeficiente de transformação quantizado 117 é emitido para o processador de codificação 107 junto com a informação relacionada com um método de predição tal como a informação de predição 109 e um parâmetro de quantização. O processador de codificação 107 executa a codificação de entropia (codificação de Huffman ou codificação aritmética) no coeficiente de transformação quantizado e na informação de predição de entrada, etc. Os dados codificados por entropia com o processador de codificação 107 são multiplexados com a informação de predição 109, etc., com o multiplexador 111, e emitidos como dados codificados 113 através de uma memória inter- mediaria de saída 112.

O dequantizador / transformador inverso 105 retira a quantiza- ção do coeficiente de transformação 117 quantizado com o transformador / quantizador 104 de acordo com um parâmetro de quantização estabelecido com o controlador de codificação 108 e sujeita o coeficiente de transforma- ção á transformação inversa (DCT inversa, por exemplo) para decodificar o coeficiente de transformação para um sinal de erro de predição 116.

O sinal de erro de predição 116 decodificado com o dequantiza- dor / transformador inverso 105 é adicionado para um sinal de imagem de predição 114 de um modo de predição de seleção fornecido a partir do sele- tor de modo 103 com um adicionador 118. Um sinal de adição ser tornar um sinal de imagem decodificado 119 e é informado para uma memória de ima- gem de referência 106. A memória de imagem de referência 106 acumula o sinal de imagem decodificado 119 como uma imagem de referência. A ima- gem de referência acumulada junto à memória de imagem de referência 106 é referida na geração de um sinal de erro de predição com o preditor de in- traquadro 102.

Uma repetição de codificação (um processo executado na ordem de preditor de intraquadro 102 seletor de modo 103 -> transformador / quantizador 104 transformador inverso / dequantizador 105 memória de imagem de referência na Figura 1) corresponde a uma repetição quando o processo de codificação é executado para todos os modos de predição que podem ser selecionados no macrobloco. Quando a repetição de codifi- cação é terminada para o macrobloco de predição, o sinal de imagem de entrada 115 do próximo bloco é informado para ser codificado.

O controlador de codificação 108 executa o controle de reali- mentação do número de bits codificados, do controle da característica de quantização, do controle modal, etc.. Adicionalmente, o controlador de codi- ficação 108 executa o controle de taxa para controlar o número de bits codi- ficados e o controle da unidade de predição, e controle de toda a codificação.

A função de cada uma das partes mencionadas acima pode ser realizado por um programa armazenado em um computador.

O preditor intraquadro do aparelho de codificação de vídeo 100 para implementar o método de codificação de vídeo de acordo com a pre- sente modalidade é explicado se referindo à Figura 2. A descrição das par- tes similares a estas apresentadas na Figura 1 é omitida à medida que apro- priado.

O preditor intraquadro 102 compreende um seletor de modo in- terno 204, um transformador / quantizador interno 206, um dequantizador / transformador inverso interno 207, e uma memória de imagem de referência interna 209 para fazer a predição em um tamanho de bloco menor do que o tamanho do macrobloco. Cada uma dentre uma unidade de predição adapta- tiva de pixel 201 e uma unidade de predição direcional 202 compreende vá- rios modos de predição, mas diferem no método de predição uma em rela- ção à outra. Uma unidade de predição de modo fixo 203 prediz um bloco de 15 predição utilizando um método de predição de uma unidade de predição a- daptativa de pixel 201 e uma unidade de predição direcional 202, mas exe- cuta um dos modos de predição, o qual não envia a informação de modo em nível de macrobloco.

A unidade de predição direcional 202 e a unidade de predição adaptativa de pixel 201 serão explicadas em detalhes. Estas unidades de predição predizem um bloco de predição utilizando o pixel de referência já decodificado mantido na memória de imagem de referência 106. Existem nove modos de predição possuindo direções de predição diferentes uns dos outros por cada 22,5 graus, exceto para o modo 2 como apresentado na Fi- gura 5A. Os modos 0 e 1 e 3 até 8, à parte do modo 2, são descritos, e o modo 2 descreve uma predição DC com a unidade de predição direcional 202. O nome do modo de predição direcional feito com a unidade de predi- ção direcional 202 e o nome do modo de predição adaptativa de pixel feita com a unidade de predição adaptativa de pixel 201 são apresentados na Figura 9. A relação entre o bloco de predição para a predição de 4 χ 4 pixels e o pixel de referência é apresentada na Figura 5B. Os pixels do caracteres maiúsculos A até M são pixels de referência, e os pixels dos caracteres mi- núsculos a até ρ são pixels de predição.

Inicialmente, o método de predição da unidade de predição dire- cional 202 é explicado. Quando a predição DC do modo 2 é selecionada, a unidade de predição direcional 202 calcula o pixel de predição de acordo com a equação (2) seguinte.

H = (A+B+C+D), V = (l+J+K+L) (2)

A até ρ = (H+V+4) »3

Quando o pixel de referência não pode ser utilizado, o pixel de predição é predito por uma média de pixels de referência disponíveis. Se não existir pixel de referência disponível, o valor de predição é calculado pe- lo valor pela metade (128, se ele for 8 bits) do valor máximo de luminância do aparelho de codificação. Quando outros modos são selecionados, a uni- dade de predição direcional 202 utiliza uma método de predição de copiar um valor de predição interpolado a partir do pixel de referência em uma dire- ção de predição apresentada na Figura 5A. Mais especificamente, um méto- do para gerar o valor de predição quando o modo 0 (predição vertical) é se- lecionado é explicado baseado na equação (3) seguinte.

a, e, i, m = A

b, f, j, η = B

c, g, k, o = C

d, h,l, p = D (3)

Este modo de predição somente pode ser selecionado quando os pixels de referência A até D estão disponíveis. O detalhe do método de predição é apresentado na Figura 5(c). Os valores de luminosidade dos pi- xels de referência A até D são copiados nos pixels de predição em uma dire- ção vertical, e suplementados como valores de predição.

Um método de predição quando o modo de predição 4 (predição direita inferior ortogonal) é selecionado é explicado baseado na equação (4) seguinte.

d = (B + (C « 1) + D + 2) » 2

c, h = (A + (B«1) + C + 2)»2

b, g, I = (M + (A « 1) + B + 2) » 2 a, f, k, ρ = (I + (Μ « 1) + A + 2) » 2

e, j, o = (J + (I « 1) + M + 2) » 2

i,n = (K + (J«1) + l + 2)»2

m = (L + (k « 1) + J + 2) » 2 (4)

Este modo de predição somente pode ser selecionado quando os pixels de referência A até D e I até M estão disponíveis. Este modo de predição é apresentado na Figura 5(d) em detalhes. Um valor gerado com um filtro de três derivações é copiado no pixel de predição em uma direção direita inferior em 45 graus e suplementado como um valor de predição.

Uma configuração aproximadamente similar à acima é utilizada para um método de predição à parte dos modos de predição 0, 2, 4. Em ou- tras palavras, um valor de interpolação é gerado a partir do pixel de referên- cia disponível na direção de predição, e uma predição copiando o valor do pixel de predição de acordo com a direção de predição é feita.

A unidade de predição adaptativa de pixel 201 será explicada. A unidade de predição adaptativa de pixel 201 executa a predição por alterar o número de pixels de referência utilizados de.acordo com uma distância entre o pixel de predição e o pixel de referência. O valor de predição se altera em unidades de pixel. A predição intraquadro é a predição utilizando uma corre- lação espacial de imagens, e gera um valor de predição baseado na suposi- ção de que os valores de luminosidade dos pixels adjacentes são similares. Quando a distância entre o pixel de predição e o pixel de referência disponí- vel aumenta, esta suposição não mostra efeito, resultando na tendência em aumentar um erro de predição. Por esta razão, quando a distância entre o pixel de predição e o pixel de referência aumenta, o erro de predição é dimi- nuído pelo aumento do número de pixels disponíveis de acordo com a dis- tância crescente. Adicionalmente, o valor de predição de alta precisão pode ser gerado pela alteração de uma tabela ponderada de pixels de referência disponíveis de acordo com a distância.

O modo de predição é similar a este explicado na Figura 5A. A relação entre o pixel de referência e o bloco de predição é apresentada na Figura 6A. O pixel de referência e o pixel de predição apresentados na Figu- ra 6Α e na Figura 5B correspondem um a um. Entretanto, índices diferentes são dados para estes pixels para o propósito de facilitar a explicação de uma equação de predição. Os pixels de referência são 13 pixels de xOO até x08 e x09, x18, x27, x36. Os pixels de predição são 16 pixels de x10 até x13, x19 até x22, x28 até x31, e x37 até x40. 16 pixels x14 até x17, x23 até x26, x32 até x35, e x41 até x44 são pixels de auxílio de predição, e utilizados para aumentar a precisão de predição.

Um método de geração de valor de predição com respeito à pre- dição de pixel vertical adaptativa (modo 0) será explicado em detalhes. O método de predição de pixels adaptativa vertical é apresentado na Figura 6B. Como visto a partir da Figura 6B, o valor de predição é determinado utili- zando pixels de referência aumentando em número à medida que a distância entre o pixel de referência e o pixel de predição aumenta. Por exemplo, no pixel de predição x10 longe do pixel de referência por um pixel na direção de predição, o valor de predição é calculado utilizando três pixels de referência xOO, x01 e x02. No pixel de predição x20 longe do pixel de referência por dois pixels na direção de predição, o valor de predição é calculado utilizando os quintos pixels de referência xOO, x01, x02, x03 e x04. No pixel de predi- ção x30 longe do pixel de referência por três pixels na direção de predição, o valor de predição é calculado utilizando os quintos pixels de referência xOO, x01, x02, x03, x04, x05 e x06. No pixel x40 longe do pixel de referência por quatro pixels na direção de predição, o valor de predição é calculado utili- zando os quintos pixels de referência xOO, x01, x02, x03, x04, x05, x06, x07 e x08.

O método de geração de valor de predição será explicado de forma concreta de acordo com a equação (5) seguinte. Na predição de pixel vertical adaptativa, o pixel de predição é calculado utilizando a equação (5) seguinte.

X(n) = (X(n - d - 1) + (X(n - d) << 1) + X(n - d + 1) + 2) >> 2 (5)

onde η indica um índice correspondendo a uma posição de pixel de predição (x10 até x13, x19 até x22, x28 até x31 e x37 até x40) apresentada na Figura 6A. d é dado pela seguinte equação. d = (blk_num « 1) + 1 (6)

onde blk_num é 4 em um bloco de 4 χ 4 pixels, e 8 em um bloco de 8 χ 8 pixels.

Pode ser pensado que este sistema de predição não somente prediz um pixel utilizando o pixel de referência já codificado mas também prediz um próximo pixel utilizando o pixel de predição já codificado. A Figura 6 apresenta este conceito. De modo que um pixel de predição pretendido seja obtido, este sistema de predição é como se executando a predição utili- zando um pixel de predição que a distância com respeito ao pixel de refe- rência é curta por um pixel. O método de predição apresentado na Figura 6B é obtido se a equação (5) for desenvolvida pela colocação do valor de predi- ção na equação (5).

Se a equação (5) for desenvolvida de acordo com a distância entre o pixel de referência e o pixel de predição, a seguinte equação (7) é estabelecida.

<formula>formula see original document page 17</formula>

L representa uma distância entre o pixel de referência e o pixel de predição. Vi indica um índice determinado de acordo com o modo de pre- dição correspondente, hi representa um coeficiente de filtro, e o número de derivações se altera de acordo com L. hi e Vi são explicados a cerca da pre- dição de pixel vertical adaptativa em concreto. A Fig. 7 apresenta um exem- plo de um coeficiente de filtro de peso hi (tabela ponderada) utilizado de a- cordo com a distância entre o pixel de referência e a imagem de predição na predição de 4 χ 4 pixels.

O pixel de predição longe do pixel de referência por um pixel na direção de predição é predito pela seguinte equação (8) utilizando três pi- xels.

X(n) = (X(n - d - 1) + (X(n - d) « 1 + X(n - d + 1) + 2 » 2 (8) onde η indica um índice correspondendo a L = 1 (x10 até x13). O coeficiente de filtro é hi = (1, 2, 1), e corresponde a Vi = (d+1, d, d-1).

O pixel de predição longe do pixel de referência por dois pixels é predito pela seguinte equação (9) utilizando quintos pixels. Χ(η) = (X(n-(d«1)-2) + (X(ri-(d«1|) - 1) « 2 + (6x(n-d(d«1))) + (x(n- (d«1) + 1) « 2) + x(n-(d«1) + 2) + 8) » 4 (9) onde n indica um índice correspondendo a L= 2 (x19 até x22). O coeficiente de filtro é hi = (1, 4, 6, 4, 1), e corresponde a vi = (2d+2, 2d+1, 2d, 2d-1, 2d- 2).

O pixel de prediçãõ longe do pixel de referência por três pixels é predito pela seguinte equação (10) utilizando sete pixels.

X(n) = (X(n-3d-3_ + (6X(n-3d-2)) + (15X(n-3d-1)) + (20X(n-3d)) + (15X(n-3d+1)) + (6X(n-3d+2)) + x(n-3d+3)+32 »6 (10) onde n indica um índice correspondendo a L= 3 (x28 até x31). O coeficiente de filtro é hi = (1, 6, 15, 20, 15, 6, 1) e corresponde a Vi = (3d+3, 3d+2, 3d+1), 3d, 3d-1, 3d-2, 3d-3).

O pixel de predição longe do pixel de referência por quatro pixels é predito pela seguinte equação (11) utilizando sete pixels.

X(n) = (X(n-(d«2) - 4) + (x(n-(d«2) - 3) «3) + (28X(n-(d«2) - 2)) + (56X(n-(d«2) - 1)) + (70X(n-(d«2))) + (56X(n-(d«2)+1)) + (28X(n- (d«2) + 2)) + (X(n-(d«2) + 3) « 3) + x(n-(d«2) + 4) + 128) » 8 (11) onde n indica um índice correspondendo a L = 4 (x37 até x40). O coeficiente de filtro é hi = (1, 8, 28, 56, 70, 56, 28, 8, 1) e corresponde a Vi = (4d+4, 4d+3, 4d+2, 4d+1, 4d, 4d-1, 4d-2, 4d-3, 4d-4).

Os pixels de referência utilizados para predição, o número de pixels de referência e uma tabela ponderada são obtidos pelo desenvolvi- mento da equação (5). O valor de interpolação do pixel de predição é calcu- lado utilizando esta tabela. Quando o valor de interpolação do pixel x31 é calculado, a partir da tabela da Figura 7, o coeficiente de filtro hi = (1, 6, 15, 20, 15, 6, 1) é utilizado em L = 3. a seguinte equação de predição (12) é es- tabelecida pela equação (9).

X(31) = (x(01) + (6X(02))) + (15X(03) + (20X(04)) + (15X(05)) + (6X(06)) + x(07)+32 » 6 (12)

Quando não existe pixel de referência correspondente, a predi- ção é feita por se colocar o último valor de pixel de referência na equação de predição. Quando o pixel x19 é predito, o pixel de referência na esquerda do pixel xOO não pode ser utilizado. Entretanto, desde que o pixel de referência x09 pode ser utilizado, a predição é feita de acordo com a equação (13) se- guinte.

X(19) = (x(09) + (X(OO) « 1) + (5X(01)) + (x(02) « 2) + X(03) + 8) »4 (13)

Neste caso, a equação (12) é estabelecida pela determinação do pixel utilizado para predição na equação (5) e desenvolvendo um valor de predição necessário.

Uma equação de predição para a predição adaptativa de pixel horizontal (modo 1) é expressa pela seguinte equação (14).

X(n) = (X9n-d-1_ + (X(n-1) « 1) + X(n+d-1) + 2) » 2 (14) Uma equação de predição para a predição adaptativa de pixel adjacente (modo 2) é expressa pela seguinte equação (15).

<formula>formula see original document page 19</formula>

Uma equação de predição para a predição adaptativa de pixel ortogonal inferior esquerda (modo 3) é expressa pela seguinte equação (16).

<formula>formula see original document page 19</formula>

Uma equação de predição para a predição adaptativa de pixel ortogonal inferior direita (modo 4) é expressa pela seguinte equação (17).

<formula>formula see original document page 19</formula>

Uma equação de predição para a predição adaptativa de pixel vertical esquerda (modo 5) é expressa pela seguinte equação (18).

<formula>formula see original document page 19</formula>

Uma equação de predição para a predição adaptativa de pixel horizontal inferior (modo 6) é expressa pela seguinte equação (19).

<formula>formula see original document page 19</formula>

Uma equação de predição para a predição adaptativa de pixel vertical esquerda (modo 7) é expressão pela seguinte equação (20)

<formula>formula see original document page 19</formula>

Uma equação de predição para a predição adaptativa de pixel horizontal superior (modo 8) é expressa pela seguinte equação (21).

<formula>formula see original document page 19</formula> De modo que o valor do pixel de predição seja calculado, a ima- gem de predita necessária é colocada na equação para desenvolver a mes- ma, de forma similar à predição de pixel vertical adaptativa. Como resultado, os pixels de referência necessários, o número de pixels de referência e a tabela de ponderação são determinados.

Quando não existe pixel de referência, o pixel de referência é suplementado como a predição de pixel vertical adaptativa. Quando o pixel x37 é predito pela predição de pixel horizontal adaptativa, o pixel de referên- cia x45 não pode ser utilizado, Portanto, este pixel de referência é suplemen- tado pelo pixel x36 como apresentado pela seguinte equação (22).

X(37) = (X(36) + (x(36) << 1) + x(27) + 2) >> 2 = (3X(36) + x(27) + 2) >> 2 (22)

Deste modo, desde que a predição de precisão mais elevada é feita pela alteração do número de utilização de pixels de referência de acor- do com a distância entre o pixel de predição e o pixel de referência, se torna possível aperfeiçoar a eficiência da codificação. O aperfeiçoamento da pre- dição da predição torna a imagem de predição próxima da imagem de entra- da. Portanto, este é um sistema de predição possuindo um efeito alto para visão.

Subseqüentemente, o preditor de modo fixo 203 será descrito em detalhes. O preditor de modo fixo 203 prediz a informação de modo e executa a predição adaptativa de pixel ou a predição direcional de acordo com o modo de predição determinado. A informação de modo é predita utili- zando a informação de modo dos blocos de predição adjacentes. A relação entre os blocos adjacentes no caso da predição de 4 χ 4 pixels é apresenta- da na Figura 8. Assumindo que o bloco adjacente ao lado esquerdo do bloco de predição C é A e que o bloco adjacente ao lado superior do mesmo é B. Quando estes dois modos de predição são definidos como prev_left_mode e prev_upper_mode, o modo de predição do bloco C é determinado pela se- guinte equação (23).

Current_mode = min(prev_left_mode, prev_upper_mode) (23) onde current_mode representa um modo de predição do bloco de predição C. A função min(A, Β) representa um valor do menor entre AeB. Desde que a informação de modo de predição do bloco de predição é predita a partir da informação de modo de predição dos blocos circundantes, este modo é um dentre os modos de codificação tornando possível reduzir amplamente o número de bits codificados necessários para codificar a informação de modo de predição. Ele é determinado por um indicador ex_direct_intra descrito abaixo se a unidade de predição adaptativa de pixel 201 for utilizada para gerar a imagem de predição ou a unidade de predição direcional 202 for uti- lizada, e ele é determinado baseado na informação do indicador ex_directJntra dada a partir do controlador de codificação 108.

Na presente modalidade, a informação de modo de predição do bloco de predição corrente é determinada baseada na informação de modo de predição dos blocos de predição adjacentes A e B. Como modificação da presente modalidade, ela pode ser determinada baseada na informação de modo de predição dos blocos de predição circundantes. O modo de predição do bloco de predição corrente pode ser determinado utilizando a informação de modo de predição do bloco no lado direito do bloco de predição B, do bloco no lado superior do bloco de predição Β, o bloco no lado esquerdo do bloco de predição A e um bloco no lado superior do bloco de predição A. Por exemplo, o modo de predição mais freqüente entre os modos de predição dos blocos de predição circundantes, o valor médio dos modos de predição dos blocos de predição circundantes ou a média dos modos de predição dos blocos de predição circundantes podem ser determinados como o modo de predição do bloco de predição corrente.

A operação do preditor intraquadro 102 apresentada na Figura 2 será descrita em detalhes daqui para frente. Quando o sinal de imagem de entrada 115 é informado para o preditor intraquadro 102, o sinal é informado para a unidade de predição adaptativa de pixel 201, para a unidade de pre- dição direcional 202 e para o preditor de modo fixo 203. O sinal de imagem de predição correspondente 114 é gerado com cada um dentre a unidade de predição adaptativa de pixel 201, a unidade de predição direcional 202 e o preditor de modo fixo 203 de acordo com o modo de predição e com o for- mato do bloco de predição.

Então, se a informação de proibição de predição para proibir a predição for informada a partir do controlador de codificação 108, a unidade de predição correspondente não gera o sinal de imagem de predição. Mais especificamente, quando a informação de proibição de predição é informada para a unidade de predição adaptativa de pixel 201, o sinal de imagem de predição 114 não é gerado a partir da unidade de predição adaptativa de pixel 201. Quando a informação de proibição de predição é informada para a unidade de predição direcional 202, o sinal de imagem de predição 114 não é gerado a partir da unidade de predição direcional 202. Quando a informa- ção de proibição de predição é informada para o preditor de modo fixo 203, o sinal de imagem de predição 114 não é gerado a partir do preditor de modo fixo 203.

Quando a informação de proibição de predição é informada para uma das unidades de predição, a unidade de predição correspondente não é conectada com o comutador de câmbio de predição 205. Não é permitido que a informação de proibição de predição seja informada para a unidade de predição adaptativa de pixel 201 e para a unidade de predição direcional 202 ao mesmo tempo.

Os sinais de imagem de predição 114 e a informação de modo de predição, os quais são preditos por cada uma das unidades de predição, são informados para o seletor interno de modo 204. O seletor interno de mo- do 204 gera um sinal de erro de predição 116 obtido pela subtração do sinal de imagem de predição 114 do sinal de imagem de entrada 115. O seletor interno de modo 204 seleciona um modo baseado na informação de modo predita por cada uma das unidades de predição e no sinal de erro de predi- ção 116.

O modo de predição é selecionado utilizando o custo utilizado na equação (1). O seletor interno de modo 204 envia, para o controlador de co- dificação 108, a informação de modo representando se o modo de predição selecionado é um modo de predição predito com a unidade de predição a- daptativa de pixel 201 ou um modo de predição predito com a unidade de predição direcional 202. Quando a predição adaptativa de pixel é utilizada, o ex_adaptive_intra_flag descrito abaixo é VERDADEIRO, e quando a predi- ção direcional é utilizada o indicador é FALSO. O controlador de codificação 108 controla o comutador de câmbio de predição 205 de acordo com a in- formação de modo fornecida. É determinado pelo ex_direct_intra_flag se a predição de modo fixo é feita. Quando o indicador é VERDADEIRO, a predi- ção de modo fixo é feita, e quando ele é FALSO, a predição não é feita,

Quando o ex_adaptive_intra_flag é VERDADEIRO, o comutador de câmbio de predição 205 é conectado com a unidade de predição adapta- tiva de pixel 201. Quando o ex_adaptive_intra_flag é FALSO, o comutador de câmbio de predição 205 'é conectado com a unidade de predição direcio- nal 202. Quando o ex_directjntrajlag é VERDADEIRO, o controlador de codificação 108 conecta o comutador de câmbio de predição 205 com a uni- dade de determinação de modo fixo 203.

Quando a predição em todos os blocos de pixels é completada, o seletor interno de modo 204 emite o sinal de imagem de predição 114 para o macrobloco e a informação de modo a partir do preditor de intraquadro 102.

O comutador de câmbio de predição 205 é conectado com o transformador / quantizador interno 206. A informação de modo e o sinal de erro de predição 114 que são selecionados com o seletor interno de modo 204 são informados para o transformador / quantizador interno 206 através do comutador de câmbio 205. O transformador / quantizador interno 206 transforma o sinal de erro de predição de entrada 114 em um coeficiente de transformação utilizando a transformação discreta de co-seno, etc., e gera os dados de coeficiente de transformação. O sinal de erro de predição 114 pode ser transformado pela transformação tal como a transformação de on- daleta ou a análise independente de componente. O transformador / quanti- zador interno 206 quantiza o coeficiente de transformação. O parâmetro de quantização necessário para a quantização é estabelecido com o controla- dor de codificação 108.

O dequantizador / transformador inverso interno 207 dequantiza o coeficiente de transformação 117 quantizado com o transformador / quan- tizador interno 206, de acordo com o parâmetro de quantização estabelecido com o controlador de codificação 108, e sujeita o coeficiente de transforma- ção dequantizado à transformação inversa (DCT inversa, por exemplo) e emite o sinal de erro de predição 116. O sinal de erro de predição 116 deco- dificado com o dequantizador / transformador inverso interno 207 é adicio- nado para o sinal de imagem de predição 114 do modo selecionado com o seletor interno de modo 204 com o adicionador 208. O sinal de adição é in- formado para a imagem interna de imagem de referência 209 como um sinal de imagem decodificado 119.

A memória interna de imagem de referência 209 acumula o sinal de imagem decodificado 119 como uma imagem de referência. A imagem de referência acumulada na memória interna de imagem de referência 209 é referida no caso de geração do sinal de imagem de predição 114 e também com a unidade de predição adaptativa de pixel 201, com a unidade de predi- ção direcional 202 ou com a unidade de predição de modo fixo 203. Uma repetição interna de predição (um processo executado em ordem de unidade de predição adaptativa dé pixel 201, unidade de predição direcional 202 ou unidade de predição de modo fixo 203 seletor interno de modo 204 comutador de câmbio de predição 205 -> transformador / quantizador interno 206 transformador inverso dequantizador interno 207 -> memória interna de imagem de referência 209 na Figura 2) corresponde a uma repetição quando o processo de codificação é executado para todos os modos de pre- dição que podem ser selecionados nos blocos de pixels do macrobloco.

Quando a predição adaptativa de pixel, a predição direcional e a predição de modo fixo são comutadas, por exemplo, a predição de 4 χ 4 pi- xels, a repetição interna de predição é executada 16x3 vezes no total. Nes- te caso, o controlador de codificação 108 conecta o comutador de câmbio de predição 205 com a unidade de predição adaptativa de pixel 201 primeiro para executar a repetição intra-predição 16 vezes, e determina uma combi- nação ótima de modos em unidades de macrobloco na predição adaptativa de pixel. O controlador de codificação 108 conecta o comutador de câm- bio de predição 205 com a unidade de predição direcional 202 para executar a repetição interna de predição 16 vezes. O controlador de codificação 108 conecta o comutador de câmbio de predição 205 com a unidade de predição de modo fixo 203 para determinar qual método de predição é utilizado para executar a predição de modo fixo baseado no estado do indicador interno e executa a predição pelo método de predição determinado. Três modos obti- dos deste modo são informados para o seletor de modo 103 para selecionar o modo ótimo do macrobloco.

De forma similar, no caso de predição de 8 χ 8 pixels, a repeti- ção interna de predição é executada 4x3 vezes. Desde que a predição de 16x16 pixels não precisa gerar uma imagem local decodificada, a repetição interna de predição não precisa ser executada. Portanto, o modo e o sinal de imagem de predição que são preditos com a unidade de predição adaptativa de pixel 201 ou com a unidade de predição direcional 202 são emitidos a partir do preditor intraquadro 102 como estão. Quando a repetição interna de predição é terminada para o macrobloco, o sinal de imagem de entrada 115 do próximo macrobloco é informado para ser codificado.

Um método de codificação de vídeo realizado com o aparelho de codificação de vídeo 100 será explicado com referência à Figura 3.

Quando um quadro de um sinal de vídeo é informado para o a- parelho de codificação de vídeo 100 (etapa S1), o divisor de imagem 101 divide um quadro em vários macroblocos e adicionalmente divide os mes- mos em vários blocos de pixels (etapa S2). Um macrobloco dividido é infor- mado para o preditor intraquadro 102 como o sinal de imagem de entrada 115. Então, o seletor de modo 103 inicia um índice indicando um modo e um custo (etapa S3).

O preditor intraquadro 102 gera o sinal de imagem de predição 114 do modo de predição que pode ser selecionado pelo bloco de predição, utilizando o sinal de imagem de entrada 115 (etapa S4). O seletor de modo 103 calcula uma diferença entre o sinal de imagem de predição 114 e o sinal de imagem de entrada 115 para gerar um sinal de erro de predição 116. O custo é calculado a partir da soma de valor absoluto SAD do número de bits codificados OH e do sinal de erro de predição 116 do modo de predição (e- tapa S5).

O seletor de modo 103 determina se o custo calculado é menor do que o custo mínimo min_cost (etapa S6). O seletor de modo 103 atualiza o custo mínimo para o custo calculado e mantém o modo de codificação se- lecionado como um índice de melhor modo quando o custo calculado é me- nor do que o custo mínimo (SIM) (etapa S7). Quando o custo calculado é maior do que o custo mínimo min_cost (NÃO), o índice indicando o número de modo é incrementado e é determinado se o índice incrementado é o últi- mo modo (etapa S8).

Quando o índice é maior do que MAX, indicando o número do último modo (SIM), a informação de modo de codificação de best_mode e o sinal de erro de predição 116 são enviados para o transformador / quantiza- dor 104 para serem transformados e quantizados (etapa S9). O coeficiente de transformação quantizado 117 é informado para o processador de codifi- cação 107, e codificado por entropia junto com a informação de predição 109 e com a informação de troca de predição 110 com o processador de codifi- cação 107 (etapa S10). Quando o índice é menor do que MAX, indicando o número do último modo (NÃO), o sinal de imagem de predição 114 do modo de codificação indicado pelo próximo índice é gerado (etapa S4).

Quando a codificação é feita em best_mode, o coeficiente de transformação quantizado 117 é informado para o dequantizador / transfor- mador inverso 105 e sujeito à dequantização e à transformação inversa para ser decodificado para o sinal de erro de predição 116. Este sinal de erro de predição decodificado 116 é adicionado para o sinal de imagem de predição 114 do best_mode proporcionado a partir do seletor de modo 103 com o adi- cionador 118 para gerar um sinal de imagem decodificado 119. Este sinal de imagem decodificado 119 é armazenado na memória de imagem de referên- cia 106 como uma imagem de referência.

É determinado se a codificação para um quadro é terminada (e- tapa S11). Quando o processo de codificação está completo (SIM), o próxi- mo quadro é informado para o aparelho de codificação de vídeo 100 e o pro- cesso de codificação é feito novamente. Quando o processo de codificação para um quadro não está completo (NÃO), o sinal de imagem de entrada do próximo bloco de pixels é informado para o preditor intraquadro 102 para continuar o processo de codificação.

Como descrito acima, o aparelho de codificação de vídeo 100 desta modalidade codifica o vídeo em movimento.

Na predição adaptativa de pixel da modalidade, o pixel de predi- ção é calculado utilizando a tabela ponderada do filtro apresentado na Figura 7. Neste caso, o pixel de predição é predito em ordem de distância crescente entre o pixel de referência e o pixel de predição, e o valor do pixel obtido pe- la predição é armazenado em uma memória. Este valor de pixel pode ser utilizado como um pixel de referência quando a distância entre a imagem de predição e a imagem de referência aumenta. Portanto, a ordem de geração do pixel de predição pode ser determinada em ordem de distância crescente entre o pixel de referência e o pixel de predição na direção de predição. Quando o pixel de predição é gerado a partir de cima para baixo na predição de pixel vertical adaptativa (modo 0) na Figura 6A, por exemplo, o pixel de predição gerado com L = 1 na hora da predição de L = 2 pode ser referido. De forma similar, na predição de pixel de nível de adaptação (modo 1), o pixel de predição é gerado em uma direção da direita para a esquerda. O pixel de predição gerado é salvo na memória e é utilizado como um pixel de referência para a próxima predição a qualquer tempo. Como resultado, um custo aritmético para calcular o valor de predição do pixel de predição de uma distância longa longe do pixel de predição pode ser suprimido e um custo de hardware pode ser reduzido.

Nesta modalidade, a predição de pixel intraquadro adaptativa é explicada para a predição de 4 x 4 pixels em detalhes. A predição similar pode ser feita para um bloco de 8 x 8 pixels, para um bloco de 16 x 16 pixels e para um sinal de diferença de cor. Em particular, desde que a distância entre o pixel de referência e o pixel de predição aumenta com o aumento de um tamanho do bloco de pixels, a predição adaptativa de pixel proporciona um efeito máximo. O número de pixels de referência utilizados para a predi- ção é aumentado de acordo com a distância, mas ele pode ser reduzido de modo a reduzir um custo aritmético. Podem existir várias combinações de filtros para utilização para a predição de cada pixel de predição.

Nesta modalidade, é descrito o caso no qual um quadro a ser processado é dividido em vários blocos retangulares, cada um possuindo um tamanho de 16 χ 16 pixels, e os blocos são codificados em uma seqüência de esquerda superior para direita inferior. Entretanto, a seqüência de codifi- cação pode ser outra seqüência. O quadro pode ser codificado a partir da direita inferior para a esquerda superior, e também pode ser codificado em um formato em espiral a partir do centro do quadro. O quadro pode ser codi- ficado a partir da direita superior para a esquerda inferior, e pode ser codifi- cado em direção ao centro a partir da periferia.

Nesta modalidade, é descrito o caso no qual o quadro a ser pro- cessado é dividido em vários macroblocos em uma base de 16 χ 16 , e a predição intraquadro é baseada em um bloco de 8 χ 8 pixels ou em um bloco de 4 χ 4 pixels. Entretanto, o bloco a ser processador não precisa ter um formato de bloco uniforme, e pode ter um tamanho de bloco tal como 16x8 pixels, 8x16 pixels, 8x4 pixels, 4x8 pixels, etc.. Por exemplo, a predição de 8 χ 4 pixels ou a predição de 2 χ 2 pixels pode ser realizada no esquema similar.

Além disso, o tamanho de bloco de quantização de transforma- ção não precisa ser um tamanho de bloco uniforme, e pode ser um tamanho de bloco tal como 16x8 pixels, 8x16 pixels, 8x4 pixels, 4x8 pixels. Adi- cionalmente, não é necessário pegar um tamanho de bloco uniforme em um macrobloco. Tamanhos de bloco diferentes podem ser proporcionados no macrobloco. Por exemplo, a predição de 8 χ 8 pixels e a predição de 4 χ 4 pixels podem ser coexistentes na macrobloco como apresentado na Figura 4E. Neste caso, o número de bits codificados necessários para a codificação dos blocos divididos aumenta com o aumento do número de blocos dividi- dos, mas a predição intraquadro com eficiência de predição mais elevada pode ser realizada, e um erro de predição pode ser reduzido. Por conse- qüência, o tamanho do bloco pode ser selecionado considerando o equilíbrio entre o número de bits codificados de coeficiente de transformação e a ima- gem local decodificada.

Nesta modalidade, o modo de predição é explicado somente na predição intraquadro. Entretanto, a predição inter-quadro para fazer a predi- ção utilizando a correlação entre os quadros pode ser utilizada. Este sistema de predição pode ser utilizado como a predição inter-quadro selecionada quando codificando um pedaço na codificação inter-quadro. Neste caso, a predição intraquadro e a predição inter-quadro não precisam ser trocadas em unidades de macrobloco, e podem ser trocadas a cada bloco de 8 χ 8 pixels, e podem ser divididas em unidades de um bloco de 8 χ 4 pixels.

Nesta modalidade, o transformador / quantizador 104 e o de- quantizador / transformador inverso 105 são proporcionados, mas a trans- formação / quantização e a dequantização / transformação inversa não pre- cisam sempre ser sujeitas a todos os sinais de erro de predição. O sinal de erro de predição pode ser codificado com o processador de codificação 107 como ele é, e o processo de quantização / dequantização pode ser omitido. De forma similar, o processo de transformação / transformação inversa não precisa ser feito.

Um método para codificar um indicador ex_adaptive_intra_flag para trocar entre a predição adaptativa de pixel e a predição de direcional e um indicador ex_direct_intra_flag para fazer a predição de modo fixo será descrito.

A estrutura da sintaxe utilizada nesta modalidade é apresentada esquematicamente na Figura 13. As sintaxes são constituídas principalmen- te de três partes, isto é, a sintaxe de alto nível (1301), a sintaxe em nível de pedaço (1304) e a sintaxe em nível de macrobloco (1307). A sintaxe de alto nível (1301) é preenchida com a informação de sintaxe de camadas mais elevadas do que o pedaço. A sintaxe em nível de pedaço (1304) é especifi- cada pela informação a ser necessária para cada pedaço. A sintaxe em nível de macrobloco (1307) é especificada por um valor de alteração ou por uma informação de modo do parâmetro de quantização necessário para cada macrobloco.

Cada sintaxe é composta de sintaxes adicionais detalhadas. Em outras palavras, a sintaxe de alto nível (1301) é composta de seqüências tal como sintaxe de estabelecimento de parâmetro de seqüência (1302) e sinta- xe de estabelecimento de parâmetro de imagem (1303), e sintaxe em nível de imagem. A sintaxe em nível de pedaço (1304) é composta de sintaxe de cabeçalho de pedaço (1305) e uma sintaxe de dados de pedaço (1306). A sintaxe em nível de macrobloco (1307) é composta de sintaxe de camada de macrobloco (1308) e sintaxe de predição de macrobloco (1309).

Nesta modalidade, a informação de sintaxe necessária é a sinta- xe de estabelecimento de parâmetro de seqüência (1302), a sintaxe de es- tabelecimento de parâmetro de imagem (1303), a sintaxe de cabeçalho de pedaço (1305) e a sintaxe de camada de macrobloco (1308). As respectivas sintaxes serão explicadas daqui para frente.

O indicador ex_adaptive_intra_in_seq_flag apresentado na sin- taxe de estabelecimento de parâmetro de seqüência da Figura 14 é um indi- cador indicando se a predição adaptativa de pixel é alterada a cada seqüên- cia. Quando o indicador é VERDADEIRO, a predição adaptativa de pixel e a predição direcional podem ser trocadas em unidades de seqüência. Quando o indicador é FALSO, é impossível utilizar a predição adaptativa de pixel na seqüência.

O indicador ex_adaptive_intra_in_pic_flag apresentado na sinta- xe de estabelecimento de parâmetro de imagem da Figura 15 é um indicador indicando se a predição adaptativa de pixel é alterada a cada imagem. Quando o indicador é VERDADEIRO, a predição adaptativa de pixel e a pre- dição direcional podem ser trocadas em unidades de imagem. Quando o indicador é FALSO, é impossível utilizar a predição adaptativa de pixel na imagem.

O indicador ex_adaptive_intra_in_slice_flag apresentado na sin- taxe de cabeçalho de pedaço da Figura 16 é um indicador indicando se a predição adaptativa de pixel é alterada a cada pedaço. Quando o indicador é VERDADEIRO, é possível trocar entre a predição adaptativa de pixel e a predição direcional em unidades de pedaço. Quando o indicador é FALSO, é impossível utilizar a predição adaptativa de pixel no pedaço.

O indicador ex_adaptive_intra_flag apresentado na sintaxe de camada de macrobloco da Figura 17 é um indicador indicando se a predição adaptativa de pixel é utilizada no macrobloco. Quando o indicador é VER- DADEIRO, a predição adaptativa de pixel é utilizada. Quando o indicador é FALSO, a predição direcional é utilizada. Este indicador é eficaz quando pelo menos um dentre o ex_adaptive_intra_in_seq_flag, o ex_adaptive_intra_in_pic_flag e o ex_adaptive_intra_in_slice_flag é VER- DADEI RO. O tipo de predição do macrobloco pode ser somente utilizada na predição intraquadro.

O indicador ex_direct_intra_in_seq_flag apresentado na sinta de estabelecimento de parâmetro de seqüência da Figura 18 é um indicador indicando se a predição de modo fixo é alterada a cada seqüência. Quando o indicador é VERDADEIRO, é possível trocar entre utilizar e não utilizar a predição de modo fixo em unidades de seqüência. Quando o indicador é FALSO, é impossível utilizar a predição de modo fixo na seqüência.

O indicador ex_direct_intra_in_pic_flag apresentado na sintaxe de estabelecimento de parâmetro de imagem da Figura 19 é um indicador indicando se a predição de modo fixo é alterada a cada imagem. Quando o indicador é VERDADEIRO, é possível trocar o uso e o não uso da predição de modo fixo nas unidades de imagem. Quando o indicador é FALSO, é im- possível utilizar a predição de modo fixo na imagem.

O indicador ex_direct_intra_in_slice_flag apresentado na sintaxe de cabeçalho de pedaço da Figura 20 é um indicador indicando se a predi- ção de modo fixo é alterada a cada pedaço. Quando o indicador é VERDA- DEIRO, é possível trocar entre o uso e não uso da predição de modo fixo em unidades de pedaço. Quando o indicador é FALSO, é impossível utilizar a predição de modo fixo no pedaço.

O indicador ex_direct_intra_flag apresentado na sintaxe de ca- mada de macrobloco da Figura 21A é um indicador indicando se a predição de modo fixo é utilizada no macrobloco. Quando o indicador é VERDADEI- RO, a predição de modo fixo é utilizada. Quando o indicador é FALSO, a predição de modo fixo não pode ser utilizada. Este indicador é eficaz somen- te quando pelo menos um dentre o ex_direct_intra_in_seq_flag, o ex_direct_intra_in_pic_flag e o ex_directjntra_in_slice_flag é VERDÀDEI- RO. O tipo de predição de macrobloco somente pode ser utilizado na predi- ção intraquadro.

A Figura 21B apresenta uma sintaxe de predição de macrobloco. A informação de modo de predição no macrobloco correspondente é arma- zenada nesta sintaxe. Quando um modo de predição à parte de uma predi- ção de modo fixo é selecionado, esta sintaxe estabelece a informação cor- respondente de modo de predição.

O prev_intra4x4_pred_mode_flag é apresentado nesta sintaxe não é utilizado quando ex_direct_intra_flag é VERDADEIRO. O prev_intra4x4_pred_mode_flag é um indicador indicando se o modo de pre- dição (current_mode) estimado pelos blocos de predição adjacentes coincide com um modo de predição (pred_mode) realmente selecionado para o bloco de predição pretendido. Quando eles coincidem um com o outro, ou seja, é VERDADEIRO, rem_intra4x4_pred_mode não é utilizado. Quando eles não coincidem um com o outro, rem_intra4x4_pred_mode é adicionalmente utili- zado. O remJntra4x4_pred_mode representa uma quantidade divergente entre current_mode e um modo de predição (pred_mode) realmente selecio- nado para o bloco de predição pretendido. Quando pred_mode é maior do que o modo corrente, um valor de rem_intra4x4_pred_mode = current_mode é armazenado. Quando pred_mode é igual ou menor do que current_mode, um valor de rem_intra4x4_pred_mode = current_mode + 1 é armazenado.

Quando tanto o ex_direct_intra_flag como o ex_adaptive_intra_flag são VERDADEIRO, é utilizado um modo de codifica- ção o qual não envia a informação de modo na predição adaptativa de pixel. Quando o ex_direct_intra_flag é VERDADEIRO e o ex_adaptive_intra_flag é FALSO, é utilizado um modo de codificação que não envia a informação de modo na predição direcional.

A presente modalidade aperfeiçoa a predição da predição do pixel de predição longe do pixel de referência, e reduz o erro de predição. Segunda Modalidade (Codificação)

Em um aparelho de codificação de vídeo 1000 de acordo com a segunda modalidade apresentada na Figura 10, um contador temporário de codificação / número de bits codificados 1001, uma unidade de medição de distorção de codificação 1002, um comutador de câmbio de codificação 1003 são adicionados para o aparelho de codificação de vídeo da primeira moda- lidade. Desde que o preditor intraquadro e o seletor de modo diferem em função da primeira modalidade, os números de referência diferentes destes da primeira modalidade são designados para os mesmos. Na presente mo- dalidade, números de referência iguais são utilizados para designar elemen- tos estruturais iguais correspondendo a estes como na Figura 1 e qualquer explicação adicional é omitida por propósito de brevidade.

O sinal de vídeo informado para o aparelho de codificação de vídeo 1000 é dividido em vários blocos de pixels com o divisor de quadro 101. Cada bloco é informado para o preditor de intraquadro 1004 como um sinal de imagem de entrada 115. O preditor intraquadro 1004 gera um sinal de imagem de predição 114 com todos os modos de predição que podem ser selecionados no macrobloco utilizando a imagem de referência armaze- nada temporariamente na memória de imagem de referência 106. Entretan- to, quando uma próxima predição não pode ser feita a não ser que uma ima- gem local decodificada seja gerada no macrobloco como a predição intra- quadro deΉ.264 (predição de 4 x 4 pixels), (Figura 4C) ou predição de 8 x 8 pixels (Fig. 4D), o preditor intraquadro 1004 pode executar a transformação 25 e a quantização, e a dequantização e a transformação inversa.

O sinal de imagem de predição 114 gerado com o preditor intra- quadro 1004 é enviado para o seletor de modo 1005. O seletor de modo 1005 gera um sinal de erro de predição 116 obtido pela subtração do sinal de imagem de predição 114 do sinal de imagem de entrada 115. O seletor de modo 1005 recebe o número de bits codificados 1006 acumulados com a unidade codificação temporal / medição de número de bits codificados 1001 e a distorção de codificação 1007 calculada com a unidade de medição de distorção de codificação 1002 e calcula um custo de codificação. O custo de codificação é calculado pela seguinte equação (24).

J = D + λ χ R (24)

onde R indica o número de bits codificados, D é a distorção de codificação, e λ é uma constante e determinada por uma largura de quantização e por um valor de um parâmetro de quantização. Um modo é selecionado pelo custo de codificação obtido deste modo. O modo proporcionado um custo J cujo valor é mínimo é selecionado como um modo ótimo.

Nesta modalidade, o número de bits codificados 1006 e a distor- ção de codificação 1007 são utilizados. Entretanto, o modo pode ser sele- cionado utilizando somente o número de bits codificados ou somente a dis- torção de codificação. O custo pode ser calculado utilizando a atividade do sinal de imagem de entrada 115, e uma função de custo pode ser calculada utilizando uma largura de quantização e um parâmetro de quantização. A distorção de codificação ponderada pela característica ou sensibilidade de freqüência visual, etc., é utilizada como o custo de codificação.

O seletor de modo 1005 é conectado com o transformador / quantizador 104. A informação de modo e o sinal de erro de predição 116, os quais são selecionados com o seletor de modo 1005, são informados pa- ra o transformador / quantizador 104. O transformador / quantizador 104 emite um coeficiente de transformação quantizado 117 por sujeitar o sinal de erro de predição 116 à transformação e à quantização.

O coeficiente de transformação 117 é enviado para o comutador de câmbio de codificação temporária 1003. Quando um indicador de codifi- cação temporária é estabelecido para VERDADEIRO com o controlador de codificação 108, o comutador de câmbio de codificação temporal 1003 co- necta a saída do transformador / quantizador 104 com a unidade de codifi- cação temporal / de medição de número de bits codificados 1001. O coefici- ente de transformação 117 é informado para a unidade de codificação tem- poral / de medição de número de bits codificados 1001 e temporariamente codificado por entropia. Neste caso, a unidade de codificação temporal / de medição de número de bits codificados 1001 acumula o número de bits codi- ficados e calcula uma estimativa do número total de bits codificados devido à codificação real, mas emite os dados codificados. O número de bits codifica- dos 1006 contado com a unidade de codificação temporal / de medição de número de bits codificados 1001 é enviado para a unidade de medição de distorção de codificação 1002.

A unidade de medição de distorção de codificação 1002 não somente receber um sinal de imagem decodificado 119 gerado pela soma do sinal de erro de predição 116 decodificado com dequantizador / transforma- dor inverso 105 com o sinal de imagem de predição 114 como um sinal de entrada, mas também recebe um sinal de imagem de entrada 115 e calcula um erro ao quadrado (distorção de codificação 1007) do sinal de imagem decodificado 119 e o sinal de imagem de entrada 115. A unidade de medi- ção de distorção de codificação 1002 envia o número de bits codificados como uma entrada e a distorção de codificação 1007 proporcionada pelo cálculo para sa unidade de determinação de modo 1005.

Uma repetição de codificação temporal (um processo executado em ordem de preditor intraquadro 1004 seletor de modo 1005 trans- formador / quantizador 104 -> comutador de câmbio de codificação temporal 1003 unidade de codificação temporal / de medição de número de bits codificados 1001 unidade de medição de distorção de codificação 1002 na Figura 10) corresponde a uma repetição quando o processo de codifica- ção é executado para um modo de predição que pode ser selecionado para o macrobloco. Quando existem dez tipos de modos, a repetição de codifica- ção temporária é repetida dez vezes. Quando a repetição de codificação temporal é terminada para todos os modos que podem ser selecionados no macrobloco, o seletor de modo 1005 estabelece um indicador de codificação provisória do controlador de codificação 108 para FALSO.

Quando o indicador de codificação temporária é estabelecido para FALSO com o controlador de codificação 108, o comutador de câmbio de codificação temporal 1003 conecta a saída do transformador / quantiza- dor 104 com o processador de codificação 107. Nesta hora, a unidade de determinação de modo 1005 calcula os custos de codificação para todos os modos, e envia o coeficiente de transformação 117 e a informação de modo de um modo dentre os modos que fornece o custo mínimo de codificação para o processador de codificação 107. O processador de codificação 107 codifica realmente o coeficiente de transformação quantizado 117 de acordo com um método prescrito pela informação de modo de entrada. Neste caso, os dados a serem finalmente codificados já estão codificados em codificação temporal uma vez. Portanto, o coeficiente de transformação e a informação do modo, em que o custo de codificação é preferível na hora da codificação temporal, são salvos na memória, e o processador de codificação 107 pode executar o processo de ler os dados codificados salvos na memória e copiar os mesmos sem codificação.

Quando a repetição de codificação é completada para o macrob- Ioco de objetos, o sinal de imagem de entrada 115 do próximo bloco é infor- mado para o preditor de intraquadro 1004 para codificar o próximo bloco. O controlador de codificação 108 executa o controle de realimentação do nú- mero de bits codificados, o controle de característica de quantização, o con- trole modal, etc., e realiza o controle de taxa para controlar o número de bits codificados, o controle do preditor e o controle de toda a codificação.

A função de cada parte mencionada acima pode ser realizada por um programa armazenado por um computador.

O método de codificação de vídeo de acordo com a presente modalidade será explicado referindo-se ao preditor intraquadro 1004 apre- sentado na Figura 11. Na presente modalidade, números de referência i- guais são utilizados para designar elementos estruturais iguais correspon- dendo a estes como na Figura 2, e qualquer explicação adicional é omitida por propósito de brevidade.

Quando o sinal de imagem de entrada 115 é informado para o preditor intraquadro 1004, o sinal é informado para a unidade de predição adaptativa de pixel 201, para unidade de predição direcional 202 e para o preditor de modo fixo 203. O sinal de imagem de predição 114 correspon- dendo ao modo de predição e o formato do bloco de predição são gerados com cada um dentre a unidade de predição adaptativa de pixel 201, a unida- de de predição direcional 202 e o preditor de modo fixo 203.

Os sinais de imagem de predição 114 e a informação de modo de predição que são preditos com os preditores 201, 202 e 203, respectiva- mente, são informados para o seletor interno de modo 1104. O seletor inter- no de modo 1104 gera um sinal de erro de predição 116 por subtrair o sinal de imagem de predição 114 do sinal de imagem de entrada 115. O seletor interno de modo 1104 calcula um custo interno de codificação baseado no número de bits codificados 1105 calculado com o contador de codificação temporal interna / de número de bits codificados 1101 e a distorção interna de codificação calculada com a unidade de medição de distorção interna de codificação 1102 pela equação (24), e seleciona o modo fornecendo o custo de codificação J do valor mínimo como um modo ótimo.

Nesta modalidade, o número interno de bits codificados 1105 e a distorção interna de codificação 1006 são utilizados para determinar um mo- do. Entretanto, somente um número de bits codificados ou somente a distor- ção de codificação é utilizada para determinar o modo. O custo pode ser cal- culado utilizando a atividade do sinal de imagem de entrada, e uma função de custo pode ser calculada utilizando uma largura de quantização e um pa- râmetro de quantização. A distorção de codificação ponderada pela caracte- rística ou sensibilidade de freqüência visual, etc, é utilizada como o custo da codificação.

O seletor interno de modo 1104 transmite para o controlador de codificação 108 a informação de modo indicando se o modo selecionado é um modo predito com a unidade de predição adaptativa de pixel 201, um modo predito com a unidade de predição direcional 202 ou um modo predito com o preditor de modo fixo 203. O controlador de codificação 108 controla a chave de câmbio de predição 205 de acordo com a informação de modo for- necida.

A informação de modo e o sinal de erro de predição que são se- lecionados com o seletor interno de modo 1104 são informados para o trans- formador / quantizador interno 206. O transformador / quantizador 206 trans- forma de forma ortogonal o sinal de erro de predição de entrada 116 para gerar os dados de coeficiente de transformação 117. O transformador / quantizador 206 quantiza o coeficiente de transformação. O parâmetro de quantização necessário para a quantização é estabelecido com o controla- dor de codificação 108.

O controlador de codificação 108 se refere ao indicador de codi- ficação temporária e conecta a chave de câmbio de codificação temporal 1103 com de codificação temporal interna / de medição de número de bits codificados 1101, resultando em fornecer o coeficiente de transformação e a informação de modo do modo para a unidade de codificação temporal inter- na / de medição de número de bits codificados 1101. A unidade de codifica- ção temporal interna / de medição de número de bits codificados 1101 codi- ficou por entropia estes dados de entrada. Neste caso, a unidade de codifi- cação temporal interna / de medição de número de bits codificados 1101 acumula um número de bits codificados, e calcula uma estimativa do número total de bits codificados devido à codificação real, mas não emite os dados codificados. O número de bits internos codificados 1105 medido com a uni- dade de codificação temporal interna / de medição de número de bits codifi- cados 1101 é enviado pára a unidade interna de medição de distorção de codificação 1102.

A unidade interna de medição de distorção de codificação 1102 não somente recebe um sinal de imagem decodificado 119 gerado pela adi- ção do sinal de erro de predição 116 decodificado com o dequantizador / transformador inverso interno 207 e o sinal de imagem de predição 114 co- mo um sinal de entrada, mas também recebe um sinal de imagem de entra- da 115 e calcula um erro quadrático (distorção de codificação interna 1106) do sinal de imagem decodificado 119 e do sinal de imagem de entrada 115. A unidade interna de medição de distorção de codificação 1102 envia o nú- mero de bits internos codificados 1105 recebido como entrada e a distorção interna de codificação 1106 proporcionada pelo cálculo para a unidade inter- na de determinação de modo 1104.

Uma repetição interna de codificação temporal (um processo executado em ordem das respectivas unidades de predição -> seletor inter- no de modo 1104 chave de câmbio de predição 205 -> transformador / quantizador interno 206 chave de câmbio de codificação temporal interna 1103 —> unidade de codificação temporal interna / de medição de número de bits codificados 1101 —> unidade interna de medição de distorção de codifi- cação 1102, na Figura 10) corresponde a uma repetição quando o processo de codificação é executado para um módulo de predição que pode ser sele- cionado para o macrobloco. Quando existem dez tipos de modos, a repeti- ção interna de codificação temporária é repetida dez vezes. Quando a repe- tição interna de codificação temporal é terminada para todos os modos ca- pazes de serem selecionados para o bloco de pixels, o seletor interno de modo 1104 estabelece o indicador de codificação temporal do controlador de codificação 108 para FALSO.

Quando, por exemplo, a predição de 4 χ 4 pixels é feita, a predi- ção adaptativa de pixel, a predição direcional e a predição de modo fixo são executadas em um bloco de 4 χ 4 pixels. Neste caso, a repetição de codifi- cação temporal é repetida 9 + 9 + 1 vezes. As predições acima são feitas para 16 blocos na predição de 4 χ 4 pixels, a repetição interna de codificação temporal é repetida 16 χ (9 + 9 + 1) vezes.

Quando um indicador de codificação temporária é estabelecido para FALSO com o controlador de codificação 108, a chave interna de câm- bio de codificação temporal 1103 conecta a saída do transformador / quanti- zador interno 206 com o lado de fora do preditor intraquadro 1004. Nesta hora, a unidade interna de determinação de modo 1104 calcula os custos de codificação para todos os modos e envia para o exterior do preditor intra- quadro 1004 o coeficiente de transformação 117 e a informação de modo de um dos modos que fornece o custo mínimo de codificação.

O método de codificação de vídeo implementado pelo aparelho de codificação de vídeo 1000 será explicado se referindo à Figura 12.

Quando um vídeo em movimento é informado para o aparelho de codificação de vídeo 1000 (etapa S001), o divisor de imagem 101 divide um quadro do vídeo em movimento em vários macroblocos. Um macrobloco dividido é informado para o preditor intraquadro 102 como um sinal de ima- gem de entrada 115 (etapa S002). Nesta hora, o seletor de modo 1005 e o seletor interno de modo 1104 iniciam um índice indicando um modo e um custo (etapa S003).

O preditor intraquadro 1004 gera o sinal de imagem de predição 114 para um modo que pode ser selecionado para um bloco de predição utilizando o sinal de imagem dê entrada 115 (etapa S004). O seletor de mo- do 1005 calcula um erro entre o sinal de imagem de predição 114 e o sinal de imagem de entrada 115 para gerar um sinal de erro de predição 116. O transformador / quantizador 104 transforma e quantiza o sinal de erro de predição 116 e informa o coeficiente de transformação quantizado 117 para a unidade de codificação temporária / de medição de número de bits codifi- cados 1001. A unidade de codificação temporária / de medição de número de bits codificados 1001 temporariamente codifica o coeficiente de transfor- mação (etapa S005) e acumula o número de bits codificados. O coeficiente de transformação é sujeito à decodificação local, e um erro quadrático do sinal de imagem de entrada e do sinal de imagem decodificado é calculado com a unidade de medição de distorção de codificação 1002. Um custo de codificação é calculado baseado no número de bits codificados R e na dis- torção de codificação D (etapa S006).

O seletor de modo 1005 determina se o custo de codificação calculado é menor do que o custo mínimo de codificação min_cost (etapa S007). Quando ele é menor (SIM) , o seletor de modo 1005 atualiza o custo mínimo de codificação para o custo de codificação, mantém um modo de codificação correspondendo ao custo de codificação calculado como um ín- dice de best_mode, e armazena os dados temporais codificados em um ar- mazenamento temporário (etapa S008). Quando, o custo de codificação cal- culado é maior do que o custo mínimo de codificação min_cost (NÃO), o se- letor de modo 1005 aumenta o índice indicando um número do modo, e de- termina se o índice aumentado indica o último modo (etapa S009).

Quando o índice é maior do que MAX indicando um número do último modo (SIM), o índice é codificado por entropia junto com a informação de modo de codificação best_mode, a informação de predição 109 e a in- formação de rearranjo de predição 110 com o processador de codificação 107 (etapa S010). Quando o índice é menor do que MAX indicando um nú- mero do último modo (isto é, a determinação é NÃO), o sinal de imagem de predição 115 do modo de codificação indicado pelo próximo índice é gerado (etapa S004).

Quando a codificação é feita no best_mode, o coeficiente de transformação quantizado 117 é informado para o dequantizador / transfor- mador inverso 105 para ser dequantizado e transformado de forma inversa.

O sinal de erro de predição decodificado 116 é adicionado para o sinal de imagem de predição 114 do best_mode proporcionado a partir do seletor de modo 1004 com o adicionador 118, e é salvo na memória de imagem de re- ferência 106 como um sinal de imagem decodificado 119.

Então, é determinado se a codificação de um quadro está com- pleta (etapa S11). Quando a codificação está completa (SIM), um sinal de imagem de entrada de um próximo quadro é informado para o divisor de quadro 101 e o processo de codificação para o próximo quadro é feito. Quando o processo de codificação de um quadro não está completo (NÃO), um sinal de entrada de um próximo macrobloco é informado para o preditor intraquadro 1004 e o processo de codificação é continuado.

O método de codificação de vídeo desta modalidade é executa- do com o aparelho de codificação de vídeo 1000 como descrito acima. De acordo com a presente modalidade, o número de bits codificados pode ser alocado de forma adequada para cada bloco pela utilização da codificação temporal e de um índice, por meio do que a eficiência da codificação é aper- feiçoada.

Terceira Modalidade (Codificação)

Na terceira modalidade apresentada na Figura 22, um primeiro preditor intraquadro 2202 e um segundo preditor intraquadro 2203 são adi- cionados para a segunda modalidade. Desde que o divisor de quadro 2201 difere em função da segunda modalidade, números de referência diferentes destes da segunda modalidade são designados para os mesmos. Na moda- lidade da Figura 10, números de referências iguais são utilizados para de- signar elementos estruturais iguais correspondendo a estes na modalidade da Figura 1 e qualquer explicação adicional é omitida por propósito de brevidade.

No aparelho de codificação de vídeo 2200 apresentado na Figu- ra 22, o primeiro preditor intraquadro 2202 difere do primeiro preditor intra- quadro 2203 somente em um tamanho do bloco de predição, e o método de predição é o mesmo que no preditor intraquadro 1004 apresentado na Figura 11. Um divisor de imagem 2201 divide um sinal de vídeo de entrada em vá- rios blocos de pixels. Nesta hora, o macrobloco é dividido em diferentes for- matos de bloco. Um macrobloco é dividido em 16 blocos de 4 χ 4 pixels, e o outro macrobloco é dividido em quatro blocos de 8 χ 8 pixels. Os respectivos blocos divididos são informados para o primeiro preditor intraquadro 2202 e para o segundo preditor intraquadro 2203 como o sinal de imagem de entra- da. O primeiro preditor intraquadro 2202 executa a predição de 4 χ 4 pixels. Quatro imagens de predição, cada uma configurada por um bloco de 8 χ 8 pixels composto de quatro blocos de 4 χ 4 pixels que são reunidos, são cria- dos. O segundo preditor intraquadro 2203 executa a predição de 8 χ 8 pixels. Em outras palavras, o segundo preditor intraquadro 2203 executa a predição de 8 χ 8 pixels quatro vezes. Em um ponto do tempo quando a predição para o primeiro bloco de 8 χ 8 pixels é completada, um sinal de imagem de predi- ção baseado na predição de 4 χ 4 pixels e um sinal de imagem de predição baseado na predição de 8 χ 8 pixels são informados para o seletor de modo 1005. O seletor de modo 1005 calcula custos de codificação de acordo com um dado sistema, e seleciona a partir dos custos de codificação calculados um modo de predição denotando o custo mínimo de codificação. A imagem decodificada correspondendo ao modo selecionado é acumulada na memó- ria de imagem de referência 106 através do transformador / quantizador 104 e do dequantizador / transformador inverso 105.

Quando o modo do primeiro bloco de 8 χ 8 pixels é determinado, a predição do próximo bloco de 8 χ 8 pixels é feita de forma similar. Em ou- tras palavras, a predição de 4 χ 4 pixels e a predição de 8 χ 8 pixels pode ser trocada em unidades de 8 χ 8 pixels no macrobloco. A Figura 4E apresenta um exemplo da alteração do tamanho do bloco de predição no macrobloco. Quando todos os modos dos quatro blocos de 8 x 8 pixels são determinados, o controlador de codificação 108 conecta a chave de câmbio de codificação temporal 1003 com o processador de codificação 107 para executar a codifi- cação. Nesta hora, a informação indicando se o bloco de 8 x 8 pixels é codi- ficado pela predição de 4 x 4 pixels ou pela predição de 8 x 8 pixels é codifi- cada ao mesmo tempo. Esta informação é codificada como dados de quatro bits no macrobloco com o processador de codificação 107.

Será explicada, daqui para frente, uma sintaxe de informação de alteração de tamanho de bloco necessária para alterar a informação de pre- dição.

O indicador ex_adaptive_blocksize_in_seq_flag apresentado na sintaxe de estabelecimento de parâmetro de seqüência da Figura 23 é um indicador indicando se uma predição de alteração de tamanho de bloco é alterada a cada seqüência. Quando o indicador é VERDADEIRO, é possível trocar entre o uso e não uso da alteração de tamanho de bloco através da predição em unidades de seqüência. Quando o indicador é FALSO, é im- possível utilizar a alteração de tamanho de bloco através da predição na se- qüência.

O indicador ex_adaptive_blocksize_in_pic_flag apresentado na sintaxe de estabelecimento de parâmetro de imagem da Figura 24 é um in- dicador indicando se a predição de alteração de tamanho de bloco é alterada a cada imagem. Quando o indicador é VERDADEIRO, é possível trocar en- tre o uso e o não uso da alteração do tamanho de bloco através da predição em unidades de imagem. Quando o indicador é FALSO, é impossível utilizar a alteração de tamanho de bloco através da predição na imagem.

O indicador ex_adaptive_blocksize_in_slice_flag apresentado na sintaxe de cabeçalho de pedaço da Figura 25 é um indicador indicando se uma alteração de tamanho de bloco através da predição é alterada a cada pedaço. Quando o indicador é VERDADEIRO, é possível trocar entre o uso e o não uso da alteração de tamanho de bloco através da predição em uni- dades de pedaço. Quando o indicador é FALSO, é impossível utilizar a alte- ração de tamanho dé bloco através da predição no pedaço.

O indicador ex_adaptive_blocksize_mode apresentado na sinta- xe de camada de macrobloco da Figura 26 são dados de quatro bits, e cor- respondem à alteração de tamanho de bloco através da informação. A Figu- ra 28A apresenta se o bloco de 8 χ 8 pixels é a predição de 4 χ 4 pixels ou a predição de 8 χ 8 pixels, na ordem correspondendo à A, B1 C e D. Quando, por exemplo, o ex_adaptive_blocksize_mode apresenta 1100, é visto que os blocos AeB são codificados pela predição de 8 χ 8 pixels, e os blocos CeD são codificados pela predição de 4 χ 4 pixels, como apresentado na Figura 28B. Estes dados são eficazes quando pelo menos um dentre o ex_adaptive_blocksize_in_seq_flag, o ex_adaptive_blocksize_in_pic_flag, e o ex_adaptive_blocksize_in_slice_flag é VERDADEIRO.

A sintaxe não é enviada por uma camada de macrobloco, mas pode ser enviada por um tipo de macrobloco. A Figura 27 apresenta um e- xemplo para fornecer a alteração de tamanho de bloco através da informa- ção para um tipo de macrobloco. Quando mb_type é 0, o macrobloco é pre- dito somente pela predição de 4 χ 4 pixels. Quando mb_type é 1, o macrob- loco é predito somente pela predição de 8 χ 8 pixels. Quando mb_type re- presenta 1 até 5, a alteração de tamanho de bloco através da predição é executada. lntra_A_B_C_D apresenta que o bloco é utilizado pela predição de 8 χ 8 pixels. As posições dos blocos A, B, C e D são apresentadas na Figura 28A. Quando mb_type é, por exemplo, 3, isto apresenta que os blo- cos AeB são preditos pela predição de 8 χ 8 pixels. Quando mb_type é 6, isto apresenta que a predição de 16x16 pixels é feita. A predição com uma boa eficiência pode ser obtida por se fornecer a alteração de tamanho de bloco através da informação para mb_type e um pequeno índice para um modo de alta freqüência de seleção deste modo.

Como discutido acima, esta modalidade executa realmente um processo de codificação temporal em cada um dentre vários modos de codi- ficação que podem ser selecionados em unidades de 8 χ 8 pixels, seleciona um modo correspondendo ao modo mínimo de custo de codificação calcula- do a partir do número de bits codificados dos dados codificados baseados no modo a cada bloco de 8 χ 8 pixels e uma distorção de codificação do mes- mo, e emite dados codificados baseado no modo selecionado. Deste modo, devido à seleção de modo ser feita pela alteração do tamanho do bloco de predição a cada bloco de 8 χ 8 pixels no macrobloco, um formato de bloco permitindo codificação com alta eficiência de codificação pode ser selecio- nado de acordo com o método de predição. Em outras palavras, a codifica- ção preferida pode ser feita de acordo com o conteúdo do bloco de pixels, etc..

Deste modo, desde que a codificação possuindo uma grande carga não precisa ser feita para todos os respectivos modos, e a codificação no modo selecionado somente tem que ser feita, o aumento de uma carga de operação pode ser suprimido. Em outras palavras, esta modalidade per- mite que a seleção do modo preferível em alta velocidade e a codificação de vídeo com alta velocidade e alta eficiência de compactação sejam realiza- dos.

Como mencionado acima, no caso da codificação do bloco de pixels em um modo selecionado, um sinal de vídeo decodificado somente tem que ser gerado no modo selecionado. A codificação não precisa ser sempre executada em uma repetição para determinar um modo de predição.

O aparelho de decodificação de vídeo correspondendo ao apare- lho de codificação de vídeo será explicado.

Quarta Modalidade (Decodificação)

De acordo com o aparelho de decodificação de vídeo apresen- tado na Figura 29, os dados codificados transmitidos a partir do aparelho de codificação de vídeo e enviados através de um sistema de transmissão ou de um sistema de meio de gravação, são salvos em uma memória temporá- ria de entrada 901 uma vez. Os dados codificados são divididos em vários blocos de pixels de acordo com a sintaxe a cada quadro com um demultiple- xador 902 e então, informados para um decodificador de cadeia de código 903. O decodificador de cadeia de código 903 decodifica a cadeia de código de cada sintaxe de dados codificados para cada um a dentre uma sintaxe de alto nível, uma sintaxe em nível de pedaço e uma sintaxe em nível de ma- crobloco, de acordo com a estrutura de sintaxe apresentada na Figura 13. Como resultado, um coeficiente de transformação quantizado, uma matriz de quantização, um parâmetro de quantização, a informação de modo de predi- ção, e a informação de alteração de predição, são reconstruídos.

O coeficiente de transformação quantizado é dequantizado utili- zando a matriz de quantização e o parâmetro de quantização da informação reconstruída com o dequantizador / transformador inverso 904, e sujeito à transformação ortogonal inversa (por exemplo, transformação inversa de co- seno separado). A transformação ortogonal inversa é explicada aqui. Entre- tanto, quando a transformação de ondaleta é feita com o codificador, o de- quantizador / transformador inverso 904 pode executar a quantização inver- sa e a transformação de ondaleta inversa correspondendo à transformação ortogonal inversa. O coeficiente transformado com o dequantizador / trans- formador inverso 904 é enviado para um adicionador 905 como um sinal de erro 911. O adicionador 905 adiciona o sinal de predição 916 emitido a partir do preditor intraquadro 907 e o sinal de erro 911, e informa um sinal adicio- nal para uma memória de imagem de referência 906 como um sinal decodifi- cado 912. O sinal decodificado 912 é enviado para uma memória temporária de saída 913 e emitido em um tempo controlado com o controlador de deco- dificação 908.

A informação de modo de predição 909 e a informação de alte- ração de predição 910 decodificada com o decodificador de cadeia de códi- go 903 são informadas para um preditor intraquadro 907. O sinal de referên- cia já codificado 914 é lido a partir da memória de imagem de referência 906 para o preditor intraquadro 907. O preditor intraquadro 907 gera um sinal de predição 916 baseado na informação de entrada e informa o mesmo para o adicionador 905. O controlador de decodificação 908 controla a memória intermediária de entrada 901 e a memória intermediária de saída 913 ou o tempo de decodificação, etc.

O preditor intraquadro 907 do aparelho de decodificação de ví- deo 900 implementando um método de decodificação de vídeo de acordo com a presente modalidade será descrito se referindo à Figura 30. Na moda- lidade da Figura 30, números de referência iguais são utilizados para desig- nar elementos estruturais iguais correspondendo a estes na modalidade da Figura 29 e qualquer explicação adicional é omitida por propósito de brevi- dade.

Quando a informação de modo de predição 909 e a informação de troca de predição 910 que são decodificadas com o decodificador de ca- deia de código 903 são informadas para o preditor intraquadro 907, estas informações são enviadas para um controlador de predição 3007 uma vez. Um comutador de câmbio de predição 3001 é controlado de acordo com a informação de troca de predição 910. Mais especificamente, o indicador ex_adaptive_intra_flag e o indicador ex_direct_intra_flag são informados pa- ra o controlador de predição 3007 como informação de troca de predição. O indicador ex_adaptive_intra_flag é um indicador indicando se a imagem é predita pela predição adaptativa de pixel ou pela predição direcional. Se o indicador for VERDADEIRO, o comutador de câmbio de predição 3001 é conectado com a unidade de predição adaptativa de pixel 3002. Se o indica- dor for FALSO, o comutador de câmbio de predição 3001 é conectado com a unidade de predição direcional 3003. O indicador ex_direct_intra_flag é um indicador indicando se a predição de modo fixo é feita ou não. Se o indicador for VERDADEIRO, o comutador de câmbio de predição 3001 é conectado com o preditor de modo fixo independente do estado do indicador ex_adaptive_intra_flag. Quando o comutador de câmbio de predição 3001 é trocado de acordo com a respectiva informação, o sinal de referência 914 é informado para o preditor intraquadro 907.

O sinal de referência 914 é informado para a unidade de predi- ção correspondendo ao indicador através do comutador de câmbio de predi- ção 3001. Quando o sinal de referência 914 é formado para a unidade de predição adaptativa de pixel 3002, o controlador de predição 3007 informa a informação de modo de predição 909 para a unidade de predição adaptativa de pixel 3002. Baseada nesta informação, a unidade de predição adaptativa de pixel 3002 executa a predição adaptativa de pixel e gera o sinal de predi- ção 916. Quando o sinal de referência 914 é informado para a unidade de predição direcional 3003, o controlador de predição 3007 informa a informa- ção de modo de predição 909 para a unidade de predição direcional 3003. Baseada nesta informação, a unidade de predição direcional 3003 executa a predição direcional e gera o sinal de predição 916. Quando o sinal de refe- rência 914 é informado para o preditor de modo fixo 3004, o controlador de predição 3007 informa a informação de modo de predição 909 para a unida- de de predição de modo fixo 3004. Baseada nesta informação, a unidade de predição de modo fixo 3003 executa a predição de modo fixo e gera o sinal de predição 916. O sinal de predição 916 predito seletivamente pelas unida- des de predição 3002, 3003 e 3004, deste modo é emitido para o exterior do preditor intraquadro 907.

Subseqüentemente, será explicado um método de predição de cada uma das unidades de predição 3002, 3003 e 3004. Cada uma destas unidades de predição prediz um bloco a ser predito utilizando o sinal de refe- rência já decodificado 914 armazenado na memória de imagem de referên- cia 906. Existem nove modos de predição possuindo direções de predição diferentes umas das outras, por cada 22,5 graus como apresentado na Figu- ra 5A. Os modos são prescritos a partir do modo zero até o modo 8, e o mo- do 2 é uma predição DC na unidade de predição direcional 3003. Os nomes do modo de predição direcional feito com a unidade de predição direcional 3003 e um modo de predição adaptativo de pixel feito com a unidade de predição adaptativa de pixel 3002 são apresentados na Figura 9. A relação entre o bloco de predição e o pixel de referência da predição de 4 χ 4 pixels é apresentada na Figura 5B. Os pixels dos caracteres em letra maiúscula A até M são pixels de referência, e os pixels dos caracteres a até ρ são pixels de predição.

O método de predição da unidade de predição direcional 3003 será explicado primeiro. Quando a predição DC do modo 2 é selecionada, a unidade de predição direcional 3003 calcula um pixel de predição utilizando a equação (2). Quando um pixel de referência não pode ser utilizado, a pre- dição é executada pela média dos pixels de referência disponíveis. Se não existir pixel de referência disponível, o valor de predição é calculado por um meio valor do valor máximo de luminância do aparelho de codificação (128, se ele for 8 bits). Se outro modo for selecionado, a unidade de predição dire- cional 3003 utiliza um método de predição para copiar um valor de predição interpolado pelos pixels de referência na direção de predição apresentada na Figura 5A. Quando, por exemplo, o modo 0 (predição vertical) for seleciona- do, o método de geração de valor de predição utiliza a equação (3). Este modo pode ser selecionado somente quando os pixels de referência A até D podem ser utilizados. Neste método de predição, os valores de brilho dos pixels de referência A até D são copiados em uma direção vertical como são, como apresentado na Figura 5C e suplementados como valores de predição.

Os métodos de predição à parte dos modos de predição 0 e 2, utilizam a estrutura aproximadamente similar à dita acima, e executam a predição pela geração do valor de interpolação a partir dos pixels de refe- rência disponíveis na direção de predição, e copiando o valor de acordo com a direção de predição.

A unidade de predição adaptativa de pixel 3002 será explicada. Um modo de predição é idêntico ao descrito com referência à Figura 5A. A unidade de predição adaptativa de pixel 3002 executa a predição enquanto alterando o número de pixels de referência disponíveis de acordo com a dis- tância entre o pixel de predição e o pixel de referência, com o valor de predi- ção sendo alterado em unidades de pixel. É possível gerar um valor de pre- dição com maior precisão pela alteração de uma tabela ponderada para o pixel de referência em uso de acordo com a distância.

A relação entre o pixel de referência e o bloco de predição é a - presentada na Figura 6A. O pixel de referência e o pixel de predição apre- sentados nas FIGs. 6A e 6B correspondem um para um, um com o outro. Entretanto, índices diferentes são dados para estes pixels para facilitar a explicação da equação de predição. Existem treze pixels de referência xOO até x08, x09, x18, x27 e x36. Existem dezesseis pixels de predição x10 até x13, x19 até x22, x28 até x31 e 37 até x40. Os dezesseis pixels X14 x17, x23 x26, x32 x35, e x41 até x44, são pixels de auxílio de predição, e utiliza- dos para aumentar a precisão da predição. Um método de geração de valor de predição na predição vertical adaptativa de pixel (modo zero) será explicado em detalhes. O método de predição da predição vertical adaptativa de pixel é apresentado na Figura 6B. Como pode ser visto a partir da Figura 6B, o valor de predição é deter- minado utilizando pixels de referência aumentando em número com o au- mento da distância entre o pixel de referência e o pixel de predição.

O método de geração de valor de predição será explicado de forma concreta. A predição vertical adaptativa de pixel calcula o pixel de predição utilizando a equação (5). η indica um índice correspondendo a um dos pixels de predição (x10 até x13, x19 até x22, x28 até x31, x37 até x40) apresentados na Figura 6A. d é dado pela equação (6). Desenvolvendo a equação (5), de acordo com a distância entre o pixel de referência e o pixel de predição, uma equação de predição tal como a equação (7), é estabele- cida. L representa a distância entre o pixel de referência e o pixel de predi- ção. Vi é um índice determinado de acordo com o modo de predição corres- pondente. Hi representa um coeficiente de filtro e o número de alterações de derivações de acordo com L.

O pixel de predição longe do pixel de referência por um pixel na direção de predição é calculado pela equação (8) utilizando três pixels de referência. Onde η indica um índice correspondendo à L = 1 (pixels x10 até x13). O coeficiente de filtro é hi = (1, 2, 1), e corresponde a Vi = (d + 1, d, d - 1).

O pixel de predição longe do pixel de referência por dois pixels na direção de predição é predito pela equação (9) utilizando cinco pixels de referência, η indica um índice correspondendo à L = 2 (x19 até x22). O coe- ficiente de filtro é hi = (1, 4, 6, 4, 1), e corresponde a Vi = (2d + 2, 2d + 1, 2d, 2d - 1, 2d - 2).

O pixel de predição longe do pixel de referência por três pixels na direção de predição é predito pela equação (9) utilizando sete pixels de referência, η indica um índice correspondendo a L = 3 (x28 até x31). O coe- ficiente de filtro é hi = (1, 6, 15, 20, 15, 6, 1), e corresponde a Vi = (3d + 3, 3d + 2. 3d + 1, 3d, 3d - 1, 3d - 2, 3d - 3). O pixel de predição longe do pixel de referência por quatro pixels na direção de predição é predito pela equação (10), utilizando sete pixels de referência, η indica um índice correspondendo a L = 4 (x37 até x40). O coe- ficiente de filtro é hi = (1, 8, 28, 56, 70, 56, 28, 8, 1), e corresponde a Vi = (4d + 4, 4d + 3, 4d + 2, 4d + 1, 4d, 4d - 1, 4d - 2, 4d -3, 4d - 4).

As equações de predição dos respectivos modos serão explica- das. A predição horizontal adaptativa de pixel (modo 1) executa a predição utilizando a equação (14). A predição superior esquerda adaptativa de pixel (modo 2) executa a predição utilizando a equação (15). A predição inferior esquerda ortogonal adaptativa de pixel (modo 3) executa a predição utilizan- do a equação (16). A predição inferior direita ortogonal adaptativa de pixel (modo 4) executa a predição utilizando a equação (17). A predição vertical esquerda adaptativa de pixel (modo 5) executa a predição utilizando a equa- ção (18). A predição horizontalmente inferior adaptativa de pixel (modo 6) executa a predição utilizando a equação (19). A predição vertical· esquerda adaptativa de pixel (modo 7) executa a predição utilizando a equação (20). A predição horizontal superior adaptativa de pixel (modo 8) executa a predição utilizando a equação (21). De modo que o valor do pixel de predição seja calculado, a imagem predita necessária é colocada na equação para desen- volver a mesma. Como resultado, os pixels de referência necessários, o nú- mero dos pixels de referência, e uma tabela de ponderação, são determina- dos.

Quando não existe pixel de referência, o pixel de referência é suplementado como a predição vertical adaptativa de pixel. Quando o pixel x37 é predito pela predição horizontal adaptativa de pixel, o pixel de referên- cia x45 não pode ser utilizado. Portanto, este pixel de referência é suplemen- tado pelo pixel x36.

Como descrito acima, o método de geração de imagem de pre- dição é executado pela unidade de predição adaptativa de pixel 3002.

A unidade de predição de modo fixo 3004 será descrita em deta- lhes. A unidade de predição de modo fixo 3004 prediz a informação de mo- do, e executa a predição adaptativa de pixel ou a predição direcional no mo- do de predição determinada. A predição da informação de modo utiliza a informação de modo de um bloco de predição adjacente ao bloco de predi- ção pretendido.

A relação do bloco adjacente com o bloco de predição pretendi- do na predição de 4 χ 4 pixels é apresentada na Figura 8. Assuma que o bloco adjacente à esquerda do bloco de predição pretendido C é A, e o bloco adjacente ao lado superior do mesmo é B. Quando dois destes modos de predição são dados como prev_left_mode e prev_upper_mode, o modo de predição do bloco é determinado pela equação (23). O current_mode indica um modo de predição do bloco de predição pretendido. Uma função min (A, B) representa um valor do menor dentre os blocos AeB. Deste modo, desde que a informação de modo de predição do bloco de predição pretendido é predita a partir da informação do modo de predição de blocos circundantes, o modo de codificação é um dos modos de codificação η o qual o número de bits codificados necessários para codificar a informação de modo de predi- ção pode ser amplamente reduzido.

É determinado pelo indicador ex_direct_intra se a unidade de predição adaptativa de pixel 201 ou a unidade de predição direcional 202 é utilizada para gerar a imagem de predição. Isto é determinado baseado no indicador ex_directJntra fornecido a partir do controlador de codificação 108.

Na presente modalidade, a informação de modo de predição do bloco de predição corrente é determinada baseada na informação de modo de predição dos blocos de predição adjacentes AeB. Como uma modifica- ção da presente modalidade, ela pode ser determinada baseada na informa- ção de modo de predição dos blocos de predição circundantes. O modo de predição do bloco de predição corrente pode ser determinado utilizando a informação de modo de predição de um bloco no lado direito do bloco de predição B, um bloco no lado superior do bloco de predição B, de um bloco do lado esquerdo do bloco de predição A, e de um bloco no lado superior do bloco de predição A. Por exemplo, o modo de predição mais freqüente entre os modos de predição dos blocos de predição circundantes, o valor médio dos modos de predição dos blocos de predição circundantes ou a média dos modos de predição dos blocos de predição circundantes pode ser determi- nado como um modo de predição do bloco de predição corrente.

Um método de decodificação para decodificar uma sintaxe da informação de troca de predição para trocar entre a predição adaptativa de pixel e a predição direcional, um indicador ex_adaptive_intra_flag, uma sin- taxe para predizer o modo fixo e o indicador ex_direct_intra_flag é o mesmo que o método de codificação apresentado nas FIGs. 13 até 21. Quinta Modalidade (Decodificação)

O aparelho de decodificação 3100 relacionado com a segunda modalidade será explicado com referência à Figura 31. Nesta modalidade, o preditor intraquadro 907 da quarta modalidade é alterado para o primeiro preditor intraquadro 3102 e o segundo preditor intraquadro 3103. Um comu- tador de câmbio de tamanho de bloco 3101 é introduzido como novidade. Na presente modalidade, números de referência iguais são utilizados para de- signar elementos estruturais iguais correspondendo a estes como na moda- lidade da Figura 29, e qualquer explicação adicional é omitida para propósito de brevidade.

A informação de modo de predição 909, a informação de troca de predição 910 e a informação de troca de tamanho de bloco 915, que são decodificadas com o decodificador de cadeia de código 903, são enviadas para o comutador de câmbio de tamanho de bloco 3101 e para o controlador de decodificação 908. O controlador de decodificação 908 conecta o comu- tador de câmbio de tamanho de bloco 3101 com um contato apropriado ba- seado na informação de troca de tamanho de bloco.

Mais especificamente, um tamanho de bloco é determinado ba- seado no indicador ex_adaptive_blocksize_mode fornecido a partir do deco- dificador de cadeia de código 903.

Esta informação é composta de quatro bits, e indica se a predi- ção de 4 χ 4 pixels ou a predição de 8 χ 8 pixels é executada com 8x8 pi- xels no macrobloco. Os bits são alocados seqüencialmente a partir da es- querda superior até a direita inferior, e dispostos na ordem correspondendo a A, B, C e D como apresentado na Figura 28A. Quando o valor do indicador ex_adaptive_blocksize_mode é 1100, é visto que a predição de 8 χ 8 pixels é alocada para os blocos A e B, e a predição de 4 χ 4 pixels é alocada para os blocos CeD, como apresentado na Figura 28B.

Se um valor de cada bit for O1 o controlador de decodificação 903 conecta o primeiro terminal de saída do comutador de câmbio de tamanho de bloco 3101 com o preditor intraquadro 3102. O primeiro preditor intraqua- dro 3102 executa a predição de 4 χ 4 pixels nos quatro blocos de 4 χ 4 pi- xels, e envia uma imagem de predição para o adicionador 905.

Se o valor de cada bit correspondendo ao bloco de 8 χ 8 pixels for 1, o controlador de decodificação 908 conecta o segundo terminal de saí- da do comutador de câmbio de tamanho de bloco 3101 com o preditor intra- quadro 3103. O segundo preditor intraquadro 3103 executa a predição de 8 χ 8 pixels em um bloco de 8 χ 8 pixels, e envia uma imagem de predição pa- ra o adicionador 905.

O primeiro preditor intraquadro 3102 e o segundo preditor intra- quadro 3103 são ambos similares em estrutura interna à Figura 30, e execu- tam a predição do tamanho de bloco determinado baseados na informação de troca de predição de entrada, e cada um emite um sinal de predição.

O controlador de decodificação 908 realmente faz o controle de um comutador de câmbio de tamanho de bloco, bem como o controle da memória intermediária de entrada 901 e da memória intermediária de saída 913, ou o controle do tempo de codificação. A sintaxe da informação de alte- ração de tamanho de bloco requerida quando a informação de predição é alterada nesta modalidade é a mesma que esta apresentada na Figura 24 até 26. A informação de troca de tamanho de bloco não é obtida a partir da camada de macrobloco, mas pode ser obtida a partir do tipo de macrobloco.

A Figura 27 apresenta um exemplo para adquirir a informação de troca de tamanho de bloco a partir do tipo do macrobloco. Quando mb_type é 0, o macrobloco é predito somente pela predição de 4 χ 4 pixels. Quando mb_type é 1, o macrobloco é predito somente pela predição de 8 χ 8 pixels. Quando mb_type é 1 até 5, a predição de tamanho do macrobloco é executada. Intra_A_B_C_D apresenta que o bloco utiliza a predição d e 8 χ 8 pixels. As posições dos blocos A, B, C e D são apresentadas na Figura 28A.

De acordo com a presente modalidade, a geração de imagem de predição com alta precisão é permitida para cada bloco. Quando a predição intraquadro é feita, o modo de predição pode ser alterado a cada seqüência, a cada pedaço ou a cada macrobloco, de modo que a imagem de predição pode ser gerada em consideração à qualidade subjetiva da imagem.

A codificação de vídeo é explicada na presente modalidade, mas a presente invenção pode ser aplicada para a codificação de imagem para- da.

De acordo com a presente invenção, um erro de predição é re- duzido na predição intraquadro, enquanto reduzindo o custo de hardware, a eficiência da codificação é aperfeiçoada, e a imagem de predição, cuja pro- priedade visual é considerada suficiente, pode ser gerada. Aplicabilidade Industrial

Ela pode ser aplicada junto à codificação e à decodificação para uma imagem em movimento, uma imagem parada, fala, etc., em cada cam- po, tal como um dispositivo de vídeo, um dispositivo de áudio, equipamento móvel, rádio difusão, um terminal de informação, uma rede.

Claims

1. Método de codificação de imagem, compreendendo: uma etapa de dividir um sinal de imagem de entrada correspon- dendo a uma imagem em vários sinais de bloco de pixels; uma etapa de geração de sinal de imagem de predição para e- xecutar cada intrapredição para extrapolar um pixel de predição em uma di- reção definida em todos os vários modos de predição utilizando pixels de referência alterados em número de acordo com uma distância entre o pixel de predição e um pixel de referência codificado para gerar um sinal de ima- gem de predição e informação do modo de predição; uma etapa para calcular um sinal de erro de predição a partir do sinal de bloco de pixels e o sinal de imagem de predição; uma etapa para selecionar um modo de predição dos vários mo- dos de predição utilizando o sinal de erro de predição; e uma etapa para codificar o sinal de imagem utilizando o sinal de erro de predição baseado no modo de predição selecionado.

2. Método, de acordo com a reivindicação 1, onde na etapa de geração de sinal de predição, o pixel de predição é extrapolado utilizando os pixels de referência aumentando em número com o aumento da distância entre o pixel de predição e o pixel de referência.

3. Método, de acordo com a reivindicação 1 ou 2, adicionalmente compreendendo uma etapa de alterar em um tamanho de bloco de pixels específico, um tamanho de bloco do sinal de bloco de pixels de predição cor- respondendo ao modo de predição.

4. Método, de acordo com a reivindicação 1 ou 2, adicionalmente compreendendo uma etapa para trocar entre a codificação e a não codifica- ção da informação de modo de predição no tamanho do bloco de pixels es- pecífico.

5. Método, de acordo com qualquer uma das reivindicações 1 até 4, onde a etapa de geração de sinal de predição inclui uma etapa de al- terar uma tabela ponderada de coeficiente de filtro utilizado para predição de acordo com uma distância entre o pixel de referência e o pixel de predição.

6. Método, de acordo com qualquer uma das reivindicações 1 até 4, onde a etapa de codificação inclui uma etapa de transformar o sinal de erro de predição em coeficiente de transformação e quantizar o mesmo para gerar dados de coeficiente de transformação.

7. Método, de acordo com qualquer, uma das reivindicações 1 até 4, onde a etapa de geração de sinal de predição inclui uma etapa de tro- car de forma adaptativa entre uso e não uso do sinal de imagem de predição quando extrapolando o pixel de predição em cada unidade de pixel.

8. Método, de acordo com qualquer uma das reivindicações 1 até 4, onde a etapa de geração de sinal de predição inclui uma etapa de a- daptativamente trocar entre uso e não uso do pixel de referência codificado quando extrapolando o pixel de predição em cada unidade de um pixel.

9. Método, de acordo com qualquer uma das reivindicações 1 até 4, caracterizado pelo fato de que a etapa de geração de sinal de predi- ção inclui uma etapa de trocar entre a execução e a não execução de cada intrapredição para extrapolar o pixel de predição em uma direção definida a cada um dos vários modos de predição, utilizando pixels alterados em núme- ro de acordo com a distância entre o pixel de predição e o pixel de referência codificado em cada seqüência, cada imagem ou em cada parte quando ex- trapolando em cada unidade de pixel.

10. Método, de acordo com qualquer uma das reivindicações 1 até 4 e 6, adicionalmente incluindo uma etapa de trocar entre os modos de predição de acordo com um tamanho de bloco de quantização do sinal de bloco de pixels.

11. Método, de acordo com qualquer uma das reivindicações 1 até 4, adicionalmente incluindo uma etapa de trocar entre os modos de pre- dição de acordo com a resolução do sinal de imagem de entrada.

12. Método, de acordo com qualquer uma das reivindicações 1 até 4 e 6, onde a etapa de seleção de modo de predição inclui uma etapa de cálculo de número de bits codificados para calcular o número de bits codifi- cados quando codificando o sinal de erro de predição baseado no modo de predição selecionado, e uma etapa de cálculo de distorção de codificação para decodificação local do sinal de erro de predição baseado no modo de predição selecionado para gerar um sinal de imagem local decodificado e calcular uma distorção de codificação representando uma diferença entre a imagem local decodificada e o sinal de imagem de entrada.

13. Método, de acordo com qualquer uma das reivindicações 1 até 4 e 6, onde a etapa de geração de sinal de predição inclui as etapas de alterar um procedimento para geração de pixel de predição de acordo com uma direção de predição prescrita pelo modo de predição quando extrapo- lando em cada unidade de um pixel, e salvando temporariamente o pixel de 1CJ referência codificado e o pixel de predição extrapolado em uma memória para uso para a próxima predição.

14. Método de decodificação de imagem, compreendendo: uma etapa de decodificar um sinal de imagem de entrada codifi- cado para gerar um sinal de imagem decodificado incluindo a informação de modo de predição; uma etapa de alterar o número de pixels de referência para uso na predição e um procedimento para geração de pixel de predição de acordo com um modo de predição selecionado baseado na informação de modo de predição do sinal de imagem decodificado e uma distância entre um pixel de referência codificado e um pixel de predição; uma etapa de geração de sinal de imagem de predição para ge- rar um sinal de imagem de predição por intrapredição para extrapolar o sinal de imagem decodificado em cada unidade de um pixel; uma etapa de geração de sinal de erro de predição para gerar um sinal de erro de predição baseado no sinal de imagem decodificado; e uma etapa de geração de imagem reconstruída para gerar uma imagem reconstruída pela adição do sinal de imagem de predição com o sinal de erro de predição.

15. Método, de acordo com a reivindicação 14, adicionalmente incluindo uma etapa de seleção de tamanho de bloco para alteração em um tamanho de bloco de pixel específico de um tamanho do bloco de pixel de predição correspondendo ao modo de predição para todos os modos de predição.

16. Método, de acordo com a reivindicação 14, adicionalmente incluindo uma etapa de seleção de informação de modo para predizer um modo de predição e trocar entre a decodificação e a não decodificação da informação de modo de predição predito em um tamanho específico de blo- co de pixels.

17. Método, de acordo com qualquer uma das reivindicações 14 até 16, onde a etapa de geração de sinal de predição inclui uma etapa para alterar uma tabela ponderada de um coeficiente de filtro para uso na predi- ção de acordo com a distância entre o pixel de referência e o pixel de predi- ção quando implementando a intrapredição para executar extrapolação em cada unidade de um pixel.

18. Método, de acordo com qualquer uma das reivindicações 14 até 16, onde a etapa de geração de sinal de erro de predição inclui uma eta- pa de retirada de quantização / transformação inversa para executar a reti- rada de quantização baseada no coeficiente decodificado e a transformação inversa do coeficiente de transformação com. quantização retirada para gerar o sinal de erro de predição.

19. Método, de acordo com qualquer uma das reivindicações 14 até 16, onde a etapa de geração de sinal de imagem de predição inclui uma etapa para trocar de forma adaptável entre o uso e o não uso do sinal de imagem de predição predito.

20. Método, de acordo com qualquer uma das reivindicações 14 até 16, onde a etapa de geração de sinal de predição inclui uma etapa para trocar de forma adaptável entre o uso e o não uso da imagem de referência decodificada.

21. Método, de acordo com qualquer uma das reivindicações 14 até 16, onde a etapa de geração de sinal de predição inclui uma etapa para trocar entre a execução e a não execução da intrapredição de acordo com a reivindicação 13 para cada seqüência, cada imagem ou cada parte.

22. Método, de acordo com qualquer uma das reivindicações 14 até 16, adicionalmente incluindo uma etapa para trocar entre os modos de predição de acordo com um valor pequeno ou com um valor grande de um parâmetro de quantização do sinal de bloco de imagem.

23. Método, de acordo com qualquer uma das reivindicações 14 até 16, adicionalmente incluindo uma etapa para trocar entre os modos de predição de acordo com uma alta resolução ou uma baixa resolução do sinal de imagem de entrada.

24. Método, de acordo com qualquer uma das reivindicações 14 até 16, onde a geração do sinal de predição inclui as etapas de alterar um procedimento para geração de pixel de predição de acordo com.uma direção de predição prescrita pelo modo de predição quando executando a extrapo- lação em cada unidade de um pixel, e salvar temporariamente o pixel de re- ferência codificado e o pixel de predição extrapolado em uma memória para uso para a próxima predição.

25. Aparelho de codificação de imagem, compreendendo: um divisor de imagem para dividir um sinal de imagem de entra- da correspondendo a uma imagem em vários sinais de bloco de pixels; um gerador de sinal de predição para gerar um sinal de imagem de predição e a informação de modo de predição para executar cada intra- predição para extrapolar um pixel de predição de acordo com uma direção definida em todos os vários modos de predição utilizando pixels de referên- cia alterados em número de acordo com uma distância entre o pixel de pre- dição e um pixel de referência codificado; um seletor para selecionar um modo de predição dos vários mo- dos de predição utilizando o sinal de erro de predição calculado a partir do sinal de bloco de pixels e do sinal de imagem de predição; e um codificador para codificar o sinal de imagem utilizando o sinal de erro de predição baseado no modo de predição selecionado.

26. Aparelho de decodificação de imagem, compreendendo: um decodificador para decodificar um sinal de imagem de entra- da codificado; um gerador de sinal de predição para gerar um sinal de imagem de predição pela alteração do número de pixels de referência para uso na predição e um procedimento para geração de pixel de predição de acordo com um modo de predição selecionado baseado na informação de modo de predição do sinal de imagem decodificado e em uma distância entre o pixel de referência codificado e um pixel de predição, e executar a intrapredição para executar a extrapolação em cada unidade de um pixel; um gerador para gerar um sinal de erro de predição baseado no sinal de imagem decodificado; e um gerador para gerar uma imagejn reconstruída pela adição do sinal de imagem de predição com o sinal de erro de predição.

27. Programa de codificação de vídeo para causar que um com- putador execute comandos um comando para dividir um sinal de imagem de entrada corres- pondendo a uma imagem em vários sinais de bloco de pixels; um comando para executar cada intrapredição para extrapolar um pixel de predição de acordo com uma direção definida para todos os mo- dos de predição utilizando pixels de referência alterados em número de a- cordo com uma distância entre o pixel de predição e um pixel de referência codificado para gerar um sinal de imagem de predição e a informação de modo de predição; um comando para calcular um sinal de erro de predição a partir do sinal de bloco de pixels e do sinal de imagem de predição; um comando para selecionar um modo de predição dentre os vários modos de predição utilizando o sinal de erro de predição; e um comando para codificar o sinal de imagem utilizando o sinal de erro de predição baseado no modo de predição selecionado.

28. Programa de decodificação de vídeo para causar que um computador execute um comando para decodificar um sinal de imagem de entrada codificado para gerar um sinal de imagem decodificado incluindo a informà- ção de modo de predição; um comando para alterar o número de pixels de referência para uso na predição e um procedimento para geração de pixel de predição de acordo com um modo de predição selecionado baseado na informação de modo de predição do sinal de imagem decodificado e em uma distância en- tre um pixel de referência codificado e um pixel de predição; um comando para gerar um, sinal de imagem de predição pela intrapredição para extrapolar o sinal de imagem decodificado em cada uni- dade de um pixel; um comando para gerar um sinal de erro de predição baseado no sinal de imagem decodificadp; e um comando para gerar uma imagem reconstruída pela adição do sinal de imagem de predição com o sinal de erro de predição.