BRPI0616407B1 - Codificação/decodificação de vídeo escalonável h.264 com região de interesse - Google Patents

Codificação/decodificação de vídeo escalonável h.264 com região de interesse Download PDF

Info

Publication number
BRPI0616407B1
BRPI0616407B1 BRPI0616407-2A BRPI0616407A BRPI0616407B1 BR PI0616407 B1 BRPI0616407 B1 BR PI0616407B1 BR PI0616407 A BRPI0616407 A BR PI0616407A BR PI0616407 B1 BRPI0616407 B1 BR PI0616407B1
Authority
BR
Brazil
Prior art keywords
slices
enhancement layer
layer
coded
groups
Prior art date
Application number
BRPI0616407-2A
Other languages
English (en)
Inventor
Peng Yin
Jill MacDonald Boyce
Purvin Bibhas Pandit
Original Assignee
Interdigital Vc Holdings, Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Interdigital Vc Holdings, Inc filed Critical Interdigital Vc Holdings, Inc
Publication of BRPI0616407A2 publication Critical patent/BRPI0616407A2/pt
Publication of BRPI0616407B1 publication Critical patent/BRPI0616407B1/pt

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/37Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability with arrangements for assigning different transmission priorities to video input data or to video coded data

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

codificação/decodificação de vídeo escalonável h.264 com região de interesse. trata-se de um codificador, um decodificador, métodos de codificação e decodificação correspondentes, estrutura de sinais de vídeo e meios de armazenamento para codificação e decodificação de vídeo escalonável. um codificador de video escalonável inclui um codificador (100) para codificar uma imagem a fim de formar um fluxo de bits da camada de base e um fluxo de bits da camada de aperfeiçoamento. o fluxo de bits da camada de base e o fluxo de bits da camada de aperfeiçoamento são formados dividindo a imagem em vários blocos de imagem, agrupando os vários blocos de imagem em um ou mais grupos de fatias no fluxo de bits da camada de base e em dois ou mais grupos de fatias no fluxo de bits da camada de aperfeiçoamento, codificando todos do um ou mais grupos de fatias no fluxo de bits da camada de base e menos do que todos dos dois ou mais grupos de fatias na camada de aperfeiçoamento, de modo que pelo menos um grupo de fatias dentre os dois ou mais grupos de fatias seja intencionalmente não-codificado no fluxo de bits da camada de aperfeiçoamento, codificando um elemento de sintaxe em um cabeçalho para indicar o pelo menos um grupo de fatias intencionalmente não-codificado na camada de aperfeiçoamento.

Description

REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS
Este pedido reivindica o beneficio do Pedido US Provisório de No. de Série 60/725.700, depositado em 12 de outubro de 2005 e intitulado "METHOD AND APPARATUS FOR SCALABLE VIDEO ENCODING AND DECODING", incorporado a este documento na integra e a titulo de referenda.
CAMPO DA INVENÇÃO
Em geral, a presente invenção refere-se à codificação e decodificação de videos, mais especificamente, a urn método e aparelho para codificação e decodificação de video escalonável.
ANTECEDENTES DA INVENÇÃO
A escalabilidade de regiões de interesse (ROI) é uma característica essencial para algumas aplicações de co- dificaçào/decodificação de video escalonável. Os usuários podem desejar ter diferentes escalabilidades espaci- al/temporal/de qualidade dentro e fora das ROIs.
A ordenação de macroblocos flexível (FMO) foi discutida para implementar o recurso de ROI. O padrão de Codi- ficação/Decodificação de Vídeo Avançada (AVC) Parte 10 do Grupo de Peritos em Imagens em Movimento-4 (MPEG-4) da Organização Internacional de Normalização Técnica/Comissão Internacional Eletrotécnica (ISO/IEC)/padrão H.264 da União Internacional de Comunicações, Setor de Comunicações (ITU-T) (doravante referido como "padrão MPEG4/H.264" ou simplesmente "padrão H.264") exige que cada macrobloco na imagem seja incluído em um grupo de fatias, e que todos os grupos de fatias sejam codificados/decodificados em imagens codificadas primárias (embora não seja necessário para imagens redundantes) . O padrão H.264 não permite a ausência de quaisquer grupos de fatias, o que significa que, mesmo para os grupos de fatias que não incluem ROIs, ainda precisamos codificar esses grupos de fatias e enviá-los para a rede. Pode-se a- firmar que o codificador possui a opção de controlar os bits para os macroblocos fora da ROI. Por exemplo, em uma imple-mentação da técnica anterior, o codificador pode codificar todos os macroblocos fora de ROIs para serem do modo BL__SKIP ou INTRA_BL. Embora os bits necessários para sinalizar o modo BL-SKIP ou INTRA_BL possam ser pequenos, o codificador ainda tem esforço extra para codificá-los. Com maior importância, a codificação de não-ROIs requer unidades NAL. extras e, consequentemente, sobrecarga extra da taxa de bits. Por exemplo, nos casos de uma divisão ROI versus não-ROI de (1/4 contra %) e contra *á) para uma camada de base de um quarto de formato intermediário comum (QCIF) e uma camada de a- perfeiçoamento de formato intermediário comum (CIF) (30fps), a sobrecarga de taxa de bits para transmitir o modo INTRA_BL para a região não-ROI na camada de aperfeiçoamento pelo pro-tocolo de transporte em tempo real (RTP) é aproximadamente calculada em 12kbps e 9kbps, respectivamente. Ao mesmo tempo, ela aumenta a carga sobre o roteador para analisar todas essas unidades NAL. Além disso, o decodificador ainda preci-sa analisar os fluxos de bits para não-ROIs. Deve-se observar que, no Joint Scalable Video Model (JSVM) Versão 3.0, suportando o modo INTRA_BL para todos os macroblocos na camada de aperfeiçoamento, independente dos tipos dos macrob-locos na camada de base, é necessária a decodificação em múltiplos laços, que pode não ser permitida para alguns perfis. Essas restrições limitam o uso do modo INTRA_BL, caso o codificador suporte apenas a decodificação em único laço. Sendo assim, no presente momento, o JSVM Versão 3.0 não permite o uso do modo INTRA_BL para todos os MBs em não-ROI, seja em decodificação em múltiplos o em único laço.
SUMÁRIO DA INVENÇÃO
Esses e outros obstáculos e desvantagens da técnica anterior são tratados pela presente invenção, que é direcionada a um método e aparelho para codificação e decodificação de video escalonável.
De acordo com um aspecto da presente invenção, é proposto um codificador de video escalonável. 0 codificador de video escalonável inclui um codificador para codificar uma imagem a fim de formar um fluxo de bits de camada de base e um fluxo de bits de camada de aperfeiçoamento. O fluxo de bits da camada de base e o fluxo de bits da camada de a- perfeiçoamento são formados dividindo a imagem em vários blocos de imagem, agrupando os vários blocos de imagem em um ou mais grupos de fatias no fluxo de bits da camada de base e em dois ou mais grupos de fatias no fluxo de bits da camada de aperfeiçoamento, codificando todos do um ou mais grupos de fatias no fluxo de bits da camada de base e menos do que todos dos dois ou mais grupos de fatias na camada de a- perfeiçoamento, de modo que pelo menos um grupo de fatias dentre os dois ou mais grupos de fatias seja intencionalmente não-codificado no fluxo de bits da camada de aperfeiçoa-mento, codificando um elemento de sintaxe em um cabeçalho para indicar o pelo menos um grupo de fatias intencionalmente não-codifiçado na camada de aperfeiçoamento.
De acordo com outro aspecto da presente invenção, é proposto um método para codificação de video escalonável. O método inclui codificar uma imagem a fim de formar um fluxo de bits de camada de base e um fluxo de bits de camada de aperfeiçoamento. A etapa de codificação inclui dividir a i- magem em vários blocos de imagem. A etapa de codificação também inclui agrupar os vários blocos de imagem em um ou mais grupos de fatias no fluxo de bits da camada de base e em dois ou mais grupos de fatias no fluxo de bits da camada de aperfeiçoamento. A etapa de codificação inclui ainda codificar todos do um ou mais grupos de fatias no fluxo de bits da camada de base e menos do que todos dos dois ou mais grupos de fatias na camada de aperfeiçoamento, de modo que pelo menos um grupo de fatias dentre os dois ou mais grupos de fatias seja intencionalmente não-codificado no fluxo de bits da camada de aperfeiçoamento. A etapa de codificação adicionalmente inclui codificar um elemento de sintaxe em um cabeçalho a fim de indicar o pelo menos um grupo de fatias intencionalmente não-codificado na camada de aperfeiçoamento .
De acordo com ainda outro aspecto da presente invenção, é proposto um decodificador de video escalonável. 0 decodificador de video escalonável inclui um decodificador para decodificar um fluxo de bits da camada de base e um fluxo de bits da camada de aperfeiçoamento. O fluxo de bits da camada de base e o fluxo de bits da camada de aperfeiçoamento são decodificados pela leitura de um elemento de sintaxe que indica que pelo menos um de vários grupos de fatias é intencionalmente não-codifiçado na camada de aperfeiçoamento; pela decodificação do fluxo de bits da camada de a- perfeiçoamento usando apenas informações da camada de base para o pelo menos um de vários grupos de fatias indicados pelo elemento de sintaxe; e pela decodificação de quaisquer dos vários grupos de fatias restantes na camada de aperfeiçoamento usando informações da camada de aperfeiçoamento.
De acordo com ainda outro aspecto da presente invenção,. é proposto um método para decodificação de video es- calonável. O método inclui decodificar um fluxo de bits da camada de base e um fluxo de bits da camada de aperfeiçoa-mento pela leitura de um elemento de sintaxe que indica que pelo menos um de vários grupos de fatias é intencionalmente não-codifiçado na camada de aperfeiçoamento; pela decodifi- cação do fluxo de bits da camada de base usando apenas informações da camada de base para o pelo menos um de vários grupos de fatias indicados pelo elemento de sintaxe; e pela decodificação de quaisquer dos vários grupos de fatias restantes na camada de aperfeiçoamento usando informações da camada de aperfeiçoamento.
De acordo com um aspecto adicional da presente invenção, é proposta uma estrutura de sinal de video para codificação de video escalonável. A estrutura de sinal de vi- deo inclui uma imagem codificada a fim de formar um fluxo de bits da camada de base e um fluxo de bits da camada de aperfeiçoamento. 0 fluxo de bits da camada de base e o fluxo de bits da camada de aperfeiçoamento são formados dividindo a imagem em vários blocos de imagem, agrupando os vários blocos de imagem em um ou mais grupos de fatias no fluxo de bits da camada de base e em dois ou mais grupos de fatias no fluxo de bits da camada de aperfeiçoamento, codificando todos do um ou mais grupos de fatias no fluxo de bits da camada de base e menos do que todos dos dois ou mais grupos de fatias na camada de aperfeiçoamento, de modo que pelo menos um grupo de fatias dentre os dois ou mais grupos de fatias seja intencionalmente não-codificado no fluxo de bits da camada de aperfeiçoamento, codificando um elemento de sintaxe em um cabeçalho para indicar o pelo menos um grupo de fatias intencionalmente não-codificado na camada de aperfeiçoamento.
De acordo com outro aspecto adicional da presente invenção, é proposto um meio de armazenamento com dados de sinal de vídeo escalonável codificados nele. 0 meio de armazenamento inclui uma imagem codificada a fim de formar um fluxo de bits da camada de base e um fluxo de bits da camada de aperfeiçoamento. 0 fluxo de bits da camada de base e o fluxo de bits da camada de aperfeiçoamento são formados dividindo a imagem em vários blocos de imagem, agrupando os vários blocos de imagem em um ou mais grupos de fatias no fluxo de bits da camada de base e em dois ou mais grupos de fatias no fluxo de bits da camada de aperfeiçoamento, codi- ficando todos do um ou mais grupos de fatias no fluxo de bits da camada de base e menos do que todos dos dois ou mais grupos de fatias na camada de aperfeiçoamento, de modo que pelo menos um grupo de fatias dentre os dois ou mais grupos de fatias seja intencionalmente não-codifiçado no fluxo de bits da camada de aperfeiçoamento, codificando um elemento de sintaxe em um cabeçalho para indicar que o pelo menos um grupo de fatias intencionalmente não-codifiçado na camada de aperfeiçoamento.
Esses e outros aspectos, características e vantagens da presente invenção transparecerão por meio da descrição detalhada das concretizações exemplificativas a seguir, que deverá ser lida junto com os desenhos em anexo.
BREVE DESCRIÇÃO DOS DESENHOS
A presente invenção pode ser melhor compreendida de acordo com as figuras exemplificativas a seguir, nas quais:
A FIG. 1 ilustra um diagrama de blocos para um codificador Joint Scalable Video Model (JSVM) 3.0, ao qual os presentes princípios podem ser aplicados;
A FIG. 2 ilustra um diagrama de blocos para um de- codificador exemplificativo, ao qual os presentes princípios podem ser aplicados;
A FIG. 3 ilustra um diagrama de fluxo de dados para um método exemplificative para codificação de vídeo escalonável conjunta com regiões de interesse de acordo com uma concretização dos presentes princípios; e
A FIG. 4 ilustra um diagrama de fluxo de dados para um método exemplificativo para decodificação de vídeo es- calonável conjunta com regiões de interesse de acordo com uma concretização dos presentes princípios.
DESCRIÇÃO DETALHADA
A presente invenção está voltada para um método e aparelho para codificação e decodificação de vídeo escaloná- vel.
A presente descrição ilustra os princípios da presente invenção. Sendo assim, apreciar-se-á que os versados na técnica serão capazes de descobrir várias combinações que, embora não explicitamente descritas ou ilustradas neste documento, concretizam os princípios da invenção e estão incluídas dentro de sua essência e âmbito.
Todos os exemplos e linguagens condicionais relatados no presente documento são concebidos para, propósitos pedagógicos a fim de auxiliar o leitor a compreender os princípios da invenção e os conceitos contribuídos pelo inventor para favorecer a técnica, e devem ser interpretados sem restrições a tais exemplos e condições especificamente relatados.
Além disso, todas as declarações, neste documento, relatando princípios, aspectos e concretizações da invenção, bem como exemplos específicos dela, devem abranger tanto e- quivalentes estruturais quanto funcionais dela. Além disso, pretende-se que tais equivalentes incluam tanto equivalentes atualmente conhecidos quanto equivalentes desenvolvidos no futuro, isto é, quaisquer elementos desenvolvidos que desempenhem a mesma função, independente da estrutura.
Sendo assim, por exemplo, será apreciado pelos versados na técnica que os diagramas de blocos apresentados neste documento representam visualizações conceituais do sistema de circuitos ilustrativo que concretiza os princípios da invenção. De maneira semelhante, apreciar-se-á que quaisquer fluxogramas, diagramas de fluxo de dados, diagramas de transição de estados, pseudocódigos, entre outros, representam vários processos que podem ser substancialmente representados em meios legíveis por computador e, portanto, executados por um computador ou processador, quer tal computador ou processador seja ilustrado explicitamente ou não.
As funções dos vários elementos ilustrados nas figuras podem ser realizadas pelo uso de hardware dedicado, bem como de hardware capaz de executar softwares relacionados ao software apropriado. Quando realizadas por um proces-sador, as funções podem ser realizadas por um único processador dedicado, por um único processador compartilhado ou por vários processadores individuais, alguns dos quais podem ser compartilhados.
Além disso, o uso explícito do termo "processador" ou "controlador" não deve ser interpretado como referência exclusiva a hardware capaz de executar softwares e pode incluir implicitamente, sem restrição, hardware processador de sinais digitais ("DSP"), memória somente para leitura ("ROM") para armazenar softwares, memória de acesso aleatório ("RAM") e armazenamentos não voláteis.
Também podem ser incluídos outros hardwares, convencionais e/ou personalizados. De maneira semelhante, quaisquer botões ilustrados nas figuras são meramente conceituais. Sua função pode ser realizada pela operação de ló-gica de programa, por meio de lógica dedicada, pela interação de controle de programa e lógica dedicada, ou até mesmo manualmente, a técnica especifica sendo selecionável pelo implementador como mais especificamente compreendido com ba-se no contexto.
Nas reivindicações deste documento, qualquer elemento expresso como um meio para desempenhar uma função específica tem a intenção de abranger qualquer forma de desempenhar tal função, incluindo, por exemplo: a) uma combinação de elementos de circuito que desempenham tal função ou b) softwares de qualquer forma, incluindo, portanto, firmwares, microcódigos ou similares, combinados com o sistema de circuitos apropriado para executar tal software para desempenhar a função. A invenção, conforme definida por tais reivindicações, consiste no fato de que as funcionalidades oferecidas pelos vários meios relatados são combinadas e unidas da maneira que as reivindicações prescrevem. Assim, considera-se que qualquer meio capaz de oferecer tais funcionalidades é equivalente aos ilustrados no presente documento.
Com relação à FIG. 1, um codificador Joint Scalable Video Model Versão 3.0 (doravante referido como "JSVM3.0") exemplificativo, ao qual a presente invenção pode ser aplicada, é, em geral, indicado pelo número de referência 100. O codificador JSVM3.0 100 usa três camadas espaciais e filtragem temporal com compensação de movimento. O codificador JSVM 100 inclui um decimador bidirecional (2D) 104, um decimador 2D 106 e um módulo de filtragem temporal com compensação de movimento (MCTF) 108, cada um contendo uma entrada para receber dados de sinal de video 102.
Uma saída do decimador 2D 106 é conectada, em comunicação de sinais, a uma entrada de um módulo MCTF 110. Uma primeira saída do módulo MCTF 110 é conectada, em comunicação de sinais, a uma entrada de um codificador de movi-mento 112 e uma segunda saída do módulo MCTF 110 é conectada, em comunicação de sinais, a uma entrada de um módulo de predição 116. Uma primeira saída do codificador de movimento 112 é conectada, em comunicação de sinais, a uma primeira entrada de um multiplexador 114. Uma segunda saída do codificador de movimento 112 é conectada, em comunicação de sinais, a uma primeira entrada de um codificador de movimento 124. Uma primeira saída do módulo de predição 116. é conectada, em comunicação de sinais, a uma entrada de um transformador espacial 118. Uma saída do transformador espacial 118 é conectada, em comunicação de sinais, a uma segunda entrada do multiplexador 114. Uma segunda saída do módulo de predição 116 é conectada, em comunicação de sinais, a uma entrada de um interpolador 120. Uma saída do interpolador é conectada, em comunicação de sinais, a uma primeira entrada de um módulo de predição 122. Uma primeira saída do módulo de predição 122 é conectada, em comunicação de sinais, a uma entrada de um transformador espacial 126. Uma saída do transformador espacial 126 é conectada, em comunicação de sinais, à segunda entrada do multiplexador 114. Uma segunda saída do módulo de predição 122 é conectada, em comunicação de si- nais, a uma entrada de um interpolador 130. Uma saida do in- terpolador 130 é conectada, em comunicação de sinais, a uma primeira entrada de um módulo de predição 134. Uma saida do módulo de predição 134 é conectada, em comunicação de sinais, a um transformador espacial 136. Uma saida do transformador espacial é conectada, em comunicação de sinais, à segunda entrada de um multiplexador 114.
Uma saída do decimador 2D 104 é conectada, em comunicação de sinais, a uma entrada de um módulo MCTF 128. Uma primeira saída do módulo MCTF 128 é conectada, em comunicação de sinais, a uma segunda entrada do codificador de movimento 124. Uma primeira saída do codificador de movimento 124 é conectada, em comunicação de sinais, à primeira entrada do multiplexador 114. Uma segunda saída do codificador de movimento 124 é conectada, em comunicação de. sinais, a uma primeira entrada de um codificador de movimento 132. Uma segunda saída do módulo MCTF 128 é conectada, em comunicação de sinais, a uma segunda entrada do módulo de predição 122.
Uma primeira saída do módulo MCTF 108 é conectada, em comunicação de sinais, a uma segunda entrada do codificador de movimento 132. Uma saída do codificador de movimento 132 é conectada, em comunicação de sinais, à primeira entrada do multiplexador 114. Uma segunda saída do módulo MCTF 108 é conectada, em comunicação de sinais, a uma segunda entrada do módulo de predição 134. Uma saída do multiplexador 114 fornece um fluxo de bits de saída 138.
Para cada camada espacial, é realizada uma decom posição temporal com compensação de movimento. Essa decompo- sição propicia escalabilidade temporal. As informações de movimento das camadas espaciais inferiores podem ser usadas para predição de movimento nas camadas superiores. Para a codificação de textura, a predição espacial entre camadas espaciais sucessivas pode ser aplicada para remover redundâncias. O sinal residual resultante da predição intra ou da predição inter com compensação de movimento é codificado em transformada. Um residual da camada de base de qualidade o- ferece qualidade de reconstrução minima em cada camada espacial. Essa camada de base de qualidade pode ser codificada em um fluxo compativel com o padrão H.264, se nenhuma predição intercamadas for aplicada. Para escalabilidade de qualidade, as camadas de aperfeiçoamento de qualidade são adicionalmente codificadas. Essas camadas de aperfeiçoamento podem ser escolhidas tanto para oferecer escalabilidade de qualidade de granularidade (SNR) fina ou grossa.
Voltando-se para a FIG. 2, um codificador de video escalonável exemplificative, ao qual a presente invenção pode ser aplicada, é indicado, em geral, pelo número de referência 200. Uma entrada de um demultiplexador 202 é disponível como uma entrada para o decodificador de video escalonável 200 para receber um fluxo de bits escalonável. Uma primeira saida do demultiplexador 202 é conectada, em comunicação de sinais, a uma entrada de um decodificador de entropia escalonável SNR de transformada espacial inversa 204. Uma primeira saida do decodificador de entropia escalonável SNR de transformada espacial inversa 204 é conectada, em comunicação de sinais, a uma primeira entrada de um módulo de pre- dição 206. Uma saída do módulo de predição 206 é conectada, em comunicação de sinais, a uma primeira entrada de um módulo MCTF inverso 208.
Uma segunda saída do decodificador de entropia es- calonável SNR de transformada espacial inversa 204 é conectada, em comunicação de sinais, a uma primeira entrada de um decodificador de vetor de movimento (MV) 210. Uma saída do decodificador MV 210 é conectada, em comunicação de sinais, a uma segunda entrada de um módulo MCTF inverso 208.
Uma segunda saída do demultiplexador 202 é conectada, em comunicação de sinais, a uma entrada de um decodificador de entropia escalonável SNR de transformada espacial inversa 212. Uma primeira saída do decodificador de entropia escalonável SNR de transformada espacial inversa 212 é conectada, em comunicação de sinais, a uma primeira entrada de um módulo de predição 214. Uma primeira saída do módulo de predição 214 é conectada, em comunicação de sinais, a uma entrada de um módulo de interpolação 216. Uma saída do módulo de interpolação 216 é conectada, em comunicação de sinais, a uma segunda entrada do módulo de predição 206. Uma saída do módulo de predição 214 é conectada, em comunicação de sinais, a uma primeira entrada de um módulo MCTF inverso 218.
Uma segunda saída do decodificador de entropia escalonável SNR de transformada espacial inversa 212 é conectada, em comunicação de sinais, a uma primeira entrada de um decodificador MV 220. Uma primeira saída do decodificador MV 220 é conectada, em comunicação de sinais, a uma segunda en- trada do decodificador MV 210. Uma segunda saida do decodi- ficador MV 220 é conectada, em comunicação de sinais, a uma segunda entrada do módulo MCTF inverso 218.
Uma terceira saida do demultiplexador 202 é conectada, em comunicação de sinais, a uma entrada de um decodi- ficador de entropia escalonável SNR de transformada espacial inversa 222. Uma primeira saída do decodificador de entropia escalonável SNR de transformada espacial inversa 222 é conectada, em comunicação de sinais, a uma entrada de um módulo de predição 224. Uma primeira saída do módulo de predição 224 é conectada, em comunicação de sinais, a uma entrada de um módulo de interpolação 226. Uma saída do módulo de interpolação 226 é conectada, em comunicação de sinais, a uma segunda entrada do módulo de predição 214.
Uma saída do módulo de predição 224 é conectada, em comunicação de sinais, a uma primeira entrada de um módulo MCTF inverso 228. Uma segunda saída do decodificador de entropia escalonável SNR de transformada espacial inversa 222 é conectada, em comunicação de sinais, a uma entrada de um decodificador MV 230. Uma primeira saída do decodificador MV 230 é conectada, em comunicação de sinais, a uma segunda entrada do decodificador MV 220. Uma segunda saída do deco- dificador MV 230 é conectada, em comunicação de sinais, a uma segunda entrada do módulo MCTF inverso 228.
Uma saída do módulo MCTF inverso 228 é disponível como uma saída do decodificador 200 para emitir um sinal de camada 0. Uma saída do módulo MCTF inverso 218 é disponível como uma saída do decodificador 200 para emitir um sinal de camada 1. Uma saída do módulo MCTF inverso 208 é disponível como uma saída do decodificador 200 para emitir um sinal de camada 2.
A FMO (ordenação de macroblocos flexível) foi discutida para implementar o recurso de escalabilidade ROI (região de interesse). A especificação H.264/AVC não permite a ausência de qualquer grupo de fatias, o que significa que até mesmo grupos de fatias que incluem não-ROIs ainda preci-sam ser codificados e enviados para uma rede. De acordo com uma concretização dos presentes princípios, esse requisito é reduzido e passamos a permitir a ausência de grupos de fatias nas camadas de aperfeiçoamento, bem como definimos um comportamento padronizado para fatias intencionalmente ausentes . A camada de base continua compatível com o padrão H.264 .
Sendo assim, de acordo com uma concretização dos presentes princípios, propomos reduzir os requisitos do padrão H.264 a fim de permitir grupos de fatias ausentes na camada de aperfeiçoamento para a aplicação de ROI. Essa a- bordagem oferece pelo menos as seguintes vantagens: (2) economia de taxa de bits; (b) redução da carga sobre o roteador; (c) simplificação da análise para o decodificador; e (d) economia de codificação para o codificador para regiões não-ROI.
Se permitirmos grupos de fatias ausentes na camada de aperfeiçoamento, um problema imediato que ocorre é de que forma o decodificador pode determinar se um grupo de fatias ausente está intencionalmente não-codifiçado pelo codifica- dor ou está ausente devido a falhas de rede. Se um grupo de fatias é intencionalmente omitido, então, de acordo com os presentes princípios, o decodificador oferece um comportamento padronizado, de modo que o decodificador ainda possa ter a capacidade de decodificar a imagem inteira (ROI + não- ROI) , a saída do processo de decodificação se comporta de maneira consistente entre diferentes decodíficadores, e a exatidão de bits do codificador/decodificador pode ser mantida. No entanto, se um grupo de fatias estiver ausente devido à falhas de rede, é possível aplicar um encobrimento de falha não-padronizado, que depende da aplicação.
Para esclarecer a ambiguidade de se um grupo de fatias é voluntária ou involuntariamente ausente, propomos adicionar um sinalizador no sequence_parameter_set(), a saber, missing_slice_groups_allowed_flag, conforme ilustrado na TABELA 1. Em particular, a TABELA 1 ilustra a sintaxe RBSP do conjunto de parâmetros de sequência. A fim de suportar todos os slice_group_map_types, precisamos indicar quais grupos de fatias estão faltando para slice_group__map_type igual a 0,1 e 6. Para outros casos, podemos sempre pressupor que apenas o último grupo de fatias está ausente, sendo assim, não é necessária nenhuma sintaxe adicional. Para o caso mais comumente esperado de escalabilidade ROI retangular, slice_group_map_type = = 2 será selecionado e, então, é adicionada uma pequena sintaxe em picture_parameter_set(). Uma sintaxe completa é ilustrada na TABELA 2. TABELA 1
Figure img0001
Figure img0002
TABELA 2
Figure img0003
Figure img0004
Figure img0005
missão de grupos de fatias ausentes no fluxo de bits. Quando missing_slice_groups_allowed_flag não está presente, deve-se pressupor que ele é igual a 0. Quando mis- sing_slice_groups_allowed_flag é igual a 1, então o "mesmo mapeamento de grupo de fatias" tem de existir entre a camada de base e a camada de aperfeiçoamento. O "mesmo mapeamento de grupo de fatias" significa o mesmo num_slice_groups_minus_l e o mesmo slice_group_map_type. num_missing_slice__groups especifica o número de grupos de fatias ausentes para uma imagem. missing_slice_group_id[ i ] identifica um grupo de fatias ausente da i-ésima unidade de mapa de grupo de fatias ausente em ordem de varredura por rastreio.
Com a nova sintaxe proposta, o decodificador pode decidir se um grupo de fatias na camada de aperfeiçoamento está intencionalmente ausente ou, em vez disso, está ausente devido a uma falha de rede. Ao decidir qual deve ser o comportamento padrão do processo de decodificação para um grupo intencionalmente ausente, deve-se considerar o seguinte: (1) uma vez que um grupo de fatias ausente é aplicado a nâo-ROI na camada de aperfeiçoamento, a qualidade não precisa ser muito alta, mas a qualidade deve ser aceitável; e (2) a complexidade deve ser mantida baixa e o decodificador deve reutilizar a funcionalidade disponível no projeto SVC atual.
Propomos duas possíveis soluções que podem usar o projeto SVC atual: (1) o uso do modo INTRA_BL sem resíduo, isto é, copiar ou aumentar a qualidade da imagem da camada de base; e 2) o uso do modo BL_SKIP sem resíduo. Como consequência, podemos escolher comportamentos padronizados usando qualquer um dos métodos acima para decodificar um grupo de fatias intencionalmente ausente.
Voltando-se para a FIG. 3, um método exemplificative para codificação de video escalonável conjunta com regiões de interesse é indicado, em geral, pelo número de referência 300. O método inclui um bloco inicial 305 que inicia a codificação com as informações de região de interesse (ROI), e passa o controle para um bloco de função 310. O bloco de função 310 cria grupos de fatias dependendo das in-formações ROI, e passa o controle para um bloco de decisão 315. O bloco de decisão 315 determina se a camada atual a ser codificada é ou não é a camada de base. Se a resposta for positiva, então o controle passa para um bloco de função 320. Caso contrário, o controle passa para um bloco de função 325.
O bloco de função 320 codifica todos os grupos de fatias (na camada de base), e passa o controle para um bloco final 370.
O bloco de função 325 mapeia grupos de fatias da camada de base para grupos de fatias da camada de aperfeiço- amento, e passa o controle para um bloco de função 330. 0 bloco de função 330 define missing_slice_groups_allowed_flag igual a um, e passa o controle para um bloco de decisão 335. O bloco de decisão 335 determina se o grupo de fatias atual pertence ou não a uma região de interesse. Se a resposta for positiva, então o controle passa para um bloco de função 340. Caso contrário, o controle passa para um bloco de fun-ção 355.
O bloco de função 340 codifica o grupo de fatias atual usando predição intercamadas, e passa o controle para um bloco de decisão 345.
O bloco de função 355 não codifica o grupo de fatias atual, e passa o controle para um bloco de função 360. O bloco de função 360 incrementa num_missing_slice_groups, e passa o controle para o bloco de decisão 345.
O bloco de decisão 345 determina se num_missing__slice_groups é ou não maior do que um. Se a resposta for positiva, então o controle passa para um bloco de função 350. Caso contrário, o controle passa para o bloco final 370.
O bloco de função 350, para cada grupo de fatias ausente i, indica missing_slice__groups_id [i] , e passa o controle para o bloco final 370.
Voltando-se para a FIG. 4, um método exemplificative para decodificação de video escalonável conjunta com regiões de interesse é indicado, em geral, pelo número de referência 400. O método inclui um bloco inicial 405 que i- nicia a decodificação da camada de aperfeiçoamento, e passa o controle para um bloco de função 410. 0 bloco de função 410 obtém o missing_slice_groups_allowed_flag, e passa o controle para um bloco de função 415. 0 bloco de função 415, para cada grupo de fatias ausente i, indica mis- sing_slice_groups_id[i], e passa o controle para um bloco de função 420. O bloco de função 420 obtém num__missing_slice_groups, e passa o controle para um bloco de decisão 425. 0 bloco de decisão 425 determina se num_missing_slice_groups é ou não maior do que um. Se a resposta for positiva, então o controle passa para um bloco de função 430. Caso contrário, o controle passa para um bloco de decisão 435.
O bloco de função 430, para cada grupo de fatias ausente i, lê missing_slice_groups_id[i] , e passa o controle para o bloco de decisão 435.
O bloco de decisão 435 determina se irá ou não decodificar apenas a região ROI. Se a resposta for positiva, então o controle passa para um bloco de decisão 4 4 0. Caso contrário, o controle passa para um bloco de decisão 450.
O bloco de decisão 440 determina se um grupo de fatias (que inclui a região ROI) é intencionalmente ausente ou não. Se a resposta for positiva, então o controle passa para um bloco de função 445. Caso contrário, o controle passa para um bloco de função 460.
O bloco de função 445 decodifica o próximo grupo de fatias ROI, e passa o controle para um bloco final 480.
O bloco de função 460 oculta o grupo de fatias ROI perdido, e passa o controle para o bloco final 480.
O bloco de decisão 450 determina se o grupo de fatias pertence ou não a uma ROI. Se a resposta for positiva, então o controle passa para um bloco de função 455. Caso contrário, o controle passa para um bloco de decisão 465.
O bloco de função 455 decodifica o grupo de fatias ROI, e passa o controle para um bloco final 480.
O bloco de decisão 465 determina se o grupo de fatias é intencionalmente ausente ou não. Se a resposta for positiva, então o controle passa para um bloco de função 470. Caso contrário, o controle passa para o bloco de função 460.
O bloco de função 470 decodifica esse grupo de fatias na camada de base, e passa o controle para um bloco de função 475. O bloco de função 475 usa o modo INTRA_BL ou o modo BL_SKIP sem resíduo para decodificar esse grupo de fatias na camada de aperfeiçoamento, e passa o controle para o bloco final 480.
Agora será feita uma descrição.de algumas das muitas vantagens/características concomitantes da presente invenção, algumas das quais foram mencionadas acima. Por exemplo, uma vantagem/característica é um codificador de vídeo escalonável. O codificador de vídeo escalonável inclui um codificador para codificar uma imagem a fim de formar um fluxo de bits da camada de base e um fluxo de bits da camada de aperfeiçoamento. O fluxo de bits da camada de base e o fluxo de bits da camada de aperfeiçoamento são formados dividindo a imagem em vários blocos de imagem, agrupando os vários blocos de imagem em um ou mais grupos de fatias no fluxo de bits da camada de base e em dois ou mais grupos de fatias no fluxo de bits da camada de aperfeiçoamento, codificando todos do um ou mais grupos de fatias no fluxo de bits da camada de base e menos do que todos dos dois ou mais grupos de fatias na camada de aperfeiçoamento, de modo que pelo menos um grupo de fatias dentre os dois ou mais grupos de fatias seja intencionalmente não-codifiçado no fluxo de bits da camada de aperfeiçoamento, codificando um elemento de sintaxe em um cabeçalho para indicar o pelo menos um grupo de fatias intencionalmente não-codifiçado na camada de aperfeiçoamento.
Outra vantagem/caracteristica é o codificador de video escalonável conforme descrito acima, em que o fluxo de bits da camada de aperfeiçoamento é formado para suportar pelo menos uma aplicação de região de interesse, de modo que qualquer um dos dois ou mais grupos de fatias na camada de aperfeiçoamento que incluem regiões de interesse seja codificado no fluxo de bits da camada de aperfeiçoamento, ao passo que qualquer um dos dois ou mais grupos de fatias na camada de aperfeiçoamento que estão sem regiões de interesse seja intencionalmente não-codifiçado.
Ainda outra vantagem/caracteristica é o codificador de video escalonável conforme descrito acima, em que o codificador adiciona o elemento de sintaxe com a adição de um campo missing_slice_groups_allowed_flag em um conjunto de parâmetros de seqüência correspondente ao fluxo de bits da camada de aperfeiçoamento.
Além disso, outra vantagem/caracteristica é o co- dificador de vídeo escalonável que adiciona o elemento de sintaxe, conforme descrito acima, em que um mesmo mapeamento de grupos de fatias existe entre o fluxo de bits da camada de aperfeiçoamento e o fluxo de bits da camada de base, quando o campo missing_slice_groups_allowed_flag é igual a 1, o mesmo mapeamento de grupos de fatias relacionado a um campo num_slice_groups_minus_l e slice_group_map_type, res-pectivamente, contendo o mesmo valor para o fluxo de bits da camada de base e o fluxo de bits da camada de aperfeiçoamento .
Ademais, outra vantagem/caracteristica é o codificador de video escalonável, conforme descrito acima, em que o codificador adiciona um campo num_missing_slice_groups em um conjunto de parâmetros de sequência correspondendo ao fluxo de bits da camada de aperfeiçoamento para especificar uma quantidade de grupos de fatias que são intencionalmente não-codificados para a imagem.
Além do mais, outra vantagem/caracteristica é o codificador de video escalonável que adiciona o campo num_missing_slice_groups, conforme descrito acima, em que o codificador adiciona um campo missing_slice_group_id[ i ] em um conjunto de parâmetros de imagem correspondente ao fluxo de bits da camada de aperfeiçoamento a fim de identificar nela pelo menos o grupo de fatias intencionalmente não- codificado de uma i-ésima unidade de mapa do grupo de fatias intencionalmente omitido em ordem de varredura por rastreio para um campo slice_group_map igual a qualquer um dentre 0,1 e 6.
Além disso, outra vantagem/característica é o codificador de video escalonável que adiciona o campo num_missing_slice_groups, conforme descrito acima, em que o codificador atribui a um campo slice_group_map um valor i- gual a qualquer um dentre 2, 3, 4 e 5 a fim de indicar que o último grupo de fatias no fluxo de bits da camada de aperfeiçoamento é o pelo menos um grupo de fatias intencionalmente nâo-codificado.
Essas e outras características e vantagens da presente invenção podem ser facilmente verificadas pelos versados na técnica pertinente com base nos ensinamentos deste documento. Deve-se compreender que os ensinamentos da presente invenção podem ser implementados em várias formas de hardware, software, firmware, processadores de uso especifico ou combinações desses.
Mais preferivelmente, os ensinamentos da presente invenção são implementados como uma combinação de hardware e software. Ademais, o software pode ser implementado como um programa aplicativo incorporado de forma tangível a uma unidade de armazenamento de programas. 0 programa aplicativo pode ser carregado para, e executado por, uma máquina compreendendo qualquer arquitetura adequada. De preferência, a máquina é implementada em uma plataforma de computador com hardwares tal como uma ou mais unidades centrais de processamento ("CPU"), uma memória de acesso aleatório ("RAM") e interfaces de entrada/saída ("I/O"). A plataforma de computador também pode incluir um sistema operacional e código de micro-instrução. Os vários processos e funções descritos neste documento podem ser parte ou do código de micro- instrução ou do programa aplicativo, ou qualquer combinação desses, que pode ser executada por uma CPU. Além disso, várias outras unidades periféricas podem ser conectadas à plataforma de computador, tal como uma unidade de armazenamento de dados adicional e uma unidade de impressão.
Também deve ser compreendido que, já que alguns dos componentes e métodos constituintes do sistema representados nos desenhos em anexo são preferencialmente implementados em software, as conexões reais entre os componentes do sistema ou os blocos de função de processo podem divergir, dependendo da maneira na qual a presente invenção é programada . Dados os ensinamentos neste documento, os versados na técnica pertinente serão capazes de contemplar essas implementações ou configurações, bem como implementações ou configurações similares, da presente invenção.
Embora as concretizações ilustrativas tenham sido descritas com referência aos desenhos em anexo, deve-se compreender que a presente invenção não se restringe a essas concretizações exatas, e que várias alterações e modificações podem ser realizadas pelos versados na técnica pertinente sem divergir do âmbito e da essência da presente invenção. Todas essas alterações e modificações devem ser in- cluidas dentro do âmbito da presente invenção, conforme estabelecido nas reivindicações em anexo.

Claims (18)

1. Aparelho para codificação de video escalonável, CARACTERIZADO por compreender: um codificador para codificar uma imagem para formar uma camada de base e uma camada de aperfeiçoamento dividindo a imagem em vários blocos de imagem e associando os vários blocos de imagem a uma ou mais fatias; codificando todas da uma ou mais fatias para a camada de base e menos do que todas da uma ou mais fatias para a camada de aperfeiçoamento; e codificando um elemento de sintaxe para indicar a pelo menos uma fatia não codificada na camada de aperfeiçoa-mento .
2. Aparelho, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que a camada de aperfeiçoamento é formada para suportar pelo menos uma aplicação de região de interesse, de modo que menos do que todas da uma ou mais fatias para a camada de aperfeiçoamento codificadas na camada de aperfeiçoamento sejam incluídas em grupos de fatias que incluem regiões de interesse, ao passo que a pelo menos uma fatia não codificada na camada de aperfeiçoamento seja incluída em pelo menos um grupo de fatias sem uma região de interesse.
3. Aparelho, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que o elemento de sintaxe é incluído em um cabeçalho.
4. Método de codificação de video escalonável, CARACTERIZADO por compreender: codificar (355) uma imagem para formar uma camada de base e uma camada de aperfeiçoamento, em que a referida etapa de codificar compreende: dividir a imagem em vários blocos de imagem; associar os vários blocos de imagem a uma ou mais fatias; codificar (320, 340, 355) todas da uma ou mais fatias para a camada de base e menos do que todas da uma ou mais fatias para a camada de aperfeiçoamento; e codificar (330) um elemento de sintaxe para indicar a pelo menos uma fatia não codificada na camada de aperfeiçoamento .
5. Método, de acordo com a reivindicação 4, CARA.CTERIZADO pelo fato de que a camada de aperfeiçoamento é formada para suportar pelo menos uma aplicação de região de interesse, de modo que menos do que todas da uma ou mais fatias para a camada de aperfeiçoamento codificadas na camada de aperfeiçoamento sejam incluídas em grupos de fatias que incluem regiões de interesse, ao passo que a pelo menos uma fatia não codificada na camada de aperfeiçoamento seja incluída em pelo menos um grupo de fatias sem uma região de interesse.
6. Método, de acordo com a reivindicação 4, CARACTERIZADO pelo fato de que o elemento de sintaxe é incluído em um cabeçalho.
7. Aparelho para decodificação de video escalonável, CARACTERIZADO por compreender: um decodificador (200) para decodificar uma camada de base e uma camada de aperfeiçoamento analisando um elemento de sintaxe que indica que uma ou mais fatias foram intencionalmente não codificadas na camada de aperfeiçoamento; decodificando para a uma ou mais fatias intencionalmente não codificadas na camada de aperfeiçoamento usando apenas informações da camada de base; e decodificando quaisquer das várias fatias restantes na camada de aperfeiçoamento usando informações da camada de aperfeiçoamento.
8. Aparelho, de acordo com a reivindicação 7, CARACTERIZADO pelo fato de que o elemento de sintaxe é incluído em um cabeçalho.
9. Aparelho, de acordo com a reivindicação 8, CARACTERIZADO pelo fato de que o referido decodificador (200) usa o modo INTRA_BL para decodificar a uma ou mais fatias não codificadas na camada de aperfeiçoamento, independente de se a decodificação em múltiplos laços é permitida em um perfil especifico indicado para a camada de aperfeiçoamento .
10. Aparelho, de acordo com a reivindicação 8, CARACTERIZADO pelo fato de que o referido decodificador (200) usa o modo BL_SKIP para decodificar a uma ou mais fatias não codificadas na camada de aperfeiçoamento.
11. Aparelho, de acordo com a reivindicação 8, CARACTERIZADO pelo fato de que o referido decodificador (200) realiza um método de encobrimento de falhas para encobrir a uma ou mais fatias não codificadas na camada de aperfeiçoamento, quando a uma ou mais fatias não codificadas na camada de aperfeiçoamento são detectadas como ausentes, mas não são especificadas em um conjunto de parâmetros de se- qüência e em um conjunto de parâmetros de imagem correspon-dendo à camada de aperfeiçoamento.
12. Método para decodificação de video escalonável, CARACTERIZADO por compreender: analisar (410) um elemento de sintaxe indicando que uma ou mais fatias foram intencionalmente não codificadas na camada de aperfeiçoamento; decodificar (475), para a uma ou mais fatias in-tencionalmente não codificadas na camada de aperfeiçoamento, usando apenas informações da camada de base; e decodificar (455) quaisquer das várias fatias restantes na camada de aperfeiçoamento, usando informações da camada de aperfeiçoamento.
13. Método, de acordo com a reivindicação 12, CARACTERIZADO pelo fato de que o elemento de sintaxe é incluído em um cabeçalho.
14. Método, de acordo com a reivindicação 12, CARACTERIZADO pelo fato de que o referido decodificador (200) usa o modo INTRA_BL para decodificar a uma ou mais fatias não codificadas na camada de aperfeiçoamento, independente de se a decodificação em múltiplos laços é permitida em um perfil especifico indicado para a camada de aperfeiçoamento .
15. Método, de acordo com a reivindicação 12, CARACTERIZADO pelo fato de que o referido decodificador (200) usa o modo BL_SKIP para decodificar a uma ou mais fatias intencionalmente não codificadas na camada de aperfeiçoamento .
16. Método, de acordo com a reivindicação 12, CARACTERIZADO pelo fato de que o referido decodificador (200) realiza um método de encobrimento de falhas para encobrir a uma ou mais fatias não codificadas na camada de aperfeiçoamento, quando a uma ou mais fatias não codificadas na camada de aperfeiçoamento são detectadas como ausentes, mas não são especificadas em um conjunto de parâmetros de se- qüência, e em um conjunto de parâmetros de imagem correspon-dendo à camada de aperfeiçoamento.
17. Estrutura de sinal de video para codificação de video escalonável, CARACTERIZADA por compreender: uma imagem codificada para formar uma camada de base e uma camada de aperfeiçoamento dividindo a imagem em vários blocos de imagem e associando os vários blocos de imagem a uma ou mais fatias; e em que todas da uma ou mais fatias para a camada de base são codificadas e menos do que todas da uma ou mais fatias para a camada de aperfeiçoamento são codificadas; e um elemento de sintaxe é codificado para indicar a pelo menos uma fatia não codificada na camada de aperfeiçoamento.
18. Meios de armazenamento contendo dados de sinal de video escalonável codificados neles, CARACTERIZADOS por compreender: uma imagem codificada para formar uma camada de base e uma camada de aperfeiçoamento dividindo a imagem em vários blocos de imagem e associando os vários blocos de imagem a uma ou mais fatias; e em que todas da uma ou mais fatias para a camada de base são codificadas e menos do que todas da uma ou mais fatias para a camada de aperfeiçoamento são codificadas; e um elemento de sintaxe é codificado para indicar a pelo menos uma fatia não codificada na camada de aperfeiçoamento
BRPI0616407-2A 2005-10-12 2006-10-03 Codificação/decodificação de vídeo escalonável h.264 com região de interesse BRPI0616407B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US72570005P 2005-10-12 2005-10-12
US60/725.700 2005-10-12
PCT/US2006/038380 WO2007047077A2 (en) 2005-10-12 2006-10-03 Region of interest h .264 scalable video coding

Publications (2)

Publication Number Publication Date
BRPI0616407A2 BRPI0616407A2 (pt) 2011-06-21
BRPI0616407B1 true BRPI0616407B1 (pt) 2020-08-11

Family

ID=37890473

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0616407-2A BRPI0616407B1 (pt) 2005-10-12 2006-10-03 Codificação/decodificação de vídeo escalonável h.264 com região de interesse

Country Status (13)

Country Link
US (1) US8270496B2 (pt)
EP (1) EP1952638B1 (pt)
JP (1) JP5020960B2 (pt)
KR (1) KR101329167B1 (pt)
CN (1) CN101283599B (pt)
AU (1) AU2006303886B2 (pt)
BR (1) BRPI0616407B1 (pt)
CA (1) CA2624339C (pt)
MX (1) MX2008004760A (pt)
MY (1) MY152568A (pt)
RU (1) RU2417546C2 (pt)
WO (1) WO2007047077A2 (pt)
ZA (1) ZA200803018B (pt)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5753341B2 (ja) * 2006-03-03 2015-07-22 ヴィドヨ,インコーポレーテッド スケーラブルビデオ通信でエラー耐性、ランダムアクセス、およびレート制御を提供するシステムおよび方法
US20070230567A1 (en) * 2006-03-28 2007-10-04 Nokia Corporation Slice groups and data partitioning in scalable video coding
KR100781524B1 (ko) 2006-04-04 2007-12-03 삼성전자주식회사 확장 매크로블록 스킵 모드를 이용한 인코딩/디코딩 방법및 장치
WO2008030067A1 (en) * 2006-09-07 2008-03-13 Lg Electronics Inc. Method and apparatus for decoding/encoding of a video signal
JP2009538084A (ja) * 2006-11-17 2009-10-29 エルジー エレクトロニクス インコーポレイティド ビデオ信号のデコーディング/エンコーディング方法及び装置
US8411734B2 (en) 2007-02-06 2013-04-02 Microsoft Corporation Scalable multi-thread video decoding
US9648325B2 (en) 2007-06-30 2017-05-09 Microsoft Technology Licensing, Llc Video decoding implementations for a graphics processing unit
US20090010341A1 (en) * 2007-07-02 2009-01-08 Feng Pan Peak signal to noise ratio weighting module, video encoding system and method for use therewith
WO2009033432A1 (fr) * 2007-09-14 2009-03-19 Huawei Technologies Co., Ltd. Procédé et appareil pour codage et décodage vidéo
CN101389021B (zh) * 2007-09-14 2010-12-22 华为技术有限公司 视频编解码方法及装置
US8355450B1 (en) * 2007-10-09 2013-01-15 Arris Solutions, Inc. Buffer delay reduction
KR100951465B1 (ko) * 2008-05-08 2010-04-07 엘지전자 주식회사 영상 부호화 방법, 복호화 방법, 및 그 기록 매체
FR2930702A1 (fr) * 2008-04-23 2009-10-30 Thomson Licensing Sas Procede d'insertion, de suppression, support d'enregistrement et codeur
US8885729B2 (en) 2010-12-13 2014-11-11 Microsoft Corporation Low-latency video decoding
US9706214B2 (en) 2010-12-24 2017-07-11 Microsoft Technology Licensing, Llc Image and video decoding implementations
RU2587467C2 (ru) 2011-06-30 2016-06-20 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Сокращение задержки при кодировании и декодировании видео
US8731067B2 (en) 2011-08-31 2014-05-20 Microsoft Corporation Memory management for video decoding
US9819949B2 (en) 2011-12-16 2017-11-14 Microsoft Technology Licensing, Llc Hardware-accelerated decoding of scalable video bitstreams
EP2810443B1 (en) * 2012-02-01 2021-03-31 Nokia Technologies Oy Method and apparatus for video coding
CN102595135B (zh) * 2012-02-24 2013-03-27 中国科学技术大学 一种可伸缩视频编码的方法及装置
RS64003B1 (sr) 2012-04-13 2023-03-31 Ge Video Compression Llc Kodiranje slike sa niskim kašnjenjem
KR102659283B1 (ko) * 2012-06-29 2024-04-22 지이 비디오 컴프레션, 엘엘씨 비디오 데이터 스트림 개념
US20140003504A1 (en) * 2012-07-02 2014-01-02 Nokia Corporation Apparatus, a Method and a Computer Program for Video Coding and Decoding
GB2504068B (en) * 2012-07-11 2015-03-11 Canon Kk Methods and devices for controlling spatial access granularity in compressed video streams
US10045032B2 (en) 2013-01-24 2018-08-07 Intel Corporation Efficient region of interest detection
BR112015023318A2 (pt) 2013-03-21 2017-07-18 Sony Corp dispositivos de codificação e de decodificação de imagem, e, método de decodificação de imagem
US9807421B2 (en) * 2013-04-05 2017-10-31 Sharp Kabushiki Kaisha NAL unit type restrictions
JP6269813B2 (ja) * 2013-04-08 2018-01-31 ソニー株式会社 Shvcでの注目領域スケーラビリティ
GB2516224A (en) * 2013-07-11 2015-01-21 Nokia Corp An apparatus, a method and a computer program for video coding and decoding
KR20200045012A (ko) 2013-07-15 2020-04-29 소니 주식회사 상호작용성을 위한 모션-구속된 타일 세트들 sei 메시지의 확장들
GB2516824A (en) 2013-07-23 2015-02-11 Nokia Corp An apparatus, a method and a computer program for video coding and decoding
US9386275B2 (en) * 2014-01-06 2016-07-05 Intel IP Corporation Interactive video conferencing
US10547834B2 (en) * 2014-01-08 2020-01-28 Qualcomm Incorporated Support of non-HEVC base layer in HEVC multi-layer extensions
US9516220B2 (en) 2014-10-02 2016-12-06 Intel Corporation Interactive video conferencing
US10021346B2 (en) 2014-12-05 2018-07-10 Intel IP Corporation Interactive video conferencing
WO2016098280A1 (ja) * 2014-12-16 2016-06-23 日本電気株式会社 映像符号化装置、映像復号装置および映像配信システム
CN105979216A (zh) * 2016-06-12 2016-09-28 浙江宇视科技有限公司 一种感兴趣区域的视频传输方法及装置
US10999602B2 (en) 2016-12-23 2021-05-04 Apple Inc. Sphere projected motion estimation/compensation and mode decision
US11259046B2 (en) 2017-02-15 2022-02-22 Apple Inc. Processing of equirectangular object data to compensate for distortion by spherical projections
US10924747B2 (en) 2017-02-27 2021-02-16 Apple Inc. Video coding techniques for multi-view video
FR3064145A1 (fr) 2017-03-16 2018-09-21 Orange Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
US11093752B2 (en) 2017-06-02 2021-08-17 Apple Inc. Object tracking in multi-view video
KR20180137917A (ko) * 2017-06-20 2018-12-28 가천대학교 산학협력단 모바일 vr을 위한 타일 기반 비디오 스트리밍
US10754242B2 (en) 2017-06-30 2020-08-25 Apple Inc. Adaptive resolution and projection format in multi-direction video

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5870550A (en) * 1996-02-26 1999-02-09 Network Engineering Software Web server employing multi-homed, moldular framework
US6011872A (en) * 1996-11-08 2000-01-04 Sharp Laboratories Of America, Inc. Method of generalized content-scalable shape representation and coding
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
DE19735607A1 (de) * 1997-08-15 1999-02-18 Bosch Gmbh Robert Verfahren zur Aufbereitung eines Datenstromes für die objektbasierte Codierung von Bewegtfortbildern
KR100591211B1 (ko) 1997-12-23 2006-06-19 톰슨 라이센싱 저잡음 엔코딩 및 디코딩 방법
RU2201654C2 (ru) 1997-12-23 2003-03-27 Томсон Лайсенсинг С.А. Способ низкошумового кодирования и декодирования
US6385248B1 (en) * 1998-05-12 2002-05-07 Hitachi America Ltd. Methods and apparatus for processing luminance and chrominance image data
CN1166207C (zh) * 1999-05-27 2004-09-08 皇家菲利浦电子有限公司 对视频信号进行编码的方法、装置及采用该装置的摄像机
US6263022B1 (en) * 1999-07-06 2001-07-17 Philips Electronics North America Corp. System and method for fine granular scalable video with selective quality enhancement
US6442203B1 (en) * 1999-11-05 2002-08-27 Demografx System and method for motion compensation and frame rate conversion
JP2001268569A (ja) * 2000-03-17 2001-09-28 Matsushita Electric Ind Co Ltd 任意形状オブジェクトの残余係数を符号化するための方法および装置
KR100353851B1 (ko) * 2000-07-07 2002-09-28 한국전자통신연구원 파문 스캔 장치 및 그 방법과 그를 이용한 영상코딩/디코딩 장치 및 그 방법
JP2004509574A (ja) 2000-09-22 2004-03-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ファイングラニュラスケーラビリティに関する好適な伝送/ストリーミング順序
EP1327360A1 (en) 2000-10-11 2003-07-16 Koninklijke Philips Electronics N.V. Scalable coding of multi-media objects
JP2003209789A (ja) 2002-01-10 2003-07-25 Sony Corp データ再生装置
US7317759B1 (en) * 2002-02-28 2008-01-08 Carnegie Mellon University System and methods for video compression mode decisions
US20040006575A1 (en) 2002-04-29 2004-01-08 Visharam Mohammed Zubair Method and apparatus for supporting advanced coding formats in media files
US20040024598A1 (en) * 2002-07-03 2004-02-05 Amit Srivastava Thematic segmentation of speech
KR100556838B1 (ko) * 2002-09-17 2006-03-10 엘지전자 주식회사 미세단위 신축형 부호화 및 복호화 장치와 방법
JP2004248124A (ja) * 2003-02-17 2004-09-02 Nippon Telegr & Teleph Corp <Ntt> 階層的画像符号化装置および階層的画像復号装置
KR20060027779A (ko) * 2004-09-23 2006-03-28 엘지전자 주식회사 영상 블록의 시간상 및 공간상 상관관계를 이용한영상신호의 엔코딩 및 디코딩 방법과 장치
KR100703774B1 (ko) * 2005-04-13 2007-04-06 삼성전자주식회사 인트라 코딩을 선택적으로 적용하여 인트라 bl 예측모드의 비디오 신호를 인코딩 및 디코딩하는 방법 및 장치
US20060256863A1 (en) * 2005-04-13 2006-11-16 Nokia Corporation Method, device and system for enhanced and effective fine granularity scalability (FGS) coding and decoding of video data

Also Published As

Publication number Publication date
KR20080055859A (ko) 2008-06-19
CN101283599B (zh) 2011-01-26
EP1952638B1 (en) 2020-05-13
CA2624339A1 (en) 2007-04-26
AU2006303886A1 (en) 2007-04-26
JP2009512342A (ja) 2009-03-19
ZA200803018B (en) 2009-07-29
US8270496B2 (en) 2012-09-18
US20100158135A1 (en) 2010-06-24
AU2006303886B2 (en) 2011-11-17
BRPI0616407A2 (pt) 2011-06-21
RU2008118370A (ru) 2009-11-20
WO2007047077A9 (en) 2007-07-05
CN101283599A (zh) 2008-10-08
EP1952638A2 (en) 2008-08-06
KR101329167B1 (ko) 2013-11-14
MX2008004760A (es) 2008-11-13
CA2624339C (en) 2014-12-02
RU2417546C2 (ru) 2011-04-27
WO2007047077A3 (en) 2007-06-14
MY152568A (en) 2014-10-31
JP5020960B2 (ja) 2012-09-05
WO2007047077A2 (en) 2007-04-26

Similar Documents

Publication Publication Date Title
BRPI0616407B1 (pt) Codificação/decodificação de vídeo escalonável h.264 com região de interesse
JP5484725B2 (ja) スケーラブルビデオコーディングのための重み付け予測方法及び装置
US9100659B2 (en) Multi-view video coding method and device using a base view
CN110572646A (zh) 帧内块复制与空时运动矢量预测的交互
US20090323824A1 (en) Methods and Apparatus for Use in Multi-View Video Coding
TW201244487A (en) Picture identification for multi-view video coding
TW201225675A (en) Methods for improved signaling using high level syntax for multi-view video coding and decoding
CN115699765A (zh) 访问单元中图片信息的信令
CN117041602B (zh) 用于对视频信号进行编码的方法、计算设备和存储介质
JP7751092B2 (ja) ビデオ処理ための方法、装置、および媒体
CN106257925A (zh) 具有限制的参考帧获取的帧间预测方法以及相关的帧间预测装置
CN121970337A (zh) 用于视频处理的方法、装置和介质
CN118056402A (zh) 用于视频处理的方法、装置和介质
BR112016007890B1 (pt) Método para codificar vídeo de múltiplas camadas ou de múltiplas visualizações, codificador de vídeo de múltiplas camadas ou múltiplas visualizações, unidade transmissora, e meio de armazenamento legível por computador

Legal Events

Date Code Title Description
B15K Others concerning applications: alteration of classification

Ipc: H04N 19/895 (2014.01), H04N 19/129 (2014.01), H04N

B15K Others concerning applications: alteration of classification

Free format text: AS CLASSIFICACOES ANTERIORES ERAM: H04N 19/895 , H04N 19/129 , H04N 19/132 , H04N 19/17 , H04N 19/174 , H04N 19/37 , H04N 19/46 , H04N 19/61 , H04N 19/70

Ipc: H04N 19/895 (2014.01), H04N 19/129 (2014.01), H04N

B06T Formal requirements before examination [chapter 6.20 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B25G Requested change of headquarter approved

Owner name: THOMSON LICENSING (FR)

B25G Requested change of headquarter approved

Owner name: THOMSON LICENSING (FR)

B25A Requested transfer of rights approved

Owner name: INTERDIGITAL VC HOLDINGS, INC. (US)

B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 11/08/2020, OBSERVADAS AS CONDICOES LEGAIS.