BRPI0616745A2 - codificação / decodificação de vìdeo com múltiplas visualizações usando codificação / decodificação de vìdeo escalonável - Google Patents

codificação / decodificação de vìdeo com múltiplas visualizações usando codificação / decodificação de vìdeo escalonável Download PDF

Info

Publication number
BRPI0616745A2
BRPI0616745A2 BRPI0616745-4A BRPI0616745A BRPI0616745A2 BR PI0616745 A2 BRPI0616745 A2 BR PI0616745A2 BR PI0616745 A BRPI0616745 A BR PI0616745A BR PI0616745 A2 BRPI0616745 A2 BR PI0616745A2
Authority
BR
Brazil
Prior art keywords
view
base layer
views
prediction
enhancement layer
Prior art date
Application number
BRPI0616745-4A
Other languages
English (en)
Inventor
Peng Yin
Yeping Su
Christina Gomila
Original Assignee
Thomson Licensing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing filed Critical Thomson Licensing
Publication of BRPI0616745A2 publication Critical patent/BRPI0616745A2/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

CODIFICAçãO/DECODIFICAçãO DE VìDEO COM MúLTIPLAS VISUALIZAçõES USANDO CODIFICAçãO/DECODIFICAçãO DE VìDEO ESCALONAVEL. Trata-se de métodos e aparelhos para codificação de vídeo estereoscópico usando codificação de vídeo escalonável. Um codificador de vídeo escalonável inclui um codificador (100) para codificar pelo menos duas visualizações correspondentes ao conteúdo de video com múltiplas visualizações codificando uma visualização específica de pelo menos uma das duas visualizações como uma camada de base, e codificando cada uma de pelo menos uma outra visualização das pelo menos duas visualizações como uma camada de aperfeiçoamento usando uma predição a partir de uma camada inferior correspondendo a pelo menos uma dentre a visualização especifica e a pelo menos uma outra visualização. As pelo menos duas visualizações são codificadas com base em uma seleção dentre pelo menos duas das técnicas de escalabilidade temporal, espacial e de razão sinal-ruído.

Description

"CODIFICAÇÃO/DECODIFICAÇÃO DE VÍDEO COM MÚLTIPLASVISUALIZAÇÕES USANDO CODIFICAÇÃO/DECODIFICAÇÃO DE VÍDEO ESCALONÁVEL"
REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS
Este pedido reivindica o beneficio do Pedido USProvisório de No. de Série 60/728.141, depositado em 19 deoutubro de 2005 e intitulado "METHOD AND APPARATUS FORSTEREOSCOPIC VIDEO USING SCALABLE VIDEO CODEC", incorporado aeste documento na integra e a titulo de referência.
CAMPO DA INVENÇÃO
Em geral, a presente invenção refere-se à codificaçãoe decodificação de videos e, mais especificamente, a um métodoe aparelho para Codificação/Decodificação de Video com Múl-tiplas Visualizações (MVC) usando codificação/decodificação devídeo escalonável.
ANTECEDENTES DA INVENÇÃO
Os vídeos estereoscópicos, também chamados de vídeostridimensionais (3-D) , criam a ilusão de profundidade nasimagens exibidas. Um método para gerar percepção de profundidadeconsiste em exibir duas imagens bidimensionais (2-D) diferentes,em que cada imagem representa duas perspectivas do mesmo objeto,de modo similar às perspectivas que ambos os olhos recebemnaturalmente sob visão binocular.
Com o advento de vários meios de exibição estere-oscópicos de alta qualidade no mercado, procura-se oferecer umasolução de compactação para vídeos estereoscópicos com eficáciade codificação/decodificação superior e com complexidade decodificação razoável.Nos últimos anos, muitos esforços foram colocados emprojetos de métodos eficazes para a compactação de vídeosestereoscópicos. Os métodos de compactação monoscópica con-vencionais podem ser aplicados de forma independente às vi-sualizações esquerda e direita de um par estéreo de imagens.Entretanto, taxas de compactação maiores podem ser atingidas sea alta correlação entre visualizações for aproveitada.
Com respeito a uma abordagem da técnica anterior, emque ambas as visualizações de um par de imagens estereoscópicassão codificadas, um Perfil com múltiplas visualizações (MVP) foi
definido no padrão Grupo de Peritos em Imagem em Movimento-2(MPEG-2) da Organização Internacional de Normalização Téc-nica/Comissão Eletrotécnica Internacional (ISO/IEC) paratransmitir um par de sinais de vídeo. 0 MVP se baseia em umaabordagem de representação de sinais com múltiplas camadas, demodo que uma visualização (geralmente a visualização esquerda)seja designada para uma camada base e a outra visualização sejadesignada para uma camada de aperfeiçoamento. A codifica-ção/decodificação monoscópica é aplicada à camada base com asmesmas ferramentas que o Perfil Principal (MP - "Main Profile") .A camada de aperfeiçoamento é codificada/decodificada usandoferramentas de escalabilidade temporal e uma predição híbridados campos de disparidade e movimento.
Nos métodos da técnica anterior relacionados aopadrão de Codificação/Decodificação de Vídeo Avançada Parte 10(AVC) do Grupo de Peritos em Imagens em Movimento-4 (MPEG-4) daOrganização Internacional de Normalização Técnica/ComissãoEletrotécnica Internacional (ISO/IEC) /padrão H.264 da UniãoInternacional de Telecomunicações, Setor de Telecomunicações(ITU-T) (doravante denominado "padrão MPEG4/H.264" ou sim-plesmente "padrão H.264") , a codificação/decodificação de vídeoestereoscópico pode ser realizada de duas formas diferentes: (i)como um caso específico de codificação/decodificação de imagensentrelaçadas, em que todos os campos de uma paridade específicasão designados para a visualização esquerda e todos os camposda paridade oposta são considerados como a visualização direitado conteúdo de visualização estéreo; ou, como alternativa, (ii)pela alternação de quadros das visualizações esquerda e direitaa fim de criar uma única seqüência de vídeo monoscópico. Umamensagem de informações suplementares de aperfeiçoamento (SEI)de estereoscopia oferece uma indicação ao decodificador quantoa se a seqüência de vídeo codificado representa ou não conteúdoestereoscópico e a qual método foi usado para codificar oconteúdo correspondente.
Esses métodos previamente conhecidos requerem mo-dificações mínimas nas técnicas de codificação/decodificaçãomonoscópica existentes. No entanto, demonstram uma capacidadelimitada em reduzir a redundância existente entre as duasvisualizações em um par estereoscópico. Como resultado, acodificação de visualização estéreo resulta em uma grandesobrecarga se comparada com a codificação de uma única vi-sualização monoscópica. Esse problema tem impedido a expansãoda estereoscopia para aplicativos de consumo com transmissão delargura de banda limitada.
Outros métodos da técnica anterior incluem métodos emque a codificação é realizada para uma visualização somada dealgumas "informações 3-D adicionais". Essa abordagem maissimples e geral para codificar/decodificar conteúdo estere-oscópico consiste em codificar uma única visualização somada dealgumas informações 3-D adicionais, permitindo que o receptorprocesse a segunda visualização do par estereoscópico. Tra-dicionalmente, as informações 3-D transmitidas são repre-sentadas por um mapa de profundidade e/ou paridade. Um mapa deprofundidade inclui uma representação de imagem 2-D da cena 3-D,para a qual é designado um valor de profundidade para cada pixel.Diferenças entre valores de pixel correspondem a diferenças naprofundidade da cena 3D. Não raro, os dados de profundidade sãocodificados como um único fluxo de video do canal de luminância.
No MPEG-4 Parte 2, a sintaxe de objeto de video incluios assim chamados componentes auxiliares múltiplos (MAC), quesão codificados como imagens de nivel de cinza usando DCT comcompensação de movimento. Os vetores de movimento de um objetode video serão usados para a compensação de movimento de seuscomponentes auxiliares. Uma utilidade dos componentes auxi-liares é codificar/decodificar dados de mapa de profundidade oudisparidade. No entanto, há a restrição de que os componentesauxiliares devem possuir o mesmo tamanho que o componente deluminância do objeto de video. 0 método anterior apresenta umdesempenho aperfeiçoado em comparação ao MPEG-2 MVP. No entanto,o padrão MPEG-4 Parte 2 não foi implementado com sucesso naindústria por causa dos ganhos de codificação/decodificaçãosuperiores do MPEG-4 parte 10 e da alta complexidade dos métodosde codificação do objeto direcionado proposto.
SUMÁRIO DA INVENÇÃOEsses e outros obstáculos e desvantagens da técnicaanterior são tratados pela presente invenção, que é direcionadaa um método e aparelho para Codificação/Decodificação de Videocom Múltiplas Visualizações (MVC) usando codifica-ção/decodificação de video escalonável.
De acordo com um aspecto dos presentes princípios, éproposto um codificador de vídeo escalonável. O codificador devídeo escalonável inclui um codificador para codificar pelomenos duas visualizações correspondentes ao conteúdo de vídeocom múltiplas visualizações pela codificação de uma visua-lização específica de pelo menos uma das duas visualizações comouma camada de base, e pela codificação de cada uma de pelo menosuma outra visualização das pelo menos duas visualizações comouma camada de aperfeiçoamento usando uma predição a partir deuma camada inferior correspondente a pelo menos uma dentre avisualização específica e a pelo menos uma outra visualização.
As pelo menos duas visualizações são codificadas combase em uma seleção dentre pelo menos duas das técnicas deescalabilidade temporal, espacial e de razão sinal-ruído.
De acordo com um aspecto dos presentes princípios, éproposto um método para codificação de vídeo escalonável. 0método inclui codificar pelo menos duas visualizações cor-respondentes ao conteúdo de vídeo com múltiplas visualizaçõespela codificação de uma visualização específica das pelo menosduas visualizações como uma camada de base, e pela codificaçãode cada uma de pelo menos uma outra visualização das pelo menosduas visualizações como uma camada de aperfeiçoamento, usandouma predição a partir de uma camada inferior correspondente apelo menos uma dentre a visualização especifica e a pelo menosuma outra visualização.
As pelo menos duas visualizações são codificadas combase em uma seleção dentre pelo menos duas das técnicas deescalabilidade temporal, espacial e de razão sinal-ruido.
De acordo com ainda outro aspecto dos presentesprincípios, é proposto um decodificador de video escalonávelpara decodificação de video escalonável . 0 decodificador devideo escalonável inclui um decodif icador para decodificar pelomenos duas visualizações correspondentes ao conteúdo de videocom múltiplas visualizações pela decodificação de uma visu-alização especifica das pelo menos duas visualizações como umacamada de base, e pela decodif icação de cada uma de pelo menosuma outra visualização das pelo menos duas visualizações comoúma camada de aperfeiçoamento, usando uma predição a partir deuma camada inferior correspondente a pelo menos uma dentre avisualização especifica e a pelo menos uma outra visualização.
As pelo menos duas visualizações são decodificadas com base emuma seleção dentre pelo menos duas das técnicas de escala-bilidade temporal, espacial e de razão sinal-ruido.
De acordo com ainda outro aspecto dos presentesprincípios, é proposto um método para decodificação de vídeoescalonável . O método inclui decodificar pelo menos duasvisualizações correspondentes ao conteúdo de vídeo com múl-tiplas visualizações pela decodificação de uma visualizaçãoespecífica das pelo menos duas visualizações como uma camada debase, e pela decodif icação de cada uma de pelo menos uma outravisualização das pelo menos duas visualizações como uma camadade aperfeiçoamento, usando uma predição a partir de uma camadainferior correspondente a pelo menos uma dentre a visualizaçãoespecifica e a pelo menos uma outra visualização. As pelo menosduas visualizações são decodificadas com base em uma seleçãodentre pelo menos duas das técnicas de escalabilidade temporal,espacial e de razão sinal-ruido.
De acordo com um aspecto adicional dos presentesprincípios, é proposta uma estrutura de sinal de vídeo paracodificação de vídeo escalonável . A estrutura de sinal de vídeoinclui uma visualização específica de pelo menos duas visu-alizações codificada como uma camada de base, e pelo menos umaoutra visualização das pelo menos duas visualizações codificadacomo uma camada de aperfeiçoamento, usando uma predição a partirde uma camada inferior correspondente a pelo menos uma dentrea visualização específica e a pelo menos uma outra visualização.As pelo menos duas visualizações correspondem ao conteúdo devídeo com múltiplas visualizações e são codificadas com base emuma seleção dentre pelo menos duas das técnicas de escala-bilidade temporal, espacial e de relação sinal ruído.
De acordo com outro aspecto adicional dos presentesprincípios, é proposto um meio de armazenamento com dados desinal de vídeo escalonável codificados nele. Os dados de sinalde vídeo escalonável incluem uma visualização específica de pelomenos duas visualizações codificada como uma camada de base, epelo menos uma outra visualização das pelo menos duas visu-alizações codificada como uma camada de aperfeiçoamento usandouma predição a partir de uma camada inferior correspondente apelo menos uma dentre a visualização específica e a pelo menosuma outra visualização. As pelo menos duas visualizaçõescorrespondem ao conteúdo de video com múltiplas visualizaçõese são codificadas com base em uma seleção dentre pelo menos duasdas técnicas de escalabilidade temporal, espacial e de relaçãosinal ruido.
De acordo com um aspecto adicional dos presentesprincípios, é proposto um codificador de vídeo escalonável. 0codificador de vídeo escalonável inclui um codificador paracodificar uma primeira visualização estereoscópica como umacamada de base e codificar pelo menos um dentre um mapa deprofundidade e um mapa de disparidade como uma camada deaperfeiçoamento usando uma predição da primeira visualizaçãoestereoscópica. Tanto a primeira visualização estereoscópicaquanto o pelo menos um dentre o mapa de profundidade e o mapade disparidade correspondem a um conteúdo estereoscópicoespecífico e são codificados com base em uma seleção dentre pelomenos uma dentre as duas das técnicas de escalabilidade temporal,espacial e relação sinal-ruído.
De acordo com um aspecto dos presentes princípios, éproposto um método para codificação de vídeo escalonável . 0método inclui codificar uma primeira visualização estereos-cópica como uma camada de base e codificar pelo menos um dentreum mapa de profundidade e um mapa de disparidade como uma camadade aperfeiçoamento usando uma predição a partir da primeiravisualização estereoscópica. Tanto a primeira visualizaçãoestereoscópica quanto o pelo menos um dentre o mapa de pro-fundidade e o mapa de disparidade correspondem a um conteúdoestereoscópico específico e são codificados com base em umaseleção dentre pelo menos duas das técnicas de escalabilidadetemporal, espacial e relação sinal-ruido.
De acordo com ainda outro aspecto dos presentesprincípios, é proposto um decodificador de vídeo escalonável.
0 decodificador de vídeo escalonável inclui um decodificadorpara decodificar uma primeira visualização estereoscópica apartir de uma camada de base e decodificar pelo menos um dentreum mapa de profundidade e um mapa de disparidade a partir de umacamada de aperfeiçoamento usando uma predição a partir daprimeira visualização estereoscópica. Cada um dentre a primeiravisualização estereoscópica e o pelo menos um dentre o mapa deprofundidade e o mapa de disparidade corresponde a um conteúdoestereoscópico específico e é decodificado com base em umaseleção dentre pelo menos duas das técnicas de escalabilidadetemporal, espacial e relação sinal-ruído.
De acordo com ainda outro aspecto dos presentesprincípios, é proposto um método para decodificação de vídeoescalonável. O método inclui decodificar uma primeira vi-sualização estereoscópica a partir de uma camada de base edecodificar pelo menos um dentre um mapa de profundidade e ummapa de disparidade a partir de uma camada de aperfeiçoamentousando uma predição a partir da primeira visualização este-reoscópica. Tanto a primeira visualização estereoscópica quantoo pelo menos um dentre o mapa de profundidade e o mapa dedisparidade correspondem a um conteúdo estereoscópico espe-cífico e são decodificados com base em uma seleção dentre pelomenos duas das técnicas de escalabilidade temporal, espacial erelação sinal-ruído.De acordo com um aspecto ainda adicional dos presentesprincípios, é proposta uma estrutura de sinal de vídeo paracodificação de vídeo escalonável . A estrutura de sinal de vídeoinclui uma primeira visualização estereoscópica codificada comouma camada de base e pelo menos um dentre um mapa de profundidadee um mapa de disparidade codificado como uma camada de a-perfeiçoamento para permitir uma predição a partir da primeiravisualização estereoscópica. Tanto a primeira visualizaçãoestereoscópica quanto o pelo menos um dentre o mapa de pro-fundidade e o mapa de disparidade correspondem a um conteúdoestereoscópico específico e são codificados com base em umaseleção dentre pelo menos duas das técnicas de escalabilidadetemporal, espacial e relação sinal-ruído.
De acordo com um aspecto adicional dos presentes.princípios, é proposto um meio de armazenamento com dados desinal de vídeo escalonável codificados nele. Os dados de sinalde vídeo escalonável incluem uma primeira visualização es-tereoscópica codificada como uma camada de base e pelo menos umdentre um mapa de profundidade e um mapa de disparidade co-dificado como uma camada de aperfeiçoamento para permitir umapredição a partir da primeira visualização estereoscópica.Tanto a primeira visualização estereoscópica quanto o pelo menosum dentre o mapa de profundidade e o mapa de disparidadecorrespondem a um conteúdo estereoscópico específico e sãocodificados com base em uma seleção entre pelo menos duas dastécnicas de escalabilidade temporal, espacial e relação si-nal-ruído .
Esses e outros aspectos, características e vantagensda presente invenção transparecerão por meio da descriçãodetalhada das concretizações exemplificativas a seguir, quedeverá ser lida junto com os desenhos em anexo.
BREVE DESCRIÇÃO DOS DESENHOS
A presente invenção pode ser mais bem compreendida deacordo com as figuras exemplificativas a seguir, em quê:
A FIG. 1 ilustra um diagrama de blocos para umcodificador Joint Scalable Video Model (JSVM) 3.0, ao qual ospresentes princípios podem ser aplicados;
A FIG. 2 ilustra um diagrama de blocos para umdecodificador exemplificativo, ao qual os presentes princípiospodem ser aplicados;
A FIG. 3 é um diagrama para um mapeamento de ma-croblocos exemplificativo para predição intercamadas na es-calabilidade espacial SVC para um fator de escalonamento iguala 1/2 para cada dimensão;
A FIG. 4 é um diagrama para um método de codificaçãode vídeo escalonável capaz de codificar um par de visualizaçõesestereoscópicas de conteúdo estereoscópico de acordo com umaprimeira concretização exemplificativa dos presentes prin-cípios ;
A FIG. 5 é um diagrama para um método de decodif icaçãode vídeo escalonável capaz de decodificar um par de visua-lizações estereoscópicas de conteúdo estereoscópico de acordocom a primeira concretização exemplificativa dos presentesprincípios;
A FIG. 6 é um diagrama para um método de codificaçãode vídeo escalonável capaz de codificar um par de visualizaçõesestereoscópicas de conteúdo estereoscópico de acordo com umasegunda concretização exemplificativa dos presentes princípios;
A FIG. 7 é um diagrama para um método de decodif icaçãode vídeo escalonável capaz de decodificar um par de visua-lizações estereoscópicas de conteúdo estereoscópico de acordocom a segunda concretização exemplificativa dos presentesprincípios;
A FIG. 8 é um método de codificação de vídeo es-calonável para codificar um macrobloco em uma camada de a-perfeiçoamento de acordo com uma concretização exemplificativados presentes princípios; e
A FIG. 9 é um método de decodificação de vídeoescalonável para decodificar um macrobloco em uma camada deaperfeiçoamento de acordo com uma concretização exemplif icativados presentes princípios.
DESCRIÇÃO DETALHADA
A presente invenção está voltada para um método eaparelho para Codificação de Vídeo com Múltiplas Visualizações(MVC) usando codificação de vídeo escalonável. Para finsilustrativos, as concretizações exemplificativas da presenteinvenção são descritas com respeito a conteúdos de vídeoestereoscópico (com duas visualizações). No entanto, dados osensinamentos dos presentes princípios apresentados nestedocumento, os versados nesta técnica e em técnicas relacionadasserão capazes de expandir facilmente os presentes princípios aoconteúdo de vídeo com múltiplas visualizações, correspondentea duas ou mais visualizações, sem desviar-se do âmbito dapresente invenção.
A presente descrição ilustra os princípios dapresente invenção.Sendo assim, apreciar-se-á que os versados natécnica serão capazes de descobrir várias combinações que,embora não explicitamente descritas ou ilustradas neste do-cumento, concretizam os princípios da invenção e estão incluídasdentro de sua essência e âmbito.
Todos os exemplos e linguagens condicionais relatadosno presente documento são concebidos para propósitos peda-gógicos a fim de auxiliar o leitor a compreender os princípiosda invenção e os conceitos contribuídos pelo inventor parafavorecer a técnica, e devem ser interpretados sem restriçõesa tais exemplos e condições especificamente relatados.
Além disso, todas as declarações, neste documento,relatando princípios, aspectos e concretizações da invenção,bem como exemplos específicos dela, devem abranger tantoequivalentes estruturais quanto funcionais dela. Além disso,pretende-se que tais equivalentes incluam tanto equivalentesatualmente conhecidos quanto equivalentes desenvolvidos nofuturo, isto é, quaisquer elementos desenvolvidos que de-sempenhem a mesma função, independente da estrutura.
Sendo assim, por exemplo, será apreciado pelosversados na técnica que os diagramas de blocos apresentadosneste documento representam visualizações conceituais dosistema de circuitos ilustrativo que concretiza os princípiosda invenção. De maneira semelhante, apreciar-se-á que quaisquerfluxogramas, diagramas de fluxo de dados, diagramas de transiçãode estados, pseudocódigos, entre outros, representam váriosprocessos que podem ser substancialmente representados em meioslegíveis por computador e, portanto, executados por um com-putador ou processador, quer tal computador ou processador sejailustrado explicitamente ou não.
As funções dos vários elementos ilustrados nasfiguras podem ser realizadas pelo uso de hardware dedicado, bemcomo de hardware capaz de executar softwares relacionados aosoftware apropriado. Quando realizadas por um processador, asfunções podem ser realizadas por um único processador dedicado,por um único processador compartilhado ou por vários pro-cessadores individuais, alguns dos quais podem ser compar-tilhados. Além disso, o uso explícito do termo "processador" ou"controlador" não deve ser interpretado como referência ex-clusiva a hardware capaz de executar softwares e pode incluirimplicitamente, sem restrição, hardware processador de sinaisdigitais ("DSP"), memória somente para leitura ("ROM") paraarmazenar softwares, memória de acesso aleatório ("RAM") earmazenamentos não voláteis.
Também podem ser incluídos outros hardwares, con-vencionais e/ou personalizados. De maneira semelhante,quaisquer botões ilustrados nas figuras são meramente con-ceituais. Sua função pode ser realizada pela operação de lógicade programa, por meio de lógica dedicada, pela interação decontrole de programa e lógica dedicada, ou até mesmo manualmente,a técnica específica sendo selecionável pelo implementador comomais especificamente compreendido com base no contexto.
Nas reivindicações deste documento, qualquer ele-mento expresso como um meio para desempenhar uma função es-pecifica tem a intenção de abranger qualquer forma de de-sempenhar tal função, incluindo, por exemplo: a) uma combinaçãode elementos de circuito que desempenham tal função ou b)softwares de qualquer forma, incluindo, portanto, firmwares,microcódigos ou similares, combinados como sistema de circuitosapropriado para executar tal software para desempenhar a função.
A invenção, conforme definida por tais reivindicações, consisteno fato de que as funcionalidades oferecidas pelos vários meiosrelatados são combinadas, e unidas da maneira que as reivin-dicações prescrevem. Assim, considera-se que qualquer meiocapaz de oferecer tais funcionalidades é equivalente aosilustrados no presente documento.
Com relação à FIG. 1, um codificador Joint ScalableVideo Model Version 3.0 (doravante referido como "JSVM3.0")exemplificativo, ao qual a presente invenção pode ser aplicada,é, em geral, indicado pelo número de referência 100. 0 co-dificador JSVM3.0 100 usa três camadas espaciais e filtragemtemporal com compensação de movimento. 0 codificador JSVM 100inclui um decimador bidirecional (2D) 104, um decimador 2D 106e um módulo de filtragem temporal com compensação de movimento(MCTF) 108, cada um contendo uma entrada para receber dados desinal de vídeo 102.
Uma saída do decimador 2D 106 é conectada, em co-municação de sinais, a uma entrada de um módulo MCTF 110. Umaprimeira saída do módulo MCTF 110 é conectada, em comunicaçãode sinais,· a uma entrada de um codificador de movimento 112 euma segunda saída do módulo MCTF 110 é conectada, em comunicaçãode sinais, a uma entrada de" um módulo de predição 116. Umaprimeira saida do codificador de movimento 112 é conectada, emcomunicação de sinais, a uma primeira entrada de um multi-plexador 114. Uma segunda saida do codificador de movimento 112é conectada, em comunicação de sinais, a uma primeira entradade um codificador de movimento 124. Uma primeira saida do módulode predição 116 é conectada, em comunicação de sinais, a umaentrada de um transformador espacial 118. Uma saida dotransformador espacial 118 é conectada, em comunicação de sinais,a uma segunda entrada do multiplexador 114. Uma segunda saidado módulo de predição 116 é conectada, em comunicação de sinais,a uma entrada de um interpolador 120. Uma saida do interpoladoré conectada, em comunicação de sinais, a uma primeira entradade um módulo de predição 122. Uma primeira saida do módulo depredição 122 é conectada, em comunicação de sinais, a uma entradade um transformador espacial 126. Uma saida do transformadorespacial 126 é conectada, em comunicação de sinais, à segundaentrada do multiplexador 114. Uma segunda saida do módulo depredição 122 é conectada, em comunicação de sinais, a uma entradade um interpolador 130. Uma saida do interpolador 130 é conectada,em comunicação de sinais, a uma primeira entrada de um módulode predição 134 . Uma saida do módulo de predição 134 é conectada,em comunicação de sinais, a um transformador espacial 136. Umasaida do transformador espacial é conectada, em comunicação desinais, à segunda entrada de um multiplexador 114.
Uma saida do decimador 2D 104 é conectada, em co-municação de sinais, a uma entrada de um módulo MCTF 128. Umaprimeira saida do módulo MCTF 128 é conectada, em comunicaçãode sinais, a uma segunda entrada do codificador de movimento 124.Uma primeira saida do codificador de movimento 124 é conectada,em comunicação de sinais, à primeira entrada do multiplexador114. Uma segunda saída do codificador de movimento 124 éconectada, em comunicação de sinais, a uma primeira entrada deum codificador de movimento 132 . Uma segunda saída do módulo MCTF128 é conectada, em comunicação de sinais, a uma segunda entradado módulo de predição 122.
Uma primeira saída do módulo MCTF 108 é conectada, emcomunicação de sinais, a uma segunda entrada do codificador demovimento 132. Uma saída do codificador de movimento 132 éconectada, em comunicação de sinais, à primeira entrada domultiplexador 114. Uma segunda saída do módulo MCTF 108 éconectada, em comunicação de sinais, a uma segunda entrada domódulo de predição 134. Uma saída do multiplexador 114 forneceum fluxo de bits de saída 138.
Para cada camada espacial, é realizada uma decom-posição temporal com compensação de movimento. Essa decom-posição propicia escalabilidade temporal. As informações demovimento das camadas espaciais inferiores podem ser usadas parapredição de movimento nas camadas superiores. Para a codificaçãode textura, a predição espacial entre camadas espaciais su-cessivas pode ser aplicada para remover redundâncias. O sinalresidual resultante da predição intra ou da predição inter comcompensação de movimento é codificado em transformada. Umresidual da camada de base de qualidade oferece qualidade dereconstrução mínima em cada camada espacial. Essa camada de basede qualidade pode ser codificada em um fluxo compatível com opadrão H.264, se nenhuma predição intercamadas for aplicada.Para escalabilidade de qualidade, as camadas de aperfeiçoamentode qualidade são adicionalmente codificadas.
Essas camadas de aperfeiçoamento podem ser escolhidastanto para oferecer escalabilidade de qualidade de granula-ridade (SNR) fina ou grossa.
Voltando-se para a FIG. 2, um codificador de videoescalonável exemplificativo, ao qual a presente invenção podeser aplicada, é indicado, em geral, pelo número de referência200. Uma entrada de um demultiplexador 202 é disponível como umaentrada para o decodificador de vídeo escalonável 200 parareceber um fluxo de bits escalonável. Uma primeira saída dodemultiplexador 202 é conectada, em comunicação de sinais, a umaentrada de um decodificador de entropia escalonável SNR detransformada espacial inversa 204. Uma primeira saída dodecodificador de entropia escalonável SNR de transformadaespacial inversa 204 é conectada, em comunicação de sinais, auma primeira entrada de um módulo de predição 206. Uma saída domódulo de predição 206 é conectada, em comunicação de sinais,a uma primeira entrada de um módulo MCTF inverso 208.
Uma segunda saída do decodificador de entropiaescalonável SNR de transformada espacial inversa 204 é conectada,em comunicação de sinais, a uma primeira entrada de um de-codificador de vetor de movimento (MV) 210. Uma saída dodecodificador MV 210 é conectada, em comunicação de sinais, auma segunda entrada de um módulo MCTF inverso 208.
Uma segunda saída do demultiplexador 202 é conectada,em comunicação de sinais, a uma entrada de um decodif icador deentropia escalonável SNR de transformada espacial inversa 212.Uma primeira saída do decodificador de entropia escalonável SNRde transformada espacial inversa 212 é conectada, em comunicaçãode sinais, a uma primeira entrada de um módulo de predição 214.Uma primeira saída do módulo de predição 214 é conectada, emcomunicação de sinais, a uma entrada de um módulo de interpolação216. Uma saída do módulo de interpolação 216 é conectada, emcomunicação de sinais, a uma segunda entrada do módulo depredição 206. Uma saída do módulo de predição 214 é conectada,em comunicação de sinais, a uma primeira entrada de um móduloMCTF inverso 218.
Uma segunda saída do decodificador de entropiaescalonável SNR de transformada espacial inversa 212 é conectada,em comunicação de sinais, a uma primeira entrada de um de-codificador MV 220. Uma primeira saída do decodificador MV 220é conectada, em comunicação de sinais, a uma segunda entrada dodecodificador MV 210. Uma segunda saída do decodificador MV 220é conectada, em comunicação de sinais, a uma segunda entrada domódulo MCTF inverso 218.
Uma terceira saída do demultiplexador 202 é conectada,em comunicação de sinais, a uma entrada de um decodif icador deentropia escalonável SNR de transformada espacial inversa 222.Uma primeira saída do decodificador de entropia escalonável SNRde transformada espacial inversa 222 é conectada, em comunicaçãode sinais, a uma entrada de um módulo de predição 224. Umaprimeira saída do módulo de predição 224 é conectada, emcomunicação de sinais, a uma entrada de um módulo de interpolação226. Uma saída do módulo de interpolação 226 é conectada, emcomunicação de sinais, a uma segunda entrada do módulo depredição 214.
Uma saída do módulo de predição 224 é conectada, emcomunicação de sinais, a uma primeira entrada de um módulo MCTFinverso 228. Uma segunda saída do decodificador de entropiaescalonável SNR de transformada espacial inversa 222 é conectada,em comunicação de sinais, a uma entrada de um decodif icador MV230. Uma primeira saída do decodificador MV 230 é conectada, emcomunicação de sinais, a uma segunda entrada do decodificadorMV 220. Uma segunda saída do decodif icador MV 230 é conectada,em comunicação de sinais, a uma segunda entrada do módulo MCTFinverso 22 8.
Uma saída do módulo MCTF inverso 228 é disponível comouma saída do decodificador 200 para emitir um sinal de camada0. Uma saída do módulo MCTF inverso 218 é disponível como umasaída do decodif icador 200 para emitir a um sinal de camada 1.Uma saída do módulo MCTF inverso 208 é disponível como uma saídado decodificador 200 para emitir um sinal de camada 2.
Para escalabilidade espacial, temporal e SNR, éincorporado um alto grau de predição intercamadas. Macroblocosintra e inter podem ser preditos usando os sinais corres-pondentes das camadas anteriores. Além disso, a descrição demovimento de cada camada pode ser usada para predição dadescrição de movimento para camadas de aperfeiçoamento se-guintes. Essas técnicas podem ser divididas em três categorias:predição de textura intra intercamadas, predição de movimentointercamadas e predição de resíduo intercamadas.
De acordo com os presentes princípios, revelamos duasconcretizações exemplificativas para codificação de vídeoestereoscópico capazes de serem usadas com a Codifica-ção/Decodificação de Vídeo Escalonável (doravante tambémreferida como "H.264 SVC" ou simplesmente "SVC") que estáatualmente sendo desenvolvida como um aperfeiçoamento ao padrãoH.264. De acordo com o primeiro método, o conteúdo estere-oscópico é codificado em SVC como um par de visualizações(visualizações esquerda e direita, ou, como alternativa, umaprimeira e segunda visualizações estereoscópicas). De acordocom o segundo método, o conteúdo estereoscópico é codificado emSVC como uma visualização somada de mapas de profundida-de/paridade. Para cada método das duas concretizações exem-plificativas, uma nova mensagem, indicador, ou algo do gênero(por exemplo, uma mensagem de Informações Suplementares deAperfeiçoamento(SEI)) é usada para indicar o fluxo de bits SVCusado para codificação de vídeo estereoscópico.
Apreciar-se-á que, embora as concretizações dospresentes princípios sejam descritas neste documento comrespeito ao H.264 SVC, os versados nesta técnica ou em técnicasrelacionadas perceberão que os presentes princípios não selimitam a isso e também podem ser facilmente aplicados a outrospadrões de codificação/decodificação de vídeo (incluindo, porexemplo, mas sem a isto se restringir, vários padrões MPEG,incluindo MPEG-2), sem desviar-se do âmbito dos presentesprincípios.
De acordo com a primeira concretização exemplifi-cativa, a codificação/decodificação de ambas as visualizaçõesde um par de imagens estereoscópicas em um esquema de codi-ficação/decodificação de vídeo escalonável é realizada co-dificando/decodificando uma visualização como camada de base ecodificando/decodificando a segunda visualização em uma camadade aperfeiçoamento. Uma diferença essencial entre os presentesprincípios e o esquema MPEG-2 MVP é que os presentes princípiosnão necessitam que as duas visualizações sejam codifica-das/decodificadas usando apenas escalabilidade temporal.Portanto, de acordo com os presentes princípios, as visua-lizações estereoscópicas podem ser codificadas (e, portanto,decodificadas mais tarde) como escalabilidade temporal, es-pacial ou SNR, dependendo das necessidades e capacidadesdisponíveis para os requisitos de uma aplicação específica. Porexemplo, a escalabilidade temporal é mais adequada quando énecessária maior eficácia de codificação/decodificação. Aescalabilidade espacial/SNR é mais adequada quando um apli-cativo correspondente pode se beneficiar de diferentes qua-lidades/resoluções espaciais entre duas visualizações.
A fim de admitir que uma exibição não-estéreo sejacapaz de decodificar o vídeo sem decodificar a camada deaperfeiçoamento e permitir que outra visualização tenha re-soluções diferentes, para aplicações de escalabilidade espacial,propomos a utilização de um fator de escalonamento menor que,ou igual a, 1, em um aspecto exemplificativo da primeiraconcretização exemplificativa.
Discrepâncias de iluminação e cor ao longo de di-ferentes visualizações de câraera são comuns em vídeos este-reoscópicos capturados. Possíveis causas de tais discrepânciasindesejadas incluem, mas sem a isto se restringirem, calibraçãode câmera precária, diferentes direções na projeção de luz ediferentes características de reflexão superficial. A PrediçãoPonderada (WP), originalmente desenvolvida no padrão H.264, éuma ferramenta eficiente para compensar diferenças de ilu-minação/cor quando a predição de textura entre duas visua-lizações está envolvida. A WP é suportada na SVC, mas é permitidaapenas para a mesma camada ou escalabilidade temporal. Portanto,de acordo com uma implementação exemplificativa da primeiraconcretização exemplificativa, uma vez que codifica-mos/decodificamos uma visualização na camada de base e umasegunda visualização na camada de aperfeiçoamento na primeiraconcretização exemplificativa, para escalabilidade temporal,podemos simplesmente permitir a WP na SVC a fim de proporcionarum benefício na eficácia de codificação/decodificação parapredição de visualização cruzada. Para escalabilidade espacialou SNR, propomos adicionar o suporte WP para o modo Intra_BL,isto é, codificar/decodificar a diferença entre o macrobloco nacamada de aperfeiçoamento e o macrobloco ponderado na camada debase.
É fornecida uma nova mensagem de informações su-plementares de aperfeiçoamento (SEI) que dá suporte à primeiraconcretização descrita neste documento e especifica qualvisualização corresponde à camada de base. A mensagem SEI éilustrada na Tabela 1. Por exemplo, quando ba-se_layer_is__lef t_view_f Iag é igual a 1, isso indica que avisualização esquerda é codificada na camada de base. De modooposto, quando base_layer_is_left_view_fIag é igual a 0, issoindica que a visualização direita é codificada na camada de base.
Tabela 1<table>table see original document page 25</column></row><table>
Deve-se observar que, uma vez que esses metadados nãosão necessários para o processo de decodificação, os metadadospodem ser transmitidos fora de banda de acordo com uma es-pecificação de sintaxe diferente.
De acordo com a segunda concretização exemplificativa,uma visualização é codificada/decodificada e um mapa deprofundidade e/ou disparidade é usado na camada de aperfei-çoamento para dar suporte a uma exibição não-estéreo con-vencional para podermos decodificar o video sem decodificar osmapas de profundidade. Podemos aplicar escalabilidade espacial,ou SNR, dependendo dos requisitos da aplicação. Tendo em vistaque o mapa de profundidade pode ser codificado/decodificado emuma resolução inferior, em escalabilidade espacial, umapossível concretização preferida usa um fator de escalonamentomenor que, ou igual a, 1.
É fornecida uma nova mensagem SEI que dá suporte àsegunda concretização exemplificativa e que oferece metadados3-D adicionais que são transmitidos para auxiliar no processode sintetização da visualização não-transmitida. Em umaconcretização específica, os metadados transmitidos podemincluir dois parâmetros (Nknear, Nkfar), conforme ilustrado naTabela 2. Com esses dois parâmetros e o mapa de profundidade,a paralaxe de pixel correta pode ser calculada e resultará noefeito de profundidade intencionado na exibição conforme vistapelo espectador.
Nknear especifica o parâmetro de razão knear nor-malizado para 128 que deve ser aplicado para calcular o paralelode tela de uma visualização recém-processada.
Nkfar especifica o parâmetro de razão kfar norma-lizado para 32 que deve ser aplicado para calcular o paralelode tela de uma visualização recém-processada.
Tabela 2
<table>table see original document page 26</column></row><table> Deve-se observar que, uma vez que esses metadadòs nãosão necessários para o processo de decodificação, os metadadòspodem ser transmitidos fora de banda de acordo com uma es-pecificação de sintaxe diferente.
Um grande problema no uso de um mapa de profundidadee uma visualização codificada (por exemplo, a visualizaçãoesquerda) para construir a outra visualização não-transmitida(por exemplo, a visualização direita) é que as áreas ina-cessíveis na visualização esquerda podem se tornar visíveis navisualização direita. Isso pode criar buracos na visualizaçãodireita. Outro problema é que, já que a visualização esquerdae. o mapa de profundidade são codificados com perdas, podemocorrer erros entre a visualização direita reconstruída e avisualização direita original. Ά fim de aperfeiçoar a qualidadeda visualização não-transmitida, é possível adicionar umacamada SNR adicional. Essa camada SNR adicional deve sercombinada com a mensagem SEI, de modo que o decodificador saibaque o refinamento é baseado na visualização não-codifiçadareconstruída.
Deve-se observar que, atualmente, na SVC (que usa oJoint Scalable Video Model 3 (JSVM3) ) , a escalabilidade espacialapenas lida com o escalonamento de resolução maior ou igual aum. De acordo com a presente invenção, a predição intercamadasé usada para dar suporte ao escalonamento de resolução menor doque 1.
Para predição intercamadas, deve-se chamar atençãopara os problemas a seguir a fim lidar com a escalabilidadeespacial para escalonamento de resolução menor do que um: (1)processamento de blocos misturados; (2) mapeamento de tipo demacrobloco; (3) escalonamento de vetor de movimento; 4) es-calonamento de textura. Técnicas novas e/ou anteriores, in-cluindo as relacionadas à transcodificação de resolução es-pacial, podem ser usadas para abordar esses problemas.
Para simplificar, podemos permitir que a SVC dêsuporte apenas para o fator de escalonamento ser 2Λ<"η>, em quen>0. Com relação à FIG. 3, um mapeamento de macroblocos e-xemplificativo para predição intercamadas em escalabilidadeespacial SVC para um fator de escalonamento igual a 1/2 para cadadimensão é indicado, em geral, pelo número de referência 300.Em tal exemplo, um macrobloco na camada de aperfeiçoamentocorresponde a quatro macroblocos na camada de base. Uma vez queesses quatro macroblocos podem ter diferentes modos intra/intere a SVC não permite modos de mistura em um macrobloco, precisamosdecidir qual modo deve ser usado para o macrobloco na camada deaperfeiçoamento na predição intercamadas. Propomos forçar osmacroblocos ao modo inter, e pressupor que os vetores demovimento (MVs) e resíduos da transformada discreta de cosseno(DCT) no macrobloco intra sejam iguais a zero. Para o mapeamentode tipo de macrobloco, uma vez que a menor partição na SVC é 4x4,mas a redução da escala por 2 pode resultar em uma partição tãopequena quanto 2x2, propomos agrupar cada uma das quatropartições 2x2 em uma partição 4x4. O MV para cada partição 4x4é ajustado para o MV do canto do sub-macrobloco 8x8 corres-pondente. Para cada índice de figura de referência, agrupamoscada uma das quatro partições 4x4 em uma partição 8x8. O índicede figura de referência é designado para o do canto do macroblocoassociado. Para o escalonamento de vetor de movimento, MVE =(MVB+1) >>T, em que MVE é o vetor de movimento da camada deaperfeiçoamento, e MVB é o vetor de movimento da camada de basecorrespondente. Para a redução da escala da textura envolvendoo resíduo, podemos usar o método de média aritmética. Para atextura espacial, podemos usar o método de média aritmética oua função de redução de escala do MPEG-4 atualmente em uso no JSVM.Para o fator de escalonamento de 2A<_n), podemos escalonariterativamente por 1/2 (n vezes).
Apreciar-se-á que, conforme usado neste documento, otermo "mapa de profundidade/disparidade" se refere a um ou maismapas de profundidade e/ou um ou mais mapas de disparidade.
As FIGs. 4 e 5 correspondem à primeira concretizaçãoexemplificativa dos presentes princípios.Com relação à FIG. 4, um método para codificação devideo escalonável capaz de codificar um par de visualizaçõesestereoscópicas de conteúdo estereoscópico é, em geral, in-dicado pelo número de referência 400. O método 400 inclui umbloco inicial 405 que passa o controle para um bloco de decisão410. O bloco de decisão 410 determina se irá ou não codificaruma visualização esquerda do conteúdo estereoscópico como umacamada de base. Se a resposta for positiva, o controle passa parao bloco de função 415. Caso contrário, o controle passa para umbloco de função 425.
O bloco de função 415 atribui a ba-se_layer_is_left_view_fIag um valor igual a um, grava o ba-se_layer_is_left_view_fIag em uma mensagem de informaçõessuplementares de aperfeiçoamento (SEI), e passa o controle paraum bloco de função 420. O bloco de função 420 codifica avisualização esquerda como a camada de base e a visualizaçãodireita como uma camada de aperfeiçoamento e passa o controlepara um bloco final 435.
O bloco de função 425 atribui a ba-se_layer_is_left_yiew_fIag um valor igual a zero, grava obase_layer_is j eft_view_fIag na mensagem SEI, e passa o controlepara um bloco de função 430. O bloco de função 430 codifica avisualização direita como a camada de base e a visualizaçãoesquerda como uma camada de aperfeiçoamento usando escala-bilidade SNR, espacial e/ou temporal e passa o controle para obloco final 435.
Voltando-se para a FIG. 5, um método de decodificaçãode vídeo escalonável capaz de decodificar um par de visua-lizações estereoscópicas de conteúdo estereoscópico é, em geral,indicado pelo número de referência 500. O método 500 inclui umbloco inicial 505 que passa o controle para um bloco de função510. O bloco de função analisa o base_layer_is_left_view_fIagna mensagem SEI e passa o controle para um bloco de decisão 515.
O bloco de decisão 515 determina se o ba-se_layer_is_left_view_fIag é ou não igual a um. Se for, entãoo controle passa para um bloco de função 520. Caso contrário,o controle passa para um bloco de função 525.
O bloco de função 520 decodifica a visualizaçãoesquerda a partir da camada de base e a visualização direita apartir da camada de aperfeiçoamento usando escalabilidade SNR,espacial e/ou temporal e passa o controle para um bloco final599.
O bloco de função 525 decodifica a visualizaçãodireita a partir da camada de base e a visualização esquerda apartir da camada de aperfeiçoamento usando escalabilidade SNR,espacial e/ou temporal e passa o controle para o bloco final 599.
As FIGs. 6 e 7 correspondem à segunda concretizaçãoexemplificativa dos presentes principios.
Voltando-se para a FIG. 6, um método para codificaçãode video escalonável capaz de codificar um par de visualizaçõesestereoscópicas de conteúdo estereoscópico é, em geral, in-dicado pelo número de referência 600. O método 600 inclui umbloco inicial 605 que passa o controle para um bloco de função610. O bloco de função 610 codifica uma visualização do conteúdoestereoscópico como uma camada de base e codifica um mapa deprofundidade/disparidade correspondente ao video estereos-cópico como uma camada de aperfeiçoamento usando escalabilidadeSNR, espacial e/ou temporal e passa o controle para um bloco defunção 615. O bloco de função 615 grava parâmetros de pro-fundidade na mensagem SEI e passa o controle para um bloco defunção 620. O bloco de função 620 reconstrói outra visualização(não codificada) do conteúdo estereoscópico usando o videoreconstruído a partir da camada de base, um mapa de profun-didade/disparidade reconstruído a partir da camada de aper-feiçoamento e parâmetros de profundidade da mensagem SEI, epassa o controle para um bloco de função 625. 0 bloco de função625 codifica uma camada SNR adicional com base na visualizaçãonão codificada reconstruída e passa o controle para um blocofinal 630.
Com relação à FIG. 7, um método para decodif icação devídeo escalonável capaz de decodificar um par de visualizaçõesestereoscópicas de conteúdo estereoscópico é, em geral, in-dicado pelo número de referência 700. O método 700 inclui umbloco inicial 705 que passa o controle para um bloco de função710. O bloco de função 710 decodifica uma visualização es-tereoscópica do conteúdo estereoscópico a partir da camada debase, decodifica um mapa de profundidade/disparidade a partirda camada de aperfeiçoamento usando escalabilidade SNR, es-pacial e/ou temporal, e passa o controle para um bloco de função715. O bloco de função 715 analisa as mensagens de profundidadeda mensagem SEI e passa o controle para um bloco de função 720.
O bloco de função 720 reconstrói outra visualização (nãocodificada) estereoscópica como a camada de base usando o vídeoreconstruído a partir da camada de base, um mapa de profun-didade/disparidade reconstruído a partir da camada de aper-feiçoamento e parâmetros de profundidade da mensagem SEI, epassa o controle para um bloco de função 725. 0 bloco de função725 decodifica uma camada SNR adicional com base na visualizaçãonão codificada reconstruída, forma uma visualização não co-dificada aperfeiçoada e passa o controle para um bloco final 730.
Com relação à FIG. 8, um método de codifica-ção/decodificação de vídeo escalonável para codificar ummacrobloco em uma camada de aperfeiçoamento é indicado, em geral,pelo número de referência 800. O método 800 inclui um blocoinicial 805 que passa o controle para um bloco de decisão 810.
O bloco de decisão 810 determina se irá ou não usar prediçãointercamadas. Se a resposta for positiva, então o controle passapara um bloco de decisão 815. Caso contrário, o controle passapara um bloco de função 855.
O bloco de decisão 815 determina se irá ou não usarpredição de textura intra intercamadas. Se a resposta forpositiva, então o controle passa para um bloco de decisão 820.Caso contrário, o controle passa para um bloco de decisão 830.
O bloco de decisão 820 determina se irá ou não usarpredição ponderada. Se a resposta for positiva, o controle passapara o bloco de função 825. Caso contrário, o controle passa paraum bloco de função 840.
O bloco de função 825 codifica uma diferença entre omacrobloco na camada de aperfeiçoamento e um macroblocoponderado escalonado a partir de um conjunto de macroblocosmapeados na camada de base, e passa o controle para o bloco dedecisão 830.O bloco de decisão 830 determina se irá ou não usarpredição de vetor de movimento intercamadas. Se a resposta forpositiva, o controle passa para o bloco de função 835. Casocontrário, o controle passa para um bloco de decisão 845.
O bloco de função 835 realiza mapeamento de modo emapeamento de vetor de movimento, e passa o controle para o blocode decisão 845.
O bloco de decisão 845 determina se irá ou não usarpredição de resíduo intercamadas. Se a resposta for positiva,o controle passa para um bloco de função 850. Caso contrário,o controle passa para o bloco de função 855.
O bloco de função 850 realiza mapeamento de modo emapeamento de resíduo e passa o controle para o bloco de função855. Em uma concretização, o bloco de função 850 pode envolveratribuir ao fator de escalonamento espacial um valor igual a 2(_n>,η sendo um número inteiro maior do que zero, e realizar o cálculoda média para redução da taxa de amostragem de resíduoscorrespondentes aos pelo menos alguns blocos (850).
O bloco de função 855 codifica o macrobloco e passao controle para um bloco final 860.
O bloco de função 840 codifica uma diferença entre omacrobloco na camada de aperfeiçoamento e um macrobloco es-calonado a partir de um conjunto de macroblocos mapeados nacamada de base, e passa o controle para o bloco de decisão 830.
Em uma concretização, o bloco de função 855 podeenvolver restringir um fator de escalonamento espacial para serigual ou menor do que um quando for escolhida a técnica deescalabilidade espacial.Em uma concretização, os blocos de função 835, 850e/ou 855 podem envolver, por exemplo, atribuir a um fator deescalonamento espacial um valor igual a 2<_n), η sendo um númerointeiro maior do que zero, realizar um mapeamento de blocos demuitos para um a partir da camada de base para a camada deaperfeiçoamento, converter os blocos na camada de base com ummodo de predição intra para um modo de predição inter, e forçaros vetores de movimento e os coeficientes de transformadadiscreta de cosseno no modo de predição intra a serem zero.
Em uma concretização, os blocos de função 835 e/ou 855podem envolver, por exemplo, mapear um vetor de movimento paraum bloco na camada de aperfeiçoamento para um vetor de movimentoescalonado de um canto de um bloco mapeado correspondente apartir de um conjunto de blocos mapeados na camada de base, edesignar um índice de referência para o bloco na camada deaperfeiçoamento ao do canto do bloco mapeado correspondente nacamada de base, o bloco na camada de aperfeiçoamento estandoco-localizado com respeito ao conjunto de blocos mapeados nacamada de base.
Em uma concretização, os blocos de função 850 e/ou 855podem envolver atribuir ao fator de escalonamento espacial umvalor igual a 2<_n>, η sendo um número inteiro maior do que zero,e realizar o cálculo da média para redução da taxa de amostragemde textura dos resíduos.
Com relação à FIG. 9, um método de decodificação devídeo escalonável para decodificar um macrobloco em uma camadade aperfeiçoamento é indicado, em geral, pelo número de re-ferência 900. O método 900 inclui um bloco inicial 905 que passao controle para um bloco de função 910. 0 bloco de função 910analisa a sintaxe para o macrobloco e passa o controle para umbloco de decisão 915. O bloco de decisão 915 determina se umsinalizador de predição intercamadas é ou não igual a um. Se aresposta for positiva, então o controle passa para um bloco dedecisão 920. Caso contrário, o controle passa para um bloco defunção 960.
O bloco de decisão 920 determina se um sinalizador depredição de textura intra intercamadas é ou não igual a um. Sea resposta for positiva, então o controle passa para um blocode decisão 925. Caso contrário, o controle passa para um blocode decisão 935.
O bloco de decisão 925 determina se um sinalizador depredição ponderada é ou não igual a um. Se a resposta for positiva,o controle passa para um bloco de função 930. Caso contrário,o controle passa para um bloco de função 945.
O bloco de função 930 decodifica a diferença entre omacrobloco na camada de aperfeiçoamento e um macroblocoponderado escalonado a partir de um conjunto de macroblocosmapeados na camada de base, e passa o controle para um bloco dedecisão 935.
O bloco de decisão 935 determina se um sinalizador depredição de vetor de movimento intercamadas é ou não igual a um.Se a resposta for positiva, o controle passa para um bloco defunção 940. Caso contrário, o controle passa para um bloco dedecisão 950.
O bloco de função 940 realiza mapeamento de modo emapeamento de vetor de movimento, e passa o controle para o blocode decisão 950.
O bloco de decisão 950 determina se um sinalizador depredição de resíduo intercamadas é ou não igual a um. Se aresposta for positiva, o controle passa para um bloco de função955. Caso contrário, o controle passa para um bloco de função960.
O bloco de função 955 realiza mapeamento de modo emapeamento de resíduo, e passa o controle para o bloco de função960 .
O bloco de função 960 decodifica o macrobloco e passao controle para um bloco final 965.
0 bloco de função 945 decodifica a diferença entre omacrobloco na camada de aperfeiçoamento e um macrobloco es-calonado a partir de um conjunto de macroblocos mapeados nacamada de base, e passa o controle para o bloco de decisão 935.
Agora será feita uma descrição de algumas das muitasvantagens/características concomitantes da presente invenção,algumas das quais foram mencionadas acima. Por exemplo, umavantagem/característica é o codificador de vídeo escalonávelincluir um codificador para codificar pelo menos duas visu-alizações correspondentes ao conteúdo de vídeo com múltiplasvisualizações pela codificação de uma visualização específicadas pelo menos duas visualizações como uma camada de base, e pelacodificação de cada uma de pelo menos uma outra visualização daspelo menos duas visualizações como uma camada de aperfeiçoamentousando uma predição a partir de uma camada inferior corres-pondente a pelo menos uma dentre a visualização específica e apelo menos uma outra visualização. As pelo menos duas visu-alizações são codificadas com base em uma seleção dentre pelomenos duas das técnicas de escalabilidade temporal, espacial ede razão sinal-ruido.
Outra vantagem/característica é o codificador devideo escalonável, conforme descrito acima, em que a camada debase e a camada de aperfeiçoamento são incluídas em um fluxo debits de vídeo, e o codificador adiciona um indicador em umamensagem sinalizando o fluxo de bits de vídeo. 0 indicador servepara indicar que o fluxo de bits de vídeo inclui sinais de vídeocom múltiplas visualizações.
Ainda outra vantagem/característica é o codificadorde vídeo escalonável que adiciona o indicador em uma mensagem,conforme descrito acima, em que a mensagem é uma mensagem deInformações Suplementares de Aperfeiçoamento (SEI).
Além disso, outra vantagem/característica é o co-dificador de vídeo escalonável que adiciona o indicador em umamensagem, conforme descrito acima, em que a mensagem é enviadafora de banda.
Ademais, outra vantagem/característica é o codi-ficador de vídeo escalonável que adiciona o indicador em umamensagem, conforme descrito acima, em que o indicador éfornecido na forma de metadados.
De mais a mais, outra vantagem/característica é ocodificador de vídeo escalonável que adiciona o indicador em umamensagem, conforme descrito acima, em que o indicador especificauma dentre a visualização específica e a pelo menos outravisualização como sendo codificada em uma dentre a camada de baseou a camada de aperfeiçoamento.Em adição, outra vantagem/característica é o co-dificador de vídeo escalonável, conforme descrito acima, em queas técnicas de escalabilidade temporal, espacial ou de razãosinal-ruído são realizadas de acordo com a Extensão de Co-dificação de Vídeo Escalonável da Organização Internacional deNormalização Técnica/padrão de Codificação de Vídeo AvançadaParte 10 do Grupo de Peritos em Imagens em Movimento da ComissãoInternacional Eletrotécnica/padrão H.264 da União Interna-cional de Telecomunicações, Setor de Telecomunicações.
Ademais, outra vantagem/característica é o codi-ficador de vídeo escalonável, conforme descrito acima, em queo codificador restringe um fator de escalonamento espacial demodo a ser igual ou inferior a um, quando é escolhida a técnicade escalabilidade espacial.
De mais a mais, outra vantagem/característica é ocodificador de vídeo escalonável que restringe o fator deescalonamento espacial, conforme descrito acima, em que ocodificador codifica pelo menos alguns blocos na camada de basee na camada de aperfeiçoamento usando predição intercamadasatribuindo ao fator de escalonamento espacial um valor igual a2<_n), η sendo um número inteiro maior do que zero, realizandoum mapeamento de blocos de muitos para um a partir da camada debase para a camada de aperfeiçoamento, convertendo qualquer umdos pelo menos alguns blocos na camada de base com um modo depredição intra para um modo de predição inter, e forçando osvetores de movimento e os coeficientes da transformada discretade cosseno no modo de predição intra a serem iguais a zero.
Além disso, outra vantagem/característica é o co-dificador de vídeo escalonável que codifica pelo menos algunsblocos na camada de base e na camada de aperfeiçoamento usandopredição intercamadas, conforme descrito acima, em que ocodificador mapeia um vetor de movimento para um bloco na camadade aperfeiçoamento para um vetor de movimento escalonado de umcanto de um bloco mapeado correspondente a partir de um conjuntode blocos mapeados na camada de base, e designa um índice dereferência para o bloco na camada de aperfeiçoamento ao do cantodo bloco mapeado correspondente na camada de base, o bloco nacamada de aperfeiçoamento e o conjunto de blocos mapeados nacamada de base incluídos nos pelo menos alguns blocos, o blocona camada de aperfeiçoamento estando co-localizado com respeitoao conjunto de blocos mapeados na camada de base.
Ademais, outra vantagem/característica é o codi-ficador de vídeo escalonável que restringe o fator de esca-lonamento espacial, conforme descrito acima, em que o codi-ficador codifica pelo menos alguns blocos na camada de base ena camada de aperfeiçoamento atribuindo ao fator de escalo-namento espacial um valor igual a 2(_n), η sendo um número inteiromaior do que zero, e calculando a média para redução da texturade resíduos correspondentes aos pelo menos alguns blocos.
De mais a mais, outra vantagem/característica é ocodificador de vídeo escalonável, conforme descrito acima, emque as pelo menos duas visualizações são codificadas permitindoa predição ponderada para predição de visualização cruzada entrea visualização específica e a pelo menos uma outra visualização.
Além disso, outra vantagem/característica é o co-dificador de vídeo escalonável que codifica as pelo menos duasvisualizações permitindo a predição de visualização cruzada,conforme descrito acima, em que a predição ponderada é permitidaao codificar uma diferença entre um macrobloco na camada deaperfeiçoamento e um macrobloco ponderado escalonado a partirde um conjunto de macroblocos mapeados na camada de base, omacrobloco na camada de aperfeiçoamento estando co-localizadocom respeito ao conjunto de macroblocos mapeados na camada debase.
Ademais, outra vantagem/característica é o codi-ficador de video escalonável, conforme descrito acima, em queas pelo menos duas visualizações correspondem a um par devisualizações estereoscópicas, com uma visualização do parsendo codificada como a camada de base e outra visualização dopar sendo codificada como a camada de aperfeiçoamento usando umapredição a partir da camada de base.
Essas e outras características e vantagens dapresente invenção podem ser facilmente verificadas pelosversados na técnica pertinente com base nos ensinamentos destedocumento. Deve-se compreender que os ensinamentos da presenteinvenção podem ser implementados em várias formas de hardware,software, firmware, processadores de uso específico ou com-binações desses.
Mais preferivelmente, os ensinamentos da presenteinvenção são implementados como uma combinação de hardware esoftware. Ademais, o software é, de preferência, implementadocomo um programa aplicativo incorporado de forma tangível a umaunidade de armazenamento de programas.
O programa aplicativo pode ser carregado para, eexecutado por, uma máquina compreendendo qualquer arquiteturaadequada. De preferência, a máquina é implementada em umaplataforma de computador com hardwares tal como uma ou maisunidades centrais de processamento ("CPU"), uma memória deacesso aleatório ("RAM") e interfaces de entrada/saida ("I/O").A plataforma de computador também pode incluir um sistemaoperacional e código de micro-instrução. Os vários processos efunções descritos neste documento podem ser parte ou do códigode micro-instrução ou do programa aplicativo, ou qualquercombinação desses, que pode ser executada por uma CPU. Além disso,várias outras unidades periféricas podem ser conectadas àplataforma de computador, tal como uma unidade de armazenamentode dados adicional e uma unidade de impressão.
Também deve ser compreendido que, já que alguns doscomponentes e métodos constituintes do sistema representadosnos desenhos em anexo são preferencialmente implementados emsoftware, as conexões reais entre os componentes do sistema ouos blocos de função de processo podem divergir, dependendo damaneira na qual a presente invenção é programada. Dados osensinamentos neste documento, os versados na técnica pertinenteserão capazes de contemplar essas implementações ou confi-gurações, bem como implementações ou configurações similares,da presente invenção.
Embora as concretizações ilustrativas tenham sidodescritas com referência aos desenhos em anexo, deve-secompreender que-a presente invenção não se restringe a essasconcretizações exatas, e que várias alterações e modificaçõespodem ser realizadas pelos versados na técnica pertinente semdivergir do âmbito e da essência da presente invenção. Todasessas alterações e modificações devem ser incluídas dentro doâmbito da presente invenção, conforme estabelecido nas rei-vindicações em anexo.

Claims (96)

1. Aparelho, CARACTERIZADO por compreender:um codificador (100) para codificar pelo menos duasvisualizações correspondentes ao conteúdo de video com múl-tiplas visualizações pela codificação de uma visualizaçãoespecifica das pelo menos duas visualizações como uma camada debase, e pela codificação de cada uma de pelo menos uma outravisualização das pelo menos duas visualizações como uma camadade aperfeiçoamento, usando uma predição a partir de uma camadainferior correspondente a pelo menos uma dentre a visualizaçãoespecifica e a pelo menos uma outra visualização,em que as pelo menos duas visualizações são codi-ficadas com base em uma seleção dentre pelo menos duas dastécnicas de escalabilidade temporal, espacial e de razãosinal-ruido.
2. Aparelho, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de que a camada de base e a camada deaperfeiçoamento são incluídas em um fluxo de bits de vídeo, eo referido codificador (100) adiciona um indicador em umamensagem sinalizando o fluxo de bits de vídeo, o indicadorservindo para indicar que o fluxo de bits de vídeo inclui sinaisde vídeo com múltiplas visualizações.
3. Aparelho, de acordo com a reivindicação 2,CARACTERIZADO pelo fato de que a mensagem é uma mensagem deInformações Suplementares de Aperfeiçoamento (SEI).
4. Aparelho, de acordo com a reivindicação 2,CARACTERIZADO pelo fato de que a mensagem é enviada fora debanda.
5. Aparelho, de acordo com a reivindicação 2,CARACTERIZADO pelo fato de que o indicador é fornecido na formade metadados.
6. Aparelho, de acordo com a reivindicação 2,CARACTERIZADO pelo fato de que o indicador especifica uma dentrea visualização especifica ou a pelo menos uma outra visualizaçãocomo sendo codificada em uma dentre a camada de base ou a camadade aperfeiçoamento.
7. Aparelho, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de que as técnicas de escalabilidadetemporal, espacial e de razão sinal-ruido são realizadas deacordo com a Extensão de Codificação de Video Escalonável daOrganização Internacional de Normalização Técnica/padrão deCodificação de Video Avançada Parte 10 do Grupo de Peritos emImagens em Movimento-4 da Comissão Internacional Eletrotéc-nica/padrão H.264 da União Internacional de Telecomunicações,Setor de Telecomunicações.
8. Aparelho, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de que o referido codificador (100)restringe um fator de escalonamento espacial para ser igual ouinferior a um, quando é escolhida a técnica de escalabilidadeespacial.
9. Aparelho, de acordo com a reivindicação 8,CARACTERIZADO pelo fato de que o referido codificador (100)codifica pelo menos alguns blocos na camada de base e na camadade aperfeiçoamento usando predição intercamadas atribuindo, aofator de escalonamento espacial, um valor igual a 2(_n), η sendoum número inteiro maior do que zero, realizando um mapeamentode blocos de muitos para um a partir da camada de base para acamada de aperfeiçoamento, convertendo qualquer um dos pelomenos alguns blocos na camada de base com um modo de prediçãointra para um modo de predição inter, e forçando os vetores demovimento e os coeficientes da transformada discreta de cossenono modo de predição intra a serem iguais a zero.
10. Aparelho, de acordo com a reivindicação 9,CARACTERIZADO pelo fato de que o referido codificador (100)mapeia um vetor de movimento, para um bloco na camada deaperfeiçoamento, para um vetor de movimento escalonado de umcanto de um bloco mapeado correspondente a partir de um conjuntode blocos mapeados na camada de base, e designa um índice dereferência para o bloco na camada de aperfeiçoamento ao do cantodo bloco mapeado correspondente na camada de base, o bloco nacamada de aperfeiçoamento e o conjunto de blocos mapeados nacamada de base incluídos nos pelo menos alguns blocos, o blocona camada de aperfeiçoamento estando co-localizado com respeitoao conjunto de blocos mapeados na camada de base.
11. Aparelho, de acordo com a reivindicação 8,CARACTERIZADO pelo fato de que o referido codificador (100)codifica pelo menos alguns blocos na camada de base e na camadade aperfeiçoamento atribuindo ao fator de escalonamento espacialum valor igual a 2<_n), η sendo um número inteiro maior do que zero,e calculando a média para redução de amostragem de textura dosresíduos correspondentes aos pelo menos alguns blocos.
12. Aparelho, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de que as pelo menos duas visualizaçõessão codificadas ao permitir a predição ponderada para prediçãode visualização cruzada entre a visualização especifica e a pelomenos uma outra visualização.
13. Aparelho, de acordo com a reivindicação 12,CARACTERIZADO pelo fato de que a predição ponderada é pos-sibilitada ao codificar uma diferença entre um macrobloco nacamada de aperfeiçoamento e um macrobloco ponderado escalonadoa partir de um conjunto de macroblocos mapeados na camada de base,o macrobloco na camada de aperfeiçoamento estando co-localizadocom respeito ao conjunto de macroblocos mapeados na camada de base.
14. Aparelho, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de que as pelo menos duas visualizaçõescorrespondem a um par de visualizações estereoscópicas, com umavisualização do par sendo codificada como a camada de base eoutra visualização do par sendo codificada como a camada deaperfeiçoamento usando uma predição a partir da camada de base.
15. Método para codificação de video escalonável,CARACTERIZADO por compreender:codificar (420, 430) pelo menos duas visualizaçõescorrespondentes ao conteúdo de video com múltiplas visuali-zações pela codificação de uma visualização especifica das pelomenos duas visualizações como uma camada de base, e pelacodificação de cada uma de pelo menos uma outra visualização daspelo menos duas visualizações como uma camada de aperfeiçoamento,usando uma predição a partir de uma camada inferior corres-pondente a pelo menos uma dentre a visualização especifica e apelo menos uma outra visualização,em que as pelo menos duas visualizações são codi-ficadas com base em uma seleção dentre pelo menos duas dastécnicas de escalabilidade temporal, espacial e de razãosinal-ruido.
16. Método, de acordo com a reivindicação 15,CARACTERIZADO pelo fato de que a camada de base e a camada deaperfeiçoamento são incluídas em um fluxo de bits de vídeo, ea referida etapa de codificar compreende adicionar (415, 425)um indicador em uma mensagem sinalizando o fluxo de bits de vídeo,o indicador servindo para indicar que o fluxo de bits de vídeoinclui sinais de vídeo com múltiplas visualizações.
17. Método, de acordo com a reivindicação 16,CARACTERIZADO pelo fato de que a mensagem é uma mensagem deInformações Suplementares de Aperfeiçoamento (SEI).
18. Método, de acordo com a reivindicação 16,CARACTERIZADO pelo fato de que a mensagem é enviada fora debanda.
19. Método, de acordo com a reivindicação 16,CARACTERIZADO pelo fato de que o indicador é fornecido na formade metadados.
20. Método, de acordo com a reivindicação 16,CARACTERIZADO pelo fato de que o indicador especifica uma dentrea visualização específica ou a pelo menos uma outra visualizaçãocomo sendo codificada em uma dentre a camada de base ou a camadade aperfeiçoamento.
21. Método, de acordo com a reivindicação 15,CARACTERIZADO pelo fato de que as técnicas de escalabilidadetemporal, espacial e de razão sinal-ruido são realizadas deacordo com a Extensão de Codificação de Vídeo Escalonável daOrganização Internacional de Normalização Técnica/padrão deCodificação de Video Avançada Parte 10 do Grupo de Peritos emImagens em Movimento-4 da Comissão Internacional Eletrotéc-nica/padrão H.264 da União Internacional de Telecomunicações,Setor de Telecomunicações.
22. Método, de acordo com a reivindicação 15,CARACTERIZADO pelo fato de que a referida etapa de codificarcompreende restringir um fator de escalonamento espacial a serigual ou inferior a um, quando é escolhida a técnica de es-calabilidade espacial (855).
23. Método, de acordo com a reivindicação 22,CARACTERIZADO pelo fato de que a referida etapa de codificarcodifica pelo menos alguns blocos na camada de base e na camadade aperfeiçoamento, usando predição intercamadas atribuindo, aofator de escalonamento espacial, um valor igual a 2 <_n), η sendoum número inteiro maior do que zero, realizando um mapeamentode blocos de muitos para um a partir da camada de base para acamada de aperfeiçoamento, convertendo qualquer um dos pelomenos alguns blocos na camada de base com um modo de prediçãointra para um modo de predição inter, e forçando os vetores demovimento e os coeficientes da transformada discreta de cossenono modo de predição intra a serem iguais a zero (835, 850, 855) .
24. Método, de acordo com a reivindicação 23,CARACTERIZADO pelo fato de que a referida etapa de codificarmapeia um vetor de movimento, para um bloco na camada deaperfeiçoamento, para um vetor de movimento escalonado de umcanto de um bloco mapeado correspondente a partir de um conjuntode blocos mapeados na camada de base, e designa um índice dereferência para o bloco na camada de aperfeiçoamento ao do cantodo bloco mapeado correspondente na camada de base, o bloco nacamada de aperfeiçoamento e o conjunto de blocos mapeados nacamada de base incluídos nos pelo menos alguns blocos, o blocona camada de aperfeiçoamento estando co-localizado com respeitoao conjunto de blocos mapeados na camada de base (835, 855).
25. Método, de acordo com a reivindicação 22,CARACTERIZADO pelo fato de que a referida etapa de codificarcodifica pelo menos alguns blocos na camada de base e na camadade aperfeiçoamento atribuindo, ao fator de escalonamentoespacial, um valor igual a 2<_n), η sendo um número inteiro maiordo que zero, e calculando a média para redução de amostragem detextura dos resíduos correspondentes aos pelo menos algunsblocos (850, 855).
26. Método, de acordo com a reivindicação 15,CARACTERIZADO pelo fato de que as pelo menos duas visualizaçõessão codificadas ao permitir a predição ponderada para prediçãode visualização cruzada entre a visualização específica e a pelomenos uma outra visualização (825).
27. Método, de acordo com a reivindicação 26,CARACTERIZADO pelo fato de que a predição ponderada é pos-sibilitada ao codificar uma diferença entre um macrobloco nacamada de aperfeiçoamento e um macrobloco ponderado escalonadoa partir de um conjunto de macroblocos mapeados na camada de base,o macrobloco na camada de aperfeiçoamento estando co-localizadocom respeito ao conjunto de macroblocos mapeados na camada debase.
28. Método, de acordo com a reivindicação 15,CARACTERIZADO pelo fato de que as pelo menos duas visualizaçõescorrespondem a um par de visualizações estereoscópicas, com umavisualização do par sendo codificada como a camada de base eoutra visualização do par sendo codificada como a camada deaperfeiçoamento usando uma predição a partir da camada de base.
29. Aparelho, CARACTERIZADO por compreender:um decodificador (200) para decodificar pelo menosduas visualizações correspondentes ao conteúdo de video commúltiplas visualizações decodificando uma visualização es-pecifica das pelo menos duas visualizações como uma camada debase, e decodificando cada uma de pelo menos uma outra vi-sualização das pelo menos duas visualizações como uma camada deaperfeiçoamento, usando uma predição a partir de uma camadainferior correspondendo a pelo menos uma dentre a visualizaçãoespecifica e a pelo menos uma outra visualização,em que as pelo menos duas visualizações são deco-dificadas com base em uma seleção dentre pelo menos duas dastécnicas de escalabilidade temporal, espacial e de razãosinal-ruido.
30. Aparelho, de acordo com a reivindicação 28,CARACTERIZADO pelo fato de que a camada de base e a camada deaperfeiçoamento são incluídas em um fluxo de bits de vídeo, eo referido decodificador (200) lê um indicador em uma mensagemsinalizando o fluxo de bits de vídeo, o indicador servindo paraindicar que o fluxo de bits de vídeo inclui sinais de vídeo commúltiplas visualizações.
31. Aparelho, de acordo com a reivindicação 29,CARACTERIZADO pelo fato de que a mensagem é uma mensagem deInformações Suplementares de Aperfeiçoamento (SEI).
32. Aparelho, de acordo com a reivindicação 29,CARACTERIZADO pelo fato de que a mensagem é recebida fora debanda.
33. Aparelho, de acordo com a reivindicação 29,CARACTERIZADO pelo fato de que o indicador é fornecido na formade metadados.
34. Aparelho, de acordo com a reivindicação 30,CARACTERIZADO pelo fato de que o indicador especifica uma dentrea visualização especifica ou a pelo menos uma outra visualizaçãocomo sendo codificada em uma dentre a camada de base ou a camadade aperfeiçoamento.
35. Aparelho, de acordo com a reivindicação 29,CARACTERIZADO pelo fato de que as técnicas de escalabilidadetemporal, espacial e de razão sinal-ruido são realizadas deacordo com a Extensão de Codificação de Video Escalonável daOrganização Internacional de Normalização Técnica/padrão deCodificação de Video Avançada Parte 10 do Grupo de Peritos emImagens em Movimento-4 da Comissão Internacional Eletrotéc-nica/padrão H.264 da União Internacional de Telecomunicações,Setor de Telecomunicações.
36. Aparelho, de acordo com a reivindicação 29,CARACTERIZADO pelo fato de que as pelo menos duas visualizaçõessão decodificadas ao permitir a predição ponderada para prediçãode visualização cruzada entre a visualização especifica e a pelomenos uma outra visualização.
37. Aparelho, de acordo com a reivindicação 36,CARACTERIZADO pelo fato de que a predição ponderada é pos-sibilitada ao decodificar uma diferença entre um macrobloco nacamada de aperfeiçoamento e um macrobloco ponderado escalonadoa partir de um conjunto de macroblocos mapeados na camada de base,o macrobloco na camada de aperfeiçoamento estando co-localizadocom respeito ao conjunto de macroblocos mapeados na camada debase.
38. Aparelho, de acordo com a reivindicação 29,CARACTERIZADO pelo fato de que as pelo menos duas visualizaçõescorrespondem a um par de visualizações estereoscópicas, com umavisualização do par sendo decodificada como a camada de base eoutra visualização do par sendo decodificada como a camada deaperfeiçoamento usando uma predição a partir da camada de base.
39. Método de decodificação de video escalonável,CARACTERIZADO por compreender:decodificar (520, 525) pelo menos duas visualizaçõescorrespondentes ao conteúdo de video com múltiplas visuali-zações pela decodificação de uma visualização especifica daspelo menos duas visualizações como uma camada de base, e peladecodificação de cada uma de pelo menos uma outra visualizaçãodas pelo menos duas visualizações como uma camada de aper-feiçoamento, usando uma predição a partir de uma camada inferiorcorrespondendo a pelo menos uma dentre a visualização especificae a pelo menos uma outra visualização,em que as pelo menos duas visualizações são deco-dificadas com base em uma seleção dentre pelo menos duas dastécnicas de escalabilidade temporal, espacial e de razãosinal-ruido.
40. Método, de acordo com a reivindicação 39,CARACTERIZADO pelo fato de que a camada de base e a camada deaperfeiçoamento são incluídas em um fluxo de bits de vídeo, eo referido decodificador lê (510) um indicador em uma mensagemsinalizando o fluxo de bits de vídeo, o indicador servindo paraindicar que o fluxo de bits de vídeo inclui sinais de vídeo commúltiplas visualizações.
41. Método, de acordo com a reivindicação 40,CARACTERIZADO pelo fato de que a mensagem é uma mensagem deInformações Suplementares de Aperfeiçoamento (SEI).
42. Método, de acordo com a reivindicação 40,CARACTERIZADO pelo fato de que a mensagem é recebida fora debanda.
43. Método, de acordo com a reivindicação 40,CARACTERIZADO pelo fato de que o indicador é fornecido na formade metadados.
44. Método, de acordo com a reivindicação 40,CARACTERIZADO pelo fato de que o indicador especifica uma dentrea visualização específica ou a pelo menos uma outra visualizaçãocomo sendo codificada em uma dentre a camada de base ou a camadade aperfeiçoamento.
45. Método, de acordo com a reivindicação 39,CARACTERIZADO pelo fato de que as técnicas de escalabilidadetemporal, espacial e de razão sinal-ruido são realizadas deacordo com a Extensão de Codificação de Vídeo Escalonável daOrganização Internacional de Normalização Técnica/padrão deCodificação de Vídeo Avançada Parte 10 do Grupo de Peritos emImagens em Movimento-4 da Comissão Internacional Eletrotéc-nica/padrão H.264 da União Internacional de Telecomunicações,Setor de Telecomunicações.
46. Método, de acordo com a reivindicação 39,CARACTERIZADO pelo fato de que as pelo menos duas visualizaçõessão decodificadas ao permitir a predição ponderada para prediçãode visualização cruzada entre a primeira visualização este-reoscópica e a segunda visualização estereoscópica (930).
47. Método, de acordo com a reivindicação 46,CARACTERIZADO pelo fato de que a predição ponderada é pos-sibilitada ao decodificar uma diferença entre um macrobloco nacamada de aperfeiçoamento e um macrobloco ponderado escalonadoa partir de um conjunto de macroblocos mapeados na camada de base,o macrobloco na camada de aperfeiçoamento estando co-localizadocom respeito ao conjunto de macroblocos mapeados na camada debase.
48. Codificador de video escalonável, de acordo coma reivindicação 39, CARACTERIZADO pelo fato de que as pelo menosduas visualizações correspondem a um par de visualizaçõesestereoscópicas, com uma visualização do par sendo codificadacomo a camada de base e outra visualização do par sendo co-dificada como a camada de aperfeiçoamento usando uma prediçãoa partir da camada de base.
49. Estrutura de sinal de video para codificação devideo escalonável, CARACTERIZADA por compreender: uma visu-alização especifica de pelo menos duas visualizações codi-ficadas como uma camada de base; epelo menos uma outra visualização das pelo menos duasvisualizações codificadas como uma camada de aperfeiçoamento,usando uma predição a partir de uma camada inferior corres-pondente a pelo menos uma dentre a visualização especifica e apelo menos uma outra visualização,em que as pelo menos duas visualizações correspondemao conteúdo de video com múltiplas visualizações e são co-dificadas com base em uma seleção dentre pelo menos duas dastécnicas de escalabilidade temporal, espacial e SNR.
50. Meio de armazenamento contendo dados de sinal devideo escalonável codificados neles, CARACTERIZADO por com-preender :uma visualização especifica de pelo menos duasvisualizações codificadas como uma camada de base; epelo menos uma outra visualização das pelo menos duasvisualizações codificadas como uma camada de aperfeiçoamento,usando uma predição a partir de uma camada inferior corres-pondente a pelo menos uma dentre a visualização especifica e apelo menos uma outra visualização,em que as pelo menos duas visualizações correspondemao conteúdo de video com múltiplas visualizações e são co-dificadas com base em uma seleção dentre pelo menos duas dastécnicas de escalabilidade temporal, espacial e SNR.
51. Aparelho, CARACTERIZADO por compreender:um codificador (100) para codificar uma primeiravisualização estereoscópica como uma camada de base e codificarpelo menos um dentre um mapa de profundidade e um mapa dedisparidade como uma camada de aperfeiçoamento usando umapredição a partir da primeira visualização estereoscópica,em que a primeira visualização estereoscópica e o pelomenos um dentre o mapa de profundidade e o mapa de disparidadecorrespondem a um conteúdo estereoscópico especifico e sãocodificados com base em uma seleção dentre pelo menos duas dastécnicas de escalabilidade temporal, espacial e SNR.
52. Aparelho, de acordo com a reivindicação 51,CARACTERIZADO pelo fato de que a camada de base e a camada deaperfeiçoamento são incluídas em um fluxo de bits de vídeo, eo referido codificador (100) adiciona informações tridimen-sionais adicionais com relação ao conteúdo estereoscópicoespecífico em uma mensagem sinalizando o fluxo de bits de vídeo.
53. Aparelho, de acordo com a reivindicação 52,CARACTERIZADO pelo fato de que a mensagem é uma mensagem deInformações Suplementares de Aperfeiçoamento (SEI).
54. Aparelho, de acordo com a reivindicação 52,CARACTERIZADO pelo fato de que a mensagem é enviada fora debanda.
55. Aparelho, de acordo com a reivindicação 52,CARACTERIZADO pelo fato de que as informações tridimensionaisadicionais são fornecidas na forma de metadados.
56. Aparelho, de acordo com a reivindicação 52,CARACTERIZADO pelo fato de que o referido codificador (100)reconstrói uma visualização não-codifiçada do conteúdo es-tereoscópico específico usando vídeo reconstruído a partir dacamada de base, de pelo menos um mapa de profundidade re-construído e um mapa de disparidade reconstruído, e das in-formações tridimensionais adicionais na mensagem, e codificauma camada de aperfeiçoamento adicional com base na visualizaçãonão-codifiçada reconstruída.
57. Aparelho, de acordo com a reivindicação 51,CARACTERIZADO pelo fato de que as técnicas de escalabilidadetemporal, espacial e de razão sinal-ruido são realizadas deacordo com a Extensão de Codificação de Video Escalonável daOrganização Internacional de Normalização Técnica/padrão deCodificação de Video Avançada Parte 10 do Grupo de Peritos emImagens em Movimento-4 da Comissão Internacional Eletrotéc-nica/padrão H.264 da União Internacional de Telecomunicações,Setor de Telecomunicações.
58. Aparelho, de acordo com a reivindicação 51,CARACTERIZADO pelo fato de que o referido codificador (100)restringe um fator de escalonamento espacial para ser igual ouinferior a um, quando é escolhida a técnica de escalabilidadeespacial.
59. Aparelho, de acordo com a reivindicação 58,CARACTERIZADO pelo fato de que o referido codificador (100)codifica pelo menos alguns blocos na camada de base e na camadade aperfeiçoamento usando predição intercamadas atribuindo, aofator de escalonamento espacial, um valor igual a 2<_n), η sendoum número inteiro maior do que zero, realizando um mapeamentode blocos de muitos para um a partir da camada de base para acamada de aperfeiçoamento, convertendo qualquer um dos pelomenos alguns blocos na camada de base com um modo de prediçãointra para um modo de predição inter, e forçando os vetores demovimento e os coeficientes da transformada discreta de cossenono modo de predição intra a serem iguais a zero.
60. Aparelho, de acordo com a reivindicação 59,CARACTERIZADO pelo fato de que o referido codificador (100)mapeia um vetor de movimento para um bloco na camada de a-perfeiçoamento para um vetor de movimento escalonado de um cantode um bloco mapeado correspondente a partir de um conjunto deblocos mapeados na camada de base, e designa um índice dereferência para o bloco na camada de aperfeiçoamento ao do cantodo bloco mapeado correspondente na camada de base, o bloco nacamada de aperfeiçoamento e o conjunto de blocos mapeados nacamada de base incluídos nos pelo menos alguns blocos, o blocona camada de aperfeiçoamento estando co-localizado com respeitoao conjunto de blocos mapeados na camada de base.
61. Aparelho, de acordo com a reivindicação 58,CARACTERIZADO pelo fato de que o referido codificador (100)codifica pelo menos alguns blocos na camada de base e na camadade aperfeiçoamento atribuindo, ao fator de escalonamento espacial,um valor igual a 2(-n), η sendo um número inteiro maior do que zero,e calculando a média para redução de amostragem de textura dosresíduos correspondentes aos pelo menos alguns blocos.
62. Aparelho, de acordo com a reivindicação 51,CARACTERIZADO pelo fato de que o par de visualizações este-reoscópicas é codificado ao permitir a predição ponderada parapredição de visualização cruzada entre a primeira visualizaçãoestereoscópica e a segunda visualização estereoscópica.
63. Aparelho, de acordo com a reivindicação 62,CARACTERIZADO pelo fato de que a predição ponderada é pos-sibilitada ao codificar uma diferença entre um macrobloco nacamada de aperfeiçoamento e um macrobloco ponderado escalonadoa partir de um conjunto de macroblocos mapeados na camada de base,o macrobloco na camada de aperfeiçoamento estando co-localizadocom respeito ao conjunto de macroblocos mapeados na camada debase.
64. Método de codificação de vídeo escalonável,CARACTERIZADO por compreender:codificar (610) uma primeira visualização estere-oscópica como uma camada de base; ecodificar (610) pelo menos um dentre um mapa deprofundidade e um mapa de disparidade como uma camada deaperfeiçoamento usando uma predição a partir da primeiravisualização estereoscópica,em que a primeira visualização estereoscópica e o pelomenos um dentre o mapa de profundidade e o mapa de disparidadecorrespondem a um conteúdo estereoscópico específico e sãocodificados com base em uma seleção dentre pelo menos duas dastécnicas de escalabilidade temporal, espacial e SNR.
65. Método, de acordo com a reivindicação 64,CARACTERIZADO pelo fato de que a camada de base e a camada deaperfeiçoamento são incluídas em um fluxo de bits de vídeo, eo referido codificador adiciona (615) informações tridimen-sionais adicionais com relação ao conteúdo estereoscópicoespecífico em uma mensagem sinalizando o fluxo de bits de vídeo.
66. Método, de acordo com a reivindicação 65,CARACTERIZADO pelo fato de que a mensagem é uma mensagem deInformações Suplementares de Aperfeiçoamento (SEI).
67. Método, de acordo com a reivindicação 65,CARACTERIZADO pelo fato de que a mensagem é enviada fora debanda.
68. Método, de acordo com a reivindicação 65,CARACTERIZADO pelo fato de que as informações tridimensionaisadicionais são fornecidas na forma de metadados.
69. Método, de acordo com a reivindicação 65,CARACTERIZADO por adicionalmente compreender:reconstruir (620) uma visualização não codificada doconteúdo estereoscópico especifico usando video reconstruído apartir da camada de base, de pelo menos um de um mapa deprofundidade reconstruído e um mapa de disparidade reconstruído,e as informações tridimensionais adicionais na mensagem; ecodificar (625) uma camada de aperfeiçoamento a-dicional com base na visualização não codificada reconstruída.
70. Método, de acordo com a reivindicação 64,CARACTERIZADO pelo fato de que as técnicas de escalabilidadetemporal, espacial e de razão sinal-ruído são realizadas deacordo com a Extensão de Codificação de Vídeo Escalonável daOrganização Internacional de Normalização Técnica/padrão deCodificação de Vídeo Avançada Parte 10 do Grupo de Peritos emImagens em Movimento-4 da Comissão Internacional Eletrotéc-nica/padrão H.264 da União Internacional de Telecomunicações,Setor de Telecomunicações.
71. Método, de acordo com a reivindicação 64,CARACTERIZADO pelo fato de que o referido codificador restringeum fator de escalonamento espacial a ser igual ou inferior a um,quando é escolhida a técnica de codificação de vídeo escalonávelespacial (855).
72. Método, de acordo com a reivindicação 71,CARACTERIZADO pelo fato de que a referida etapa de codificarcodifica pelo menos alguns blocos na camada de base e na camadade aperfeiçoamento, usando predição intercamadas, atribuindo,ao fator de escalonamento espacial, um valor iguala2(_n), η sendoum número inteiro maior do que zero, realizando um mapeamentode blocos de muitos para um a partir da camada de base para acamada de aperfeiçoamento, convertendo qualquer um dos pelomenos alguns blocos na camada de base com um modo de prediçãointra para um modo de predição inter, e forçando os vetores demovimento e os coeficientes da transformada discreta de cossenono modo de predição intra a serem iguais a zero (835, 850, 855) .
73. Método, de acordo com a reivindicação 72,CARACTERIZADO pelo fato de que a referida etapa de codificarmapeia um vetor de movimento, para um bloco na camada deaperfeiçoamento, para um vetor de movimento escalonado de umcanto de um bloco mapeado correspondente a partir de um conjuntode blocos mapeados na camada de base, e designa um índice dereferência para o bloco na camada de aperfeiçoamento ao do cantodo bloco mapeado correspondente na camada de base, o bloco nacamada de aperfeiçoamento e o conjunto de blocos mapeados nacamada de base incluídos - nos pelo menos alguns blocos, o blocona camada de aperfeiçoamento estando co-localizado com respeitoao conjunto de blocos mapeados na camada de base (835, 855).
74. Método, de acordo com a reivindicação 72,CARACTERIZADO pelo fato de que a referida etapa de codificarcodifica pelo menos alguns blocos na camada de base e na camadade aperfeiçoamento atribuindo, ao fator de escalonamentoespacial, um valor igual a 2(-n), η sendo um número inteiro maiordo que zero, e calculando a média para redução de amostragem detextura dos resíduos correspondentes aos pelo menos algunsblocos (850, 855) .
75. Método, de acordo com a reivindicação 64,CARACTERIZADO pelo fato de que o par de visualizações este-reoscópicas é codificado ao permitir a predição ponderada parapredição de visualização cruzada entre a primeira visualizaçãoestereoscópica e a segunda visualização estereoscópica (825).
76. Método, de acordo com a reivindicação 75,CARACTERIZADO pelo fato de que a predição ponderada é pos-sibilitada ao codificar uma diferença entre um macrobloco nacamada de aperfeiçoamento e um macrobloco ponderado escalonadoa partir de um conjunto de macroblocos mapeados na camada de base,o macrobloco na camada de aperfeiçoamento estando co-localizadocom respeito ao conjunto de macroblocos mapeados na camada debase.
77. Aparelho, CARACTERIZADO por compreender:um decodificador (200) para decodificar uma primeiravisualização estereoscópica a partir de uma camada de base edecodificar pelo menos um dentre um mapa de profundidade e ummapa de disparidade a partir de uma camada de aperfeiçoamentousando uma predição a partir da primeira visualização este-reoscópica,em que a primeira visualização estereoscópica e o pelomenos um dentre o mapa de profundidade e o mapa de disparidadecorrespondem a um conteúdo estereoscópico especifico e sãodecodificados com base em uma seleção dentre pelo menos duas dastécnicas de escalabilidade temporal, espacial e SNR.
78. Aparelho, de acordo com a reivindicação 77,CARACTERIZADO pelo fato de que a camada de base e a camada deaperfeiçoamento são incluídas em um fluxo de bits de vídeo, eo referido decodificador (200) lê informações tridimensionaisadicionais com relação ao conteúdo estereoscópico especifico apartir de uma mensagem sinalizando o fluxo de bits de video.
79. Aparelho, de acordo com a reivindicação 78,CARACTERIZADO pelo fato de que a mensagem é uma mensagem deInformações Suplementares de Aperfeiçoamento (SEI).
80. Aparelho, de acordo com a reivindicação 78,CARACTERIZADO pelo fato de que a mensagem é enviada fora debanda.
81. Aparelho, de acordo com a reivindicação 78,CARACTERIZADO pelo fato de que as informações tridimensionaisadicionais são fornecidas na forma de metadados.
82. Aparelho, de acordo com a reivindicação 78,CARACTERIZADO pelo fato de que o referido decodificador (200)reconstrói uma visualização não-codifiçada do conteúdo es-tereoscópico especifico como a camada de base usando videoreconstruído a partir da camada de base, de pelo menos um mapade profundidade reconstruído e um mapa de disparidade re-construído, e das informações tridimensionais adicionais namensagem, e decodifica uma camada de aperfeiçoamento adicionalcom base na visualização não codificada reconstruída para formaruma visualização não codificada refinada do conteúdo este-reoscópico específico.
83. Aparelho, de acordo com a reivindicação 77,CARACTERIZADO pelo fato de que as técnicas de escalabilidadetemporal, espacial e de razão sinal-ruído são realizadas deacordo com a Extensão de Codificação de Vídeo Escalonável daOrganização Internacional de Normalização Técnica/padrão deCodificação de Vídeo Avançada Parte 10 do Grupo de Peritos emImagens em Movimento-4 da Comissão Internacional Eletrotéc-nica/padrão H.264 da União Internacional de Telecomunicações,Setor de Telecomunicações.
84. Aparelho, de acordo com a reivindicação 77,CARACTERIZADO pelo fato de que o par de visualizações este-reoscópicas é decodificado ao permitir a predição ponderada parapredição de visualização cruzada entre a primeira visualizaçãoestereoscópica e a segunda visualização estereoscópica.
85. Aparelho, de acordo com a reivindicação 84,CARACTERIZADO pelo fato de que a predição ponderada é pos-sibilitada ao decodificar uma diferença entre um macrobloco nacamada de aperfeiçoamento e um macrobloco ponderado escalonadoa partir de um conjunto de macroblocos mapeados na camada de base,o macrobloco na camada de aperfeiçoamento estando co-localizadocom respeito ao conjunto de macroblocos mapeados na camada debase.
86. Método para decodificação de vídeo escalonável,CARACTERIZADO por compreender:decodificar (710) uma primeira visualização este-reoscópica a partir de uma camada de base; edecodificar (710) pelo menos um dentre um mapa deprofundidade e um mapa de disparidade a partir de uma camada deaperfeiçoamento usando uma predição a partir da primeiravisualização estereoscópica,em que a primeira visualização estereoscópica e o pelomenos um dentre o mapa de profundidade e o mapa de disparidadecorrespondem a um conteúdo estereoscópico específico e sãodecodificados com base em uma seleção dentre pelo menos duas dastécnicas de escalabilidade temporal, espacial e SNR.
87. Método, de acordo com a reivindicação 86,CARACTERIZADO pelo fato de que a camada de base e a camada deaperfeiçoamento são incluídas em um fluxo de bits de vídeo, ométodo adicionalmente compreendendo ler (715) informaçõestridimensionais adicionais com relação ao conteúdo estere-oscópico específico a partir de uma mensagem sinalizando o fluxode bits de vídeo.
88. Método, de acordo com a reivindicação 87,CARACTERIZADO pelo fato de que a mensagem é uma mensagem deInformações Suplementares de Aperfeiçoamento (SEI).
89. Método, de acordo com a reivindicação 87,CARACTERIZADO pelo fato de que a mensagem é enviada fora debanda.
90. Método, de acordo com a reivindicação 87,CARACTERIZADO pelo fato de que as informações tridimensionaisadicionais são fornecidas na forma de metadados.
91. Método, de acordo com a reivindicação 87,CARACTERIZADO por adicionalmente compreender:reconstruir (720) uma visualização não codificada doconteúdo estereoscópico específico como a camada de base usandovídeo reconstruído a partir da camada de base, de. pelo menos umde um mapa de profundidade reconstruído e um mapa de disparidadereconstruído, e das informações tridimensionais adicionais namensagem; edecodificar (725) uma camada de aperfeiçoamentoadicional com base na visualização não codificada reconstruídapara formar uma visualização não codificada refinada do conteúdoestereoscópico especifico.
92. Método, de acordo com a reivindicação 86,CARACTERIZADO pelo fato de que as técnicas de escalabilidadetemporal, espacial e de razão sinal-ruido são realizadas deacordo com a Extensão de Codificação de Video Escalonável daOrganização Internacional de Normalização Técnica/padrão deCodificação de Video Avançada Parte 10 do Grupo de Peritos emImagens em Movimento-4 da Comissão Internacional Eletrotéc-nica/padrão H.264 da União Internacional de Telecomunicações,Setor de Telecomunicações.
93. Método, de acordo com a reivindicação 86,CARACTERIZADO pelo fato de que o par de visualizações este-reoscópicas é decodificado ao permitir a predição ponderada parapredição de visualização cruzada entre a primeira visualizaçãoestereoscópica e a segunda visualização estereoscópica (930).
94. Método, de acordo com a reivindicação 93,CARACTERIZADO pelo fato de que a predição ponderada é pos-sibilitada ao decodificar uma diferença entre um macrobloco nacamada de aperfeiçoamento e um macrobloco ponderado escalonadoa partir de um conjunto de macroblocos mapeados na camada de base,o macrobloco na camada de aperfeiçoamento estando co-localizadocom respeito ao conjunto de macroblocos mapeados na camada debase.
95. Estrutura de sinal de video para codificação devideo escalonável, CARACTERIZADApor compreender: uma primeiravisualização estereoscópica codificada como uma camada de base;epelo menos um dentre um mapa de profundidade e um mapade disparidade codificado como uma camada de aperfeiçoamentopara permitir uma predição a partir da primeira visualizaçãoestereoscópica,em que a primeira visualização estereoscópica e o pelomenos um dentre o mapa de profundidade e o mapa de disparidadecorrespondem a um conteúdo estereoscópico especifico e sãocodificados com base em uma seleção dentre pelo menos duas dastécnicas de escalabilidade temporal, espacial e SNR.
96. Meios de armazenamento contendo dados de sinal devideo escalonável codificados neles, CARACTERIZADOS porcompreender:uma primeira visualização estereoscópica codificadacomo uma camada de base; epelo menos um dentre um mapa de profundidade e um mapade disparidade codificado como uma camada de aperfeiçoamentopara permitir uma predição a partir da primeira visualizaçãoestereoscópica,em que a primeira visualização estereoscópica e o pelomenos um dentre o mapa de profundidade e o mapa de disparidadecorrespondem a um conteúdo estereoscópico especifico e sãocodificados com base em uma seleção dentre pelo menos duas dastécnicas de escalabilidade temporal, espacial e SNR.
BRPI0616745-4A 2005-10-19 2006-10-17 codificação / decodificação de vìdeo com múltiplas visualizações usando codificação / decodificação de vìdeo escalonável BRPI0616745A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US72814105P 2005-10-19 2005-10-19
US60/728.141 2005-10-19
PCT/US2006/040658 WO2007047736A2 (en) 2005-10-19 2006-10-17 Multi-view video coding using scalable video coding

Publications (1)

Publication Number Publication Date
BRPI0616745A2 true BRPI0616745A2 (pt) 2011-06-28

Family

ID=37781683

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0616745-4A BRPI0616745A2 (pt) 2005-10-19 2006-10-17 codificação / decodificação de vìdeo com múltiplas visualizações usando codificação / decodificação de vìdeo escalonável

Country Status (8)

Country Link
US (1) US9131247B2 (pt)
EP (1) EP1946563A2 (pt)
JP (1) JP5587552B2 (pt)
KR (1) KR101475527B1 (pt)
CN (1) CN101292538B (pt)
BR (1) BRPI0616745A2 (pt)
MY (1) MY159176A (pt)
WO (1) WO2007047736A2 (pt)

Families Citing this family (185)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7068729B2 (en) 2001-12-21 2006-06-27 Digital Fountain, Inc. Multi-stage code generator and decoder for communication systems
US6307487B1 (en) 1998-09-23 2001-10-23 Digital Fountain, Inc. Information additive code generator and decoder for communication systems
US9240810B2 (en) 2002-06-11 2016-01-19 Digital Fountain, Inc. Systems and processes for decoding chain reaction codes through inactivation
EP2348640B1 (en) 2002-10-05 2020-07-15 QUALCOMM Incorporated Systematic encoding of chain reaction codes
KR101183843B1 (ko) 2003-10-06 2012-09-19 디지털 파운튼, 인크. 단일 송신기 또는 다중 송신기를 갖는 통신 시스템의 에러정정 다중-스테이지 코드 생성기 및 디코더
EP2202888A1 (en) 2004-05-07 2010-06-30 Digital Fountain, Inc. File download and streaming system
KR101208498B1 (ko) * 2005-10-10 2012-12-05 엘지전자 주식회사 디지털 방송 시스템, 방법, 및 데이터 구조
US8315308B2 (en) * 2006-01-11 2012-11-20 Qualcomm Incorporated Video coding with fine granularity spatial scalability
US20070177671A1 (en) * 2006-01-12 2007-08-02 Lg Electronics Inc. Processing multiview video
KR100943914B1 (ko) * 2006-01-12 2010-03-03 엘지전자 주식회사 다시점 비디오의 처리 방법 및 장치
KR101276847B1 (ko) 2006-01-12 2013-06-18 엘지전자 주식회사 다시점 비디오의 처리
CN101686107B (zh) 2006-02-13 2014-08-13 数字方敦股份有限公司 使用可变fec开销和保护周期的流送和缓冲
US9270414B2 (en) 2006-02-21 2016-02-23 Digital Fountain, Inc. Multiple-field based code generator and decoder for communications systems
US7971129B2 (en) 2006-05-10 2011-06-28 Digital Fountain, Inc. Code generator and decoder for communications systems operating using hybrid codes to allow for multiple efficient users of the communications systems
US9432433B2 (en) 2006-06-09 2016-08-30 Qualcomm Incorporated Enhanced block-request streaming system using signaling or block creation
US9386064B2 (en) 2006-06-09 2016-07-05 Qualcomm Incorporated Enhanced block-request streaming using URL templates and construction rules
US9209934B2 (en) 2006-06-09 2015-12-08 Qualcomm Incorporated Enhanced block-request streaming using cooperative parallel HTTP and forward error correction
US9178535B2 (en) 2006-06-09 2015-11-03 Digital Fountain, Inc. Dynamic stream interleaving and sub-stream based delivery
US9419749B2 (en) 2009-08-19 2016-08-16 Qualcomm Incorporated Methods and apparatus employing FEC codes with permanent inactivation of symbols for encoding and decoding processes
TWI344791B (en) * 2006-07-12 2011-07-01 Lg Electronics Inc A method and apparatus for processing a signal
WO2008020734A1 (en) * 2006-08-18 2008-02-21 Gwangju Institute Of Science And Technology A method and apparatus for encoding or decoding frames of different views in multiview video using global disparity
BRPI0806829A2 (pt) * 2007-01-04 2014-06-03 Thomson Licensing Método e aparelho para ocultamento de erros na transmissão de vídeo em vídeos codificados em múltiplas vistas que utilizam um alto nível de sintaxe
US8155461B2 (en) * 2007-03-27 2012-04-10 Samsung Electronics Co., Ltd. Methods and apparatuses for encoding and decoding multi-view image
HUE052116T2 (hu) 2007-04-12 2021-04-28 Dolby Int Ab Csempézés video kódolásban és dekódolásban
CN101658040B (zh) 2007-04-17 2013-09-11 汤姆森许可贸易公司 用于多视点视频编码的假设参考解码器
US10313702B2 (en) 2007-04-25 2019-06-04 Interdigital Madison Patent Holdings Inter-view prediction
EP2001235B1 (en) * 2007-06-08 2013-05-22 Samsung Electronics Co., Ltd. MPEG-4 format extension for recording stereoscopic or synthetic 3D video data with related metadata
US8558832B1 (en) * 2007-06-19 2013-10-15 Nvida Corporation System, method, and computer program product for generating a plurality of two-dimensional images and depth maps for a scene at a point in time
JP2009004940A (ja) * 2007-06-20 2009-01-08 Victor Co Of Japan Ltd 多視点画像符号化方法、多視点画像符号化装置及び多視点画像符号化プログラム
JP2009004939A (ja) * 2007-06-20 2009-01-08 Victor Co Of Japan Ltd 多視点画像復号方法、多視点画像復号装置及び多視点画像復号プログラム
KR101460362B1 (ko) 2007-06-25 2014-11-14 삼성전자주식회사 다시점 비디오 코딩에서 휘도 보상 방법 및 장치
KR20080114482A (ko) * 2007-06-26 2008-12-31 삼성전자주식회사 다시점 비디오 코딩에서 휘도 보상 방법 및 장치
US8023562B2 (en) * 2007-09-07 2011-09-20 Vanguard Software Solutions, Inc. Real-time video coding/decoding
AU2008298602A1 (en) 2007-09-12 2009-03-19 Digital Fountain, Inc. Generating and communicating source identification information to enable reliable communications
MY162861A (en) 2007-09-24 2017-07-31 Koninl Philips Electronics Nv Method and system for encoding a video data signal, encoded video data signal, method and system for decoding a video data signal
JP2011502375A (ja) * 2007-10-10 2011-01-20 韓國電子通信研究院 ステレオスコピックデータの保存および再生のためのメタデータ構造ならびにこれを利用するステレオスコピックコンテンツファイルの保存方法
CN101415114B (zh) * 2007-10-17 2010-08-25 华为终端有限公司 视频编解码方法和装置以及视频编解码器
CN101420609B (zh) * 2007-10-24 2010-08-25 华为终端有限公司 视频编码、解码方法及视频编码器、解码器
CN101170702B (zh) * 2007-11-23 2010-08-11 四川虹微技术有限公司 多视角视频编码方法
JP5128963B2 (ja) * 2008-01-08 2013-01-23 日本電信電話株式会社 動画像の多重化方法とファイル読み込み方法及び装置,並びにそのプログラムとコンピュータ読み取り可能な記録媒体
EP2281394A1 (en) 2008-04-10 2011-02-09 Thomson Licensing Method and apparatus for content replacement in live production
US8855199B2 (en) 2008-04-21 2014-10-07 Nokia Corporation Method and device for video coding and decoding
CN103297771B (zh) * 2008-04-25 2017-03-01 汤姆森许可贸易公司 使用基于深度信息的视差估计的多视点视频编码
KR101591085B1 (ko) * 2008-05-19 2016-02-02 삼성전자주식회사 영상 파일 생성 및 재생 장치 및 방법
JP5295236B2 (ja) * 2008-06-18 2013-09-18 三菱電機株式会社 三次元映像変換記録装置、三次元映像変換記録方法、記録媒体、三次元映像変換装置、及び三次元映像伝送装置
KR101539935B1 (ko) * 2008-06-24 2015-07-28 삼성전자주식회사 3차원 비디오 영상 처리 방법 및 장치
US20090317062A1 (en) * 2008-06-24 2009-12-24 Samsung Electronics Co., Ltd. Image processing method and apparatus
US20100232521A1 (en) * 2008-07-10 2010-09-16 Pierre Hagendorf Systems, Methods, and Media for Providing Interactive Video Using Scalable Video Coding
JP5437369B2 (ja) * 2008-07-21 2014-03-12 トムソン ライセンシング 3dビデオ信号の符号化装置
WO2012122423A1 (en) * 2011-03-10 2012-09-13 Dolby Laboratories Licensing Corporation Pre-processing for bitdepth and color format scalable video coding
BRPI0916963A2 (pt) 2008-08-20 2015-11-24 Thomson Licensing mapa de profundidade refinado
KR101012760B1 (ko) * 2008-09-05 2011-02-08 에스케이 텔레콤주식회사 다시점 비디오의 송수신 시스템 및 방법
AU2009299356A1 (en) * 2008-09-30 2011-08-25 Panasonic Corporation Reproduction device, recording medium, and integrated circuit
BRPI0904620A2 (pt) * 2008-09-30 2020-08-18 Panasonic Corporation meio de gravação , dispositivo de reprodução, sistema lsi, método de reprodução,óculos, e dispositivo de exibição para imagens 3d
WO2010043773A1 (en) * 2008-10-17 2010-04-22 Nokia Corporation Sharing of motion vector in 3d video coding
US8482654B2 (en) * 2008-10-24 2013-07-09 Reald Inc. Stereoscopic image format with depth information
KR101619448B1 (ko) * 2008-11-18 2016-05-10 엘지전자 주식회사 영상 신호 처리 방법 및 장치
KR101154051B1 (ko) * 2008-11-28 2012-06-08 한국전자통신연구원 다시점 영상 송수신 장치 및 그 방법
KR101158491B1 (ko) * 2008-12-08 2012-06-20 한국전자통신연구원 다시점 영상 부호화, 복호화 방법 및 그 장치.
US8587639B2 (en) * 2008-12-11 2013-11-19 Alcatel Lucent Method of improved three dimensional display technique
CN102272778B (zh) 2009-01-07 2015-05-20 汤姆森特许公司 联合深度估计
RU2689191C2 (ru) 2009-01-26 2019-05-24 Томсон Лайсенсинг Упаковка кадров для кодирования видео
WO2010087574A2 (en) 2009-01-28 2010-08-05 Lg Electronics Inc. Broadcast receiver and video data processing method thereof
BRPI1013339B1 (pt) * 2009-02-19 2021-09-21 Interdigital Madison Patent Holdings Método e aparelho para codificar vídeo, método e aparelho para decodificar vídeo, sinal de vídeo formatado para incluir informações e mídia legível por processador
US8798158B2 (en) * 2009-03-11 2014-08-05 Industry Academic Cooperation Foundation Of Kyung Hee University Method and apparatus for block-based depth map coding and 3D video coding method using the same
JP5267886B2 (ja) * 2009-04-08 2013-08-21 ソニー株式会社 再生装置、記録媒体、および情報処理方法
JP4984184B2 (ja) * 2009-04-08 2012-07-25 ソニー株式会社 再生装置および再生方法
CA2758903C (en) * 2009-04-27 2016-10-11 Lg Electronics Inc. Broadcast receiver and 3d video data processing method thereof
CN102484700A (zh) * 2009-05-01 2012-05-30 汤姆森特许公司 3d视频编码格式
US20100278232A1 (en) * 2009-05-04 2010-11-04 Sehoon Yea Method Coding Multi-Layered Depth Images
CN102461183B (zh) 2009-06-16 2015-08-19 Lg电子株式会社 广播发射机、广播接收机及其3d视频处理方法
US9774882B2 (en) 2009-07-04 2017-09-26 Dolby Laboratories Licensing Corporation Encoding and decoding architectures for format compatible 3D video delivery
US8676041B2 (en) 2009-07-04 2014-03-18 Dolby Laboratories Licensing Corporation Support of full resolution graphics, menus, and subtitles in frame compatible 3D delivery
WO2011013030A1 (en) * 2009-07-27 2011-02-03 Koninklijke Philips Electronics N.V. Combining 3d video and auxiliary data
WO2011019224A2 (ko) * 2009-08-12 2011-02-17 엘지전자 주식회사 3d 상태 정보 진단 방법 및 방송 수신기
US9414080B2 (en) * 2009-08-21 2016-08-09 Broadcom Corporation Method and system for asymmetrical rate control for 3D video compression
US9917874B2 (en) 2009-09-22 2018-03-13 Qualcomm Incorporated Enhanced block-request streaming using block partitioning or request controls for improved client-side handling
US8665968B2 (en) * 2009-09-30 2014-03-04 Broadcom Corporation Method and system for 3D video coding using SVC spatial scalability
KR101807886B1 (ko) 2009-10-14 2017-12-11 돌비 인터네셔널 에이비 깊이 맵 처리를 위한 방법 및 디바이스
JP5585047B2 (ja) * 2009-10-28 2014-09-10 ソニー株式会社 ストリーム受信装置、ストリーム受信方法、ストリーム送信装置、ストリーム送信方法及びコンピュータプログラム
CN102792699A (zh) * 2009-11-23 2012-11-21 通用仪表公司 作为到视频序列的附加通道的深度代码化
US9014276B2 (en) * 2009-12-04 2015-04-21 Broadcom Corporation Method and system for 3D video coding using SVC temporal and spatial scalabilities
US8743178B2 (en) 2010-01-05 2014-06-03 Dolby Laboratories Licensing Corporation Multi-view video format control
EP2522146B1 (en) 2010-01-06 2016-08-31 Dolby Laboratories Licensing Corporation Complexity-adaptive scalable decoding and streaming for multi-layered video systems
JP5722349B2 (ja) 2010-01-29 2015-05-20 トムソン ライセンシングThomson Licensing ブロックに基づくインターリーブ
CN102742269B (zh) 2010-02-01 2016-08-03 杜比实验室特许公司 处理图像或图像序列的样本、后处理已解码图像的方法
US8526488B2 (en) 2010-02-09 2013-09-03 Vanguard Software Solutions, Inc. Video sequence encoding system and algorithms
KR20110101099A (ko) * 2010-03-05 2011-09-15 한국전자통신연구원 복수 전송 계층 연동형 3dtv 방송 서비스 제공을 위한 송신 및 수신 방법, 송신 및 수신 장치
JP2011214948A (ja) 2010-03-31 2011-10-27 Sony Corp 情報処理装置、行動予測表示方法及びコンピュータプログラム
JP2011216965A (ja) * 2010-03-31 2011-10-27 Sony Corp 情報処理装置、情報処理方法、再生装置、再生方法、およびプログラム
CN102939754B (zh) * 2010-04-13 2016-09-07 Ge视频压缩有限责任公司 样本区域合并技术
EP3697089B1 (en) 2010-04-13 2021-09-29 GE Video Compression, LLC Inheritance in sample array multitree subdivision
ES3053791T3 (en) 2010-04-13 2026-01-26 Ge Video Compression Llc Video coding using multi-tree sub-divisions of images
BR122020007923B1 (pt) * 2010-04-13 2021-08-03 Ge Video Compression, Llc Predição interplano
WO2011136621A2 (en) * 2010-04-30 2011-11-03 Lg Electronics Inc. An apparatus of processing an image and a method of processing thereof
US8483271B2 (en) * 2010-05-06 2013-07-09 Broadcom Corporation Method and system for 3D video pre-processing and post-processing
US20110280311A1 (en) 2010-05-13 2011-11-17 Qualcomm Incorporated One-stream coding for asymmetric stereo video
JP2012019329A (ja) * 2010-07-07 2012-01-26 Sony Corp 記録装置、記録方法、再生装置、再生方法、プログラム、および記録再生装置
CN103155568B (zh) * 2010-07-08 2016-07-27 杜比实验室特许公司 用于使用参考处理信号进行多层图像和视频传输的系统和方法
US9185439B2 (en) 2010-07-15 2015-11-10 Qualcomm Incorporated Signaling data for multiplexing video components
US8619852B2 (en) * 2010-07-21 2013-12-31 Dolby Laboratories Licensing Corporation Systems and methods for multi-layered frame-compatible video delivery
US9596447B2 (en) 2010-07-21 2017-03-14 Qualcomm Incorporated Providing frame packing type information for video coding
JP2012034138A (ja) * 2010-07-29 2012-02-16 Toshiba Corp 信号処理装置及び信号処理方法
JP5340425B2 (ja) * 2010-08-09 2013-11-13 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置
US9319448B2 (en) 2010-08-10 2016-04-19 Qualcomm Incorporated Trick modes for network streaming of coded multimedia data
KR20120020627A (ko) * 2010-08-30 2012-03-08 삼성전자주식회사 3d 영상 포맷을 이용한 영상 처리 장치 및 방법
JP2013538534A (ja) 2010-09-14 2013-10-10 トムソン ライセンシング オクルージョンデータのための圧縮方法および圧縮装置
US20120075436A1 (en) * 2010-09-24 2012-03-29 Qualcomm Incorporated Coding stereo video data
CN103190152B (zh) * 2010-10-26 2016-04-27 韩国放送公社 用于三维广播的分级广播系统及方法
KR101910192B1 (ko) * 2010-11-12 2018-10-22 한국전자통신연구원 3dtv 서비스에서의 영상 압축 규격 결정 방법 및 장치
US8755438B2 (en) * 2010-11-29 2014-06-17 Ecole De Technologie Superieure Method and system for selectively performing multiple video transcoding operations
KR101303719B1 (ko) * 2011-02-03 2013-09-04 브로드콤 코포레이션 깊이 정보를 강화 계층으로 이용하기 위한 방법 및 시스템
US8958375B2 (en) 2011-02-11 2015-02-17 Qualcomm Incorporated Framing for an improved radio link protocol including FEC
US20120230432A1 (en) * 2011-03-10 2012-09-13 Jill Boyce Signaling number of active layers in video coding
US20120236115A1 (en) * 2011-03-14 2012-09-20 Qualcomm Incorporated Post-filtering in full resolution frame-compatible stereoscopic video coding
WO2012131895A1 (ja) * 2011-03-29 2012-10-04 株式会社東芝 画像符号化装置、方法及びプログラム、画像復号化装置、方法及びプログラム
KR20120118779A (ko) * 2011-04-19 2012-10-29 삼성전자주식회사 전처리 필터링을 수반한 계층 간 예측을 수행하는 비디오 부호화 방법 및 그 장치, 후처리 필터링을 수반한 계층 간 예측을 수행하는 비디오 복호화 방법 및 그 장치
CN102752588B (zh) * 2011-04-22 2017-02-15 北京大学深圳研究生院 使用空间缩放预测的视频编解码方法
US9420259B2 (en) 2011-05-24 2016-08-16 Comcast Cable Communications, Llc Dynamic distribution of three-dimensional content
JP2012249137A (ja) * 2011-05-30 2012-12-13 Sony Corp 記録装置、記録方法、再生装置、再生方法、プログラム、および記録再生装置
CN103765899B (zh) * 2011-06-15 2018-03-06 韩国电子通信研究院 用于编码和解码可伸缩视频的方法以及使用其的设备
US9521418B2 (en) 2011-07-22 2016-12-13 Qualcomm Incorporated Slice header three-dimensional video extension for slice header prediction
US11496760B2 (en) 2011-07-22 2022-11-08 Qualcomm Incorporated Slice header prediction for depth maps in three-dimensional video codecs
MX335982B (es) * 2011-08-09 2016-01-07 Samsung Electronics Co Ltd Metodo y aparato de codificacion de datos de video de vistas multiples y metodo y aparato de decodificacion.
EP2744201A4 (en) * 2011-08-09 2016-03-23 Samsung Electronics Co Ltd METHOD AND DEVICE FOR CODING A DEPTH CARD OF VIDEO DATA WITH MULTIPLE VIEWPOINTS AND METHOD AND DEVICE FOR DECODING THE CODED DEPTH CARD
US9288505B2 (en) 2011-08-11 2016-03-15 Qualcomm Incorporated Three-dimensional video with asymmetric spatial resolution
US9253233B2 (en) 2011-08-31 2016-02-02 Qualcomm Incorporated Switch signaling methods providing improved switching between representations for adaptive HTTP streaming
US9390752B1 (en) * 2011-09-06 2016-07-12 Avid Technology, Inc. Multi-channel video editing
US9473788B2 (en) 2011-09-16 2016-10-18 Dolby Laboratories Licensing Corporation Frame-compatible full resolution stereoscopic 3D compression and decompression
US10764604B2 (en) * 2011-09-22 2020-09-01 Sun Patent Trust Moving picture encoding method, moving picture encoding apparatus, moving picture decoding method, and moving picture decoding apparatus
EP2761877B8 (en) 2011-09-29 2016-07-13 Dolby Laboratories Licensing Corporation Dual-layer frame-compatible full-resolution stereoscopic 3d video delivery
TWI595770B (zh) 2011-09-29 2017-08-11 杜比實驗室特許公司 具有對稱圖像解析度與品質之圖框相容全解析度立體三維視訊傳達技術
CN103907346B (zh) * 2011-10-11 2017-05-24 联发科技股份有限公司 运动矢量预测子及视差矢量导出方法及其装置
WO2013074964A1 (en) 2011-11-16 2013-05-23 Vanguard Software Solutions, Inc. Video compression for high efficiency video coding
US9485503B2 (en) 2011-11-18 2016-11-01 Qualcomm Incorporated Inside view motion prediction among texture and depth view components
CA2856909C (en) * 2011-12-04 2016-12-06 Lg Electronics Inc. Digital broadcasting reception method and apparatus capable of displaying stereoscopic images
EP2792146A4 (en) 2011-12-17 2015-12-09 Dolby Lab Licensing Corp MULTI-STAGE NESTED FRAME COMPATIBLE VIDEO OUTPUT WITH INCREASED RESOLUTION
WO2013105207A1 (en) * 2012-01-10 2013-07-18 Panasonic Corporation Video encoding method, video encoding apparatus, video decoding method and video decoding apparatus
US20130222537A1 (en) * 2012-02-29 2013-08-29 Qualcomm Incorporated Bitstream extraction in three-dimensional video
US20130243079A1 (en) * 2012-03-19 2013-09-19 Nokia Siemens Networks Oy Storage and processing savings when adapting video bit rate to link speed
KR20130107861A (ko) * 2012-03-23 2013-10-02 한국전자통신연구원 인터 레이어 인트라 예측 방법 및 장치
GB2500712A (en) * 2012-03-30 2013-10-02 Sony Corp An Apparatus and Method for transmitting a disparity map
WO2013153808A1 (ja) * 2012-04-13 2013-10-17 パナソニック株式会社 画像復号方法および画像復号装置
WO2013156678A1 (en) * 2012-04-16 2013-10-24 Nokia Corporation An apparatus, a method and a computer program for video coding and decoding
KR20130116782A (ko) 2012-04-16 2013-10-24 한국전자통신연구원 계층적 비디오 부호화에서의 계층정보 표현방식
US10205961B2 (en) 2012-04-23 2019-02-12 Qualcomm Incorporated View dependency in multi-view coding and 3D coding
CA2864002A1 (en) * 2012-04-24 2013-10-31 Mediatek Inc. Method and apparatus of motion vector derivation for 3d video coding
US20130287093A1 (en) * 2012-04-25 2013-10-31 Nokia Corporation Method and apparatus for video coding
WO2013169025A1 (ko) * 2012-05-09 2013-11-14 엘지전자 주식회사 스케일러블 비디오 인코딩/디코딩 방법 및 장치
US9762903B2 (en) * 2012-06-01 2017-09-12 Qualcomm Incorporated External pictures in video coding
TWI630815B (zh) 2012-06-14 2018-07-21 杜比實驗室特許公司 用於立體及自動立體顯示器之深度圖傳遞格式
CN104380745B (zh) * 2012-06-22 2018-04-27 联发科技股份有限公司 图层间与视图间自适应帧内预测方法及其装置
RU2658793C2 (ru) 2012-09-03 2018-06-22 Сони Корпорейшн Устройство и способ обработки изображения
US9998727B2 (en) * 2012-09-19 2018-06-12 Qualcomm Incorporated Advanced inter-view residual prediction in multiview or 3-dimensional video coding
US9426462B2 (en) * 2012-09-21 2016-08-23 Qualcomm Incorporated Indication and activation of parameter sets for video coding
JP5883153B2 (ja) * 2012-09-25 2016-03-09 日本電信電話株式会社 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、画像復号プログラム及び記録媒体
CN104704835B (zh) * 2012-10-03 2017-11-24 联发科技股份有限公司 视频编码中运动信息管理的装置与方法
US9544612B2 (en) * 2012-10-04 2017-01-10 Intel Corporation Prediction parameter inheritance for 3D video coding
CN104782130B (zh) 2012-12-05 2018-06-08 英特尔公司 从丢失的空间可扩展层恢复运动向量
ITTO20121073A1 (it) * 2012-12-13 2014-06-14 Rai Radiotelevisione Italiana Apparato e metodo per la generazione e la ricostruzione di un flusso video
US9106922B2 (en) 2012-12-19 2015-08-11 Vanguard Software Solutions, Inc. Motion estimation engine for video encoding
US9584792B2 (en) * 2013-01-04 2017-02-28 Qualcomm Incorporated Indication of current view dependency on reference view in multiview coding file format
WO2014107074A1 (ko) * 2013-01-04 2014-07-10 삼성전자 주식회사 스케일러블 비디오의 부호화 및 복호화를 위한 움직임 보상 방법 및 장치
US9743097B2 (en) * 2013-03-01 2017-08-22 Qualcomm Incorporated Spatial motion vector scaling for scalable video coding
US9369708B2 (en) * 2013-03-27 2016-06-14 Qualcomm Incorporated Depth coding modes signaling of depth data for 3D-HEVC
US9807421B2 (en) * 2013-04-05 2017-10-31 Sharp Kabushiki Kaisha NAL unit type restrictions
KR102118524B1 (ko) * 2013-04-05 2020-06-09 브이아이디 스케일, 인크. 다수의 레이어 비디오 코딩을 위한 레이어간 참조 화상 강화
US20140301463A1 (en) * 2013-04-05 2014-10-09 Nokia Corporation Method and apparatus for video coding and decoding
WO2014166096A1 (en) * 2013-04-11 2014-10-16 Mediatek Singapore Pte. Ltd. Reference view derivation for inter-view motion prediction and inter-view residual prediction
US9288507B2 (en) * 2013-06-21 2016-03-15 Qualcomm Incorporated More accurate advanced residual prediction (ARP) for texture coding
KR101595397B1 (ko) 2013-07-26 2016-02-29 경희대학교 산학협력단 서로 다른 다계층 비디오 코덱의 통합 부호화/복호화 방법 및 장치
WO2015012514A1 (ko) * 2013-07-26 2015-01-29 경희대학교 산학협력단 서로 다른 다계층 비디오 코덱의 통합 부호화/복호화 방법 및 장치
CN104427337B (zh) * 2013-08-21 2018-03-27 杭州海康威视数字技术股份有限公司 基于目标检测的感兴趣区域视频编码方法及其装置
US8879858B1 (en) 2013-10-01 2014-11-04 Gopro, Inc. Multi-channel bit packing engine
CN103561255B (zh) * 2013-10-24 2016-01-27 洪丹 一种裸眼立体显示方法
US9854270B2 (en) * 2013-12-19 2017-12-26 Qualcomm Incorporated Device and method for scalable coding of video information
US12177417B2 (en) 2014-01-08 2024-12-24 Qualcomm Incorporated Support of non-HEVC base layer in HEVC multi-layer extensions
US20160050440A1 (en) * 2014-08-15 2016-02-18 Ying Liu Low-complexity depth map encoder with quad-tree partitioned compressed sensing
CN104284195B (zh) * 2014-10-11 2018-12-25 华为技术有限公司 三维视频中的深度图预测方法、装置、编码器和解码器
KR102517570B1 (ko) * 2015-02-11 2023-04-05 한국전자통신연구원 3dtv 방송 송수신 장치
WO2016129899A1 (ko) * 2015-02-11 2016-08-18 한국전자통신연구원 3dtv 방송 송수신 장치
US10424082B2 (en) * 2017-04-24 2019-09-24 Intel Corporation Mixed reality coding with overlays
CN109559349B (zh) * 2017-09-27 2021-11-09 虹软科技股份有限公司 一种用于标定的方法和装置
FR3080968A1 (fr) 2018-05-03 2019-11-08 Orange Procede et dispositif de decodage d'une video multi-vue, et procede et dispositif de traitement d'images.
US11468587B2 (en) * 2020-05-12 2022-10-11 Samsung Electronics Co., Ltd. System and method for depth map recovery

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5612735A (en) * 1995-05-26 1997-03-18 Luncent Technologies Inc. Digital 3D/stereoscopic video compression technique utilizing two disparity estimates
US5619256A (en) * 1995-05-26 1997-04-08 Lucent Technologies Inc. Digital 3D/stereoscopic video compression technique utilizing disparity and motion compensated predictions
US6055012A (en) * 1995-12-29 2000-04-25 Lucent Technologies Inc. Digital multi-view video compression with complexity and compatibility constraints
US6057884A (en) * 1997-06-05 2000-05-02 General Instrument Corporation Temporal and spatial scaleable coding for video object planes
KR100454194B1 (ko) * 2001-12-28 2004-10-26 한국전자통신연구원 다중 디스플레이 방식을 지원하는 양안식 동영상 부호화/복호화 장치 및 그 방법
KR100459893B1 (ko) * 2002-01-08 2004-12-04 삼성전자주식회사 동영상에서 칼라 기반의 객체를 추적하는 방법 및 그 장치
US20060045187A1 (en) * 2002-09-25 2006-03-02 Koninklijke Philips Electronics , N.V. Method and system for processing a digital video signal
EP1574079B1 (en) * 2002-10-23 2013-03-13 Koninklijke Philips Electronics N.V. Method for post-processing a 3d digital video signal
KR100751422B1 (ko) * 2002-12-27 2007-08-23 한국전자통신연구원 스테레오스코픽 비디오 부호화 및 복호화 방법, 부호화 및복호화 장치
US20050012817A1 (en) * 2003-07-15 2005-01-20 International Business Machines Corporation Selective surveillance system with active sensor management policies
US7650036B2 (en) 2003-10-16 2010-01-19 Sharp Laboratories Of America, Inc. System and method for three-dimensional video coding
KR100987775B1 (ko) * 2004-01-20 2010-10-13 삼성전자주식회사 영상의 3차원 부호화 방법
EP1719081B1 (en) * 2004-01-30 2013-09-04 Telefonaktiebolaget L M Ericsson (Publ) Prioritising data elements of a data stream
US20050185711A1 (en) * 2004-02-20 2005-08-25 Hanspeter Pfister 3D television system and method
EP1727091A1 (en) * 2004-02-27 2006-11-29 Tdvision Corporation S.A. DE C.V. Method and system for digital coding 3d stereoscopic video images
US7515759B2 (en) * 2004-07-14 2009-04-07 Sharp Laboratories Of America, Inc. 3D video coding using sub-sequences
TWI268715B (en) * 2004-08-16 2006-12-11 Nippon Telegraph & Telephone Picture encoding method, picture decoding method, picture encoding apparatus, and picture decoding apparatus
US7961963B2 (en) * 2005-03-18 2011-06-14 Sharp Laboratories Of America, Inc. Methods and systems for extended spatial scalability with picture-level adaptation
KR100732961B1 (ko) 2005-04-01 2007-06-27 경희대학교 산학협력단 다시점 영상의 스케일러블 부호화, 복호화 방법 및 장치
US8731064B2 (en) * 2006-09-11 2014-05-20 Apple Inc. Post-processing for decoder complexity scalability
US20080205791A1 (en) * 2006-11-13 2008-08-28 Ramot At Tel-Aviv University Ltd. Methods and systems for use in 3d video generation, storage and compression

Also Published As

Publication number Publication date
MY159176A (en) 2016-12-30
WO2007047736A3 (en) 2007-07-12
JP2009513074A (ja) 2009-03-26
JP5587552B2 (ja) 2014-09-10
US20100165077A1 (en) 2010-07-01
CN101292538B (zh) 2012-11-28
KR101475527B1 (ko) 2014-12-22
CN101292538A (zh) 2008-10-22
EP1946563A2 (en) 2008-07-23
KR20080063323A (ko) 2008-07-03
US9131247B2 (en) 2015-09-08
WO2007047736A2 (en) 2007-04-26

Similar Documents

Publication Publication Date Title
BRPI0616745A2 (pt) codificação / decodificação de vìdeo com múltiplas visualizações usando codificação / decodificação de vìdeo escalonável
JP6825155B2 (ja) ビデオ符号化及び復号化におけるタイリング
CN102577376B (zh) 用于多视点视频编码和解码的方法、设备和系统
Müller et al. 3D high-efficiency video coding for multi-view video and depth data
KR102227279B1 (ko) 비디오 부호화/복호화 방법 및 장치
Ho et al. Overview of multi-view video coding
EP2859724B1 (en) Method and apparatus of adaptive intra prediction for inter-layer coding
CN106464907B (zh) 运动合并模式下消除视点合成预测候选冗余的装置和方法
ES2703062T3 (es) Síntesis de visualización en vídeo 3D
US20110096832A1 (en) Depth map generation techniques for conversion of 2d video data to 3d video data
US20070104276A1 (en) Method and apparatus for encoding multiview video
KR102185200B1 (ko) 비디오 데이터 디코딩 방법 및 비디오 데이터 디코딩 장치
KR100728009B1 (ko) 다시점 동영상을 부호화하는 방법 및 장치
KR102116265B1 (ko) 서로 다른 다계층 비디오 코덱의 통합 부호화/복호화 방법 및 장치
JP2023553433A (ja) ビデオ処理の方法、装置、及びプログラム
CN101243692B (zh) 对多视角视频进行编码的方法和设备
US20130170552A1 (en) Apparatus and method for scalable video coding for realistic broadcasting
KR20140035065A (ko) 다시점 비디오 인코딩 및 디코딩 방법 및 이를 이용한 인코딩 및 디코딩 장치
JP7700373B2 (ja) ビデオ処理の方法、装置及び媒体
EP4136842A1 (en) Multiview view position supplementary enhancement information message
KR20150043164A (ko) 2d 비디오 기반 3d 비디오 코딩을 위한 병합 움직임 후보 리스트를 구성하는 방법 및 장치

Legal Events

Date Code Title Description
B15K Others concerning applications: alteration of classification

Ipc: H04N 19/615 (2014.01), H04N 19/31 (2014.01), H04N

B06T Formal requirements before examination [chapter 6.20 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B25G Requested change of headquarter approved

Owner name: THOMSON LICENSING (FR)

B25A Requested transfer of rights approved

Owner name: THOMSON LICENSING DTV (FR)

B25A Requested transfer of rights approved

Owner name: INTERDIGITAL MADISON PATENT HOLDINGS (FR)

B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]

Free format text: MANTIDO O INDEFERIMENTO UMA VEZ QUE NAO FOI APRESENTADO RECURSO DENTRO DO PRAZO LEGAL