BRPI0620497A2 - método para a criação de uma sinopse de vìdeo, sistema para transformar uma sequência de origem de quadros de vìdeo de uma primeira cena dinámica em uma sequência de sinopse de pelo menos dois quadros de vìdeo que ilustram uma segunda cena dinámica, e, produto de programa de computador - Google Patents

método para a criação de uma sinopse de vìdeo, sistema para transformar uma sequência de origem de quadros de vìdeo de uma primeira cena dinámica em uma sequência de sinopse de pelo menos dois quadros de vìdeo que ilustram uma segunda cena dinámica, e, produto de programa de computador Download PDF

Info

Publication number
BRPI0620497A2
BRPI0620497A2 BRPI0620497-0A BRPI0620497A BRPI0620497A2 BR PI0620497 A2 BRPI0620497 A2 BR PI0620497A2 BR PI0620497 A BRPI0620497 A BR PI0620497A BR PI0620497 A2 BRPI0620497 A2 BR PI0620497A2
Authority
BR
Brazil
Prior art keywords
video
synopsis
sequence
frames
objects
Prior art date
Application number
BRPI0620497-0A
Other languages
English (en)
Inventor
Peleg Shmuel
Rav-Acha Alexander
Original Assignee
Yissum Research Development Company Of The Hebrew University Of Jerusalem
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=38016397&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BRPI0620497(A2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Yissum Research Development Company Of The Hebrew University Of Jerusalem filed Critical Yissum Research Development Company Of The Hebrew University Of Jerusalem
Publication of BRPI0620497A2 publication Critical patent/BRPI0620497A2/pt
Publication of BRPI0620497B1 publication Critical patent/BRPI0620497B1/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2625Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects for obtaining an image which is composed of images from a temporal image sequence, e.g. for a stroboscopic effect
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8549Creating video summaries, e.g. movie trailer
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/16Spatio-temporal transformations, e.g. video cubism
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Studio Circuits (AREA)
  • Television Signal Processing For Recording (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

MéTODO PARA A CRIAçãO DE UMA SINóPSE DE VìDEO, SISTEMA PARA TRANSFORMAR UMA SEQUêNCIA DE ORIGEM DE QUADROS DE VìDEO DE UMA PRIMEIRA CENA DINáMICA EM UMA SEQUêNCIA DE SINOPSE DE PELO MENOS DOIS QUADROS DE VìDEO QUE ILUSTRAM UMA SEGUNDA CENA DINáMICA, E, PRODUTO DE PROGRAMA DE COMPUTADOR. Trata-se de um método e um sistema implementado por computador que transformam uma primeira seqúência de quadros de vídeo de uma primeira cena dinâmica em uma segunda seqUência de pelo menos dois quadros de vídeo que apresentam uma segunda cena dinâmica. Um subconjunto de quadros de vídeo na primeira seqUência é obtido, o qual mostra o movimento de pelo menos um objeto que tem uma pluralidade de pixeis localizados nas respectivas coordenadas x,y e são selecionadas partes do subconj unto que mostram os aparecimentos não-espacialmente sobrepostos de pelo menos um objeto na primeira cena dinâmica. As partes são copiadas de pelo menos três quadros de entrada diferentes em pelo menos dois quadros sucessivos da segunda sequência sem mudar as respectivas coordenadas x,y dos pixels no objeto e de maneira tal que pelo menos um dos quadros da segunda seqUência contenha pelo menos duas partes que aparecem em quadros diferentes na primeira sequência.

Description

MÉTODO PARA A CRIAÇAO DE UMA SINOPSE DE VIDEO7 SISTEMA PARA TRANSFORMAR UMA SEQÜÊNCIA DE ORIGEM DE QUADROS DE VÍDEO DE UMA PRIMEIRA CENA DINÂMICA EM UMA SEQÜÊNCIA DE SINOPSE DE PELO MENOS DOIS QUADROS DE VÍDEO QUE ILUSTRAM UMA SEGUNDA CENA DINÂMICA E PRODUTO DE PROGRAMA DE COMPUTADOR
CAMPO DA INVENÇÃO A presente invenção refere-se de maneira geral à renderização baseada em imagem e vídeo, onde novas imagens e os vídeos são criados mediante a combinação de partes de múltiplas imagens originais de uma cena. Particularmente, a invenção refere-se a tal técnica para a finalidade de abstração ou sinopse de vídeo.
TÉCNICA ANTERIOR As referências da técnica anterior consideradas como relevantes como um antecedente para a invenção são listadas abaixo e seus conteúdos são aqui incorporados a título de referência. Referências adicionais são mencionadas nos pedidos de patente norte-americanos provisórios números 60/736.313 e 60/759.044 e seus teores são aqui incorporados a título de referência. 0 reconhecimento das referências aqui apresentadas não deve inferido como significando que elas são de alguma maneira relevantes à Patenteabilidade da invenção aqui descrita. Cada referência é identificada por um número incluído nos colchetes e, por conseguinte a técnica anterior será mencionada por todo o relatório descritivo pelos números incluídos nos colchetes.
[1] A. Agarwala, M. Dontcheva, M. Agrawala, S. Drucker, A. Colburn, B. Curless, D. Salesin, and M. Cohen. Interactive digital photomontage. In SIGGRAPH, páginas 294-302, 2004.
[2] A. Agarwala, K. C. Zheng, C. Pai, M. Agrawala, M. Cohen, B. Curless, D. Salesin, and R. Szeliski. Panoramic video textures. In SIGGRAPH, páginas 821-827, 2005.
[3] J. Assa, Y. Caspi, and D. Cohen-Or. Action sinopse: Pose selection and illustration. In SIGGRAPH, páginas 667-676, 2005 .
[4] O. Boiman and M. Irani. Detecting irregularities in images and in video. In ICCV, páginas I: 462-469, Beijing, 2005.
[5] A. M. Ferman and A. M. Tekalp. Multiscale content extraction and representation for video indexing. Proc. of SPIE, 3229:23-31, 1997.
[6] M. Irani, P. Anandan, J. Bergen, R. Kumar, and S. Hsu. Efficient representations of video sequences and their applications. Signal Processing: Image Communication, 8(4):327-351, 1996.
[7] C. Kim and J. Hwang. An integrated scheme for object- based video abstraction. In ACM Multimedia, páginas 303-311, New York, 2000.
[8] S. Kirkpatrick, C. D. Gelatt, and M. P. Veeehi. Optimization by simulated annealing. Science, 4598(13):671- 680, 1983.
[9] V. Kolmogorov and R. Zabih. What energy functions can be minimized via graph cuts? In ECCV, páginas 65-81, 2002.
[10] Y. Li, T. Zhang, and D. Tretter. An overview of video abstraction techniques. Technical Report HPL-2001-191, HP Laboratory, 2 001.
[11] J. Oh, Q. Wen, J. Iee, and S. Hwang. Video abstraction. In S. Deb, editor, Video Data Mangement and Information Retrieval, páginas 321-346. Idea Group Inc. and IRM Press, 2004 .
[12] C. Pal and N. Jojic. Interactive montages of sprites for indexing and summarizing security video. In Vídeo Proceedings of CVPRO5, página II: 1192, 2005.
[13] A. Pope, R. Kumar, H. Sawhney, and C. Wan. Video abstraction: Summarizing video content for retrieval and visualization. In Signals, Systems and Computers, páginas 915-919, 1998.
[14] W02006/048875 Method and system for spatio-temporal video warping, pub. May 11, 2006 by S. Peleg, A. Rav-Acha and D. Lischinski. Este corresponde ao USSN 10/556,601 depositado em 02 de novembro de 2 005.
[15] A. M. Smith and T. Kanade. Video skimming and characterization through the combination of image and language understanding. In CAIVD, páginas 61-70, 1998.
[16] A. Stefanidis, P. Partsinevelos, P. Agouris, and P. Doucette. Summarizing video datasets in the spatio temporal domain. In DEXA Workshop, páginas 906-912, 2000.
[17] H. Zhong, J. Shi, and M. Visontai. Detecting unusual activity in video. In CVPR, páginas 819-826, 2004.
[18] X. Zhu, X. Wu, J. Fan, A. K. Elmagarmid, and W. G. Aref. Exploring video content structure for hierarchical summarization. Multimedia Syst., 10(2):98-115, 2004.
[19] J. Barron, D. Fleet, S. Beauchemin and T. Burkitt. Performance of optical flow techniques, volume 92, páginas 236-242 .
[20] V. Kwatra, A. Schodl, I. Essa, G. Turk and A. Bobick. Graphcut textures: image and video synthesis using graph cuts. In SIGGRAPH, páginas 227-286, Julho de 2003.
[21] C. Kim and J. Hwang, Fast and Automatic Video Object Segmentation and Tracking for Content-Based Applications, IEEE Transaetions on Circuits and Systems for Video Technology, Vol. 12, No. 2, Fevereiro de 2002, páginas 122- 129.
[22] Patente U.S. N°. 6.665.003.
ANTECEDENTES DA INVENÇÃO
A sinopse de vídeo (ou abstração) é uma representação temporalmente compacta que visa a habilitação de busca e recuperação de vídeo.
Há duas abordagens principais para a sinopse de vídeo. Em uma abordagem, um conjunto de imagens salientes (quadros chaves) é selecionado da seqüência de vídeo original. Os quadros chaves que são selecionados são aqueles que melhor representam o vídeo [7, 18] . Em uma outra abordagem, uma coleção de seqüências de vídeo curtas é selecionada [15] . A segunda abordagem é menos compacta, mas confere uma melhor impressão da dinâmica da cena. Essas abordagens (e outras) são descritas em buscas amplas na abstração de vídeo [10, 11].
Em ambas as abordagens acima, quadros inteiros são utilizados como os blocos de edificação fundamentais. Uma metodologia diferente utiliza imagens de mosaico junto com alguns meta-dados para a indexação de vídeo [6, 13, 12] .
Nessa metodologia, a imagem de sinopse estática inclui objetos de tempos diferentes.
Também são conhecidas abordagens baseadas em objetos nas quais os objetos são extraídos do vídeo de entrada [7, 5, 16] . No entanto, esses métodos utilizam a detecção do objeto para identificar quadros chaves significativos e não combinam as atividades de intervalos de tempo diferentes.
No estado da técnica, também são conhecidos métodos, para a criação de uma imagem panorâmica simples utilizando mini-cortes iterados [1] e para a criação de um filme panorâmico utilizando mini-cortes [2]. Em ambos os métodos, um problema com complexidade exponencial (no número de quadros de entrada) é aproximado e, portanto, eles são mais apropriados para um número pequeno de quadros. O trabalho relacionado neste campo é associado com a combinação de dois filmes utilizando mini-cortes [20] .
0 Pedido de Patente W02006/048875 [14] apresenta um método e um sistema para manipular o fluxo temporal em um vídeo. Uma primeira seqüência de quadros de vídeo de uma primeira cena dinâmica é transformada em uma segunda seqüência de quadros de vídeo que descrevem uma segunda cena dinâmica tal que, em um aspecto, para pelo menos uma característica na primeira cena dinâmica, as respectivas partes da primeira seqüência de quadros de vídeo são amostradas a uma taxa diferente do que as partes circundantes da primeira seqüência de quadros de vídeo; e as partes amostradas são copiadas em um quadro correspondente da segunda seqüência. Isso permite que a sincronia temporal das características em uma cena dinâmica seja mudada.
DESCRIÇÃO RESUMIDA DA INVENÇÃO
De acordo com um primeiro aspecto da invenção, é apresentado um método implementado em computador para a criação de uma sinopse de vídeo a partir da transformação de uma fonte de seqüências de quadros de vídeo de uma primeira cena dinâmica capturada em intervalos de tempo regular em uma seqüência de sinopse de quadros de vídeo mais curta, que descreve uma segunda cena dinâmica, em que o método compreende:
(a) a obtenção de um subconjunto de quadros de vídeo na dita primeira seqüência que mostram o movimento de pelo menos um objeto que compreende uma pluralidade de pixels localizados nas respectivas coordenadas x,y;
(b) a seleção das ditas partes do subconjunto que mostram aparecimentos não-espacialmente sobrepostos de pelo menos um objeto em cada quadro de vídeo; e
(c) a cópia das ditas partes de pelo menos três quadros de entrada diferentes em pelo menos dois quadros sucessivos da segunda seqüência sem mudar as respectivas coordenadas x, y dos pixels no dito objeto, e de maneira tal que pelo menos um dos quadros da segunda seqüência contenha pelo menos duas partes que aparecem em quadros diferentes na primeira seqüência. De acordo com um segundo aspecto da invenção, é apresentado um sistema para transformar uma primeira seqüência de quadros de vídeo de uma primeira cena dinâmica em uma segunda seqüência de pelo menos dois quadros de vídeo que descrevem uma segunda cena dinâmica, em que o sistema compreende:
uma primeira memória para armazenar um subconjunto de quadros de vídeo na dita primeira seqüência que mostram o movimento de pelo menos um objeto que compreende uma pluralidade de pixels localizados nas respectivas coordenadas x,y,
uma unidade da seleção acoplada à primeira memória para selecionar das ditas partes do subconjunto que mostram aparecimentos não-espacialmente sobrepostos de pelo menos um objeto em cada quadro de vídeo,
um gerador de quadros para copiar as ditas partes de pelo menos três quadros de entrada diferentes em pelo menos dois quadros sucessivos da segunda seqüência sem mudar as respectivas coordenadas x,y dos pixels no dito objeto e de maneira tal que pelo menos um dos quadros da segunda seqüência contenha pelo menos duas partes que aparecem em quadros diferentes na primeira seqüência, e
uma segunda memória para armazenar os quadros da segunda seqüência.
A invenção compreende adicionalmente, de acordo com um terceiro aspecto, um portador de dados que incorpora tangivelmente uma seqüência de quadros de vídeo de saída que ilustram uma cena dinâmica, em que pelo menos dois quadros sucessivos dos ditos quadros de vídeo de saída compreendem uma pluralidade de pixels que têm as respectivas coordenadas χ, γ e são derivados de partes de um objeto de pelo menos três quadros de entrada diferentes sem mudar as respectivas coordenadas x,y dos pixels no dito objeto e de maneira tal que pelo menos um dos quadros de vídeo de saída contenha pelo menos duas partes que aparecem em quadros de entrada diferentes.
A sinopse de vídeo dinâmica apresentada pela presente invenção é diferente das abordagens de abstração de vídeo precedentes revistas acima nas duas seguintes propriedades: (i) A sinopse de vídeo é ela própria um vídeo, expressando a dinâmica da cena. (ii) Para reduzir tanta redundância espaço-temporal quanto possível, o sincronismo relativo entre as atividades pode mudar.
Como um exemplo, consideremos o clip de vídeo esquemático representado como um volume de espaço-tempo na figura 1. O vídeo começa com uma pessoa caminhando na terra, e após um período de inatividade um pássaro está voando no céu. Os quadros inativos são omitidos na maior parte dos métodos de abstração de vídeo. A sinopse de vídeo é substancialmente mais compacta, ao rodar a pessoa e o pássaro simultaneamente. Isso constitui um uso ideal de regiões da imagem ao deslocar eventos de seu intervalo de tempo original a um outro intervalo de tempo quando nenhuma outra atividade ocorre nessa localização espacial. Tais manipulações relaxam a consistência cronológica dos eventos tal como foi apresentado primeiramente em [14].
A invenção também apresenta um método de baixo nível para produzir a sinopse de vídeo utilizando otimizações em Campos Randômicos de Markov [9].
Uma das opções fornecidas pela invenção é a capacidade de exibir múltiplos aparecimentos dinâmicos de um único objeto. Esse efeito é uma generalização dos retratos "estroboscópicos" utilizados na sinopse de vídeo tradicional de objetos móveis [6,1]. Dois esquemas diferentes para fazer isso são apresentados. Em um primeiro esquema, os instantâneos do objeto em períodos de tempo diferentes são apresentados no vídeo de saída de modo a fornecer uma indicação do progresso do objeto por todo o vídeo de uma localização inicial a uma localização final. Em um segundo esquema, o objeto não tem nenhuma localização inicial ou final definida, mas se move aleatória e imprevisivelmente. Neste caso, os instantâneos do objeto em períodos de tempo diferentes são apresentados outra vez no vídeo de saída, mas neste tempo dá a impressão de um número maior de objetos aumentados do que há realmente. 0 que ambos os esquemas compartilham em comum é que múltiplos instantâneos tirados em tempos diferentes de um vídeo de entrada são copiados em um vídeo de saída de uma maneira tal que é evitada a sobreposição espacial e sem copiar os dados de vídeo de entrada que não contribuem com o progresso dinâmico dos objetos de interesse.
Dentro do contexto da invenção e das reivindicações anexas, o termo "vídeo" é sinônimo de "filme" em seu termo mais geral contanto apenas que seja acessível como um arquivo de imagem de computador passível de pós-processamento e inclua qualquer tipo de arquivo de filme, por exemplo, digital, analógico. A câmera fica de preferência em uma posição fixa, o que significa que ela pode girar e efetuar zoom - mas não sujeitada a um movimento de translação tal como ocorre nas técnicas propostas até o presente. As cenas às quais a presente invenção diz respeito são dinâmicas em oposição, por exemplo, às cenas estáticas processadas na Patente U.S. n° . 6.665.003 [22] e outras referências relacionadas à exibição de imagens estereoscópicas qual não mostram uma cena dinâmica na qual quadros sucessivos dinâmicos têm continuidade espacial e temporal. De acordo com um aspecto da invenção, o problema é formulado como um problema de mini-corte simples que pode ser solucionado em tempo polinomial ao encontrar um fluxo máximo em um gráfico [5] .
A fim de descrever a invenção, será utilizada uma construção que é indicada como do "volume no espaço-tempo" para criar os vídeos panorâmicos dinâmicos. 0 volume no espaço-tempo pode ser construído a partir da seqüência de entrada das imagens ao empilhar seqüencialmente todos os quadros ao longo do eixo do tempo. No entanto, deve ficar compreendido que até onde diz respeito ã implementação real, não é necessário realmente construir o volume no espaço- tempo, por exemplo, ao empilhar realmente no tempo quadros bidimensionais de uma cena de fonte dinâmica. Mais tipicamente, os quadros da fonte são processados individualmente para construir quadros alvo, mas isso irá ajudar na compreensão da referência ao volume no tempo e espaço como se fosse uma construção física e não uma construção conceituai.
BREVE DESCRIÇÃO DOS DESENHOS
A fim de compreender a invenção e ver como ela pode ser executada na prática, uma realização preferida será descrita agora, apenas a título de exemplo não-limitador, com referência aos desenhos anexos, nos quais:
a Figura 1 é uma representação ilustrativa que mostra a abordagem da presente invenção para a produzir uma sinopse de vídeo compacto ao executar características temporalmente deslocadas simultaneamente;
as Figuras 2a e 2b são representações esquemáticas que ilustram as sinopses de vídeo geradas de acordo com a invenção;
as Figuras 3a, 3b e 3c são representações ilustrativas que mostram exemplos do rearranjo temporal de acordo com a invenção;
a Figura 4 é uma representação ilustrativa que mostra um único quadro de uma sinopse de vídeo utilizando um efeito estroboscõpico dinâmico ilustrado na Figura 3b;
as Figuras 5a, 5b e 5c são representações ilustrativas que mostram um exemplo quando uma sinopse curta pode descrever uma seqüência mais longa sem nenhuma perda de atividade e sem o efeito estroboscópico;
a Figura 6 é uma representação ilustrativa que mostra um exemplo adicional de uma sinopse de vídeo panorâmica de acordo com a invenção;
as Figuras 7a, 7b e 7c são representações
ilustrativas que mostram detalhes de uma sinopse de vídeo de vigilância de rua;
as Figuras 8a e 8b são representações ilustrativas que mostram detalhes de uma sinopse de vídeo de vigilância de cerca;
a Figura 9 é uma representação ilustrativa que mostra a densidade de atividade crescente de um filme de acordo com uma realização adicional da invenção;
a Figura 10 é um diagrama esquemático do processo utilizado para gerar o filme mostrado na Figura 9;
a Figura 11 é um diagrama de blocos que mostra a funcionalidade principal de um sistema de acordo com a invenção; e
a Figura 12 é um fluxograma que mostra a operação principal executada de acordo com a invenção.
DESCRIÇÃO DETALHADA DAS REALIZAÇÕES
1. Detecção de Atividade
A invenção supõe que cada pixel de entrada foi etiquetado com seu nível de "importância". Embora a partir de agora o nível de "importância" será utilizado o nível de atividade, é evidente que qualquer outra medida pode ser utilizada para a "importância" com base no pedido requerido. A avaliação do nível de importância (ou de atividade) é suposta e não é ela própria uma característica da invenção. Ela pode ser obtida utilizando um dentre vários métodos de detecção de irregularidades [4, 17], a detecção de objetos móveis, e o acompanhamento de objetos. Alternativamente, ela pode ser baseada em algoritmos de reconhecimento, tal como a detecção de rostos.
A título de exemplo, um indicador de atividade simples geralmente utilizado pode ser selecionado, onde um pixel de entrada I(x,y,t) é etiquetado como "ativo" se a sua diferença de cor da média temporal na posição (x,y) for maior do que um determinado ponto inicial. Os pixels ativos são definidos pela função característica:
<formula>formula see original document page 12</formula>
Para limpar o indicador de atividade do ruído, um filtro mediano é aplicado a χ antes de continuar com o processo de sinopse.
Embora seja possível utilizar uma medida de atividade contínua, os autores da presente invenção se concentraram no caso binário. Uma medida de atividade contínua pode ser utilizada com quase todas as equações na seguinte descrição detalhada com apenas pequenas mudanças [4, 17, 1].
Foram descritas duas realizações diferentes para a computação da sinopse de vídeo. Uma abordagem (Seção 2) utiliza a representação de gráfico e a otimização da função de custo utilizando cortes de gráfico. Uma outra abordagem (Seção 3) utiliza a segmentação e o acompanhamento de obj etos.
2. Sinopse de Vídeo por Minimização de Energia Deixar N quadros de uma seqüência de vídeo de entrada ser representados em um volume de espaço-tempo tridimensional I(x,y,t), onde (x,y) são as coordenadas espaciais desse pixel, el<t<Néo número de quadros.
Seria desejável a geração de uma sinopse de vídeo S(x, y, t) que tem as seguintes propriedades:
• A sinopse de vídeo S deve ser substancialmente mais curta do que o vídeo original J.
• A "atividade máxima" do vídeo original deve aparecer na sinopse de vídeo.
• O movimento dos objetos na sinopse de vídeo deve ser similar ao seu movimento no vídeo original.
A sinopse de vídeo deve parecer bem, e emendas visíveis ou objetos fragmentados devem ser evitados.
A sinopse de vídeo S que tem as propriedades acima é gerado com um mapeamento M, atribuindo a cada coordenada (x,y,t) na sinopse S as coordenadas de um pixel de origem de I. Foi dado enfoque ao deslocamento de tempo dos pixels, mantendo as posições espaciais fixas. Desse modo, qualquer pixel de sinopse S(x,y, t) pode advir de um pixel de entrada I (x, y, M(x, y, t)) . O deslocamento de tempo M é obtido ao solucionar um problema de minimização de energia, onde a função de custo é fornecida por
E(M) = Ea(M)+ aEd(M), (D
onde Ea(M) indica a perda na atividade, e Ed(M) indica a descontinuidade através de emendas. A perda de atividade será o número de pixels ativos no vídeo de entrada J que não aparecem na sinopse de vídeo S,
<formula>formula see original document page 13</formula>
O custo de descontinuidade Ed é definido como a soma de diferenças de cores através das emendas entre os vizinhos espaço-temporais na sinopse de vídeo e os vizinhos correspondentes no vídeo de entrada (Uma formulação similar de A pode ser encontrada em [1]): <formula>formula see original document page 14</formula>
onde ej são os seis vetores unitários que representam os seis vizinhos espaço-temporais.
As figuras 2a e 2b são representações esquemáticas que ilustram as operações no espaço-tempo que criam uma sinopse de vídeo curta através da minimização da função de custo onde o movimento de objetos móveis é ilustrado pelas "tiras de atividade" nas figuras. A parte superior representa o vídeo original, ao passo que a parte inferior representa a sinopse de vídeo. Especificamente, na figura 2a a sinopse de vídeo mais curta S é gerada do vídeo de entrada J ao incluir os pixels mais ativos. Para assegurar a lisura, quando o pixel A em S corresponde ao pixel B em I1 os seus vizinhos "além da fronteira" devem ser similares. Encontrar a minimização M ideal (3) é um problema de otimização muito grande. Uma solução aproximada é mostrada na figura 2b onde os pixels consecutivos na vídeo de sinopse são impedidos de vir dos pixels de entrada consecutivos.
Deve-se observar que a função de custo E(M)
(Equação 1) corresponde a um campo aleatório tridimensional
de Markov (MRF) onde cada nó corresponde a um pixel no volume tridimensional do filme de saída, e pode ser designado por qualquer valor de tempo que corresponde a um quadro de entrada. Os pesos nos nós estão determinados pelo custo da atividade, ao passo que as bordas entre os nós são determinadas de acordo com o custo da descontinuidade. A função de custo pode, portanto, ser minimizada por algoritmos tais como cortes de gráfico iterativos [9] .
2.1. Solução Restringida Utilizando um Gráfico Bidimensional
A otimização da Equação (1) , permitindo que cada pixel na sinopse de vídeo venha de qualquer tempo, é um problema de grande escala. Por exemplo, um vídeo de entrada de três minutos que é resumido em uma sinopse de vídeo de cinco segundos resulta em um gráfico com aproximadamente 225 nós, cada um dos quais tem 5.4 00 etiquetas.
Foi mostrado em [2] que, para casos de texturas ou objetos dinâmicos que se movem em uma trajetória horizontal, MRFs tridimensionais podem ser solucionados eficientemente ao reduzir o problema a um problema unidimensional. Nesse trabalho, são visados os objetos que se movem de uma maneira mais geral, e, portanto, são utilizadas restrições diferentes. Os pixels consecutivos na sinopse de vídeo S são impedidos de vir dos pixels consecutivos no vídeo de entrada J. Sob essa restrição, o gráfico tridimensional é reduzido em um gráfico bidimensional onde cada nó corresponde a uma localização espacial no filme da sinopse. A etiqueta de cada nó M(x,y) determina o número de quadros t em J mostrado no primeiro quadro de S1 tal como ilustrado na figura 2b. Existe uma emenda entre duas localizações vizinhas (xlfyi) e (χς,Υς) em S se M(XlfY1) * M(x2/y2), e o custo da descontinuidade Ed(M) ao longo da emenda for uma soma das diferenças de cores nessa posição espacial em todos os quadros em S.
<formula>formula see original document page 15</formula>
onde e^i são agora quatro vetores unitários que descrevem os quatro vizinhos espaciais.
O número de etiquetas para cada nó é N - K, onde N e K são os números de quadros nos vídeos de entrada e de saída, respectivamente. A perda da atividade para cada pixel é:
<formula>formula see original document page 15</formula>
3. Sinopse Baseada em Objetos
A abordagem de baixo nível para a sinopse de vídeo dinâmico tal como descrito anteriormente é limitada para satisfazer propriedades locais tais como evitar emendas visíveis. As propriedades baseadas em objetos de nível mais elevado podem ser incorporadas quando os objetos podem ser detectados. Por exemplo, para evitar o efeito estroboscópico é requerida a detecção e o acompanhamento de cada objeto no volume. Essa seção descreve uma implementação da abordagem baseada em objetos para a sinopse de vídeo dinâmico. Existem diversos métodos de sumário de vídeo baseados em objetos na literatura (por exemplo, [7, 5, 16]), e todos eles utilizam os objetos detectados para a seleção de quadros significativos. Ao contrário desses métodos, a invenção desloca objetos a tempo e cria novos quadros de sinopse que nunca apareceram na seqüência de entrada a fim de fazer um uso melhor do espaço e do tempo.
Em uma realização, os objetos móveis são detectados tal como descrito acima ao comparar cada pixel à média temporal e ao calcular o limite dessa diferença. Isto é seguido pela limpeza de ruído utilizando um filtro mediano espacial, e ao agrupar os componentes conectados espaço- temporais. Deve ser apreciado o fato que há muitos outros métodos na literatura para a detecção e o acompanhamento de objetos que podem ser utilizados para essa tarefa (por exemplo, [7, 17, 21]. Cada processo de detecção e acompanhamento de objetos resulta em um jogo de objetos, onde cada objeto b é representado por sua função característica
<formula>formula see original document page 16</formula>b
As figuras que 3a, 3b e 3c são representações ilustrativas que mostram exemplos do rearranjo temporal de acordo com a invenção. As partes superiores de cada figura representam o vídeo original, e as partes inferiores representam a sinopse de vídeo onde o movimento de objetos móveis é ilustrado pelas "tiras de atividade" nas figuras. A figura 3a mostra dois objetos gravados em tempos diferentes deslocados ao mesmo intervalo de tempo na sinopse de vídeo. A figura 3b mostra um único objeto se movendo durante um período longo dividido em segmentos que tem intervalos mais curtos de tempo, que são então executados simultaneamente, criando um efeito estroboscópico dinâmico. A figura 3c mostra que a interseção dos objetos não perturba a sinopse quando os volumes do objeto são divididos em segmentos.
De cada objeto, os segmentos são criados ao selecionar subconjuntos de quadros em que o objeto aparece. Tais segmentos podem representar intervalos de tempo diferentes, tomados opcionalmente a taxas de amostragem diferentes.
A sinopse de vídeo S será construída a partir do vídeo de entrada I utilizando as seguintes operações:
(1) Os objetos b2 ... br são extraídos do vídeo de entrada I.
(2) Um jogo de segmentos não-sobrepostos B é selecionado dos objetos originais.
(3) Um deslocamento temporal M é aplicado a cada segmento selecionado, criando uma sinopse de vídeo mais curta enquanto se evita oclusões entre objetos e permite uma costura sem emendas. Isto é explicado na figura 1 e nas figuras 3a a 3c.
A figura 4 é uma representação ilustrativa que mostra um exemplo onde um se obtém único quadro de uma sinopse de vídeo utilizando um efeito estroboscópico dinâmico tal como ilustrado na figura 3b.
As operações (2) e (3) são interrelacionadas, uma vez que seria desejável selecionar os segmentos e deslocar os mesmos no tempo para obter uma sinopse de vídeo curta e sem emendas. Deve-se apreciar o fato que a operação em (2) e (3) acima não precisa ser perfeita. Quando se refere a "segmentos não-sobrepostos", uma sobreposição pequena pode ser permitida, e se refere a "se evita oclusão" uma sobreposição pequena entre os objetos deslocados no tempo pode ser permitida mas deve ser minimizada a fim de obter um vídeo visualmente apelativo.
Na representação baseada em objetos, um pixel na sinopse resultante pode ter fontes múltiplas (vir de objetos diferentes) e, portanto, foi adicionada uma etapa pós- processamento em que todos os objetos são costurados juntos.
A imagem de fundo é gerada ao tomar um valor médio de pixel de todos os quadros da seqüência. Os objetos selecionados podem então ser misturados, utilizando pesos proporcionais à distância (no espaço de RGB) entre o valor do pixel em cada quadro e a imagem mediana. Esse mecanismo de costura é similar àquele utilizado em [6].
O jogo de todos os pixels que são mapeados para um único pixel da sinopse (x,y,t) e S como src(x,y,t) foi definido, e é denotado o número de pixels (ativos) em um objeto (ou um segmento) b como
<formula>formula see original document page 18</formula>
É então definida uma função de energia que mede o custo para uma seleção de subconjunto de segmentos B e para um deslocamento temporal M. 0 custo de deslocamento inclui uma perda de atividade Eai uma penalidade para oclusões entre os objetos E0 e um termo Ei que penaliza sinopses de vídeos longas:
<formula>formula see original document page 18</formula>
onde
<formula>formula see original document page 18</formula> <formula>formula see original document page 19</formula>
3.1 Sinopse de Vídeo Com um Comprimento Predeterminado
É descrito agora o caso onde uma sinopse de vídeo curta de um comprimento predeterminado K é construída a partir de um vídeo mais longo. Nesse esquema, cada objeto é dividido em segmentos sobrepostos e consecutivos de comprimento K. Todos os segmentos são deslocados no tempo para começarem no tempo t = 1, e fica para decidir quais segmentos devem ser incluídos na sinopse de vídeo. Obviamente, com esse esquema alguns objetos não podem aparecer na sinopse de vídeo.
Foi definido primeiramente um custo de oclusão entre todos os pares de segmentos. Deixar bi e bj serem dois segmentos com tempos de aparecimento t± e t·,·; e deixar que o suporte de cada segmento seja representado pela sua função característica x (tal como na Equação 5).
O custo entre esses dois segmentos é definido como sendo a soma de diferenças de cores entre os dois segmentos, depois de ter deslocado ao tempo t - 1.
<formula>formula see original document page 19</formula>
Para a sinopse de vídeo, foi selecionado um jogo parcial de segmentos B que minimiza o custo na Equação 6 onde agora E1 é a constante K1 e o custo de oclusão é fornecido por
<formula>formula see original document page 19</formula>
Para evitar ter que mostrar o mesmo pixel espaço- temporal duas vezes (o que é admissível, mas um desperdício), v(bi,bj) = oo foi ajustado para os segmentos b± e bj que se interceptam no filme original. Além disso, se o efeito estroboscópico for indesejável, ele pode ser evitado ao ajustar v(b±,bj) = oo para todo b± e bj que foram amostrados do mesmo objeto.
O arrefecimento simulado [8] é utilizado para minimizar a função de energia. Cada estado descreve o subconjunto de segmentos que são incluídos na sinopse, e os estados vizinhos são tomados para que sejam os jogos em que um segmento é removido, adicionado ou substituído por um outro segmento.
Após a seleção do segmento, um filme de sinopse de comprimento K é construído ao colar todos os segmentos deslocados uns aos outros. Um exemplo de um quadro de uma sinopse de vídeo que utiliza essa abordagem é fornecido na figura 4.
3.2 Sinopse de Vídeo Sem Perda
Para algumas aplicações, tais como a vigilância de vídeo, é possível que seja preferível uma sinopse de vídeo mais longa, mas na qual seja garantido que todas as atividades irão aparecer. Nesse caso, o objetivo não consiste em selecionar um jogo de segmentos de objetos tal como foi feito na seção precedente, mas, por outro lado, encontrar um rearranjo temporal compacto dos segmentos de objetos.
Outra vez, foi utilizado o arrefecimento simulado para minimizar a energia. Nesse caso, um estado corresponde a um jogo de deslocamentos do tempo para todos os segmentos, e dois estados são definidos como vizinhos se os seus deslocamentos do tempo diferirem para somente um único segmento. Há duas questões que devem ser anotadas neste caso: • Os segmentos de objetos que aparecem no primeiro ou no último quadros devem permanecer assim na sinopse de vídeo; (ou então eles podem de repente aparecer ou desaparecer). Cuidado foi tomado para que cada estado satisfaça essa restrição ao fixar os deslocamentos temporais de todos esses objetos de maneira correspondente.
• O arranjo temporal do vídeo de entrada é geralmente um mínimo local da função de energia, e, portanto, não é uma escolha preferível para inicializar o processo de arrefecimento. O arrefecimento simulado foi inicializado com um vídeo mais curto, onde todos os objetos se sobrepõem.
As figuras 5a, 5b e 5c são representações ilustrativas que mostram um exemplo dessa abordagem quando uma sinopse curta pode descrever uma seqüência mais longa sem nenhuma perda da atividade e sem o efeito estroboscópico. Três objetos podem ser deslocados no tempo para aparecerem simultaneamente. Especificamente, a figura 5a ilustra o diagrama esquemático de espaço-tempo do vídeo original (alto) e da sinopse de vídeo (fundo) . A figura 5b ilustra três quadros de vídeo original; tal como visto no diagrama na figura 5a, no vídeo original cada pessoa aparece separadamente, mas na sinopse de vídeo todos os três objetos podem aparecer juntos. A figura 5c ilustra um quadro da sinopse de vídeo que mostra todas as três pessoas simultaneamente.
4. Sinopse de Vídeo Panorâmica
Quando uma câmera vídeo está fazendo a varredura de uma cena, muita redundância pode ser eliminada ao utilizar um mosaico panorâmico. Apesar disso, os métodos existentes constroem uma única imagem panorâmica, em que a dinâmica da cena é perdida. A dinâmica limitada pode ser representada por uma imagem estroboscópica [6, 1, 3], onde os objetos móveis são indicados em diversas localizações ao longo de suas traj etórias.
Uma sinopse de vídeo panorâmica pode ser criada ao exibir simultaneamente as ações que ocorreram em tempos diferentes em regiões diferentes da cena. Uma condensação substancial pode ser obtida, uma vez que a duração da atividade para cada objeto é limitada ao tempo em que está sendo visto pela câmera. Um caso especial é quando a câmera segue um objeto tal como a leoa correndo mostrada na figura 6. Quando uma câmera segue a leoa correndo, a sinopse de vídeo é um mosaico panorâmico do fundo, e o primeiro plano inclui diversas cópias dinâmicas da leoa correndo. Neste caso, uma sinopse de vídeo curta pode ser obtida somente ao permitir o efeito estroboscópico.
A construção da sinopse de vídeo panorâmica é feita de uma maneira similar à sinopse de vídeo regular, com um estágio preliminar de alinhamento de todos os quadros em relação a algum quadro de referência. Após o alinhamento, as coordenadas da imagem dos objetos são tomadas de um sistema de coordenadas global, que pode ser o sistema de coordenadas de uma das imagens de entrada.
A fim de poder processar vídeos até mesmo quando a segmentação de objetos móveis não é perfeita, se tem oclusões penalizadas em vez de seu impedimento total. Essa penalidade de oclusão permite uma flexibilidade no arranjo temporal dos objetos, até mesmo quando a segmentação não é perfeita, e os pixels de um objeto podem incluir algum fundo.
Termos adicionais podem ser adicionados, que impelem o ordenamento temporal da sinopse de vídeo para o ordenamento do vídeo de entrada.
A minimização da energia acima em todas as seleções de segmentos possíveis B e um deslocamento temporal M é muito exaustiva devido ao grande número de possibilidades. No entanto, o problema pode ser reduzido de maneira significativamente ao restringir as soluções. Dois esquemas restringidos são descritos nas seguintes seções. 5. Exemplos de Vigilância
Uma aplicação interessante para a sinopse de vídeo pode ser o acesso a vídeos de vigilância armazenados. Quando se torna necessário examinar determinados eventos no vídeo, isso pode ser feito muito mais rapidamente com a sinopse de vídeo.
Conforme observado acima, a figura 5 mostra um exemplo do poder da sinopse de vídeo na condensação de toda a atividade em um período curto, sem perder nenhuma atividade.
Isto foi feito ao utilizar um vídeo coletado de uma câmera que monitora uma estação de café. Dois exemplos adicionais são fornecidos de câmeras reais de vigilância. As figuras 8a, 8b e 8c são representações ilustrativas que mostram detalhes de uma sinopse de vídeo de vigilância de rua. A figura 8a mostra um quadro típico do vídeo original (22 segundos) . A figura 8b ilustra um quadro de um filme da sinopse de vídeo (2 segundos) mostrando uma atividade condensada. A figura 8c ilustra um quadro de uma sinopse de vídeo mais curta (0,7 segundo), mostrando uma atividade ainda mais condensada. As imagens mostradas nessas figuras foram derivadas de um vídeo capturado por uma câmera que vigia uma rua da cidade, com os pedestres cruzando ocasionalmente o campo de visão. Muitas delas podem ser coletadas em uma sinopse muito condensada.
As figuras 8a e 8b são representações ilustrativas que mostram detalhes de uma sinopse de vídeo de vigilância de cerca. Há uma atividade muito pequena perto da cerca, e de tempo em tempo é possível ver um soldado rastejar na direção da cerca. A sinopse de vídeo mostra todos os casos de soldados rastejando e andando simultaneamente, ou opcionalmente tornando a sinopse de vídeo ainda mais curta ao
ser apresentada estroboscopicamente.
6. Indexação de Vidro Através de Sinopse de Vídeo
A sinopse de vídeo pode ser utilizada para a indexação de vídeo, fornecendo ao usuário links eficientes e intuitivos para ações de acesso nos vídeos. Isto pode ser feito ao associar com cada pixel de sinopse um ponteiro para o aparecimento do objeto correspondente no vídeo original. Na sinopse de vídeo, a informação de vídeo é projetada no "espaço de atividades", em que somente as atividades importam, independentemente de seu contexto temporal (embora ainda seja preservado o contexto espacial) . Uma vez que as atividades são concentradas em um período curto, as atividades específicas no vídeo podem ser alcançadas com facilidade.
Ficará evidente a partir da descrição acima que, quando uma câmera de vídeo está fazendo a varredura de uma cena dinâmica, o "tempo cronológico" absoluto no qual uma região se torna visível no vídeo de entrada, não faz parte da dinâmica da cena. O "tempo local" durante o período de visibilidade de cada região é mais relevante para a descrição da dinâmica na cena, e deve ser preservado quando da construção de mosaicos dinâmicos. As realizações descritas acima apresentam um primeiro aspecto da invenção. De acordo com um segundo aspecto, será mostrado agora como criar mosaicos panorâmicos sem emendas, em que a costura entre imagens evita tanto quanto possível o corte de partes dos objetos na cena, até mesmo quando esses objetos podem estar se movendo.
7. Criação de Imagem Panorâmica Utilizando um Corte Mínimo Tridimensional
Deixar I1,..., In ser os quadros da seqüência de entrada. Se supõe que a seqüência foi alinhada para um único quadro de referência utilizando um dos métodos existentes.
Para fins de simplificação, será suposto que todos os quadros depois do alinhamento são do mesmo tamanho (os pixels fora do campo de visão da câmera estarão marcados como não-válidos) . Também irá se supor que a câmera está girando no sentido horário. (Os movimentos diferentes podem ser mantidos de uma maneira similar).
Deixar que P(x,y) seja a imagem panorâmica construída. Para cada pixel (x,y) em Pé preciso escolher o quadro M(x,y) do qual esse pixel é tirado. (Isto é, se M(x,y) = k então P(x,y) = Ik(x,y)). Obviamente, sob a suposição que a câmera está girando no sentido horário, a coluna da esquerda deve ser tirada do primeiro quadro, enquanto a coluna da direita dever ser tirada do último quadro. (Outras condições de limite podem ser selecionadas para produzir imagens panorâmicas com um campo de visão menor).
O objetivo aqui é a produção de uma imagem panorâmica sem emendas. Para obter isto, tentar-se-á evitar a costura dentro de objetos, particularmente se eles estiverem se movendo. Foi empregada uma contagem de emendas similar à contagem utilizada por [1], mas em vez de solucionar (com aproximação) um problema difícil de NP1 será encontrada uma solução ideal para um problema mais restrito.
8. Formulação do Problema Como um Problema de Minimização de Energia
A diferença principal das formulações precedentes é o custo de costura, definido por:
<formula>formula see original document page 25</formula>
onde :
minM = min(M(x,y), M(x',y')) maxM = max(M(x,y), M (χ', y'))
Esse custo é razoavelmente supor que a atribuição dos quadros é contínua, o que significa que, se (x,y) e (x',y') forem pixels vizinhos, os seus quadros originais M(x,y) e Μίχ',γ') são próximos. A vantagem principal desse custo é que ele permite que seja solucionado o problema como um problema de corte mínimo em um gráfico. A função que da energia nós minimizaremos é:
<formula>formula see original document page 26</formula>
onde:
N(x,y) são os pixels na vizinhança de (x,y) .
E(x,y,x',y') é o custo da costura para cada um dos pixels vizinhos, tal como descrito na Equação 1. Valid (x,y,k) é 1 o Ik (x,y) é um pixel válido (isto é, no campo de visão da câmera).
D é um número muito grande (que representa o infinito) . 9. Construção de um Panorama Simples
Será mostrado em seguida como converter o problema de múltiplas etiquetas bidimensional (que tem uma complexidade exponencial) em um problema binário tridimensional (que tem uma complexidade polinomial, e praticamente pode ser solucionado rapidamente) . Para cada pixel x, y e o quadro de entrada k, é definido uma variável binária b(x,y,k) que é igual a um iff M(x,y) <= k. (M(x,y) é o quadro original do pixel (x,y)) . Obviamente, b(x,y,N) = 1.
Deve-se observar se for determinado b(x,y,k) para cada 1 < k < N, é possível determinar M(x,y) como o k mínimo para o qual b(x,y,k) = 1. Será escrito um termo de energia cuja minimização resulta em um panorama sem emendas. Para cada um dos pixels adjacentes (x,y) e (x',y') e para cada k, foi adicionado o termo de erro:
<formula>formula see original document page 26</formula>
para as atribuições em que b(x,y,k) * b (χ', y', k) . (Este termo de erro é simétrico). Também foi adicionada uma penalidade infinita para as atribuições em que b(x,y,k) = 1 mas b(x,y,k+l) = 0. {Y na vez que não é possível que M(x,y) <= k mas M(x,y) > k) .
Finalmente, se Ik(x,y) for um pixel não-válido, ê possível evitar escolher esse pixel ao aplicar uma penalidade infinita às atribuições b(x,y,k) = 1 b(x,y,k+l) = 0 se k > 1 ou b(x,y,k) = 1 de k = 1. (Estas atribuições implicam que M(x,y) = k).
Todos os termos acima estão em pares de variáveis em uma grade tridimensional, e, portanto, é possível descrever como minimizar uma função de energia em um MRF binário tridimensional, e minimizar o mesmo em um tempo polinomial utilizando corte mínimo [9].
10. Criação de Filme Panorâmico Utilizando um Corte Mínimo Quadridimensional
Para criar um filme panorâmico (de comprimento L) , é necessário criar uma seqüência de imagens panorâmicas. A construção de cada imagem panorâmica independentemente não é boa, uma vez que nenhuma consistência temporal é obtida. Uma outra maneira consiste em começar com uma imagem de mosaico inicial como primeiro quadro, e para as imagens de mosaico consecutivas tomar cada pixel do quadro consecutivo utilizado do mosaico precedente (Mt(x,y) = M(x,y)+1) . Essa possibilidade é similar àquela que foi descrita acima com referência à figura 2b dos desenhos.
De acordo com o segundo aspecto da invenção, é preferivelmente utilizada uma formulação diferente, que dá à costura uma oportunidade de mudar de um quadro panorâmico a outro, que é muito importante para a costura de objetos móveis bem sucedida.
Foi construído um gráfico quadridimensional que consista em L casos do gráfico tridimensional descrito anteriormente: b(x,y,k,l) = 1 ⇔ M1(x,y)k.
Para reforçar a consistência temporal, foi aplicada uma penalidade infinita às atribuições b(x,y,N,l) = 1 para cada 1 < L, e uma penalidade infinita para as atribuições b(x,y,1,1) = 0 para cada 1 > 1.
Além disso, para cada (x, y, k, 1) (1 ≤ 1 ≤ L - 1,1 ≤ k ≤ N -1) a função de custo é ajustada:
<formula>formula see original document page 28</formula>
para as atribuições b(x,y,k,l) = 1 ≠ b (x, y, k+1,1+1) . (Para 1k = N-1 só ê utilizado o termo esquerdo do custo) . Esse custo incentiva a exibição de pixels consecutivos (temporais) no filme resultante (a menos que, por exemplo, esses pixels estejam no fundo).
Uma variante desse método consiste em conectar cada pixel (x,y) não ao mesmo pixel no quadro consecutivo, mas ao pixel correspondente (x+u,y+v) de acordo com o fluxo óptico nesse pixel (u,v). Os métodos apropriados para computar o fluxo óptico podem ser encontrados, por exemplo, em [19] . 0 uso do fluxo óptico lida melhor com o caso de objetos móveis.
Outra vez, é possível minimizar a função de energia ao utilizar cortes mínimos no gráfico quadridimensional, e a solução binaria define um filme panorâmico que se reduz os problemas de costura.
11. Melhorias Práticas
Pode ser necessária uma quantidade enorme de memória para salvar o gráfico quadridimensional. Portanto, são empregadas diversas melhorias que reduzem os requisitos de memória e o tempo operacional do algoritmo:
• Conforme mencionado anteriormente, a energia pode ser minimizada sem salvar explicitamente vértices para pixels não-válidos. O número de vértices é reduzido desse modo ao número de pixels no vídeo de entrada, multiplicado pelo número de quadros no vídeo de saída.
• Em vez da solução para cada quadro no vídeo de saída, só pode ser solucionado para um jogo amostrado de quadros de saída, e interpolada a função de costura entre eles. Essa melhoria é baseada na suposição que o movimento na cena não é muito grande.
• É possível restringir cada pixel para que advenha somente de um jogo parcial de quadros de entrada. Isso faz sentido especialmente para uma seqüência de quadros tomada de um vídeo, onde o movimento entre cada par de quadros consecutivos é muito pequeno. Nesse caso, não se perde muito ao amostrar o jogo de quadros originais para cada pixel. Mas é aconselhável amostrar os quadros originais de uma maneira consistente. Por exemplo, se o quadro k for uma fonte possível para o pixel (x,y) nos 1-ésimo quadro de saída, então o quadro k+1 deve ser um quadro original possível para o pixel (x,y) no (l+l)-ésimo quadro de saída.
• É utilizada uma estrutura de multi-resolução (tal como foi feito, por exemplo, em [2]), onde uma solução grosseira é encontrada para imagens de baixa resolução (depois de borrar e de sub-amostrar), e a solução só é refinada nos limites.
12. Combinação de Vídeos com a Contagem de Interesse Será descrito agora um método para combinar filmes de acordo com uma contagem de interesse. Há diversas aplicações, tais como a criação de um filme com atividade mais densa (ou mais escassa), ou até mesmo o controle da cena em uma maneira especificada pelo usuário.
O panorama dinâmico descrito em [14] pode ser considerado como um caso especial, onde as partes diferentes do mesmo filme são combinadas para se obter um filme com um campo de visão maior: nesse caso, é definida uma contagem de interesse de acordo com a "visibilidade" de cada pixel em cada tempo. De maneira mais geral, a combinação de partes diferentes (deslocamentos no tempo ou no espaço) do mesmo filme pode ser utilizada em outros casos. Por exemplo, para tornar a atividade no filme mais densa, é possível combinar a parte diferente do filme onde a ação ocorre, a um filme novo com muita ação. A realização descrita acima com referência às figuras 1 a 8 descreve o exemplo especial de maximização da atividade, e utiliza uma metodologia diferente.
Duas questões que devem ser solucionadas são: 1. Como combinar os filmes em um filme "de boa aparência". Por exemplo, é desejável evitar problemas de costura. 2. Maximização da contagem de interesse.
Para começar, são descritas as contagens diferentes que podem ser utilizadas, e então é descrito o esquema utilizado para combinar os filmes.
Uma das características principais que podem ser utilizadas como uma função de interesse para filmes é o nível de "importância" de um pixel. Nas experiências feitas foi considerado que a "atividade" em um pixel indica a sua importância, mas outras medidas da importância também são apropriadas. A avaliação do nível de atividade não é ela própria uma característica da presente invenção e pode ser feita ao utilizar um de vários métodos tal como indicado acima na Seção 1 (Detecção da Atividade).
13. Outras Contagens
Outras contagens que podem ser utilizadas para combinar filmes:
• Contagem da Visibilidade: Quando a câmera está se movendo, ou se alguém tenta preencher uma lacuna em um vídeo, há pixels que não são visíveis. É possível penalizar (não necessariamente com uma contagem infinita) os pixels não- válidos. Desta maneira, é possível incentivar o preenchimento de lacunas (ou o aumento do campo de visão) , mas pode ser preferível não preencher a lacuna, ou utilizar o campo de visão menor se resultar em uma costura má.
• Orientação: A medida da atividade pode ser substituída por uma medida direcional. Por exemplo, é possível favorecer as regiões que se movem horizontalmente em relação às regiões que se movem verticalmente.
• Especificada pelo usuário: O usuário pode especificar uma função favorita de interesse, tal como a cor, a textura, etc. Além disso, o usuário pode especificar regiões (e momentos no tempo) manualmente com contagens diferentes. Por exemplo, ao desenhar uma máscara onde 1 denota que a atividade máxima é desejada, ao passo que 0 denota que nenhuma atividade é desejada, o usuário pode controlar a dinâmica na cena, isto é, para ocorrer em um lugar específico. 14. O Algoritmo
É empregado um método similar àquele utilizado por [20], com as seguintes mudanças:
• Foi adicionada uma contagem de interesse para que cada pixel seja escolhido de um filme ou de um outro. Essa contagem pode ser adicionada utilizando bordas de cada pixel de cada filme para os vértices terminais (fonte e fundo), e os pesos nessas bordas são as contagens de interesse.
• É (opcionalmente) computado o fluxo óptico entre cada par consecutivo de quadros. Então, para reforçar a consistência, é possível substituir as bordas entre vizinhos temporais ((x,y, t) (x,y, t+1)) pelas bordas entre vizinhos de acordo com o fluxo óptico ((x,y, t) a (x + u(x,y),y + v(x, y), t+1)) . Isso realça a transição entre os filmes costurados,uma vez que incentiva a costura para seguir o fluxo que é menos visível.
• Deve se levar em consideração não somente o custo da costura, mas também a contagem de interesse quando se decide sobre quais as partes de um filme (ou quais filmes) se deve combinar. Por exemplo, ao criar um filme com o nível de atividade mais denso, é escolhido um jogo de filmes S que maximiza a contagem:
<formula>formula see original document page 32</formula>
A figura 9b é uma representação ilustrativa que demonstra esse efeito como a densidade aumentada da atividade de um filme, um quadro original do qual é mostrado na figura 9a. Quando mais de dois filmes são combinados, é utilizada uma abordagem iterativa, onde em cada iteração um novo filme é combinado no filme resultante. Para fazer isso corretamente, devem ser consideradas as emendas e as contagens antigas que resultaram das iterações precedentes. Esse esquema, embora sem as contagens de interesse, é descrito por [20] . Um quadro de amostra do vídeo resultante é mostrado na figura 9b.
A figura 10 é um diagrama esquemático do processo. Neste exemplo, um vídeo é combinado com uma versão temporalmente deslocada dele mesmo. A combinação é feita ao utilizar um corte mínimo de acordo com os critérios descritos acima, isto é, ao maximizar a contagem de interesse enquanto é minimizado o custo da costura.
Com referência agora à figura 11, é mostrado um diagrama de blocos de um sistema 10 de acordo com a invenção para transformar uma primeira seqüência de quadros de vídeo de uma primeira cena dinâmica capturada por uma câmera 11 em uma segunda seqüência de pelo menos dois quadros de vídeo que ilustram uma segunda cena dinâmica. 0 sistema inclui uma primeira memória 12 para armazenar um subconjunto de quadros de vídeo na primeira seqüência que mostram o movimento de pelo menos um objeto que compreende uma pluralidade de pixels localizados nas respectivas coordenadas x,y. Uma unidade de seleção 13 é acoplada à primeira memória 12 para selecionar das partes do subconjunto quais aquelas que mostram aparecimentos não-espacialmente sobrepostos de pelo menos um objeto na primeira cena dinâmica. Um gerador de quadros 14 copia as partes de pelo menos três quadros de entrada diferentes em pelo menos dois quadros sucessivos da segunda seqüência sem mudar as respectivas coordenadas x,y dos pixels no objeto e de maneira tal que pelo menos um dos quadros da segunda seqüência contém pelo menos duas partes que aparecem em quadros diferentes na primeira seqüência. Os quadros da
segunda seqüência são armazenados em uma segunda memória 15 para processamento subseqüente ou exibição por uma unidade de exibição 16. O gerador de quadros 14 pode incluir uma unidade de deformação 17 para deformar espacialmente pelo menos duas das partes antes de copiar na segunda seqüência.
O sistema 10 pode ser executado na prática por um computador apropriadamente programado que tem um cartão de gráficos ou uma estação de trabalho e periféricos apropriados, tudo tal como é bem conhecido no estado da técnica.
No sistema 10, pelo menos três quadros de entrada diferentes podem ser temporalmente contíguos. O sistema 10 também pode incluir uma unidade de alinhamento 18 opcional acoplada à primeira memória para pré-alinhar a primeira seqüência de quadros de vídeo. Neste caso, a câmera 11 será acoplada à unidade de alinhamento 18 de modo a armazenar os quadros de vídeo pré-alinhados na primeira memória 12. A unidade de alinhamento 18 pode operar por meio:
da computação dos parâmetros de movimento da imagem entre os quadros na primeira seqüência a deformação dos quadros de vídeo na primeira seqüência de modo que os objetos estacionários na primeira cena dinâmica fiquem estacionários no vídeo.
Do mesmo modo, o sistema 10 também pode incluir um gerador de fatias do tempo 19 opcional acoplado à unidade de seleção 13 para varrer o volume de espaço-tempo alinhado por uma "frente do tempo" e gerar uma seqüência de fatias de tempo.
Essas características opcionais não são descritas em detalhes, uma vez que elas, bem como os termos uma "frente de tempo" e "fatias de tempo", são descritas integralmente no pedido de patente W02006/048875 acima mencionado ao qual é feita referência.
Para fins de integralidade, a figura 12 é um fluxograma que mostra as operações principais executadas pelo sistema 10 de acordo com a invenção.
Discussão
A sinopse de vídeo foi proposta como uma abordagem para condensar a atividade em um vídeo em um período de tempo muito curto. Essa representação condensada pode permitir o acesso eficiente às atividades nas seqüências de vídeo. Duas abordagens foram apresentadas: uma abordagem utiliza a otimização de gráfico de baixo nível, onde cada pixel na sinopse de vídeo é um nó nesse gráfico. Essa abordagem tem o benefício de obter a sinopse de vídeo diretamente do vídeo de entrada, mas a complexidade da solução pode ser muito grande. Uma abordagem alternativa consiste em detectar primeiramente os objetos móveis, e executar a otimização nos objetos detectados. Embora uma etapa preliminar de segmentação do movimento seja necessária na segunda aproximação, ela é muito mais rápida, e são possíveis as restrições baseadas em objetos. A atividade na sinopse de vídeo resultante é muito mais condensada do que a atividade em qualquer vídeo comum, e a visualização de tal sinopse pode parecer esquisita ao observador inexperiente. Mas quando o objetivo consiste em observar muita informação em um tempo curto, a sinopse de vídeo atinge esse objetivo. Uma atenção especial deve ser prestada à possibilidade de obter estroboscopia dinâmica. Embora permita uma redução adicional no comprimento da sinopse de vídeo, a estroboscopia dinâmica pode precisar de uma adaptação adicional do usuário. Leva algum tempo para treinar para se dar conta que as ocorrências espaciais múltiplas de um único objeto indicam um tempo de atividade mais longo. Embora tenha sido detalhada uma execução específica para a sinopse de vídeo dinâmica, muitas extensões são diretas. Por exemplo, ao invés de ter um indicador de "atividade" binário, o indicador de atividade pode ser contínuo. Uma atividade contínua pode estender as opções disponíveis para criar a sinopse de vídeo, por exemplo, ao controlar a velocidade dos objetos exibidos com base em seus níveis de atividade. A sinopse de vídeo também pode ser aplicada para os filmes longos que consistem em muitas tomadas. Teoricamente, o presente algoritmo não irá ajuntar as partes das cenas diferentes devido à penalidade de oclusão (ou a descontinuidade). Neste caso, o modelo de fundo simples utilizado para uma única tomada tem que ser substituído por um estimador de fundo ajustável. Uma outra abordagem que pode ser aplicada em filmes longos consiste no emprego de um método existente para a detecção do limite de tomada e a criação da sinopse de vídeo em cada um tomada separadamente.
Também deve ficar compreendido que o sistema de acordo com a invenção pode ser um computador apropriadamente programado. Do mesmo modo, a invenção contempla um programa de computador que pode ser lido por um computador para executar o método da invenção. A invenção contempla adicionalmente uma memória que pode ser lida por máquina que incorpora tangivelmente um programa de instruções executável pela máquina para executar o método da invenção.

Claims (15)

1. MÉTODO PARA A CRIAÇÃO DE UMA SINOPSE DE VÍDEO, ao transformar uma seqüência de origem de quadros de vídeo de uma primeira cena dinâmica capturada por uma câmera de vídeo a uma seqüência de sinopse mais curta dos quadros de vídeo que ilustram uma segunda cena dinâmica, no qual o método compreende a obtenção de um subconjunto de quadros de vídeo na dita seqüência de origem que mostram o movimento de pelo menos um objeto, em que cada objeto é um subconjunto conectado de pixels de pelo menos três quadros diferentes do vídeo de origem; em que o método é caracterizado pelo fato de compreender: a seleção de pelo menos três objetos da dita seqüência de origem, e a amostragem de cada objeto de origem selecionado de um ou mais objetos de sinopse pela amostragem temporal; a determinação, para cada objeto de sinopse, de um respectivo tempo de exibição para iniciar a sua exibição no vídeo de sinopse; e a geração do vídeo de sinopse através da exibição dos objetos de sinopse selecionados, cada um dos quais em seu tempo respectivo tempo de exibição predeterminado sem mudar a localização espacial dos ditos objetos na primeira cena dinâmica de maneira tal que pelo menos três pixels, cada um deles derivado de respectivos tempos diferentes na seqüência de origem, são exibidos simultaneamente no vídeo de sinopse.
2. MÉTODO, de acordo com a reivindicação 1, caracterizado pelo fato de que um dos objetos é um objeto de fundo.
3. MÉTODO, de acordo com a reivindicação 2, caracterizado pelo fato de incluir a costura dos objetos e do fundo em um vídeo sem costura.
4. MÉTODO, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que os objetos de origem são selecionados, e um respectivo tempo para iniciar a exibição de cada objeto de sinopse é determinado de modo a otimizar uma função de custo.
5. MÉTODO, de acordo com qualquer uma das reivindicações 1 a 4, caracterizado pelo fato de que a seqüência de origem é capturada por uma câmera que é girada em relação a um eixo geométrico em uma posição fixa, e inclui a deformação espacial de pelo menos duas das ditas partes antes de copiar para a seqüência de sinopse.
6. MÉTODO, de acordo com qualquer uma das reivindicações 1 a 4, caracterizado pelo fato de que a seqüência de origem é capturada por uma câmera estática em uma posição fixa.
7. MÉTODO, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que pelo menos três quadros de origem diferentes são temporalmente contíguos.
8. MÉTODO, de acordo com qualquer uma das reivindicações 1 a 7, caracterizado pelo fato de que as partes selecionadas são espacialmente contíguas na primeira cena dinâmica.
9. MÉTODO, de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de que dois eventos que ocorrem simultaneamente na seqüência de vídeo de origem são exibidos em momentos diferentes na seqüência de sinopse de vídeo.
10. MÉTODO, de acordo com qualquer uma das reivindicações 1 a 9, caracterizado pelo fato de ser utilizado para qualquer um dos seguintes: sinopse de vídeo para vigilância; aumento da densidade da atividade de um filme; indexação de vídeo.
11. MÉTODO, de acordo com a reivindicação 10, caracterizado pelo fato de incluir a manutenção, para cada pixel na seqüência de sinopse, de um ponteiro para um pixel correspondente na seqüência de origem.
12. MÉTODO, de acordo com qualquer uma das reivindicações 1 a 11, caracterizado pelo fato de incluir o pré-alinhamento da seqüência de origem para obter uma seqüência de origem alinhada, por meio da: (a) computação de parâmetros de movimento da imagem entre quadros na seqüência de origem; e (b) deformação dos quadros de vídeo na seqüência de origem de modo que os objetos estacionários na primeira cena dinâmica sejam estacionários na seqüência de origem alinhada.
13. SISTEMA PARA TRANSFORMAR UMA SEQÜÊNCIA DE ORIGEM DE QUADROS DE VÍDEO DE UMA PRIMEIRA CENA DINÂMICA EM UMA SEQÜÊNCIA DE SINOPSE DE PELO MENOS DOIS QUADROS DE VÍDEO QUE ILUSTRAM UMA SEGUNDA CENA DINÂMICA, em que o sistema compreende: uma primeira memória (12) para armazenar um subconjunto de quadros de vídeo na dita seqüência de origem que mostram o movimento de pelo menos um objeto, e cada objeto é um subconjunto conectado dos pixels de pelo menos três quadros de origem diferentes, em que o sistema é caracterizado pelo fato de compreender: uma unidade de seleção (13) acoplada à primeira memória (12) para selecionar pelo menos três objetos de origem da dita seqüência de origem, e para amostrar de cada objeto de origem selecionado um ou mais objetos de sinopse através de amostragem temporal, um gerador de quadros (14) para determinar para cada objeto de sinopse um respectivo tempo de exibição para iniciar a sua exibição no vídeo de sinopse e gerar o vídeo de sinopse ao exibir objetos de sinopse selecionados ou objetos derivados dos mesmos, cada um dos quais em seu respectivo tempo de exibição predeterminado sem mudar a posição espacial dos ditos objetos ou dos respectivos objetos derivados dos mesmos na primeira cena dinâmica, de maneira tal que pelo menos três pixels, cada um deles derivado de respectivos tempos diferentes na seqüência de origem, são exibidos simultaneamente no vídeo de sinopse, uma segunda memória (15) acoplada ao gerador de quadros para armazenar quadros da seqüência de sinopse, e um meio para acoplar um dispositivo de exibição (16) à segunda memória (15) para exibir a segunda cena dinâmica.
14. SISTEMA, de acordo com a reivindicação 13, caracterizado pelo fato de que o gerador de quadros (14) inclui uma unidade de deformação (17) para deformar espacialmente pelo menos duas das ditas partes antes de copiar para a seqüência de sinopse.
15. PRODUTO DE PROGRAMA DE COMPUTADOR, caracterizado pelo fato de compreender o código do programa de computador para executar o método de acordo com qualquer uma das reivindicações 1 a 12 quando o dito programa for rodado em um computador.
BRPI0620497-0A 2005-11-15 2006-11-15 método para a criação de uma sinopse de vídeo, e sistema para transformar uma sequência de origem de quadros de vídeo de uma primeira cena dinâmica em uma sequência de sinopse de pelo menos dois quadros de vídeo que ilustram uma segunda cena dinâmica. BRPI0620497B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US73631305P 2005-11-15 2005-11-15
US60/736,313 2005-11-15
US75904406P 2006-01-17 2006-01-17
US60/759,044 2006-01-17
PCT/IL2006/001320 WO2007057893A2 (en) 2005-11-15 2006-11-15 Method and system for producing a video synopsis

Publications (2)

Publication Number Publication Date
BRPI0620497A2 true BRPI0620497A2 (pt) 2011-11-16
BRPI0620497B1 BRPI0620497B1 (pt) 2018-09-25

Family

ID=38016397

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0620497-0A BRPI0620497B1 (pt) 2005-11-15 2006-11-15 método para a criação de uma sinopse de vídeo, e sistema para transformar uma sequência de origem de quadros de vídeo de uma primeira cena dinâmica em uma sequência de sinopse de pelo menos dois quadros de vídeo que ilustram uma segunda cena dinâmica.

Country Status (10)

Country Link
US (2) US8102406B2 (pt)
EP (1) EP1955205B1 (pt)
JP (1) JP4972095B2 (pt)
KR (1) KR101420885B1 (pt)
CN (1) CN101366027B (pt)
AU (1) AU2006314066B2 (pt)
BR (1) BRPI0620497B1 (pt)
CA (1) CA2640834C (pt)
DK (1) DK1955205T3 (pt)
WO (1) WO2007057893A2 (pt)

Families Citing this family (134)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2640834C (en) 2005-11-15 2014-08-19 Yissum Research Development Company Of The Hebrew University Of Jerusalem Method and system for producing a video synopsis
US8949235B2 (en) 2005-11-15 2015-02-03 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Methods and systems for producing a video synopsis using clustering
US20090180546A1 (en) 2008-01-09 2009-07-16 Rodriguez Arturo A Assistance for processing pictures in concatenated video streams
US20080115175A1 (en) * 2006-11-13 2008-05-15 Rodriguez Arturo A System and method for signaling characteristics of pictures' interdependencies
US8875199B2 (en) * 2006-11-13 2014-10-28 Cisco Technology, Inc. Indicating picture usefulness for playback optimization
US20090100482A1 (en) * 2007-10-16 2009-04-16 Rodriguez Arturo A Conveyance of Concatenation Properties and Picture Orderness in a Video Stream
JP2010509830A (ja) * 2006-11-14 2010-03-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオデータストリームの要約を生成するための方法及び装置
EP3297272A1 (en) 2007-02-01 2018-03-21 Yissum Research Development Company of the Hebrew University of Jerusalem Ltd. Method and system for video indexing and video synopsis
JP4821642B2 (ja) 2007-02-15 2011-11-24 株式会社ニコン 画像処理方法、画像処理装置、ディジタルカメラ及び画像処理プログラム
US8593506B2 (en) * 2007-03-15 2013-11-26 Yissum Research Development Company Of The Hebrew University Of Jerusalem Method and system for forming a panoramic image of a scene having minimal aspect distortion
US8275215B2 (en) * 2007-05-08 2012-09-25 Arcsoft (Shanghai) Technology Company, Ltd Merging images
US8958486B2 (en) * 2007-07-31 2015-02-17 Cisco Technology, Inc. Simultaneous processing of media and redundancy streams for mitigating impairments
US8804845B2 (en) * 2007-07-31 2014-08-12 Cisco Technology, Inc. Non-enhancing media redundancy coding for mitigating transmission impairments
US8630497B2 (en) * 2007-11-27 2014-01-14 Intelliview Technologies Inc. Analyzing a segment of video
US8718388B2 (en) 2007-12-11 2014-05-06 Cisco Technology, Inc. Video processing with tiered interdependencies of pictures
JP2009151896A (ja) * 2007-12-21 2009-07-09 Sony Corp 画像処理装置、動画再生装置、これらにおける処理方法およびプログラム
US8269765B2 (en) * 2008-02-28 2012-09-18 Autodesk, Inc. System and method for removing seam artifacts
US8416858B2 (en) * 2008-02-29 2013-04-09 Cisco Technology, Inc. Signalling picture encoding schemes and associated picture properties
WO2009152450A1 (en) 2008-06-12 2009-12-17 Cisco Technology, Inc. Picture interdependencies signals in context of mmco to assist stream manipulation
US8699578B2 (en) * 2008-06-17 2014-04-15 Cisco Technology, Inc. Methods and systems for processing multi-latticed video streams
US8971402B2 (en) 2008-06-17 2015-03-03 Cisco Technology, Inc. Processing of impaired and incomplete multi-latticed video streams
US8705631B2 (en) * 2008-06-17 2014-04-22 Cisco Technology, Inc. Time-shifted transport of multi-latticed video for resiliency from burst-error effects
US20090323822A1 (en) * 2008-06-25 2009-12-31 Rodriguez Arturo A Support for blocking trick mode operations
EP2148297A1 (en) * 2008-07-24 2010-01-27 BRITISH TELECOMMUNICATIONS public limited company Video display interface
US8259817B2 (en) * 2008-11-12 2012-09-04 Cisco Technology, Inc. Facilitating fast channel changes through promotion of pictures
JP5432677B2 (ja) * 2008-11-21 2014-03-05 イッサム リサーチ デベロップメント カンパニー オブ ザ ヘブリュー ユニバーシティー オブ イェルサレム リミテッド クラスタリングを使用したビデオ概要の生成方法とシステム
US8862987B2 (en) 2009-03-31 2014-10-14 Intel Corporation Capture and display of digital images based on related metadata
US8949883B2 (en) 2009-05-12 2015-02-03 Cisco Technology, Inc. Signalling buffer characteristics for splicing operations of video streams
JP5564643B2 (ja) * 2009-06-12 2014-07-30 博 石川 情報処理方法および情報処理装置
US8279926B2 (en) 2009-06-18 2012-10-02 Cisco Technology, Inc. Dynamic streaming with latticed representations of video
US8897603B2 (en) * 2009-08-20 2014-11-25 Nikon Corporation Image processing apparatus that selects a plurality of video frames and creates an image based on a plurality of images extracted and selected from the frames
DE102010031429A1 (de) 2010-07-16 2012-01-19 Robert Bosch Gmbh Verfahren zum Bereitstellen eines Kombinations-Videos
US10645344B2 (en) * 2010-09-10 2020-05-05 Avigilion Analytics Corporation Video system with intelligent visual display
CN101950242A (zh) * 2010-09-19 2011-01-19 电子科技大学 一种多视点场景成像缩放显示控制方法
JP5653736B2 (ja) * 2010-12-06 2015-01-14 オリンパスイメージング株式会社 カメラ、表示装置、および表示方法
AU2010257454B2 (en) * 2010-12-24 2014-03-06 Canon Kabushiki Kaisha Summary view of video objects sharing common attributes
TW201228376A (en) * 2010-12-28 2012-07-01 Altek Corp Electronic apparatus, image capturing apparatus and method thereof
CN102547103A (zh) * 2010-12-28 2012-07-04 华晶科技股份有限公司 电子装置、影像拍摄装置及其方法
JP2012191486A (ja) 2011-03-11 2012-10-04 Sony Corp 画像合成装置と画像合成方法およびプログラム
US9210468B2 (en) * 2011-03-22 2015-12-08 Sony Corporation System and method for effectively implementing a stroboscopic visual effect
EP2726937B1 (en) * 2011-06-30 2019-01-23 Nokia Technologies Oy Method, apparatus and computer program product for generating panorama images
RU2471231C1 (ru) 2011-09-30 2012-12-27 Общество с ограниченной ответственностью "Ай Ти Ви групп" Способ поиска объектов в последовательности изображений, полученных от стационарной видеокамеры
US9819711B2 (en) * 2011-11-05 2017-11-14 Neil S. Davey Online social interaction, education, and health care by analysing affect and cognitive features
CN102495907B (zh) * 2011-12-23 2013-07-03 香港应用科技研究院有限公司 具有深度信息的视频概要
US8719687B2 (en) 2011-12-23 2014-05-06 Hong Kong Applied Science And Technology Research Method for summarizing video and displaying the summary in three-dimensional scenes
US8736664B1 (en) * 2012-01-15 2014-05-27 James W. Gruenig Moving frame display
US10645345B2 (en) * 2012-07-03 2020-05-05 Verint Americas Inc. System and method of video capture and search optimization
US9274678B2 (en) 2012-09-13 2016-03-01 Google Inc. Identifying a thumbnail image to represent a video
JP5994612B2 (ja) * 2012-12-04 2016-09-21 富士通株式会社 映像編集装置および映像編集方法並びに映像編集プログラム
CN103888768B (zh) * 2012-12-21 2016-02-10 浙江大华技术股份有限公司 一种视频图像帧序列的浓缩方法及装置
US9491366B2 (en) 2013-02-01 2016-11-08 Htc Corporation Electronic device and image composition method thereof
US11165994B2 (en) 2013-05-13 2021-11-02 Texas Instruments Incorporated Analytics-driven summary views for surveillance networks
KR102021857B1 (ko) * 2013-07-23 2019-09-17 엘지전자 주식회사 이동 단말기 및 그의 파노라마 촬영방법
KR102072022B1 (ko) * 2013-09-02 2020-01-31 에스케이 텔레콤주식회사 관심영역 기반의 영상요약 장치와 그를 위한 컴퓨터로 읽을 수 있는 기록 매체
US9146455B2 (en) * 2013-09-09 2015-09-29 Disney Enterprises, Inc. Spatio-temporal video compositing
US9609236B2 (en) 2013-09-16 2017-03-28 Kyle L. Baltz Camera and image processing method
GB2519348B (en) 2013-10-18 2021-04-14 Vision Semantics Ltd Visual data mining
KR102025362B1 (ko) 2013-11-07 2019-09-25 한화테크윈 주식회사 검색 시스템 및 영상 검색 방법
CN104717457B (zh) * 2013-12-13 2018-05-18 华为技术有限公司 一种视频浓缩方法及装置
CN103793477B (zh) * 2014-01-10 2017-02-08 同观科技(深圳)有限公司 用于生成视频摘要的系统及方法
CN103826125B (zh) * 2014-01-20 2017-10-27 北京创鑫汇智科技发展有限责任公司 用于已压缩监控视频的浓缩分析方法和装置
US9877086B2 (en) 2014-01-26 2018-01-23 BriefCam Ltd. Method and system for producing relevance sorted video summary
CN103886089B (zh) * 2014-03-31 2017-12-15 吴怀正 基于学习的行车记录视频浓缩方法
KR101482226B1 (ko) * 2014-05-13 2015-01-22 주식회사 다이나맥스 시놉시스 영상감시 기능을 수행하는 cctv 통합관제시스템을 구현하기 위한 방법
KR101482924B1 (ko) * 2014-05-13 2015-01-15 주식회사 다이나맥스 시놉시스 영상을 생성하여 영상감시 기능을 수행하는 cctv 통합관제시스템
KR102170694B1 (ko) 2014-07-07 2020-10-27 한화테크윈 주식회사 비디오써머리를 제공하는 영상재생장치 및 영상재생장치에서 비디오써머리를 제공하는 방법
KR101594605B1 (ko) * 2014-07-16 2016-02-16 유용호 전신 디스플레이 장치
TWI586176B (zh) * 2014-10-01 2017-06-01 大猩猩科技股份有限公司 基於壓縮視訊之縮時概要產出系統與方法
KR101994291B1 (ko) 2014-10-14 2019-06-28 한화테크윈 주식회사 통합써머리를 제공하는 영상재생장치 및 방법
US9959903B2 (en) 2014-10-23 2018-05-01 Qnap Systems, Inc. Video playback method
US10424341B2 (en) 2014-11-12 2019-09-24 Massachusetts Institute Of Technology Dynamic video summarization
EP3023987B1 (en) * 2014-11-20 2017-03-22 Axis AB Method and apparatus for visualizing information of a digital video stream
KR102268596B1 (ko) * 2014-12-08 2021-06-23 한화테크윈 주식회사 메타데이터 기반 비디오 데이터의 전송조건 변경장치 및 방법
JP6503881B2 (ja) * 2015-05-20 2019-04-24 株式会社リコー コンテンツ提供システム、情報処理装置、プログラム、コンテンツ再生方法
GB2541193A (en) * 2015-08-10 2017-02-15 Nokia Technologies Oy Handling video content
US9805567B2 (en) 2015-09-14 2017-10-31 Logitech Europe S.A. Temporal video streaming and summaries
US9313556B1 (en) 2015-09-14 2016-04-12 Logitech Europe S.A. User interface for video summaries
US10299017B2 (en) 2015-09-14 2019-05-21 Logitech Europe S.A. Video searching for filtered and tagged motion
CN108351965B (zh) 2015-09-14 2022-08-02 罗技欧洲公司 视频摘要的用户界面
CN105554456B (zh) * 2015-12-21 2018-11-23 北京旷视科技有限公司 视频处理方法和设备
US20170228440A1 (en) * 2016-02-10 2017-08-10 Virdree BURNS Method of facilitating pattern recognition through organizing data based on their sequencing relationship
KR101805018B1 (ko) * 2016-07-08 2017-12-06 한양대학교 산학협력단 컴팩트 비디오 생성 장치, 방법 및 컴퓨터 프로그램이 기록된 기록매체
TWI604323B (zh) 2016-11-10 2017-11-01 財團法人工業技術研究院 視訊索引建立方法及應用其之裝置
EP3535974A4 (en) 2016-12-08 2019-09-11 Zhejiang Dahua Technology Co., Ltd METHOD AND SYSTEMS FOR VIDEO SYNOPSIS
TR201702177A2 (pt) 2017-02-14 2018-09-21 Akif Ekin
US10956773B2 (en) 2017-03-02 2021-03-23 Ricoh Company, Ltd. Computation of audience metrics focalized on displayed content
US10720182B2 (en) 2017-03-02 2020-07-21 Ricoh Company, Ltd. Decomposition of a video stream into salient fragments
US10949705B2 (en) 2017-03-02 2021-03-16 Ricoh Company, Ltd. Focalized behavioral measurements in a video stream
US10929685B2 (en) 2017-03-02 2021-02-23 Ricoh Company, Ltd. Analysis of operator behavior focalized on machine events
US10956494B2 (en) 2017-03-02 2021-03-23 Ricoh Company, Ltd. Behavioral measurements in a video stream focalized on keywords
US10949463B2 (en) 2017-03-02 2021-03-16 Ricoh Company, Ltd. Behavioral measurements in a video stream focalized on keywords
US10708635B2 (en) 2017-03-02 2020-07-07 Ricoh Company, Ltd. Subsumption architecture for processing fragments of a video stream
US10713391B2 (en) 2017-03-02 2020-07-14 Ricoh Co., Ltd. Tamper protection and video source identification for video processing pipeline
US10719552B2 (en) 2017-03-02 2020-07-21 Ricoh Co., Ltd. Focalized summarizations of a video stream
US10943122B2 (en) 2017-03-02 2021-03-09 Ricoh Company, Ltd. Focalized behavioral measurements in a video stream
US10956495B2 (en) 2017-03-02 2021-03-23 Ricoh Company, Ltd. Analysis of operator behavior focalized on machine events
US10929707B2 (en) 2017-03-02 2021-02-23 Ricoh Company, Ltd. Computation of audience metrics focalized on displayed content
CN110753933A (zh) * 2017-04-14 2020-02-04 脸谱公司 反应性简档肖像
EP3413270A1 (en) * 2017-06-07 2018-12-12 Thomson Licensing Device and method for editing a virtual reality scene represented in a curved shape form
CN109600544B (zh) * 2017-09-30 2021-11-23 阿里巴巴集团控股有限公司 一种局部动态影像生成方法及装置
US10909378B2 (en) 2017-11-07 2021-02-02 Comcast Cable Communications, Llc Processing content based on natural language queries
AU2017272325A1 (en) 2017-12-08 2019-06-27 Canon Kabushiki Kaisha System and method of generating a composite frame
WO2019142179A1 (en) 2018-01-21 2019-07-25 Anzu Virtual Reality Ltd An object viewability determination system and method
KR102095097B1 (ko) * 2018-01-29 2020-03-30 한국과학기술원 생성적 적대 네트워크를 이용한 비디오 시퀀스 생성 시스템 및 그 방법
KR102147100B1 (ko) 2018-04-04 2020-08-25 한국과학기술연구원 복수의 영상 장비를 사용하여 관심 객체 식별에 의한 비디오 요약을 생성하는 방법 및 이를 수행하는 시스템
CN108521614B (zh) * 2018-04-25 2020-06-12 中影数字巨幕(北京)有限公司 电影介绍生成方法和系统
US20200036909A1 (en) 2018-07-27 2020-01-30 BriefCam Ltd. System and method allowing simultaneous viewing of live and recorded video content
US10820029B2 (en) 2018-10-24 2020-10-27 Motorola Solutions, Inc. Alerting groups of user devices to similar video content of interest based on role
US11527265B2 (en) 2018-11-02 2022-12-13 BriefCam Ltd. Method and system for automatic object-aware video or audio redaction
US10958854B2 (en) 2018-11-02 2021-03-23 BriefCam Ltd. Computer-implemented method for generating an output video from multiple video sources
EP3878187A4 (en) 2018-11-07 2022-08-10 Genetec Inc. METHODS AND SYSTEMS FOR DETECTING ABNORMAL MOTION IN A VIDEO STREAM AND PRODUCING A VIDEO SUMMARY
CN109257621A (zh) * 2018-11-09 2019-01-22 惠州学院 一种基于云计算技术的图像视频检索系统
WO2020213426A1 (ja) * 2019-04-18 2020-10-22 ソニー株式会社 画像処理装置、画像処理方法、及び、プログラム
CN110505534B (zh) * 2019-08-26 2022-03-08 腾讯科技(深圳)有限公司 监控视频处理方法、装置及存储介质
KR102271929B1 (ko) 2019-09-17 2021-07-02 한국과학기술연구원 장면 이해를 통해 비디오 요약을 생성하는 방법 및 이를 위한 시스템
JP7446760B2 (ja) * 2019-10-07 2024-03-11 キヤノン株式会社 情報処理装置、映像の要約方法、およびプログラム
JP2021064870A (ja) 2019-10-15 2021-04-22 キヤノン株式会社 情報処理装置、情報処理システム、情報処理方法およびプログラム
JP7451172B2 (ja) * 2019-12-24 2024-03-18 キヤノン株式会社 情報処理装置、映像の要約方法、およびプログラム
US10965908B1 (en) 2020-03-30 2021-03-30 Logitech Europe S.A. Advanced video conferencing systems and methods
US10972655B1 (en) 2020-03-30 2021-04-06 Logitech Europe S.A. Advanced video conferencing systems and methods
US10904446B1 (en) 2020-03-30 2021-01-26 Logitech Europe S.A. Advanced video conferencing systems and methods
US10951858B1 (en) 2020-03-30 2021-03-16 Logitech Europe S.A. Advanced video conferencing systems and methods
CN111325665A (zh) * 2020-04-07 2020-06-23 同创蓝天投资管理(北京)有限公司 基于网络全景图的视频轻量嵌入方法
CN113781519A (zh) * 2020-06-09 2021-12-10 华为技术有限公司 目标跟踪方法和目标跟踪装置
KR102223010B1 (ko) 2020-07-15 2021-03-05 (주)비상정보통신 객체 인식 기반의 채널 재조정 편집이 가능한 다중화면 검색기술 지원 시스템 및 방법
CN112488153B (zh) * 2020-11-06 2022-07-05 中国人民解放军国防科技大学 基于聚类趋向性原理的气味源自主搜索及定位方法
US12164969B2 (en) * 2021-01-15 2024-12-10 Samsung Electronics Co., Ltd. Method and system for learning to temporal align signals with interspersed outliers
US11941393B2 (en) * 2021-11-01 2024-03-26 Capital One Services, Llc Systems and methods for managing a software repository
KR102446832B1 (ko) 2021-12-20 2022-09-22 김승모 영상내 객체 검출 시스템 및 그 방법
KR102493856B1 (ko) * 2022-08-26 2023-02-01 임요셉 운동 영상에 기초한 합성 영상 제공 방법
KR102879024B1 (ko) * 2023-01-03 2025-10-31 주식회사 엘지유플러스 개선된 비디오 시놉시스 수행 방법 및 장치
EP4456068A1 (en) * 2023-04-24 2024-10-30 Briefcam Ltd. Interaction-aware video synopsis
CN116797993B (zh) * 2023-05-13 2024-03-19 全景智联(武汉)科技有限公司 一种基于智慧社区场景的监控方法、系统、介质及设备
CN119206066B (zh) * 2024-09-11 2025-04-18 天津大学 一种面向大场景视频的动态三维人群重建方法

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774593A (en) 1995-07-24 1998-06-30 University Of Washington Automatic scene decomposition and optimization of MPEG compressed video
US5911008A (en) 1996-04-30 1999-06-08 Nippon Telegraph And Telephone Corporation Scheme for detecting shot boundaries in compressed video data using inter-frame/inter-field prediction coding and intra-frame/intra-field coding
US5768447A (en) * 1996-06-14 1998-06-16 David Sarnoff Research Center, Inc. Method for indexing image information using a reference model
TW303555B (en) 1996-08-08 1997-04-21 Ind Tech Res Inst Digital data detecting method
US6057884A (en) * 1997-06-05 2000-05-02 General Instrument Corporation Temporal and spatial scaleable coding for video object planes
US6337683B1 (en) * 1998-05-13 2002-01-08 Imove Inc. Panoramic movies which simulate movement through multidimensional space
US6665003B1 (en) 1998-09-17 2003-12-16 Issum Research Development Company Of The Hebrew University Of Jerusalem System and method for generating and displaying panoramic images and movies
US7016540B1 (en) 1999-11-24 2006-03-21 Nec Corporation Method and system for segmentation, classification, and summarization of video images
US6549643B1 (en) 1999-11-30 2003-04-15 Siemens Corporate Research, Inc. System and method for selecting key-frames of video data
US6665423B1 (en) 2000-01-27 2003-12-16 Eastman Kodak Company Method and system for object-oriented motion-based video description
AUPQ535200A0 (en) 2000-01-31 2000-02-17 Canon Kabushiki Kaisha Extracting key frames from a video sequence
KR100698106B1 (ko) 2000-03-07 2007-03-26 엘지전자 주식회사 엠펙(mpeg)압축 비디오 환경에서 계층적 혼합형장면 변화 검출 방법
US7522186B2 (en) * 2000-03-07 2009-04-21 L-3 Communications Corporation Method and apparatus for providing immersive surveillance
EP1287518B1 (en) * 2000-04-07 2010-09-15 Dartfish SA Automated stroboscoping of video sequences
US6879332B2 (en) 2000-05-16 2005-04-12 Groxis, Inc. User interface for displaying and exploring hierarchical information
US20020051077A1 (en) 2000-07-19 2002-05-02 Shih-Ping Liou Videoabstracts: a system for generating video summaries
US6697523B1 (en) 2000-08-09 2004-02-24 Mitsubishi Electric Research Laboratories, Inc. Method for summarizing a video using motion and color descriptors
US7212726B2 (en) * 2000-09-15 2007-05-01 International Business Machines Corporation System and method of processing MPEG streams for file index insertion
US6925455B2 (en) 2000-12-12 2005-08-02 Nec Corporation Creating audio-centric, image-centric, and integrated audio-visual summaries
US7110458B2 (en) 2001-04-27 2006-09-19 Mitsubishi Electric Research Laboratories, Inc. Method for summarizing a video using motion descriptors
US6904420B2 (en) 2001-05-17 2005-06-07 Honeywell International Inc. Neuro/fuzzy hybrid approach to clustering data
US7480864B2 (en) 2001-10-12 2009-01-20 Canon Kabushiki Kaisha Zoom editor
US6961732B2 (en) 2001-12-18 2005-11-01 General Electric Company Web based process capability data collection and reporting system
CN1444398A (zh) * 2002-03-12 2003-09-24 中国科学院计算技术研究所 基于关键帧的视频流索引播放系统
US7149974B2 (en) * 2002-04-03 2006-12-12 Fuji Xerox Co., Ltd. Reduced representations of video sequences
US7149755B2 (en) 2002-07-29 2006-12-12 Hewlett-Packard Development Company, Lp. Presenting a collection of media objects
US7375731B2 (en) 2002-11-01 2008-05-20 Mitsubishi Electric Research Laboratories, Inc. Video mining using unsupervised clustering of video content
US7143352B2 (en) 2002-11-01 2006-11-28 Mitsubishi Electric Research Laboratories, Inc Blind summarization of video content
US7131059B2 (en) 2002-12-31 2006-10-31 Hewlett-Packard Development Company, L.P. Scalably presenting a collection of media objects
WO2004072485A1 (en) 2003-02-05 2004-08-26 Engineered Support Systems, Inc. Digital pressure controller for pump assembly
US7127127B2 (en) 2003-03-04 2006-10-24 Microsoft Corporation System and method for adaptive video fast forward using scene generative models
JP4344534B2 (ja) 2003-04-30 2009-10-14 セコム株式会社 画像処理システム
US7406123B2 (en) 2003-07-10 2008-07-29 Mitsubishi Electric Research Laboratories, Inc. Visual complexity measure for playing videos adaptively
JP4168940B2 (ja) 2004-01-26 2008-10-22 三菱電機株式会社 映像表示システム
US7409407B2 (en) 2004-05-07 2008-08-05 Mitsubishi Electric Research Laboratories, Inc. Multimedia event detection and summarization
US7730406B2 (en) * 2004-10-20 2010-06-01 Hewlett-Packard Development Company, L.P. Image processing system and method
WO2006048875A2 (en) * 2004-11-05 2006-05-11 Yissum Research Development Company Of The Hebrew University Of Jerusalem Method and system for spatio-temporal video warping
US7982738B2 (en) 2004-12-01 2011-07-19 Microsoft Corporation Interactive montages of sprites for indexing and summarizing video
US7594177B2 (en) 2004-12-08 2009-09-22 Microsoft Corporation System and method for video browsing using a cluster index
WO2006100674A2 (en) * 2005-03-21 2006-09-28 Yeda Research And Development Co. Ltd. Detecting irregularities
US8949235B2 (en) 2005-11-15 2015-02-03 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Methods and systems for producing a video synopsis using clustering
CA2640834C (en) 2005-11-15 2014-08-19 Yissum Research Development Company Of The Hebrew University Of Jerusalem Method and system for producing a video synopsis
EP1972137A4 (en) * 2006-01-13 2009-11-11 Yahoo Inc METHOD AND SYSTEM FOR CREATING AND APPLYING DYNAMIC MEDIA TERMS AND CREATORS AND USERS THEREFOR
EP3297272A1 (en) 2007-02-01 2018-03-21 Yissum Research Development Company of the Hebrew University of Jerusalem Ltd. Method and system for video indexing and video synopsis
US20100036875A1 (en) * 2008-08-07 2010-02-11 Honeywell International Inc. system for automatic social network construction from image data

Also Published As

Publication number Publication date
US8514248B2 (en) 2013-08-20
CN101366027B (zh) 2013-03-20
CA2640834C (en) 2014-08-19
CA2640834A1 (en) 2007-05-24
WO2007057893A3 (en) 2007-08-02
BRPI0620497B1 (pt) 2018-09-25
WO2007057893A2 (en) 2007-05-24
US20090219300A1 (en) 2009-09-03
KR101420885B1 (ko) 2014-07-17
US20120092446A1 (en) 2012-04-19
JP2009516257A (ja) 2009-04-16
JP4972095B2 (ja) 2012-07-11
DK1955205T3 (da) 2012-10-15
KR20080082963A (ko) 2008-09-12
EP1955205B1 (en) 2012-08-29
EP1955205A2 (en) 2008-08-13
AU2006314066A1 (en) 2007-05-24
AU2006314066B2 (en) 2012-11-08
CN101366027A (zh) 2009-02-11
US8102406B2 (en) 2012-01-24

Similar Documents

Publication Publication Date Title
BRPI0620497A2 (pt) método para a criação de uma sinopse de vìdeo, sistema para transformar uma sequência de origem de quadros de vìdeo de uma primeira cena dinámica em uma sequência de sinopse de pelo menos dois quadros de vìdeo que ilustram uma segunda cena dinámica, e, produto de programa de computador
Rav-Acha et al. Making a long video short: Dynamic video synopsis
JP2009516257A5 (pt)
Gleicher et al. Re-cinematography: Improving the camerawork of casual video
Pritch et al. Nonchronological video synopsis and indexing
AU2007345938B2 (en) Method and system for video indexing and video synopsis
Whyte et al. Get Out of my Picture! Internet-based Inpainting.
Gleicher et al. Re-cinematography: improving the camera dynamics of casual video
US8719687B2 (en) Method for summarizing video and displaying the summary in three-dimensional scenes
BRPI0807370A2 (pt) Aparelho e método de processamento de image, aparelho de reprodução de imagem móvel, e, programa.
JP2005094756A (ja) ビデオ・データファイルのフレームからアニメーション映像ファイルの生成する方法
US7129961B1 (en) System and method for dynamic autocropping of images
Sevilla‐Lara et al. Smooth loops from unconstrained video
Wolf Space, time, frame, cinema: Exploring the possibilities of spatiotemporal effects
Barnes Patchmatch: a fast randomized matching algorithm with application to image and video
Lieng et al. Interactive Multi‐perspective Imagery from Photos and Videos
Simakov Visual summarisation of Images and Video
Pritch et al. Video Synopsis and Indexing
Lin Visual stitching under challenging conditions

Legal Events

Date Code Title Description
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 25/09/2018, OBSERVADAS AS CONDICOES LEGAIS.

B25A Requested transfer of rights approved
B21F Lapse acc. art. 78, item iv - on non-payment of the annual fees in time

Free format text: REFERENTE A 19A ANUIDADE.

B24D Patent annual fee: restoration after fee payment