JP4972095B2 - 映像概要を生成する方法およびシステム - Google Patents

映像概要を生成する方法およびシステム Download PDF

Info

Publication number
JP4972095B2
JP4972095B2 JP2008539616A JP2008539616A JP4972095B2 JP 4972095 B2 JP4972095 B2 JP 4972095B2 JP 2008539616 A JP2008539616 A JP 2008539616A JP 2008539616 A JP2008539616 A JP 2008539616A JP 4972095 B2 JP4972095 B2 JP 4972095B2
Authority
JP
Japan
Prior art keywords
video
sequence
frames
source
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008539616A
Other languages
English (en)
Other versions
JP2009516257A (ja
JP2009516257A5 (ja
Inventor
ペレグ,シュムエル
ラヴ−アチャ,アレクサンダー
Original Assignee
イッサム リサーチ ディベロップメント カンパニー オブ ザ ヘブライ ユニバーシティー オブ エルサレム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=38016397&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP4972095(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by イッサム リサーチ ディベロップメント カンパニー オブ ザ ヘブライ ユニバーシティー オブ エルサレム filed Critical イッサム リサーチ ディベロップメント カンパニー オブ ザ ヘブライ ユニバーシティー オブ エルサレム
Publication of JP2009516257A publication Critical patent/JP2009516257A/ja
Publication of JP2009516257A5 publication Critical patent/JP2009516257A5/ja
Application granted granted Critical
Publication of JP4972095B2 publication Critical patent/JP4972095B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2625Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects for obtaining an image which is composed of images from a temporal image sequence, e.g. for a stroboscopic effect
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8549Creating video summaries, e.g. movie trailer
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/16Spatio-temporal transformations, e.g. video cubism
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Studio Circuits (AREA)
  • Television Signal Processing For Recording (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

関連出願
本出願は、2006年11月2日に出願された米国第10/556,601(Peleg等)「Method and sytem for spatio-temporal video warping」の一部継続出願であり、2006年5月11日に公開されたWO2006/048875に対応し、さらに、2005年11月15日に出願された暫定出願第60/736,313および2006年1月17日に出願された60/759,044の優先権を主張し、これらの出願の総ての内容は、参照によりここに組み込まれている。
本発明は、一般に、新しい画像および映像が、シーンの複数のオリジナル映像から部分を統合することにより生成されるレンダリングに基づく画像および映像に関連する。特に、本発明は、映像の抽象化あるいは概要(synopsis)を目的とするこのような技術に関連する。
従来技術
本発明の背景として関連があると考えられる従来技術の引例が、以下に記載されており、これらの内容は、ここに組み込まれている。追加の引例が、前述した米国暫定出願第60/736,313および60/759,044に記載されており、これらの内容は、参照によりここに組み込まれている。ここに記載された引用の確認は、ここに開示された本発明の特許性に関連する方法であることを意味するものではない。各引用は、角括弧に囲まれた数字により特定され、したがって、従来技術は、明細書全体を通して、角括弧に囲まれた数字により引用される。
[1] A. Agarwala, M. Dontcheva, M. Agrawala, S. Drucker, A. Colburn, B. Curless, D. Salesin, and M. Cohen. Interactive digital photomontage. 2004年のシーグラフ(SIGGRAPH)の294から302ページ。
[2] A. Agarwala, K. C. Zheng, C. Pal, M. Agrawala, M. Cohen, B. Curless, D. Salesin, and R. Szeliski. Panoramic video textures. 2005年のシーグラフの821から827ページ。
[3] J. Assa, Y. Caspi, and D. Cohen-Or. Action synopsis: Pose selection and illustration. 2005年のシーグラフの667から676ページ。
[4] O. Boiman and M. Irani. Detecting irregularities in images and in video. 2005年北京におけるICCVのページI:462から469。
[5] A. M. Ferman and A. M. Tekalp. Multiscale content extraction and representation for video indexing. Proc. of SPIE, 3229:23-31, 1997.
[6] M. Irani, P. Anandan, J. Bergen, R. Kumar, and S. Hsu. Efficient representations of video sequences and their applications. Signal Processing: Image Communi- cation, 8(4):327-351, 1996.
[7] C. Kim and J. Hwang. An integrated scheme for object-based video abstraction. 200年ニューヨークにおけるACMマルチメディア(ACM Multimedia)の303−311。
[8] S. Kirkpatrick, C. D. Gelatt, and M. P. Vecchi. Optimization by simulated annealing. Science, 4598(13):671-680, 1983.
[9] V. Kolmogorov and R. Zabih. What energy functions can be minimized via graph cuts? 2002年ECCVのページ65から81。
[10] Y. Li, T. Zhang, and D. Tretter. An overview of video abstraction techniques. Technical Report HPL-2001-191, HP Laboratory, 2001.
[11] J. Oh, Q. Wen, J. lee, and S. Hwang. Video abstraction. In S. Deb, editor, Video Data Mangement and Information Retrieval, pages 321-346. Idea Group Inc. and IRM Press, 2004.
[12] C. Pal and N. Jojic. Interactive montages of sprites for indexing and summarizing security video. In Video Proceedings of CVPR05, page II: 1192, 2005.
[13] A. Pope, R. Kumar, H. Sawhney, and C.Wan. Video abstraction: Summarizing video content for retrieval and visualization. In Signals, Systems and Computers, pages 915-919, 1998.
[14] WO2006/048875 Method and system for spatio-temporal video warping, pub. May 11, 2006 by S. Peleg, A. Rav-Acha and D. Lischinski. これは、2005年11月2日に出願された米国第10/556,601に対応する。
[15] A. M. Smith and T. Kanade. Video skimming and characterization through the combination of image and language understanding. 1998年のCATVDの61から70ページ。
[16] A. Stefanidis, P. Partsinevelos, P. Agouris, and P. Doucette. Summarizing video datasets in the spatiotemporal domain. 2000年のDEXAのワークショップの906から912。
[17] H. Zhong, J. Shi, and M. Visontai. Detecting unusual activity in video.2004年のCVPRのページ819から826。
[18] X. Zhu, X. Wu, J. Fan, A. K. Elmagarmid, and W. G. Aref. Exploring video content structure for hierarchical summarization. Multimedia Syst, 10(2): 98-115, 2004.
[19] J. Barron, D. Fleet, S. Beauchemin and T. Burkitt.. Performance of optical flow techniques, volume 92, pages 236-242.
[20] V. Kwatra, A. Schδdl, I. Essa, G. Turk and A. Bobick. Graphcut textures: image and video synthesis using graph cuts. 2003年のシーグラフの227から286ページ。
[21] C. Kim and J. Hwang, Fast and Automatic Video Object Segmentation and Tracking for Content-Based Applications, IEEE Transactions on Circuits and Systems for Video Technology, Vol. 12, No. 2, February 2002, pp 122-129.
[22]米国特許第6,665,003
映像の概要(video synopsis)は、映像のブラウジングおよび検索を可能にする一時的なコンパクト表現である。
映像の概要のための2つの主要なアプローチがある。一方のアプローチでは、一組の特徴的な画像(キーフレーム)が、オリジナルの映像シーケンスから選択される。選択されたキーフレームは、映像を最もよく表わすフレームである[7,18]。他方のアプローチでは、短い映像シーケンスの収集が選択される[15]。第2のアプローチは、コンパクトではないが、シーンの動的性(dynamics)に良い影響を与える。これらのアプローチ(および他のアプローチ)は、映像の抽象化の広範囲な調査に記されている[10,11]。
前述した双方のアプローチでは、総てのフレームが、基礎的な基本的要素として利用される。別の方法は、映像のインデックスのためにメタデータと共にモザイク画像を利用する[6,13,12]。この方法では、静的な概要画像(synopsis image)は、時間の異なるオブジェクトを含む。
オブジェクトに基づくアプローチが知られており、このアプローチでは、オブジェクトが入力映像から抽出される[7,5,16]。しかしながら、これらの方法は、重要なキーフレームを特定するオブジェクトの検出を利用し、異なる時間間隔の活動を組み合わせない。
繰り返される最小のカット(iterated min-cut)を利用して単一のパノラマ画像を生成し[1]、繰り返される最小のカットを利用してパノラマ映像を生成する[2]する方法が、本分野で知られている。この2つの方法では、(入力フレームの数の)指数の複雑さに関する問題が近似され、したがって、これらは、少数のフレームにより適切である。本分野の関連する研究は、最小のカットを利用して2つの映像を組み合わせることに関連する[20]。
WO2006/048875[14]は、映像の一時的な流れを操作する方法およびシステムを開示している。第1の動的シーンの映像フレームの第1のシーケンスは、第2の動的シーンを表示する映像フレームの第2のシーケンスに変換され、一の態様では、第1の動的シーン内の少なくとも一つの特徴の場合、映像フレームの第1のシーケンスの各部分は、映像フレームの第1のシーケンスの周辺部分よりも異なるレートで標本化され、標本化された部分は、第2のシーケンスの対応するフレームにコピーされる。これにより、動的シーン内の特徴の一時的な同期が変更できる。
本発明の第1の態様によると、第1の動的シーンの映像フレームの第1のシーケンスを、第2の動的シーンを表示する少なくとも2つの映像フレームの第2のシーケンスに変換するコンピュータが実施する方法が提供され、当該方法が、
(a)x,y座標それぞれに配置された複数のピクセルを備える少なくとも一つのオブジェクトの動作を示す前記第1のシーケンスの映像フレームのサブセットを取得するステップと、
(b)各映像フレームで前記第1の動的シーン内の少なくとも1つのオブジェクトの空間的に重複しない外観(non-spatially overlapping appearance)を示す前記サブセット部分から選択するステップと、
(c)前記オブジェクトのピクセルのx,y座標それぞれを変更することなく、前記部分を、少なくとも3つの異なる入力フレームから前記第2のシーケンスの少なくとも2つの連続したフレームにコピーして、前記第2のシーケンスのうちの少なくとも一つのフレームが、前記第1のシーケンスの異なるフレームで現れる少なくとも2つの部分を含むようにするステップとを備える。
本発明の第2の態様によると、第1の動的シーンの映像フレームの第1のシーケンスを、第2の動的シーンを表示する少なくとも2つの映像フレームの第2のシーケンスに変換するシステムが提供され、当該システムが、
x,y座標に配置された複数のピクセルを備える少なくとも一つのオブジェクトの動作を示す前記第1のシーケンス内の映像フレームのサブセットを格納する第1のメモリと、
各映像フレームで、前記第1の動的シーン内の少なくとも一つのオブジェクトの空間的に重複しない外観を示す前記サブセット部分から選択するための、前記第1のメモリに連結される選択ユニットと、
前記オブジェクト内のx,y座標それぞれを変更することなく、前記部分を、少なくとも3つの異なる入力フレームから、前記第2のシーケンスの少なくとも2つの連続したフレームにコピーし、前記第2のシーケンスのフレームのうちの少なくとも一つが、前記第1のシーケンス内の異なるフレームで現れる少なくとも2つの部分を含むフレーム生成部と、
前記第2のシーケンスのフレームを蓄積する第2のメモリとを備える。
本発明の第3の態様はさらに、動的シーンを表示する一連の出力映像フレームを確実に実施するデータキャリアを備えており、前記出力映像の少なくとも2つの連続したフレームは、x,y座標それぞれを有する複数のピクセルであって、オブジェクト内のピクセルのx,y座標それぞれを変更することなく、少なくとも3つの異なる入力フレームのオブジェクトの部分から生じる複数のピクセルを備え、前記出力映像フレームのうちの少なくとも一つが、異なる入力フレームで現れる少なくとも2つの部分を含む。
本発明により開示された動的な映像概要(video synopsis)は、前述した従来の映像の抽象化手段と、以下の2つの特定において相違する。(i)映像概要自体が、シーンの動的性を表示する映像である。(ii)時空間の重複(spatio-temporal redundancy)をできる限り低減すべく、活動の相対的なタイミングを変更する。
例えば、図1の空間時間量(space-time volume)で表わされる概略的な映像クリップを検討する。映像は、地面を歩く人で始まり、活動のない期間の後、鳥が空を飛んでいる。活動のないフレームは、多くの映像の抽象化の方法では省略される。映像概要は、人と鳥を同時に表示することにより実質的によりコンパクトである。これは、他の活動がこの空間的な位置で生じない場合、オリジナルの時間間隔から別の時間間隔にイベントをシフトさせることによる画像領域の最適利用を可能にする。このような操作は、初めに[14]に示したように、年代のコンシステンシー(chronological consistency)を緩和する。
また、本発明は低レベルの方法を提供し、マルコフ確率場の最適化を利用して映像概要を生成する。
本発明により提供される選択肢のうちの一つは、単一のオブジェクトの複数の動的な外観を表示する能力である。この効果は、移動するオブジェクトの従来の映像概要で用いられる「ストロボ観察(strobo-scopic)」画像の一般化である[6,1]。これを実行する2つの異なるスキームが提供される。第1のスキームでは、異なる時間の事例におけるオブジェクトのスナップショットは、開始位置から終了位置までの映像全体のオブジェクトの経過の指標を提供すべく出力映像で提供される。第2のスキームでは、オブジェクトは、開始あるいは終了位置を定義しないが、ランダムに予測不可能に移動する。この場合、異なる時間の事例におけるオブジェクトのスナップショットが再び、出力映像として提供されるが、この時間は、実際よりも多いオブジェクトの印象を与える。双方のスキームが共通点は、入力映像から異なる時間に取得される複数のスナップショットが、空間的な重複を避け、且つ関心のあるオブジェクトの動的な経過に寄与しないコピーしない方法により、入力映像から出力映像にコピーされることである。
本発明の内容および添付の請求項では、「映像(video)」の語は、最も一般的な用語の「動画(movie)」と同義であり、これは、ポスト処理に従うコンピュータ画像ファイルとしてアクセス可能であり、任意の種類の動画ファイル、例えばデジタル、アナログを含む。カメラは、回転およびズームが可能な所定の位置にあることが好適であるが、これまで提案された技術で行われるような影響を受けやすい並進運動ではない。本発明に関連するシーンは、例えば、米国特許6,665,003[22]および動的なシーンを表示しない立体的な画像の表示を目的とする他の引例で処理される静的なシーンと反対に動的であり、連続したフレームが空間的および時間的な連続性を有する。本発明の一の多様によるうと、我々はこの問題を、グラフ上の最大の流れを見つけることにより多項式時間で説くことができる単一の最小のカットの問題として定式化する[5]。
本発明を説明するために、「空間時間量」と称する構成が利用され、動的なパノラマ映像を生成する。空間時間量は、総てのフレームを時間軸に沿って順次スタックすることにより画像の入力シーケンスから構成される。しかしながら、実際の実施に関する限り、例えば、動的なソースシーンの2Dフレームを時間内にスタックすることにより空間時間量を実際に構成する必要はないことを理解すべきである。さらに通常は、ソースフレームは、ターゲットフレームを構成するために個々に処理されるが、空間時間量を概念的な構成でなく物理的な構成であるかのように参照することは理解を助けるであろう。
本発明を理解し、本発明が実際にどのように実行されるか理解するために、好適な実施例は、限定ではなく添付図面を参照することにより説明される。
1.活動検出
本発明は、総ての入力ピクセルが「重要度」のレベルが付されていると仮定する。これ以降、活動レベルを「重要度」のレベルとして使用するが、所望の応用例に基づいて他の測定値を「重要度」として使用できることは明らかであろう。重要度(あるいは活動)レベルの評価が想定され、それ自体は本発明の特徴ではない。これは、不規則性を検出し[4,17]、オブジェクト検出を移動させ、オブジェクトトラッキングを行う様々な手段のうちの一つを利用して行うことができる。代替的に、これは、顔認識などの認識アルゴリズムに基づいて行うことができる。
例えば、単一且つ共通で使用される活動インジケータが選択され、入力ピクセルI(x,y,t)は、位置(x,y)における時間的なメジアンからの色差が所定の閾値よりも大きい場合、「アクティブ」とされる。アクティブピクセルは、特有の関数により既定される。
Figure 0004972095
活動インジケータからノイズを除去すべく、メジアンフィルタが、概要(synopsis)処理を継続する前にχに適用される。
連続的な活動測定を利用できるが、本発明は2元の事例に焦点を合わせる。連続的な活動の測定は、以下の詳細な説明のほぼ総ての等式を僅かに変更するだけで行うことができる[4,17,1]。
我々は、映像概要の算出のための2つの異なる実施例を記載する。1つのアプローチ(セクション2)は、グラフカットを用いたグラフ表現および費用関数の最適化を利用する。別のアプローチ(セクション3)は、オブジェクトセグメンテーションおよびトラッキングを利用する。
2.エネルギーの最小化による映像概要
入力映像シーケンスのN個のフレームを3Dの空間時間量I(x,y,z)で表示させ、この場合、(x,y)はこのピクセルの空間的な座標であり、1≦t≦Nがフレームの数である。
我々は、以下の特性を有する映像概要S(x,y,z)を生成する。
・映像概要Sは、オリジナル映像Iよりも実質的に短くあるべきである。
・オリジナル映像の最大の「活動」は、要約映像内で現れるべきである。
・映像概要内のオブジェクトの動作は、オリジナル映像内の動作と同様であるべきである。
・映像概要は、見栄えがよく、目に見える継ぎ目(シーム)あるいは断片化したオブジェクトは阻止されるべきである。
前述した特性を有する映像概要Sは、マッピングMを利用して生成され、概要S内の総ての座標(x,y,z)に、Iからのソースピクセルの座標を割り当てる。我々は、空間的な位置を固定しつつ、ピクセルのタイムシフトに焦点を合わせる。したがって、概要ピクセルS(x,y,z)は、入力ピクセルI(x,y,M(x,y,t))から生じる。タイムシフトMは、エネルギーの最小化の問題を解決することにより得られ、費用関数は、以下の等式により得られる。
Figure 0004972095
ここで、E(M)は活動の損失を示し、E(M)は継ぎ目における不連続性を示す。活動の損失は、映像概要S内で現れない入力映像Iのアクティブピクセルの数であろう。
Figure 0004972095
不連続性費用(discontinuity cost)Eは、映像概要内の空間および時間的な隣接部分と、入力映像内の対応する隣接部分との間の継ぎ目における色差の合計として既定される(同様の等式が[1]に存在する)。
Figure 0004972095
ここで、eは、6つの空間および時間的な隣接部分を表わす6つのユニットである。
図2aおよび2bは、費用関数を最小化することにより短い映像概要を生成する空間および時間的な処理を表わす概略図であり、移動するオブジェクトの動作は、図中の「活動ストリップ」により表わされる。上図はオリジナルの映像を示しており、下図は映像概要を示している。特に図2aでは、短い映像概要Sは、多くのアクティブピクセルを含むことにより入力映像lから生成される。円滑にすべく、S内のピクセルAがl内のピクセルBに対応する場合、「境界を越えた」隣接部分は同様であるべきである。最適なM最小化(3)を発見することは、非常に大きな最適化の問題である。近似解が図2bに示されており、映像概要内の連続したピクセルは、連続した入力ピクセルから生成されるように限定されている。
費用関数E(M)(等式1)は3次元のマルコフ確率場に対応し、各ノードは、出力映像の3次元体積内のピクセルに対応し、入力フレームに対応する時間的価値が割り当てることができることに留意する。ノードの重みは、活動費用により決定され、ノード間のエッジは、不連続性費用に応じて決定される。したがって、費用関数は、反復するグラフカット(iterative graph-cuts)などのアルゴリズムにより最小化することができる[9]。
2.1.2Dグラフを利用した限定的な解決方法
映像概要内の各ピクセルが任意の時間に生じることを可能にする等式(1)の最適化は、大きな問題である。例えば、5秒の映像概要に要約される3分の入力映像は、それぞれが5400ラベルを有する約225ノードを有するグラフを生じる。
水平な経路を移動する動的なテクスチャあるいはオブジェクトの場合、3次元のMRFは、この問題を1次元の問題に低減させることにより効果的に解決できることが[2]に記載されていた。この研究において、我々は、より一般的な方法で移動するオブジェクトに取り組み、したがって、我々は異なる制約を用いる。映像概要S内の連続したピクセルは、入力映像I内の連続したピクセルから生じるように制限されている。この制限の下では、3次元のグラフは、2次元のグラフに減らされ、各ノードは、概要動画内の空間的な位置に対応する。各ノードM(x,y)のラベルは、図2bに示すように、Sの第1のフレームに示すI内のフレーム数tを決定する。M(x,y)≠M(x,y)の場合、継ぎ目は、2つの隣接する位置(x,y)と(x,y)との間に存在し、継ぎ目に沿った不連続性費用E(M)は、S内の総てのフレームに跨るこの空間的な位置における色差の合計である。
Figure 0004972095
ここで、eは、4つの空間的な隣接部分を示す4つの単位ベクトルである。
各ノードのラベルの数はN−Kであり、NおよびKは、入力および出力映像それぞれのフレームの数である。各ピクセルの活動の損失は、
Figure 0004972095
である。
3.オブジェクトに基づく概要
前述した動的な映像概要の低いレベルのアプローチは、目に見える継ぎ目を防止するといった局所的な特性に限定されている。高いレベルのオブジェクトに基づく特性は、オブジェクトが検出できる場合に取り入れることができる。例えば、ストロボ効果を避けることは、体積内の各オブジェクトの検出およびトラッキングを必要とする。このセクションでは、動的な映像概要のためのオブジェクトに基づくアプローチの実施について説明する。いくつかのオブジェクトに基づく映像の要約方法は、文献(例えば、[7,5,16])に存在し、これらは総て、重要なフレームの選択するために、検出されたオブジェクトを利用する。これらの方法とは違い、本発明は、時間内にオブジェクトを移動させ、入力シーケンス内に現れない新しい概要フレームを生成し、空間および時間を有効に利用する。
一実施例では、移動するオブジェクトは、前述したように、各ピクセルを時間的なメジアンと比較し、この違いを閾値化することにより検出される。この後、空間的なメジアンフィルタを利用したノイズクリーニングが行われ、空間および時間的に関連する構成要素が組み合わされる。文献内には、このタスクのために利用されるオブジェクト検出およびトラッキングのための多くの他の方法が存在することは理解できるであろう(例えば、[7,17,21])。オブジェクト検出およびトラッキングの各処理は、一組のオブジェクトを生成し、各オブジェクトbは、特有の関数により表わされる。
Figure 0004972095
図3a,3b,3cは、本発明による時間的な再配置の例を示した図である。各図の上図は、オリジナルの映像を表わしており、下図は、映像概要を表わしており、移動するオブジェクトの動作は、図中の「活動ストリップ」により表わされる。図3aは、異なる時間に記録され、映像概要の同じ時間間隔で移動する2つのオブジェクトを示している。図3bは、長い期間移動し、短い時間間隔を有するセグメントに分割される単一のオブジェクトを示しており、これは、同時に表示され、動的なストロボ効果を生成する。図3cは、オブジェクトの体積がセグメントに分割される場合に、オブジェクトの交差が概要を妨げないことを示している。
各オブジェクトから、セグメントは、オブジェクトが現れるフレームのサブセットを選択することにより生成される。このようなセグメントは、異なる時間間隔を表わすことができ、任意で異なる標本化レートで取得される。
映像概要Sは、以下の処理を用いて、入力映像Iから構成される。
(1)オブジェクトb...bは、入力映像Iから抽出される。
(2)一組の重ならないセグメントBは、オリジナルのオブジェクトから選択される。
(3)時間的なシフトMは、選択された各セグメントに適用され、短い映像概要を生成するとともに、オブジェクト間の重なりを阻止し、継ぎ目のないステッチ(stitching)を可能にする。これは、図1および図3a乃至3cに説明されている。図4は、映像概要の単一のフレームが図3bに示す動的なストロボ効果を利用する例を示した図である。
我々が処理(2)および(3)を時間内に選択およびシフトさせ、短くて継ぎ目の無い映像概要を取得するため、処理(2)および(3)は関連している。前述した処理(2)および(3)は、完全である必要はないことは理解できるであろう。「空間的に重複しないセグメント(non-spatially overlapping segment)」という場合には、小さな重複部分が許容され、「重なりを阻止する」という場合には、時間内に移動するオブジェクト間の小さな重なりは許容されるが、これは、視覚的に魅力的な映像を得るために最小限にすべきである。
オブジェクトに基づく表示では、生成された概要内のピクセルは、複数のソース(異なるオブジェクトから生成され)を有し、したがって、我々は、総てのオブジェクトが統合される後の処理ステップを付加する。背景画像は、シーケンスの総てのフレームにおけるピクセルのメジアン値を取得することにより生成される。次に、選択されたオブジェクト」は、各フレーム内のピクセルとメジアン画像との間の距離(RGB空間内)に比例した重み付けを利用して融合可能である。このステッチ機構は、[6]で使用されるものと同様である。
我々は、単一の概要ピクセルにマップされる一組の総てのピクセル(x,y,t)∈Sを、src(x,y,t)として規定し、我々は、オブジェクト(あるいはセグメント)b内の(アクティブ)ピクセルの数を#b=Σx,y,t∈Iχ(x,y,t)とする。
我々は、セグメントBのサブセット選択および時間的なシフトMの費用を測定するエネルギー関数を定める。費用は、活動の損失Eα、オブジェクトE間の重なりのペナルティ、および長い映像概要にペナルティを課す項Eを含む。
Figure 0004972095
ここで、
Figure 0004972095
である。
3.1.所定の長さを有する映像−概要
ここで、所定の長さKの短い映像概要が、長い映像で構成される事例を説明する。このスキームの場合、各オブジェクトは、長さKを有する重複し連続するセグメントに分割される。総てのセグメントは、時間的に推移してタイムt=1で開始し、いずれのセグメントが映像概要内に含まれるか決定する必要がある。明らかに、このスキームでは、いくつかのオブジェクトが概要データ内に現れない。
初めに、我々はセグメントの総ての対の重なりの費用を決定する。bおよびb
を出現時間tおよびtを有する2つのセグメントとし、各セグメントのサポートを(等式5のような)特有の関数χにより表わす。
これらの2つのセグメントの費用は、時間t=1になった後の2つのセグメントの色差の合計として決定される。
Figure 0004972095
映像概要の場合、我々は、等式6の費用を最小化するセグメントBの部分的なセットを選択し、ここでは、Eは、定数Kであり、重なり費用は、
Figure 0004972095
により求められる。
同じ空間および時間ピクセルが2回表示される(これは、許容可能であるが無駄である)のを阻止すべく、我々は、オリジナルの動画を横切るセグメントbおよびbのために、v(b,b)=∞と設定する。さらに、ストロボ効果が必要ない場合、ストロボ効果は、同じオブジェクトから標本化された総てのbおよびbのために、v(b,b)=∞と設定することにより避けられる。
擬似的なアニーリング(simulated annealing)[8]は、エネルギー関数を最小化するために利用される。各状態は、概要内に含まれるセグメントのサブセットを示しており、隣接する状態が、設定するために取得され、セグメントが取り除かれ、追加され、あるいは別のセグメントと交換される。
セグメントの選択の後、長さKの概要動画は、総ての変化したセグメントを結合することにより構成される。この手段を利用した映像概要の一つのフレームの例が。図4に示されている。
3.2.無損失映像概要
映像監視などのいくつかの応用例の場合、我々は、長い映像概要を好むが、総ての活動が現れるのが保証される。この場合、オブジェクトは、先行するセクションで行われた一組のオブジェクトのセグメントを選択するためのものでないが、オブジェクトのセグメントのコンパクトな時間的な再配置を発見するためのものである。
さらに、我々は、擬似アニーリングを用いてエネルギーを最小化する。この場合、状態は、総てのセグメントの一組のタイムシフトに対応し、2つの状態は、タイムシフトが単一のセグメントのためにのみ変化する場合、隣接部分として定義される。この場合、注意すべき2つの問題がある。
・最初あるいは最後のフレーム内で現れるオブジェクトのセグメントは、映像概要内に残るべきである(さもなければ、これらは突然現れるか消える)。我々は、各状態が、これら総てのオブジェクトの時間的なシフトを結果的に固定することにより、この制約を満足させることに留意する。
・入力映像の時間的な配置は、共通するエネルギー関数の局所的な最小化であり、したがって、アニーリング処理を初期化する好適な選択肢ではない。我々は、短い映像を有する擬似アニーリングを初期化し、総てのオブジェクトが重なる。
図5a,5bおよび5cは、短い概要が、ストロボ効果がなく活動の損失がない長いシーケンスを表示可能である場合に、この手段を示す図である。3つのオブジェクトは、同時に表示されるようにタイムシフトできる。特に、図5aは、オリジナルの映像(上図)および映像概要(下図)の空間および時間的な概略図である。図5bは、オリジナルの映像の3つのフレームを示しており、図5aに示すように、オリジナルの映像では、各人物が個別に現れているが、映像概要では、3つの総てのオブジェクトが一緒に現れる。図5cは、3人を同時に示す映像概要の1つのフレームを示している。
4.パノラマの映像概要
ビデオカメラがシーンをスキャンする場合、パノラマのモザイクを用いて多くの冗長な部分が取り除かれる。しかし、従来の方法は、シーンの動的性が損なわれる単一のパノラマ画像を構成する。制限された動的性は、ストロボ画像により表わすことができ[6,1,3]、移動するオブジェクトは、これらの経路に沿っていくつかの位置で表示される。
パノラマの映像概要は、異なる時間にシーンの異なる位置で行われる活動を同時に表示させることにより生成できる。実質的な圧縮が得られ、各オブジェクトの活動の期間が時間に制限されるため、カメラにより表示される。特別な事例は、カメラが、図6に示す走っているライオンなどのオブジェクトをトラックする場合である。カメラが、走っているライオンをトラックする場合、映像概要は、背景のパノラマのモザイクであり、前景は、走っているライオンのいくつかの動的なコピーを含む。この場合、短い映像概要は、ストロボ効果を許可するだけで取得できる。
パノラマの映像概要を構成することは、総てのフレームをいくつかの基準フレームに整列させる予備の段階で、通常の映像概要と同様の方法により行われる。整列の後、オブジェクトの画像の座標が、入力画像のうちの一つの座標系であるグローバル座標から取得される。
映像を処理を可能にすべく、移動するオブジェクトのセグメンテーションが完全でない場合でさえ、我々は、重なった部分を完全に阻止する代わりに当該部分にペネルティを課す。この重なった部分のペナルティにより、オブジェクトの時間的な配置の順応性を可能にし、セグメンテーションが完全でない場合でさえ、オブジェクトのピクセルは、いくつかの背景を含む。
付加的な期間が追加され、映像概要の時間的な順序を入力映像の順序に偏向させる。
総ての可能なセグメントセクションBおよび時間的なシフトMの前述したエネルギーを最小化することは、可能性が非常に多いため、非常に消耗的である。しかしながら、問題は、解決手段を制限することにより小さくすることができる。2つの制限されたスキームは、以下のセクションに記載される。
5.監視例
映像概要の関心のある応用例は、記録された監視映像へのアクセスである。映像内の特定のイベントを調査する必要がある場合、調査は、映像概要を用いることにより非常に早く行うことができる。
前述したように、図5は、いずれの活動を失うことなく総ての活動を短い期間に凝縮した映像概要のパワーの例を示している。これは、コーヒーステーションを監視するカメラが収集した映像を用いて行われた。2つの例は、実際の監視カメラから得られたものである。図8a,8bおよび8cは、ストリートの監視の映像概要の詳細を示す図である。図8aは、オリジナル映像の通常のフレーム(22秒)を示している。図8bは、凝縮された活動を示す映像概要動画(2秒)のフレームを示している。図8cは、短い映像概要(0.7秒)のフレームを示しており、さらに凝縮された活動を示している。これらの図に示す画像は、街路を監視するカメラにより取得された映像から生成され、歩行者が時折視界を横切っている。これらの多くは、非常に凝縮された概要に集められる。
図8aおよび8bは、フェンスの監視の映像概要の詳細を示す図である。フェンスの近くでは非常に少ない活動があり、時折、兵士が巡回するのが確認できる。映像概要は、巡回および歩いている兵士の総ての事例を同時に示しており、任意で、ストロボ効果により表示させることにより映像概要を短くすることさえ可能である。
6.映像概要による映像インデックス
映像概要は、映像インデックスとして利用することができ、映像内の行動にアクセスする効率的で直観的なリンクをユーザに提供する。これは、総ての概要ピクセルを、オリジナル映像の対応するオブジェクトの外観へのポインタと関連させることにより行うことができる。映像概要では、映像の情報は、「活動の空間」に投影され、活動は、時間的な内容に拘わらず(我々は空間的な内容を保護できるが)重要である。活動は短い期間内に集中するため、映像内の特定の活動は容易にアクセスできる。
前述した説明から、ビデオカメラが動的なシーンをスキャンニングする場合、領域が入力映像内で確認できるようになる絶対的な「年代順の時間」が、シーンの動的性の一部でないことは理解できるであろう。各領域の可視期間内の「ローカルタイム」は、シーン内の動的性の描写とより関連しており、動的なモザイクを構成する場合に保護されるべきである。前述した実施例は、本発明の第1の態様である。第2の態様では、我々は、継ぎ目のないパノラマのモザイクを生成すり方法を示しており、当該実施例では、シーン内のオブジェクトが移動する場合に、画像間のステッチが、可能な限りシーン内のオブジェクトの部分を省略することを阻止する。
7.3次元の最小カットを用いたパノラマ画像の生成
,....,Iは、入力シーケンスのフレームである。我々は、シーケンスが、従来の方法のうちの一つを用いて、単一の基準フレームに整列された場合を想定する。説明を簡単にするために、我々は、整列後の総てのフレームが、同じ大きさであると仮定する(カメラの視界の外のピクセルは、無効として記録される)。また、カメラは時計回りにパンすると仮定する(別の動作は、同じような方法で処理できる)。
P(x,y)は、構成されたパノラマ画像とする。P内の各ピクセル(x,y)の場合、我々は、このピクセルが取得されるフレームM(x,y)を選択する必要がある(すなわち、M(x,y)=kの場合、P(x,y)=I(x,y)である)。カメラが時計回りにパンすると仮定した場合、左側の列は最初のフレームから取得され、一方、右側の列は、最後のフレームから取得されることは明らかである(視野の小さなパノラマ画像を生成するために、他の境界条件を選択できる)。
我々の目的は、継ぎ目のないパノラマ画像を生成することである。このため、我々は、特に、オブジェクトが移動している場合、オブジェクト内のステッチの防止を試みる。我々は、[1]で使用されるスコアと同様の継ぎ目のスコアを利用するが、NPの難しい問題を(近似により)解決する代わりに、より限定された問題の最適な解決方法を発見する。
8.エネルギー最小化問題などの問題の定式化
前述した等式との主な違いは、
Figure 0004972095
により求められるステッチ費用である。ここで、
min=min(M(x,y),M(x’,y’))、
max=max(M(x,y),M(x’,y’))である。
この費用は、フレームの割り当てが連続的であると仮定すると妥当であり、すなわち、(x,y)および(x’,y’)が隣接するピクセルの場合、これらのソースフレームM(x,y)およびM(x’,y’)は近い。この費用の主な利点は、この問題を図上の最小カットの問題として解決できることである。
我々が最小化するエネルギー関数は、
Figure 0004972095
であり、ここでは、
N(x,y)は、(x,y)の隣接するピクセルである。
E(x,y,x’,y’)は、等式1で説明したように、隣接する各ピクセルのステッチ費用である。
Valid(x,y,k)は1であり、I(x,y)は、有効ピクセル(即ち、カメラの視界内)である。
Dは、非常に大きな数である(無限大を意味する)。
9.単一のパノラマの生成
次に、我々は、(複雑な指数を有する)2次元の複数のラベルの問題を、(複雑な多項式を有するが実際には即座に解決できる)3次元の2つのラベルの問題に変換する方法を示す。各ピクセルx,yおよび入力フレームkの場合、我々は、X(x,y)<=kの場合に1に等しい2値変数b(x,y,k)を決定する(M(x,y)は、ピクセル(x,y)のソースフレームである)。b (x,y,k)=1であることは明らかである。
各1≦k≦Nでb(x,y,k)の場合、我々は、b(x,y,k)=1の最小のkとしてM(x,y)を定める。我々は、最小化が継ぎ目のないパノラマを与えるエネルギー項を記載する。各隣接するピクセル(x,y)および(x’,y’)と、各kの場合、我々は、b(x,y,k)≠b(x’,y’,k)の割り当てのために誤差項(error term)を追加する(この誤差項は対称である)。
Figure 0004972095
また、我々は、b(x,y,k)=1であるがb(x,y,k+1)=0である割り当ての無限のペネルティを追加する(M(x,y)<=kであるがM(x,y)>kが可能でないため)。
最後に、I(x,y)が無効なピクセルである場合、我々は、無限のペナルティを割り当てに与えることにより、k>1の場合b(x,y,k)=1∧b(x,y,k+1)=0あるいはk=1の場合b(x,y,k)=1、このピクセルを選択することを阻止することができる(これらの割り当ては、M(x,y)=kであることを意味している)。
前述した総ての項は、3次元グリッドの変数の対であり、したがって、我々は、3次元バイナリMRFのエネルギー関数を最小化として説明でき、最小カットを用いて多項式時間内でそれを最小化できる[9]。
10.4次元最小カットを用いたパノラマ動画の生成
(長さLの)パノラマ動画を生成すべく、我々は、一連のパノラマ画像を生成すべきである。時間的な整合性が強化されないため、各パノラマ画像を個別に生成することはよくない。別の方法は、連続的なモザイク画像が、先行するモザイクで使用された連続するフレームから各ピクセルを取得する場合、最初のフレームとして最初のモザイク画像で開始する(M(x,y)=M(x,y)+1)。この可能性は、図2bを参照して前述したのと同様である。
本発明の第2の態様では、我々は、1のパノラマフレームから別のパノラマフレームに変化する機会をステッチに与える別の式を代わりに使用し、これは、移動するオブジェクトを上手くステッチするのに非常に重要である。
我々は、前述した3次元図の事例Lで構成される4次元の図を生成する。
Figure 0004972095
時間的な整合性を強化すべく、我々は、無限のペナルティを割り当てに課す、即ちl<Lそれぞれの場合はb(x,y,N,l)=1、l>1それぞれの場合はb(x,y,1,l)=0。
さらに、各(x,y,k,l)(1≦l≦L−1,1≦k≦N−1)の場合、我々は、
割り当てb(x,y,k,l)=1≠b(x,y,k+1,l+1)のための費用関数を設定する(k=N−1の場合、我々は費用の左項のみを使用する)。
Figure 0004972095
この費用は、生成された動画内で(時間的に)連続したピクセルを表示するのを強化する(ただし、例えば、これらのピクセルは背景内である)。
この方法の変更例は、各ピクセル(x,y)を、連続したフレームの同じピクセルに接続するのではなく、ピクセル(u,v)におけるオプティカルフローにより、対応するピクセル(x+u,y+v)に接続する。オプティカルフローを算出する好適な方法は、例えば[19]にある。オプティカルフローを用いることにより、移動するオブジェクトの事例をよりよく処理する。
さらに我々は、4次元図の最小カットを用いてエネルギー関数を最小化することができ、バイナリの解決方法は、ステッチの問題を軽減するパノラマ動画を決定する。
11.実用的な改良
4次元の図を保存するには、非常に大きなメモリが必要である。したがって、我々は、メモリ要求とアルゴリズムの動作時間の双方を低減するいくつかの改良点を利用する。
・前述したように、エネルギーは、無効なピクセルのための頂点(vertices)を明確に保存することなく最小化できる。したがって、頂点の数は、入力映像内のピクセルの数に減少し、出力映像内のフレームの数により増加する。
・出力映像内の各フレームを解決する代わりに、我々は、出力フレームの標本化されたセットのみを解決し、これらの間にステッチ関数を挿入する。この改良点は、シーン内の動作があまり大きくないことを想定している。
・我々は、入力フレームの部分的なセットからのみ各ピクセルを生成することができる。これは、特に映像から取得される一連のフレームに有用であり、連続したフレームの各対の間の動作は非常に小さい。この場合、我々は、各ピクセルのために一組のソースフレームを標本化することにより、多くを失うことがない。しかし、一貫性のある方法によりソースフレームを標本化することが好適である。例えば、フレームkが、l−th出力フレーム内のピクセル(x,y)のために可能なソースである場合、k+1フレームは、l+1−th出力フレーム内のピクセル(x,y)のために可能なソースフレームであるべきである。
・我々は、複数の解像度のフレームワーク(multi-resolution framework)を利用し(例えば、[2]で利用されたような)、粗い解決(solution)が低解像度の画像のために発見され(バッファリングおよび標本化の後に)、解決は境界においてのみ洗練される。
ここで、我々は、関心のあるスコアにより動画を結合する方法を説明する。密度の高い(denser)あるいは薄い(sparser)活動を含む動画を生成し、あるいはユーザが特定する方法でシーンを制御するといったいくつかの応用例が存在する。
[14]に記載された動的なパノラマは、特別な事例として考えることができ、同じ動画の異なる部分が結合されて、より大きな視界の動画が取得され、この場合、我々は、各時間の各ピクセルの「視認性」により、関心のあるスコアを決定する。さらに一般的には、同じ動画の異なる部分(時間あるいは空間的にシフトする)を結合することは、他の事例でも利用できる。例えば、動画内の活動の密度を高めるために、我々は、アクションが生じる動画の異なる部分を、多くのアクションを有する新しい動画に結合する。図1から8を参照して前述した実施例は、活動の特別な事例を説明しており、異なる方法を利用している。
取り組むべき2つの問題は、
1.動画を「見た目のよい」動画に結合する方法。例えば、我々はステッチの問題を避けたい。
2.関心のあるスコアを最大化する。
我々は、使用可能な異なるスコアを説明することから開始し、動画を結合するのに用いられるスキームを説明する。
関心のある特徴(interest function)として使用可能な主要な特徴の一つは、ピクセルの「重要度」のレベルである。我々の実験では、我々は、ピクセル内の「活動」をその重要度を示すために考慮しているが、重要度の他の測定も同様に好適である。活動レベルの評価は、本発明の特徴自体ではないが、前述したセクション1で参照された様々な方法のうちの一つ(活動検出)を利用して行うことができる。
13.他のスコア
動画を結合するのに利用可能な他のスコア:
・視認性スコア:カメラが移動する場合、あるいは映像内の穴を埋めようとする場合、見ることができないピクセルが存在する。我々は、(必ずしも無限のスコアによってではなく)無効なピクセルにペナルティを課することができる。この方法では、我々は、穴を埋めることを促進できるが(あるいは視野を広げることができるが)、悪いステッチが生じた場合には、穴を埋めることを望まなくてもよく、あるいは小さな視野を利用してもよい。
・方向:活動の測定は、方向の測定と置き換えることができる。例えば、我々は、垂直に移動する領域よりも水平に移動する領域を好むだろう。
・ユーザ仕様:ユーザは、色、テクスチャ等の好適な関心のある特徴を指定する。さらに、ユーザは、異なるスコアにより手動で領域(およびタイムスロット)を指定する。例えば、1が、最大の活動が所望されることを意味し、0が、活動がないことが所望されることを意味するマスクを描くことにより、ユーザは、シーン内の動的性を制御でき、すなわち、特定の位置で発生させることができる。
14.アルゴリズム
我々は、以下の変更を有する[20]により使用される方法と同様の方法を利用する。
・我々は、1の動画あるいは別の動画から選択される各ピクセルのための関心のある領域を追加する。このスコアは、各動画の各ピクセルのエッジを利用して端末の頂点(ソースおよびシンク)に追加され、これらのエッジの重みは、関心のあるスコアである。
・我々は、(任意で)フレームの連続した各対の間のオプティカルフローを算出する。次に、一貫性を強化すべく、我々は、時間的に隣接する部分のエッジ((x,y,t)から(x,y,t+1))を、オプティカルフローによる隣接部分のエッジ((x,y,t)から(x+u(x,y),y+v(x,y),t+1))と交換できる。これは、ステッチが顕著でないフローに従うように奨励するように、ステッチ動画間の遷移を強化する。
・動画のいずれの部分(あるいは移動する部分)が結合されるかを決定する場合、ステッチ費用だけでなく、関心のあるスコアを考慮すべきである。例えば、密度の高い活動レベルを有する動画を生成する場合、我々は、スコアを最大化する動画のセットSを選択する。
Figure 0004972095
図9bは、動画の増加した活動密度のような効果を示した図であり、オリジナルのフレームは図9aに示されている。2つ以上の動画が結合された場合、我々は反復手段を利用し、この反復により、新しい動画が、生成された動画に結合される。正確に行うために、以前の反復により生成された古い継ぎ目およびスコアを考慮すべきである。関心のあるスコアが無いにも拘わらず、このスキームは[20]に記載されている。生成された映像のサンプルフレームが、図9bに示されている。
図10は、処理の概略図である。この例では、映像は、時間的にシフトした映像と結合される。結合は、前述した基準、すなわちステッチ費用を最小限にしつつ関心のあるスコアを最大化することに基づいて、最小カットを用いて行われる。
ここで図11を参照すると、カメラ11により取得された第1の動的シーンの映像フレームの第1のシーケンスを、第2の動的シーンを示す少なくとも2つの映像フレームの第2のシーケンスに変換する本発明に係るシステム10のブロック図が示されている。このシステムは、各x,y座標に配置された複数のピクセルを備える少なくとも一つのオブジェクトの動作を示す第1のシーケンス無いの映像フレームのサブセットを記憶する第1のメモリ12を備えている。第1の動的なシーン内の少なくとも一つのオブジェクトの空間的に重ならない外観を示すサブセット部分から選択する選択ユニット13が、第1のメモリ12に連結される。フレーム生成部14は、オブジェクト内のピクセルの各x,y座標を変更することなく、少なくとも3つの異なる入力フレームの部分を、第2のシーケンスの少なくとも2つの連続したフレームにコピーし、第2のシーケンスの少なくとも一つのフレームが、第1のシーケンス内の異なるフレームに現れる少なくとも2つの部分を含む。第2のシーケンスのフレームは、ディスプレイユニット16による後の処理あるいは表示のために、第2のメモリ15に格納される。フレーム生成部14は、第2のシーケンスをコピーする前に少なくとも2つの部分を空間的に移動させる移動ユニット(warping unit)17を備えてもよい。
実際には、システム10は、本分野で周知のように、グラフィックカードあるいはワークステーションおよび好適な周辺機器を有する最適にプログラムされたコンピュータにより実現される。
システム10では、少なくとも3つの異なる入力フレームは時間的に近い。システム10はさらに、映像フレームの第1のシーケンスを予め整列させるために、第1のメモリに結合された任意の整列ユニット18を備えてもよい。この場合、カメラ11は、第1のメモリ12内の予め整列された映像フレームを格納するために整列ユニット18に連結される。整列ユニット18は、
第1のシーケンス内のフレーム間の画像動作パラメータを算出し、
第1の動的シーン内の静止したオブジェクトが映像内で静止するように、第1のシーケンス内の映像フレームを移動させることにより動作する。
同様に、システム10は、整列された空間および時間量を「タイムフロント」表面により一掃し、一連のタイムスライスを生成するために、選択ユニット13に連結された任意のタイムスライス生成部19を備えてもよい。
これらの任意の特徴は、「タイムフロント」および「タイムスライス」の語は、参照されている前述したWO2006/048875に完全に記載されているのと同様であるため、詳細には説明されていない。
完全にするために、図12は、本発明に係るシステム10により実行される主要な処理を示すフロー図である。
15.考察
映像概要は、映像内の活動を非常に短い期間に凝縮する手段として提案されている。この凝縮された表示は、映像シーケンス内の活動への効率的なアクセスを可能にする。2つの手段が提案されており、1つの手段は、低いレベルのグラフの最適化を用い、映像概要内の各ピクセルは、このグラフ内のノードである。この手段は、入力映像から直接的に映像概要を取得する利点を有しているが、解決(solution)の複雑度が非常に高い。代替的な手段は、最初に移動するオブジェクトを検出し、検出されたオブジェクトを最適化することである。第2の手段では動作のセグメンテーションの予備段階が必要とされるが、これは非常に高速であり、オブジェクトに基づく制約が可能である。生成される映像概要の活動は、オリジナルの映像よりも非常に凝縮されており、このような概要は、これを利用したことのない者にとっては扱い難いかもしれない。しかし、多くの情報を短い時間内で観察することを目的とする場合、映像概要はこの目的を達成する。特別な注意が、動的なストロボスコープを取得する可能性に払われるべきである。映像概要の長さをさらに減少させるとともに、動的なストロボスコープはユーザからの調整を必要としてもよい。単一のオブジェクトの複数の空間的な出現は、長い活動時間を示すことが分かることにはいくらかの訓練を必要とする。我々は、動的な映像概要の特定の実施例を説明しているが、多くの拡張も可能である。例えば、バイナリの「活動」インジケータを有するのではなく、活動インジケータが連続していてもよい。連続的な活動は、例えば、活動レベルに基づいて、表示されたオブジェクトの速度を制御することにより、映像概要を生成可能な選択肢を広げることができる。また、映像概要は、多くのショットから成る長い動画のために用いてもよい。理論的に、我々のアルゴリズムは、重なり(あるいは不連続性)による不利益のために、異なるシーンの部分を結合させない。この場合、単一のショットに利用される単一の背景モデルは、調整可能な背景推定器と交換される。長い動画に利用される別の手段は、ショットのバイナリ検出の従来の方法を利用し、ショット毎に個別に映像概要を生成することである。
本発明に係るシステムは、プログラムされたコンピュータに最適であることは理解できるであろう。同様に本発明は、本発明の方法を実行すべく、コンピュータにより読み取り可能なコンピュータプログラムを意図する。さらに本発明は、本発明の方法を実施する機械により実行可能なプログラム命令を明確に実行する機械読み取り可能なメモリを意図する。
図1は、時間的に配置された特徴を同時に表示することによりコンパクトな映像概要を生成する本発明のアプローチを示す図である。 図2aは、本発明により生成される映像概要を表わす概略図である。 図2bは、本発明により生成される映像概要を表わす概略図である。 図3aは、本発明による一時的な再配置の例を示す図である。 図3bは、本発明による一時的な再配置の例を示す図である。 図3cは、本発明による一時的な再配置の例を示す図である。 図4は、図3bに示す動的なストロボ効果を利用した映像概要の単一のフレームを示す図である。 図5aは、短い概要が、活動を損なうことなく且つストロボ効果なしで、長いシーケンスを表示できる場合の例を示す図である。 図5bは、短い概要が、活動を損なうことなく且つストロボ効果なしで、長いシーケンスを表示できる場合の例を示す図である。 図5cは、短い概要が、活動を損なうことなく且つストロボ効果なしで、長いシーケンスを表示できる場合の例を示す図である。 図6は、本発明によるパノラマの映像概要の更なる例を示す図である。 図7aは、ストリートの監視の映像概要の詳細を示す図である。 図7bは、ストリートの監視の映像概要の詳細を示す図である。 図7cは、ストリートの監視の映像概要の詳細を示す図である。 図8aは、フェンスの監視の映像概要の詳細を示す図である。 図8bは、フェンスの監視の映像概要の詳細を示す図である。 図9aは、本発明の更なる実施例による動画の増加する活動密度を示す図である。 図9bは、本発明の更なる実施例による動画の増加する活動密度を示す図である。 図10は、図に示す動画を生成するのに利用される処理の概略図である。 図11は、本発明によるシステムの主要な機能を示すブロック図である。 図12は、本発明により実行される主要な動作を示すフロー図である。

Claims (14)

  1. ビデオカメラによって取得された第1の動的シーンの映像フレームのソースシーケンスを、第2の動的シーンを表示する映像フレームのより短い概要シーケンスに変換することによって、映像概要(video synopsis)を生成するための方法であって、当該方法が、
    少なくとも一つのオブジェクトの動作を示す前記ソースシーケンスの映像フレームのサブセットを取得するステップであって、各オブジェクトが、前記ソースシーケンスの少なくとも3の異なるフレームからの、各フレーム内で互いに連結されたピクセルサブセットであるステップを具え、当該方法が、
    前記ソースシーケンスから少なくとも3のソースオブジェクトを選択し、時間サンプリング(temporal sampling)によって、各々の選択されたソースオブジェクトから1又はそれ以上の概要オブジェクトをサンプリングするステップであって、前記時間サンプリングが、ソースシーケンスのN個のフレームを映像シーケンスのM個(NはMとは異なる)のフレームにマッピングするものであり、前記選択が、オブジェクトの現れる時間、オブジェクトの種類、およびオブジェクトの動作の種類のうちの少なくとも1つを含む選択基準に基づくものであるステップと、
    各概要オブジェクトについて前記映像概要における表示を開始する各表示時間を決定するステップであって、映像概要の全体の再生時間が前記ソースシーケンスの再生時間よりも短くなるように、概要オブジェクトの各々について表示時間を決定するステップと、
    前記ソースシーケンスのそれぞれ異なる時間で得られた少なくとも2の概要オブジェクトが、前記映像概要中に同時に表示されるように、前記第1の動的シーンの前記オブジェクトの空間的な位置を変更することなく、概要オブジェクトをそれぞれの所定の表示時間で表示することによって前記映像概要を生成するステップと、によって特徴付けられる方法。
  2. 請求項1に記載の方法において、前記オブジェクトのうちの1つが背景オブジェクトであることを特徴とする方法。
  3. 請求項2に記載の方法において、前記オブジェクトと前記背景とを継ぎ目のない映像につなぎ合わせることを特徴とする方法。
  4. 請求項1乃至3のいずれか1項に記載の方法において、前記ソースオブジェクトが選択され、各概要オブジェクトの表示を開始する各時間が費用関数を最適化するように決定され、前記費用関数が、前記映像概要の長さとその質的な映像基準(qualitative video metrics)との間の妥協点を決定するものであることを特徴とする方法。
  5. 請求項1乃至4のいずれか1項に記載の方法において、前記ソースシーケンスが固定位置で軸に対し回転するカメラによって取得され、前記概要シーケンスにコピーする前に少なくとも前記ソースオブジェクトの少なくとも2つを空間的に移動させることを特徴とする方法。
  6. 請求項1乃至4のいずれか1項に記載の方法において、前記ソースシーケンスが固定位置で静止カメラによって取得されることを特徴とする方法。
  7. 請求項1乃至6のいずれか1項に記載の方法において、少なくとも3の異なるソースフレームが時間的に連続していることを特徴とする方法。
  8. 請求項1乃至7のいずれか1項に記載の方法において、前記ソース映像シーケンスにおいて同時に発生する2のイベントが、前記概要シーケンスにおいて異なる時間に表示されることを特徴とする方法。
  9. 請求項1乃至8のいずれか1項に記載の方法が、監視用映像概要、動画の活動密度(activity density)の増加、映像インデックスのいずれかに用いられることを特徴とする方法。
  10. 請求項9に記載の方法が、前記概要シーケンス内の各ピクセルについて、前記ソースシーケンス内の対応するピクセルへのポインタを維持するステップを含むことを特徴とする方法。
  11. 請求項1乃至10のいずれか1項に記載の方法であって、
    (a)前記ソースシーケンスのフレーム間の画像動作パラメータを算出し、
    (b)前記第1の動的シーン内の静止したオブジェクトが整列されたソースシーケンス内で静止するように、前記ソースシーケンス内の映像フレームを移動させることにより、前記整列されたソースシーケンスを与えるように、当該ソースシーケンスを事前に整列させるステップを含むことを特徴とする方法。
  12. 第1の動的シーンの映像フレームのソースシーケンスを、第2の動的シーンを表示する少なくとも2つの映像フレームの概要シーケンスに変換するシステム(10)であって、当該システムが、
    少なくとも一つのオブジェクトの動作を示す前記ソースシーケンス内の映像フレームのサブセットを格納し、各々のオブジェクトが、少なくとも3の異なるソースフレームからの、各フレーム内で互いに連結されたピクセルサブセットであり、前記時間サンプリングが、ソースシーケンスのN個のフレームを映像シーケンスのM個のフレーム(NはMとは異なる)にマッピングするものであり、前記選択が、オブジェクトの現れる時間、オブジェクトの種類、およびオブジェクトの動作の種類のうちの少なくとも1つを含む選択基準に基づくものである、第1のメモリ(12)を具え、前記システムが、
    前記ソースシーケンスから少なくとも3のオブジェクトを選択し、時間サンプリングによって、各々の選択されたソースオブジェクトから1又はそれ以上の概要オブジェクトをサンプリングする、前記第1のメモリ(12)に連結された選択ユニット(13)と、
    各概要オブジェクトについて、映像概要における表示を開始するために各表示時間を決定し、前記ソースシーケンスのそれぞれ異なる時間で得た少なくとも2の概要オブジェクトが、前記映像概要中に同時に表示されるように、前記オブジェクトの空間的位置又は前記第1の動的シーンにおいてそこから得られる前記それぞれのオブジェクトを変更することなく、概要オブジェクト、又は、各所定の表示時間でそこから得られたオブジェクトとを表示することによって前記映像概要を生成する、フレーム生成部であって、映像概要の全体の再生時間が前記ソースシーケンスの再生時間よりも短くなるように、概要オブジェクトの各々について表示時間を決定するフレーム生成部(14)と、
    前記フレーム生成部に連結されて、前記概要シーケンスのフレームを蓄積する、第2のメモリ(15)と、
    前記第2の動的シーンを表示すべく、前記第2のメモリ(15)にディスプレイ装置(16)を連結する手段とによって特徴付けられるシステム。
  13. 請求項12に記載のシステムにおいて、前記フレーム生成部(14)が、前記概要シーケンスにコピーする前に、前記ソースオブジェクトの少なくとも2つを空間的に移動させる移動ユニット(17)を具えることを特徴とするシステム。
  14. コンピュータプログラムであって、当該プログラムがコンピュータ上で実行されるときに、請求項1乃至11のいずれか1項に記載の方法を実行するコンピュータプログラムコードを具えることを特徴とするコンピュータプログラム。
JP2008539616A 2005-11-15 2006-11-15 映像概要を生成する方法およびシステム Active JP4972095B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US73631305P 2005-11-15 2005-11-15
US60/736,313 2005-11-15
US75904406P 2006-01-17 2006-01-17
US60/759,044 2006-01-17
PCT/IL2006/001320 WO2007057893A2 (en) 2005-11-15 2006-11-15 Method and system for producing a video synopsis

Publications (3)

Publication Number Publication Date
JP2009516257A JP2009516257A (ja) 2009-04-16
JP2009516257A5 JP2009516257A5 (ja) 2010-01-07
JP4972095B2 true JP4972095B2 (ja) 2012-07-11

Family

ID=38016397

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008539616A Active JP4972095B2 (ja) 2005-11-15 2006-11-15 映像概要を生成する方法およびシステム

Country Status (10)

Country Link
US (2) US8102406B2 (ja)
EP (1) EP1955205B1 (ja)
JP (1) JP4972095B2 (ja)
KR (1) KR101420885B1 (ja)
CN (1) CN101366027B (ja)
AU (1) AU2006314066B2 (ja)
BR (1) BRPI0620497B1 (ja)
CA (1) CA2640834C (ja)
DK (1) DK1955205T3 (ja)
WO (1) WO2007057893A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11501534B2 (en) 2019-10-15 2022-11-15 Canon Kabushiki Kaisha Information processing apparatus, information processing system, information processing method, and storage medium
KR102493856B1 (ko) * 2022-08-26 2023-02-01 임요셉 운동 영상에 기초한 합성 영상 제공 방법

Families Citing this family (132)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2640834C (en) 2005-11-15 2014-08-19 Yissum Research Development Company Of The Hebrew University Of Jerusalem Method and system for producing a video synopsis
US8949235B2 (en) 2005-11-15 2015-02-03 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Methods and systems for producing a video synopsis using clustering
US20090180546A1 (en) 2008-01-09 2009-07-16 Rodriguez Arturo A Assistance for processing pictures in concatenated video streams
US20080115175A1 (en) * 2006-11-13 2008-05-15 Rodriguez Arturo A System and method for signaling characteristics of pictures' interdependencies
US8875199B2 (en) * 2006-11-13 2014-10-28 Cisco Technology, Inc. Indicating picture usefulness for playback optimization
US20090100482A1 (en) * 2007-10-16 2009-04-16 Rodriguez Arturo A Conveyance of Concatenation Properties and Picture Orderness in a Video Stream
JP2010509830A (ja) * 2006-11-14 2010-03-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオデータストリームの要約を生成するための方法及び装置
EP3297272A1 (en) 2007-02-01 2018-03-21 Yissum Research Development Company of the Hebrew University of Jerusalem Ltd. Method and system for video indexing and video synopsis
JP4821642B2 (ja) 2007-02-15 2011-11-24 株式会社ニコン 画像処理方法、画像処理装置、ディジタルカメラ及び画像処理プログラム
US8593506B2 (en) * 2007-03-15 2013-11-26 Yissum Research Development Company Of The Hebrew University Of Jerusalem Method and system for forming a panoramic image of a scene having minimal aspect distortion
US8275215B2 (en) * 2007-05-08 2012-09-25 Arcsoft (Shanghai) Technology Company, Ltd Merging images
US8958486B2 (en) * 2007-07-31 2015-02-17 Cisco Technology, Inc. Simultaneous processing of media and redundancy streams for mitigating impairments
US8804845B2 (en) * 2007-07-31 2014-08-12 Cisco Technology, Inc. Non-enhancing media redundancy coding for mitigating transmission impairments
US8630497B2 (en) * 2007-11-27 2014-01-14 Intelliview Technologies Inc. Analyzing a segment of video
US8718388B2 (en) 2007-12-11 2014-05-06 Cisco Technology, Inc. Video processing with tiered interdependencies of pictures
JP2009151896A (ja) * 2007-12-21 2009-07-09 Sony Corp 画像処理装置、動画再生装置、これらにおける処理方法およびプログラム
US8269765B2 (en) * 2008-02-28 2012-09-18 Autodesk, Inc. System and method for removing seam artifacts
US8416858B2 (en) * 2008-02-29 2013-04-09 Cisco Technology, Inc. Signalling picture encoding schemes and associated picture properties
WO2009152450A1 (en) 2008-06-12 2009-12-17 Cisco Technology, Inc. Picture interdependencies signals in context of mmco to assist stream manipulation
US8699578B2 (en) * 2008-06-17 2014-04-15 Cisco Technology, Inc. Methods and systems for processing multi-latticed video streams
US8971402B2 (en) 2008-06-17 2015-03-03 Cisco Technology, Inc. Processing of impaired and incomplete multi-latticed video streams
US8705631B2 (en) * 2008-06-17 2014-04-22 Cisco Technology, Inc. Time-shifted transport of multi-latticed video for resiliency from burst-error effects
US20090323822A1 (en) * 2008-06-25 2009-12-31 Rodriguez Arturo A Support for blocking trick mode operations
EP2148297A1 (en) * 2008-07-24 2010-01-27 BRITISH TELECOMMUNICATIONS public limited company Video display interface
US8259817B2 (en) * 2008-11-12 2012-09-04 Cisco Technology, Inc. Facilitating fast channel changes through promotion of pictures
JP5432677B2 (ja) * 2008-11-21 2014-03-05 イッサム リサーチ デベロップメント カンパニー オブ ザ ヘブリュー ユニバーシティー オブ イェルサレム リミテッド クラスタリングを使用したビデオ概要の生成方法とシステム
US8862987B2 (en) 2009-03-31 2014-10-14 Intel Corporation Capture and display of digital images based on related metadata
US8949883B2 (en) 2009-05-12 2015-02-03 Cisco Technology, Inc. Signalling buffer characteristics for splicing operations of video streams
JP5564643B2 (ja) * 2009-06-12 2014-07-30 博 石川 情報処理方法および情報処理装置
US8279926B2 (en) 2009-06-18 2012-10-02 Cisco Technology, Inc. Dynamic streaming with latticed representations of video
US8897603B2 (en) * 2009-08-20 2014-11-25 Nikon Corporation Image processing apparatus that selects a plurality of video frames and creates an image based on a plurality of images extracted and selected from the frames
DE102010031429A1 (de) 2010-07-16 2012-01-19 Robert Bosch Gmbh Verfahren zum Bereitstellen eines Kombinations-Videos
US10645344B2 (en) * 2010-09-10 2020-05-05 Avigilion Analytics Corporation Video system with intelligent visual display
CN101950242A (zh) * 2010-09-19 2011-01-19 电子科技大学 一种多视点场景成像缩放显示控制方法
JP5653736B2 (ja) * 2010-12-06 2015-01-14 オリンパスイメージング株式会社 カメラ、表示装置、および表示方法
AU2010257454B2 (en) * 2010-12-24 2014-03-06 Canon Kabushiki Kaisha Summary view of video objects sharing common attributes
TW201228376A (en) * 2010-12-28 2012-07-01 Altek Corp Electronic apparatus, image capturing apparatus and method thereof
CN102547103A (zh) * 2010-12-28 2012-07-04 华晶科技股份有限公司 电子装置、影像拍摄装置及其方法
JP2012191486A (ja) 2011-03-11 2012-10-04 Sony Corp 画像合成装置と画像合成方法およびプログラム
US9210468B2 (en) * 2011-03-22 2015-12-08 Sony Corporation System and method for effectively implementing a stroboscopic visual effect
EP2726937B1 (en) * 2011-06-30 2019-01-23 Nokia Technologies Oy Method, apparatus and computer program product for generating panorama images
RU2471231C1 (ru) 2011-09-30 2012-12-27 Общество с ограниченной ответственностью "Ай Ти Ви групп" Способ поиска объектов в последовательности изображений, полученных от стационарной видеокамеры
US9819711B2 (en) * 2011-11-05 2017-11-14 Neil S. Davey Online social interaction, education, and health care by analysing affect and cognitive features
CN102495907B (zh) * 2011-12-23 2013-07-03 香港应用科技研究院有限公司 具有深度信息的视频概要
US8719687B2 (en) 2011-12-23 2014-05-06 Hong Kong Applied Science And Technology Research Method for summarizing video and displaying the summary in three-dimensional scenes
US8736664B1 (en) * 2012-01-15 2014-05-27 James W. Gruenig Moving frame display
US10645345B2 (en) * 2012-07-03 2020-05-05 Verint Americas Inc. System and method of video capture and search optimization
US9274678B2 (en) 2012-09-13 2016-03-01 Google Inc. Identifying a thumbnail image to represent a video
JP5994612B2 (ja) * 2012-12-04 2016-09-21 富士通株式会社 映像編集装置および映像編集方法並びに映像編集プログラム
CN103888768B (zh) * 2012-12-21 2016-02-10 浙江大华技术股份有限公司 一种视频图像帧序列的浓缩方法及装置
US9491366B2 (en) 2013-02-01 2016-11-08 Htc Corporation Electronic device and image composition method thereof
US11165994B2 (en) 2013-05-13 2021-11-02 Texas Instruments Incorporated Analytics-driven summary views for surveillance networks
KR102021857B1 (ko) * 2013-07-23 2019-09-17 엘지전자 주식회사 이동 단말기 및 그의 파노라마 촬영방법
KR102072022B1 (ko) * 2013-09-02 2020-01-31 에스케이 텔레콤주식회사 관심영역 기반의 영상요약 장치와 그를 위한 컴퓨터로 읽을 수 있는 기록 매체
US9146455B2 (en) * 2013-09-09 2015-09-29 Disney Enterprises, Inc. Spatio-temporal video compositing
US9609236B2 (en) 2013-09-16 2017-03-28 Kyle L. Baltz Camera and image processing method
GB2519348B (en) 2013-10-18 2021-04-14 Vision Semantics Ltd Visual data mining
KR102025362B1 (ko) 2013-11-07 2019-09-25 한화테크윈 주식회사 검색 시스템 및 영상 검색 방법
CN104717457B (zh) * 2013-12-13 2018-05-18 华为技术有限公司 一种视频浓缩方法及装置
CN103793477B (zh) * 2014-01-10 2017-02-08 同观科技(深圳)有限公司 用于生成视频摘要的系统及方法
CN103826125B (zh) * 2014-01-20 2017-10-27 北京创鑫汇智科技发展有限责任公司 用于已压缩监控视频的浓缩分析方法和装置
US9877086B2 (en) 2014-01-26 2018-01-23 BriefCam Ltd. Method and system for producing relevance sorted video summary
CN103886089B (zh) * 2014-03-31 2017-12-15 吴怀正 基于学习的行车记录视频浓缩方法
KR101482226B1 (ko) * 2014-05-13 2015-01-22 주식회사 다이나맥스 시놉시스 영상감시 기능을 수행하는 cctv 통합관제시스템을 구현하기 위한 방법
KR101482924B1 (ko) * 2014-05-13 2015-01-15 주식회사 다이나맥스 시놉시스 영상을 생성하여 영상감시 기능을 수행하는 cctv 통합관제시스템
KR102170694B1 (ko) 2014-07-07 2020-10-27 한화테크윈 주식회사 비디오써머리를 제공하는 영상재생장치 및 영상재생장치에서 비디오써머리를 제공하는 방법
KR101594605B1 (ko) * 2014-07-16 2016-02-16 유용호 전신 디스플레이 장치
TWI586176B (zh) * 2014-10-01 2017-06-01 大猩猩科技股份有限公司 基於壓縮視訊之縮時概要產出系統與方法
KR101994291B1 (ko) 2014-10-14 2019-06-28 한화테크윈 주식회사 통합써머리를 제공하는 영상재생장치 및 방법
US9959903B2 (en) 2014-10-23 2018-05-01 Qnap Systems, Inc. Video playback method
US10424341B2 (en) 2014-11-12 2019-09-24 Massachusetts Institute Of Technology Dynamic video summarization
EP3023987B1 (en) * 2014-11-20 2017-03-22 Axis AB Method and apparatus for visualizing information of a digital video stream
KR102268596B1 (ko) * 2014-12-08 2021-06-23 한화테크윈 주식회사 메타데이터 기반 비디오 데이터의 전송조건 변경장치 및 방법
JP6503881B2 (ja) * 2015-05-20 2019-04-24 株式会社リコー コンテンツ提供システム、情報処理装置、プログラム、コンテンツ再生方法
GB2541193A (en) * 2015-08-10 2017-02-15 Nokia Technologies Oy Handling video content
US9805567B2 (en) 2015-09-14 2017-10-31 Logitech Europe S.A. Temporal video streaming and summaries
US9313556B1 (en) 2015-09-14 2016-04-12 Logitech Europe S.A. User interface for video summaries
US10299017B2 (en) 2015-09-14 2019-05-21 Logitech Europe S.A. Video searching for filtered and tagged motion
CN108351965B (zh) 2015-09-14 2022-08-02 罗技欧洲公司 视频摘要的用户界面
CN105554456B (zh) * 2015-12-21 2018-11-23 北京旷视科技有限公司 视频处理方法和设备
US20170228440A1 (en) * 2016-02-10 2017-08-10 Virdree BURNS Method of facilitating pattern recognition through organizing data based on their sequencing relationship
KR101805018B1 (ko) * 2016-07-08 2017-12-06 한양대학교 산학협력단 컴팩트 비디오 생성 장치, 방법 및 컴퓨터 프로그램이 기록된 기록매체
TWI604323B (zh) 2016-11-10 2017-11-01 財團法人工業技術研究院 視訊索引建立方法及應用其之裝置
EP3535974A4 (en) 2016-12-08 2019-09-11 Zhejiang Dahua Technology Co., Ltd METHOD AND SYSTEMS FOR VIDEO SYNOPSIS
TR201702177A2 (ja) 2017-02-14 2018-09-21 Akif Ekin
US10956773B2 (en) 2017-03-02 2021-03-23 Ricoh Company, Ltd. Computation of audience metrics focalized on displayed content
US10720182B2 (en) 2017-03-02 2020-07-21 Ricoh Company, Ltd. Decomposition of a video stream into salient fragments
US10949705B2 (en) 2017-03-02 2021-03-16 Ricoh Company, Ltd. Focalized behavioral measurements in a video stream
US10929685B2 (en) 2017-03-02 2021-02-23 Ricoh Company, Ltd. Analysis of operator behavior focalized on machine events
US10956494B2 (en) 2017-03-02 2021-03-23 Ricoh Company, Ltd. Behavioral measurements in a video stream focalized on keywords
US10949463B2 (en) 2017-03-02 2021-03-16 Ricoh Company, Ltd. Behavioral measurements in a video stream focalized on keywords
US10708635B2 (en) 2017-03-02 2020-07-07 Ricoh Company, Ltd. Subsumption architecture for processing fragments of a video stream
US10713391B2 (en) 2017-03-02 2020-07-14 Ricoh Co., Ltd. Tamper protection and video source identification for video processing pipeline
US10719552B2 (en) 2017-03-02 2020-07-21 Ricoh Co., Ltd. Focalized summarizations of a video stream
US10943122B2 (en) 2017-03-02 2021-03-09 Ricoh Company, Ltd. Focalized behavioral measurements in a video stream
US10956495B2 (en) 2017-03-02 2021-03-23 Ricoh Company, Ltd. Analysis of operator behavior focalized on machine events
US10929707B2 (en) 2017-03-02 2021-02-23 Ricoh Company, Ltd. Computation of audience metrics focalized on displayed content
CN110753933A (zh) * 2017-04-14 2020-02-04 脸谱公司 反应性简档肖像
EP3413270A1 (en) * 2017-06-07 2018-12-12 Thomson Licensing Device and method for editing a virtual reality scene represented in a curved shape form
CN109600544B (zh) * 2017-09-30 2021-11-23 阿里巴巴集团控股有限公司 一种局部动态影像生成方法及装置
US10909378B2 (en) 2017-11-07 2021-02-02 Comcast Cable Communications, Llc Processing content based on natural language queries
AU2017272325A1 (en) 2017-12-08 2019-06-27 Canon Kabushiki Kaisha System and method of generating a composite frame
WO2019142179A1 (en) 2018-01-21 2019-07-25 Anzu Virtual Reality Ltd An object viewability determination system and method
KR102095097B1 (ko) * 2018-01-29 2020-03-30 한국과학기술원 생성적 적대 네트워크를 이용한 비디오 시퀀스 생성 시스템 및 그 방법
KR102147100B1 (ko) 2018-04-04 2020-08-25 한국과학기술연구원 복수의 영상 장비를 사용하여 관심 객체 식별에 의한 비디오 요약을 생성하는 방법 및 이를 수행하는 시스템
CN108521614B (zh) * 2018-04-25 2020-06-12 中影数字巨幕(北京)有限公司 电影介绍生成方法和系统
US20200036909A1 (en) 2018-07-27 2020-01-30 BriefCam Ltd. System and method allowing simultaneous viewing of live and recorded video content
US10820029B2 (en) 2018-10-24 2020-10-27 Motorola Solutions, Inc. Alerting groups of user devices to similar video content of interest based on role
US11527265B2 (en) 2018-11-02 2022-12-13 BriefCam Ltd. Method and system for automatic object-aware video or audio redaction
US10958854B2 (en) 2018-11-02 2021-03-23 BriefCam Ltd. Computer-implemented method for generating an output video from multiple video sources
EP3878187A4 (en) 2018-11-07 2022-08-10 Genetec Inc. METHODS AND SYSTEMS FOR DETECTING ABNORMAL MOTION IN A VIDEO STREAM AND PRODUCING A VIDEO SUMMARY
CN109257621A (zh) * 2018-11-09 2019-01-22 惠州学院 一种基于云计算技术的图像视频检索系统
WO2020213426A1 (ja) * 2019-04-18 2020-10-22 ソニー株式会社 画像処理装置、画像処理方法、及び、プログラム
CN110505534B (zh) * 2019-08-26 2022-03-08 腾讯科技(深圳)有限公司 监控视频处理方法、装置及存储介质
KR102271929B1 (ko) 2019-09-17 2021-07-02 한국과학기술연구원 장면 이해를 통해 비디오 요약을 생성하는 방법 및 이를 위한 시스템
JP7446760B2 (ja) * 2019-10-07 2024-03-11 キヤノン株式会社 情報処理装置、映像の要約方法、およびプログラム
JP7451172B2 (ja) * 2019-12-24 2024-03-18 キヤノン株式会社 情報処理装置、映像の要約方法、およびプログラム
US10965908B1 (en) 2020-03-30 2021-03-30 Logitech Europe S.A. Advanced video conferencing systems and methods
US10972655B1 (en) 2020-03-30 2021-04-06 Logitech Europe S.A. Advanced video conferencing systems and methods
US10904446B1 (en) 2020-03-30 2021-01-26 Logitech Europe S.A. Advanced video conferencing systems and methods
US10951858B1 (en) 2020-03-30 2021-03-16 Logitech Europe S.A. Advanced video conferencing systems and methods
CN111325665A (zh) * 2020-04-07 2020-06-23 同创蓝天投资管理(北京)有限公司 基于网络全景图的视频轻量嵌入方法
CN113781519A (zh) * 2020-06-09 2021-12-10 华为技术有限公司 目标跟踪方法和目标跟踪装置
KR102223010B1 (ko) 2020-07-15 2021-03-05 (주)비상정보통신 객체 인식 기반의 채널 재조정 편집이 가능한 다중화면 검색기술 지원 시스템 및 방법
CN112488153B (zh) * 2020-11-06 2022-07-05 中国人民解放军国防科技大学 基于聚类趋向性原理的气味源自主搜索及定位方法
US12164969B2 (en) * 2021-01-15 2024-12-10 Samsung Electronics Co., Ltd. Method and system for learning to temporal align signals with interspersed outliers
US11941393B2 (en) * 2021-11-01 2024-03-26 Capital One Services, Llc Systems and methods for managing a software repository
KR102446832B1 (ko) 2021-12-20 2022-09-22 김승모 영상내 객체 검출 시스템 및 그 방법
KR102879024B1 (ko) * 2023-01-03 2025-10-31 주식회사 엘지유플러스 개선된 비디오 시놉시스 수행 방법 및 장치
EP4456068A1 (en) * 2023-04-24 2024-10-30 Briefcam Ltd. Interaction-aware video synopsis
CN116797993B (zh) * 2023-05-13 2024-03-19 全景智联(武汉)科技有限公司 一种基于智慧社区场景的监控方法、系统、介质及设备
CN119206066B (zh) * 2024-09-11 2025-04-18 天津大学 一种面向大场景视频的动态三维人群重建方法

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774593A (en) 1995-07-24 1998-06-30 University Of Washington Automatic scene decomposition and optimization of MPEG compressed video
US5911008A (en) 1996-04-30 1999-06-08 Nippon Telegraph And Telephone Corporation Scheme for detecting shot boundaries in compressed video data using inter-frame/inter-field prediction coding and intra-frame/intra-field coding
US5768447A (en) * 1996-06-14 1998-06-16 David Sarnoff Research Center, Inc. Method for indexing image information using a reference model
TW303555B (en) 1996-08-08 1997-04-21 Ind Tech Res Inst Digital data detecting method
US6057884A (en) * 1997-06-05 2000-05-02 General Instrument Corporation Temporal and spatial scaleable coding for video object planes
US6337683B1 (en) * 1998-05-13 2002-01-08 Imove Inc. Panoramic movies which simulate movement through multidimensional space
US6665003B1 (en) 1998-09-17 2003-12-16 Issum Research Development Company Of The Hebrew University Of Jerusalem System and method for generating and displaying panoramic images and movies
US7016540B1 (en) 1999-11-24 2006-03-21 Nec Corporation Method and system for segmentation, classification, and summarization of video images
US6549643B1 (en) 1999-11-30 2003-04-15 Siemens Corporate Research, Inc. System and method for selecting key-frames of video data
US6665423B1 (en) 2000-01-27 2003-12-16 Eastman Kodak Company Method and system for object-oriented motion-based video description
AUPQ535200A0 (en) 2000-01-31 2000-02-17 Canon Kabushiki Kaisha Extracting key frames from a video sequence
KR100698106B1 (ko) 2000-03-07 2007-03-26 엘지전자 주식회사 엠펙(mpeg)압축 비디오 환경에서 계층적 혼합형장면 변화 검출 방법
US7522186B2 (en) * 2000-03-07 2009-04-21 L-3 Communications Corporation Method and apparatus for providing immersive surveillance
EP1287518B1 (en) * 2000-04-07 2010-09-15 Dartfish SA Automated stroboscoping of video sequences
US6879332B2 (en) 2000-05-16 2005-04-12 Groxis, Inc. User interface for displaying and exploring hierarchical information
US20020051077A1 (en) 2000-07-19 2002-05-02 Shih-Ping Liou Videoabstracts: a system for generating video summaries
US6697523B1 (en) 2000-08-09 2004-02-24 Mitsubishi Electric Research Laboratories, Inc. Method for summarizing a video using motion and color descriptors
US7212726B2 (en) * 2000-09-15 2007-05-01 International Business Machines Corporation System and method of processing MPEG streams for file index insertion
US6925455B2 (en) 2000-12-12 2005-08-02 Nec Corporation Creating audio-centric, image-centric, and integrated audio-visual summaries
US7110458B2 (en) 2001-04-27 2006-09-19 Mitsubishi Electric Research Laboratories, Inc. Method for summarizing a video using motion descriptors
US6904420B2 (en) 2001-05-17 2005-06-07 Honeywell International Inc. Neuro/fuzzy hybrid approach to clustering data
US7480864B2 (en) 2001-10-12 2009-01-20 Canon Kabushiki Kaisha Zoom editor
US6961732B2 (en) 2001-12-18 2005-11-01 General Electric Company Web based process capability data collection and reporting system
CN1444398A (zh) * 2002-03-12 2003-09-24 中国科学院计算技术研究所 基于关键帧的视频流索引播放系统
US7149974B2 (en) * 2002-04-03 2006-12-12 Fuji Xerox Co., Ltd. Reduced representations of video sequences
US7149755B2 (en) 2002-07-29 2006-12-12 Hewlett-Packard Development Company, Lp. Presenting a collection of media objects
US7375731B2 (en) 2002-11-01 2008-05-20 Mitsubishi Electric Research Laboratories, Inc. Video mining using unsupervised clustering of video content
US7143352B2 (en) 2002-11-01 2006-11-28 Mitsubishi Electric Research Laboratories, Inc Blind summarization of video content
US7131059B2 (en) 2002-12-31 2006-10-31 Hewlett-Packard Development Company, L.P. Scalably presenting a collection of media objects
WO2004072485A1 (en) 2003-02-05 2004-08-26 Engineered Support Systems, Inc. Digital pressure controller for pump assembly
US7127127B2 (en) 2003-03-04 2006-10-24 Microsoft Corporation System and method for adaptive video fast forward using scene generative models
JP4344534B2 (ja) 2003-04-30 2009-10-14 セコム株式会社 画像処理システム
US7406123B2 (en) 2003-07-10 2008-07-29 Mitsubishi Electric Research Laboratories, Inc. Visual complexity measure for playing videos adaptively
JP4168940B2 (ja) 2004-01-26 2008-10-22 三菱電機株式会社 映像表示システム
US7409407B2 (en) 2004-05-07 2008-08-05 Mitsubishi Electric Research Laboratories, Inc. Multimedia event detection and summarization
US7730406B2 (en) * 2004-10-20 2010-06-01 Hewlett-Packard Development Company, L.P. Image processing system and method
WO2006048875A2 (en) * 2004-11-05 2006-05-11 Yissum Research Development Company Of The Hebrew University Of Jerusalem Method and system for spatio-temporal video warping
US7982738B2 (en) 2004-12-01 2011-07-19 Microsoft Corporation Interactive montages of sprites for indexing and summarizing video
US7594177B2 (en) 2004-12-08 2009-09-22 Microsoft Corporation System and method for video browsing using a cluster index
WO2006100674A2 (en) * 2005-03-21 2006-09-28 Yeda Research And Development Co. Ltd. Detecting irregularities
US8949235B2 (en) 2005-11-15 2015-02-03 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Methods and systems for producing a video synopsis using clustering
CA2640834C (en) 2005-11-15 2014-08-19 Yissum Research Development Company Of The Hebrew University Of Jerusalem Method and system for producing a video synopsis
EP1972137A4 (en) * 2006-01-13 2009-11-11 Yahoo Inc METHOD AND SYSTEM FOR CREATING AND APPLYING DYNAMIC MEDIA TERMS AND CREATORS AND USERS THEREFOR
EP3297272A1 (en) 2007-02-01 2018-03-21 Yissum Research Development Company of the Hebrew University of Jerusalem Ltd. Method and system for video indexing and video synopsis
US20100036875A1 (en) * 2008-08-07 2010-02-11 Honeywell International Inc. system for automatic social network construction from image data

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11501534B2 (en) 2019-10-15 2022-11-15 Canon Kabushiki Kaisha Information processing apparatus, information processing system, information processing method, and storage medium
KR102493856B1 (ko) * 2022-08-26 2023-02-01 임요셉 운동 영상에 기초한 합성 영상 제공 방법

Also Published As

Publication number Publication date
US8514248B2 (en) 2013-08-20
CN101366027B (zh) 2013-03-20
CA2640834C (en) 2014-08-19
CA2640834A1 (en) 2007-05-24
WO2007057893A3 (en) 2007-08-02
BRPI0620497B1 (pt) 2018-09-25
WO2007057893A2 (en) 2007-05-24
US20090219300A1 (en) 2009-09-03
BRPI0620497A2 (pt) 2011-11-16
KR101420885B1 (ko) 2014-07-17
US20120092446A1 (en) 2012-04-19
JP2009516257A (ja) 2009-04-16
DK1955205T3 (da) 2012-10-15
KR20080082963A (ko) 2008-09-12
EP1955205B1 (en) 2012-08-29
EP1955205A2 (en) 2008-08-13
AU2006314066A1 (en) 2007-05-24
AU2006314066B2 (en) 2012-11-08
CN101366027A (zh) 2009-02-11
US8102406B2 (en) 2012-01-24

Similar Documents

Publication Publication Date Title
JP4972095B2 (ja) 映像概要を生成する方法およびシステム
JP2009516257A5 (ja)
Rav-Acha et al. Making a long video short: Dynamic video synopsis
CN101689394B (zh) 用于视频索引和视频概要的方法和系统
Pritch et al. Nonchronological video synopsis and indexing
Pritch et al. Webcam synopsis: Peeking around the world
US8719687B2 (en) Method for summarizing video and displaying the summary in three-dimensional scenes
BRPI1011189B1 (pt) Sistema baseado em computador para selecionar pontos de visualização ótimos e meio de armazenamento de sinal legível por máquina não transitória
Parisot et al. Consensus-based trajectory estimation for ball detection in calibrated cameras systems
Aner-Wolf et al. Video summaries and cross-referencing through mosaic-based representation
Cai et al. Automatic heterogeneous video summarization in temporal profile
Cai Video anatomy: spatial-temporal video profile
Aner-Wolf et al. Beyond key-frames: The physical setting as a video mining primitive
Yang et al. Generation of animated panorama from single video sequence
Pritch et al. Video Synopsis and Indexing
Huang et al. Animated panorama from a panning video sequence
IL199678A (en) Method and system for video indexing and video synopsis

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091113

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091113

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100407

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110705

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111003

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111011

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111104

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120327

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120406

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150413

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4972095

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250