JP2016111694A - フレームのシーケンスをビデオ符号化するための方法及びエンコーダ - Google Patents

フレームのシーケンスをビデオ符号化するための方法及びエンコーダ Download PDF

Info

Publication number
JP2016111694A
JP2016111694A JP2015221910A JP2015221910A JP2016111694A JP 2016111694 A JP2016111694 A JP 2016111694A JP 2015221910 A JP2015221910 A JP 2015221910A JP 2015221910 A JP2015221910 A JP 2015221910A JP 2016111694 A JP2016111694 A JP 2016111694A
Authority
JP
Japan
Prior art keywords
frame
time point
frames
interest
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015221910A
Other languages
English (en)
Other versions
JP6119045B2 (ja
JP2016111694A5 (ja
Inventor
チエンタン チェン,
Jiandan Chen
チエンタン チェン,
マルクス スキャンス,
Skans Markus
マルクス スキャンス,
ウィリー ベシャート,
Betschart Willie
ウィリー ベシャート,
ミーケル ペンゼ,
Pendse Mikael
ミーケル ペンゼ,
アレクサンドル マルティンス,
Martins Alexandre
アレクサンドル マルティンス,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Axis AB
Original Assignee
Axis AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Axis AB filed Critical Axis AB
Publication of JP2016111694A publication Critical patent/JP2016111694A/ja
Publication of JP2016111694A5 publication Critical patent/JP2016111694A5/ja
Application granted granted Critical
Publication of JP6119045B2 publication Critical patent/JP6119045B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】フレームのシーケンスをビデオ符号化するための方法及びエンコーダを提供する。【解決手段】方法は、移動する対象物を描写するフレームのシーケンスを受信することS02と、第1時点と第2時点との間の複数のフレームのシーケンスにおける、移動する対象物の移動を予測することS04と、移動する対象物の予測された移動に基づいて、第1時点と第2時点との間の移動する対象物の予測された移動中ずっと、移動する対象物をカバーする、複数のフレーム内の関心領域を画定することS06と、関心領域のどの部分にどの符号化品質を使用するかを規定する共通の符号化品質パターンを使用して、関心領域において第1時点に対応する第1フレームを符号化し、関心領域の少なくとも1つのサブセットにおいて第1と第2の時点の中間にある時点に対応する一又は複数の中間フレームを符号化することS08とを含む。【選択図】図3

Description

本発明はビデオ符号化の分野に関する。具体的には、本発明は、フレームのシーケンスを符号化するための方法及びエンコーダに関する。
H.264、又はより一般的にはH.26x標準に基づくビデオ符号化のような、既知のビデオ符号化方法は、ビデオフレームの領域における局所的な圧縮レベルの修正を可能にする。例えば、対象物を表現する関心領域(ROI)のための圧縮レベルを調整することによって、画像品質が向上しうる。これは、移動している対象物が存在するビデオシーケンスにも適用されうる。
これが、例えば、移動する対象物を伴うビデオシーケンスについて、フレームごとに1つのROIが画定されうることを教示している、米国特許第8150173号のテーマである。代替的には、ROIの開始位置及びサイズが特定されてよく、特定されたROIは次いで、ビデオシーケンスにおける対象物の動きを追跡しうる。
関心対象物に対する、及びその周囲の圧縮アーチファクトを低減するために、ROIは通常、関心対象物だけでなく背景の一部も含む。背景のこの部分は、対象物が移動している時に、フレーム毎に変動する。その結果として、背景の特定の部分を符号化するために使用される圧縮レベルは、対象物が通り過ぎる時に変動し、対象物が揺れ動くように移動している場合には複数回にわたり変動することもある。これにより、背景の特定の部分が複数回にわたり異なる圧縮レベルで再符号化されなくてはならないことから、ビデオシーケンスを符号化するために必要なビットレートが著しく増大することになる。ゆえに、改善の必要性がある。
従って、上記を鑑みて、上述の問題を克服するか、又は、少なくとも軽減することが、本発明の一目的である。具体的には、対象物が通り過ぎる際に背景を何度も再符号化する必要性を低減する、符号化方法及びエンコーダを提供することが、一目的である。
本発明の第1態様により、フレームのシーケンスをビデオ符号化するための方法によって上記の目的が達成され、方法は、
移動する対象物を描写するフレームのシーケンスを受信することを含み、シーケンスは、第1時点に対応する第1フレーム、その後の第2時点に対応する第2フレーム、及び、第1と第2の時点の中間にある一又は複数の時点に対応する一又は複数の中間フレームを備え、
第1時点と第2時点との間の複数のフレームのシーケンスにおける、移動する対象物の移動を予測することと、
移動する対象物の予測された移動に基づいて、第1時点と第2時点との間の移動する対象物の予測された移動中ずっと、移動する対象物をカバーする、複数のフレーム内の関心領域を画定することと、
関心領域のどの部分にどの符号化品質を使用するかを規定する共通の符号化品質パターンを使用して、関心領域において第1フレームを符号化し、関心領域の少なくとも1つのサブセットにおいて一又は複数の中間フレームを符号化することとを含み、特定の中間フレームについて、関心領域のサブセットが、特定の中間画像フレームに対応する時点と第2時点との間の対象物の予測された移動中ずっと、対象物をカバーする。
上記の方法を用いると、対象物の移動は、第1フレームと一又は複数の中間フレームの各々を符号化する時に使用される単一のROIを画定するために、予測され、使用される。ゆえに、従来技術とは対照的に、ROIがフレーム間で変動することはない。
ROIは、第1時点と第2時点との間の移動する対象物の予測された移動中ずっと、移動する対象物をカバーするように画定される。換言すると、画定されたROIは、第1フレーム及び一又は複数の中間フレーム内で、対象物をカバーすることが予期される。ゆえに、移動する対象物、及び移動する対象物に近在する背景画素は、第1フレーム及び一又は複数の中間フレーム内のROIの中に見出されることが予期される。
第1フレーム及び一又は複数の中間フレームを符号化する時に、ROIに関して、又は、少なくともROIのサブセットに関して、共通の(つまり同一の)符号化品質パターンが使用される。これは、ROIの中に含まれる背景の特定部分については、常に同一の符号化品質が使用されるか、又は、対象物が通り過ぎる際に最大でも1回しか変更されず、それによって、再符号化の必要性が減少することを意味する。
例えば、第1フレームのROI全体、並びに一又は複数の各中間フレームのROI全体に関して共通の符号化品質パターンが使用される場合、ROIの背景部分の再符号化は必要なくなる。他の例によれば、一又は複数の中間フレームを符号化する時に、共通の符号化品質パターンがROIのサブセットに適用される。特定の中間フレームについては、サブセットはかかる状況において、第2時点までの対象物の予測された移動の残りの間、対象物をカバーしうる。すなわち、サブセットは、特定の中間フレーム、及び第2時点までの後続の各中間フレーム内で、対象物をカバーすることが予期される。かかる場合には、背景の特定部分は、対象物が通り過ぎる際に、最大でも1回しか再符号化される必要はない。
本書で使用する場合、フレームのシーケンスとは画像フレームのシーケンスを表す。フレームのシーケンスは、典型的には、例えばそれらがカメラによって捕捉される際に、連続的に受信されることに留意されたい。
本書で使用する場合、移動する対象物の移動の予測とは、一般的に、それまでに受信された複数のフレームに基づく移動の予測を表す。典型的には、これは、第1時点に先行する時点に対応する複数のフレームを含む。それは、第1フレームも含みうる。しかし、予測が実施される時において、一又は複数の中間フレームは、典型的には、まだ受信されていない。一又は複数の中間フレームの受信前に移動の予測を開始することによって、符号化プロセスにおける待ち時間が減少しうる。
本書で使用する場合、「第1時点と第2時点との間」という文言によって画定される時間間隔は、第1時点と、一又は複数の中間フレームに対応する時点とを含む。しかしそれは、必ずしも第2時点を含むわけではない。従って、この定義を用いると、第1時点と第2時点との間の移動する対象物の予測された移動中ずっと、移動する対象物をカバーする、画定されたROIは、第1フレーム及び一又は複数の各中間フレーム内で対象物をカバーすることが予期されるが、第2フレーム内ではその限りではない。
同様に、特定の中間画像フレームに対応する時点と第2時点との間の対象物の予測された移動中ずっと対象物をカバーする、関心領域のサブセットは、特定のフレーム及び後続の各中間フレーム内で対象物をカバーすることが予期されるが、第2フレーム内ではその限りではない、サブセットである。
関心領域は、一般的に、いくつかの画素であって、例えばそれらが対象物を表現していることから特に重要なものであると判断される、いくつかの画素を意味する。符号化応用において、フレームは、例えば16×16ピクセルの固定サイズを有する複数のマクロブロックに分割されうる。関心領域は、かかるマクロブロックであって、例えばそれらが対象物を表現していることから特に重要なものであると認められる、マクロブロックの組で構成されうる。
本書で使用する場合、符号化品質パターン(encoding quality pattern)とは、典型的には、符号化品質の空間パターン又は機能(spatial pattern or function)を表す。具体的には、符号化品質パターンは、関心領域のどの部分にどの符号化品質を使用するかを規定する。
いくつかの実施形態では、符号化品質は、ROI全体を通じて一定であるように設定される。換言すると、符号化品質パターンは、関心領域全体に使用される単一の符号化品質を規定しうる。符号化品質の変動が少ないことには、より多くのコーディングブロックをその他から予測することを可能にし、それによって、コーディング効率を向上させるという利点がある。
他の実施形態では、符号化品質パターンは、関心領域の別々の部分に使用される異なる符号化品質を規定しうる。これは、適応性の増大を可能にする。例えば、符号化品質は、フレームの一般的に画像品質が低いことが予期される部分、例えばフレームの周縁部に対応するROIの部分では、低くなるように設定されうる。
符号化品質は、一般的に、圧縮のレベルに対応しうる。圧縮のレベルが低いことにより、典型的には、高符号化品質が付与され、逆もまた同様である。H.264コーデックのようないくつかのコーデックでは、圧縮レベルは、量子化パラメータ(QP値)の観点から付与される。符号化品質は、従って、量子化パラメータにも対応しうる。
以下の項で更に記述するように、H−264標準のようないくつかのビデオ圧縮標準は、Iフレームなどのイントラフレーム、及び、Pフレーム又はBフレームなどのインターフレームに関して実装される、経時的なビデオ圧縮を定めている。イントラフレームは、基本的に、符号化される1つの画像フレーム内の情報のみを使用して符号化される、1つの画像フレームである。更に、イントラフレームは、符号化される1つの画像フレームのために捕捉された全ての画像データから計算される。予測フレーム、又は差分フレームとも称されるインターフレームは、以前に符号化された画像フレームからの情報、並びに、現在符号化されるフレームの情報に基づく。すなわち、インターフレームは、以前の画像フレーム内の時間的冗長情報をうまく活用していると説明されうる。
実施形態によれば、第1フレームはイントラフレームとして符号化されうる。更に、一又は複数の中間フレームはインターフレームとして符号化されうる。典型的には、背景画素がフレーム間で著しく変化することはない。従って、中間フレームをインターフレームとして符号化することにより、背景画素は、典型的には、各フレームについて再符号化される必要はなく、具体的には、特定の背景画素について符号化品質パターンが経時的に一定であり続ける限り、その必要はない。
いくつかの実施形態では、一又は複数の中間フレームのうちの少なくともいくつかは、共通の符号化品質パターンを使用して、(関心領域のサブセットだけではなく)関心領域全体において符号化される。これは、一又は複数の中間フレームの各々が、共通の符号化品質パターンを使用して、関心領域全体において符号化される場合を含む。このことには、関心領域の中に含まれる背景の再符号化が完全に回避されうるという利点がある。
一般的に、ROIの内側の符号化品質が、フレームの残部と比較して(少なくともROIの周囲と比較して)、より高くなるように、フレームは符号化される。しかし、より高い符号化品質での符号化は、ビットレートの増大を代償に成立する。これは、ROIの領域が広い場合には、特に言えることである。従って、その視点から、符号化される各フレームについて、ROIを可能な限り狭く保つのが良い。しかし、対象物が通り過ぎる際の背景の再符号化を回避することによってビットレートを削減するという視点からは、上述のように、第1と第2の時点の間の対象物の移動中ずっと対象物をカバーするROIを有し、かつ、共通の符号化品質パターンを使用して、ROI全体において各フレームを符号化するのが良い。従って、考慮すべき相反関係が存在する。
いくつかの実施形態では、共通の符号化品質パターンを使用して、(ROI全体ではなく)ROIの1つのサブセットにおいて一又は複数の中間フレームを符号化することによって、この相反関係が考慮される。これは、符号化される各中間フレームについて、順次小さくなるROIのサブセットが共通の符号化品質パターンを使用して符号化される、縮小手順によって、達成されうる。このサブセットは、ROIの対象物が既に通り過ぎた部分に対応する、ROIの一部分を除去することによって決定されうる。具体的には、これは、各中間フレームについて、ROI又はそのサブセットの、直前のフレームを符号化する時に使用された部分が除去される、反復手順に従って実施されうる。別の言い方をすると、第1中間フレーム(最初の中間フレーム)について、関心領域のサブセットは、関心領域から一部分を除去することによって決定されてよく、第1中間フレームに後続する各中間フレームについては、関心領域のサブセットは、サブセットから、直前の中間フレームを符号化する時に使用された部分を除去することによって決定される。
この手順を用いると、中間フレームは、順次小さくなるROIのサブセットにおいて、(ビットを相当消費すると考えられる)共通の符号化品質パターンを使用して符号化され、それによって、消費されるビットレートが低減される。同時に、結果としてもたらされるサブセットは、対象物の予測された移動の残りをカバーするようなものになる。これにより、結果として、ROI内の背景は、最大でも1回しか再符号化される必要がなくなる。背景の特定部分の再符号化は、典型的には、対象物が既に通り過ぎ、背景の特定部分がROIから除去される部分の一部を形成する時に、行われる。
関心領域から除去された部分は、第1フレームにおいて対象物の少なくとも一部をカバーするが、第1中間フレームにおいてはそうではない領域に対応してよく、直前の中間フレームを符号化する時に使用されたサブセットから除去された部分は、直前の中間フレームにおいて対象物を少なくとも部分的にカバーするが、後続の中間フレームにおいてはそうではない領域に対応しうる。この方法では、特定の中間フレームについて、関心領域のサブセットが、特定の中間画像フレームに対応する時点と第2時点との間の対象物の予測された移動中ずっと、対象物をカバーすることが達成されうる。
一又は複数の中間フレームの各々について、中間フレームは、除去された部分において、除去された部分のための符号化品質パターンによって規定された符号化品質よりも低い符号化品質を用いて、符号化されうる。この方法では、結果としてもたらされる総ビットレートが低減しうる。
ROIは、一般的に、対象物の予測された移動に応じて任意の形状をとりうる。例えば、それは、長方形であって、長方形の第1の寸法が、フレーム内の第1方向に沿った第1時点と第2時点との間の移動する対象物の予測された移動をカバーし、かつ、長方形の他方の寸法が、フレーム内の第1方向に対して垂直である第2方向に沿った第1時点と第2時点との間の移動する対象物の予測された移動をカバーする、長方形を含みうる。このことには、単純な実行形態を提供すると同時に、2つの寸法における対象物の移動が勘案されるという利点がある。
長方形の「第1の寸法」とは一般的に、長方形の一方の辺を意味し、「他方の寸法」とは一般的に、一方の辺に対して垂直である長方形のもう一方の辺を意味する。
上述の方法は反復的な様態で実施されてよい。つまり、第2フレームが符号化されると、方法は繰り返されうる。より詳細には、方法は、第2時点と、第2時点よりも後の第3時点との間の複数のフレームのシーケンスにおける、移動する対象物の移動を予測することと、移動する対象物の予測された移動に基づいて、第2時点と第3時点との間の移動する対象物の予測された移動中ずっと、移動する対象物をカバーするように、更なる関心領域を画定することと、第2フレームを符号化する時に、更なる関心領域を使用することとを、更に含みうる。第2フレームは、典型的には、イントラフレームとして符号化される。
例えば対象物移動の予測におけるエラーにより、対象物が、中間フレーム内で観測される際にROIによってカバーされないということが、起こりうる。そのために、方法は更に、
少なくとも1つの中間フレームについて、移動する対象物が、少なくとも1つの中間フレーム内で描写される際に関心領域によってカバーされているか否かを確認することを含んでよく、もしカバーされていなければ、
少なくとも1つの中間フレームに対応する時点とその後の第4時点との間の複数のフレームのシーケンスにおける、移動する対象物の移動を予測することと、
移動する対象物の予測された移動に基づいて、一又は複数の中間フレームのうちの少なくとも1つに対応する時点と第4時点との間の移動する対象物の予測された移動中ずっと、移動する対象物をカバーするように、シーケンスの複数のフレーム内の関心領域を再画定することと、
少なくとも1つの中間フレームを符号化する時に、再画定された関心領域を使用することとを含みうる。
この手法を用いると、ROIは、従って、ある中間フレームから第4フレームまで対象物を再度カバーするように再画定される。この方法では、対象物移動の予測におけるエラーは補償されうる。再画定されたROIは、ある中間フレームに後続するフレームを符号化する時に使用されうる。この方法では、対象物移動の予測におけるエラーは補償されうる。
本発明の第2の態様によれば、上記の目的は、処理能力を有するデバイスによって実行されると第1態様の方法を実施するよう適合したコンピュータコード指令を伴うコンピュータ可読媒体を備える、コンピュータプログラム製品によって達成される。
第3態様により、上記の目的はフレームのシーケンスをビデオ符号化するためのエンコーダによって達成され、エンコーダは、
移動する対象物を描写するフレームのシーケンスを受信するよう構成された受信機を備え、シーケンスは、第1時点に対応する第1フレーム、その後の第2時点に対応する第2フレーム、及び、第1と第2の時点の中間にある一又は複数の時点に対応する一又は複数の中間フレームを含み、
第1時点と第2時点との間の複数のフレームのシーケンスにおける、移動する対象物の移動を予測するよう構成された、予測構成要素と、
移動する対象物の予測された移動に基づいて、第1時点と第2時点との間の移動する対象物の予測された移動中ずっと、移動する対象物をカバーする、複数のフレーム内の関心領域を画定するよう構成された、関心領域画定構成要素と、
符号化構成要素であって、
関心領域のどの部分にどの符号化品質を使用するかを規定する共通の符号化品質パターンを使用して、関心領域において第1フレームを符号化し、関心領域の少なくとも1つのサブセットにおいて一又は複数の中間フレームを符号化するよう構成され、特定の中間フレームについて、関心領域のサブセットが、特定の中間フレームに対応する時点と第2時点との間の対象物の予測された移動中ずっと、対象物をカバーする、符号化構成要素とを備える。
第2及び第3の態様は、一般的に、第1態様と同じ特徴及び利点を有しうる。本発明は、別途明示的に記載されない限り、特徴のありうる組み合わせ全てに関することが、更に留意される。
上記の、並びに追加的な、本発明の目的、特徴、及び利点は、付随する図面を参照しつつ、本発明の好ましい実施形態の、以下の例示的かつ非限定的な詳細説明を通して、より明確に理解されるであろう。図面では、同じ参照番号が類似要素に対して使用される。
実施形態による符号化システムを概略的に示す。 図1の符号化システムのエンコーダをより詳細に示す。 実施形態による、フレームのシーケンスのビデオ符号化のための方法のフロー図である。 移動する対象物を描写するフレームのシーケンスを概略的に示す。
これより、本発明の実施形態を示す添付図面を参照して、本発明をより網羅的に説明する。作動中の、本書で開示されるシステム及びデバイスが、説明される。
図1は、ビデオエンコーダ104に動作可能に接続されたビデオカメラ102を備える、符号化システム100を示している。ビデオカメラ102は、例えば、ここでは1人の人間として例示されている移動する対象物110を描写するフレームのビデオシーケンス106を捕捉するよう、配設されうる。フレームのビデオシーケンス106は、フレームのシーケンス106を符号化するよう配設されているエンコーダ104に送信されうる。エンコーダ104は、ビットストリームの形態で、符号化されたフレームのシーケンス108を出力しうる。
エンコーダ104は、ビデオカメラ102から物理的に分離されているユニットを形成しうるか、カメラ102に含まれうることを、理解されたい。
図2は、エンコーダ104をより詳細に示している。エンコーダ104は、受信機202と、予測構成要素204と、関心領域画定構成要素206と、符号化構成要素208と、送信機210とを備える。
受信機202は、ビデオカメラ102からフレームのシーケンス106を受信するよう配設される。受信機202は、フレームのシーケンスを、符号化構成要素208及び予測構成要素204に送りうる。予測構成要素204と符号化構成要素208は、少なくとも部分的に並行して、受信されたフレームのシーケンスを処理するよう構成されうる。
以下でより詳細に説明するように、予測構成要素204は、フレームのシーケンス106における対象物110の移動を予測するよう配設される。この後、予測された移動は、受信されたフレームのシーケンス106を符号化する時に符号化構成要素208によって使用されるROIを決定する時の、ROI画定構成要素206のための基準になる。送信機210は、結果としてもたらされた、符号化されたフレームのビデオシーケンス108を、例えばネットワークを介して、外部エンティティに伝送するよう配設される。
図2に関して説明された構成要素202、204、206、208、210は、エンコーダ104の機能ブロックを表現することを、理解されたい。これらの機能ブロックは、ハードウェア又はソフトウェア、或いはそれらの組み合わせを用いて実装されうる。例えば、エンコーダ104は、構成要素202、204、206、208、210の機能を実装するよう構成された回路を含みうる。代替的又は追加的には、エンコーダ104は、(非一時的な)コンピュータ可読媒体又はデバイスと協働して、構成要素202、204、206、208、210の機能を実装するよう構成されている、プロセッサを含みうる。このために、コンピュータ可読媒体は、プロセッサによって実行される時に本書で開示されているどの方法も実装する、コンピュータコード指令を記憶するよう配設されうる。
これより、図1、図2、図4、及び図3のフロー図を参照して、エンコーダ104の動作を解説する。
ステップS02において、受信機202は、ビデオカメラ102によって捕捉された、符号化されるべきフレームのシーケンス106を受信する。受信機202は、典型的には、連続的な様態で、かつリアルタイムに、フレームのシーケンス106を受信する。換言すると、受信機202は、フレームがカメラ102によって捕捉される際に、フレームを受信する。
フレームのシーケンス106は、図1の移動する対象物110のような移動する対象物を描写すると想定される。フレームのシーケンス106、又は少なくともそのサブシーケンスが、図4に更に示されている。
シーケンス106における各フレームは、一時点に対応している。具体的には、フレームのシーケンス106は、第1時点tに対応する第1フレーム402、その後の第2時点tに対応する第2フレーム412、及び、第1時点tと第2時点tとの間の時点に対応する、ここでは4つのフレームで示されている、一又は複数の中間フレーム404、406、408、410を含む。中間フレーム404、406、408、410の数は変更しうることを理解されたい。
ビデオ符号化において、いくつかのフレームをイントラフレーム(いくつかのビデオ符号化方式ではIフレームと称される)として符号化すること、つまり、フレームが、少なくとも本質的には、完全に符号化されること、及び、いくつかのフレームをインターフレーム(いくつかの符号化方式ではPフレーム又はBフレームと称される)として符号化すること、つまり、フレームが前のフレームと関連して符号化されることは、既知である。典型的には、イントラフレームの後に、複数のインターフレームが続く。図4の例では、第1と第2の時点は、典型的には、2つの続いて発生するイントラフレームに対応している。すなわち、第1と第2のフレームはイントラフレームとして符号化されることになる。更に、中間フレームは、典型的には、インターフレームとして符号化されることになる。
フレーム402から412は、移動する対象物414を描写している。実施例においては、対象物414は、(矢印で示すように)ほぼ下向き方向に(ただし揺れ動くように)移動する。つまり、対象物414は、前後に移動する傾向を有している。
ステップS04において、予測構成要素204は、移動する対象物の移動を予測する。より詳細には、予測構成要素204は、第1時点tから第2時点までの複数のフレームのシーケンスにおける、対象物414の移動を予測する。上述のように、フレームは、典型的には、連続的な様態で受信される。従って、予測は、それまでに受信されたフレームに基づく。これは、典型的には、第1時点に先行する、又は第1時点に等しい時点に対応するフレームを含みうる。例えば、ステップS04が実施される時に、予測構成要素204は、中間フレーム404から410を、第1フレーム402でさえも、まだ受信していないことがある。第1時点から第2時点までの対象物414の動きを予測することによって、第1時点から第2時点までの時点に対応するフレーム402から410の受信を待つ代わりに、符号化プロセスにおける待ち時間が減少しうる。
予測構成要素204は、任意の既知の様態で、例えば動きベクトルを使用することによって、移動する対象物414の移動を予測しうる。これは、移動する対象物414が第1時点tと第2時点tとの間に辿ることが予期される経路を予測することを含みうる。いくつかの実施形態では、予測構成要素204は、移動する対象物の速度v、及び、移動する対象物414が第1時点tと第2時点tとの間で移動することが予期される方向を予測することによって、移動を予測しうる。他の実施形態では、予測構成要素204は、第1時点tと第2時点tとの間の対象物414の予測された経路が本質的にいかなる形態もとりうるように、経路のより複雑なモデルを適用しうる。予測構成要素204は、フレーム内のいくつかの寸法又は方向に沿った対象物414の移動も予測しうる。例えば、予測構成要素204は、フレーム内の第1方向、及び、第1方向に対して垂直であるフレーム内の第2方向への、対象物414の移動を予測しうる。第1方向は、例えば、対象物414が移動する主たる方向に対応しうる。図4では、これは、下向き方向に対応することになる。しかし、対象物414が、第1の主たる方向に沿って真っ直ぐには移動せずに、例えば図4の左右方向に沿って、揺れ動くように移動しうるという場合もある。従って、これを勘案するために、予測構成要素204は、第1方向に対して垂直でありうる第2方向に沿った対象物114の(揺れ動く)移動も予測しうる。図4では、これは、例示的なフレームの左右方向に対応することになる。
より一般的には、予測構成要素204が、第1時点tと第2時点tとの間に対象物414が辿ることが予期される経路に関して対象物414の移動を予測する場合、予測構成要素204は、対象物414が移動する際のその揺動動作を勘案するように、対象物414が経路の周囲で(例えば経路に対して垂直に)揺動する動きも予測しうる。
ステップS06において、ROI画定構成要素206は、予測構成要素204からの予測された移動に基づいて、ROI416を画定する。ROI416は、第1時点tと第2時点tとの間の移動する対象物414の予測された移動中ずっと、移動する対象物414をカバーするように画定される。第1時点tと第2時点tとの間の移動する対象物414の予測された移動中ずっと、移動する対象物414をカバーすることは、ROI416が、第1フレーム402及び各中間フレーム404から410内の移動する対象物をカバーする、すなわち含むことが予期されるように画定されることを、特に意味する(ただし第2フレーム412内ではその限りではない。新たなROI418が、典型的には、下記で更に記述するように、第2フレーム412に関して画定されることになる)。注目すべきは、ROI416は、後に第1フレーム402及び中間フレーム404から410を符号化する時に使用される、第1フレーム402及び中間フレーム404から410に関して画定された単一の領域である。これは、各フレームについて異なるROIを使用することを教示する従来技術とは対照的である。
ROIは一般的に、対象物414の予測された移動に応じて任意の形状を有しうる。例えば、対象物414が辿ることが予期される(一般的な形状の)経路として、対象物414の移動が既に予測されている場合、ROIはその経路の形状に従う形態をとりうるが、ただし、対象物の揺動移動を踏まえて対象物をカバーするように、ROIは各時点において経路に対して垂直な方向に延びる。
いくつかの実施形態では、ROI416は、図4に更に示すような長方形を含むか、長方形の形状を有する。具体的には、長方形の第1の寸法は、フレーム内の第1方向(図4の下向き方向など)に沿った対象物414の予測された移動中に、対象物414をカバーするように画定されてよく、長方形の第2の寸法は、フレーム内の第2方向(図4の左右方向など)に沿った対象物414の予測された移動中に、対象物414をカバーするように画定されうる。
対象物の移動の主たる方向に沿った移動が、(時間依存である可能性がある)速度vに関して予測される場合、ROIの面積は、次の数式に従って計算されうる。
Figure 2016111694
ここで、wは、予測された主たる経路に対して垂直な方向への、第1時点tと第2時点tとの間の対象物414の予測された移動の範囲である。しかし、ROI416は常に、少なくとも対象物のサイズをカバーする面積を有するように設定されることを、理解されたい。例えば、速度がゼロに等しくなると予測される(つまり、対象物は動かないと予測される)場合にも、ROI416は、依然として、第1フレーム402内の(従って中間フレーム404から410内でも)対象物をカバーする領域に設定される。
ステップS08において、符号化構成要素208は、第1フレーム402及び一又は複数の中間フレーム404から410を符号化する。このために、符号化構成要素208は、関心領域について符号化品質、すなわち圧縮のレベルが設定されることを可能にする任意の既知の標準を実装する、コーデックを含みうる。これは、H.264標準を含む、H.26xファミリー中の標準を含む。H.264コーデックによって規定された圧縮のレベルは、多くの場合、量子化パラメータ(QP)と称される。
かかるビデオ圧縮標準は、Iフレームなどのイントラフレーム、及び、Pフレーム又はBフレームなどのインターフレームに関して実装される、経時的なビデオ圧縮を定めている。イントラフレームは、基本的に、符号化される1つの画像フレーム内の情報のみを使用して符号化される、1つの画像フレームである。更に、イントラフレームは、符号化される1つの画像フレームのために捕捉された全ての画像データから計算される。従って、イントラフレームは時に、フルフレームと称される。予測フレーム、又は差分フレームとも称されるインターフレームは、以前に符号化された画像フレームからの情報、並びに、現在符号化されるフレームの情報に基づく。すなわち、インターフレームは、以前の画像フレーム内の時間的冗長情報をうまく活用していると説明されうる。この種のコーデックを実装する動画は、典型的には、イントラフレームとそれに続く既定の数のインターフレームを生成し、次いで新たなイントラフレームとそれに続く同じ数のインターフレームを、生成する。イントラフレームにいくつかのインターフレームが続くこのシーケンスの長さは、多くの場合、画像グループ長さ(GOP長さ)と称される。
本例の場合、第1フレーム402、中間フレーム404から410、及び第2フレーム412が、GOPとして符号化されるシーケンスを形成しうる。従って、第1フレーム402はイントラフレームとして、中間フレーム404から410はインターフレームとして、第2フレーム412はイントラフレームとして、符号化されうる。
第1フレーム402及び中間フレーム404から410を符号化する前に、符号化構成要素208は、典型的には、ROI416又はそのサブセットの符号化に関連して使用される、符号化品質パターンを設定する。符号化品質パターンは、ROI416のどの部分にどの符号化品質、すなわち圧縮レベルを使用するかを規定する。典型的には、符号化品質パターンは、ROIの周囲の符号化品質と比較して、ROIの内側では符号化品質が高くなる(すなわち、より低い圧縮レベルが適用される)ように設定される。一般的には、ROI416の外側の符号化品質は、フレーム間で、空間的にも、時間的にも変動しうる。
いくつかの実施形態では、符号化品質パターンは、ROI416全体に使用される単一の符号化品質を規定する。換言すると、かかる実施形態では、符号化品質は、ROI416全体を通じて一定である。しかし、他の実施形態では、符号化品質は、ROI416の中で空間的に変動することが可能でありうる符号化品質パターンは、ゆえに、ROIの別々の部分に使用される異なる符号化品質を規定しうる。例えば、符号化品質パターンは、ROI416の中の階調に従って符号化品質が変動するように規定しうる。
符号化構成要素208は、ROI416に関して規定される符号化品質パターンを、第1時点tと第2時点tとの間で時間的に一定になるように設定する。すなわち、符号化構成要素は、第1フレーム402及び中間フレーム404から410を符号化する時に、共通の符号化品質パターンを適用する。しかし典型的には、符号化品質パターンは、第2フレーム412を符号化する時に再設定されることになる。第1フレーム402及び中間フレーム404から410を符号化する時に、ROI416内に同一の符号化品質パターンを適用することによって、背景のフレーム間の再符号化が、有利なことに、低減されうる。
ステップS08は複数のサブステップを含みうる。ステップS08aにおいて、符号化構成要素208は、第1フレーム402を符号化する。第1フレーム402は、典型的には、イントラフレームとして符号化される。第1フレーム402を符号化する時に、符号化構成要素208は、ROI416(の全体)に、選択された符号化品質パターンを適用する。
符号化構成要素208は次いで、中間フレーム404から410の符号化に進む。中間フレーム404から410は、典型的には、インターフレームとして符号化される。
いくつかの実施形態によれば、符号化構成要素208は、中間フレーム404から410を符号化する時に、ROI416全体に、選択された符号化品質パターンを適用する。
他の実施形態では、符号化構成要素208は、中間フレーム404から410のうちの少なくともいくつかを符号化する時に、ROI416の1つのサブセット内に、選択された符号化品質パターンを適用する。
より詳細には、方法は、サブステップS08bを含んでよく、サブステップS08bでは、符号化構成要素208は、各中間フレーム404から410について、選択された符号化品質パターンに従って符号化されるROI416のサブセットを決定する。具体的には符号化構成要素208は、特定の中間フレームのROIのサブセットを、特定の中間フレームに対応する時点と第2時点tとの間の対象物414の予測された移動中に対象物414をカバーする、ROIのサブセットであると決定しうる。これは、ROIの対象物414が既に通り過ぎた画素に対応する部分を、縮小又は除去することであると考察しうる。
これは、第1フレーム402、第1中間フレーム404、及び第2中間フレーム406の拡大図を示す図4の下部に、更に図示されている。第1中間フレーム404に関して、符号化構成要素208は、第1中間フレームに対応する時点で対象物414が既に通り過ぎた画素に対応する部分422aの除去によって、ROI416のサブセット420aを決定している。具体的には、除去された部分422aは、第1フレーム402では対象物414を少なくとも部分的にカバーしているが、第1中間フレーム404においてはそうではない領域に、対応している。
第2中間フレーム406に関して、符号化構成要素208は、第2中間フレーム406に対応する時点で対象物414が既に通り過ぎた画素に対応する部分422bの除去によって、ROI416のサブセット420bを決定している。具体的には、除去された部分422bは、第1フレーム402及び第1中間フレーム404において対象物414を少なくとも部分的にカバーしているが、第2中間フレーム406においてはそうではない領域に、対応している。
符号化構成要素208は、ROI416のサブセット420a、420bを決定するために反復手順を適用しうる。より具体的には、第1中間フレーム404について、ROI416から部分422aを除去することにより、ROI416のサブセット420aが決定される。第2中間フレーム404については、第1中間フレーム404に関して決定されたサブセット420aから一部分を除去することによって、ROI416のサブセット420bが決定される。より一般的には、第1中間フレーム404に後続する各中間フレーム404から410について、直前の中間フレームに関して決定されたサブセットから一部分を除去することにより、ROI416のサブセットが決定される。
第1フレームに対応する時点をt1.0、中間フレームに対応する時点をt1,i、ROIの面積をA、i番目の中間フレームに対応するROIのサブセットの面積をAにより表すと、サブセットの面積は、下記のように反復的に計算されうる。
Figure 2016111694
Figure 2016111694
しかし、より詳細に上述したように、ROI416は常に、少なくとも対象物のサイズをカバーする面積を有するように設定されることを、理解されたい。
いくつかの実施形態によれば、符号化構成要素208は、サブステップS08cで、中間フレーム404から410の各々を、共通の符号化品質パターンを使用して、決定されたサブセット420a、420bにおいて符号化する。除去された部分422a、422bにおいては、符号化構成要素208は、除去された部分に関する符号化品質パターンによって規定された符号化品質よりも低い(すなわちより高い圧縮レベルを有する)符号化品質を用いて、中間フレーム402から410を符号化しうる。
場合によっては、例えば、対象物移動の予測が真の対象物移動と一致しないために、対象物414がROI416の外に移動するということが起こりうる。これが起こると、ROI416が、(拡大される等)再画定されうるか、又は、対象物がROI416の外に移動した時点を新たな開始時点として、方法が再度開始されうる。
その事例に当てはまるか否かを見出すために、符号化構成要素208は、符号化される各フレームについて、移動する対象物414が対象のフレーム内で描写される際に関心領域によってカバーされているか否かを更に確認しうる。その事例に当てはまらなければ、予測構成要素204は、対象のフレームに対応する時点と(第2時点と一致してもよいし、そうではなくてもよい)その後の時点との間の、対象物の移動を予測しうる。ROI画定構成要素206は次いで、対象のフレームに対応する時点とその後の時点との間の予測された移動中にROIが対象物414をカバーするように、対象物414の新たに予測された移動に基づいてROIを再画定しうる。この後、符号化構成部品208は、対象のフレーム、及び、その後の時点以前のある時点に対応する後続の任意のフレームを符号化する時に、そのように再画定されたROIを使用しうる。
上記で開示された方法S02−S08は何度も繰り返されうることを理解されたい。具体的には、方法は時点tに到達すると繰り返される。すなわち、時点tが開始時点とされる。
当業者は上述の実施形態を多くの方法で修正し、かつ、上記の実施形態において示されている本発明の利点を依然として使用することが可能であると理解されるだろう。例えば、フレームのシーケンス内にはいくつかの移動する対象物が存在しうる。その場合、対象物ごとに1つのROIが画定されうる。別々のROIについては異なる符号化品質パターンが使用されうる。従って、本発明は、示された実施形態に限定されるべきではなく、付随する特許請求の範囲によってのみ限定されるべきである。加えて、当業者は理解するように、示された実施形態は組み合わされうる。

Claims (14)

  1. フレームのシーケンスをビデオ符号化するための方法であって、
    移動する対象物(414)を描写するフレームのシーケンスを受信すること(S02)を含み、前記シーケンスは、第1時点に対応する第1フレーム(402)、その後の第2時点に対応する第2フレーム(412)、及び、前記第1時点と前記第2時点との中間にある一又は複数の時点に対応する一又は複数の中間フレーム(404、406、408、410)を含み、前記方法は、
    前記第1時点と前記第2時点との間の複数のフレームのシーケンスにおける、前記移動する対象物(414)の移動を予測すること(S04)と、
    前記移動する対象物(414)の予測された移動に基づいて、前記第1時点と前記第2時点との間の前記移動する対象物(414)の予測された移動中ずっと、前記移動する対象物(414)をカバーする、前記複数のフレーム内の関心領域(416)を画定すること(S06)とを含み、前記関心領域は前記フレーム間で変動せず、前記方法は、
    前記関心領域(416)のどの部分にどの符号化品質を使用するかを規定する共通かつ一定の符号化品質パターンを使用して、前記関心領域(416)において前記第1フレーム(402)を符号化し、前記関心領域(416)の少なくとも1つのサブセットにおいて前記一又は複数の中間フレーム(404、406、408、410)を符号化すること(S08)を含み、特定の中間フレームについて、前記関心領域のサブセットが、前記特定の中間画像フレームに対応する時点と前記第2時点との間の前記対象物の予測された移動中ずっと、前記対象物をカバーし、
    前記方法は更に、
    第1中間フレーム(404)について、前記関心領域(416)から一部分(422a)を除去することにより、前記関心領域(416)のサブセット(420a)を決定することと、
    前記第1中間フレーム(404)に後続する各中間フレーム(406、408、410)について、直前の中間フレームを符号化する時に使用された前記サブセット(420a)から一部分(422b)を除去することにより、前記関心領域のサブセット(420b)を決定することとを含む、方法。
  2. 前記符号化品質パターンは、前記関心領域(416)全体で使用される単一の符号化品質を規定する、請求項1に記載の方法。
  3. 前記符号化品質パターンは、前記関心領域(416)の別々の部分で使用される異なる符号化品質を規定する、請求項1に記載の方法。
  4. 各符号化品質は圧縮のレベルに対応する、請求項1から3のいずれか一項に記載の方法。
  5. 前記第1フレーム(402)はイントラフレームとして符号化される、請求項1から4のいずれか一項に記載の方法。
  6. 前記一又は複数の中間フレーム(404、406、408、410)はインターフレームとして符号化される、請求項1から5のいずれか一項に記載の方法。
  7. 前記一又は複数の中間フレーム(404、406、408、410)のうちの少なくともいくつかは、前記共通の符号化品質パターンを使用して、前記関心領域(416)全体において符号化される、請求項1から6のいずれか一項に記載の方法。
  8. 前記関心領域(416)から除去された前記部分(422a)は、前記第1フレーム(402)において前記対象物の少なくとも一部をカバーするが、前記第1中間フレーム(404)においてはそうではない領域に対応し、
    前記直前の中間フレームを符号化する時に使用された前記サブセット(420a)から除去された前記部分(422b)は、前記直前の中間フレームにおいて前記対象物を少なくとも部分的にカバーするが、後続の中間フレームにおいてはそうではない領域に対応する、請求項1から7のいずれか一項に記載の方法。
  9. 前記一又は複数の中間フレーム(404、406、408、410)の各々について、前記除去された部分のための前記符号化品質パターンによって規定された符号化品質よりも低い符号化品質を用いて、前記除去された部分(422a、422b)において前記中間フレームを符号化することを更に含む、請求項1から8のいずれか一項に記載の方法。
  10. 前記関心領域は、長方形であって、前記長方形の第1の寸法が、前記フレーム内の第1方向に沿った前記第1時点と前記第2時点との間の前記移動する対象物の前記予測された移動をカバーし、かつ、前記長方形の他方の寸法が、前記フレーム内の前記第1方向に対して垂直である第2方向に沿った前記第1時点と前記第2時点との間の前記移動する対象物の前記予測された移動をカバーする、長方形を含む、請求項1から9のいずれか一項に記載の方法。
  11. 更に、
    前記第2時点と、前記第2時点よりも後の第3時点との間の複数のフレームのシーケンスにおける、前記移動する対象物(416)の移動を予測することと、
    前記移動する対象物の前記予測された移動に基づいて、前記第2時点と前記第3時点との間の前記移動する対象物(416)の予測された移動中ずっと、前記移動する対象物(416)をカバーするように、更なる関心領域(418)を画定することと、
    前記第2フレーム(412)を符号化する時に、前記更なる関心領域(418)を使用することとを含む、請求項1から10のいずれか一項に記載の方法。
  12. 更に、
    少なくとも1つの中間フレームについて、前記移動する対象物が前記少なくとも1つの中間フレーム内で描写される際に前記関心領域によってカバーされているか否かを確認することを含み、もしカバーされていなければ、
    前記少なくとも1つの中間フレームに対応する時点とその後の第4時点との間の複数のフレームのシーケンスにおける、前記移動する対象物の移動を予測することと、
    前記移動する対象物の前記予測された移動に基づいて、前記一又は複数の中間フレームのうちの前記少なくとも1つに対応する前記時点と前記第4時点との間の前記移動する対象物の予測された移動中ずっと、前記移動する対象物をカバーするように、前記シーケンスの複数のフレーム内の前記関心領域を再画定することと、
    前記少なくとも1つの中間フレームを符号化する時に、再画定された関心領域を使用することとを含む、請求項1から11のいずれか一項に記載の方法。
  13. 処理能力を有するデバイスによって実行されると、請求項1から12のいずれか一項に記載の前記方法を実施するよう適合したコンピュータコード指令を伴うコンピュータ可読媒体を備える、コンピュータプログラム製品。
  14. フレームのシーケンスをビデオ符号化するためのエンコーダ(104)であって、
    移動する対象物(414)を描写するフレームのシーケンスを受信するよう構成された受信機(202)を備え、前記シーケンスは、第1時点に対応する第1フレーム(402)、その後の第2時点に対応する第2フレーム、及び、前記第1時点と前記第2時点との中間にある一又は複数の時点に対応する一又は複数の中間フレーム(404、406、408、410)を含み、前記エンコーダは、
    前記第1時点と前記第2時点との間の複数のフレームのシーケンスにおける、前記移動する対象物(414)の移動を予測するよう構成された、予測構成要素(204)と、
    前記移動する対象物の予測された移動に基づいて、前記第1時点と前記第2時点との間の前記移動する対象物(414)の予測された移動中ずっと、前記移動する対象物(414)をカバーする、複数のフレーム内の関心領域(416)を画定するよう構成された、関心領域画定構成要素(206)とを備え、前記関心領域は前記フレーム間で変動せず、前記エンコーダは、
    符号化構成要素(208)であって、
    前記関心領域のどの部分にどの符号化品質を使用するかを規定する共通かつ一定の符号化品質パターンを使用して、前記関心領域(416)において前記第1フレーム(402)を符号化し、前記関心領域(416)の少なくとも1つのサブセットにおいて前記一又は複数の中間フレームを符号化するよう構成され、特定の中間フレームについて、前記関心領域の前記サブセットが、前記特定の中間フレームに対応する時点と前記第2時点との間の前記対象物の予測された移動中ずっと、前記対象物をカバーする、符号化構成要素を備え、
    前記符号化構成要素は更に、
    第1中間フレーム(404)について、前記関心領域(416)から一部分(422a)を除去することにより、前記関心領域のサブセット(420a)を決定し、
    前記第1中間フレーム(404)に後続する各中間フレーム(406、408、410)について、直前の中間フレームを符号化する時に使用された前記サブセット(420a)から一部分(422b)を除去することにより、前記関心領域のサブセット(420b)を決定するよう構成されている、エンコーダ(104)。
JP2015221910A 2014-12-03 2015-11-12 フレームのシーケンスをビデオ符号化するための方法及びエンコーダ Active JP6119045B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP14196126.8A EP3029937B1 (en) 2014-12-03 2014-12-03 Method and encoder for video encoding of a sequence of frames
EP14196126.8 2014-12-03

Publications (3)

Publication Number Publication Date
JP2016111694A true JP2016111694A (ja) 2016-06-20
JP2016111694A5 JP2016111694A5 (ja) 2016-12-22
JP6119045B2 JP6119045B2 (ja) 2017-04-26

Family

ID=52006883

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015221910A Active JP6119045B2 (ja) 2014-12-03 2015-11-12 フレームのシーケンスをビデオ符号化するための方法及びエンコーダ

Country Status (6)

Country Link
US (1) US9936217B2 (ja)
EP (1) EP3029937B1 (ja)
JP (1) JP6119045B2 (ja)
KR (1) KR101715833B1 (ja)
CN (1) CN105681795B (ja)
TW (1) TWI613910B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019068248A (ja) * 2017-09-29 2019-04-25 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170359596A1 (en) * 2016-06-09 2017-12-14 Apple Inc. Video coding techniques employing multiple resolution
EP3306528B1 (en) * 2016-10-04 2019-12-25 Axis AB Using image analysis algorithms for providing traning data to neural networks
US10999602B2 (en) 2016-12-23 2021-05-04 Apple Inc. Sphere projected motion estimation/compensation and mode decision
US11259046B2 (en) 2017-02-15 2022-02-22 Apple Inc. Processing of equirectangular object data to compensate for distortion by spherical projections
US10924747B2 (en) 2017-02-27 2021-02-16 Apple Inc. Video coding techniques for multi-view video
FR3064145A1 (fr) * 2017-03-16 2018-09-21 Orange Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
US11093752B2 (en) 2017-06-02 2021-08-17 Apple Inc. Object tracking in multi-view video
US10754242B2 (en) 2017-06-30 2020-08-25 Apple Inc. Adaptive resolution and projection format in multi-direction video
US10869040B2 (en) * 2017-10-29 2020-12-15 Chun-Wei Chan Perceptual multimedia encoding system and method with pre-defined encoding quality patterns
EP3503548B1 (en) * 2017-12-19 2019-10-23 Axis AB Video encoding method and system
US10713517B2 (en) * 2018-09-30 2020-07-14 Himax Technologies Limited Region of interest recognition
CN113132721B (zh) * 2019-12-31 2022-07-19 浙江宇视科技有限公司 视频编码方法、装置、可读存储介质及电子设备
CN111277825A (zh) * 2020-01-19 2020-06-12 浙江工业大学 一种基于海思芯片的码流控制方法
US11936881B2 (en) * 2021-09-30 2024-03-19 Hewlett-Packard Development Company, L.P. Region of interest based image data enhancement in a teleconference

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006101075A (ja) * 2004-09-29 2006-04-13 Sanyo Electric Co Ltd 画像圧縮装置
JP2009253581A (ja) * 2008-04-04 2009-10-29 Fujifilm Corp 画像処理装置、画像処理方法、およびプログラム
JP2013187769A (ja) * 2012-03-08 2013-09-19 Panasonic Corp 符号化装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6665342B1 (en) * 1999-07-02 2003-12-16 International Business Machines Corporation System and method for producing a still image representation of a motion video
DE10300048B4 (de) 2002-01-05 2005-05-12 Samsung Electronics Co., Ltd., Suwon Verfahren und Vorrichtung zur Bildcodierung und -decodierung
JP4656912B2 (ja) 2004-10-29 2011-03-23 三洋電機株式会社 画像符号化装置
US8693537B2 (en) 2005-03-01 2014-04-08 Qualcomm Incorporated Region-of-interest coding with background skipping for video telephony
WO2007024351A2 (en) * 2005-08-26 2007-03-01 Idt Corporation Region of interest tracking and integration into a video codec
WO2008075779A1 (en) * 2006-12-18 2008-06-26 Fujifilm Corporation Monitoring system, monitoring method and program
US20090022403A1 (en) * 2007-07-20 2009-01-22 Fujifilm Corporation Image processing apparatus, image processing method, and computer readable medium
JP5285632B2 (ja) * 2009-01-26 2013-09-11 パナソニック株式会社 動画像処理装置、動画像処理方法および撮像装置
TWI429294B (zh) * 2009-06-04 2014-03-01 Ind Tech Res Inst 具有限度變動位元率控制之感興趣區域編碼方法與系統以及相關之儲存媒體
CN102831442A (zh) * 2011-06-13 2012-12-19 索尼公司 异常行为检测设备和方法及生成该检测设备的设备和方法
CN102682454B (zh) * 2012-04-28 2013-05-08 中国科学技术大学 一种视频中的感兴趣区域跟踪方法及装置
CN104782121A (zh) 2012-12-18 2015-07-15 英特尔公司 多区域视频会议编码

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006101075A (ja) * 2004-09-29 2006-04-13 Sanyo Electric Co Ltd 画像圧縮装置
JP2009253581A (ja) * 2008-04-04 2009-10-29 Fujifilm Corp 画像処理装置、画像処理方法、およびプログラム
JP2013187769A (ja) * 2012-03-08 2013-09-19 Panasonic Corp 符号化装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019068248A (ja) * 2017-09-29 2019-04-25 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Also Published As

Publication number Publication date
JP6119045B2 (ja) 2017-04-26
EP3029937B1 (en) 2016-11-16
US20160165257A1 (en) 2016-06-09
TW201631973A (zh) 2016-09-01
CN105681795A (zh) 2016-06-15
TWI613910B (zh) 2018-02-01
CN105681795B (zh) 2018-02-13
US9936217B2 (en) 2018-04-03
EP3029937A1 (en) 2016-06-08
KR101715833B1 (ko) 2017-03-13
KR20160067032A (ko) 2016-06-13

Similar Documents

Publication Publication Date Title
JP6119045B2 (ja) フレームのシーケンスをビデオ符号化するための方法及びエンコーダ
KR102400078B1 (ko) 비디오 코딩에서 모션 보상 예측을 위한 광흐름 추정
CN106537923B (zh) 自适应视频流的技术
JP4838312B2 (ja) より正確な動き情報を用いたフレーム補間
CN105379268A (zh) 在视频编码中适应鲁棒性
CN105409216A (zh) 丢失视频数据的条件隐藏
CN107646194B (zh) 用于视频运动补偿的装置和方法
US20170099491A1 (en) Apparatus, method and non-transitory medium storing program for encoding moving picture
US9967581B2 (en) Video quality adaptation with frame rate conversion
US8396127B1 (en) Segmentation for video coding using predictive benefit
US11412253B2 (en) Methods for combining decoder side motion vector refinement with wrap-around motion compensation
JP2023521295A (ja) 映像符号化データをシグナリングするための方法
US11956463B2 (en) Methods for performing wrap-around motion compensation
JP2016111699A (ja) リアルタイム符号化のための方法及び装置
CN108632527A (zh) 控制器、摄像机以及用于控制摄像机的方法
KR20200084300A (ko) 영상 복호화 방법, 영상 부호화 방법, 영상 복호화 장치, 영상 부호화 장치 및 컴퓨터 판독 가능한 기록 매체
CN121284252B (zh) 一种解码图像的方法、装置和介质
Sun et al. Rate distortion modeling and adaptive rate control scheme for high efficiency video coding (HEVC)
JP7775459B2 (ja) 後のアナリティクスおよび再構成要件に基づいた、アダプティブなビデオシンニング
KR101668133B1 (ko) 화상 데이터의 블록을 예측하는 방법, 이 방법을 실행하는 복호 장치 및 부호화 장치
Ates Decoder-side super-resolution and frame interpolation for improved H. 264 video coding
US20130003844A1 (en) Video encoder bit estimator for macroblock encoding
JP2007110409A (ja) 画像処理装置及び画像処理方法をコンピュータに実行させるためのプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161108

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20161108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170130

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20170202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170307

R150 Certificate of patent or registration of utility model

Ref document number: 6119045

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250