JP2007201558A - 動画像符号化装置および動画像符号化方法 - Google Patents

動画像符号化装置および動画像符号化方法 Download PDF

Info

Publication number
JP2007201558A
JP2007201558A JP2006014376A JP2006014376A JP2007201558A JP 2007201558 A JP2007201558 A JP 2007201558A JP 2006014376 A JP2006014376 A JP 2006014376A JP 2006014376 A JP2006014376 A JP 2006014376A JP 2007201558 A JP2007201558 A JP 2007201558A
Authority
JP
Japan
Prior art keywords
resolution
block size
prediction
encoding
resolution information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006014376A
Other languages
English (en)
Inventor
Kazuo Saigo
賀津雄 西郷
Tatsuro Shigesato
達郎 重里
Hideyuki Okose
秀之 大古瀬
Hisaki Maruyama
悠樹 丸山
Hiroshi Arakawa
博 荒川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2006014376A priority Critical patent/JP2007201558A/ja
Publication of JP2007201558A publication Critical patent/JP2007201558A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】H.264画像符号化のイントラ予測、動き予測および直交変換の処理における符号化モード(あるいは符号化タイプ)を適応的に選択しその画像の解像度に応じた適切な符号化を可能にし、回路規模、消費電力あるいは画質といった実装上の観点から最適な動画像符号化装置および動画像符号化方法を提供すること。
【解決手段】複数ピクチャからなる動画像の各ピクチャをマクロブロックに分割すると共にマクロブロックを更にブロックに分割してイントラ予測、動き予測並びに直交変換の処理を行う動画像符号化装置1であって、符号化対象ピクチャの符号化後の解像度に関する情報である解像度情報の選択または入力を受け付ける解像度情報受付部110と、解像度情報受付部110により受け付けられた解像度情報に応じ、マクロブロックを分割するときの分割サイズを複数の選択肢の中から1つ以上選択するブロックサイズ選択部111とを備える。
【選択図】図1

Description

本発明は、画像を光ディスク、磁気ディスクあるいはフラッシュメモリ等の記憶メディア上に圧縮記録する動画像圧縮符号化方式に関し、特に、H.264画像符号化方式の動画像符号化装置および動画像符号化方法に関する。
MPEG−2やMPEG−4といった従来の画像符号化方式に比べ、2倍近くの高い符号化効率を実現する方式としてH.264(MPEG−4 AVCとも呼ばれる)が規格化されている(例えば、非特許文献1参照)。H.264は、直交変換と動き補償をベースとしたハイブリッド画像符号化であるという点で、従来の方式と変わりない。しかしながら、符号化を構成する各要素の符号化ツールの自由度が高く、それらの累積効果で高い符号化効率を実現している。
図13は、H.264画像符号化を実現する従来の動画像符号化装置の機能的な構成の一例を示す機能ブロック図である。この動画像符号化装置は、図13に示すようにA/D(Analog/Digital)変換部11と、画像並び替えバッファ12と、マクロブロック分割部13、差分処理部14、直交変換部15、量子化部16、符号化部17、蓄積バッファ18、逆量子化部19、逆直交変換部20、加算処理部21、フレームメモリ22、イントラ推定部23、動き推定部24、モード選択部25、モードスッチ26、イントラ予測部27、動き補償部28、およびレート制御部29を備えている。
A/D変換部11は、入力されたアナログの輝度信号Y、色差信号Cb、Crから構成される原画像信号をデジタルの画像信号に変換する。
画像並び替えバッファ12は、A/D変換部11から入力した原画像信号内のフレーム画像信号を、その符号化ピクチャタイプI、P、BからなるGOP(Group Of Pictures)構造に応じて、符号化する順番に並べ替える。
なお、符号化ピクチャタイプにおけるIピクチャとは、参照ピクチャを持たずに符号化対象ピクチャのみを用いてピクチャ内予測(イントラ予測)符号化を行うピクチャである。また、既に処理済みの1枚のピクチャを参照してピクチャ間予測(インター予測)符号化するピクチャをPピクチャと呼び、既に処理済みの2枚以上のピクチャを同時に参照してピクチャ間予測(インター予測)符号化するピクチャをBピクチャと呼んでいる。
連続するピクチャ(フレームおよびフィールドの両者を包含する1つの符号化の単位)からなる動画像の各ピクチャは、4:2:0フォーマットのピクチャである場合、図14(A)〜図14(C)に示すように、1個の輝度信号(Y信号31)と2個の色差信号(Cb信号32、Cr信号33)とで構成されており、色差信号の画像サイズは縦横とも輝度信号の1/2となる。
また、動画像の各ピクチャはマクロブロックと呼ばれるブロックに分割され、マクロブロック単位で符号化される。マクロブロックは図15(A)に示すように16×16画素の1個のY信号ブロック41と、図15(B)及び図15(C)それぞれに示すように、Y信号ブロック41と空間的に一致する8×8画素のCb信号ブロック42およびCr信号ブロック43にて構成されている(例えば、非特許文献1参照)。
入力された各ピクチャは、マクロブロック分割部13にて入力マクロブロックに分割される。分割された入力マクロブロックは、差分処理部14に入力される。差分処理部14は、入力マクロブロックの各画素に対して、イントラ予測部27または動き補償部28で生成された予測マクロブロックの空間的に対応する各画素との間で差分処理を施し、差分マクロブロックを出力する。
差分マクロブロックは、直交変換部15に入力され、複数の直交変換ブロックに周波数変換される。なお、直交変換ブロックのサイズは、従来のMPEG方式では8×8画素であるが、H.264では、BaselineおよびMainの各プロファイルにおいては4×4画素が基本サイズであり、Highプロファイルにおいては4x4画素と8×8画素の2つのうちどちらかを基本サイズとしてマクロブロック単位で選択できる。なお、Highプロファイルにおいて、ピクチャ単位で4x4画素と8×8画素の両方が使用できる場合と、4x4画素だけしか使用できない場合とを選択できる。
直交変換部15は、差分マクロブロックを、まず図16(A)〜図16(C)に示すような24個の4×4画素ブロック(51−0から51−15、52−0から52−3、53−0から53―3)に分割し、それぞれについて直交変換を行う。8×8画素の直交変換については、6個の8×8画素ブロックについて同様に行われる。なお、後で述べるイントラ16×16予測が選択された場合には、各4×4直交変換ブロックの直流成分のみを集めた直交ブロック(51−16、52−4、53−4)を信号成分毎に構成し、さらに直交変換する。直交変換ブロック内の各変換係数は量子化部16に入力される。
量子化部16は、レート制御部29から入力された量子化パラメータに従って、各直交変換ブロック内の変換係数を量子化する。量子化された直交変換係数は、符号化部17に入力され、符号化(コード化)される。H.264では、符号化部17として、可変長符号化を用いたCAVLC(Context−based Adaptive Variable Length Coding)あるいはCABAC(Context−based Adaptive Binary Arithmetic Coding)が用意されている。
符号化部17は、量子化された直交変換係数および後述するモード選択部25で選択された予測情報をコード化し、蓄積バッファ18に供給する。蓄積バッファ18は蓄積したコードをストリームとして出力する。
量子化された直交変換係数は、符号化部17へ供給されると同時に、逆量子化部19に入力される。逆量子化部19は、レート制御部29から入力される量子化パラメータに従って、量子化された直交変換係数を逆量子化する。これにより直交変換ブロックが復元する。復元された直交変換ブロックは、逆直交変換部20にて差分マクロブロックに復元される。復元された差分マクロブロックは、予測マクロブロックと共に加算処理部21に入力される。
加算処理部21は、復元された差分マクロブロックと予測マクロブロックの各画素に加算処理を施し、再生マクロブロックを生成する。この再生マクロブロックは、さらに予測処理に用いるためフレームメモリ22に蓄積される。
上記の逆量子化部19、逆直交変換部20、加算処理部21で行われる一連の処理はローカル復号化と呼ばれる。このローカル復号化には、復号側と同様の再生マクロブロックを生成する能力をもつ必要がある。
次に、上記予測マクロブロックを生成するための予測方法、予測タイプについて説明する。
予測方法には、大きく分けて2種類あり、それぞれ、イントラ予測、動き予測(フレーム間予測あるいはインター予測)と呼ばれる。
イントラ予測は、フレーム内の符号化済み画素を用いて、マクロブロック内の画素を予測する方法である。H.264には、予測を行う単位として2種類のブロックサイズ、4×4ブロックおよび16×16ブロックが用意されており、それぞれ、イントラ4×4予測とイントラ16×16予測と呼ばれている。
さらに、イントラ4×4予測には9種類、イントラ16×16予測には4種類の方向の異なる予測モード(予測タイプとも呼ばれる。)が用意されており、マクロブロック毎(イントラ4×4予測では、4×4ブロック毎)に予測モードを選択することができる。
図17(A)は、イントラ4×4予測において予測する対象画素(aからpの16画素)と予測に用いる符号化済み隣接画素(AからLの12画素)の配置を示す図である。ここで、前記対象画素(aからp)はマクロブロック分割部13から出力された符号化対象のマクロブロック内の画素であり、一方、符号化済み隣接画素(AからL)は復号化され再生されたマクロブロックまたはブロックの画素であり、フレームメモリから読み出される。
図17(B)は、イントラ4×4予測の予測方向を示す図である。予測対象画素の画素値は、符号化済み隣接画素の画素値を用い、予測方向に沿って、規格(例えば、非特許文献1)で規定された演算式によって算出される。ここで、このときの予測方向をモード番号(モード0からモード8)で示される。
図17(C)は、モード番号と各予測方向との対応を示す図である。
図17(C)に示すように、各予測方向は、モード0の予測方向を示すブロック60では垂直、モード1の予測方向を示すブロック61では水平、モード2の予測方向を示すブロック62ではDC(平均)、モード3の予測方向を示すブロック63では斜め左下方、モード4の予測方向を示すブロック64では斜め右下、モード5の予測方向を示すブロック65では垂直右方、モード6の予測方向を示すブロック66では水平下方、モード7の予測方向を示すブロック67では垂直左方、モード8の予測方向を示すブロック68では水平上方である。
上記イントラ4×4予測は輝度信号に適用される。例えば、モード0の場合,予測対象画素の4×4画素ブロックの上側に隣接する復号済みの画素データを用いて,垂直方向の予測を行い,予測画像を生成する。この予測モードは,予測対象の画像領域に垂直方向エッジや境界がある場合に有効な予測モードである。モード0以外の予測モードも同様にそれぞれが特定方向のエッジや境界に対して有効な予測モードとなっており,隣接ブロックの復号済み画素を基に予測対象画素を生成する。
また、輝度信号の場合は、図18(A)〜図18(D)に示すように、イントラ16×16予測に対しても4通りの予測モード(図18(A)モード0:垂直、図18(B)モード1:水平、図18(C)モード2:DC(平均)、図18(D)モード3:plane)が規格(例えば、非特許文献1)で定義されており、イントラ4×4予測を含め合計13通りの予測モードの中から最適な予測モードを選択し符号化に用いる。
また、色差信号については,8×8画素ブロックに対し,4通りの予測モード(輝度信号のイントラ16×16予測と同様な予測方向からなる。但し、モード0:DC、モード1:水平、モード2:垂直:モード3:plane)が定義されており,輝度信号とは独立に予測モードを符号化することが可能である。
なお、Highプロファイルのイントラ予測では、輝度信号について4×4ブロックおよび16×16ブロックにさらに8×8ブロックのイントラ8×8予測が追加されている。このイントラ8×8予測は上記Highプロファイルにおける8×8の直交変換の追加に合わせて追加されたものである。イントラ8×8予測は、3タップのローパスフィルタ後、イントラ4×4予測と同様9つの予測モードが設定されている(非特許文献1、参照)。
なお、それぞれのモードで予測された各予測ブロックについて、その予測ブロックとそのブロックに対応するマクロブロック分割部13から出力された対象ブロックとが比較され、それらブロック間の差分絶対値和などの評価関数に基づいて各予測ブロックの評価値が算出される。
動き予測(フレーム間予測あるいはインター予測)には、符号化済みのピクチャ内の画素を用いてマクロブロック内の画素を予測する方法であり、PタイプとBタイプがある。なお、符号化済みのピクチャ内の画素はフレームメモリ22から読み出す。また、現在、符号化しようとしている対象のマクロブロックはマクロブロック分割部13から出力されたマクロブロックである。
動き予測の基本となる動き推定と動き補償の概念について、図19を例に説明する。動き推定とは、符号化済みのピクチャ(参照ピクチャ)から対象マクロブロックの内容と似通った部分を検出する技術である。ここでは、動き推定の典型的な技術としてブロックマッチング法について説明する。
図19(A)に破線で示す参照ピクチャ83内の輝度成分ブロック84が図19(B)に示す太枠で囲んだ現在の対象ピクチャ81の輝度成分ブロック82と空間的に同位置に相当する。動き推定では、まず、輝度成分ブロック84を囲む探索範囲87を設定する。次に、この範囲内を1画素ずつ縦横に移動しながら探索し、評価値が最小となる位置をそのブロックの予測位置とする。評価値の算出には、例えば、ブロック内の予測誤差信号の絶対値和、または2乗和に動きベクトルの符号量を加味した関数を用いる場合が多い。
動きベクトルとは、元のブロック位置から予測位置までの移動量をベクトルで示したものである。例えば、輝度ブロック84に対応する予測位置をブロック85とすると、移動量86が動きベクトルとなる。なお、H.264では、動きベクトルの精度は1/4画素であり、整数精度で探索を行った後、その周囲の1/2画素と1/4画素を検索する必要がある。一方、動き補償は、動きベクトルと参照ピクチャから予測ブロックを生成する技術である。例えば、輝度成分ブロック82を予測対象ブロック、移動量86を動きベクトルすると、ブロック85が予測ブロックとなる。
図20は、Pピクチャタイプにおける動き補償のブロックサイズを示す図である。基本のマクロブロックタイプ(モード)は、図20(A)〜図20(D)に示す4種類の分割ブロックのタイプがあり、予測対象となるマクロブロック毎に選択する。さらに、8×8ブロックを選択した場合には、各8×8のサブブロックタイプ(モード)について、図20(E)〜図20(H)に示す4種類の分割ブロックのタイプから選択する。H.264では、参照ピクチャとして複数のピクチャを用意し、基本マクロブロックタイプ内の各分割ブロック(90−0、91−0〜91−1、92−0〜92−1、93−0〜93−3)毎にどの参照ピクチャを予測に用いるかを選択できる。
Bピクチャタイプおいても選択可能な動き補償のブロックサイズは、同様であるが、基本マクロブロックタイプ(モード)内の各分割ブロック毎に、予測の種類(参照ピクチャの数と方向)を選択できる。具体的には、複数の参照ピクチャを登録した2種類の参照ピクチャリスト(リスト1とリスト2)を用意し、リスト1(前方予測)、リスト2(後方予測)あるいはリスト1とリスト2の両方(双予測)の3通りから予測の種類を選択できる。予測に使用する参照ピクチャも、各リストについて、基本マクロブロックタイプ内の分割ブロック毎に選択できる。なお、双予測では、2つの予測候補ブロック内の各画素を内挿処理して、予測ブロックを生成する。
また、Bピクチャタイプでは、16×16マクロブロックと8×8サブブロックに対して、ダイレクト予測と呼ばれる予測モードが用意されている。この予測モードでは、符号化済みの情報からそのブロックの参照ピクチャ、予測の種類、動きベクトルが自動的に算出されるため、これらの情報を符号化する必要がない。
さらに、上記予測タイプのそれぞれについて、skipマクロブロックといわれるモードが存在する。このモードでは、動き補償後の予測マクロブロックと対象マクロブロックとの予測誤差がゼロのモードである。Pタイプのskipマクロブロックでは動きベクトルもゼロで、Bピクチャタイプのskipマクロブロックでは動きベクトルは上記ダイレクトモードと同じ方法で算出される。
なお、上記動き推定部24で予測した予測タイプ(モード)についてそれぞれ、予測タイプ(モード)から生成した予測マクロブロックと対象マクロブロックの差分絶対値和および動きベクトルの推定符号量などを考慮した評価関数によって評価値を算出する。
以上のようにして、イントラ推定部23および動き推定部24で選択された各予測タイプ(モード)とその評価値は、モード選択部25に出力される。モード選択部25は、イントラ推定部23と動き推定部24とから受け取った複数の評価値からその値が最小となる予測タイプ(モード)を選択する。
選択された予測タイプ(モード)はモードスッチ26へ送られる。モードスッチ26は、選択された予測タイプ(モード)に従って、予測情報(予測タイプ、動きベクトル、参照ピクチャ番号)をイントラ予測部27または動き補償部28に対して出力する。イントラ予測部27または動き補償部28は、選択された予測タイプと、フレームメモリ22内の符号化済み周囲画素や参照ピクチャから予測マクロブロックを生成し、差分処理部14および加算処理部21に出力する。
このように、H.264画像符号化では、イントラ予測、動き予測および直交変換の処理において複数の符号化モード(あるいは符号化タイプ)が選択できるため、最適な符号化モード(あるいは符号化タイプ)を選択することで符号化効率は高くなる。すなわち、先に述べたように、H.264画像符号化における符号化モード(あるいは符号化タイプ)の選択肢の多さが、従来のMPEG−2やMPEG−4といった画像符号化と大きく異なる点である。
また、H.264画像符号化では、そのレベルによって最大フレームレートやピクチャのサイズが決められている。例えば、レベルが最高の5.1(非特許文献1参照)であれば、図21に示すようなピクチャフォーマットがすべてデコードできなければならない。なお、現在よく使用されてものとして、標準解像度のSD(Standard Definition)のピクチャフォーマットとしては、“525 4SIF”、“525 SD”、“4CIF”あるいは“625 SD” が挙げられる。また、高解像度のHD(High Definition)のピクチャフォーマットとしては、“720p HD”、あるいは“1080 HD”が挙げられる。
このように、H.264画像符号化は、多くの符号化モード(あるいは符号化タイプ)の選択肢を有し、しかも、多くのピクチャフォーマットに対応させることができる。これに対して、従来の画像符号化などでは、イントラ予測、動き予測および直交変換の処理において符号化モード(あるいは符号化タイプ)として選択肢がほとんどないため、標準解像度のSDの画像を符号化する場合と高解像度のHDの画像を符号化する場合とで、同じような符号化設定条件で符号化していた。
例えば、MPEG−2画像符号化では、H.264画像符号化のようなイントラ予測はなく、動き予測は16×16のマクロブロック単位で行われ、直交変換は8×8ブロックサイズのみである。同様に、MPEG−4でもH.264画像符号化のようなイントラ予測はなく、直交変換は8×8ブロックサイズのみ、動き予測も16×16と8×8のブロックサイズを選択できるだけである。
これに対して、H.264画像符号化では、上記の処理単位となるブロックサイズ等の要素を含む符号化モード(あるいは符号化タイプ)の選択肢が多く、解像度の違いによって符号化モード(あるいは符号化タイプ)の選択が可能である。しかしながら、そうした選択の自由度は、一方で、H.264画像符号化を実装する上で、回路規模、消費電力あるいは画質の観点から、解像度が違う場合、符号化モード(あるいは符号化タイプ)をいかに選択するかといった課題を生むことになる。
例えば、回路規模あるいは消費電力の観点からみると、ピクチャの解像度が高くなればなるほど、処理するマクロブロックは増え、すべての符号化モード(あるいは符号化タイプ)から最適なモード(あるいはタイプ)を選択するとなると、演算量が大幅に増大し動作周波数を上げなければならず結果的に消費電力が大きく上昇する。また、パイプラン化し動作周波数を下げたとしても今度は回路規模が増大する。
また、画質の観点からみると、高解像度HDは標準解像度SDに比べピクチャ内のマクロブロックの総数が2倍以上のため、高解像度HDのマクロブロックは標準解像度SDのそれよりも表示画面に占める面積が小さくなる。従って、人間の視覚分解能を考慮すると、高解像度HDの小さなマクロブロックに発生した歪みは検知しにくくなる。これにより、高解像度HDの画像は、同じSNR(Signal to Noise Ratio)の標準解像度SDの画像と比べ画質の劣化許容限度が低くなるため、画質的に余裕ができ、符号化モードの最適化に余裕を持たせることができる。
更に、画像の情報量の観点から見ると、平坦で一様な画像内容でなければ、高解像度HDは標準解像度SDよりも画像の情報量が少なくなる。同じ内容の画像を取り込んで符号化した場合、標準解像度SDの方が1マクロブロックに表現される画像の内容(対象物が表現される領域)が広いため、マクロブロック内の画像の大きな信号変化も多くなり、情報量が多くなる。
上記課題に対して、従来技術として、テレビジョン番組の種類から前記テレビジョン番組の信号の符号化条件を決定する符号化条件生成器と、前記信号を符号化する信号符号化器とを具備し、前記信号符号化器は前記符号化条件生成器により決定された符号化条件によって前記信号を符号化することを特徴とするテレビジョン信号符号化装置が開示されている(例えば、特許文献1参照)。なお、上記信号の符号化条件としては、平均ビットレート、画面サイズなどである。
上記テレビジョン信号符号化装置では、テレビジョン番組、例えば、スポーツ番組、ドラマ番組あるいはニュース番組といった番組の種類によって最適な符号化条件が異なるため、その番組を符号化する条件、例えば、平均ビットレートや画面サイズなどを決定し、その符号化条件で符号化するというものである。
Draft of Version 4 of H.264/AVC(ITU−TRecommendation H.264 and ISO/IEC 14496−10 (MPEG−4 part 10) Advanced Video Coding),Joint Video Team (JVT) of ISO/IEC MPEG & ITU−T VCEG、Document:JVT−N050d1、2005−01−28 特開平11−55626号公報
上述のように、H.264画像符号化は、MPEG−2やMPEG−4といった従来の符号化方式に比べ、イントラ予測、動き予測および直交変換の処理において多くの符号化モード(あるいは符号化タイプ)を有しており、解像度の違いによって符号化モード(あるいは符号化タイプ)の選択が可能である。しかしながら、そうした選択の自由度は、一方で、H.264画像符号化を実装する上で、回路規模、消費電力あるいは画質の観点から、解像度が違う場合、符号化モード(あるいは符号化タイプ)をいかに選択するかといった課題を生むことになる。
なお、上記特許文献1に開示された技術は、テレビジョン番組の種類によって、平均ビットレートや画面サイズといった符号化条件を設定することで番組に合った符号化を可能にすると言うものである。こうした符号化する前にテレビジョン番組の種類を知る番組情報のようなものが提供されている、あるいはすでに知っていて入力することが可能な場合にのみ符号化条件を決定することができる。
しかしながら、自分で撮影記録しようとしている場合、あるいは記録しようとしている番組の内容が事前にわからない場合は、符号化条件の設定は一般にはむずかしく、符号化モード(あるいは符号化タイプ)の選択も何らかの画像情報をもとに設定する必要がある。
本発明は上記の事情に鑑みてなされたものであり、画像の解像度に関する情報を利用し、H.264画像符号化のイントラ予測、動き予測および直交変換の処理における符号化モード(あるいは符号化タイプ)を適応的に選択しその画像の解像度に応じた適切な符号化を可能にし、回路規模、消費電力あるいは画質といった実装上の観点から最適な動画像符号化装置および動画像符号化方法を提供することを目的とする。
上記課題を解決し上記目的を達成するために、本発明の動画像符号化装置は、複数ピクチャからなる動画像の各ピクチャをマクロブロックに分割すると共に前記マクロブロックを更にブロックに分割してイントラ予測、動き予測並びに直交変換の処理を行う動画像符号化装置であって、符号化対象ピクチャの符号化後の解像度に関する情報である解像度情報の選択または入力を受け付ける解像度情報受付手段と、前記解像度情報受付手段により受け付けられた前記解像度情報に応じ、前記マクロブロックを分割するときの分割サイズを複数の選択肢の中から1つ以上選択するブロックサイズ選択手段とを備える。
この構成により、本発明の動画像符号化装置は、解像度に関する情報である解像度情報に応じてイントラ予測等に使用されるブロックサイズを複数の選択肢の中から絞り込むことができる。従って、符号化処理に係る動作を効率的に行うことができ、かつ、解像度に応じた適切な符号化が可能となる。
また、前記ブロックサイズ選択手段は、前記解像度情報受付手段により受け付けられた前記解像度情報が所定の解像度以上の解像度を示す場合、前記分割サイズとして所定のサイズ以上のブロックサイズを選択するとしてもよい。または、前記ブロックサイズ選択手段は、前記解像度情報受付手段により受け付けられた前記解像度情報が所定の解像度以下の解像度を示す場合、前記分割サイズとして所定のサイズ以下のブロックサイズを選択するとしてもよい。
これにより、ユーザの実質的な視認能力を考慮したブロックサイズの候補の絞り込みを行うことができる。
また、本発明の動画符号化装置は、更に、前記符号化対象ピクチャ内における信号変化または信号レベルに基づき、前記符号化対象ピクチャの少なくとも一部の特徴を示す情報である画像特徴量を算出する画像特徴量算出手段を備え、前記ブロックサイズ選択手段は、前記解像度情報受付手段により受け付けられた前記解像度情報と、前記画像特徴量算出手段により算出された前記画像特徴量とに基づき、前記分割サイズを選択するとしてもよい。
この構成により、本発明の動画符号化装置は解像度情報だけでなく、平坦か非平坦か、または明るいか暗いか等の画像の特徴を考慮してイントラ予測等に使用されるブロックサイズの候補の絞り込みを行うことができる。つまり、ユーザの実質的な視認能力を考慮した、より緻密な絞り込みを行うことができる。
また、前記画像特徴量は、前記符号化対象ピクチャ内における信号変化の度合いおよび信号レベルの大きさの少なくとも一方と正の相関関係を有する値であり、前記ブロックサイズ選択手段は、前記画像特徴量が所定の閾値以上である場合、前記分割サイズとして所定のサイズ以下のブロックサイズを選択するとしてもよい。または、前記ブロックサイズ選択手段は、前記画像特徴量が所定の閾値以下である場合、前記分割サイズとして所定のサイズ以上のブロックサイズを選択するとしてもよい。
これらによっても、ユーザの実質的な視認能力を考慮したブロックサイズの候補の絞り込みを行うことができる。
また、前記画像特徴量算出手段は、前記画像特徴量として、前記符号化対象ピクチャが分割されたマクロブロック内の信号変化または信号レベルに基づき、前記マクロブロックの特徴を示す情報を算出し、前記ブロックサイズ選択手段は、前記マクロブロック毎に前記分割サイズを選択するとしてもよい。
これにより、細かい単位で分割サイズを選択することができる。つまり、より細かい単位で最適な符号化モードを選択することができる。
また、前記解像度情報受付手段は、前記解像度情報として少なくとも標準解像度または高解像度を示す情報を受け付けるとしてもよい。また、前記標準解像度を示す情報とは、ピクチャフォーマットである“525 4SIF”または“625SD”を示す情報であり、前記高解像度を示す情報とは、ピクチャフォーマットである“720pHD”または“1080HD”を示す情報であるとしてもよい。
また、前記ブロックサイズ選択手段は、前記解像度情報受付手段により前記解像度情報として前記高解像度を示す情報が受け付けられた場合、前記イントラ予測および前記直交変換の処理に使用する前記分割サイズとして8×8のブロックサイズを含む1つ以上のブロックサイズを選択するとしてもよい。
また、前記ブロックサイズ選択手段は、前記解像度情報受付手段により、前記解像度情報として前記高解像度を示す情報が受け付けられた場合、前記動き予測の処理に使用する前記分割サイズとして4×4のブロックサイズを含まない1つ以上のブロックサイズを選択するとしてもよい。
さらに、本発明は、本発明の動画像符号化装置の特徴的な構成部をステップとする方法として実現したり、それらのステップを含むプログラムとして実現したり、そのプログラムが格納されたCD−ROM等の記憶媒体として実現したり、集積回路として実現することもできる。プログラムは、通信ネットワーク等の伝送媒体を介して流通させることもできる。
本発明の動画像符号化装置および動画像符号化方法によれば、解像度に関する情報を選択または入力して設定し、イントラ予測、動き予測および直交変換の処理における符号化モード(あるいは符号化タイプ)を適応的に選択することで、その画像の解像度に応じた符号かを可能とすることができる。結果として、回路規模の削減、消費電力の低減あるいは高画質化の保持を可能にする。
以下、本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
図1は、本発明の実施の形態1における動画像符号化装置の機能的な構成を示す機能ブロック図である。
図1に示す動画像符号化装置1は、入力される動画像をブロック単位で符号化するための装置であり、図1に示すようにA/D変換部11と、画像並び替えバッファ12と、マクロブロック分割部13、差分処理部14、直交変換部15、量子化部16、符号化部17、蓄積バッファ18、逆量子化部19、逆直交変換部20、加算処理部21、フレームメモリ22、イントラ推定部23、動き推定部24、モード選択部25、モードスッチ26、イントラ予測部27、動き補償部28、レート制御部29、解像度情報受付部110、およびブロックサイズ選択部111を備えている。
本実施の形態の動画像符号化装置1の構成は、上記背景技術で説明した従来の動画像符号化装置の構成に、解像度情報受付部110およびブロックサイズ選択部111が追加されたものである。従って、動画像符号化装置1の各構成部の符号は、図13に示す動画像符号化装置の構成部と同じ動作をするところは同じ符号を付してある。
このため、以下、本実施の形態の説明では、上記従来の動画像符号化装置の構成とは異なる構成部である解像度情報受付部110とブロックサイズ選択部111、および、これら構成部と、ブロックサイズ選択部111から信号が送られている直交変換部15、イントラ推定部23および動き推定部24との関係について中心的に述べる。
解像度情報受付部110は、符号化対象ピクチャの符号化後の解像度に関する情報(以下、単に「解像度情報」ともいう。)の選択または入力を受け付ける処理部である。例えば、図1に記載されていない表示画面に、メニュー形式で解像度の情報に関する選択画面が用意されており、ユーザにより、動画像の符号化後の解像度が選択されることによりその選択された情報を受け付けることができる。なお、表示画面のメニューでなくとも、スイッチやボタンなどで特定の解像度の情報を表すシンボルや名称を選択するような形態でもよい。また、ユーザが解像度情報を直接入力できる入力フィールドを表示画面に表示し、入力フィールドに入力される解像度情報を受け付けてもよい。
なお、解像度情報としては、例えば、図21に示したようなピクチャフォーマットの名称(例えば、525 4SIF、1080 HD)、具体的な輝度信号の幅と高さのサンプル数の数値、解像度のモードに関する記載(例えば、標準解像度モード、高解像度モード)あるいは解像度を何らかの独自の名称、記号ないし音声で規定したものである。これら解像度情報は、ブロックサイズ選択部111へ供給される。
ブロックサイズ選択部111は、解像度情報受付部110により受け付けられた解像度情報に応じ、マクロブロックを分割するときの分割サイズを、複数の選択肢の中から1つ以上選択する処理部である。
具体的には、解像度情報受付部110から供給される解像度情報に基づきイントラ予測、動き予測および直交変換で用いるブロックサイズの候補を選択する。このとき選択肢となるブロックサイズは、イントラ予測の輝度信号の場合、4×4、8×8および16×16の3種類、動き予測では16×16、16×8、8×16、8×8、8×4、4×8および4×4の7種類、そして直交変換では4×4および8×8の2種類である。
ブロックサイズの選択は、上記のブロックサイズの種類から解像度に合わせて符号化効率、画質において有効であるものを一つ以上選択する。具体的に、解像度として、現在、標準解像度SDに属するであろうピクチャのフォーマット“525 4SIF”と、高解像度HDに属するであろうピクチャのフォーマット“1080 HD”の2つの解像度がユーザに選択される場合を例に挙げ、それぞれの場合のブロックサイズ選択部111の動作を説明する。
図2は、上記2つの解像度、SD(525 4SIF)とHD(1080 HD)における輝度信号サンプル数とマクロブロック数とを示す図である。HDはSDに対してピクチャ当たり6倍程度のサンプル数(マクロブロック数)を有している。従って、単純に計算して、イントラ予測や直交変換の場合、“1080 HD”は“525 4SIF”のマクロブロック数比の6倍程度の演算量である。また、ピクチャ全体に対する探索範囲の割合がSDとHDで同じであれば、動き予測ではこの6倍に更に動き探索範囲の2乗倍が乗算される。
このため、HDの演算量を抑え消費電力を低減したり、回路規模を削減するには、できるだけ画質に影響しないブロックサイズをイントラ予測等に使用する候補から除外した方がよい。とりわけ、ブロックのサイズが小さい場合、同一画面に表示したHDのブロックはSDに比べ非常に小さくなるので、歪みも検知しにくく、画像の情報量も低くなる可能性がある。そのため、ブロックサイズの使用候補から外しても影響はない。逆に、使用候補を少なくすることにより、画像の内容によっては、符号化するブロック数が減るため、ブロックを示す符号化モード(あるいは符号化タイプ)に関する情報の送出も減り、符号化効率が上がる場合がある。
以下、本実施の形態では、H.264画像符号化においてイントラ8×8予測、8×8直交変換が使用可能なHighプロファイルを使用し、“1080 HD”までデコード可能なレベル4.1(非特許文献1参照)を想定し説明する。
図3は、SDおよびHDのそれぞれの場合においてイントラ予測に使用するブロックサイズの候補の例を示す図である。SDとHDに関する上記の理由から、SDの場合、4×4および16×16のブロックサイズが使用候補として選択される。HDの場合、8×8および16×16のブロックサイズが使用候補として選択される。
図4は、SDおよびHDのそれぞれの場合において直交変換に使用するブロックサイズの候補の例を示す図である。
イントラ予測のブロックサイズと関係する直交変換におけるブロックサイズは、図4に示すようにSDの場合4×4が、HDの場合8×8が選択される。
図5は、SDおよびHDのそれぞれの場合において動き予測に使用するブロックサイズの候補の例を示す図である。
動き予測に使用するブロックサイズの候補は、図5に示すように、SDの場合、16×16、16×8、8×16、8×8、8×4、4×8および4×4の7種類すべて。HDの場合、16×16、16×8、8×16の3種類が選択される。これも、SDとHDに関する上記の理由から、HDについては、比較的小さなブロックサイズを使用候補から除外した例である。8×8のブロックサイズをHDで外したのは8×8ブロックに分割した場合、1マクロブロックで4つのブロックをそれぞれ動き予測する必要があり、演算量が大きく増えるためである。
ブロックサイズ選択部111は、解像度情報受付部110から供給される解像度情報、すなわち、本実施の形態においてはSDまたはHDを示す情報に応じ、図3〜図5に示すようなブロックサイズの候補の中から特定の候補を、イントラ推定部23、動き推定部24および直交変換部15へ送信する。
なお、これらブロックサイズの使用候補についての情報は、ブロックサイズ選択部111が有する所定の記憶領域(図示せず)に記憶している。
イントラ推定部23は、図3のSDあるいはHDにおけるブロックサイズの候補に基づき、入力されたピクチャの各マクブロックについて、候補のブロックサイズのそれぞれでイントラ予測を実行する。
同様に、動き推定部24は、図5のSDあるいはHDにおけるブロックサイズの候補に基づき、入力されたピクチャの各マクブロックについて、候補のブロックサイズのそれぞれで動き予測を実行する。
また、直交変換部15は、差分マクロブロックを図3のイントラ予測のブロックサイズに合わせ、SDの場合は4×4で直交変換し、HDの場合は8×8で直交変換する。
図6は、解像度情報受付部110、ブロックサイズ選択部111、差分処理部14、直交変換部15、イントラ推定部23、動き推定部24、モード選択部25、イントラ予測部27、動き補償部28における上記のような解像度情報に基づいて選択されるブロックサイズ候補でのイントラ予測、動き予測(動き推定)、直交変換に係る処理の流れを示すフローチャートである。
解像度情報受付部110において、解像度情報がメニュー画面あるいはスイッチなどから選択、または直接解像度モードが入力されることで受け付けられる(S202)。
この解像度情報はブロックサイズ選択部111に送られる。ブロックサイズ選択部111は、この解像度情報をもとに、イントラ予測ブロックサイズの候補を選択(S203)、動き予測のブロックサイズの候補を選択(S204)、そして直交変換ブロックサイズの候補を選択(S205)する。
このとき、解像度情報が、例えば、標準解像度SDとして選択または入力された“525 4SIF”であった場合、ブロックサイズ選択部111は、イントラ予測のブロックサイズの候補として4×4および16×16を、直交変換のブロックサイズの候補として4×4を、動き予測のブロックサイズの候補として16×16、16×8、8×16、8×8、8×4、4×8および4×4の7種類を選択する。
一方、解像度情報が、例えば、高解像度HDとして選択または入力された“1080 HD”であった場合、ブロックサイズ選択部111は、イントラ予測のブロックサイズの候補として8×8および16×16を、直交変換のブロックサイズの候補は8×8を、動き予測のブロックサイズの候補として16×16、16×8、8×16の3種類を選択する。
ブロックサイズ選択部111により選択(S203)されたイントラ予測ブロックサイズの候補は、イントラ推定部23へ送られる。イントラ推定部23は、上記候補となったイントラ予測ブロックサイズを用いてイントラ推定をする(S206)。
また、ブロックサイズ選択部111により選択(S204)された動き予測ブロックサイズの候補は、動き推定部24へ送られる。動き推定部24は、上記候補となった動き予測ブロックサイズを用いて動き予測する(S207)。
イントラ推定部23により候補のブロックサイズを用いてイントラ推定されたイントラ予測モードと、候補のブロックサイズを用いて動き推定(動き予測)(S207)された動き予測モードについて、モード選択部25は、所定の評価関数をもとに最適な予測モードを選択する(S208)。
S208においてイントラ予測モードあるいは動き予測モードのどちらかが選択され、イントラ予測部27は、イントラ予測マクブロックを生成し(S209)、また、動き補償部28は動き補償マクロブロックを生成する(S210)。
差分処理部14は、生成されたイントラ予測マクロブロックあるいは動き補償マクロブロックについて入力マクロブロックを用いて差分処理し、差分マクロブロックを算出する(S211)。
差分処理部により算出(S211)された差分マクロブロックは、ブロックサイズ選択部111により選択(S205)された直交変換ブロックサイズにもとづいて直交変換される(S212)。なお、モード選択部25によるモード選択(S208)でイントラ予測のモードが選択された場合は、イントラ予測のブロックサイズと合わせられる。具体的には、イントラ4×4予測のときは直交変換も4×4、イントラ8×8予測のときは直交変換も8×8のブロックサイズで行われる。また、イントラ16×16予測のときは直交変換は4×4のブロックサイズで行われる。
このように、本発明は、多くの符号化モード(あるいは符号化タイプ)の選択肢を有するH.264画像符号化において、解像度に関する情報に応じ、イントラ予測、動き予測および直交変換の処理における符号化モード(あるいは符号化タイプ)を適応的に選択することができる。つまり、その画像の解像度に適した符号化を可能にし、回路規模、消費電力あるいは画質といった実装上の観点から最適な動画像符号化装置および動画像符号化方法を提供することができる。
(実施の形態2)
図7は、本発明の実施の形態2における動画像符号化装置の機能的な構成を示す機能ブロック図である。
図7に示す実施の形態2における動画像符号化装置2の構成は、上記の実施の形態1の動画像符号化装置1の構成とほとんど同じあり、前処理部112が追加されている点が異なる。従って、動画像符号化装置2が備える各構成部の符号は、第1の実施の形態で説明した図1に示す動画像符号化装置1の各構成部と同じ動作をするところは同じ符号を付してある。
以下、本実施の形態の説明では、実施の形態1と構成の異なる前処理部112を中心的に説明する。
前処理部112は、A/D変換部11から供給された画像信号に対して、信号の変化あるいは信号のレベルに基づき、ピクチャの少なくとも一部の特徴を示す情報である画像特徴量を算出し、ブロックサイズ選択部111へ供給する。なお、前処理部112は本発明の画像特徴量算出手段の一例である。
信号の変化に関する特徴を示す値として、例えば信号の変化点の数を用いることができる。具体的には、A/D変換部11でデジタル信号に変換された信号について、例えば、スキャンする連続した信号から隣接信号間の差分を抽出し、その差分の絶対値を所定の値と比べ、その値よりも大きい場合を信号の変化点としてカウントする。そしてそのカウント合計数を画像特徴量とする。
あるいは、一旦メモリに、A/D変換された信号を蓄積し2次元の空間配置に整列させ、2方向の信号変化から信号の変化点を抽出してもよい。
図8は、2次元空間内の信号の変化点を抽出する手法の一例を示す図である。
図8に示すように、変化点たり得るか否かの判定の対象となる対象信号を中央のp(i、j)(iおよびjは整数)とした場合、その上下斜めに位置する対角位置にある信号対、すなわちp(i−1、j−1)とp(i+1、j+1)の対、およびp(i+1、j−1)とp(i−1、j+1)の対の信号間差分の絶対値をとる。更に、2つの信号対のうちどちらか大きい方の信号間差分の絶対値であるPedge(i、j)が、所定の値よりも大きい場合を信号の変化点としてカウントし、カウント合計数を画像特徴量とする。
なお、信号の変化の算出方法として他のどのような方法を用いてもよく、それが画像のエッジ、輪郭、テクスチャなど信号の変化の度合い(変化している部分が多いか少ないか、画像が非平坦か平坦かなど)を示すものであればよい。
また、信号のレベルに関する特徴を示す値として、例えば、所定の値以上の輝度値を有する信号の数を用いることができる。具体的には、A/D変換部11でデジタル信号に変換された輝度信号値が所定の値より大きい場合を高輝度点としてカウントし、カウント合計数を画像特徴量とする。カウント数がゼロあるいは所定の数以下の場合、その画像は暗く画像内容がよくわからない画像であること意味する。
なお、画像特徴量として、前記信号の変化と信号レベルとを組み合わせてもよい。例えば、信号レベルが低く、且つ信号の変化が小さければ、その画像は暗くて平坦な信号成分からなり、画像内容が更にわかりにくい画像であることを示す。
要するに、画像特徴量は、符号化対象ピクチャ内における信号変化あるいは信号レベルに基づく情報であればよい。より具体的には、符号化対象ピクチャ内における信号変化の度合いおよび信号レベルの大きさの少なくとも一方と相関関係を有する値であればよい。本実施の形態においては、画像特徴量は信号変化の度合いおよび信号レベルの大きさの少なくとも一方と正の相関関係を有する値である。
ブロックサイズ選択部111は、上記実施の形態1での動作と同じように解像度情報受付部110から解像度情報を受け、更に前処理部112から信号の変化あるいは信号のレベルに関する情報を受け、イントラ予測、動き予測そして直交変換の処理に使用するブロックサイズの候補を選択する。
なお、解像度情報として、上記実施の形態1における想定と同じく、ピクチャフォーマットである“525 4SIF”あるいは“1080 HD”をユーザから選択または入力された場合について説明する。
ブロックサイズ選択部111におけるブロックサイズの選択は、解像度情報と信号の変化あるいは信号のレベルに関する情報に合わせて、符号化効率あるいは画質において有効であるものの候補を一つ以上選択する。
以下、本実施の形態においても、H.264画像符号化においてイントラ8×8予測、8×8直交変換が使用可能なHighプロファイルを使用し、“1080 HD”までデコード可能なレベル4.1(非特許文献1参照)を想定し説明する。
図9は、解像度情報と画像特徴量とに応じてイントラ予測に使用されるブロックサイズの候補の一例を示した図である。
図9(A)および図9(B)は、イントラ予測の場合のSD(ここでは、“525 4SIF”)とHD(ここでは“1080 HD”)におけるブロックサイズの候補の例を示している。
図9(A)は、前処理部112から画像特徴量として供給された信号の変化点のカウント数が所定の閾値より少ない場合、または、前処理部112から画像特徴量として供給された高輝度点のカウント数が所定の閾値より少ない場合にイントラ予測に使用するブロックサイズの候補である。
ここで、変化点のカウント数が少ない場合とは、言い換えると、入力画像が平坦な場合である。また、高輝度点のカウント数が少ない場合とは、言い換えると、入力画像が暗い場合である。
すなわち、入力画像が平坦あるいは暗い場合、図9(A)に示すように、所定のサイズ以上の比較的大きなブロックサイズをイントラ予測に使用するブロックサイズの候補として選択する。これは、平坦あるいは暗い画像では、空間周波数に高域成分が少ない、あるいは暗い画像では歪みを検知しにくいため、比較的大きなブロックサイズで処理しても符号化効率あるいは画質に影響を及ぼさないためである。
図9(B)は、前処理部112から画像特徴量として供給された信号の変化点のカウント数が所定の閾値以上である場合、または、前処理部112から画像特徴量として供給された高輝度点のカウント数が所定の閾値以上である場合にイントラ予測に使用するブロックサイズの候補である。
すなわち、入力画像が非平坦で高い空間周波数成分を多く含む、または、明るいもしくは信号レベルのレンジ(範囲)が広い画像であるため、所定のサイズ以下の比較的小さなブロックサイズをイントラ予測に使用する候補として選択する。
なお、信号変化の度合いまたは信号レベルの大きさを表す画像特徴量がどちらの条件にも当てはまらない場合は、実施の形態1の説明で参照した図3に示すブロックサイズの候補を選択すればよい。
図10は、解像度情報と画像特徴量とに応じて直交変換に使用されるブロックサイズの候補の一例を示した図である。
図11は、解像度情報と画像特徴量とに応じて動き予測に使用されるブロックサイズの候補の一例を示した図である。
図10(A)と図10(B)との違い、および図11(A)と図11(B)との違いは、図9(A)と図9(B)との違いと同様である。
すなわち、入力画像の信号変化あるいは信号レベルが全体として小さい場合、ブロックサイズ選択部111は、図10(A)および図11(A)に示すブロックサイズの候補からSDまたはHDに対応するブロックサイズの候補を選択する。
逆に、入力画像の信号変化あるいは信号レベルが全体として大きい場合には、ブロックサイズ選択部111は、図10(B)および図11(B)に示す候補からSDまたはHDに対応するブロックサイズの候補を選択する。
更に、図10(A)または図10(B)から選択されたブロックサイズの候補は、直交変換部15へ送られ、図11(A)または図11(B)から選択されたブロックサイズの候補は、動き推定部24へ送られる。
なお、信号変化あるいは信号レベルが上記のどちらの条件にも当てはまらない場合は、直交変換については図4に示す候補の中から、動き予測については図5に示す候補の中からそれぞれ選択する。
このように、ブロックサイズ選択部111は、解像度情報と入力信号の信号変化あるいは信号のレベルに基づく画像特徴量に応じ、図9〜図11に示すようなブロックサイズの候補の中から特定の候補をイントラ推定部23、動き推定部24および直交変換部15へ送信する。
イントラ推定部23、動き推定部24および直交変換部15が行う処理は上記実施の形態1における処理と同様である。
図12は、解像度情報受付部110、ブロックサイズ選択部111、前処理部112、差分処理部14、直交変換部15、イントラ推定部23、動き推定部24、モード選択部25、イントラ予測部27、および動き補償部28における、解像度と画像入力信号の変化(あるいは信号レベルの大きさ、レンジ)に基づいて選択されるブロックサイズ候補でのイントラ予測、動き予測(動き推定)、および直交変換に係る処理の流れを示すフローチャートである。
なお、本フローチャートは、上述の図6に示す実施の形態1におけるフローチャートと比較すると、信号変化または信号レベルの抽出(S301)が追加された点が異なる。そこで、以下に、信号変化または信号レベルの抽出に関する動作(S301)を中心に説明する。それ以外の動作は、実施の形態1における動作と同じである。
解像度情報受付部110において、解像度情報が受け付けられる(S202)。この解像度情報はブロックサイズ選択部111に送られる。また、前処理部112において、入力画像信号の信号変化あるいは信号レベルが抽出され、上述の画像特徴量が算出される。この画像特徴量はブロックサイズ選択部111に送られる(S301)。
ブロックサイズ選択部111は、解像度情報受付部110で受け付けられた(S202)解像度情報と、前処理部112から送られた(S301)画像特徴量とに基づき、イントラ予測ブロックサイズの候補を選択し(S302)、動き予測のブロックサイズの候補を選択し(S303)、更に直交変換ブロックサイズの候補を選択する(S304)。
このとき、解像度情報と、入力画像信号の信号変化あるいは信号レベルに基づく画像特徴量とを利用したブロックサイズの候補の選択は、例えば、図3、図4、図5、図9、図10および図11のそれぞれに示したようなブロックサイズの候補の中から選択する。その後の動作は、実施の形態1と同じであるので省略する。
なお、本実施の形態では、画像特徴量として信号の変化あるいは信号のレベルに基づく情報を使用した。しかしながら、画像の空間周波数の程度、エッジ成分の大きさと量などを示す情報であれば画像特徴量として他の情報を使用してもよい。
また、本実施の形態では前処理部112をA/D変換部11の後に配置し、ピクチャ単位で信号変化あるは信号レベルに基づく画像特徴量の算出を行なった。しかしながら、マクロブロック分割部13の後に前処理部112を配置し、マクロブロック単位で画像特徴量を算出してもよい。この場合、ブロックサイズ選択部111は、マクロブロック単位でイントラ推定等に使用するブロックサイズの候補を選択することができる。
更に、実施の形態1および実施の形態2において、標準解像度SDのピクチャフォーマットとして“525 4SIF”のみをあげたが、図21に示されるピクチャフォーマットの中でこのピクチャフォーマット近いもの、例えば、“VGA”、“525SD”、“4CIF”、“625SD”、あるいは、さらに解像度の低いピクチャフォーマットを標準解像度として見なして受け付けてもよい。
同様に、高解像度HDのピクチャフォーマットとして、“1080HD”の他に、“720pHD”、“4VGA”、“SXGA”、“525 16SIF”、“16CIF”、あるいはそれ以上の解像度のピクチャフォーマットを高解像度と見なして受け付けてもよい。また、図21に記載していないサンプル数の独自のフォーマットを標準解像度SDあるいは高解像度HDとして受け付けてもよい。
更に、本実施の形態では、標準解像度と高解像度の2つの解像度のみについて、ブロックサイズの選択の例を説明したが、低解像度、標準解像度、高解像度といった3以上の解像度に分け、ブロックサイズ選択部111が、それら解像度に応じてブロックサイズの選択を行ってもよい。
要するに、ブロックサイズ選択部111は、ユーザから選択または入力された解像度情報が所定の解像度以上の解像度を示す場合、マクロブロックを分割する分割サイズとして、所定のサイズ以上のブロックサイズを1つ以上選択すればよい。または、解像度情報が所定の解像度以下の解像度を示す場合、分割サイズとして所定のサイズ以下のブロックサイズを1つ以上選択すればよい。更に、これら所定の解像度は解像度軸上で複数存在していてもよく、この場合は、その存在に対応して、選択すべきブロックサイズの下限または上限を決定しておけばよい。
また、画像特徴量についても同様である。すなわち、実施の形態2において、ブロックサイズ選択部111は、解像度情報と画像特徴量とに応じて候補として選択するブロックサイズを変更していた。つまり、解像度情報だけでなく画像特徴量にも応じて候補として選択するブロックサイズを変更していた。具体的には、画像特徴量が所定の閾値以上であるか、および所定の閾値以下であるかの2段階の評価に応じ、ブロックサイズ選択部111が候補として選択するブロックサイズを変更した。しかしながら、3段階以上の評価に応じて、ブロックサイズ選択部111が候補として選択するブロックサイズを変更してもよい。
要するに、ブロックサイズ選択部111は、画像特徴量が所定の閾値以上である場合、マクロブロックを分割する分割サイズとして、所定のサイズ以下のブロックサイズを1つ以上選択すればよい。または画像特徴量が所定の閾値以下である場合、分割サイズとして所定のサイズ以上のブロックサイズを1つ以上選択すればよい。更に、これら所定の閾値は複数存在していてもよく、この場合は、その閾値の高低に対応して、選択すべきブロックサイズの下限または上限を決定しておけばよい。
また、図1および図7に示した機能ブロック図の各機能ブロックは典型的には集積回路であるLSIとして実現される。このLSIは1チップ化されても良いし、複数チップ化されても良い。また、例えばメモリ以外の機能ブロックが1チップ化されていても良い。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
また、各機能ブロックのうち、データを格納するユニットだけ1チップ化せずに、別構成としても良い。
本発明は、ピクチャをブロック単位に符号化する画像符号化装置に適しており、動画配信するウェブサーバー、それを受信するネットワーク端末、動画の記録再生可能なデジタルカメラ、カメラ付き携帯電話機、DVD録画/再生機、PDA、パーソナルコンピュータ等に適している。
本発明の実施の形態1における動画像符号化装置の機能的な構成を示す機能ブロック図である。 2つの解像度であるSD(525 4SIF)とHD(1080 HD)の輝度信号サンプル数とマクロブロック数とを示す図である。 本発明の実施の形態1において、解像度情報に応じてイントラ予測に使用されるブロックサイズの候補の例を示す図である。 本発明の実施の形態1において、解像度情報に応じて直交変換に使用されるブロックサイズの候補の例を示す図である。 本発明の実施の形態1において、解像度情報に応じて動き予測に使用されるブロックサイズの候補の例を示す図である。 本発明の実施の形態1の動画像符号化装置において、解像度情報に応じて選択されるブロックサイズ候補を用いた符号化処理の流れを示すフローチャートである。 本発明の実施の形態2における動画像符号化装置の構成を示すブロック図である。 本発明の実施の形態2において、2次元空間内の信号の変化点を抽出する手法の一例を示す図である。 本発明の実施の形態2において、解像度情報と画像特徴量とに応じてイントラ予測に使用されるブロックサイズの候補の一例を示した図である。 本発明の実施の形態2において、解像度情報と画像特徴量とに応じて直交変換に使用されるブロックサイズの候補の一例を示した図である。 本発明の実施の形態2において、解像度情報と画像特徴量とに応じて動き予測に使用されるブロックサイズの候補の一例を示した図である。 本発明の実施の形態2の動画像符号化装置において、解像度情報と画像特徴量とに応じて選択されるブロックサイズ候補を用いた符号化処理の流れを示すフローチャートである。 H.264画像符号化を実現する従来の動画像符号化装置の機能的な構成の一例を示す機能ブロック図である。 4:2:0フォーマットの1ピクチャの映像信号を説明するための図である。 4:2:0フォーマットの1マクロブロックの映像信号を説明するための図である。 4:2:0フォーマットの1マクロブロックの直交変換ブロックを説明するための図である。 H.264画像符号化での輝度信号におけるイントラ4×4予測を説明するための図である。 H.264画像符号化での輝度信号におけるイントラ16×16予測を説明するめの図である。 動き推定の典型的な技術としてブロックマッチング法について説明するための図である。 H.264画像符号化における動き補償ブロックタイプを説明するための図である。 動画像の各種ピクチャフォーマットの名称、輝度信号サンプル数、およびマクロブロック数を示したものである。
符号の説明
1、2 動画像符号化装置
11 A/D変換部
12 画像並び替えバッファ
13 マクロブロック分割部
14 差分処理部
15 直交変換部
16 量子化部
17 符号化部
18 蓄積バッファ
19 逆量子化部
20 逆直交変換部
21 加算処理部
22 フレームメモリ
23 イントラ推定部
24 動き推定部
25 モード選択部
26 モードスッチ
27 イントラ予測部
28 動き補償部
29 レート制御部
110 解像度情報受付部
111 ブロックサイズ選択部
112 前処理部

Claims (15)

  1. 複数ピクチャからなる動画像の各ピクチャをマクロブロックに分割すると共に前記マクロブロックを更にブロックに分割してイントラ予測、動き予測並びに直交変換の処理を行う動画像符号化装置であって、
    符号化対象ピクチャの符号化後の解像度に関する情報である解像度情報の選択または入力を受け付ける解像度情報受付手段と、
    前記解像度情報受付手段により受け付けられた前記解像度情報に応じ、前記マクロブロックを分割するときの分割サイズを複数の選択肢の中から1つ以上選択するブロックサイズ選択手段と
    を備える動画像符号化装置。
  2. 前記ブロックサイズ選択手段は、前記解像度情報受付手段により受け付けられた前記解像度情報が所定の解像度以上の解像度を示す場合、前記分割サイズとして所定のサイズ以上のブロックサイズを選択する
    請求項1記載の動画像符号化装置。
  3. 前記ブロックサイズ選択手段は、前記解像度情報受付手段により受け付けられた前記解像度情報が所定の解像度以下の解像度を示す場合、前記分割サイズとして所定のサイズ以下のブロックサイズを選択する
    請求項1記載の動画像符号化装置。
  4. 更に、前記符号化対象ピクチャ内における信号変化または信号レベルに基づき、前記符号化対象ピクチャの少なくとも一部の特徴を示す情報である画像特徴量を算出する画像特徴量算出手段を備え、
    前記ブロックサイズ選択手段は、前記解像度情報受付手段により受け付けられた前記解像度情報と、前記画像特徴量算出手段により算出された前記画像特徴量とに基づき、前記分割サイズを選択する
    請求項1記載の動画像符号化装置。
  5. 前記画像特徴量は、前記符号化対象ピクチャ内における信号変化の度合いおよび信号レベルの大きさの少なくとも一方と正の相関関係を有する値であり、
    前記ブロックサイズ選択手段は、前記画像特徴量が所定の閾値以上である場合、前記分割サイズとして所定のサイズ以下のブロックサイズを選択する
    請求項4記載の動画像符号化装置。
  6. 前記画像特徴量は、前記符号化対象ピクチャ内の信号変化の度合いまたは信号レベルの大きさと正の相関関係を有する値であり、
    前記ブロックサイズ選択手段は、前記画像特徴量が所定の閾値以下である場合、前記分割サイズとして所定のサイズ以上のブロックサイズを選択する
    請求項4記載の動画像符号化装置。
  7. 前記画像特徴量算出手段は、前記画像特徴量として、前記符号化対象ピクチャが分割されたマクロブロック内の信号変化または信号レベルに基づき、前記マクロブロックの特徴を示す情報を算出し、
    前記ブロックサイズ選択手段は、前記マクロブロック毎に前記分割サイズを選択する
    請求項4記載の動画像符号化装置。
  8. 前記解像度情報受付手段は、前記解像度情報として少なくとも標準解像度または高解像度を示す情報を受け付ける
    請求項1記載の動画像符号化装置。
  9. 前記標準解像度を示す情報とは、ピクチャフォーマットである“525 4SIF”または“625SD”を示す情報であり、
    前記高解像度を示す情報とは、ピクチャフォーマットである“720pHD”または“1080HD”を示す情報である
    請求項8記載の動画像符号化装置。
  10. 前記ブロックサイズ選択手段は、前記解像度情報受付手段により前記高解像度を示す情報が受け付けられた場合、前記イントラ予測および前記直交変換の処理に使用する前記分割サイズとして、8×8のブロックサイズを含む1つ以上のブロックサイズを選択する
    請求項8記載の動画像符号化装置。
  11. 前記ブロックサイズ選択手段は、前記解像度情報受付手段により前記高解像度を示す情報が受け付けられた場合、前記動き予測の処理に使用する前記分割サイズとして、4×4のブロックサイズを含まない1つ以上のブロックサイズを選択する
    請求項8記載の動画像符号化装置。
  12. 複数ピクチャからなる動画像の各ピクチャをマクロブロックに分割すると共に前記マクロブロックを更にブロックに分割してイントラ予測、動き予測並びに直交変換の処理を行う動画像符号化方法であって、
    符号化対象ピクチャの符号化後の解像度に関する情報である解像度情報の選択または入力を受け付ける解像度情報受付ステップと、
    前記解像度情報受付ステップにおいて受け付けられた前記解像度情報に応じ、前記マクロブロックを更にブロックに分割するときの分割サイズを複数の選択肢の中から1つ以上選択するブロックサイズ選択ステップと
    を含む動画像符号化方法。
  13. 更に、前記符号化対象ピクチャ内における信号変化または信号レベルに基づき、前記符号化対象ピクチャの少なくとも一部の特徴を示す情報である画像特徴量を算出する画像特徴量算出ステップを含み、
    前記ブロックサイズ選択ステップでは、前記解像度情報受付ステップにおいて受け付けられた前記解像度情報と、前記画像特徴量算出ステップにおいて算出された前記画像特徴量とに応じて、前記分割サイズを選択する
    請求項12記載の動画像符号化方法。
  14. 複数ピクチャからなる動画像の各ピクチャをマクロブロックに分割すると共に前記マクロブロックを更にブロックに分割してイントラ予測、動き予測並びに直交変換の処理を行うためのプログラムであって、
    符号化対象ピクチャの符号化後の解像度に関する情報である解像度情報の選択または入力を受け付ける解像度情報受付ステップと、
    前記解像度情報受付ステップにおいて受け付けられた前記解像度情報に応じ、前記マクロブロックを更にブロックに分割するときの分割サイズを複数の選択肢の中から1つ以上選択するブロックサイズ選択ステップと
    をコンピュータに実行させるためのプログラム。
  15. 更に、前記符号化対象ピクチャ内における信号変化または信号レベルに基づき、前記符号化対象ピクチャの少なくとも一部の特徴を示す情報である画像特徴量を算出する画像特徴量算出ステップを含み、
    前記ブロックサイズ選択ステップでは、前記解像度情報受付ステップにおいて受け付けられた前記解像度情報と、前記画像特徴量算出ステップにおいて算出された前記画像特徴量とに応じて、前記分割サイズを選択する
    請求項14記載のプログラム。
JP2006014376A 2006-01-23 2006-01-23 動画像符号化装置および動画像符号化方法 Pending JP2007201558A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006014376A JP2007201558A (ja) 2006-01-23 2006-01-23 動画像符号化装置および動画像符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006014376A JP2007201558A (ja) 2006-01-23 2006-01-23 動画像符号化装置および動画像符号化方法

Publications (1)

Publication Number Publication Date
JP2007201558A true JP2007201558A (ja) 2007-08-09

Family

ID=38455728

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006014376A Pending JP2007201558A (ja) 2006-01-23 2006-01-23 動画像符号化装置および動画像符号化方法

Country Status (1)

Country Link
JP (1) JP2007201558A (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009049779A (ja) * 2007-08-21 2009-03-05 Toshiba Corp 情報処理装置およびインター予測モード判定方法
JP2009296104A (ja) * 2008-06-03 2009-12-17 Hitachi Kokusai Electric Inc 画像符号化装置
WO2010052833A1 (ja) * 2008-11-07 2010-05-14 三菱電機株式会社 画像符号化装置及び画像復号装置
JP2010288080A (ja) * 2009-06-11 2010-12-24 Sony Corp 画像処理装置及び画像処理方法
WO2011080925A1 (ja) * 2009-12-28 2011-07-07 パナソニック株式会社 画像符号化装置および方法
JP2011151546A (ja) * 2010-01-20 2011-08-04 Mega Chips Corp 画像符号化装置及び画像変換装置
JP2011239365A (ja) * 2010-04-12 2011-11-24 Canon Inc 動画像符号化装置及びその制御方法、コンピュータプログラム
US8737482B2 (en) 2007-02-16 2014-05-27 Kabushiki Kaisha Toshiba Information processing apparatus and inter-prediction mode determining method
JP2015002368A (ja) * 2013-06-13 2015-01-05 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム
JP2015136150A (ja) * 2009-02-23 2015-07-27 コリア アドバンスド インスティテュート オブ サイエンス アンド テクノロジー ビデオ符号化での分割ブロック符号化方法、ビデオ復号化での分割ブロック復号化方法及びこれを実現する記録媒体
CN105284110A (zh) * 2013-07-31 2016-01-27 松下电器(美国)知识产权公司 图像编码方法及图像编码装置
JP2018093386A (ja) * 2016-12-05 2018-06-14 キヤノン株式会社 符号化装置及び符号化方法
WO2019069602A1 (ja) * 2017-10-03 2019-04-11 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法、プログラムおよび映像システム
WO2019069601A1 (ja) * 2017-10-03 2019-04-11 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法およびプログラム

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8737482B2 (en) 2007-02-16 2014-05-27 Kabushiki Kaisha Toshiba Information processing apparatus and inter-prediction mode determining method
JP2009049779A (ja) * 2007-08-21 2009-03-05 Toshiba Corp 情報処理装置およびインター予測モード判定方法
US8848798B2 (en) 2007-08-21 2014-09-30 Kabushiki Kaisha Toshiba Information processing apparatus and inter-prediction mode determination method
JP2009296104A (ja) * 2008-06-03 2009-12-17 Hitachi Kokusai Electric Inc 画像符号化装置
WO2010052833A1 (ja) * 2008-11-07 2010-05-14 三菱電機株式会社 画像符号化装置及び画像復号装置
US9838721B2 (en) 2009-02-23 2017-12-05 Korea Advanced Institute Of Science And Technology Video encoding method for encoding division block, video decoding method for decoding division block, and recording medium for implementing the same
US9838719B2 (en) 2009-02-23 2017-12-05 Korea Advanced Institute Of Science And Technology Video encoding method for encoding division block, video decoding method for decoding division block, and recording medium for implementing the same
US12581133B2 (en) 2009-02-23 2026-03-17 Korea Advanced Institute Of Science And Technology Video encoding method for encoding division block, video decoding method for decoding division block, and recording medium for implementing the same
US12096043B2 (en) 2009-02-23 2024-09-17 Korea Advanced Institute Of Science And Technology Video encoding method for encoding division block, video decoding method for decoding division block, and recording medium for implementing the same
US11659210B2 (en) 2009-02-23 2023-05-23 Korea Advanced Institute Of Science And Technology Video encoding method for encoding division block, video decoding method for decoding division block, and recording medium for implementing the same
US11076175B2 (en) 2009-02-23 2021-07-27 Korea Advanced Institute Of Science And Technology Video encoding method for encoding division block, video decoding method for decoding division block, and recording medium for implementing the same
US10462494B2 (en) 2009-02-23 2019-10-29 Korea Advanced Institute Of Science And Technology Video encoding method for encoding division block, video decoding method for decoding division block, and recording medium for implementing the same
JP2015136150A (ja) * 2009-02-23 2015-07-27 コリア アドバンスド インスティテュート オブ サイエンス アンド テクノロジー ビデオ符号化での分割ブロック符号化方法、ビデオ復号化での分割ブロック復号化方法及びこれを実現する記録媒体
US9888259B2 (en) 2009-02-23 2018-02-06 Korea Advanced Institute Of Science And Technology Video encoding method for encoding division block, video decoding method for decoding division block, and recording medium for implementing the same
US9838722B2 (en) 2009-02-23 2017-12-05 Korea Advanced Institute Of Science And Technology Video encoding method for encoding division block, video decoding method for decoding division block, and recording medium for implementing the same
US9838720B2 (en) 2009-02-23 2017-12-05 Korea Advanced Institute Of Science And Technology Video encoding method for encoding division block, video decoding method for decoding division block, and recording medium for implementing the same
JP2010288080A (ja) * 2009-06-11 2010-12-24 Sony Corp 画像処理装置及び画像処理方法
US9264714B2 (en) 2009-06-11 2016-02-16 Sony Corporation Image processing apparatus and image processing method
US8472741B2 (en) 2009-06-11 2013-06-25 Sony Corporation Image processing apparatus and image processing method
US9369720B2 (en) 2009-12-28 2016-06-14 Panasonic Intellectual Property Management Co., Ltd. Image coding apparatus and image coding method
WO2011080925A1 (ja) * 2009-12-28 2011-07-07 パナソニック株式会社 画像符号化装置および方法
JP2011151546A (ja) * 2010-01-20 2011-08-04 Mega Chips Corp 画像符号化装置及び画像変換装置
JP2011239365A (ja) * 2010-04-12 2011-11-24 Canon Inc 動画像符号化装置及びその制御方法、コンピュータプログラム
US9055292B2 (en) 2010-04-12 2015-06-09 Canon Kabushiki Kaisha Moving image encoding apparatus, method of controlling the same, and computer readable storage medium
US10123021B2 (en) 2013-06-13 2018-11-06 Canon Kabushiki Kaisha Image encoding apparatus for determining quantization parameter, image encoding method, and program
JP2015002368A (ja) * 2013-06-13 2015-01-05 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム
CN105284110B (zh) * 2013-07-31 2019-04-23 太阳专利托管公司 图像编码方法及图像编码装置
CN105284110A (zh) * 2013-07-31 2016-01-27 松下电器(美国)知识产权公司 图像编码方法及图像编码装置
JP2018093386A (ja) * 2016-12-05 2018-06-14 キヤノン株式会社 符号化装置及び符号化方法
WO2019069601A1 (ja) * 2017-10-03 2019-04-11 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法およびプログラム
JPWO2019069602A1 (ja) * 2017-10-03 2020-09-10 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法、プログラムおよび映像システム
JPWO2019069601A1 (ja) * 2017-10-03 2020-09-10 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法およびプログラム
WO2019069602A1 (ja) * 2017-10-03 2019-04-11 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法、プログラムおよび映像システム

Similar Documents

Publication Publication Date Title
JP7129958B2 (ja) 動画像符号化データ
JP4542447B2 (ja) 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法
CN104320665B (zh) 图像处理设备和方法
JP5289440B2 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
US9930355B2 (en) Optimized image decoding device and method for a predictive encoded BIT stream
JP5037938B2 (ja) 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法
JP2007053561A (ja) 画像符号化装置および画像符号化方法
KR20070090700A (ko) 영상의 인트라 예측 부호화, 복호화 방법 및 장치
JP2007201558A (ja) 動画像符号化装置および動画像符号化方法
Yeh et al. Predictive texture synthesis-based intra coding scheme for advanced video coding
JP5322956B2 (ja) 画像符号化装置および画像符号化方法
JP6222756B2 (ja) 復号化方法
JP2012090333A (ja) 画像の復号化装置
JP6647432B2 (ja) 復号化方法
JP6434172B2 (ja) 復号化方法
JP6735370B2 (ja) 復号化方法
JP4561701B2 (ja) 動画像符号化装置
JP6523495B2 (ja) 復号化方法
JP6364462B2 (ja) 復号化装置及び復号化方法
JP5055419B2 (ja) 画像の復号化装置、復号化プログラムおよび復号化方法
JP5380594B2 (ja) 画像の復号化方法
JP6117302B2 (ja) 復号化方法
JP2008141407A (ja) 符号化方式変換装置及び符号化方式変換方法
JP5868909B2 (ja) 復号化方法
JP5236088B2 (ja) 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法