WO2015115644A1

WO2015115644A1 - 画像符号化装置、画像復号装置、符号化ストリーム変換装置、画像符号化方法、及び画像復号方法

Info

Publication number: WO2015115644A1
Application number: PCT/JP2015/052855
Authority: WO
Inventors: 彰峯澤; 関口　俊一; 守屋　芳美; 亮史服部; 一之宮澤
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2014-02-03
Filing date: 2015-02-02
Publication date: 2015-08-06
Anticipated expiration: 2016-08-03
Also published as: CN105981389B; KR101785886B1; JP6147368B2; JPWO2015115644A1; CN105981389A; EP3104614A1; US20160330468A1; EP3104614A4; US10075725B2; KR20160115974A

Abstract

　予測画像生成部が、ランダムアクセス可能なインターピクチャを符号化する場合は、複数のランダムアクセス可能なイントラピクチャの中から参照ピクチャを設定し、その設定した参照ピクチャを予測処理に用いる動き補償予測を実施し、可変長符号化部１３が、その参照ピクチャの位置を示すピクチャ位置情報とランダムアクセス可能なインターピクチャがランダムアクセス可能であることを示す識別情報を符号化し、そのピクチャ位置情報及び識別情報の符号化データをビットストリームに多重化する。

Description

画像符号化装置、画像復号装置、符号化ストリーム変換装置、画像符号化方法、及び画像復号方法

　この発明は、画像を高効率で符号化する画像符号化装置及び画像符号化方法と、高効率で符号化されている画像を復号する画像復号装置及び画像復号方法、及び符号化ストリーム変換装置に関するものである。

　例えば、以下の非特許文献１に記載されている従来の画像符号化装置では、入力されたカラー画像を所定の大きさの最大符号化ブロックに分割し、さらに、最大符号化ブロックをより細かい符号化ブロックに階層分割する。
　また、その符号化ブロックをさらに細かい予測ブロックに分割し、その予測ブロックに対する画面内予測や動き補償予測を実施することで予測誤差を生成する。
　また、その予測誤差を符号化ブロック内で階層的に変換ブロックに分割し、それぞれの変換係数をエントロピー符号化することで高い圧縮率を達成している。

　従来の画像符号化装置では、時間的相関を利用した高効率な符号化を実現するため、例えば図３０（ａ）に示す符号化構造によって、既に符号化済みのピクチャから符号化対象ブロックと相関の高いブロックを探索し、その探索先のブロックを予測値とする動き補償予測を利用した符号化を行っている。一般に、このときの動き補償予測を用いるピクチャをインターピクチャ、動き補償予測の探索（参照）先のピクチャを参照ピクチャ、動き補償を用いずに符号化対象ピクチャ内の符号化済み画素のみから予測するピクチャをイントラピクチャと呼ぶ。特に図３０（ｂ）に示すように表示順で過去と未来の両方のピクチャを参照する動き補償である双方向予測は高精度な予測が実現できることで知られている。ただし、これらの例のように動き補償によってピクチャ間に参照関係を持たせることにより各ピクチャの復号に依存性が生じてしまい、符号化ビットストリーム（符号化ストリーム）の途中に存在するピクチャから復号することができず、映像の途中再生ができなくなってしまう。

　したがって、図３０等の動き補償予測を利用した符号化構造を利用する場合、符号化ビットストリームの途中から復号しても正しく再生できるようにするために、途中復号開始地点を示すランダムアクセスポイントを用意することがある。例えば図３１に、ランダムアクセス可能なピクチャ（非特許文献１記載のＩｎｔｒａＲａｎｄｏｍＡｃｃｅｓｓＰｏｉｎｔ（ＩＲＡＰ）ピクチャ）を設定する場合の例を示す。インターピクチャはイントラピクチャより時間的に前のピクチャの参照は許されるが、ＩＲＡＰピクチャより復号順（符号化順）も表示順も後になるインターピクチャは、そのＩＲＡＰピクチャを跨いでＩＲＡＰピクチャより時間的に前のピクチャを参照することはできない。すなわち、ＩＲＡＰピクチャより復号順も表示順も後になるピクチャは、動き補償予測の参照先が制限される。この場合、符号化ビットストリームの途中から復号を開始する際もＩＲＡＰから復号すれば常にＩＲＡＰピクチャより表示順で後のピクチャは正しく復号することができ、符号化シーケンスの途中再生を実現することができる。

　非特許文献１ではＩＲＡＰピクチャとして、ＩＤＲ（Ｉｎｓｔａｎｔａｎｅｏｕｓ　Ｄｅｃｏｄｉｎｇ　Ｒｅｆｒｅｓｈ）ピクチャ、ＣＲＡ（Ｃｌｅａｎ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ）ピクチャ、ＢＬＡ（Ｂｒｏｋｅｎ　Ｌｉｎｋ　Ａｃｃｅｓｓ）ピクチャが定義されている。ＩＲＡＰピクチャからのランダムアクセス時、ＩＤＲピクチャの場合は復号順が後のピクチャの正常復号を保証し、ＣＲＡピクチャ及びＢＬＡピクチャの場合は復号順も表示順も後になるピクチャの正常復号を保証している。さらに、ＩＲＡＰピクチャからのランダムアクセス時に表示順でＩＲＡＰピクチャ以降のピクチャが再生可能となるように、ＩＲＡＰピクチャより表示順が後のピクチャは必ずＩＲＡＰピクチャより復号順が後となる。すなわち、いずれのＩＲＡＰピクチャにおいても表示順で後となるピクチャについては正常復号が可能であることは共通している。
　また、非特許文献２においても同様のランダムアクセス機能を有している。ただし、非特許文献２ではランダムアクセス用のピクチャとしてＩＤＲピクチャのみが定義されている。

ＩＳＯ／ＩＥＣ　２３００８－２／ＩＴＵ－Ｔ　Ｈ．２６５ＩＳＯ／ＩＥＣ　１４４９６－１０／ＩＴＵ－Ｔ　Ｈ．２６４

　従来の画像符号化装置は以上のように構成されているので、符号化ビットストリームの途中からでも特定のピクチャから復号を開始することで表示順においてそのピクチャ以降のピクチャを正しく復号できるランダムアクセスを実現することができる。しかし、図３２に示すように、ランダムアクセス間隔（ＩＲＡＰピクチャ間隔）が短い場合、動き補償予測に使用可能なインターピクチャの割合が減り、符号化効率が低下する。一方、符号化効率を高めるためにインターピクチャの割合を増やすと、その分ランダムアクセス間隔が長くなる。このように、符号化効率とランダムアクセス間隔の間にはトレードオフの関係があり、ランダムアクセス間隔を短くしたまま予測効率を高めることが難しいという課題があった。

　この発明は上記のような課題を解決するためになされたもので、ランダムアクセス間隔を維持したまま符号化効率を高めることができる画像符号化装置、画像復号装置、符号化ストリーム変換装置、画像符号化方法及び画像復号方法を得ることを目的とする。

　この発明に係る画像符号化装置は、入力画像を符号化処理単位のブロックに分割するブロック分割部と、ブロック分割部により分割されるブロックに対する符号化モードを決定する符号化モード決定部と、符号化モード決定部により決定された符号化モードにしたがって、ブロック分割部により分割されたブロックに対する符号化処理を実施して、そのブロックの圧縮データを出力する画像符号化装置であって、ブロック分割部により分割されたブロックの予測画像を生成する予測画像生成部と、ブロック分割部により分割されたブロックと予測画像生成部により生成された予測画像との差分画像を生成する差分画像生成部と、差分画像生成部により生成された差分画像を圧縮し、その差分画像の圧縮データを出力する画像圧縮部と、画像圧縮部により圧縮された差分画像を伸張し、伸張後の差分画像と予測画像生成部により生成された予測画像を加算して局所復号画像を生成する局所復号画像生成部と、局所復号画像生成部により生成された局所復号画像に対するフィルタリング処理を実施するフィルタリング処理部と、画像圧縮部から出力された圧縮データ及び符号化モード決定部により決定された符号化モードを符号化して、その圧縮データ及び符号化モードの符号化データが多重化されているビットストリームを生成する符号化部とを備え、予測画像生成部が、ランダムアクセス可能なインターピクチャを符号化する場合は、複数のランダムアクセス可能なイントラピクチャの中から参照ピクチャを設定し、その設定した参照ピクチャを予測処理に用いる動き補償予測を実施し、符号化部が、その参照ピクチャの位置を示すピクチャ位置情報とランダムアクセス可能なインターピクチャがランダムアクセス可能であることを示す識別情報を符号化し、そのピクチャ位置情報及び識別情報の符号化データをビットストリームに多重化するようにしたものである。

　また、入力画像を符号化処理単位のブロックに分割するブロック分割部と、ブロック分割部により分割されるブロックに対する符号化モードを決定する符号化モード決定部と、符号化モード決定部により決定された符号化モードにしたがって、ブロック分割部により分割されたブロックに対する符号化処理を実施して、そのブロックの圧縮データを出力する画像符号化装置であって、ブロック分割部により分割されたブロックの予測画像を生成する予測画像生成部と、ブロック分割部により分割されたブロックと予測画像生成部により生成された予測画像との差分画像を生成する差分画像生成部と、差分画像生成部により生成された差分画像を圧縮し、その差分画像の圧縮データを出力する画像圧縮部と、画像圧縮部により圧縮された差分画像を伸張し、伸張後の差分画像と予測画像生成部により生成された予測画像を加算して局所復号画像を生成する局所復号画像生成部と、局所復号画像生成部により生成された局所復号画像に対するフィルタリング処理を実施するフィルタリング処理部と、画像圧縮部から出力された圧縮データ及び符号化モード決定部により決定された符号化モードを符号化して、その圧縮データ及び符号化モードの符号化データが多重化されているビットストリームを生成する符号化部とを備え、予測画像生成部が、ランダムアクセス可能なインターピクチャを符号化する場合は、ランダムアクセス可能なインターピクチャの符号化順に対して、符号化順が先かつ符号化順が最も近いランダムアクセス可能なイントラピクチャを参照ピクチャに設定し、その設定した参照ピクチャを予測処理に用いる動き補償予測を実施し、符号化部が、ランダムアクセス可能なインターピクチャがランダムアクセス可能であることを示す識別情報を符号化し、その識別情報の符号化データをビットストリームに多重化するようにしたものである。

　この発明に係る画像復号装置は、画像をブロック単位に圧縮符号化したビットストリームを入力して復号画像を生成する画像復号装置であって、ビットストリームから各々のブロックに係る圧縮データ及び符号化モードを復号する復号部と、復号部により復号された符号化モードにしたがって復号済み画素を参照し、各々のブロックに対する予測画像を生成する予測画像生成部と、復号部により復号された圧縮データを伸長して差分画像を生成する差分画像生成部と、差分画像生成部により生成された差分画像と予測画像生成部により生成された予測画像とを加算して復号画像を生成する復号画像生成部と、復号画像生成部により生成された復号画像に対するフィルタリング処理を実施するフィルタリング処理部とを備え、復号部が、どのインターピクチャがランダムアクセス可能なインターピクチャであるかを示す識別情報を復号するとともに、ランダムアクセス可能なインターピクチャの予測画像を生成する際に参照する参照ピクチャの位置を示すピクチャ位置情報を復号し、予測画像生成部が、その識別情報によって識別されたランダムアクセス可能なインターピクチャを復号する場合は、複数のランダムアクセス可能なイントラピクチャの中からピクチャ位置情報が示すピクチャを参照ピクチャに設定し、その設定した参照ピクチャを予測処理に用いる動き補償予測を実施するようにしたものである。

　また、画像をブロック単位に圧縮符号化したビットストリームを入力して復号画像を生成する画像復号装置であって、ビットストリームから各々のブロックに係る圧縮データ及び符号化モードを復号する復号部と、復号部により復号された符号化モードにしたがって復号済み画素を参照し、各々のブロックに対する予測画像を生成する予測画像生成部と、復号部により復号された圧縮データを伸長して差分画像を生成する差分画像生成部と、差分画像生成部により生成された差分画像と予測画像生成部により生成された予測画像とを加算して復号画像を生成する復号画像生成部と、復号画像生成部により生成された復号画像に対するフィルタリング処理を実施するフィルタリング処理部とを備え、復号部が、どのインターピクチャがランダムアクセス可能なインターピクチャであるかを示す識別情報を復号し、予測画像生成部が、その識別情報によって識別されたランダムアクセス可能なインターピクチャを復号する場合は、ランダムアクセス可能なインターピクチャの復号順に対して、復号順が先かつ復号順が最も近いランダムアクセス可能なイントラピクチャを参照ピクチャに設定し、その設定した参照ピクチャを予測処理に用いる動き補償予測を実施するようにしたものである。

　この発明に係る符号化ストリーム変換装置は、画像をブロック単位に圧縮符号化したビットストリームを入力して再符号化したビットストリームを出力する符号化ストリーム変換装置であって、ビットストリームを復号して復号画像を生成するとともに、ランダムアクセス可能なイントラピクチャを特定する画像復号部と、その特定したランダムアクセス可能なイントラピクチャの中からランダムアクセス可能なインターピクチャに再符号化する再符号化対象イントラピクチャを設定する再符号化設定部と、その再符号化対象イントラピクチャを再符号化する再符号化部と、そのビットストリームと再符号化部により再符号化された再符号化対象イントラピクチャとを合成して再符号化ビットストリームを出力するビットストリーム合成部とを備え、再符号化部が、ランダムアクセス可能なインターピクチャに再符号化されたピクチャがランダムアクセス可能であることを示す識別情報を符号化し、その識別情報の符号化データを再符号化ビットストリームに多重化するようにしたものである。

　この発明に係る画像符号化方法は、ブロック分割部が、入力画像を符号化処理単位のブロックに分割し、符号化モード決定部が、ブロック分割部により分割されるブロックに対する符号化モードを決定すると、その符号化モードにしたがって、ブロック分割部により分割されたブロックに対する符号化処理を実施して、そのブロックの圧縮データを出力する画像符号化方法であって、予測画像生成部が、ブロック分割部により分割されたブロックの予測画像を生成し、差分画像生成部が、ブロック分割部により分割されたブロックと予測画像生成部により生成された予測画像との差分画像を生成し、画像圧縮部が、差分画像生成部により生成された差分画像を圧縮して、その差分画像の圧縮データを出力し、局所復号画像生成部が、画像圧縮部により圧縮された差分画像を伸張し、伸張後の差分画像と予測画像生成部により生成された予測画像を加算して局所復号画像を生成し、フィルタリング処理部が、局所復号画像生成部により生成された局所復号画像に対するフィルタリング処理を実施し、符号化部が、画像圧縮部から出力された圧縮データ及び符号化モード決定部により決定された符号化モードを符号化して、その圧縮データ及び符号化モードの符号化データが多重化されているビットストリームを生成するものであり、予測画像生成部が、ランダムアクセス可能なインターピクチャを符号化する場合は、ランダムアクセス可能なインターピクチャの符号化順に対して、符号化順が先かつ符号化順が最も近いランダムアクセス可能なイントラピクチャを参照ピクチャに設定し、その設定した参照ピクチャを予測処理に用いる動き補償予測を実施し、符号化部が、ランダムアクセス可能なインターピクチャがランダムアクセス可能であることを示す識別情報を符号化し、その識別情報の符号化データをビットストリームに多重化するようにしたものである。

　この発明に係る画像復号方法は、画像をブロック単位に圧縮符号化したビットストリームを入力して復号画像を生成する画像復号方法であって、復号部が、ビットストリームから各々のブロックに係る圧縮データ及び符号化モードを復号し、予測画像生成部が、復号部により復号された符号化モードにしたがって復号済み画素を参照して、各々のブロックに対する予測画像を生成し、差分画像生成部が、復号部により復号された圧縮データを伸長して差分画像を生成し、復号画像生成部が、差分画像生成部により生成された差分画像と予測画像生成部により生成された予測画像とを加算して復号画像を生成し、フィルタリング処理部が、復号画像生成部により生成された復号画像に対するフィルタリング処理を実施するものであり、復号部が、どのインターピクチャがランダムアクセス可能なインターピクチャであるかを示す識別情報を復号し、予測画像生成部が、その識別情報によって識別されたランダムアクセス可能なインターピクチャを復号する場合は、ランダムアクセス可能なインターピクチャの復号順に対して、復号順が先かつ復号順が最も近いランダムアクセス可能なイントラピクチャを参照ピクチャに設定し、その設定した参照ピクチャを予測処理に用いる動き補償予測を実施するようにしたものである。

　この発明に係る画像符号化装置によれば、予測画像生成部が、ランダムアクセス可能なインターピクチャを符号化する場合は、複数のランダムアクセス可能なイントラピクチャの中から参照ピクチャを設定し、その設定した参照ピクチャを予測処理に用いる動き補償予測を実施し、符号化部が、その参照ピクチャの位置を示すピクチャ位置情報とランダムアクセス可能なインターピクチャがランダムアクセス可能であることを示す識別情報を符号化し、そのピクチャ位置情報及び識別情報の符号化データをビットストリームに多重化するように構成したので、インターピクチャにおいてもランダムアクセスが可能となり、ランダムアクセス間隔を維持したまま符号化効率を高めることができる効果がある。

　また、この発明に係る他の画像符号化装置および画像符号化方法によれば、予測画像生成部が、ランダムアクセス可能なインターピクチャを符号化する場合は、ランダムアクセス可能なインターピクチャの符号化順に対して、符号化順が先かつ符号化順が最も近いランダムアクセス可能なイントラピクチャを参照ピクチャに設定し、その設定した参照ピクチャを予測処理に用いる動き補償予測を実施し、符号化部が、ランダムアクセス可能なインターピクチャがランダムアクセス可能であることを示す識別情報を符号化し、その識別情報の符号化データをビットストリームに多重化するように構成したので、ランダムアクセス可能なインターピクチャが参照するイントラピクチャを識別する情報が不要となり、符号化する情報の符号量を削減することができる効果がある。

　また、この発明に係る画像復号装置および画像復号方法によれば、復号部が、どのインターピクチャがランダムアクセス可能なインターピクチャであるかを示す識別情報を復号するとともに、ランダムアクセス可能なインターピクチャの予測画像を生成する際に参照する参照ピクチャの位置を示すピクチャ位置情報を復号し、予測画像生成部が、その識別情報によって識別されたランダムアクセス可能なインターピクチャを復号する場合は、複数のランダムアクセス可能なイントラピクチャの中からピクチャ位置情報が示すピクチャを参照ピクチャに設定し、その設定した参照ピクチャを予測処理に用いる動き補償予測を実施するように構成したので、ランダムアクセスが可能なインターピクチャを含む符号化ビットストリームを正しく復号することができる効果がある。

　また、この発明に係る符号化ストリーム変換装置によれば、再符号化部が、ランダムアクセス可能なインターピクチャに再符号化されたピクチャがランダムアクセス可能であることを示す識別情報を符号化し、その識別情報の符号化データを再符号化ビットストリームに多重化するように構成したので、画像符号化装置等によって生成された符号化ビットストリームより符号量が少ない符号化ビットストリームを生成することができる効果がある。

この発明の実施の形態１による画像符号化装置を示す構成図である。この発明の実施の形態１による画像符号化装置の処理内容（画像符号化方法）を示すフローチャートである。この発明の実施の形態１による画像復号装置を示す構成図である。この発明の実施の形態１による画像復号装置の処理内容（画像復号方法）を示すフローチャートである。最大符号化ブロックが階層的に複数の符号化ブロックに分割される例を示す説明図である。（ａ）は分割後の符号化ブロック及び予測ブロックの分布を示し、（ｂ）は階層分割によって符号化モードｍ（Ｂ_ｎ）が割り当てられる状況を示す説明図である。符号化ブロックＢ^ｎ内の各予測ブロックＰ_ｉ ^ｎが選択可能なイントラ予測モードの一例を示す説明図である。ｌ_ｉ ^ｎ＝ｍ_ｉ ^ｎ＝４の場合の予測画像生成ブロック内の画素の予測値を生成する際に用いる画素の一例を示す説明図である。予測画像生成ブロック内の左上画素を原点とする相対座標を示す説明図である。量子化マトリクスの一例を示す説明図である。この発明の実施の形態１による画像符号化装置のループフィルタ部で複数のループフィルタ処理を用いる場合の構成例を示す説明図である。この発明の実施の形態１による画像復号装置のループフィルタ部で複数のループフィルタ処理を用いる場合の構成例を示す説明図である。符号化ビットストリームの一例を示す説明図である。画素適応オフセット処理のクラス分類手法のインデックスを示す説明図である。１６×１６画素のサイズの直交変換における変換係数の符号化順を示す説明図である。１６×１６画素のサイズの直交変換における変換係数の分布の一例を示す説明図である。平均値予測時のフィルタ処理におけるフィルタの切り替え領域を示す説明図である。平均値予測時のフィルタ処理の参照画素配置を示す説明図である。ＹＵＶ４：２：０フォーマットの信号における輝度信号及び色差信号の圧縮処理を実施する際の変換ブロックサイズを示す説明図である。ＹＵＶ４：２：２フォーマットの信号における輝度信号及び色差信号の圧縮処理を実施する際の変換ブロックサイズを示す説明図である。ＹＵＶ４：４：４フォーマットの信号における輝度信号及び色差信号の圧縮処理を実施する際の変換ブロックサイズを示す説明図である。色差信号のイントラ予測パラメータと色差イントラ予測モードの対応例を示す説明図である。ＬＭモードを用いない場合の色差信号のイントラ予測パラメータと色差イントラ予測モードの対応例を示す説明図である。ＹＵＶ４：４：４フォーマットとＹＵＶ４：２：２フォーマットの関係を示す説明図である。ＹＵＶ４：４：４フォーマットの信号において輝度信号と色差信号で同一の方向性予測を用いることと等価となるＹＵＶ４：２：２フォーマットでの方向性予測の例を示す説明図である。ＹＵＶ４：２：２フォーマットの信号での方向性予測の予測方向ベクトルを示す説明図である。方向性予測と角度の関係を示す説明図である。ＹＵＶ４：２：２フォーマットの信号において輝度信号のイントラ予測モードインデックスと色差信号のイントラ予測モードインデックスの関係を示す説明図である。イントラ予測モードインデックスとｔａｎθの関係を示す説明図である。動き補償予測を利用した符号化の一例を示す説明図である。ＩＲＡＰピクチャを用いたランダムアクセス可能な符号化の一例を示す説明図である。ランダムアクセス間隔と符号化効率のトレードオフ関係を示す説明図である。非特許文献１及び２によるランダムアクセス実現例と実施の形態１によるランダムアクセス実現例を示す説明図である。長期参照ピクチャでないＩＲＡＰピクチャを併用した実施の形態１によるランダムアクセス実現例を示す説明図である。ランダムアクセス可能なインターピクチャによるランダムアクセスの実現例を示す説明図である。ランダムアクセス時使用参照ピクチャの位置をランダムアクセス可能なインターピクチャを識別する情報からの移動バイト数で示す場合の説明図である。ランダムアクセス時使用参照ピクチャの位置を符号化ビットストリームの先頭からの移動バイト数で示す場合の説明図である。ＩＲＡＰピクチャを先頭にランダムアクセス可能なインターピクチャを順々に参照するランダムアクセスの実現例を示す説明図である。この発明の実施の形態５による符号化ストリーム変換装置を示す構成図である。

実施の形態１．
　図１はこの発明の実施の形態１における画像符号化装置を示す構成図である。なお、この発明の特徴は、図１の構成中、主に動き補償予測部５、動き補償予測フレームメモリ１２、及び可変長符号化部１３を用いて、インターピクチャにおいてもランダムアクセスを可能とする点にある。ここで、ブロック分割部１及びスライス分割部１４は、請求項に記載のブロック分割部を構成し、符号化制御部２は符号化モード決定部を構成し、切換スイッチ３、イントラ予測部４、動き補償予測部５及び予測画像生成部を構成している。
　また、減算部６は差分画像生成部を構成し、変換・量子化部７は画像圧縮部を構成し、逆量子化・逆変換部８及び加算部９は局所復号画像生成部を構成している。
　さらに、ループフィルタ部１１はフィルタリング処理部を構成し、可変長符号化部１３は符号化部を構成している。
　この実施の形態１の画像符号化装置が処理対象とする映像信号は、輝度信号と２つの色差信号からなるＹＵＶ信号や、ディジタル撮像素子から出力されるＲＧＢ信号等の任意の色空間のカラー映像信号のほか、モノクロ画像信号や赤外線画像信号など、映像フレームが水平・垂直２次元のディジタルサンプル（画素）列から構成される任意の映像信号である。
　各画素の階調は８ビットでもよいし、１０ビット、１２ビットなどの階調であってもよい。
　また、入力信号は映像信号ではなく静止画像信号でもよいことは、静止画像信号を１フレームのみで構成される映像信号と解釈できることから当然である。

　以下の説明においては、便宜上、特に断らない限り、入力される映像信号が、２つの色差成分Ｕ，Ｖが輝度成分Ｙに対して、縦横ともに２分の１にサブサンプルされたＹＵＶ４：２：０フォーマット、２つの色差成分Ｕ，Ｖが輝度成分Ｙに対して、横方向に２分の１にサブサンプルされたＹＵＶ４：２：２フォーマット、あるいは、　２つの色差成分Ｕ，Ｖが輝度成分Ｙと同じサンプル数であるＹＵＶ４：４：４フォーマットの信号であるものとする。また、赤色（Ｒ）、緑色（Ｇ）、青色（Ｂ）の三原色の信号からなるＲＧＢ４：４：４フォーマットの信号については、それぞれの信号をＹＵＶ４：４：４フォーマットの信号とみなしてＹＵＶ４：４：４フォーマットと同一の符号化を行う。ただし、ＲＧＢ４：４：４フォーマットの各信号（ＲＧＢ）のＹＵＶ４：４：４フォーマットの各信号（ＹＵＶ）への対応付けについては限定しない（任意に設定できる）。また、ＹＵＶ４：４：４フォーマット信号やＲＧＢ４：４：４フォーマット信号の場合、各信号をモノクローム画像信号とみなしてそれぞれ独立にモノクローム（ＹＵＶ４：０：０）符号化してビットストリームを生成するようにしてもよい。このようにすることで各信号並列に符号化処理することができる。
　なお、映像の各フレームに対応する処理データ単位を「ピクチャ」と称し、この実施の形態１では、「ピクチャ」は順次走査（プログレッシブスキャン）された映像フレームの信号として説明を行う。ただし、映像信号がインタレース信号である場合、「ピクチャ」は映像フレームを構成する単位であるフィールド画像信号であってもよい。

　図１において、スライス分割部１４は入力画像として映像信号を入力すると、その入力画像を符号化制御部２により決定されたスライス分割情報にしたがって１以上の“スライス”という部分画像に分割する処理を実施する。スライスの分割単位は、後述する符号化ブロック単位まで細かくすることができる。

　ブロック分割部１はスライス分割部１４により分割されたスライスを入力する毎に、そのスライスを符号化制御部２により決定された最大サイズの符号化ブロックである最大符号化ブロックに分割するとともに、符号化制御部２により決定された上限の階層数に至るまで、その最大符号化ブロックを階層的に各符号化ブロックへ分割する処理を実施する。
　即ち、ブロック分割部１はスライスを符号化制御部２により決定された分割に応じて各符号化ブロックに分割して、その符号化ブロックを出力する処理を実施する。また、各符号化ブロックは予測処理単位となる１つないし複数の予測ブロックに分割される。

　符号化制御部２は符号化処理が実施される際の処理単位となる符号化ブロックの最大サイズを決定するとともに、最大サイズの符号化ブロックが階層的に分割される際の上限の階層数を決定することで、各々の符号化ブロックのサイズを決定する処理を実施する。
　また、符号化制御部２は選択可能な１以上の符号化モード（予測処理単位を示す予測ブロックのサイズなどが異なる１以上のイントラ符号化モード、予測ブロックのサイズなどが異なる１以上のインター符号化モード）の中から、ブロック分割部１から出力される符号化ブロックに適用する符号化モードを選択する処理を実施する。選択手法の例としては、選択可能な１以上の符号化モードの中から、ブロック分割部１から出力される符号化ブロックに対する符号化効率が最も高い符号化モードを選択する手法がある。

　また、符号化制御部２は符号化効率が最も高い符号化モードがイントラ符号化モードである場合、そのイントラ符号化モードで符号化ブロックに対するイントラ予測処理を実施する際に用いるイントラ予測パラメータを上記イントラ符号化モードが示す予測処理単位である予測ブロック毎に決定し、符号化効率が最も高い符号化モードがインター符号化モードである場合、そのインター符号化モードで符号化ブロックに対するインター予測処理を実施する際に用いるインター予測パラメータを上記インター符号化モードが示す予測処理単位である予測ブロック毎に決定する処理を実施する。
　さらに、符号化制御部２は変換・量子化部７及び逆量子化・逆変換部８に与える予測差分符号化パラメータを決定する処理を実施する。予測差分符号化パラメータには、符号化ブロックにおける直交変換処理単位となる変換ブロックの分割情報を示す変換ブロック分割情報や、変換係数の量子化を行う際の量子化ステップサイズを規定する量子化パラメータなどが含まれる。

　ここで、図１９はＹＵＶ４：２：０フォーマットの信号における輝度信号及び色差信号の圧縮処理（変換処理、量子化処理）を実施する際の変換ブロックサイズを示す説明図である。
　変換ブロックサイズは、図１９に示すように、符号化ブロックを四分木状に階層分割することによって決定される。
　例えば、変換ブロックを分割する場合と変換ブロックを分割しない場合での符号量や、符号化誤差を加味した評価尺度などに基づいて、評価値が最小になるように変換ブロックを分割するか否かを決定することで、符号量と符号化誤差のトレードオフの観点から最適な変換ブロックの分割形状を決定することができる。

　輝度信号については、例えば、図１９に示すように、符号化ブロックが１つまたは複数の正方形の変換ブロックに階層的に分割されるように構成する。

　色差信号については、図１９に示すように、入力信号フォーマットがＹＵＶ４：２：０信号である場合、輝度信号と同様に、符号化ブロックが１つまたは複数の正方形の変換ブロックに階層的に分割されるように構成する。
　この場合、色差信号の変換ブロックサイズは、対応する輝度信号の変換ブロックの縦横ともに半分のサイズとなる。

　図２０に示すように、入力信号フォーマットがＹＵＶ４：２：２信号である場合、輝度信号と同様の四分木状の階層分割を行う。また、分割したブロックの形状が、垂直方向の画素数が水平方向の画素数の２倍になる長方形となるため、さらに、分割したブロックを上下に二分することで、ＹＵＶ４：２：０信号での色差信号と同じブロックサイズ（輝度信号の変換ブロックの縦横ともに半分のサイズ）の変換ブロック２つで構成するようにする。

　また、図２１に示すように、入力信号フォーマットがＹＵＶ４：４：４信号である場合、色差信号の変換ブロックは、常に輝度信号の変換ブロックと同様の分割を行い、同じサイズの変換ブロックとなるように構成する。
　輝度信号の変換ブロックの分割情報は、例えば、階層毎に分割するか否かを示す変換ブロック分割フラグとして可変長符号化部１３に出力する。

　切換スイッチ３は符号化制御部２により決定された符号化モードがイントラ符号化モードであれば、ブロック分割部１から出力された符号化ブロックをイントラ予測部４に出力し、符号化制御部２により決定された符号化モードがインター符号化モードであれば、ブロック分割部１から出力された符号化ブロックを動き補償予測部５に出力する処理を実施する。

　イントラ予測部４は切換スイッチ３から出力された符号化ブロックに対応する符号化モードとして、符号化制御部２によりイントラ符号化モードが選択された場合、イントラ予測用メモリ１０に格納されている局所復号画像を参照しながら、符号化制御部２により決定されたイントラ予測パラメータを用いたイントラ予測処理（フレーム内予測処理）を実施してイントラ予測画像を生成する処理を実施する。なお、イントラ予測部４はイントラ予測手段を構成している。

　即ち、イントラ予測部４は、輝度信号については、輝度信号のイントラ予測パラメータを用いたイントラ予測処理（フレーム内予測処理）を実施して、輝度信号の予測画像を生成する。
　一方、色差信号については、色差信号のイントラ予測パラメータが、輝度信号に対するイントラ予測モードと同じ予測モードを用いる旨を示している場合（イントラ予測パラメータが輝度色差共通イントラ予測モード（ＤＭモード）を示している場合）、輝度信号と同じフレーム内予測を実施して、色差信号の予測画像を生成する。

　また、色差信号のイントラ予測パラメータが、垂直方向予測モード又は水平方向予測モードを示している場合、色差信号に対する方向性予測を実施して、色差信号の予測画像を生成する。
　また、色差信号のイントラ予測パラメータが、輝度相関利用色差信号予測モード（ＬＭモード）を示している場合、予測画像の生成対象ブロックの上及び左に隣接している複数の画素の輝度信号及び色差信号を用いて、輝度信号と色差信号の相関を示す相関パラメータを算出し、その相関パラメータと予測処理対象の色差信号のブロックに対応する輝度信号を用いて、色差信号の予測画像を生成する。

　なお、入力信号フォーマットがＹＵＶ４：４：４信号である場合には、上記ＤＭモード又は上記ＬＭモードの処理を実施し、その他の予測モードは選択しないように構成してもよい。
　ＹＵＶ４：４：４信号では、輝度信号と色差信号のエッジ位置に高い相関関係があるため、輝度信号と異なる予測モードを色差信号に適用することを禁止することにより、その色差信号のイントラ予測モードの情報量を削減して、符号化効率を高めることができる。

　また、入力信号フォーマットがＹＵＶ４：２：２信号である場合、図２４に示すように、輝度信号が正方ブロックであれば、色差信号は輝度信号と比較して水平方向の画素数が１／２となる長方形のブロックとなる。したがって、図２５に示すように、ＹＵＶ４：４：４信号上で輝度信号と色差信号が同一方向の予測を示している場合、ＹＵＶ４：４：４信号をＹＵＶ４：２：２信号に変換することで、垂直方向予測と水平方向予測以外の方向性予測の場合には、色差信号の予測方向が輝度信号の予測方向と異なることとなる。
　具体的には、図２６に示すように、輝度信号の予測方向ベクトルをｖ_Ｌ＝（ｄｘ_Ｌ，ｄｙ_Ｌ）とした場合、色差信号の予測方向ベクトルは、ｖ_Ｃ＝（ｄｘ_Ｌ／２，ｄｙ_Ｌ）となる。即ち、図２７に示すように、予測方向の角度をθとした場合、輝度信号の予測方向の角度をθ_Ｌ、色差信号の予測方向の角度をθ_Ｃとして、ｔａｎθ_Ｃ＝２ｔａｎθ_Ｌの関係となる予測方向で予測する必要がある。

　したがって、輝度信号と色差信号で同一方向の予測を行う上記ＤＭモードを正しく実施できるようにするために、入力信号フォーマットがＹＵＶ４：２：２信号である場合、輝度信号に使用したイントラ予測モードのインデックスを色差信号の予測に用いるイントラ予測モードのインデックスに変換し、変換後のインデックスに対応するイントラ予測モードによる色差信号の予測処理を実施する。具体的には、インデックスの変換テーブルを用意し、その変換テーブルを参照することで、インデックスを変換するように構成してもよいし、予め変換式を用意して、その変換式に従ってインデックスを変換するように構成してもよい。
　このように構成することで、方向性予測処理自体を変更することなく、インデックスの変換のみで、ＹＵＶ４：２：２信号のフォーマットに応じた色差信号の適切な予測を実施することができる。

　動き補償予測部５は切換スイッチ３から出力された符号化ブロックに対応する符号化モードとして、符号化制御部２によりインター符号化モードが選択された場合、符号化ブロックと動き補償予測フレームメモリ１２に格納されている１フレーム以上の局所復号画像を比較して動きベクトルを探索し、その動きベクトルと符号化制御部２により決定された参照するフレーム番号などのインター予測パラメータを用いて、その符号化ブロックに対するインター予測処理（動き補償予測処理）を実施してインター予測画像を生成する処理を実施する。

　減算部６はブロック分割部１より出力された符号化ブロックから、イントラ予測部４により生成されたイントラ予測画像、または、動き補償予測部５により生成されたインター予測画像を減算して、その減算結果である差分画像を示す予測差分信号を変換・量子化部７に出力する処理を実施する。
　変換・量子化部７は符号化制御部２により決定された予測差分符号化パラメータに含まれる変換ブロック分割情報を参照して、減算部６から出力された予測差分信号に対する直交変換処理（例えば、ＤＣＴ（離散コサイン変換）やＤＳＴ（離散サイン変換）、予め特定の学習系列に対して基底設計がなされているＫＬ変換等の直交変換処理）を変換ブロック単位に実施して変換係数を算出するとともに、その予測差分符号化パラメータに含まれる量子化パラメータを参照して、その変換ブロック単位の変換係数を量子化し、量子化後の変換係数である圧縮データを逆量子化・逆変換部８及び可変長符号化部１３に出力する処理を実施する。

　変換・量子化部７は変換係数を量子化する際、上記量子化パラメータから算出される量子化ステップサイズを変換係数毎にスケーリングする量子化マトリクスを用いて、変換係数の量子化処理を実施するようにしてもよい。
　ここで、図１０は４×４ＤＣＴの量子化マトリクスの一例を示す説明図である。
　図中の数字は、各変換係数の量子化ステップサイズのスケーリング値を示している。
　例えば、符号化ビットレートを抑制するために、図１０に示すように、高域の変換係数程、量子化ステップサイズを大きな値にスケーリングすることで、複雑な画像領域等で発生する高域の変換係数を抑制して符号量を抑えつつ、主観品質に大きく影響する低域の係数の情報を落とさずに符号化することができる。
　このように、変換係数毎の量子化ステップサイズを制御したい場合には量子化マトリクスを用いればよい。

　また、量子化マトリクスは、各直交変換サイズで色信号や符号化モード（イントラ符号化かインター符号化か）毎に独立したマトリクスを使用することができ、初期値として予め画像符号化装置及び画像復号装置で予め共通に用意されている量子化マトリクスや既に符号化された量子化マトリクスの中から選択するか、新しい量子化マトリクスを用いるかをそれぞれ選択することができる。
　したがって、変換・量子化部７は、各直交変換サイズに対して色信号や符号化モード毎に、新しい量子化マトリクスを用いるか否かを示すフラグ情報を符号化すべき量子化マトリクスパラメータに設定する。

　さらに、新しい量子化マトリクスを用いる場合には、図１０に示すような量子化マトリクスの各スケーリング値を符号化すべき量子化マトリクスパラメータに設定する。
　一方、新しい量子化マトリクスを用いない場合には、初期値として、画像符号化装置及び画像復号装置で、予め共通に用意されている量子化マトリクス、または、既に符号化された量子化マトリクスの中から、使用するマトリクスを特定するインデックスを符号化すべき量子化マトリクスパラメータに設定する。ただし、参照可能な既に符号化された量子化マトリクスが存在しない場合、画像符号化装置及び画像復号装置で予め共通に用意されている量子化マトリクスのみ選択可能となる。

　逆量子化・逆変換部８は符号化制御部２により決定された予測差分符号化パラメータに含まれる量子化パラメータ及び変換ブロック分割情報を参照して、変換ブロック単位に変換・量子化部７から出力された圧縮データを逆量子化するとともに、逆量子化後の圧縮データである変換係数に対する逆直交変換処理を実施して、減算部６から出力された予測差分信号に相当する局所復号予測差分信号を算出する処理を実施する。なお、変換・量子化部７が量子化マトリクスを用いて、量子化処理を実施している場合には、逆量子化処理時においても、その量子化マトリクスを参照して、対応する逆量子化処理を実施する。
　加算部９は逆量子化・逆変換部８により算出された局所復号予測差分信号と、イントラ予測部４により生成されたイントラ予測画像、または、動き補償予測部５により生成されたインター予測画像とを加算して、ブロック分割部１から出力された符号化ブロックに相当する局所復号画像を算出する処理を実施する。

　イントラ予測用メモリ１０は加算部９により算出された局所復号画像を格納する記録媒体である。
　ループフィルタ部１１は加算部９により算出された局所復号画像に対して、所定のフィルタ処理を実施して、フィルタ処理後の局所復号画像を出力する処理を実施する。
　具体的には、変換ブロックの境界や予測ブロックの境界に発生する歪みを低減するフィルタ（デブロッキングフィルタ）処理、画素単位に適応的にオフセットを加算する（画素適応オフセット）処理、ウィーナフィルタ等の線形フィルタを適応的に切り替えてフィルタ処理する適応フィルタ処理などを行う。

　ただし、ループフィルタ部１１は、上記のデブロッキングフィルタ処理、画素適応オフセット処理及び適応フィルタ処理のそれぞれについて、処理を行うか否かを決定し、各処理の有効フラグをヘッダ情報として可変長符号化部１３に出力する。なお、上記のフィルタ処理を複数使用する際は、各フィルタ処理を順番に実施する。図１１は複数のフィルタ処理を用いる場合のループフィルタ部１１の構成例を示している。
　一般に使用するフィルタ処理の種類が多いほど、画像品質は向上するが、一方で処理負荷は高くなる。即ち、画像品質と処理負荷はトレードオフの関係にある。また、各フィルタ処理の画像品質改善効果はフィルタ処理対象画像の特性によって異なる。したがって、画像符号化装置が許容する処理負荷や符号化処理対象画像の特性にしたがって使用するフィルタ処理を決めればよい。例えば、図１１の構成よりも処理不可を削減したい場合、デブロッキングフィルタ処理と画素適応オフセット処理のみで構成するといったことが考えられる。

　ここで、デブロッキングフィルタ処理では、ブロック境界にかけるフィルタ強度の選択に用いる各種パラメータを初期値から変更することができる。変更する場合には、そのパラメータをヘッダ情報として可変長符号化部１３に出力する。
　画素適応オフセット処理では、最初に、画像を複数のブロックに分割し、そのブロック単位に、オフセット処理を行わない場合もクラス分類手法の一つとして定義して、予め用意されている複数のクラス分類手法の中から、１つのクラス分類手法を選択する。
　次に、選択したクラス分類手法によって、ブロック内の各画素をクラス分類し、クラス毎に符号化歪みを補償するオフセット値を算出する。
　最後に、局所復号画像の輝度値に対して、そのオフセット値を加算する処理を行うことで局所復号画像の画像品質を改善する。
　したがって、画素適応オフセット処理では、ブロック分割情報、各ブロックのクラス分類手法を示すインデックス、ブロック単位の各クラスのオフセット値を特定するオフセット情報をヘッダ情報として可変長符号化部１３に出力する。
　なお、画素適応オフセット処理において、例えば、最大符号化ブロックといった固定サイズのブロック単位に常に分割して、そのブロック毎にクラス分類手法を選択して、クラス毎の適応オフセット処理を行ってもよい。この場合、上記ブロック分割情報が不要となり、ブロック分割情報に要する符号量分だけ符号量が削減され、符号化効率を高めることができる。

　適応フィルタ処理では、局所復号画像を所定の手法でクラス分類し、各クラスに属する領域（局所復号画像）毎に、重畳されている歪みを補償するフィルタを設計し、そのフィルタを用いて、当該局所復号画像のフィルタ処理を実施する。
　そして、クラス毎に設計したフィルタをヘッダ情報として可変長符号化部１３に出力する。
　クラス分類手法としては、画像を空間的に等間隔に区切る簡易な手法や、ブロック単位に画像の局所的な特性（分散など）に応じて分類する手法がある。
　また、適応フィルタ処理で使用するクラス数は、予め画像符号化装置及び画像復号装置に共通の値として設定してもよいし、符号化すべきパラメータとしてもよい。
　前者と比較して後者の方が、使用するクラス数を自由に設定することができるため、画像品質改善効果が上がるが、一方でクラス数を符号化するために、その分の符号量が増加する。

　なお、画素適応オフセット処理及び適応フィルタ処理を行う場合には、図１１に示すように、映像信号をループフィルタ部１１で参照する必要があるため、映像信号がループフィルタ部１１に入力されるように、図１の画像符号化装置を変更する必要がある。

　動き補償予測フレームメモリ１２はループフィルタ部１１のフィルタ処理後の局所復号画像を格納する記録媒体である。
　可変長符号化部１３は変換・量子化部７から出力された圧縮データと、符号化制御部２の出力信号（最大符号化ブロック内のブロック分割情報、符号化モード、予測差分符号化パラメータ、イントラ予測パラメータ又はインター予測パラメータ）と、動き補償予測部５から出力された動きベクトル（符号化モードがインター符号化モードである場合）とを可変長符号化して符号化データを生成する。
　また、可変長符号化部１３は、図１３に例示するように、符号化ビットストリームのヘッダ情報として、シーケンスレベルヘッダ、ピクチャレベルヘッダを符号化し、ピクチャデータと共に符号化ビットストリームを生成する。

　ただし、ピクチャデータは１以上のスライスデータから構成され、各スライスデータはスライスレベルヘッダと当該スライス内にある上記符号化データをまとめたものである。
　シーケンスレベルヘッダは、画像サイズ、色信号フォーマット、輝度信号や色差信号の信号値のビット深度、シーケンス単位でのループフィルタ部１１における各フィルタ処理（適応フィルタ処理、画素適応オフセット処理、デブロッキングフィルタ処理）の有効フラグ情報、量子化マトリクスの有効フラグ情報など、一般的にシーケンス単位に共通となるヘッダ情報をまとめたものである。
　ピクチャレベルヘッダは、参照するシーケンスレベルヘッダのインデックスや動き補償時の参照ピクチャ数、エントロピー符号化の確率テーブル初期化フラグ、量子化マトリクスパラメータなど、ピクチャ単位で設定するヘッダ情報をまとめたものである。

　スライスレベルヘッダは、当該スライスがピクチャのどの位置にあるかを示す位置情報、どのピクチャレベルヘッダを参照するかを示すインデックス、スライスの符号化タイプ（イントラ符号化、インター符号化など）、ループフィルタ部１１における各フィルタ処理（適応フィルタ処理、画素適応オフセット処理、デブロッキングフィルタ処理）を行うか否かを示すフラグ情報などのスライス単位のパラメータをまとめたものである。

　ここで、非特許文献１及び非特許文献２では、各ヘッダ情報とピクチャデータはＮＡＬユニットによって識別される。具体的には、シーケンスパラメータセット（上記シーケンスレベルヘッダに相当）、ピクチャパラメータヘッダ（上記ピクチャレベルヘッダに相当）、スライスデータはそれぞれ固有のＮＡＬユニットタイプとして定義され、ＮＡＬユニットタイプの識別情報（インデックス）と共に符号化される。また、上記ピクチャデータはアクセスユニットとして定義され、一つのピクチャの符号化データを含むデータアクセスの単位を示している。
　非特許文献１では、ランダムアクセスするピクチャについて、対応するアクセスユニット内のスライスデータのＮＡＬユニットタイプをＩＲＡＰピクチャとして符号化する。このＩＲＡＰピクチャは当該ピクチャから復号を開始しても正常に復号できるよう、イントラ予測のみで符号化されるイントラピクチャとして符号化される。なお、上述の通り、ＩＲＡＰピクチャとしては、ＩＤＲピクチャ、ＣＲＡピクチャ、ＢＬＡピクチャが定義されている。
　非特許文献２も同様であるが、ランダムアクセス可能なピクチャとしてＩＤＲピクチャのみ定義されている点が異なる。以下、非特許文献１のＩＲＡＰピクチャを前提に説明するが、非特許文献２においてもＩＲＡＰピクチャをＩＤＲピクチャに置き換えることで同様の処理が実現できる。

　図３２に示すように、ランダムアクセス間隔を短くするためには多くのピクチャをＩＲＡＰピクチャとして符号化する必要があり、動き補償予測によって高効率な符号化が可能なインターピクチャが少なくなり符号化効率が低くなる（図３２（ａ））。反対にインターピクチャを多くするとランダムアクセス間隔は長くなってしまう（図３２（ｂ））。このようなトレードオフ問題の解消のため、本実施の形態では、ランダムアクセス可能なインターピクチャを定義する。

　図３３に、図３２で説明した非特許文献１及び２による従来のランダムアクセス実現例（図３３（ａ））と本実施の形態によるランダムアクセス実現例（図３３（ｂ））を示す。図３３（ａ）ではイントラピクチャであるＩＲＡＰピクチャが１ピクチャ置きに挿入されている。一方、図３３（ｂ）では図３３（ａ）よりインターピクチャの数が多くなっている。なお、図３３（ｂ）では、白色で示す「インターピクチャ」（ランダムアクセス不可能なインターピクチャ）はそれぞれ表示順が前（表示時刻が過去）となるランダムアクセス可能なインターピクチャより表示順が前のピクチャを参照していない。このように、ランダムアクセス不可能なインターピクチャが、それぞれ表示順が前となるランダムアクセス可能なインターピクチャを跨いで更に前のピクチャを参照しないことで、ランダムアクセス可能なインターピクチャによるランダムアクセスを実現している。これは、非特許文献１のＣＲＡピクチャをランダムアクセス可能なインターピクチャに置き換えることに相当する。

　図３３（ｂ）の通り、本実施の形態では、ランダムアクセス可能なインターピクチャは長期参照（ｌｏｎｇ－ｔｅｒｍ　ｒｅｆｅｒｅｎｃｅ）ピクチャのみを参照するインターピクチャとする。ここで、長期参照ピクチャとは非特許文献１及び２に定義されている通常の参照ピクチャ（非特許文献１及び２に定義されている短期参照（ｓｈｏｒｔ－ｔｅｒｍ　ｒｅｆｅｒｅｎｃｅ）ピクチャ）のバッファ管理とは別に長期保存用に用意されている参照ピクチャバッファに格納されている参照ピクチャを示している。すなわち、長期参照ピクチャは、動き補償予測フレームメモリ１２中の長期保存用バッファに保存される。以下、ランダムアクセス可能なインターピクチャが参照するピクチャを「ランダムアクセス時使用参照ピクチャ」と呼ぶ。ランダムアクセス時使用参照ピクチャは図３３（ｂ）に示すようにランダムアクセス可能なインターピクチャ以外のピクチャ（例えば図３３（ｂ）のインターピクチャ）も参照可能なピクチャである。この実施の形態においては、ランダムアクセス時使用参照ピクチャは、当該ピクチャ単独で正常復号可能なイントラピクチャに限定する。また、ランダムアクセス時使用参照ピクチャは、一定のピクチャ間隔で設定しても良いし、シーン毎に相応しいピクチャを選択しても良い。さらに、背景画像をランダムアクセス時使用参照ピクチャとして設定しても良い。また、どのイントラピクチャをランダムアクセス時使用参照ピクチャとして設定するかは、符号化装置において予め決められたルールに従って決定する方法、符号化の過程で決定する方法、符号化装置外で決定する方法等、用途に応じて様々な方法が考えられる。

　また、ランダムアクセス可能なインターピクチャの設定についても、用途に応じて様々な設定方法が考えられる。例えば、上記ランダムアクセス時使用参照ピクチャとの間の相関を示す評価値の大きさに基づき予め設定する。つまり、上記ランダムアクセス時使用参照ピクチャとの間の相関の大きいインターピクチャをランダムアクセス可能なインターピクチャとする。その他の例としては、一定ピクチャ間隔で設定する方法もある。
　ランダムアクセス可能なピクチャとして設定されたインターピクチャは、動き補償予測部５において、１以上の長期参照ピクチャを参照して動き補償予測を行うことによって予測画像を生成する。

　復号側で、ビットストリームの途中に存在するランダムアクセス可能なインターピクチャから正しく復号できるように、ランダムアクセス可能なインターピクチャに関する情報をビットストリームに多重化する必要がある。したがって、実施の形態１は、可変長符号化部１３においてランダムアクセス可能なインターピクチャに関する情報を符号化する。
　即ち、可変長符号化部１３は、ランダムアクセス可能なインターピクチャのアクセスユニット内に、Ｓｕｐｐｌｅｍｅｎｔａｌ　Ｅｎｈａｎｃｅｍｅｎｔ　Ｉｎｆｏｒｍａｔｉｏｎ（ＳＥＩ）として、ランダムアクセス可能なインターピクチャであることを示す補足情報（識別情報）を符号化し、その補足情報の符号化データをビットストリームに多重化する。このＳＥＩには、当該アクセスユニットのインターピクチャが参照する、単独復号可能な長期参照ピクチャ（ランダムアクセス時使用参照ピクチャ）のピクチャ番号を示すピクチャ位置情報が含まれる。したがって、復号側ではランダムアクセスする際、ＩＲＡＰピクチャの他に、上記ＳＥＩを持つアクセスユニットのインターピクチャについてもランダムアクセスが可能となる。この場合、上記ＳＥＩが示す長期参照ピクチャを復号後にその長期参照ピクチャのみを参照する当該インターピクチャを復号する。
　即ち、後述する図３の画像復号装置において、復号部を構成する可変長復号部３１が、ビットストリームに多重化されている符号化データからＳＥＩを復号すると、画像復号装置は、そのＳＥＩに含まれているピクチャ位置情報が示すピクチャ番号の長期参照ピクチャであるイントラピクチャの復号画像をはじめに復号して、そのイントラピクチャの復号画像を動き補償予測フレームメモリ３９に格納したのち、動き補償部３５が、動き補償予測フレームメモリ３９に格納されているイントラピクチャの復号画像を参照して、そのＳＥＩが示すランダムアクセス可能なインターピクチャの動き補償予測を実施することで、そのＳＥＩが示すランダムアクセス可能なインターピクチャからの途中復号（ランダムアクセス）が実現できる。

　図３３（ｂ）において、ランダムアクセス時使用参照ピクチャである長期参照ピクチャはＩＲＡＰピクチャであるが、ＩＲＡＰピクチャでないイントラピクチャを長期参照ピクチャとしてもよい。さらに、全てのＩＲＡＰピクチャを長期参照ピクチャとする必要はなく、図３４の例のように長期参照ピクチャでないＩＲＡＰピクチャを併用してもよい。また、ランダムアクセス可能なインターピクチャが参照する長期参照ピクチャ数は予め画像符号化装置及び復号装置で共通の値として決定しておく。補足情報として符号化する長期参照ピクチャのピクチャ番号の個数はこの予め決定された長期参照ピクチャ数だけ存在する。あるいは、上記長期参照ピクチャ数も補足情報として符号化するようにしても良い。このようにすることで、参照する長期参照ピクチャ数を状況に応じて適応的に変更でき、ランダムアクセス可能なインターピクチャの符号化効率を改善することができる。
　このように、ピクチャ内のみを予測に利用するイントラピクチャだけでなく、動き補償用できるインターピクチャをランダムアクセスポイントとして利用できることで、非特許文献１及び２と比較して高効率な符号化が実現できる。

　図１の例では、画像符号化装置の構成要素であるブロック分割部１、符号化制御部２、切換スイッチ３、イントラ予測部４、動き補償予測部５、減算部６、変換・量子化部７、逆量子化・逆変換部８、加算部９、イントラ予測用メモリ１０、ループフィルタ部１１、動き補償予測フレームメモリ１２、可変長符号化部１３及びスライス分割部１４のそれぞれが専用のハードウェア（例えば、ＣＰＵを実装している半導体集積回路や、ワンチップマイコンなど）で構成されているものを想定しているが、画像符号化装置がコンピュータで構成される場合、ブロック分割部１、符号化制御部２、切換スイッチ３、イントラ予測部４、動き補償予測部５、減算部６、変換・量子化部７、逆量子化・逆変換部８、加算部９、ループフィルタ部１１、可変長符号化部１３及びスライス分割部１４の処理内容を記述しているプログラムをコンピュータのメモリに格納し、当該コンピュータのＣＰＵが当該メモリに格納されているプログラムを実行するようにしてもよい。
　図２はこの発明の実施の形態１による画像符号化装置の処理内容（画像符号化方法）を示すフローチャートである。

　図３はこの発明の実施の形態１による画像復号装置を示す構成図である。画像復号装置においても、インターピクチャからランダムアクセス可能な点が特徴である。
　ここで、可変長復号部３１は復号部を構成し、逆量子化・逆変換部３２は差分画像生成部を構成し、切換スイッチ３３、イントラ予測部３４及び動き補償部３５は予測画像生成部を構成している。
　また、加算部３６は復号画像生成部を構成し、ループフィルタ部３８はフィルタリング処理部を構成している。
　図３において、可変長復号部３１は図１の画像符号化装置により生成された符号化ビットストリームを入力すると、そのビットストリームからシーケンスレベルヘッダ、ピクチャレベルヘッダ、スライスレベルヘッダなどの各ヘッダ情報を復号するとともに、その符号化ビットストリームから、階層的に分割されている各々の符号化ブロックの分割状況を示すブロック分割情報を可変長復号する。このとき、ＹＵＶ４：４：４フォーマット信号やＲＧＢ４：４：４フォーマット信号の各信号をモノクローム画像信号とみなしてそれぞれ独立にモノクローム（ＹＵＶ４：０：０）符号化していることを示す情報がヘッダ情報に含まれる場合、各色信号の符号化ビットストリームに対してそれぞれ独立に復号処理することができる。

　ここで、符号化ビットストリームの途中から復号するランダムアクセスを行う場合、ＩＲＡＰピクチャ又はランダムアクセス可能なインターピクチャであることを示すＳＥＩを持つアクセスユニットのピクチャから復号を開始することで、表示順で当該ピクチャ以降のピクチャを正しく復号することができる。具体的には、ランダムアクセス可能なインターピクチャであることを示すＳＥＩを復号し、まず、このＳＥＩに含まれる長期参照ピクチャのピクチャ番号、すなわち当該アクセスユニットのピクチャが参照する長期参照ピクチャのピクチャ番号を参照して、その指し示すピクチャ番号のピクチャを復号する。その後、動き補償部３５（動き補償予測部）において、復号されて動き補償予測フレームメモリ３９（動き補償予測メモリ）に保存された長期参照ピクチャを参照して、上記ＳＥＩが含まれていたアクセスユニットのインターピクチャの動き補償予測を実施し、このインターピクチャを復号する。そして、このインターピクチャより表示順が後となるピクチャを復号する。このようにすることで上記ＳＥＩが含まれていたアクセスユニットのピクチャ以降のピクチャを正しく復号することができる。
　また、ランダムアクセス可能なインターピクチャが参照する長期参照ピクチャ数は予め画像符号化装置及び復号装置で共通の値として決定しておき、その定めた上記長期参照ピクチャ数だけの長期参照ピクチャのピクチャ番号を復号する。あるいは、上記長期参照ピクチャ数も補足情報として符号化するように画像符号化装置を構成する場合、画像復号装置は参照する長期参照ピクチャ数を復号し、その復号した長期参照ピクチャ数だけの長期参照ピクチャのピクチャ番号を復号する復号装置を構成する。このように符号化された長期参照ピクチャ数を復号するように構成することで、適応的に参照ピクチャ数を変更してランダムアクセス可能なインターピクチャの符号化効率を改善した画像符号化装置で生成したストリームを正しく復号することができる。

　以下、画像復号装置のその他の構成について説明する。以下の構成は、符号化ビットストリームの途中から復号するランダムアクセス時も、符号化ビットストリームの初めから復号する場合も同様である。
　上記ヘッダ情報に含まれる量子化マトリクスの有効フラグ情報が“有効”を示す場合、可変長復号部３１は量子化マトリクスパラメータを可変長復号し、量子化マトリクスを特定する。具体的には、各直交変換サイズの色信号や符号化モード毎に、量子化マトリクスパラメータが初期値として、画像符号化装置及び画像復号装置で予め共通に用意されている量子化マトリクス、または、既に復号された量子化マトリクスである（新しい量子化マトリクスでない）ことを示す場合は、上記マトリクスの内のどの量子化マトリクスであるかを特定するインデックス情報を参照して量子化マトリクスを特定し、量子化マトリクスパラメータが新しい量子化マトリクスを用いることを示す場合は、量子化マトリクスパラメータに含まれる量子化マトリクスを使用する量子化マトリクスとして特定する。

　また、可変長復号部３１は、各ヘッダ情報を参照して、スライス分割状態を特定するとともに、各スライスのスライスデータに含まれる最大符号化ブロックを特定し、ブロック分割情報を参照して、最大符号化ブロックを階層的に分割して復号処理を行う単位である符号化ブロックを特定し、各々の符号化ブロックに係る圧縮データ、符号化モード、イントラ予測パラメータ（符号化モードがイントラ符号化モードである場合）、インター予測パラメータ（符号化モードがインター符号化モードである場合）、動きベクトル（符号化モードがインター符号化モードである場合）及び予測差分符号化パラメータを可変長復号する処理を実施する。

　逆量子化・逆変換部３２は可変長復号部３１により可変長復号された予測差分符号化パラメータに含まれる量子化パラメータ及び変換ブロック分割情報を参照して、可変長復号部３１により可変長復号された圧縮データを変換ブロック単位に逆量子化するとともに、逆量子化後の圧縮データである変換係数に対する逆直交変換処理を実施して、図１の逆量子化・逆変換部８から出力された局所復号予測差分信号と同一の復号予測差分信号を算出する処理を実施する。

　ここで、上記変換ブロック分割情報から、符号化ブロックにおける変換ブロックの分割状態を特定する。例えば、ＹＵＶ４：２：０フォーマットの信号の場合、変換ブロックサイズは、図１９に示すように、符号化ブロックを四分木状に階層分割することによって決定される。

　色差信号については、図１９に示すように、入力信号フォーマットがＹＵＶ４：２：０信号である場合、輝度信号と同様に、符号化ブロックが１つまたは複数の正方形の変換ブロックに階層的に分割されるように構成する。この場合、色差信号の変換ブロックサイズは、対応する輝度信号の変換ブロックの縦横ともに半分のサイズとなる。

　図２１に示すように、入力信号フォーマットがＹＵＶ４：４：４信号である場合、色差信号の変換ブロックは、常に輝度信号の変換ブロックと同様の分割を行い、同じサイズの変換ブロックとなるように構成する。

　また、可変長復号部３１により可変長復号された各ヘッダ情報が、当該スライスで量子化マトリクスを用いて、逆量子化処理を実施することを示している場合、量子化マトリクスを用いて逆量子化処理を行う。
　具体的には、各ヘッダ情報から特定される量子化マトリクスを用いて逆量子化処理を行う。

　切換スイッチ３３は可変長復号部３１により可変長復号された符号化モードがイントラ符号化モードであれば、可変長復号部３１により可変長復号されたイントラ予測パラメータをイントラ予測部３４に出力し、可変長復号部３１により可変長復号された符号化モードがインター符号化モードであれば、可変長復号部３１により可変長復号されたインター予測パラメータ及び動きベクトルを動き補償部３５に出力する処理を実施する。

　イントラ予測部３４は可変長復号部３１により可変長復号されたブロック分割情報から特定される符号化ブロックに係る符号化モードがイントラ符号化モードである場合、イントラ予測用メモリ３７に格納されている復号画像を参照しながら、切換スイッチ３３から出力されたイントラ予測パラメータを用いたイントラ予測処理（フレーム内予測処理）を実施してイントラ予測画像を生成する処理を実施する。なお、イントラ予測部３４はイントラ予測手段を構成している。

　即ち、イントラ予測部３４は、輝度信号については、輝度信号に対する上記イントラ予測パラメータを用いたイントラ予測処理（フレーム内予測処理）を実施して、輝度信号の予測画像を生成する。
　一方、色差信号については、色差信号のイントラ予測パラメータが、輝度信号に対するイントラ予測モードと同じ予測モードを用いる旨を示している場合（イントラ予測パラメータが輝度色差共通イントラ予測モード（ＤＭモード）を示している場合）、輝度信号と同じフレーム内予測を実施して、色差信号の予測画像を生成する。

　なお、入力信号フォーマットがＹＵＶ４：４：４信号である場合には、上記ＤＭモード又は上記ＬＭモードの処理を実施し、その他の予測モードは選択しないように画像符号化装置が構成されている場合、その画像符号化装置から生成される符号化ビットストリームが復号できるように画像復号装置も同様の構成とする。
　ＹＵＶ４：４：４信号では、輝度信号と色差信号のエッジ位置に高い相関関係があるため、輝度信号と異なる予測モードを色差信号に適用することを禁止することにより、その色差信号のイントラ予測モードの情報量を削減して、符号化効率を高めることができる。

　また、入力信号フォーマットがＹＵＶ４：２：２信号である場合、図２４に示すように、輝度信号が正方ブロックであれば、色差信号は輝度信号と比較して水平方向の画素数が１／２となる長方形のブロックとなる。したがって、図２５に示すように、ＹＵＶ４：４：４信号をＹＵＶ４：２：２信号に変換した際に、輝度信号と色差信号で同一方向の予測となるようにするためには、ＹＵＶ４：２：２信号上では、垂直方向予測と水平方向予測以外の方向性予測の場合には、色差信号の予測方向が輝度信号の予測方向と異なることとなる。
　具体的には、図２６に示すように、輝度信号の予測方向ベクトルをｖ_Ｌ＝（ｄｘ_Ｌ，ｄｙ_Ｌ）とした場合、色差信号の予測方向ベクトルは、ｖ_Ｃ＝（ｄｘ_Ｌ／２，ｄｙ_Ｌ）となる。即ち、図２７に示すように、予測方向の角度をθとした場合、輝度信号の予測方向の角度をθ_Ｌ、色差信号の予測方向の角度をθ_Ｃとして、ｔａｎθ_Ｃ＝２ｔａｎθ_Ｌの関係となる予測方向で予測する必要がある。

　動き補償部３５は可変長復号部３１により可変長復号されたブロック分割情報から特定される符号化ブロックに係る符号化モードがインター符号化モードである場合、動き補償予測フレームメモリ３９に格納されている復号画像を参照しながら、切換スイッチ３３から出力された動きベクトルとインター予測パラメータを用いたインター予測処理（動き補償予測処理）を実施してインター予測画像を生成する処理を実施する。

　加算部３６は逆量子化・逆変換部３２により算出された復号予測差分信号と、イントラ予測部３４により生成されたイントラ予測画像、または、動き補償部３５により生成されたインター予測画像とを加算して、図１の加算部９から出力された局所復号画像と同一の復号画像を算出する処理を実施する。

　イントラ予測用メモリ３７は加算部３６により算出された復号画像をイントラ予測処理で用いる参照画像として格納する記録媒体である。
　ループフィルタ部３８は加算部３６により算出された復号画像に対して、所定のフィルタ処理を実施して、フィルタ処理後の復号画像を出力する処理を実施する。
　具体的には、変換ブロックの境界や予測ブロックの境界に発生する歪みを低減するフィルタ（デブロッキングフィルタ）処理、画素単位に適応的にオフセットを加算する（画素適応オフセット）処理、ウィーナフィルタ等の線形フィルタを適応的に切り替えてフィルタ処理する適応フィルタ処理などを行う。
　ただし、ループフィルタ部３８は、上記のデブロッキングフィルタ処理、画素適応オフセット処理、適応フィルタ処理のそれぞれについて、可変長復号部３１により可変長復号された各ヘッダ情報を参照して、当該スライスで行うか否かを特定する。
　このとき、２つ以上のフィルタ処理を行う場合において、例えば、画像符号化装置のループフィルタ部１１が図１１のように構成されていれば、図１２に示すようにループフィルタ部３８が構成される。当然、画像符号化装置のループフィルタ部１１がデブロッキングフィルタ処理と画素適応オフセット処理から構成されていれば、ループフィルタ部３８もデブロッキングフィルタ処理と画素適応オフセット処理で構成される。

　ここで、デブロッキングフィルタ処理では、可変長復号部３１により可変長復号されたヘッダ情報を参照し、ブロック境界にかけるフィルタ強度の選択に用いる各種パラメータを初期値から変更する情報が存在する場合、その変更情報に基づいて、デブロッキングフィルタ処理を実施する。変更情報がない場合は、予め定められた手法に従って行う。

　画素適応オフセット処理では、可変長復号部３１により可変長復号された画素適応オフセット処理のブロック分割情報に基づいて復号画像を分割し、そのブロック単位に、可変長復号部３１により可変長復号されたブロック単位のクラス分類手法を示すインデックスを参照して、そのインデックスが“オフセット処理を行わない”ことを示すインデックスでない場合、ブロック単位にブロック内の各画素を上記インデックスが示すクラス分類手法に従ってクラス分類する。
　なお、クラス分類手法の候補として、ループフィルタ部１１の画素適応オフセット処理のクラス分類手法の候補と同一のものが予め用意されている。
　そして、ブロック単位の各クラスのオフセット値を特定するオフセット情報を参照して、復号画像の輝度値にオフセットを加算する処理を行う。

　ただし、画像符号化装置のループフィルタ部１１の画素適応オフセット処理において、ブロック分割情報は符号化せずに、常に画像を固定サイズのブロック単位（例えば、最大符号化ブロック単位）に分割し、そのブロック毎にクラス分類手法を選択して、クラス毎の適応オフセット処理を行うように構成されている場合、ループフィルタ部３８においても、ループフィルタ部１１と同一の固定サイズのブロック単位に画素適応オフセット処理を実施する。

　適応フィルタ処理では、可変長復号部３１により可変長復号されたクラス毎のフィルタを用いて、図１の画像符号化装置と同一の手法でクラス分類した後に、そのクラス分類情報に基づいてフィルタ処理を行う。
　動き補償予測フレームメモリ３９はループフィルタ部３８のフィルタ処理後の復号画像をインター予測処理（動き補償予測処理）で用いる参照画像として格納する記録媒体である。

　図３の例では、画像復号装置の構成要素である可変長復号部３１、逆量子化・逆変換部３２、切換スイッチ３３、イントラ予測部３４、動き補償部３５、加算部３６、イントラ予測用メモリ３７、ループフィルタ部３８及び動き補償予測フレームメモリ３９のそれぞれが専用のハードウェア（例えば、ＣＰＵを実装している半導体集積回路や、ワンチップマイコンなど）で構成されているものを想定しているが、画像復号装置がコンピュータで構成される場合、可変長復号部３１、逆量子化・逆変換部３２、切換スイッチ３３、イントラ予測部３４、動き補償部３５、加算部３６及びループフィルタ部３８の処理内容を記述しているプログラムをコンピュータのメモリに格納し、当該コンピュータのＣＰＵが当該メモリに格納されているプログラムを実行するようにしてもよい。
　図４はこの発明の実施の形態１による画像復号装置の処理内容（画像復号方法）を示すフローチャートである。

　次に動作について説明する。
　この実施の形態１では、映像の各フレーム画像を入力画像として、符号化済みの近傍画素からのイントラ予測又は近接フレーム間での動き補償予測を実施して、得られた予測差分信号に対して直交変換・量子化による圧縮処理を施し、その後、可変長符号化を行って符号化ビットストリームを生成する画像符号化装置と、その画像符号化装置から出力される符号化ビットストリームを復号する画像復号装置について説明する。

　図１の画像符号化装置は、映像信号の空間・時間方向の局所的な変化に適応して、映像信号を多様なサイズのブロックに分割して、フレーム内・フレーム間適応符号化を行うことを特徴としている。
　一般的に、映像信号は、空間・時間的に信号の複雑さが局所的に変化する特性を有している。空間的に見ると、ある映像フレーム上では、例えば、空や壁などのような比較的広い画像領域中で均一な信号特性を有する絵柄もあれば、人物や細かいテクスチャを含む絵画など、小さい画像領域内で複雑なテクスチャパターンを有する絵柄も混在することがある。
　時間的に見ても、空や壁は局所的に時間方向の絵柄の変化は小さいが、動く人物や物体は、その輪郭が時間的に剛体・非剛体の運動をするため、時間的な変化が大きい。

　符号化処理は、時間・空間的な予測によって、信号電力やエントロピーの小さい予測差分信号を生成して、全体の符号量を削減する処理を行うが、予測に用いるパラメータをできるだけ大きな画像信号領域に均一に適用できれば、当該パラメータの符号量を小さくすることができる。
　一方、時間的・空間的に変化の大きい画像信号パターンに対して、同一の予測パラメータを大きな画像領域に適用すると、予測の誤りが増えてしまうため、予測差分信号の符号量が増加してしまう。
　したがって、時間的・空間的に変化が大きい領域では、同一の予測パラメータを適用して予測処理を行うブロックサイズを小さくして、予測に用いるパラメータのデータ量を増やし、予測差分信号の電力・エントロピーを低減する方が望ましい。

　この実施の形態１では、このような映像信号の一般的な性質に適応した符号化を行うため、最初に所定の最大ブロックサイズから予測処理等を開始し、階層的に映像信号の領域を分割し、分割した領域毎に予測処理や、その予測差分の符号化処理を適応化させる構成をとるようにしている。

　最初に、図１の画像符号化装置の処理内容を説明する。
　まず、符号化制御部２は、符号化対象となるピクチャ（カレントピクチャ）のスライス分割状態を決めると共に、ピクチャの符号化に用いる最大符号化ブロックのサイズと、最大符号化ブロックを階層分割する階層数の上限を決定する（図２のステップＳＴ１）。
　最大符号化ブロックのサイズの決め方としては、例えば、入力画像の映像信号の解像度に応じて、全てのピクチャに対して同一のサイズを定めてもよいし、入力画像の映像信号の局所的な動きの複雑さの違いをパラメータとして定量化して、動きの激しいピクチャには、小さいサイズを定める一方、動きが少ないピクチャには、大きいサイズを定めるようにしてもよい。

　分割階層数の上限の決め方としては、例えば、入力画像の映像信号の解像度に応じて、全てのピクチャに対して同一の階層数を定める方法や、入力画像の映像信号の動きが激しい場合には、階層数を深くして、より細かい動きが検出できるように設定し、動きが少ない場合には、階層数を抑えるように設定する方法などがある。
　なお、上記最大符号化ブロックのサイズと、最大符号化ブロックを階層分割する階層数の上限は、シーケンスレベルヘッダなどに符号化してもよいし、符号化せずに画像復号装置側も同一の決定処理を行うようにしてもよい。

　前者はヘッダ情報の符号量が増加するが、画像復号装置側で上記決定処理を行わずに済むため、画像復号装置の処理負荷を抑えることができる上、画像符号化装置側で最適な値を探索して送ることができる。
　後者は反対に、画像復号装置側で上記決定処理を行うため、画像復号装置の処理負荷が増加するが、ヘッダ情報の符号量は増加しない。
　また、上記最大符号化ブロックのサイズと、最大符号化ブロックを階層分割する階層数の上限をシーケンスレベルヘッダなどに符号化する場合、分割階層数の上限の代わりに、符号化ブロックの最小ブロックサイズを符号化するようにしてもよい。即ち、最大符号化ブロックを分割階層数の上限まで分割したときのブロックのサイズが、符号化ブロックの最小ブロックサイズであるため、画像復号装置側において、最大符号化ブロックのサイズと符号化ブロックの最小ブロックサイズから分割階層数の上限を特定することができる。

　また、符号化制御部２は、利用可能な１以上の符号化モードの中から、階層的に分割される各々の符号化ブロックに対応する符号化モードを選択する（ステップＳＴ２）。
　即ち、符号化制御部２は、最大符号化ブロックサイズの画像領域毎に、先に定めた分割階層数の上限に至るまで、階層的に符号化ブロックサイズを有する符号化ブロックに分割して、各々の符号化ブロックに対する符号化モードを決定する。
　符号化モードには、１つないし複数のイントラ符号化モード（総称して「ＩＮＴＲＡ」と称する）と、１つないし複数のインター符号化モード（総称して、「ＩＮＴＥＲ」と称する）とがあり、符号化制御部２は、当該ピクチャで利用可能な全ての符号化モード、または、そのサブセットの中から、各々の符号化ブロックに対応する符号化モードを選択する。

　ただし、後述するブロック分割部１により階層的に分割される各々の符号化ブロックは、さらに予測処理を行う単位である１つないし複数の予測ブロックに分割され、予測ブロックの分割状態も符号化モードの中に情報として含まれる。即ち、符号化モードは、どのような予測ブロック分割を持つイントラまたはインター符号化モードかを識別するインデックスである。
　符号化制御部２による符号化モードの選択方法は、公知の技術であるため詳細な説明を省略するが、例えば、利用可能な任意の符号化モードを用いて、符号化ブロックに対する符号化処理を実施して符号化効率を検証し、利用可能な複数の符号化モードの中で、最も符号化効率がよい符号化モードを選択する方法などがある。

　また、符号化制御部２は、各々の符号化ブロック毎に、差分画像が圧縮される際に用いられる量子化パラメータ及び変換ブロック分割状態を決定するとともに、予測処理が実施される際に用いられる予測パラメータ（イントラ予測パラメータ又はインター予測パラメータ）を決定する。
　ただし、符号化ブロックがさらに予測処理を行う予測ブロック単位に分割される場合は、予測ブロック毎に予測パラメータ（イントラ予測パラメータ又はインター予測パラメータ）を選択する。

　ここで、図１９は４：２：０フォーマットの信号における輝度信号及び色差信号の圧縮処理（変換処理、量子化処理）を実施する際の変換ブロックサイズを示す説明図である。
　変換ブロックサイズは、図１９に示すように、符号化ブロックを四分木状に階層分割することによって決定される。
　例えば、変換ブロックを分割する場合と変換ブロックを分割しない場合での符号量や、符号化誤差を加味した評価尺度などに基づいて、評価値が最小になるように変換ブロックを分割するか否かを決定することで、符号量と符号化誤差のトレードオフの観点から最適な変換ブロックの分割形状を決定することができる。

　図２０に示すように、入力信号フォーマットがＹＵＶ４：２：２信号である場合、輝度信号と同様の四分木状の階層分割を行う。また、分割したブロックの形状が、垂直方向の画素数が水平方向の画素数の２倍になる長方形となるため、さらに、分割したブロックを上下に二分することで、ＹＵＶ４：２：０信号での色差信号と同じブロックサイズ（輝度信号の変換ブロックの縦横ともに半分のサイズ）の変換ブロック２つで構成するようにする。
　また、図２１に示すように、入力信号フォーマットがＹＵＶ４：４：４信号である場合、色差信号の変換ブロックは、常に輝度信号の変換ブロックと同様の分割を行い、同じサイズの変換ブロックとなるように構成する。

　符号化制御部２は、符号化ブロックにおける変換ブロックの分割情報を示す変換ブロック分割情報や、変換係数の量子化を行う際の量子化ステップサイズを規定する量子化パラメータなどを含む予測差分符号化パラメータを変換・量子化部７、逆量子化・逆変換部８及び可変長符号化部１３に出力する。
　また、符号化制御部２は、イントラ予測パラメータを必要に応じてイントラ予測部４に出力する。
　また、符号化制御部２は、インター予測パラメータを必要に応じて動き補償予測部５に出力する。

　スライス分割部１４は、入力画像として映像信号を入力すると、その入力画像を符号化制御部２により決定されたスライス分割情報にしたがって１以上の部分画像であるスライスに分割する。
　ブロック分割部１は、スライス分割部１４から各スライスを入力する毎に、そのスライスを符号化制御部２により決定された最大符号化ブロックサイズに分割し、さらに、分割した最大符号化ブロックを符号化制御部２により決定された符号化ブロックへ階層的に分割して、その符号化ブロックを出力する。

　ここで、図５は最大符号化ブロックが階層的に複数の符号化ブロックに分割される例を示す説明図である。
　図５において、最大符号化ブロックは、「第０階層」と記されている輝度成分が（Ｌ^０，Ｍ^０）のサイズを有する符号化ブロックである。
　最大符号化ブロックを出発点として、４分木構造で別途定める所定の深さまで、階層的に分割を行うことによって符号化ブロックを得るようにしている。
　深さｎにおいては、符号化ブロックはサイズ（Ｌ^ｎ，Ｍ^ｎ）の画像領域である。
　ただし、Ｌ^ｎとＭ^ｎは、同じであってもよいし、異なっていてもよいが、図５では、Ｌ^ｎ＝Ｍ^ｎのケースを示している。

　以降、符号化制御部２により決定される符号化ブロックサイズは、符号化ブロックの輝度成分におけるサイズ（Ｌ^ｎ，Ｍ^ｎ）と定義する。
　４分木分割を行うため、常に、（Ｌ^ｎ＋１，Ｍ^ｎ＋１）＝（Ｌ^ｎ／２，Ｍ^ｎ／２）が成立する。
　なお、ＲＧＢ信号など、全ての色成分が同一サンプル数を有するカラー映像信号（４：４：４フォーマット）では、全ての色成分のサイズが（Ｌ^ｎ，Ｍ^ｎ）になるが、４：２：０フォーマットを扱う場合、対応する色差成分の符号化ブロックサイズは（Ｌ^ｎ／２，Ｍ^ｎ／２）になる。

　以降、第ｎ階層の符号化ブロックをＢ^ｎで表し、符号化ブロックＢ^ｎで選択可能な符号化モードをｍ（Ｂ^ｎ）で表すものとする。
　複数の色成分からなるカラー映像信号の場合、符号化モードｍ（Ｂ^ｎ）は、色成分毎に、それぞれ個別のモードを用いるように構成されてもよいし、全ての色成分に対し共通のモードを用いるように構成されてもよい。以降、特に断らない限り、ＹＵＶ信号、４：２：０フォーマットの符号化ブロックの輝度成分に対する符号化モードを指すものとして説明を行う。

　符号化ブロックＢ^ｎは、図５に示すように、ブロック分割部１によって、予測処理単位を表す１つないし複数の予測ブロックに分割される。
　以降、符号化ブロックＢ^ｎに属する予測ブロックをＰ_ｉ ^ｎ（ｉは、第ｎ階層における予測ブロック番号）と表記する。図５にはＰ_０ ^０とＰ_１ ^０の例を示している。
　符号化ブロックＢ^ｎ内の予測ブロックの分割が、どのようになされているかは、符号化モードｍ（Ｂ^ｎ）の中に情報として含まれる。
　予測ブロックＰ_ｉ ^ｎは、全て符号化モードｍ（Ｂ^ｎ）に従って予測処理が行われるが、予測ブロックＰ_ｉ ^ｎ毎に、個別の予測パラメータ（イントラ予測パラメータ又はインター予測パラメータ）を選択することができる。

　符号化制御部２は、最大符号化ブロックに対して、例えば、図６に示すようなブロック分割状態を生成して、符号化ブロックを特定する。
　図６（ａ）の点線で囲まれた矩形が各符号化ブロックを表し、各符号化ブロック内にある斜線で塗られたブロックが各予測ブロックの分割状態を表している。
　図６（ｂ）は、図６（ａ）の例について、階層分割によって符号化モードｍ（Ｂ^ｎ）が割り当てられる状況を４分木グラフで示したものである。図６（ｂ）の□で囲まれているノードは、符号化モードｍ（Ｂ^ｎ）が割り当てられたノード（符号化ブロック）である。
　この４分木グラフの情報は符号化モードｍ（Ｂ^ｎ）と共に符号化制御部２から可変長符号化部１３に出力されて、ビットストリームに多重化される。

　切換スイッチ３は、符号化制御部２により決定された符号化モードｍ（Ｂ^ｎ）がイントラ符号化モードである場合（ｍ（Ｂ^ｎ）∈ＩＮＴＲＡの場合）、ブロック分割部１から出力された符号化ブロックＢ^ｎをイントラ予測部４に出力する。
　一方、符号化制御部２により決定された符号化モードｍ（Ｂ^ｎ）がインター符号化モードである場合（ｍ（Ｂ^ｎ）∈ＩＮＴＥＲの場合）、ブロック分割部１から出力された符号化ブロックＢ^ｎを動き補償予測部５に出力する。

　イントラ予測部４は、符号化制御部２により決定された符号化モードｍ（Ｂ^ｎ）がイントラ符号化モードであり（ｍ（Ｂ^ｎ）∈ＩＮＴＲＡの場合）、切換スイッチ３から符号化ブロックＢ^ｎを受けると（ステップＳＴ３）、イントラ予測用メモリ１０に格納されている局所復号画像を参照しながら、符号化制御部２により決定されたイントラ予測パラメータを用いて、その符号化ブロックＢ^ｎ内の各予測ブロックＰ_ｉ ^ｎに対するイントラ予測処理を実施して、イントラ予測画像Ｐ_{ＩＮＴＲＡｉ} ^ｎを生成する（ステップＳＴ４）。

　ただし、詳細は後述するが、イントラ予測画像を生成する処理を行う際に、予測対象ブロックに隣接する符号化済みの画素を用いることから、イントラ予測画像を生成する処理は、予測処理に用いる予測対象ブロックに隣接する画素が既に符号化済みとなるように常に変換ブロック単位に行われなくてはならない。
　したがって、符号化モードがイントラ符号化モードである符号化ブロックでは、選択可能な変換ブロックのブロックサイズは、予測ブロックのサイズ以下に制限され、さらに、変換ブロックが予測ブロックより小さい場合（予測ブロック内に複数の変換ブロックが存在する場合）には、変換ブロック単位に、当該予測ブロックで定められたイントラ予測パラメータを用いたイントラ予測処理を実施してイントラ予測画像を生成する処理を実施する。
　なお、画像復号装置がイントラ予測画像Ｐ_{ＩＮＴＲＡｉ} ^ｎと全く同じイントラ予測画像を生成する必要があるため、イントラ予測画像Ｐ_{ＩＮＴＲＡｉ} ^ｎの生成に用いられたイントラ予測パラメータは、符号化制御部２から可変長符号化部１３に出力されて、ビットストリームに多重化される。
　イントラ予測部４の処理内容の詳細は後述する。

　動き補償予測部５は、符号化制御部２により決定された符号化モードｍ（Ｂ^ｎ）がインター符号化モードであり（ｍ（Ｂ^ｎ）∈ＩＮＴＥＲの場合）、切換スイッチ３から符号化ブロックＢ^ｎを受けると（ステップＳＴ３）、その符号化ブロックＢ^ｎ内の各予測ブロックＰ_ｉ ^ｎと動き補償予測フレームメモリ１２に格納されているフィルタ処理後の局所復号画像を比較して動きベクトルを探索し、その動きベクトルと符号化制御部２により決定されたインター予測パラメータを用いて、その符号化ブロックＢ^ｎ内の各予測ブロックＰ_ｉ ^ｎに対するインター予測処理を実施して、インター予測画像Ｐ_{ＩＮＴＥＲｉ} ^ｎを生成する（ステップＳＴ５）。
　なお、画像復号装置がインター予測画像Ｐ_{ＩＮＴＥＲｉ} ^ｎと全く同じインター予測画像を生成する必要があるため、インター予測画像Ｐ_{ＩＮＴＥＲｉ} ^ｎの生成に用いられたインター予測パラメータは、符号化制御部２から可変長符号化部１３に出力されて、ビットストリームに多重化される。
　また、動き補償予測部５により探索された動きベクトルも可変長符号化部１３に出力されて、ビットストリームに多重化される。

　減算部６は、ブロック分割部１から符号化ブロックＢ^ｎを受けると、その符号化ブロックＢ^ｎ内の予測ブロックＰ_ｉ ^ｎから、イントラ予測部４により生成されたイントラ予測画像Ｐ_{ＩＮＴＲＡｉ} ^ｎ、または、動き補償予測部５により生成されたインター予測画像Ｐ_{ＩＮＴＥＲｉ} ^ｎのいずれか一方を減算して、その減算結果である差分画像を示す予測差分信号ｅ_ｉ ^ｎを変換・量子化部７に出力する（ステップＳＴ６）。

　変換・量子化部７は、減算部６から予測差分信号ｅ_ｉ ^ｎを受けると、符号化制御部２により決定された予測差分符号化パラメータに含まれる変換ブロック分割情報を参照して、その予測差分信号ｅ_ｉ ^ｎに対する直交変換処理（例えば、ＤＣＴ（離散コサイン変換）やＤＳＴ（離散サイン変換）、予め特定の学習系列に対して基底設計がなされているＫＬ変換等の直交変換処理）を変換ブロック単位に実施して、変換係数を算出する。
　また、変換・量子化部７は、その予測差分符号化パラメータに含まれる量子化パラメータを参照して、その変換ブロック単位の変換係数を量子化し、量子化後の変換係数である圧縮データを逆量子化・逆変換部８及び可変長符号化部１３に出力する（ステップＳＴ７）。このとき、上記量子化パラメータから算出される量子化ステップサイズを変換係数毎にスケーリングする量子化マトリクスを用いて量子化処理を実施するようにしてもよい。

　量子化マトリクスは、各直交変換サイズで色信号や符号化モード（イントラ符号化かインター符号化か）毎に独立しているマトリクスを使用することができ、初期値として、画像符号化装置及び画像復号装置で、予め共通に用意されている量子化マトリクスや既に符号化された量子化マトリクスの中から選択するか、新しい量子化マトリクスを用いるかをそれぞれ選択することができる。
　したがって、変換・量子化部７は、各直交変換サイズに対して色信号や符号化モード毎に、新しい量子化マトリクスを用いるか否かを示すフラグ情報を符号化すべき量子化マトリクスパラメータに設定する。
　さらに、新しい量子化マトリクスを用いる場合には、図１０に示すような量子化マトリクスの各スケーリング値を符号化すべき量子化マトリクスパラメータに設定する。
　一方、新しい量子化マトリクスを用いない場合には、初期値として、画像符号化装置及び画像復号装置で、予め共通に用意されている量子化マトリクス、または、既に符号化された量子化マトリクスの中から、使用するマトリクスを特定するインデックスを符号化すべき量子化マトリクスパラメータに設定する。ただし、参照可能な既に符号化された量子化マトリクスが存在しない場合、画像符号化装置及び画像復号装置で、予め共通に用意されている量子化マトリクスのみ選択可能となる。
　そして、変換・量子化部７は、設定した量子化マトリクスパラメータを可変長符号化部１３に出力する。

　逆量子化・逆変換部８は、変換・量子化部７から圧縮データを受けると、符号化制御部２により決定された予測差分符号化パラメータに含まれる量子化パラメータ及び変換ブロック分割情報を参照して、変換ブロック単位にその圧縮データを逆量子化する。
　変換・量子化部７が量子化処理に量子化マトリクスを用いている場合には、逆量子化処理時においても、その量子化マトリクスを参照して、対応した逆量子化処理を実施する。
　また、逆量子化・逆変換部８は、変換ブロック単位に逆量子化後の圧縮データである変換係数に対する逆直交変換処理（例えば、逆ＤＣＴ、逆ＤＳＴ、逆ＫＬ変換など）を実施して、減算部６から出力された予測差分信号ｅ_ｉ ^ｎに相当する局所復号予測差分信号を算出して加算部９に出力する（ステップＳＴ８）。

　加算部９は、逆量子化・逆変換部８から局所復号予測差分信号を受けると、その局所復号予測差分信号と、イントラ予測部４により生成されたイントラ予測画像Ｐ_{ＩＮＴＲＡｉ} ^ｎ、または、動き補償予測部５により生成されたインター予測画像Ｐ_{ＩＮＴＥＲｉ} ^ｎのいずれか一方を加算することで、局所復号画像を算出する（ステップＳＴ９）。
　なお、加算部９は、その局所復号画像をループフィルタ部１１に出力するとともに、その局所復号画像をイントラ予測用メモリ１０に格納する。
　この局所復号画像が、以降のイントラ予測処理の際に用いられる符号化済みの画像信号になる。

　ループフィルタ部１１は、加算部９から局所復号画像を受けると、その局所復号画像に対して、所定のフィルタ処理を実施して、フィルタ処理後の局所復号画像を動き補償予測フレームメモリ１２に格納する（ステップＳＴ１０）。
　具体的には、変換ブロックの境界や予測ブロックの境界に発生する歪みを低減するフィルタ（デブロッキングフィルタ）処理、画素単位に適応的にオフセットを加算する（画素適応オフセット）処理、ウィーナフィルタ等の線形フィルタを適応的に切り替えてフィルタ処理する適応フィルタ処理などを行う。

　ただし、ループフィルタ部１１は、上記のデブロッキングフィルタ処理、画素適応オフセット処理、適応フィルタ処理のそれぞれについて、処理を行うか否かを決定し、各処理の有効フラグをシーケンスレベルヘッダの一部及びスライスレベルヘッダの一部として可変長符号化部１３に出力する。なお、上記のフィルタ処理を複数使用する際は、各フィルタ処理を順番に実施する。図１１は複数のフィルタ処理を用いる場合のループフィルタ部１１の構成例を示している。
　一般に使用するフィルタ処理の種類が多いほど、画像品質は向上するが、一方で処理負荷は高くなる。即ち、画像品質と処理負荷はトレードオフの関係にある。また、各フィルタ処理の画像品質改善効果はフィルタ処理対象画像の特性によって異なる。したがって、画像符号化装置が許容する処理負荷や符号化処理対象画像の特性にしたがって使用するフィルタ処理を決めればよい。

　ここで、デブロッキングフィルタ処理では、ブロック境界にかけるフィルタ強度の選択に用いる各種パラメータを初期値から変更することができる。変更する場合には、そのパラメータをヘッダ情報として可変長符号化部１３に出力する。

　画素適応オフセット処理では、最初に、画像を複数のブロックに分割し、そのブロック単位に、オフセット処理を行わない場合もクラス分類手法の一つとして定義して、予め用意している複数のクラス分類手法の中から、１つのクラス分類手法を選択する。
　次に、選択したクラス分類手法によってブロック内の各画素をクラス分類し、クラス毎に符号化歪みを補償するオフセット値を算出する。
　最後に、局所復号画像の輝度値に対して、そのオフセット値を加算する処理を行うことで局所復号画像の画像品質を改善する。

　クラス分類手法としては、局所復号画像の輝度値の大きさで分類する手法（ＢＯ手法と呼ぶ）や、エッジの方向毎に各画素の周囲の状況（エッジ部か否か等）に応じて分類する手法（ＥＯ手法と呼ぶ）がある。
　これらの手法は、予め画像符号化装置及び画像復号装置で共通に用意されており、例えば図１４に示すように、オフセット処理を行わない場合もクラス分類手法の一つとして定義して、これらの手法のうち、どの手法でクラス分類を行うかを示すインデックスを上記ブロック単位に選択する。

　したがって、画素適応オフセット処理は、ブロックの分割情報、ブロック単位のクラス分類手法を示すインデックス、ブロック単位のオフセット情報をヘッダ情報として可変長符号化部１３に出力する。
　なお、画素適応オフセット処理において、例えば最大符号化ブロックといった固定サイズのブロック単位に常に分割して、そのブロック毎にクラス分類手法を選択して、クラス毎の適応オフセット処理を行ってもよい。この場合、上記ブロック分割情報が不要となり、ブロック分割情報に要する符号量分だけ符号量が削減され、符号化効率を高めることができる。

　また、適応フィルタ処理では、局所復号画像を所定の手法でクラス分類し、各クラスに属する領域（局所復号画像）毎に、重畳されている歪みを補償するフィルタを設計し、そのフィルタを用いて、当該局所復号画像のフィルタ処理を実施する。
　そして、クラス毎に設計したフィルタをヘッダ情報として可変長符号化部１３に出力する。
　ここで、クラス分類手法としては、画像を空間的に等間隔に区切る簡易な手法や、ブロック単位に画像の局所的な特性（分散など）に応じて分類する手法がある。また、適応フィルタ処理で使用するクラス数は、予め画像符号化装置及び画像復号装置で共通の値に設定してもよいし、符号化すべきパラメータの一つとしてもよい。
　前者と比較して後者の方が、使用するクラス数を自由に設定することができるため、画像品質改善効果が上がるが、一方でクラス数を符号化するために、その分の符号量が増加する。

　ステップＳＴ３～ＳＴ９の処理は、階層的に分割された全ての符号化ブロックＢ^ｎに対する処理が完了するまで繰り返し実施され、全ての符号化ブロックＢ^ｎに対する処理が完了すると、ステップＳＴ１３の処理に移行する（ステップＳＴ１１，ＳＴ１２）。

　可変長符号化部１３は、変換・量子化部７から出力された圧縮データと、符号化制御部２から出力された最大符号化ブロック内のブロック分割情報（図６（ｂ）を例とする４分木情報）、符号化モードｍ（Ｂ^ｎ）及び予測差分符号化パラメータと、符号化制御部２から出力されたイントラ予測パラメータ（符号化モードがイントラ符号化モードである場合）又はインター予測パラメータ（符号化モードがインター符号化モードである場合）と、動き補償予測部５から出力された動きベクトル（符号化モードがインター符号化モードである場合）とを可変長符号化し、それらの符号化結果を示す符号化データを生成する（ステップＳＴ１３）。

　その際、量子化された直交変換係数である圧縮データの符号化手法として、変換ブロックをさらにＣｏｅｆｆｉｃｉｅｎｔＧｒｏｕｐ（ＣＧ）と呼ばれる４×４画素単位のブロック（符号化サブブロック）に分割して、ＣＧ単位に係数の符号化処理を実施する。
　図１５は１６×１６画素の変換ブロックにおける係数の符号化順（スキャン順）を示している。
　このように、４×４画素単位の１６個のＣＧを右下のＣＧから順に符号化処理し、さらに、各ＣＧはＣＧ内の１６個の係数を右下の係数から順に符号化する。

　具体的には、まず、ＣＧ内の１６個の係数の中に有意（非零）係数が存在するか否かのフラグ情報を符号化し、次に、ＣＧ内に有意（非零）係数が存在する場合のみ、ＣＧ内の各係数が有意（非零）係数であるかを上記順に符号化し、最後に有意（非零）係数に対して、その係数値情報を順に符号化する。これをＣＧ単位に上記順に行う。
　その際、有意（非零）係数がなるべく連続で発生するように偏るスキャン順とした方がエントロピー符号化による符号化効率を高めることができる。
　直交変換後の係数は、左上に位置する直流成分をはじめとして、左上に近い程、低い周波数成分の低い係数を表すことから、図１６に示す例のように、一般的に左上に近いほど有意（非零）係数が多く発生するために、図１５に示すように、右下から順に符号化することで効率的に符号化することができる。
　なお、上記では１６×１６画素の変換ブロックについて説明したが、８×８画素や３２×３２画素の変換ブロック等、１６×１６画素以外のブロックサイズにおいてもＣＧ（符号化サブブロック）単位の符号化処理を実施するものとする。

　また、可変長符号化部１３は、図１３に例示するように、符号化ビットストリームのヘッダ情報として、シーケンスレベルヘッダ、ピクチャレベルヘッダを符号化し、ピクチャデータと共に符号化ビットストリームを生成する。
　ただし、ピクチャデータは１以上のスライスデータから構成され、各スライスデータはスライスレベルヘッダと当該スライス内にある上記符号化データをまとめたものである。

　シーケンスレベルヘッダは、画像サイズ、色信号フォーマット、輝度信号や色差信号の信号値のビット深度、シーケンス単位でのループフィルタ部１１における各フィルタ処理（適応フィルタ処理、画素適応オフセット処理、デブロッキングフィルタ処理）の有効フラグ情報、量子化マトリクスの有効フラグ情報、フィールド符号化か否かを示すフラグなど、一般的にシーケンス単位に共通となるヘッダ情報をまとめたものである。
　ピクチャレベルヘッダは、参照するシーケンスレベルヘッダのインデックスや動き補償時の参照ピクチャ数、エントロピー符号化の確率テーブル初期化フラグ等のピクチャ単位で設定するヘッダ情報をまとめたものである。
　スライスレベルヘッダは、当該スライスがピクチャのどの位置にあるかを示す位置情報、どのピクチャレベルヘッダを参照するかを示すインデックス、スライスの符号化タイプ（イントラ符号化、インター符号化など）、ループフィルタ部１１における各フィルタ処理（適応フィルタ処理、画素適応オフセット処理、デブロッキングフィルタ処理）を行うか否かを示すフラグ情報などといったスライス単位のパラメータをまとめたものである。

　次に、イントラ予測部４の処理内容を詳細に説明する。
　イントラ予測部４は、上述したように、予測ブロックＰ_ｉ ^ｎのイントラ予測パラメータを参照して、その予測ブロックＰ_ｉ ^ｎに対するイントラ予測処理を実施して、イントラ予測画像Ｐ_{ＩＮＴＲＡｉ} ^ｎを生成するが、ここでは、輝度信号における予測ブロックＰ_ｉ ^ｎのイントラ予測画像を生成するイントラ処理について説明する。

　図７は符号化ブロックＢ^ｎ内の各予測ブロックＰ_ｉ ^ｎが選択可能なイントラ予測モードの一例を示す説明図であり、イントラ予測モードのインデックス値と、そのイントラ予測モードが示す予測方向ベクトルを示している。上記イントラ予測モードのインデックス値がイントラ予測パラメータを示している。
　なお、イントラ予測モード数は、処理対象となるブロックのサイズに応じて異なるように構成してもよい。
　大きいサイズのブロックでは、イントラ予測の効率が低下するため、選択できるイントラ予測方向数を少なくし、小さいサイズのブロックでは、選択できるイントラ予測方向数を多くするように構成することで演算量を抑制することができる。

　まず、イントラ予測画像を生成する処理は、処理対象のブロックに隣接する符号化済みの画素を用いることから、上述した通り、変換ブロック単位に行われなくてはならない。
　ここで、イントラ予測画像を生成する変換ブロックを予測画像生成ブロックと呼ぶこととする。したがって、イントラ予測部４は、予測画像生成ブロック単位に下記に述べるイントラ予測画像生成処理を実施して、予測ブロックＰ_ｉ ^ｎのイントラ予測画像を生成する。
　予測画像生成ブロックのサイズをｌ_ｉ ^ｎ×ｍ_ｉ ^ｎ画素とする。
　図８はｌ_ｉ ^ｎ＝ｍ_ｉ ^ｎ＝４の場合の予測画像生成ブロック内の画素の予測値を生成する際に用いる画素の一例を示す説明図である。
　図８では、予測画像生成ブロックの上の符号化済みの画素（２×ｌ_ｉ ^ｎ＋１）個と、左の符号化済みの画素（２×ｍ_ｉ ^ｎ）個を予測に用いる画素としているが、予測に用いる画素は、図８に示す画素より多くても少なくてもよい。
　また、図８では、予測画像生成ブロックの近傍の１行又は１列分の画素を予測に用いているが、２行又は２列、あるいは、それ以上の画素を予測に用いてもよい。

　予測画像生成ブロックが属する予測ブロックＰ_ｉ ^ｎに対するイントラ予測モードのインデックス値が０（平面（Ｐｌａｎａｒ）予測）の場合には、予測画像生成ブロックの上に隣接する符号化済み画素と、予測画像生成ブロックの左に隣接する符号化済み画素を用いて、これら画素と予測画像生成ブロック内の予測対象画素との距離に応じて内挿した値を予測値として予測画像を生成する。

　予測画像生成ブロックが属する予測ブロックＰ_ｉ ^ｎに対するイントラ予測モードのインデックス値が１（平均値（ＤＣ）予測）の場合には、予測画像生成ブロックの上に隣接する符号化済み画素と、予測画像生成ブロックの左に隣接する符号化済み画素の平均値を予測画像生成ブロック内の画素の予測値として予測画像を生成する。
　さらに、予測画像生成ブロックの上端及び左端に位置する図１７の領域Ａ，Ｂ，Ｃに対して、ブロック境界を平滑化するフィルタ処理を行って最終的な予測画像とする。例えば、下記の式（１）にしたがって、図１８のフィルタの参照画素配置で、下記のフィルタ係数を用いてフィルタ処理を実施する。

・領域Ａ（パーティションＰ_ｉ ^ｎの左上の画素）
　　　ａ_０＝１／２，ａ_１＝１／４，ａ_２＝１／４
・領域Ｂ（領域Ａ以外のパーティションＰ_ｉ ^ｎの上端の画素）
　　　ａ_０＝３／４，ａ_２＝１／４，（ａ_１＝０）
・領域Ｃ（領域Ａ以外のパーティションＰ_ｉ ^ｎの左端の画素）
　　　ａ_０＝３／４，ａ_１＝１／４，（ａ_２＝０）

　ただし、式（１）において、ａ_ｎ（ｎ＝０，１，２）は参照画素にかかるフィルタ係数、ｐ_ｎ（ｎ＝０，１，２）はフィルタ処理対象画素ｐ_０を含むフィルタの参照画素、Ｓ’（ｐ_０）はフィルタ処理対象画素ｐ_０におけるフィルタ処理後の予測値、Ｓ（ｐ_ｎ）（ｎ＝０，１，２）はフィルタ処理対象画素ｐ_０を含む参照画素のフィルタ処理前の予測値を表している。

　さらに、上記フィルタ処理を行う予測画像生成ブロックのブロックサイズは限定してもよい。
　一般にブロック端のみフィルタ処理を行って予測値を変化させる場合、大きなブロックサイズのブロックでは、フィルタ処理により予測値が変化する領域の占める割合が小さいために、この予測値の変化によって生じた予測残差信号の変化を非常に高い周波数成分で表されることになり、この高周波数成分を符号化するために符号化効率の悪化を生じさせてしまう傾向がある。また、符号化効率を優先して、この高周波数成分を符号化しないようにすることで、ブロック端の予測残差信号の変化を復元できずに、ブロック境界に歪みが生じてしまう傾向がある。

　一方、小さなブロックサイズのブロックでは、フィルタ処理により予測値が変化する領域の占める割合が大きいために、この予測値の変化によって生じた予測残差信号の変化が大きなブロックサイズのブロックの時のような高い周波数成分で表されることはなく、適切に残差信号を符号化することができ、本フィルタ処理によって、ブロック境界の連続性を高めた分、復号画像の品質を高めることができる。
　したがって、例えば、３２×３２画素以上のブロックサイズの予測画像生成ブロックでは、上記フィルタ処理を適用せずに、３２×３２画素より小さいブロックのみに上記フィルタ処理を適用することで、従来の平均値予測よりも予測性能を向上させながら、演算量の増加を抑えることができる。

　予測画像生成ブロックの属する予測ブロックＰ_ｉ ^ｎに対するイントラ予測モードのインデックス値が２６（垂直方向予測）の場合、下記の式（２）から予測画像生成ブロック内の画素の予測値を算出して予測画像を生成する。

　ただし、座標（ｘ，ｙ）は予測画像生成ブロック内の左上画素を原点とする相対座標（図９を参照）であり、Ｓ’（ｘ，ｙ）は座標（ｘ，ｙ）における予測値、Ｓ（ｘ，ｙ）は座標（ｘ，ｙ）における符号化済み画素の輝度値（復号された輝度値）である。また、算出した予測値が輝度値の取り得る値の範囲を超えている場合、予測値がその範囲内に収まるように値を丸めるようにする。

　なお、式（２）の１行目の式は、ＭＰＥＧ－４　ＡＶＣ／Ｈ．２６４における垂直方向予測の予測値であるＳ（ｘ，－１）に対し、隣接する符号化済み画素の垂直方向の輝度値の変化量Ｓ（－１，ｙ）－Ｓ（－１，－１）を１／２にした値を加算することで、ブロック境界が平滑化されるようにフィルタ処理したものを予測値とすることを意味しており、式（２）の２行目の式は、ＭＰＥＧ－４　ＡＶＣ／Ｈ．２６４における垂直方向予測と同じ予測式を示している。

　予測画像生成ブロックが属する予測ブロックＰ_ｉ ^ｎに対するイントラ予測モードのインデックス値が１０（水平方向予測）の場合、下記の式（３）から予測画像生成ブロック内の画素の予測値を算出して予測画像を生成する。

　なお、式（３）の１行目の式は、ＭＰＥＧ－４　ＡＶＣ／Ｈ．２６４における水平方向予測の予測値であるＳ（－１，ｙ）に対し、隣接する符号化済み画素の水平方向の輝度値の変化量Ｓ（ｘ，－１）－Ｓ（－１，－１）を１／２にした値を加算することで、ブロック境界が平滑化されるようにフィルタ処理したものを予測値とすることを意味しており、式（３）の２行目の式は、ＭＰＥＧ－４　ＡＶＣ／Ｈ．２６４における水平方向予測と同じ予測式を示している。

　ただし、式（２）の垂直方向予測、式（３）の水平方向予測を行う予測画像生成ブロックのブロックサイズを限定してもよい。
　一般にブロック端のみ予測方向の輝度値の変化量に比例する値を加算するフィルタ処理を行うことで予測値を変化させる場合、大きなブロックサイズのブロックでは、上述した予測画像生成ブロックのブロック端のフィルタ処理により予測値が変化する領域の占める割合が小さいために、この予測値の変化によって生じた予測残差信号の変化を非常に高い周波数成分で表されることになり、この高周波数成分を符号化するために符号化効率の悪化を生じさせてしまう傾向がある。また、符号化効率を優先して、この高周波数成分を符号化しないようにすることで、ブロック端の予測残差信号の変化を復元できずにブロック境界に歪みが生じてしまう傾向がある。

　一方、小さなブロックサイズのブロックでは、上記フィルタ処理により予測値が変化する領域の占める割合が大きいために、この予測値の変化によって生じた予測残差信号の変化が大きなブロックサイズのブロックの時のような高い周波数成分で表されることはなく、適切に残差信号を符号化することができ、本フィルタ処理によってブロック境界の連続性を高めた分、復号画像の品質を高めることができる。
　したがって、例えば、３２×３２画素以上のブロックサイズの予測画像生成ブロックでは、予測対象画素の座標によらず、式（２）及び式（３）の２行目の式を常に用いるようにし（予測画像生成ブロックのブロック端のフィルタ処理を行わないことにする）、３２×３２画素より小さいブロックのみに、上記フィルタ処理を行う式（２）及び式（３）を適用することで、従来の垂直方向予測、水平方向予測よりも予測性能を向上させながら、演算量の増加を抑えることができる。

　イントラ予測モードのインデックス値が０（平面予測）、１（平均値予測）、２６（垂直方向予測）、１０（水平方向予測）以外の場合には、インデックス値が示す予測方向ベクトルυ_ｐ＝（ｄｘ，ｄｙ）に基づいて、予測画像生成ブロック内の画素の予測値を生成する。
　図９に示すように、予測画像生成ブロックの左上画素を原点として、予測画像生成ブロック内の相対座標を（ｘ，ｙ）と設定すると、予測に用いる参照画素の位置は、下記のＬと隣接画素の交点になる。

ただし、ｋは負の実数である。

　参照画素が整数画素位置にある場合には、その整数画素を予測対象画素の予測値とし、参照画素が整数画素位置にない場合には、参照画素に隣接する整数画素から生成される補間画素を予測値とする。
　図８の例では、参照画素は整数画素位置にないので、参照画素に隣接する２画素から内挿したものを予測値とする。なお、隣接する２画素のみではなく、隣接する２画素以上の画素から補間画素を生成して予測値としてもよい。
　補間処理に用いる画素を多くすることで補間画素の補間精度を向上させる効果がある一方、補間処理に要する演算の複雑度が増加することから、演算負荷が大きくても高い符号化性能を要求する画像符号化装置の場合には、より多くの画素から補間画素を生成するようにした方がよい。

　以上に述べた処理によって、予測画像生成ブロック単位に予測ブロックＰ_ｉ ^ｎ内の輝度信号の全ての画素に対する予測画素を生成して、イントラ予測画像Ｐ_{ＩＮＴＲＡｉ} ^ｎを出力する。
　なお、イントラ予測画像Ｐ_{ＩＮＴＲＡｉ} ^ｎの生成に用いられたイントラ予測パラメータ（イントラ予測モード）は、ビットストリームに多重化するために可変長符号化部１３に出力される。

　なお、先に説明したＭＰＥＧ－４　ＡＶＣ／Ｈ．２６４における８×８画素のブロックのイントラ予測時に参照画素に対して施される平滑化処理と同様に、イントラ予測部４において、予測画像生成ブロックの予測画像を生成する際の参照画素を、予測画像生成ブロックに隣接する符号化済み画素を平滑化処理した画素とするように構成した場合であっても、上述の例と同様の予測画像に対するフィルタ処理を行うことができる。このようにすることで参照画素へのフィルタ処理による参照画素のノイズが除去され、これを用いて予測を行うことで予測の精度高めることができる。
　あるいは、上記参照画素へのフィルタ処理は予測画像へのフィルタ処理を行う平均値予測、垂直方向予測、水平方向予測以外の予測の際のみ実施するようにしてもよい。このようにすることで、各予測モードに対して最大で１つのフィルタ処理しか行わずに済み、演算量の増加を抑えることができる。

　上記では、輝度信号の予測画像生成処理について説明したが、色差成分に対する予測画像は次のように生成する。
　予測ブロックＰ_ｉ ^ｎの色差信号に対して、色差信号のイントラ予測パラメータ（イントラ予測モード）に基づくイントラ予測処理を実施し、イントラ予測画像の生成に用いられたイントラ予測パラメータを可変長符号化部１３に出力する。

　図２２は色差信号のイントラ予測パラメータ（インデックス値）と色差イントラ予測モードの対応例を示す説明図である。
　色差信号のイントラ予測パラメータが、輝度信号に対するイントラ予測モードと同じ予測モードを用いる旨を示している場合（イントラ予測パラメータが輝度色差共通イントラ予測モード（ＤＭモード）を示している場合）、輝度信号と同じフレーム内予測を実施して、色差信号の予測画像を生成する。

　また、色差信号のイントラ予測パラメータが、垂直方向予測モードまたは水平方向予測モードを示している場合、色差信号に対する方向性予測を実施して、色差信号の予測画像を生成する。
　また、色差信号のイントラ予測パラメータが、輝度相関利用色差信号予測モード（ＬＭモード）を示している場合、予測画像の生成対象ブロックの上及び左に隣接している複数の画素の輝度信号及び色差信号を用いて、輝度信号と色差信号の相関を示す相関パラメータを算出し、その相関パラメータと予測処理対象の色差信号のブロックに対応する輝度信号を用いて、色差信号の予測画像を生成する。

　なお、入力信号フォーマットがＹＵＶ４：４：４信号である場合には、上記ＤＭモード又は上記ＬＭモードの処理を実施し、その他の予測モードは選択しないように構成してもよい。ＹＵＶ４：４：４信号では、輝度信号と色差信号のエッジ位置に高い相関関係があるため、輝度信号と異なる予測モードを色差信号に適用することを禁止することにより、その色差信号のイントラ予測モードの情報量を削減して、符号化効率を高めることができる。
　当然、ＹＵＶ４：４：４信号の場合においても、色差信号に対して、輝度信号とは異なる方向性予測モードを選択できるように構成してもよい。

　したがって、輝度信号と色差信号で同一方向の予測を行う上記ＤＭモードを正しく実施できるようにするために、入力信号フォーマットがＹＵＶ４：２：２信号である場合、輝度信号に使用したイントラ予測モードのインデックスを色差信号の予測に用いるイントラ予測モードのインデックスに変換し、変換後のインデックスに対応するイントラ予測モードによる色差信号の予測処理を実施する。
　図２８は図７のイントラ予測モードにおけるイントラ予測モードインデックスの変換例を示している。
　図２８の変換テーブルは、予測方向の角度がθであるとき（図２７を参照）、イントラ予測モードの方向性予測が図２９に示すｔａｎθとなる角度である場合、ｔａｎθ_Ｃ＝２ｔａｎθ_Ｌの関係に最も近い角度θ_Ｃに変換するテーブルの例である。
　変換処理の実現は、上記のように、インデックスの変換テーブルを用意し、その変換テーブルを参照することでインデックスを変換するように構成してもよいし、変換式を用意し、その変換式に従ってインデックスを変換するように構成してもよい。
　このように構成することで、方向性予測処理自体を変更することなく、インデックスの変換のみでＹＵＶ４：２：２信号のフォーマットに応じた色差信号の適切な予測を実施することができる。

　また、色差信号に対して上記ＬＭモードを行わないように構成してもよい。このときの色差信号のイントラ予測パラメータ（インデックス値）と色差イントラ予測モードの対応例として、図２３が挙げられる。
　このようにＬＭモードも用いないようにすることで、予測対象画素の輝度信号と色差信号の依存性がなくなるため、輝度信号と色差信号の予測処理の並列化が可能となり、高速な演算処理を実現することができる。

　さらに、色差信号では、色差信号の垂直方向予測及び水平方向予測については、ブロック境界のフィルタ処理を行わずに、ＭＰＥＧ－４　ＡＶＣ／Ｈ．２６４と同様の予測手法としてもよい。このようにフィルタ処理を行わないことで、予測処理の低演算化を図ることができる。

　次に、図３の画像復号装置の処理内容を具体的に説明する。
　可変長復号部３１は、図１の画像符号化装置により生成された符号化ビットストリームを入力すると、そのビットストリームに対する可変長復号処理を実施して（図４のステップＳＴ２１）、１フレーム以上のピクチャから構成されるシーケンス単位のヘッダ情報（シーケンスレベルヘッダ）及びピクチャ単位のヘッダ情報（ピクチャレベルヘッダ）、ループフィルタ部３８で使用するフィルタパラメータや量子化マトリクスパラメータを復号する。

　このとき、上記ヘッダ情報に含まれる量子化マトリクスの有効フラグ情報が“有効”を示す場合、可変長復号部３１は量子化マトリクスパラメータを可変長復号し、量子化マトリクスを特定する。
　具体的には、各直交変換サイズの色信号や符号化モード毎に、量子化マトリクスパラメータが初期値として、画像符号化装置及び画像復号装置で、予め共通に用意されている量子化マトリクス、または、既に復号された量子化マトリクスである（新しい量子化マトリクスでない）ことを示す場合は、量子化マトリクスパラメータに含まれる上記マトリクスの内のどの量子化マトリクスであるかを特定するインデックス情報を参照して量子化マトリクスを特定し、量子化マトリクスパラメータが新しい量子化マトリクスを用いることを示す場合は、量子化マトリクスパラメータに含まれる量子化マトリクスを使用する量子化マトリクスとして特定する。
　そして、ピクチャ単位のデータを構成するスライスデータから、スライス分割情報等のスライス単位のヘッダ情報（スライスレベルヘッダ）を復号し、各スライスの符号化データを復号する。

　また、可変長復号部３１は、図１の画像符号化装置の符号化制御部２により決定された最大符号化ブロックサイズ及び分割階層数の上限を画像符号化装置と同様の手順で決定する（ステップＳＴ２２）。
　例えば、最大符号化ブロックサイズや分割階層数の上限が映像信号の解像度に応じて決められた場合には、復号したフレームサイズ情報に基づいて、画像符号化装置と同様の手順で最大符号化ブロックサイズを決定する。
　最大符号化ブロックサイズ及び分割階層数の上限が、画像符号化装置側でシーケンスレベルヘッダなどに多重化されている場合には、上記ヘッダから復号した値を用いるようにする。ただし、分割階層数の上限の代わりに、符号化ブロックの最小ブロックサイズが符号化されている場合、これを復号することで分割階層数の上限を決定する。即ち、最大符号化ブロックを上記最小ブロックサイズまで分割した場合が分割階層数の上限となる。
　可変長復号部３１は、決定された最大符号化ブロック単位に、図６で示されるような最大符号化ブロックの分割状態を復号する。復号された分割状態に基づき、階層的に符号化ブロックを特定する（ステップＳＴ２３）。

　次に、可変長復号部３１は、符号化ブロックに割り当てられている符号化モードを復号する。復号した符号化モードに含まれる情報に基づき、符号化ブロックをさらに１つないし複数の予測処理単位である予測ブロックに分割し、予測ブロック単位に割り当てられている予測パラメータを復号する（ステップＳＴ２４）。

　即ち、可変長復号部３１は、符号化ブロックに割り当てられている符号化モードがイントラ符号化モードである場合、符号化ブロックに含まれており、予測処理単位となる１つ以上の予測ブロック毎にイントラ予測パラメータを復号する。
　一方、符号化ブロックに割り当てられている符号化モードがインター符号化モードである場合、符号化ブロックに含まれており、予測処理単位となる１つ以上の予測ブロック毎にインター予測パラメータ及び動きベクトルを復号する（ステップＳＴ２４）。

　さらに、可変長復号部３１は、予測差分符号化パラメータに含まれる変換ブロック分割情報に基づき、変換ブロック毎に圧縮データ（変換・量子化後の変換係数）を復号する（ステップＳＴ２４）。
　その際、図１の画像符号化装置の可変長符号化部１３での圧縮データの符号化処理と同様に、ＣＧ単位の係数の復号処理を実施する。
　したがって、図１５に示すように、４×４画素単位の１６個のＣＧを右下のＣＧから順に復号処理し、さらに、各ＣＧはＣＧ内の１６個の係数を右下の係数から順に復号していくことになる。
　具体的には、まず、ＣＧ内の１６個の係数の中に有意（非零）係数が存在するか否かのフラグ情報を復号し、次に復号したフラグ情報がＣＧ内に有意（非零）係数が存在することを示す場合のみＣＧ内の各係数が有意（非零）係数であるかを上記順に復号し、最後に有意（非零）係数を示す係数に対して、その係数値情報を順に復号する。これをＣＧ単位に上記順に行う。

　切換スイッチ３３は、可変長復号部３１により可変長復号された符号化モードｍ（Ｂ^ｎ）がイントラ符号化モードであれば（ｍ（Ｂ^ｎ）∈ＩＮＴＲＡの場合）、可変長復号部３１により可変長復号された予測ブロック単位のイントラ予測パラメータをイントラ予測部３４に出力する。
　一方、可変長復号部３１により可変長復号された符号化モードｍ（Ｂ^ｎ）がインター符号化モードであれば（ｍ（Ｂ^ｎ）∈ＩＮＴＥＲの場合）、可変長復号部３１により可変長復号された予測ブロック単位のインター予測パラメータ及び動きベクトルを動き補償部３５に出力する。

　イントラ予測部３４は、可変長復号部３１により可変長復号された符号化モードｍ（Ｂ^ｎ）がイントラ符号化モード（ｍ（Ｂ^ｎ）∈ＩＮＴＲＡ）である場合（ステップＳＴ２５）、切換スイッチ３３から出力された予測ブロック単位のイントラ予測パラメータを受け取って、図１のイントラ予測部４と同様の手順で、イントラ予測用メモリ３７に格納されている復号画像を参照しながら、上記イントラ予測パラメータを用いた符号化ブロックＢ^ｎ内の各予測ブロックＰ_ｉ ^ｎに対するイントラ予測処理を実施して、イントラ予測画像Ｐ_{ＩＮＴＲＡｉ} ^ｎを生成する（ステップＳＴ２６）。

　また、イントラ予測部３４は、輝度信号については、輝度信号に対する上記イントラ予測パラメータを用いたイントラ予測処理（フレーム内予測処理）を実施して、輝度信号の予測画像を生成する。
　一方、色差信号については、色差信号のイントラ予測パラメータに基づくイントラ予測処理を実施して、色差信号の予測画像を生成する。

　また、色差信号に対して、上記ＬＭモードを行わないように画像符号化装置が構成されている場合、その画像符号化装置から生成される符号化ビットストリームが復号できるように画像復号装置も同様の構成とする。
　このときの色差信号のイントラ予測パラメータ（インデックス値）と色差イントラ予測モードの対応例として、図２３が挙げられる。
　このようにＬＭモードも用いないようにすることで、予測対象画素の輝度信号と色差信号の依存性がなくなるため、輝度信号と色差信号の予測処理の並列化が可能になり、高速な演算処理を実現することができる。

　さらに、色差信号では、色差信号の垂直方向予測及び水平方向予測については、ブロック境界のフィルタ処理を行わずに、ＭＰＥＧ－４　ＡＶＣ／Ｈ．２６４と同様の予測手法として画像符号化装置が構成されている場合、その画像符号化装置から生成される符号化ビットストリームが復号できるように画像復号装置も同様の構成とする。
　このようにフィルタ処理を行わないことで、予測処理の低演算化を図ることができる。

　動き補償部３５は、可変長復号部３１により可変長復号された符号化モードｍ（Ｂ^ｎ）がインター符号化モード（ｍ（Ｂ^ｎ）∈ＩＮＴＥＲ）である場合（ステップＳＴ２５）、切換スイッチ３３から出力された予測ブロック単位の動きベクトルとインター予測パラメータを受け取って、動き補償予測フレームメモリ３９に格納されているフィルタ処理後の復号画像を参照しながら、その動きベクトルとインター予測パラメータを用いた符号化ブロックＢ^ｎ内の各予測ブロックＰ_ｉ ^ｎに対するインター予測処理を実施してインター予測画像Ｐ_{ＩＮＴＥＲｉ} ^ｎを生成する（ステップＳＴ２７）。

　逆量子化・逆変換部３２は、可変長復号部３１から圧縮データ及び予測差分符号化パラメータを受けると、図１の逆量子化・逆変換部８と同様の手順で、その予測差分符号化パラメータに含まれる量子化パラメータ及び変換ブロック分割情報を参照して、変換ブロック単位にその圧縮データを逆量子化する。
　このとき、可変長復号部３１により可変長復号された各ヘッダ情報を参照し、各ヘッダ情報が、当該スライスで量子化マトリクスを用いて、逆量子化処理を実施することを示している場合は、量子化マトリクスを用いて逆量子化処理を行う。

　この際、可変長復号部３１により可変長復号された各ヘッダ情報を参照して、各直交変換サイズで色信号や符号化モード（イントラ符号化かインター符号化か）毎に使用する量子化マトリクスを特定する。
　また、逆量子化・逆変換部３２は、変換ブロック単位に逆量子化後の圧縮データである変換係数に対する逆直交変換処理を実施して、図１の逆量子化・逆変換部８から出力された局所復号予測差分信号と同一の復号予測差分信号を算出する（ステップＳＴ２８）。

　加算部３６は、逆量子化・逆変換部３２により算出された復号予測差分信号と、イントラ予測部３４により生成されたイントラ予測画像Ｐ_{ＩＮＴＲＡｉ} ^ｎ、または、動き補償部３５により生成されたインター予測画像Ｐ_{ＩＮＴＥＲｉ} ^ｎのいずれか一方を加算して復号画像を算出し、その復号画像をループフィルタ部３８に出力するとともに、その復号画像をイントラ予測用メモリ３７に格納する（ステップＳＴ２９）。
　この復号画像が、以降のイントラ予測処理の際に用いられる復号済みの画像信号になる。

　ループフィルタ部３８は、全ての符号化ブロックＢ^ｎに対するステップＳＴ２３～ＳＴ２９の処理が完了すると（ステップＳＴ３０）、加算部３６から出力された復号画像に対して、所定のフィルタ処理を実施して、フィルタ処理後の復号画像を動き補償予測フレームメモリ３９に格納する（ステップＳＴ３１）。
　具体的には、変換ブロックの境界や予測ブロックの境界に発生する歪みを低減するフィルタ（デブロッキングフィルタ）処理、画素単位に適応的にオフセットを加算する（画素適応オフセット）処理、ウィーナフィルタ等の線形フィルタを適応的に切り替えてフィルタ処理する適応フィルタ処理などを行う。
　ただし、ループフィルタ部３８は、上記のデブロッキングフィルタ処理、画素適応オフセット処理、適応フィルタ処理のそれぞれについて、可変長復号部３１により可変長復号された各ヘッダ情報を参照して、当該スライスで処理を行うか否かを特定する。
　このとき、２つ以上のフィルタ処理を行う場合に、例えば、画像符号化装置のループフィルタ部１１が図１１のように構成されている場合には、図１２に示すようにループフィルタ部３８が構成される。

　ここで、デブロッキングフィルタ処理では、可変長復号部３１により可変長復号されたヘッダ情報を参照し、ブロック境界にかけるフィルタ強度の選択に用いる各種パラメータを初期値から変更する情報が存在する場合には、その変更情報に基づいて、デブロッキングフィルタ処理を実施する。変更情報がない場合は、予め定められた手法に従って行う。

　画素適応オフセット処理では、可変長復号部３１により可変長復号された画素適応オフセット処理のブロック分割情報に基づいて分割し、そのブロック単位に、可変長復号部３１により可変長復号されたブロック単位のクラス分類手法を示すインデックスを参照して、そのインデックスが“オフセット処理を行わない”ことを示すインデックスでない場合、ブロック単位にブロック内の各画素を上記インデックスが示すクラス分類手法に従ってクラス分類する。
　なお、クラス分類手法の候補として、ループフィルタ部１１の画素適応オフセット処理のクラス分類手法の候補と同一のものが予め用意されている。

　そして、ループフィルタ部３８は、ブロック単位の各クラスのオフセット値を特定する可変長復号部３１により可変長復号されたオフセット情報を参照して、復号画像の輝度値にオフセットを加算する処理を行う。

　適応フィルタ処理では、可変長復号部３１により可変長復号されたクラス毎のフィルタを用いて、図１の画像符号化装置と同一の手法でクラス分類した後に、そのクラス分類情報に基づいてフィルタ処理を行う。
　このループフィルタ部３８によるフィルタ処理後の復号画像が、動き補償予測用の参照画像となり、また、再生画像となる。

　以上で明らかなように、この実施の形態１によれば、ランダムアクセスポイントに長期参照ピクチャのみを参照するインターピクチャを設定し、その長期参照ピクチャのピクチャ番号を識別する情報を補足情報として符号化することによって、上記補足情報から判明する長期参照ピクチャを先に復号し、その後に上記長期参照ピクチャのみを参照するランダムアクセスポイントを示すピクチャを復号することでインターピクチャにおいてもランダムアクセスが可能となる符号化ビットストリームを生成するように構成したので、ランダムアクセスが可能なイントラピクチャ（ＩＲＡＰピクチャ）を上記補足情報付きのインターピクチャに変更することによりランダムアクセス間隔を維持したまま符号化効率を改善する効果を奏する。

　また、この実施の形態１によれば、補足情報から判明する長期参照ピクチャを先に復号し、その後に上記長期参照ピクチャのみを参照するランダムアクセスポイントを示すピクチャを復号することでインターピクチャにおいてもランダムアクセスが可能となる符号化ビットストリームを正しく復号することができる効果を奏する。

実施の形態２．
　上記実施の形態１の画像符号化装置においては、ランダムアクセス可能なインターピクチャが参照するランダムアクセス時使用参照ピクチャのピクチャ番号を示すピクチャ位置情報を含むランダムアクセス可能なインターピクチャを示す補足情報としてＳＥＩを新たに定義したが、本実施の形態の画像符号化装置では、新たなＳＥＩを定義せずに、非特許文献１及び非特許文献２に定義されるＲｅｃｏｖｅｒｙＰｏｉｎｔＳＥＩＭｅｓｓａｇｅの意味を下記の通り解釈するように変更する。すなわち、ＲｅｃｏｖｅｒｙＰｏｉｎｔＳＥＩＭｅｓｓａｇｅが付与されているピクチャをランダムアクセス可能なインターピクチャとし、さらにＲｅｃｏｖｅｒｙＰｏｉｎｔＳＥＩＭｅｓｓａｇｅのシンタックスｒｅｃｏｖｅｒｙ＿ｐｏｃ＿ｃｎｔ（非特許文献２では、ｒｅｃｏｖｅｒｙ＿ｆｒａｍｅ＿ｃｎｔ）を、復号開始位置であるリカバリポイントとなるピクチャの位置ではなく、ランダムアクセス時使用参照ピクチャの位置を示す情報として解釈するようにする。このような構成とすれば、新たなＳＥＩを定義することなく、上記実施の形態１の画像符号化装置と同じ処理が可能となり、同様の効果を得ることができる。ただし、ランダムアクセス可能なインターピクチャが参照できるランダムアクセス時使用参照ピクチャ数は１つに限定される。

　本実施の形態の画像復号装置はＲｅｃｏｖｅｒｙＰｏｉｎｔＳＥＩＭｅｓｓａｇｅが付与されているピクチャをランダムアクセス可能なインターピクチャと解釈し、さらに、ＲｅｃｏｖｅｒｙＰｏｉｎｔＳＥＩＭｅｓｓａｇｅのシンタックスｒｅｃｏｖｅｒｙ＿ｐｏｃ＿ｃｎｔ（非特許文献２では、ｒｅｃｏｖｅｒｙ＿ｆｒａｍｅ＿ｃｎｔ）を、リカバリポイントとなるピクチャの位置ではなく、ランダムアクセス時使用参照ピクチャの位置を示す情報として解釈する。このような構成とすれば、ＲｅｃｏｖｅｒｙＰｏｉｎｔＳＥＩＭｅｓｓａｇｅが付与されているピクチャから復号を開始する場合は、まずｒｅｃｏｖｅｒｙ＿ｐｏｃ＿ｃｎｔ（非特許文献２では、ｒｅｃｏｖｅｒｙ＿ｆｒａｍｅ＿ｃｎｔ）が指すピクチャを復号し、次にＲｅｃｏｖｅｒｙＰｏｉｎｔＳＥＩＭｅｓｓａｇｅが付与されているピクチャを復号し、その後ＲｅｃｏｖｅｒｙＰｏｉｎｔＳＥＩＭｅｓｓａｇｅが付与されているピクチャより表示順で後のピクチャを復号することでＲｅｃｏｖｅｒｙＰｏｉｎｔＳＥＩＭｅｓｓａｇｅが付与されているピクチャから正常に再生可能となる。したがって、本実施の形態の画像符号化装置で生成される符号化ビットストリームに対して、ランダムアクセス可能なインターピクチャを識別し、そのランダムアクセス可能なインターピクチャから復号を開始した場合も正しく復号することができるため、上記実施の形態１の画像復号装置と同様の効果を得ることができる。

実施の形態３．
　本実施の形態では、ランダムアクセス可能なインターピクチャの参照するランダムアクセス時使用参照ピクチャを後述する直前のＩＲＡＰピクチャに限定して、直前のＩＲＡＰピクチャの復号画像を動き補償予測フレームメモリ１２に格納し、動き補償予測部５が、動き補償予測フレームメモリ１２に格納されている直前のＩＲＡＰピクチャの復号画像を参照して、そのインターピクチャの動き補償予測を実施し、可変長符号化部１３が、そのインターピクチャがランダムアクセス可能なピクチャである旨を示すＳＥＩを符号化し、そのＳＥＩの符号化データを符号化ビットストリームに多重化するようにする。
　ここで、直前のＩＲＡＰピクチャは、１つ以上のＩＲＡＰピクチャの中で、ランダムアクセス可能なインターピクチャの符号化順（復号順）に対して、符号化順（復号順）が先かつ符号化順（復号順）が最も近い（符号化順がより近い）ＩＲＡＰピクチャを意味する。

　この場合、上記実施の形態１で説明したランダムアクセス可能なインターピクチャを示すＳＥＩに含めているピクチャ位置情報、即ち、ランダムアクセス時使用参照ピクチャのピクチャ番号を示すピクチャ位置情報を省略することができる。このような構成とすれば、上記実施の形態１の画像符号化装置と同じ処理がランダムアクセス時使用参照ピクチャのピクチャ番号を識別する情報、すなわち、本ＳＥＩを構成する付随情報なしに可能となり、本ＳＥＩに要する符号量を削減する効果を得ることができる。

　ランダムアクセス可能なインターピクチャの参照するランダムアクセス時使用参照ピクチャを直前のＩＲＡＰピクチャに限定するように画像符号化装置を構成した場合、画像復号装置では、本ＳＥＩを参照することで直前のＩＲＡＰピクチャを上記参照するランダムアクセス時使用参照ピクチャであると識別する。
　したがって、このような構成とすれば、本ＳＥＩが付与されているピクチャから復号を開始する場合は、直前のＩＲＡＰピクチャを復号して、そのＩＲＡＰピクチャの復号画像を動き補償予測フレームメモリ３９に格納したのち、動き補償部３５が、動き補償予測フレームメモリ３９に格納されている直前のＩＲＡＰピクチャの復号画像を参照して、そのＳＥＩが示すランダムアクセス可能なインターピクチャの動き補償予測を実施することで、そのインターピクチャを復号する。その後、本ＳＥＩが示すランダムアクセス可能なインターピクチャより表示順で後のピクチャを復号することで、このＳＥＩが示すランダムアクセス可能なピクチャから正常に再生することが可能となる。したがって、本実施の形態の画像符号化装置で生成したビットストリームの途中から正しく復号することができる。

実施の形態４．
　上記実施の形態１の画像符号化装置においては、ランダムアクセス可能なインターピクチャであることを示す情報をＳＥＩに設定する場合について説明したが、上位ヘッダで設定できれば、これに限られない。例えば、ランダムアクセス可能なインターピクチャということを示す特別なＮＡＬユニットタイプを定義し、そのＮＡＬの中に上記ＳＥＩと同様の情報を持つように構成しても良い。
　すなわち、この場合、ＳＥＩを付与することでランダムアクセス可能なインターピクチャを識別するようにするのではなく、ランダムアクセス可能なインターピクチャを示すＮＡＬユニットタイプを新たに定義して、本ＮＡＬユニットタイプを示すＮＡＬユニットとしてランダムアクセス可能なインターピクチャを符号化する。

　ランダムアクセス可能なインターピクチャということを示す特別なＮＡＬユニットタイプを定義する画像符号化装置で生成された符号化ストリームを正しく復号するためには、復号装置においても、画像符号化装置と同様に特別なＮＡＬユニットタイプを定義し、これに従って復号する。この場合、上記特別なＮＡＬユニットタイプを持つピクチャから復号することでランダムアクセス可能なインターピクチャからの途中復号を実現している。即ち、まず上記特別なＮＡＬユニットタイプが持つ情報が指すランダムアクセス時使用参照ピクチャを復号し、次に本ＮＡＬユニットタイプを持つランダムアクセス可能なインターピクチャを復号し、その後本ランダムアクセス可能なインターピクチャより表示順で後のピクチャを復号することで本ＮＡＬユニットタイプを持つランダムアクセス可能なインターピクチャから正常に再生可能となる。したがって、このような構成としても、上記実施の形態１の画像復号装置と同様に、ビットストリームの途中から正しく復号することができ、同様の効果を得ることができる。
　また、本実施の形態はランダムアクセス可能なインターピクチャであることを示す情報を上位ヘッダで設定することを特徴としており、その上位ヘッダはランダムアクセスが可能ならばどのように構成しても良いことは明らかである。したがって、例えば実施の形態３との組み合わせとして、ランダムアクセス可能なインターピクチャの参照するランダムアクセス時使用参照ピクチャは直前のＩＲＡＰピクチャに限定し、ランダムアクセス時使用参照ピクチャのピクチャ番号を識別する情報を省略することも可能である。

実施の形態５．
　実施の形態１～４では、インターピクチャによるランダムアクセスを実現する符号化ストリームを生成する画像符号化装置と、生成した符号化ストリームを正しく復号できる画像復号装置について説明した。本実施の形態では、イントラピクチャ（非特許文献１のＩＲＡＰピクチャまたは非特許文献２のＩＤＲピクチャ）のみによるランダムアクセスを実現している符号化ストリームを部分的に変換するだけで、インターピクチャによるランダムアクセスを実現する符号化ストリームを生成する符号化ストリーム変換装置と、生成した符号化ストリームを正しく復号できる画像復号装置について説明する。

　図３９はこの発明の実施の形態５による符号化ストリーム変換装置を示す構成図である。
　ここで、再符号化制御部４２及び入力映像信号制御部４４は再符号化設定部を構成し、復号部４３は画像復号部を構成し、ビットストリーム合成部４５はビットストリーム合成部を構成している。
　本実施の形態における符号化ストリーム変換装置は、変換対象となる符号化ストリーム（ビットストリーム）のＩＲＡＰピクチャ（非特許文献２の場合、ＩＤＲピクチャ）の中から、１以上の任意のピクチャをランダムアクセス可能なインターピクチャとして再符号化する再符号化部４１を有する。
　このようにイントラピクチャをインターピクチャに再符号化することにより、元の符号化ストリームより符号量が削減された符号化ストリームを生成することができる。

　具体的には、変換対象（再符号化対象）となるピクチャを一旦、復号する。そして、復号された映像信号を図１と同様の符号化装置を用いてインターピクチャとして再符号化する。
　すなわち、符号化ストリーム変換装置は、まず再符号化制御部４２が、非特許文献３や非特許文献２等の従来の画像符号化装置によって生成された符号化ストリームからランダムアクセス可能なイントラピクチャ（非特許文献１ではＩＲＡＰピクチャ、非特許文献２ではＩＤＲピクチャ）を特定する情報を、復号部４３を用いて復号する。次に、再符号化制御部４２は、復号したランダムアクセス可能なイントラピクチャを特定する情報から特定される複数のランダムアクセス可能なイントラピクチャの中から、任意のピクチャを再符号化対象のピクチャに設定すると共に、複数のランダムアクセス可能なイントラピクチャの中で、再符号化対象のピクチャよりも先に符号化されている少なくとも１つのピクチャ（再符号化参照ピクチャ）を復号部４３にて復号して再符号化部４１の動き補償予測フレームメモリ１２に格納するように制御する。そして再符号化制御部４２にしたがって再符号化部４１は、上記復号した少なくとも１つの再符号化参照ピクチャを参照して、再符号化対象のピクチャの動き補償予測を動き補償予測部５にて実施することでインター予測画像を生成し、そのインター予測画像を用いて、インターピクチャの符号化データを生成する。このとき、復号部４３は上記符号化ストリームを生成した従来の符号化装置に対応する復号装置を示す（復号部４３は上記符号化ストリームを正しく復号できる）。さらに、再符号化部４１は実施の形態１の画像符号化装置（図１）と同じ構成となる。
　また、符号化ストリーム変換装置は、上記符号化ストリームの中の再符号化対象のイントラピクチャの符号化データに当たる部分のストリームを、再符号化部４１により生成されたインターピクチャの符号化データからなるビットストリームに置き換えることで再符号化後のストリーム（再符号化ストリーム）を生成するビットストリーム合成部４５を有する。
　なお、再符号化部４１の動き補償予測フレームメモリ１２では、変換対象となるピクチャが参照するピクチャを長期参照ピクチャとして保存する。この長期参照ピクチャはＩＲＡＰピクチャ（上記符号化ストリームが非特許文献２の符号化装置で生成されている場合、ＩＤＲピクチャ）に限定するものとする。このように、長期参照ピクチャとして特定のピクチャを保存するようにした場合、元の符号化ストリームに対して、符号化順で上記特定のピクチャより後かつ変換対象となるピクチャの前に符号化するピクチャの符号化データに該当する部分を、上記特定のピクチャが長期参照ピクチャとして保存されているようにビットストリーム合成部４５が符号化ストリームを変更する必要がある。

　動き補償予測部５から出力されるインター予測画像は、通常のインターピクチャと同様に、減算部６、変換・量子化部７を介して、圧縮データに変換され、可変長符号化部１３に出力される。このように、変換対象となるイントラピクチャをインターピクチャとして再符号化する再符号化部４１には、特定のイントラピクチャを一時的に保存するバッファ、動き補償予測部５、減算部６、及び変換・量子化部７が含まれる。なお、このとき生成される復号画像が再符号化前のイントラピクチャが生成する復号画像と同一となるように、インター予測画像及び圧縮データを生成しなくてはならない。したがって再符号化制御部４２は、入力映像信号制御部４４に対して、上記変換対象となるイントラピクチャを再符号化する際は、復号部４３によって復号された上記変換対象となるイントラピクチャの復号画像を映像信号としてスライス分割部１４に入力するように制御する。そして、上記変換対象となるイントラピクチャが生成する復号画像を参照して、上記変換対象となるイントラピクチャが生成する復号画像と再符号化後の復号画像が同一となるように、例えばロスレス符号化を行うように、動き補償予測部５、減算部６、変換・量子化部７の処理を制御するように符号化制御部２を再符号化制御部４２が制御することで可能となる。

　再符号化されたインターピクチャの参照ピクチャバッファ管理に関する処理については、再符号化前のＩＲＡＰピクチャまたはＩＤＲピクチャの次に符号化されるピクチャを符号化する際のバッファ状況が本再符号化処理によって変わらないようにする必要がある。そこで、符号化制御部２に含まれるバッファ管理部によりバッファ（動き補償予測フレームメモリ１２）を制御し、再符号化されたピクチャ以降に復号するピクチャの復号処理に影響を与えないようにする。

　再符号化されたピクチャ、すなわちイントラピクチャを変換することにより得られたインターピクチャのアクセスユニット内には、ランダムアクセス可能なインターピクチャであることを示す補足情報（ＳＥＩ情報）が多重化される。このＳＥＩ情報には、再符号化されたピクチャが参照したランダムアクセス時使用参照ピクチャのピクチャ番号を識別する情報が含まれる。ＳＥＩ情報を符号化してビットストリームに多重化する処理は、上記実施の形態１と同様、可変長符号化部１３により行われる。
　あるいは、ビットストリーム合成部４５にて上記補足情報を生成、符号化し、再符号化ストリームに多重化するように符号化ストリーム変換装置を構成してもよい。この場合、再符号化部４１は、上記補足情報の生成・符号化を行う必要がないため、再符号化前の符号化ストリームを生成した符号化装置（非特許文献４や非特許文献２等の従来の画像符号化装置）と同一の符号化処理で再符号化を実現できる。

　実施の形態３と同様に上記ランダムアクセス時使用参照ピクチャは直前のＩＲＡＰピクチャ（非特許文献２の場合、ＩＤＲピクチャ）に限定することとしてもよい。この場合、ＳＥＩとして、上記ランダムアクセス時使用参照ピクチャのピクチャ番号を識別する情報を省略することができる。
　あるいは、ＳＥＩ情報としてではなく、実施の形態２や実施の形態４と同様の形態でランダムアクセス可能なインターピクチャであることを示す情報を符号化するようにしても良い。

　再符号化された符号化ストリームを復号する本実施の形態５の画像復号装置は、ランダムアクセス可能なインターピクチャであることを示す情報をどのように符号化するように構成したかによって、実施の形態１から実施の形態４の内の対応する画像復号装置で正しくビットストリームを復号することができる。

　また、これまでの説明ではＩＲＡＰピクチャ（ＩＤＲピクチャ）等のランダムアクセス可能なイントラピクチャのみを再符号化する方法について述べたが、ランダムアクセス可能なイントラピクチャから次のランダムアクセス可能なイントラピクチャの１つ前に復号されるピクチャまでのピクチャ全て（一般にＧｒｏｕｐ　Ｏｆ　Ｐｉｃｔｕｒｅｓ（ＧＯＰ）と呼ばれる単位であり、単独復号できるピクチャ群を示す）をまとめて再符号化するようにしても良い。このときの再符号化するランダムアクセス可能なイントラピクチャは上記の説明と同様にランダムアクセス可能なインターピクチャとして、そのことを示す情報（実施の形態１から実施の形態４に記載のいずれかの情報）と共に再符号化し、残りの再符号化対象のピクチャはどのように再符号化しても良い。この場合、上記の再符号化手法とは異なり、ランダムアクセス可能なインターピクチャが生成する復号画像は再符号化前のイントラピクチャが生成する復号画像と異なっていても、本実施の形態の画像復号装置で正しく復号することができる。したがって、再符号化制御部４２は、入力映像信号制御部４４に対して、各再符号化対象ピクチャを再符号化する際は、上記再符号化対象ピクチャの原画像（映像信号）をスライス分割部１４に入力するように制御する。
このようにすることで、各各再符号化対象ピクチャに対して、再符号化前後の復号画像が同一となるように制御する必要がなく、再符号化処理を簡易化できる。
また、実施の形態３と同様にランダムアクセス時使用参照ピクチャ（再符号化対象のランダムアクセス可能なイントラピクチャを再符号化する際に参照するピクチャ）を直前のＩＲＡＰピクチャ（非特許文献２の場合、ＩＤＲピクチャ）に限定する場合、ランダムアクセス可能なインターピクチャとするピクチャからではなく、直前のＩＲＡＰピクチャから、ランダムアクセス可能なインターピクチャとするピクチャの次の（復号順で後となる最も近い）ランダムアクセス可能なイントラピクチャの１つ前に復号されるピクチャまで再符号化するようにしてもよい。このようにすることで、直前のＩＲＡＰピクチャから再符号化前の符号化ストリームが生成する復号画像に依存しない自由な再符号化が実施可能となる。なお、再符号化された複数のピクチャの中に直前のＩＲＡＰを参照する複数のランダムアクセス可能なインターピクチャが含まれていてもよい。

　上記説明ではランダムアクセス時使用参照ピクチャを長期参照ピクチャとして保存するように再符号化する例について説明したが、ランダムアクセス可能なインターピクチャが参照する特別なバッファを用意して本バッファに上記ランダムアクセス時使用参照ピクチャを格納し、ランダムアクセス可能なインターピクチャを符号化する際に上記特別なバッファに格納されるランダムアクセス時使用参照ピクチャを参照して符号化するように符号化ストリーム変換装置を構成しても良い。この場合、画像復号装置も上記特別なバッファを用意してこれを参照してランダムアクセス可能なインターピクチャを復号するように構成する。上記の動作以外の符号化ストリーム変換処理及び復号処理については、これまでに説明した本実施の形態の処理と同じ処理を実施する。
　本構成の場合、上記ランダムアクセス時使用参照ピクチャを符号化した後かつランダムアクセス可能なインターピクチャを符号化する前までのピクチャの符号化データを変更する必要がない利点がある。

　また、本実施の形態において、再符号化時に再符号化前の符号化パラメータを流用して再符号化を実施しても良い。具体的には、再符号化の前後でピクチャタイプ（スライスタイプ）が変わらないピクチャは再符号化前の符号化パラメータを一部流用する。例えば、再符号化前のブロック分割情報、各ブロックの符号化モード、予測パラメータなどの符号化パラメータをそのまま用いて再符号化する。このようにすることで符号化パラメータの選択処理が不要となり、再符号化処理の処理負荷を低減できる。

　この実施の形態５における符号化ストリーム変換装置によれば、イントラピクチャのみをランダムアクセスポイントとする符号化ストリームのイントラピクチャをランダムアクセス可能なインターピクチャに一部再符号化することができる。そのため、元の符号化ストリームより符号量が削減された符号化ストリームを生成することができる。

　また、この実施の形態５における画像復号装置によれば、イントラピクチャのみをランダムアクセスポイントとする符号化ストリームのイントラピクチャをランダムアクセス可能なインターピクチャに一部再符号化した符号化ビットストリームを正しく復号することができる効果を奏する。

実施の形態６．
　上記実施の形態１では、ランダムアクセス可能なインターピクチャより表示順が後（表示時刻が未来）となるランダムアクセス不可能なインターピクチャ（図３３（ｂ）の白色で示す「インターピクチャ」）はランダムアクセス可能なインターピクチャより表示順が前（表示時刻が過去）となるピクチャは参照しないようにすることで、ランダムアクセス可能なインターピクチャによるランダムアクセスを実現した。本実施例では、図３５に示す例のようにランダムアクセス可能なインターピクチャより復号順が後となるランダムアクセス不可能なインターピクチャはランダムアクセス可能なインターピクチャより復号順が先となるピクチャは参照しないようにすることで、ランダムアクセス可能なインターピクチャによるランダムアクセスを実現する。この場合、非特許文献１、非特許文献２のＩＤＲピクチャをランダムアクセス可能なインターピクチャに置き換えることに相当する。

　したがって、本実施の形態の画像符号化装置で生成した符号化ストリームを復号する画像復号装置は実施の形態１と同様に、ランダムアクセス可能なインターピクチャを識別するＳＥＩが付与されているランダムアクセス可能なインターピクチャより復号を開始する場合、まずランダムアクセス可能なインターピクチャを識別するＳＥＩに含まれるランダムアクセス時使用参照ピクチャのピクチャ番号を識別する情報が指すピクチャを復号し、次に上記ＳＥＩが付与されているピクチャを復号し、その後、上記ＳＥＩが付与されているピクチャより表示順で後のピクチャを復号することでランダムアクセス可能なインターピクチャから正常に再生可能となる。
　また、本実施の形態は、実施の形態１の参照ピクチャの制限を変更するのみであり、実施の形態１の画像符号化装置及び画像復号装置と同様の方法で他の実施の形態と組み合わせることができることは明らかである。

実施の形態７．
　上記実施の形態１の画像符号化装置においては、ランダムアクセス可能なインターピクチャが参照するランダムアクセス時使用参照ピクチャのピクチャ番号を識別する情報を含むランダムアクセス可能なインターピクチャを識別する情報としてＳＥＩを新たに定義したが、本実施の形態の画像符号化装置では、ランダムアクセス可能なインターピクチャを識別する情報として、非特許文献１及び非特許文献２に定義されるＲｅｃｏｖｅｒｙＰｏｉｎｔＳＥＩＭｅｓｓａｇｅを用いる。また、上記実施の形態２においてはＲｅｃｏｖｅｒｙＰｏｉｎｔＳＥＩＭｅｓｓａｇｅの解釈を変えて用いたが、本実施の形態においては、ＲｅｃｏｖｅｒｙＰｏｉｎｔＳＥＩＭｅｓｓａｇｅのシンタックスｒｅｃｏｖｅｒｙ＿ｐｏｃ＿ｃｎｔ（非特許文献２では、ｒｅｃｏｖｅｒｙ＿ｆｒａｍｅ＿ｃｎｔ）を、非特許文献１及び非特許文献２に定義されるとおり、復号開始位置であるリカバリポイントとなるピクチャの位置と解釈した上で、そのリカバリポイントとなるピクチャがインターピクチャである場合のみ上記実施の形態１のランダムアクセス時使用参照ピクチャのピクチャ番号を識別する情報をＲｅｃｏｖｅｒｙＰｏｉｎｔＳＥＩＭｅｓｓａｇｅのシンタックスとして符号化するようにする。

　本実施の形態の画像復号装置はＲｅｃｏｖｅｒｙＰｏｉｎｔＳＥＩＭｅｓｓａｇｅを復号して、シンタックスｒｅｃｏｖｅｒｙ＿ｐｏｃ＿ｃｎｔ（非特許文献２では、ｒｅｃｏｖｅｒｙ＿ｆｒａｍｅ＿ｃｎｔ）が示すリカバリポイントとなるピクチャのピクチャタイプを確認し、リカバリポイントとなるピクチャがインターピクチャである場合のみランダムアクセス時使用参照ピクチャのピクチャ番号を識別する情報を復号して、ランダムアクセス時使用参照ピクチャを特定する。このような構成とすれば、本ＳＥＩが付与されているピクチャから復号を開始する場合は、まずランダムアクセス時使用参照ピクチャのピクチャ番号を識別する情報が示すピクチャを復号し、次にｒｅｃｏｖｅｒｙ＿ｐｏｃ＿ｃｎｔが示すランダムアクセス可能なインターピクチャを復号し、その後本ランダムアクセス可能なインターピクチャより表示順で後のピクチャを復号することで本ランダムアクセス可能なインターピクチャから正常に再生可能となる。したがって、上記実施の形態１の画像復号装置と同様の効果を得ることができる。
　本実施の形態では、リカバリポイントとなるピクチャがイントラピクチャである場合は非特許文献１及び非特許文献２からの変更はなく、非特許文献１及び非特許文献２準拠の画像復号装置を用いてリカバリポイントとなるイントラピクチャからの途中復号を正常に行える。

　実施の形態３と同様に上記ランダムアクセス時使用参照ピクチャは直前のＩＲＡＰピクチャ（非特許文献２の場合、ＩＤＲピクチャ）に限定することとしてもよい。この場合、ランダムアクセス時使用参照ピクチャのピクチャ番号を識別する情報（シンタックス）を省略することができる。したがって、非特許文献１及び非特許文献２に記載のＲｅｃｏｖｅｒｙＰｏｉｎｔＳＥＩＭｅｓｓａｇｅで定義される情報（シンタックス）のみでランダムアクセス可能なインターピクチャからの途中復号を実現できる。

　また、実施の形態５の符号化ストリーム変換装置に対しても、本画像符号化装置と同様にランダムアクセス可能なインターピクチャを識別する情報を非特許文献１及び非特許文献２に定義されるＲｅｃｏｖｅｒｙＰｏｉｎｔＳＥＩＭｅｓｓａｇｅを用いるようにすることができる。このようにした場合、本実施の形態の画像復号装置にて復号可能となる。

実施の形態８．
　上記実施の形態１、２、４～７では、ランダムアクセス時使用参照ピクチャの位置をピクチャ番号として符号化していたが、本実施の形態では、上記実施の形態１、２、４～７に対して、図３６に示すようにランダムアクセス時使用参照ピクチャの位置を、ランダムアクセス可能なインターピクチャを識別する情報からの移動バイト数で示すようにする。このようにすることで、上記ランダムアクセス時使用参照ピクチャを特定するために符号化された各ピクチャデータからピクチャ番号を復号してランダムアクセス時使用参照ピクチャのピクチャ番号と照合する処理を行うことなしにランダムアクセス時使用参照ピクチャの復号開始位置を知ることができ、復号処理の処理負荷を低減することができる。また、ランダムアクセス時使用参照ピクチャの位置を、図３７のように符号化ビットストリームの先頭からの移動バイト数で示すようにしてもよい。このようにすることで、ランダムアクセス時使用参照ピクチャの復号開始位置を符号化ビットストリームの相対的位置（ランダムアクセス可能なインターピクチャを識別する情報からの移動バイト数）ではなく、絶対的な位置として知ることができる。また、移動バイト数の開始点は画像符号化装置と画像復号装置との間で統一していれば、図３６、図３７と異なる点を設定しても良いことは明らかである。

実施の形態９．
　本実施の形態では、実施の形態１においてＳＥＩで示した、ランダムアクセス可能なインターピクチャの識別情報と、ランダムアクセス時使用参照ピクチャの位置を識別する情報を、映像や音声の符号化ビットストリームをまとめるメディアファイルフォーマット内の情報として付与するようにする。メディアファイルフォーマットは、例えばＩＳＯ／ＩＥＣ　２３００８－１、ＩＳＯ／ＩＥＣ　１３８１８－１／ＩＴＵ－Ｔ　Ｈ．２２２．０、ＩＳＯ／ＩＥＣ　１４４９６－１４：２００３等に規定されている。このようにすることでメディアファイルの中から上記実施の形態１～７で説明した画像符号化装置によって生成された符号化ビットストリームを抜き出す前にランダムアクセス可能なインターピクチャとそのランダムアクセス可能なインターピクチャの復号に必要なランダムアクセス時使用参照ピクチャを識別することができ、高速なランダムアクセスを実現することができる。

　具体的には、ＩＲＡＰピクチャ（非特許文献２ではＩＤＲピクチャ）から始まる複数のピクチャを単独復号できるＧｒｏｕｐ　Ｏｆ　Ｐｉｃｔｕｒｅｓ（ＧＯＰ）単位の符号化ビットストリームをまとめた単位（以下、ＧＯＰメディアデータと呼ぶ）の記述子情報を用いる。例えば、ランダムアクセス可能なインターピクチャを含むＧＯＰメディアデータの記述子情報に、ランダムアクセス可能なインターピクチャの識別情報としてランダムアクセス可能なインターピクチャの時刻情報（タイムコードに相当）を追加し、ランダムアクセス時使用参照ピクチャの位置を識別する情報としてそのランダムアクセス時使用参照ピクチャの時刻情報を追加する。

　または、ピクチャ単位の符号化ビットストリームをまとめた単位（以下、ピクチャメディアデータと呼ぶ）の記述子情報（Ｍｏｖｉｅｆｒａｇｍｅｎｔ　ｍｅｔａｄａｔａ）を用いる。例えば、ランダムアクセス可能なインターピクチャのピクチャメディアデータの記述子情報に、ランダムアクセス可能なインターピクチャの識別情報としてランダムアクセス可能なインターピクチャであるか否かのフラグ情報を追加し、ランダムアクセス時使用参照ピクチャの位置を識別する情報としてそのランダムアクセス時使用参照ピクチャの時刻情報を追加する。

　ＧＯＰメディアデータの記述子情報の例としては、ＩＳＯ／ＩＥＣ　２３００８－１のＭＰＵ　ｍｅｔａｄａｔａやＩＳＯ／ＩＥＣ　１４４９６－１４：２００３のｍｏｏｖボックスが挙げられる。ピクチャメディアデータの記述子情報としては、ＩＳＯ／ＩＥＣ　２３００８－１のＭｏｖｉｅｆｒａｇｍｅｎｔ　ｍｅｔａｄａｔａやＩＳＯ／ＩＥＣ　１４４９６－１４：２００３のｍｏｏｆボックスが挙げられる。

　また、本実施の形態では実施の形態３と同様に、ランダムアクセス可能なインターピクチャの参照するランダムアクセス時使用参照ピクチャは直前のＩＲＡＰピクチャに限定し、ランダムアクセス時使用参照ピクチャの位置を識別する情報を省略する構成とすることも可能である。このようにすることで、ランダムアクセス時使用参照ピクチャの位置を識別する情報に要する符号量を削減することができる。

実施の形態１０．
　実施の形態１～９ではランダムアクセス可能なインターピクチャが参照するランダムアクセス時使用参照ピクチャを長期保存用バッファに保存される長期参照ピクチャとしたが、本実施の形態ではランダムアクセス時使用参照ピクチャを長期参照ピクチャでないイントラピクチャとする。この場合、ランダムアクセス時使用参照ピクチャはその他のピクチャの符号化・復号における参照ピクチャと同じ短期参照（ｓｈｏｒｔ－ｔｅｒｍ　ｒｅｆｅｒｅｎｃｅ）ピクチャとして短期保存用バッファに格納する。しかし、ランダムアクセス可能なインターピクチャの符号化・復号の際にランダムアクセス時使用参照ピクチャが短期保存用バッファに存在するようにするために、短期保存用バッファ格納後の各ピクチャの符号化・復号の際に上記ランダムアクセス時使用参照ピクチャが短期保存用バッファに保存されたままになるようにする必要がある。そこで、画像符号化装置においては、ランダムアクセス可能なインターピクチャの符号化・復号の際にランダムアクセス時使用参照ピクチャが短期保存用バッファに保存された状態となるように非特許文献１及び非特許文献２に規定されている短期参照ピクチャの管理情報を符号化する。また、画像復号装置は符号化ストリームから上記管理情報を復号し本情報に従ってバッファを管理することで、ランダムアクセス可能なインターピクチャの符号化・復号の際に上記ランダムアクセス時使用参照ピクチャが短期保存用バッファに保存されたままとなり参照可能となる。したがって、本実施の形態の画像符号化装置で生成した符号化ストリームに対して、ランダムアクセス可能なインターピクチャからの正常再生が可能となる。

実施の形態１１．
　実施の形態１～１０では、ランダムアクセス可能なインターピクチャはランダムアクセス時使用参照ピクチャとして設定されたピクチャのみを参照するピクチャとし、非特許文献１あるいは非特許文献２の長期保存用バッファあるいは短期保存用バッファにランダムアクセス時使用参照ピクチャを格納して実現している。すなわち、非特許文献１あるいは非特許文献２にしたがって、符号化側は長期保存用バッファ及び短期保存用バッファの参照ピクチャ管理情報を符号化し、復号側は上記参照ピクチャ管理情報を復号して参照する必要がある。本実施の形態では、実施の形態３と実施の形態４を組み合わせることで、ランダムアクセス可能なインターピクチャにおいて上記参照ピクチャ管理情報の符号化を不要とする。

　具体的には、実施の形態３と同様にランダムアクセス可能なインターピクチャの参照するピクチャを直前のＩＲＡＰピクチャに限定し、実施の形態４と同様にランダムアクセス可能なインターピクチャであることを示す特別なＮＡＬユニットタイプを定義する。符号化側は、符号化対象であるピクチャがランダムアクセス可能なインターピクチャの場合は、長期保存用バッファ及び短期保存用バッファにおける直前のＩＲＡＰピクチャ以外を消去し、符号化対象であるピクチャを上記特別なＮＡＬユニットタイプを持つピクチャとして符号化する。そして、ランダムアクセス可能なインターピクチャを符号化後にこのインターピクチャを長期保存用バッファあるいは短期保存用バッファに格納して、その後で符号化するピクチャで参照可能とする。

　復号側は、実施の形態４と同様に復号したＮＡＬユニットタイプが上記特別なＮＡＬユニットタイプである場合に、符号化対象であるピクチャをランダムアクセス可能なインターピクチャと解釈する。そして、長期保存用バッファ及び短期保存用バッファにおける直前のＩＲＡＰピクチャ以外を消去した上で、直前のＩＲＡＰピクチャを参照してランダムアクセス可能なインターピクチャを復号する。ランダムアクセス可能なインターピクチャを復号後、このインターピクチャを長期保存用バッファあるいは短期保存用バッファに格納して、その後で復号するピクチャで参照可能とする。このようにすることで、ランダムアクセス可能なインターピクチャ（上記特別なＮＡＬユニットタイプを持つピクチャ）から復号を開始した場合も、正しく再生可能となる。

実施の形態１２．
　実施の形態１～１１では、ランダムアクセス可能なインターピクチャが参照するランダムアクセス時使用参照ピクチャをイントラピクチャとしたが、本実施の形態では、図３８に示すようにＩＲＡＰピクチャを先頭にランダムアクセス可能なインターピクチャを順々に参照するようにする。このとき、ランダムアクセス時使用参照ピクチャの位置を識別する情報として、各ランダムアクセス可能なインターピクチャが持つランダムアクセス可能なインターピクチャを識別する情報を符号化する。さらに、上述のとおりランダムアクセス可能なインターピクチャを順々に参照可能とするために、各ランダムアクセス可能なインターピクチャを符号化する際に符号化済みのＩＲＡＰピクチャ及びランダムアクセス可能なインターピクチャの中で、直前のピクチャ（符号化順（復号順）で最も近いピクチャ）が参照可能となるように、長期保存用バッファあるいは短期保存用バッファの参照ピクチャを管理する。

　このようにすることで、復号装置は、ランダムアクセス可能なインターピクチャを識別する情報を復号してランダムアクセス可能なインターピクチャを特定した後、例えばそのうちの１つのランダムアクセス可能なインターピクチャ（ピクチャＡ）から途中再生する場合は、まず直前のＩＲＡＰピクチャと、ＩＲＡＰピクチャとピクチャＡの間に存在するランダムアクセス可能なインターピクチャを復号順に順々に復号し、そのインターピクチャを長期保存用バッファあるいは短期保存用バッファに格納する。このとき、ＩＲＡＰピクチャとピクチャＡの間に存在するランダムアクセス可能なインターピクチャは、復号されたランダムアクセス可能なインターピクチャを識別する情報から特定できる。そして、復号された直前のランダムアクセス可能なインターピクチャ（復号順で最も近いランダムアクセス可能なインターピクチャ）を参照することでピクチャＡが復号可能となるため、ランダムアクセス可能なインターピクチャからの再生を正常に行うことができる。このような構成により、ランダムアクセス可能なインターピクチャをＩＲＡＰピクチャより時間的に近いピクチャを参照して符号化することができるので、符号化効率を高めることができる。

実施の形態１３．
　実施の形態１２に対して、本実施の形態では、各ランダムアクセス可能なインターピクチャは、直前のＩＲＡＰピクチャ（符号化順（復号順）で最も近いＩＲＡＰピクチャ）及び直前のＩＲＡＰピクチャ以降に符号化（復号）したランダムアクセス可能なインターピクチャの中から、参照するピクチャを選択して符号化するようにする。
　このとき、実施の形態１２に対して、各ランダムアクセス可能なインターピクチャが参照するピクチャを特定する情報を更に符号化するようにする。上記参照するピクチャを特定する情報の例としては、ピクチャ番号（Ｐｉｃｔｕｒｅ　Ｏｏｄｅｒ　Ｃｏｕｎｔ：ＰＯＣ）がある。さらに、上述のように参照ピクチャを選択可能とするために、各ランダムアクセス可能なインターピクチャを符号化する際に直前のＩＲＡＰピクチャ及びそれ以降のランダムアクセス可能なインターピクチャが参照可能となるように、長期保存用バッファあるいは短期保存用バッファの参照ピクチャを管理する。

　このようにすることで、復号装置は、ランダムアクセス可能なインターピクチャを識別する情報を復号して、ランダムアクセス可能なインターピクチャを特定した後、例えば、そのうちの１つのランダムアクセス可能なインターピクチャ（図３８のピクチャＡ）から途中再生する場合は、直前のＩＲＡＰピクチャとピクチャＡの間に存在するランダムアクセス可能なインターピクチャを復号順に順々に復号し、そのインターピクチャを長期保存用バッファあるいは短期保存用バッファに格納する。このとき、各ランダムアクセス可能なインターピクチャが参照するピクチャを特定する情報を復号し、この情報を参照して、そのインターピクチャの参照ピクチャを特定する。このようにすることで、最終的にピクチャＡが復号可能となり、ランダムアクセス可能なインターピクチャからの再生を正常に行うことができる。このような構成により、ランダムアクセス可能なインターピクチャを複数の参照ピクチャから最も符号化効率を改善するピクチャを選択して符号化することができるので、符号化効率を高めることができる。

　また、本実施の形態１３では、直前のＩＲＡＰピクチャ及びそれ以降のランダムアクセス可能なインターピクチャから参照するように画像符号化装置及び画像復号装置を構成したが、直前のＩＲＡＰピクチャと直前のランダムアクセス可能なインターピクチャ（符号化順（復号順）で最も近いランダムアクセス可能なインターピクチャ）のどちらかから選択するようにしてもよい。このようにすることで、上記参照するピクチャを特定する情報として、直前のＩＲＡＰピクチャと直前のランダムアクセス可能なインターピクチャのどちらを選択するかのフラグ情報で実現できるため、上記ピクチャ番号等の場合より符号量を削減することができる。さらに、長期保存用バッファまたは短期保存用バッファについても、各ランダムアクセス可能なインターピクチャを符号化する際に直前のＩＲＡＰピクチャと直前のランダムアクセス可能なインターピクチャのみ参照可能となるように管理すれば良いため、格納しておくピクチャ数を削減することができる。

　なお、実施の形態１～１３において、図３１～図３５、図３８ではインターピクチャを参照ピクチャが１つの単方向動き補償予測を用いるＰピクチャとして説明したが、本インターピクチャは、図３０（ｂ）の双方向動き補償予測や双方向動き補償予測における時間的制約をなくして表示順で過去の複数のピクチャや表示順で未来の複数のピクチャを参照する双予測を用いるＢピクチャでも良いことは明らかである。

　また、上記の実施の形態の内、実施の形態４以外の実施の形態については、それぞれＳＥＩを用いてインターピクチャをランダムアクセス可能なピクチャに設定した。そのため、それぞれの実施の形態の画像符号化装置で生成した符号化ビットストリームを非特許文献１及び非特許文献２準拠の画像復号装置で復号した場合にも、ランダムアクセス可能なインターピクチャが識別できないためにそのインターピクチャからの途中復号ができないだけであって、非特許文献１及び非特許文献２に規定されているランダムアクセス可能なイントラピクチャからの途中復号や、符号化ビットストリームの始めからの復号であれば正しく復号することができる。これは、ランダムアクセス可能なインターピクチャからの途中復号を行わない場合であっても、ランダムアクセス時使用参照ピクチャを符号化した際にこのランダムアクセス時使用参照ピクチャを長期保存用バッファあるいは短期保存用バッファに格納し、ランダムアクセス可能なインターピクチャとして設定されたピクチャを復号する際に参照可能となるように上記参照ピクチャ管理情報によってバッファを管理するため、上記ＳＥＩがなくともランダムアクセス可能なインターピクチャとして設定されたピクチャを復号する際には既にランダムアクセス時使用参照ピクチャが長期保存用バッファあるいは短期保存用バッファに格納されており参照可能となるためである。

　また、ランダムアクセス可能なインターピクチャを用いる一例を以下に示す。まず先頭のイントラピクチャをランダムアクセス時使用参照ピクチャに設定する。そして、一定間隔でイントラピクチャとして符号化することを前提として、イントラピクチャとして符号化するように割り当てられた各ピクチャに対して、ランダムアクセス時使用参照ピクチャを参照するインターピクチャとして符号化した方が符号化効率が高い場合は、そのピクチャをイントラピクチャではなくランダムアクセス時使用参照ピクチャを参照するインターピクチャ（ランダムアクセス可能なインターピクチャ）として符号化するようにし、イントラピクチャとして符号化した方が符号化効率が高い場合は、そのピクチャをランダムアクセス可能なイントラピクチャとして符号化すると共に新しいランダムアクセス時使用参照ピクチャに設定する。このようにすることで、符号化対象画像に対して適応的にランダムアクセス可能なインターピクチャとランダムアクセス時使用参照ピクチャが設定できる。また、上記は符号化効率に従って、イントラピクチャとして符号化するように割り当てられたピクチャをランダムアクセス可能なイントラピクチャとして符号化するかランダムアクセス時使用参照ピクチャを参照するランダムアクセス可能なインターピクチャとして符号化するかを決定したが、ランダムアクセス時使用参照ピクチャと上記イントラピクチャとして符号化するように割り当てられたピクチャの特徴量を抽出し、その特徴量に基づいて決定するようにしても良い。例えば、特徴量に基づくピクチャ間の相関値を算出し、その相関値に従ってイントラピクチャとして符号化するように割り当てられたピクチャをランダムアクセス可能なイントラピクチャとして符号化するかランダムアクセス時使用参照ピクチャを参照するランダムアクセス可能なインターピクチャとして符号化するかを決定する。相関値の一例として、下記ピクチャ間相関指標Ｉが挙げられる。下記の式（５）に示すＩに基づいてランダムアクセス可能なインターピクチャとするか否かを決定する。

　ここで、ｗ_ｉ（ｉ＝０、１、…、５）は重み係数、Ｅ（Ｓ）はピクチャ内の画素値Ｓの平均、Ｖ（Ｓ）はピクチャ内の画素値Ｓの分散、Ｓ_ＴＸは符号化対象ピクチャ（符号化対象の上記イントラピクチャとして符号化するように割り当てられたピクチャ）の色成分Ｘの画素値、Ｓ_ＲＸはランダムアクセス時使用参照ピクチャの色成分Ｘの画素値をそれぞれ示している。上記指標Ｉが予め設定した閾値より小さい場合、ピクチャ間の相関が高いと判断して符号化対象ピクチャをランダムアクセス可能なインターピクチャとして符号化する。一方、上記指標Ｉが上記閾値以上の場合、ピクチャ間の相関が低いと判断して符号化対象ピクチャをランダムアクセス可能なイントラピクチャとして符号化する。上記閾値を適切な値に設定した上で、ピクチャ間相関指標に基づいてランダムアクセス可能なインターピクチャとするか否かを決定するようにすることで、ランダムアクセスポイントとなるピクチャ（上記イントラピクチャとして符号化するように割り当てられたピクチャ）の符号化方法（イントラ符号化かインター符号化か）を適応的に制御可能となり、ビットストリーム全体の符号化効率を改善することができる。また、上記の式（５）はＹＵＶ信号の例を示しているが、ＲＧＢ信号等の他の色信号であっても勿論良い。

　なお、本願発明はその発明の範囲内において、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。また、各実施の形態の画像符号化装置により生成された符号化ストリーム、または符号化ストリーム変換装置により生成された再符号化ストリームをサーバ等の記憶装置にファイルとして記憶させることも可能である。さらに、符号化ストリームあるいは再符号化ストリームを配信する装置を構成することも可能である。

　この発明に係る画像符号化装置、画像符号化方法及び符号化ストリーム変換装置は、画像を高効率で符号化する際、ランダムアクセス間隔を維持する必要性が高いものに適している。
　また、この発明に係る画像復号装置及び画像復号方法は、ランダムアクセス間隔が維持されながら、符号化効率が高められている場合でも、ランダムアクセスが可能なインターピクチャを含む符号化ビットストリームを正しく復号する必要性が高いものに適している。

　１　ブロック分割部、２　符号化制御部（符号化モード決定部）、３　切換スイッチ（予測画像生成部）、４　イントラ予測部（予測画像生成部）、５　動き補償予測部（予測画像生成部）、６　減算部（差分画像生成部）、７　変換・量子化部（画像圧縮部）、８　逆量子化・逆変換部（局所復号画像生成部）、９　加算部（局所復号画像生成部）、１０　イントラ予測用メモリ、１１　ループフィルタ部（フィルタリング処理部）、１２　動き補償予測フレームメモリ、１３　可変長符号化部（符号化部）、１４　スライス分割部（ブロック分割部）、３１　可変長復号部（復号部）、３２　逆量子化・逆変換部（差分画像生成部）、３３　切換スイッチ（予測画像生成部）、３４　イントラ予測部（予測画像生成部）、３５　動き補償部（予測画像生成部）、３６　加算部（復号画像生成部）、３７　イントラ予測用メモリ、３８　ループフィルタ部（フィルタリング処理部）、３９　動き補償予測フレームメモリ、４１　再符号化部、４２　再符号化制御部（再符号化設定部）、４３　復号部（画像復号部）、４４　入力映像信号制御部（再符号化設定部）、４５　ビットストリーム合成部（ビットストリーム合成部）。

Claims

　入力画像を符号化処理単位のブロックに分割するブロック分割部と、前記ブロック分割部により分割されるブロックに対する符号化モードを決定する符号化モード決定部と、前記符号化モード決定部により決定された符号化モードにしたがって、前記ブロック分割部により分割されたブロックに対する符号化処理を実施して、前記ブロックの圧縮データを出力する画像符号化装置であって、
　前記ブロック分割部により分割されたブロックの予測画像を生成する予測画像生成部と、前記ブロック分割部により分割されたブロックと前記予測画像生成部により生成された予測画像との差分画像を生成する差分画像生成部と、前記差分画像生成部により生成された差分画像を圧縮し、前記差分画像の圧縮データを出力する画像圧縮部と、前記画像圧縮部により圧縮された差分画像を伸張し、伸張後の差分画像と前記予測画像生成部により生成された予測画像を加算して局所復号画像を生成する局所復号画像生成部と、前記局所復号画像生成部により生成された局所復号画像に対するフィルタリング処理を実施するフィルタリング処理部と、前記画像圧縮部から出力された圧縮データ及び前記符号化モード決定部により決定された符号化モードを符号化して、前記圧縮データ及び前記符号化モードの符号化データが多重化されているビットストリームを生成する符号化部とを備え、
　前記予測画像生成部は、ランダムアクセス可能なインターピクチャを符号化する場合は、複数のランダムアクセス可能なイントラピクチャの中から参照ピクチャを設定し、その設定した参照ピクチャを予測処理に用いる動き補償予測を実施し、
　前記符号化部は、前記参照ピクチャの位置を示すピクチャ位置情報と前記ランダムアクセス可能なインターピクチャがランダムアクセス可能であることを示す識別情報を符号化し、前記ピクチャ位置情報及び前記識別情報の符号化データを前記ビットストリームに多重化することを特徴とする画像符号化装置。
　入力画像を符号化処理単位のブロックに分割するブロック分割部と、前記ブロック分割部により分割されるブロックに対する符号化モードを決定する符号化モード決定部と、前記符号化モード決定部により決定された符号化モードにしたがって、前記ブロック分割部により分割されたブロックに対する符号化処理を実施して、前記ブロックの圧縮データを出力する画像符号化装置であって、
　前記ブロック分割部により分割されたブロックの予測画像を生成する予測画像生成部と、前記ブロック分割部により分割されたブロックと前記予測画像生成部により生成された予測画像との差分画像を生成する差分画像生成部と、前記差分画像生成部により生成された差分画像を圧縮し、前記差分画像の圧縮データを出力する画像圧縮部と、前記画像圧縮部により圧縮された差分画像を伸張し、伸張後の差分画像と前記予測画像生成部により生成された予測画像を加算して局所復号画像を生成する局所復号画像生成部と、前記局所復号画像生成部により生成された局所復号画像に対するフィルタリング処理を実施するフィルタリング処理部と、前記画像圧縮部から出力された圧縮データ及び前記符号化モード決定部により決定された符号化モードを符号化して、前記圧縮データ及び前記符号化モードの符号化データが多重化されているビットストリームを生成する符号化部とを備え、
　前記予測画像生成部は、ランダムアクセス可能なインターピクチャを符号化する場合は、前記ランダムアクセス可能なインターピクチャの符号化順に対して、符号化順が先かつ符号化順が最も近いランダムアクセス可能なイントラピクチャを参照ピクチャに設定し、その設定した参照ピクチャを予測処理に用いる動き補償予測を実施し、
　前記符号化部は、前記ランダムアクセス可能なインターピクチャがランダムアクセス可能であることを示す識別情報を符号化し、前記識別情報の符号化データを前記ビットストリームに多重化することを特徴とする画像符号化装置。
　画像をブロック単位に圧縮符号化したビットストリームを入力して復号画像を生成する画像復号装置であって、
　前記ビットストリームから各々のブロックに係る圧縮データ及び符号化モードを復号する復号部と、前記復号部により復号された符号化モードにしたがって復号済み画素を参照し、各々のブロックに対する予測画像を生成する予測画像生成部と、前記復号部により復号された圧縮データを伸長して差分画像を生成する差分画像生成部と、前記差分画像生成部により生成された差分画像と前記予測画像生成部により生成された予測画像とを加算して復号画像を生成する復号画像生成部と、前記復号画像生成部により生成された復号画像に対するフィルタリング処理を実施するフィルタリング処理部とを備え、
　前記復号部は、どのインターピクチャがランダムアクセス可能なインターピクチャであるかを示す識別情報を復号するとともに、前記ランダムアクセス可能なインターピクチャの予測画像を生成する際に参照する参照ピクチャの位置を示すピクチャ位置情報を復号し、
　前記予測画像生成部は、前記識別情報によって識別されたランダムアクセス可能なインターピクチャを復号する場合は、複数のランダムアクセス可能なイントラピクチャの中から前記ピクチャ位置情報が示すピクチャを参照ピクチャに設定し、その設定した参照ピクチャを予測処理に用いる動き補償予測を実施することを特徴とする画像復号装置。
　画像をブロック単位に圧縮符号化したビットストリームを入力して復号画像を生成する画像復号装置であって、
　前記ビットストリームから各々のブロックに係る圧縮データ及び符号化モードを復号する復号部と、前記復号部により復号された符号化モードにしたがって復号済み画素を参照し、各々のブロックに対する予測画像を生成する予測画像生成部と、前記復号部により復号された圧縮データを伸長して差分画像を生成する差分画像生成部と、前記差分画像生成部により生成された差分画像と前記予測画像生成部により生成された予測画像とを加算して復号画像を生成する復号画像生成部と、前記復号画像生成部により生成された復号画像に対するフィルタリング処理を実施するフィルタリング処理部とを備え、
　前記復号部は、どのインターピクチャがランダムアクセス可能なインターピクチャであるかを示す識別情報を復号し、
　前記予測画像生成部は、前記識別情報によって識別されたランダムアクセス可能なインターピクチャを復号する場合は、前記ランダムアクセス可能なインターピクチャの復号順に対して、復号順が先かつ復号順が最も近いランダムアクセス可能なイントラピクチャを参照ピクチャに設定し、その設定した参照ピクチャを予測処理に用いる動き補償予測を実施することを特徴とする画像復号装置。
　画像をブロック単位に圧縮符号化したビットストリームを入力して再符号化したビットストリームを出力する符号化ストリーム変換装置であって、
　前記ビットストリームを復号して復号画像を生成するとともに、ランダムアクセス可能なイントラピクチャを特定する画像復号部と、前記特定したランダムアクセス可能なイントラピクチャの中からランダムアクセス可能なインターピクチャに再符号化する再符号化対象イントラピクチャを設定する再符号化設定部と、前記再符号化対象イントラピクチャを再符号化する再符号化部と、前記ビットストリームと前記再符号化部により再符号化された再符号化対象イントラピクチャとを合成して再符号化ビットストリームを出力するビットストリーム合成部とを備え、
　前記再符号化部は、前記ランダムアクセス可能なインターピクチャに再符号化されたピクチャがランダムアクセス可能であることを示す識別情報を符号化し、前記識別情報の符号化データを前記再符号化ビットストリームに多重化することを特徴とする符号化ストリーム変換装置。
　ブロック分割部が、入力画像を符号化処理単位のブロックに分割し、符号化モード決定部が、前記ブロック分割部により分割されるブロックに対する符号化モードを決定すると、前記符号化モードにしたがって、前記ブロック分割部により分割されたブロックに対する符号化処理を実施して、前記ブロックの圧縮データを出力する画像符号化方法であって、
　予測画像生成部が、前記ブロック分割部により分割されたブロックの予測画像を生成し、差分画像生成部が、前記ブロック分割部により分割されたブロックと前記予測画像生成部により生成された予測画像との差分画像を生成し、画像圧縮部が、前記差分画像生成部により生成された差分画像を圧縮して、前記差分画像の圧縮データを出力し、局所復号画像生成部が、前記画像圧縮部により圧縮された差分画像を伸張し、伸張後の差分画像と前記予測画像生成部により生成された予測画像を加算して局所復号画像を生成し、フィルタリング処理部が、前記局所復号画像生成部により生成された局所復号画像に対するフィルタリング処理を実施し、符号化部が、前記画像圧縮部から出力された圧縮データ及び前記符号化モード決定部により決定された符号化モードを符号化して、前記圧縮データ及び前記符号化モードの符号化データが多重化されているビットストリームを生成するものであり、
　前記予測画像生成部が、ランダムアクセス可能なインターピクチャを符号化する場合は、前記ランダムアクセス可能なインターピクチャの符号化順に対して、符号化順が先かつ符号化順が最も近いランダムアクセス可能なイントラピクチャを参照ピクチャに設定し、その設定した参照ピクチャを予測処理に用いる動き補償予測を実施し、
　前記符号化部が、前記ランダムアクセス可能なインターピクチャがランダムアクセス可能であることを示す識別情報を符号化し、前記識別情報の符号化データを前記ビットストリームに多重化することを特徴とする画像符号化方法。
　画像をブロック単位に圧縮符号化したビットストリームを入力して復号画像を生成する画像復号方法であって、
　復号部が、前記ビットストリームから各々のブロックに係る圧縮データ及び符号化モードを復号し、予測画像生成部が、前記復号部により復号された符号化モードにしたがって復号済み画素を参照して、各々のブロックに対する予測画像を生成し、差分画像生成部が、前記復号部により復号された圧縮データを伸長して差分画像を生成し、復号画像生成部が、前記差分画像生成部により生成された差分画像と前記予測画像生成部により生成された予測画像とを加算して復号画像を生成し、フィルタリング処理部が、前記復号画像生成部により生成された復号画像に対するフィルタリング処理を実施するものであり、
　前記復号部が、どのインターピクチャがランダムアクセス可能なインターピクチャであるかを示す識別情報を復号し、
　前記予測画像生成部が、前記識別情報によって識別されたランダムアクセス可能なインターピクチャを復号する場合は、前記ランダムアクセス可能なインターピクチャの復号順に対して、復号順が先かつ復号順が最も近いランダムアクセス可能なイントラピクチャを参照ピクチャに設定し、その設定した参照ピクチャを予測処理に用いる動き補償予測を実施することを特徴とする画像復号方法。