JP6281521B2

JP6281521B2 - 画像処理装置および方法、記録媒体、並びに、プログラム

Info

Publication number: JP6281521B2
Application number: JP2015077536A
Authority: JP
Inventors: 佐藤　数史; 数史佐藤
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2012-09-28
Filing date: 2015-04-06
Publication date: 2018-02-21
Anticipated expiration: 2033-09-19
Also published as: BR112015000422A2; KR101991987B1; MY168805A; RU2581014C1; RU2016109053A3; CA2871828C; MX2014014669A; US20150163505A1; JP2018093512A; RU2706237C2; EP2840795A1; US20180249170A1; MX347217B; JP6525073B2; MY191172A; US10848778B2; KR102037644B1; RU2016109053A; WO2014050677A1; JP5867791B2

Description

本開示は画像処理装置および方法、記録媒体、並びに、プログラムに関し、特に、符号化効率の低減を抑制することができるようにした画像処理装置および方法、記録媒体、並びに、プログラムに関する。

近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮する符号化方式を採用して画像を圧縮符号する装置が普及しつつある。この符号化方式には、例えば、MPEG（Moving Picture Experts Group）などがある。

特に、MPEG2(ISO/IEC 13818-2)は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準である。例えば、MPEG2は、プロフェッショナル用途及びコンシューマ用途の広範なアプリケーションに現在広く用いられている。MPEG2圧縮方式を用いることにより、例えば720×480画素を持つ標準解像度の飛び越し走査画像であれば4乃至8Mbpsの符号量（ビットレート）が割り当てられる。また、MPEG2圧縮方式を用いることにより、例えば1920×1088画素を持つ高解像度の飛び越し走査画像であれば18乃至22 Mbpsの符号量（ビットレート）が割り当てられる。これにより、高い圧縮率と良好な画質の実現が可能である。

MPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量（ビットレート）、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。画像符号化方式に関しては、1998年12月にISO/IEC 14496-2としてその規格が国際標準に承認された。

更に、近年、当初テレビ会議用の画像符号化を目的として、H.26L （ITU-T（International Telecommunication Union Telecommunication Standardization Sector） Q6/16 VCEG（Video Coding Expert Group））という標準の規格化が進められた。H.26LはMPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号化により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。また、現在、MPEG4の活動の一環として、このH.26Lをベースに、H.26Lではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJoint Model of Enhanced-Compression Video Codingとして行われた。

標準化のスケジュールとしては、２００３年３月にはH.264及びMPEG-4 Part10 （Advanced Video Coding、以下AVCと記す）という名の元に国際標準となった。

さらに、このH．264/AVCの拡張として、RGBや4:2:2、4:4:4といった、業務用に必要な符号化ツールや、MPEG-2で規定されていた8x8DCTや量子化マトリクスをも含んだFRExt (Fidelity Range Extension) の標準化が２００５年２月に完了した。これにより、H．264/AVCを用いて、映画に含まれるフィルムノイズをも良好に表現することが可能な符号化方式となって、Blu-Ray Disc（商標）等の幅広いアプリケーションに用いられる運びとなった。

しかしながら、昨今、ハイビジョン画像の4倍の、4000×2000画素程度の画像を圧縮したい、あるいは、インターネットのような、限られた伝送容量の環境において、ハイビジョン画像を配信したいといった、更なる高圧縮率符号化に対するニーズが高まっている。このため、先述の、ITU-T傘下のVCEGにおいて、符号化効率の改善に関する検討が継続され行なわれている。

そこで、現在、AVCより更なる符号化効率の向上を目的として、ITU-Tと、ISO/IECの共同の標準化団体であるJCTVC（Joint Collaboration Team - Video Coding）により、HEVC（High Efficiency Video Coding）と呼ばれる符号化方式の標準化が進められている。HEVC規格については、2012年2月に最初のドラフト版仕様であるCommittee draftが発行されている（例えば、非特許文献１参照）。

ところで、これまでの、MPEG-2やAVCといった画像符号化方式は、画像を複数のレイヤに階層化して符号化するスケーラビリティ（scalability）機能を有していた。

すなわち、例えば携帯電話のような、処理能力の低い端末に対しては、ベースレイヤ（base layer）のみの画像圧縮情報を伝送し、空間時間解像度の低い、或いは、画質の良くない動画像を再生し、テレビやパーソナルコンピュータのような、処理能力の高い端末に対しては、ベースレイヤ（base layer）に加えて、エンハンスメントレイヤ（enhancement layer）の画像圧縮情報を伝送し、空間時間解像度の高い、或いは、画質の高い動画像を再生するといったように、トランスコード処理を行うことなく、端末やネットワークの能力に応じた画像圧縮情報を、サーバから送信することが可能となる。

ところで、スケーラブル符号化を行う際、全てのピクチャにおいて、階層間での予測処理を行うことは、演算量の増大に繋がる。

そこで、ピクチャ（Picture）毎に階層間の予測処理のオン／オフ（on/off）を、NALユニット（NAL_Unit）において指定することが提案された（例えば、非特許文献２参照）。

Benjamin Bross, Woo-Jin Han, Jens-Rainer Ohm, Gary J. Sullivan, Thomas Wiegand, "High efficiency video coding (HEVC) text specification draft 6", JCTVC-H1003 ver21, Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG117th Meeting: Geneva, CH, 21-30 November, 2011 Jizheng Xu, "AHG10: Selective inter-layer prediction signalling for HEVC scalable extension", JCTVC-J0239, Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 1110th Meeting: Stockholm, SE, 11-20 July 2012

しかしながら、従来の方法では、このような、階層間の予測処理のオン／オフ（on/off）を制御する情報は、ピクチャ毎に生成され、伝送された。そのため、この情報の伝送により符号量が増大し、符号化効率が低減する恐れがあった。

本開示は、このような状況に鑑みてなされたものであり、符号化効率の低減を抑制することができるようにするものである。

本技術の一側面は、複数のレイヤを有する画像の前記複数のレイヤ間の予測であるレイヤ間予測を行う最上位のサブレイヤを決定するレイヤ間予測制御情報に基づいて、最下位のサブレイヤから前記レイヤ間予測制御情報により決定される前記最上位のサブレイヤまで前記レイヤ間予測を行うようにして、前記画像を符号化する符号化部を備える画像処理装置である。

前記符号化部は、カレントレイヤのカレントピクチャが、前記レイヤ間予測制御情報により前記レイヤ間予測を行うように決定されるサブレイヤに属する場合、前記カレントピクチャの画像を、前記レイヤ間予測を用いて符号化することができる。

前記レイヤ間予測制御情報は、レイヤ毎に設定されるようにすることができる。

前記レイヤ間予測制御情報は、全レイヤ共通のパラメータとして設定されるようにすることができる。

前記符号化部により符号化された前記画像の符号化データと、前記レイヤ間予測制御情報とを伝送する伝送部をさらに備えることができる。

前記符号化部は、前記レイヤ間予測制御情報として設定された、前記複数のレイヤ間のピクセル予測であるレイヤ間ピクセル予測を行うかを制御するレイヤ間ピクセル予測制御情報に基づいて前記レイヤ間ピクセル予測を行い、前記レイヤ間予測制御情報として、前記レイヤ間ピクセル予測制御情報とは独立に設定された、前記複数のレイヤ間のシンタクス予測であるレイヤ間シンタクス予測を行うかを制御するレイヤ間シンタクス予測制御情報に基づいて前記レイヤ間シンタクス予測を行い、前記伝送部は、前記レイヤ間予測制御情報として、互いに独立に設定された前記レイヤ間ピクセル予測制御情報および前記レイヤ間シンタクス予測制御情報を伝送することができる。

前記レイヤ間ピクセル予測制御情報は、前記レイヤ間ピクセル予測を行うかを、前記サブレイヤを用いて制御し、前記符号化部は、前記レイヤ間ピクセル予測制御情報により決定されるサブレイヤのみ前記レイヤ間ピクセル予測を行い、前記レイヤ間シンタクス予測制御情報は、前記レイヤ間シンタクス予測を行うかを、ピクチャ若しくはスライス毎に制御し、前記符号化部は、前記レイヤ間シンタクス予測制御情報により決定されるピクチャ若しくはスライスのみ前記レイヤ間シンタクス予測を行うことができる。

前記伝送部は、前記レイヤ間ピクセル予測制御情報を、ナルユニット（nal_unit）、ビデオパラメータセット（VPS（Video Parameter Set））、若しくは、拡張ビデオパラメータセット（vps_extension）として伝送することができる。

前記伝送部は、前記レイヤ間シンタクス予測制御情報を、ナルユニット（nal_unit）、ピクチャパラメータセット（PPS（Picture Parameter Set））、若しくは、スライスヘッダ（SliceHeader）として伝送することができる。

本技術の一側面は、また、複数のレイヤを有する画像の前記複数のレイヤ間の予測であるレイヤ間予測を行う最上位のサブレイヤを決定するレイヤ間予測制御情報に基づいて、最下位のサブレイヤから前記レイヤ間予測制御情報により決定される前記最上位のサブレイヤまで前記レイヤ間予測を行うようにして、前記画像を符号化する画像処理方法である。

本技術の一側面は、さらに、コンピュータを、複数のレイヤを有する画像の前記複数のレイヤ間の予測であるレイヤ間予測を行う最上位のサブレイヤを決定するレイヤ間予測制御情報に基づいて、最下位のサブレイヤから前記レイヤ間予測制御情報により決定される前記最上位のサブレイヤまで前記レイヤ間予測を行うようにして、前記画像を符号化する符号化部として機能させるプログラムを記録したコンピュータが読み取り可能な記録媒体である。

本技術の一側面は、さらに、コンピュータを、複数のレイヤを有する画像の前記複数のレイヤ間の予測であるレイヤ間予測を行う最上位のサブレイヤを決定するレイヤ間予測制御情報に基づいて、最下位のサブレイヤから前記レイヤ間予測制御情報により決定される前記最上位のサブレイヤまで前記レイヤ間予測を行うようにして、前記画像を符号化する符号化部として機能させるプログラムである。

本技術の一側面においては、複数のレイヤを有する画像の複数のレイヤ間の予測であるレイヤ間予測を行う最上位のサブレイヤを決定するレイヤ間予測制御情報に基づいて、最下位のサブレイヤからレイヤ間予測制御情報により決定される最上位のサブレイヤまでレイヤ間予測を行うようにして、画像が符号化される。

本開示によれば、画像を符号化・復号することができる。特に、符号化効率の低減を抑制することができる。

コーディングユニットの構成例を説明する図である。スペーシャルなスケーラブル符号化の例を説明する図である。テンポラルなスケーラブル符号化の例を説明する図である。信号雑音比のスケーラブル符号化の例を説明する図である。ビデオパラメータセットのシンタクスの例を説明する図である。レイヤ間の予測の例を説明する図である。レイヤ間の予測の、サブレイヤを用いた制御の例を説明する図である。ビデオパラメータセットのシンタクスの例を説明する図である。スケーラブル符号化装置の主な構成例を示すブロック図である。ベースレイヤ画像符号化部の主な構成例を示すブロック図である。エンハンスメントレイヤ画像符号化部の主な構成例を示すブロック図である。共通情報生成部とレイヤ間予測制御部の主な構成例を示すブロック図である。符号化処理の流れの例を説明するフローチャートである。共通情報生成処理の流れの例を説明するフローチャートである。ベースレイヤ符号化処理の流れの例を説明するフローチャートである。レイヤ間予測制御処理の流れの例を説明するフローチャートである。エンハンスメントレイヤ符号化処理の流れの例を説明するフローチャートである。動き予測・補償処理の流れの例を説明するフローチャートである。スケーラブル復号装置の主な構成例を示すブロック図である。ベースレイヤ画像復号部の主な構成例を示すブロック図である。エンハンスメントレイヤ画像復号部の主な構成例を示すブロック図である。共通情報取得部とレイヤ間予測制御部の主な構成例を示すブロック図である。復号処理の流れの例を説明するフローチャートである。共通情報取得処理の流れの例を説明するフローチャートである。ベースレイヤ復号処理の流れの例を説明するフローチャートである。レイヤ間予測制御処理の流れの例を説明するフローチャートである。エンハンスメントレイヤ復号処理の流れの例を説明するフローチャートである。予測処理の流れの例を説明するフローチャートである。ビデオパラメータセットのシンタクスの例を説明する図である。サブレイヤの構成例を説明する図である。サブレイヤの他の構成例を説明する図である。共通情報生成部とレイヤ間予測制御部の主な構成例を示すブロック図である。共通情報生成処理の流れの例を説明するフローチャートである。共通情報取得部とレイヤ間予測制御部の主な構成例を示すブロック図である。共通情報取得処理の流れの例を説明するフローチャートである。ビデオパラメータセットのシンタクスの例を説明する図である。共通情報生成部とレイヤ間予測制御部の主な構成例を示すブロック図である。共通情報生成処理の流れの例を説明するフローチャートである。レイヤ間予測制御処理の流れの例を説明するフローチャートである。共通情報取得部とレイヤ間予測制御部の主な構成例を示すブロック図である。共通情報取得処理の流れの例を説明するフローチャートである。レイヤ間予測制御処理の流れの例を説明するフローチャートである。レイヤ間ピクセル予測とレイヤ間シンタクス予測の制御の例を説明する図である。共通情報生成部とレイヤ間予測制御部の主な構成例を示すブロック図である。共通情報生成処理の流れの例を説明するフローチャートである。ベースレイヤ符号化処理の流れの例を説明するフローチャートである。レイヤ間予測制御処理の流れの例を説明するフローチャートである。エンハンスメントレイヤ符号化処理の流れの例を説明するフローチャートである。動き予測・補償処理の流れの例を説明するフローチャートである。イントラ予測処理の流れの例を説明するフローチャートである。共通情報取得部とレイヤ間予測制御部の主な構成例を示すブロック図である。共通情報取得処理の流れの例を説明するフローチャートである。ベースレイヤ復号処理の流れの例を説明するフローチャートである。レイヤ間予測制御処理の流れの例を説明するフローチャートである。予測処理の流れの例を説明するフローチャートである。予測処理の流れの例を説明する、図５５に続くフローチャートである。シーケンスパラメータセットの例を示す図である。シーケンスパラメータセットの例を示す図５７に続く図である。スライスヘッダの例を示す図である。スライスヘッダの例を示す図５９に続く図である。スライスヘッダの例を示す図６０に続く図である。画像符号化装置の主な構成例を示すブロック図である。ベースレイヤ画像符号化部の主な構成例を示すブロック図である。エンハンスメントレイヤ画像符号化部の主な構成例を示すブロック図である。画像符号化処理の流れの例を説明するフローチャートである。ベースレイヤ符号化処理の流れの例を説明するフローチャートである。シーケンスパラメータセット生成処理の流れの例を説明するフローチャートである。エンハンスメントレイヤ符号化処理の流れの例を説明するフローチャートである。イントラ予測処理の流れの例を説明するフローチャートである。インター予測処理の流れの例を説明するフローチャートである。画像復号装置の主な構成例を示すブロック図である。ベースレイヤ画像復号部の主な構成例を示すブロック図である。エンハンスメントレイヤ画像復号部の主な構成例を示すブロック図である。画像復号処理の流れの例を説明するフローチャートである。ベースレイヤ復号処理の流れの例を説明するフローチャートである。シーケンスパラメータセット解読処理の流れの例を説明するフローチャートである。エンハンスメントレイヤ復号処理の流れの例を説明するフローチャートである。予測処理の流れの例を説明するフローチャートである。レイヤ間予測制御処理の流れの例を説明するフローチャートである。レイヤ間予測制御処理の流れの例を説明するフローチャートである。階層画像符号化方式の例を示す図である。多視点画像符号化方式の例を示す図である。コンピュータの主な構成例を示すブロック図である。テレビジョン装置の概略的な構成の一例を示すブロック図である。携帯電話機の概略的な構成の一例を示すブロック図である。記録再生装置の概略的な構成の一例を示すブロック図である。撮像装置の概略的な構成の一例を示すブロック図である。スケーラブル符号化利用の一例を示すブロック図である。スケーラブル符号化利用の他の例を示すブロック図である。スケーラブル符号化利用のさらに他の例を示すブロック図である。ビデオセットの概略的な構成の一例を示すブロック図である。ビデオプロセッサの概略的な構成の一例を示すブロック図である。ビデオプロセッサの概略的な構成の他の例を示すブロック図である。コンテンツ再生システムの構成を示した説明図である。コンテンツ再生システムにおけるデータの流れを示した説明図である。 MPDの具体例を示した説明図である。コンテンツ再生システムのコンテンツサーバの構成を示した機能ブロック図である。コンテンツ再生システムのコンテンツ再生装置の構成を示した機能ブロック図である。コンテンツ再生システムのコンテンツサーバの構成を示した機能ブロック図である。無線通信システムの各装置による通信処理例を示すシーケンスチャートである。無線通信システムの各装置による通信処理例を示すシーケンスチャートである。無線通信システムの各装置による通信処理において送受信されるフレームフォーマット（frame format）の構成例を模式的に示す図である。無線通信システムの各装置による通信処理例を示すシーケンスチャートである。

以下、本開示を実施するための形態（以下実施の形態とする）について説明する。なお、説明は以下の順序で行う。
０．概要
１．第１の実施の形態（画像符号化装置）
２．第２の実施の形態（画像復号装置）
３．第３の実施の形態（画像符号化装置）
４．第４の実施の形態（画像復号装置）
５．第５の実施の形態（画像符号化装置）
６．第６の実施の形態（画像復号装置）
７．概要２
８．第７の実施の形態（画像符号化装置）
９．第８の実施の形態（画像復号装置）
１０．概要３
１１．第９の実施の形態（画像符号化装置）
１２．第１０の実施の形態（画像復号装置）
１３．第１１の実施の形態（レイヤ間シンタクス予測制御）
１４．その他
１５．第１２の実施の形態（コンピュータ）
１６．応用例
１７．スケーラブル符号化の応用例
１８．第１３の実施の形態（セット・ユニット・モジュール・プロセッサ）
１９．第１４の実施の形態（MPEG-DASHのコンテンツ再生システムの応用例）
２０．第１５の実施の形態（Wi-Fi規格の無線通信システムの応用例）

＜０．概要＞
＜符号化方式＞
以下においては、HEVC（High Efficiency Video Coding）方式の画像符号化・復号に適用する場合を例に、本技術を説明する。

＜コーディングユニット＞
AVC（Advanced Video Coding）方式においては、マクロブロックとサブマクロブロックによる階層構造が規定されている。しかしながら、１６画素×１６画素のマクロブロックでは、次世代符号化方式の対象となるような、UHD（Ultra High Definition；４０００画素×２０００画素）といった大きな画枠に対して最適ではない。

これに対して、HEVC方式においては、図１に示されるように、コーディングユニット（CU（Coding Unit））が規定されている。

CUは、Coding Tree Block（CTB）とも呼ばれ、AVC方式におけるマクロブロックと同様の役割を果たす、ピクチャ単位の画像の部分領域である。後者は、１６×１６画素の大きさに固定されているのに対し、前者の大きさは固定されておらず、それぞれのシーケンスにおいて、画像圧縮情報中において指定されることになる。

例えば、出力となる符号化データに含まれるシーケンスパラメータセット（SPS（Sequence Parameter Set））において、CUの最大サイズ（LCU（Largest Coding Unit））と最小サイズ（SCU（Smallest Coding Unit））が規定される。

それぞれのLCU内においては、SCUのサイズを下回らない範囲で、split-flag=1とすることにより、より小さなサイズのCUに分割することができる。図１の例では、LCUの大きさが１２８であり、最大階層深度が５となる。２Ｎ×２Ｎの大きさのCUは、split_flagの値が「１」である時、１つ下の階層となる、Ｎ×Ｎの大きさのCUに分割される。

更に、CUは、イントラ若しくはインター予測の処理単位となる領域（ピクチャ単位の画像の部分領域）であるプレディクションユニット（Prediction Unit（PU））に分割され、また、直交変換の処理単位となる領域（ピクチャ単位の画像の部分領域）である、トランスフォームユニット（Transform Unit（TU））に分割される。現在、HEVC方式においては、４×４及び８×８に加え、１６×１６及び３２×３２直交変換を用いることが可能である。

以上のHEVC方式のように、CUを定義し、そのCUを単位として各種処理を行うような符号化方式の場合、AVC方式におけるマクロブロックはLCUに相当し、ブロック（サブブロック）はCUに相当すると考えることができる。また、AVC方式における動き補償ブロックは、PUに相当すると考えることができる。ただし、CUは、階層構造を有するので、その最上位階層のLCUのサイズは、例えば128×128画素のように、AVC方式のマクロブロックより大きく設定されることが一般的である。

よって、以下、LCUは、AVC方式におけるマクロブロックをも含むものとし、CUは、AVC方式におけるブロック（サブブロック）をも含むものとする。つまり、以下の説明に用いる「ブロック」は、ピクチャ内の任意の部分領域を示し、その大きさ、形状、および特性等は限定されない。つまり、「ブロック」には、例えば、TU、PU、SCU、CU、LCU、サブブロック、マクロブロック、またはスライス等任意の領域（処理単位）が含まれる。もちろん、これら以外の部分領域（処理単位）も含まれる。サイズや処理単位等を限定する必要がある場合は、適宜説明する。

また、本明細書において、CTU（Coding Tree Unit）は、LCU(最大数のCU)のCTB（Coding Tree Block）と、そのLCUベース（レベル）で処理するときのパラメータを含む単位であるとする。また、CTUを構成するCU（Coding Unit）は、CB(Coding Block)と、そのCUベース（レベル）で処理するときのパラメータを含む単位であるとする。

＜モード選択＞
ところで、AVCそしてHEVC符号化方式において、より高い符号化効率を達成するには、適切な予測モードの選択が重要である。

かかる選択方式の例として、JM (Joint Model) と呼ばれるH.264/MPEG-4 AVCの参照ソフトウエア (http://iphome.hhi.de/suehring/tml/index.htm において公開されている) に実装されている方法を挙げることが出来る。

JMにおいては、以下に述べる、High Complexity Modeと、Low Complexity Modeの2通りのモード判定方法を選択することが可能である。どちらも、それぞれの予測モードModeに関するコスト関数値を算出し、これを最小にする予測モードを当該ブロック乃至マクロブロックに対する最適モードとして選択する。

High Complexity Modeにおけるコスト関数は、以下の式（１）のように示される。

ここで、Ωは、当該ブロック乃至マクロブロックを符号化するための候補モードの全体集合、Dは、当該予測モードで符号化した場合の、復号画像と入力画像の差分エネルギーである。λは、量子化パラメータの関数として与えられるLagrange未定乗数である。Ｒは、直交変換係数を含んだ、当該モードで符号化した場合の総符号量である。

つまり、High Complexity Modeでの符号化を行うには、上記パラメータＤ及びＲを算出するため、全ての候補モードにより、一度、仮エンコード処理を行う必要があり、より高い演算量を要する。

Low Complexity Modeにおけるコスト関数は、以下の式（２）のように示される。

ここで、Dは、High Complexity Modeの場合と異なり、予測画像と入力画像の差分エネルギーとなる。QP2Quant(QP)は、量子化パラメータQPの関数として与えられ、HeaderBitは、直交変換係数を含まない、動きベクトルや、モードといった、Headerに属する情報に関する符号量である。

すなわち、Low Complexity Modeにおいては、それぞれの候補モードに関して、予測処理を行う必要があるが、復号画像までは必要ないため、符号化処理まで行う必要はない。このため、High Complexity Modeより低い演算量での実現が可能である。

＜階層符号化＞
ところで、これまでの、MPEG2、AVCといった画像符号化方式は、図２乃至図４に示されるような、スケーラビリティ（scalability）機能を有していた。スケーラブル符号化（階層符号化）とは、画像を複数レイヤ化（階層化）し、レイヤ毎に符号化する方式である。

画像の階層化においては、所定のパラメータを基準として１の画像が複数の画像（レイヤ）に分割される。基本的に各レイヤは、冗長性が低減されるように、差分データにより構成される。例えば、１の画像をベースレイヤとエンハンスメントレイヤに２階層化した場合、ベースレイヤのデータのみで元の画像よりも低品質な画像が得られ、ベースレイヤのデータとエンハンスメントレイヤのデータを合成することで、元の画像（すなわち高品質な画像）が得られる。

このように画像を階層化することにより、状況に応じて多様な品質の画像を容易に得ることができる。例えば携帯電話のような、処理能力の低い端末に対しては、ベースレイヤ（base layer）のみの画像圧縮情報を伝送し、空間時間解像度の低い、或いは、画質の良くない動画像を再生し、テレビやパーソナルコンピュータのような、処理能力の高い端末に対しては、ベースレイヤ（base layer）に加えて、エンハンスメントレイヤ（enhancement layer）の画像圧縮情報を伝送し、空間時間解像度の高い、或いは、画質の高い動画像を再生するといったように、トランスコード処理を行うことなく、端末やネットワークの能力に応じた画像圧縮情報を、サーバから送信することが可能となる。

このようなスケーラビリティ性を持たせるパラメータとして、例えば、図２に示されるような、空間解像度がある（spatial scalability）。このスペーシャルスケーラビリティ（spatial scalability）の場合、レイヤ毎に解像度が異なる。つまり、図２に示されるように、各ピクチャが、元の画像より空間的に低解像度のベースレイヤと、ベースレイヤの画像と合成することにより元の画像（元の空間解像度）が得られるエンハンスメントレイヤの２階層に階層化される。もちろん、この階層数は一例であり、任意の階層数に階層化することができる。

また、このようなスケーラビリティ性を持たせるパラメータとして、他には、例えば、図３に示されるような、時間解像度がある（temporal scalability）。このテンポラルスケーラビリティ（temporal scalability）の場合、レイヤ毎にフレームレートが異なる。つまり、この場合、図３に示されるように、互いに異なるフレームレートのレイヤに階層化されており、低フレームレートのレイヤに、高フレームレートのレイヤを加えることで、より高フレームレートの動画像を得ることができ、全てのレイヤを加えることで、元の動画像（元のフレームレート）を得ることができる。この階層数は一例であり、任意の階層数に階層化することができる。

また、このようなスケーラビリティ性を持たせるパラメータとして、他には、例えば、信号雑音比（SNR（Signal to Noise ratio））がある（SNR scalability）。このSNRスケーラビリティ（SNR scalability）の場合、レイヤ毎にSN比が異なる。つまり、図４に示されるように、各ピクチャが、元の画像よりSNRの低いベースレイヤと、ベースレイヤの画像と合成することにより元の画像（元のSNR）が得られるエンハンスメントレイヤの２階層に階層化される。すなわち、ベースレイヤ（base layer）画像圧縮情報においては、低PSNRの画像に関する情報が伝送されており、これに、エンハンスメントレイヤ（enhancement layer）画像圧縮情報を加えることで、高PSNR画像を再構築することが可能である。もちろん、この階層数は一例であり、任意の階層数に階層化することができる。

スケーラビリティ性を持たせるパラメータは、上述した例以外であっても、もちろんよい。例えば、ベースレイヤ（base layer）が8ビット（bit）画像よりなり、これにエンハンスメントレイヤ（enhancement layer）を加えることにより、10ビット（bit）画像が得られるビット深度スケーラビリティ（bit-depth scalability）がある。

また、ベースレイヤ（base layer）が4:2:0フォーマットのコンポーネント画像よりなり、これにエンハンスメントレイヤ（enhancement layer）を加えることにより、4:2:2フォーマットのコンポーネント画像が得られるクロマスケーラビリティ（chroma scalability）がある。

＜ビデオパラメータセット＞
ところで、HEVCにおいては、シーケンスパラメータセット（SPS（Sequence Parameter Set））、ピクチャパラメータセット（PPS（Picture Parameter Set））に加え、図５に示されるような、ビデオパラメータセット（VPS（Video Parameter Set）が規定されている。

＜レイヤ間予測の制御＞
ところで、スケーラブル符号化を行う際、全てのピクチャにおいて、階層間での予測処理を行うことは、演算量の増大に繋がる。

そこで、非特許文献２においては、図６に示されるように、ピクチャ（Picture）毎に階層間の予測処理のオン／オフ（on/off）を、NALユニット（NAL_Unit）において指定することが提案された。

しかしながら、この方法の場合、階層間の予測処理のオン／オフ（on/off）を制御する情報は、ピクチャ毎に生成されて伝送されるため、この情報の伝送により符号量が増大し、符号化効率が低減する恐れがあった。

＜レイヤ構造＞
そこで、より効率よく階層間の予測処理を制御する方法を考える。まず、スケーラブル符号化（階層符号化）においては、図２乃至図４に示されるように、画像データが複数レイヤに階層化される。以下においては説明の便宜上、このレイヤを主レイヤと称する。

各主レイヤのピクチャ群は、その主レイヤにおいてシーケンスを構成することになる。そのシーケンスにおいてピクチャは、単一主レイヤの動画像データと同様に、図７に示されるように、さらに階層構造（GOP（Group Of Picture）構造）を形成する。以下においては説明の便宜上、この１主レイヤ内のレイヤをサブレイヤ（sublayer）と称する。

図７の例の場合、主レイヤは、ベースレイヤ（BaseLayer）とエンハンスメントレイヤ（EnhLayer）の２つのレイヤにより構成される。ベースレイヤは、他の主レイヤに依存せず、自身の主レイヤのみで画像が形成されるレイヤである。ベースレイヤのデータは、他の主レイヤを参照せずに符号化・復号される。エンハンスメントレイヤは、ベースレイヤのデータと合成されることにより画像が得られる主レイヤである。エンハンスメントレイヤのデータは、対応するベースレイヤとの間の予測処理（主レイヤ間の予測処理（レイヤ間予測とも称する））が利用可能である。

スケーラブル符号化により階層化された符号化データの主レイヤ数は任意である。以下においては、各主レイヤがベースレイヤか若しくはエンハンスメントレイヤに設定され、各エンハンスメントレイヤには、いずれかのベースレイヤが参照先として設定されるものとする。

また、図７の例の場合、ベースレイヤおよびエンハンスメントレイヤは、それぞれ、サブレイヤ０（Sublayer0）、サブレイヤ１（Sublayer1）、サブレイヤ２（Sublayer2）の３つのサブレイヤにより構成されるGOP構造を有する。図７に示される四角は、ピクチャを示しており、その中の文字は、そのピクチャのタイプを示している。例えば、「Ｉ」と記載された四角は、Ｉピクチャを示し、「Ｂ」と記載された四角は、Ｂピクチャを示す。また、各四角間の点線は、依存関係（参照関係）を示す。個の点線で示されるように、上位のサブレイヤのピクチャは、下位のサブレイヤのピクチャに依存する。つまり、サブレイヤ２（Sublayer2）のピクチャは、サブレイヤ１のピクチャやサブレイヤ０のピクチャを参照する。また、サブレイヤ１のピクチャは、サブレイヤ０のピクチャを参照する。サブレイヤ０のピクチャは、サブレイヤ０のピクチャを適宜参照する。

なお、サブレイヤの階層数（サブレイヤ数）は任意である。また、GOP構造も任意であり、図７の例に限定されない。

＜サブレイヤを用いたレイヤ間予測の制御＞
このような構造の画像データに対して、レイヤ間予測の制御を、サブレイヤを用いて行うようにする。つまり、各ピクチャにおいて複数主レイヤ間の予測を行うか否かを、サブレイヤによって制御するレイヤ間予測制御情報を生成し、伝送するようにする。そして、符号化側においては、符号化の際に、このレイヤ間予測制御情報において指定されるサブレイヤのみレイヤ間予測を利用するようにする。復号側においては、復号の際に、このレイヤ間予測制御情報において指定されるサブレイヤのみレイヤ間予測を利用するようにする。

つまり、レイヤ間予測制御情報により指定されるサブレイヤに属するピクチャのみがレイヤ間予測を行うことができる。つまり、サブレイヤを指定するだけで、主レイヤ内の全てのピクチャに対するレイヤ間予測の制御を行うことができる。したがって、各ピクチャを個別に制御する必要がなく、主レイヤ毎に制御すれば良いので、その制御に必要な情報量を大幅に低減させることができる。したがって、レイヤ間予測制御による符号化効率の低減を抑制することができる。

このレイヤ間予測制御情報として、レイヤ間予測を許可するサブレイヤを指定する情報を用いても良いが、レイヤ間予測を許可する最上位サブレイヤを指定する情報を用いても良い。

例えば、図７の例に示されるように、上位のサブレイヤ２のピクチャでは、当該ピクチャと参照ピクチャの時間軸上の距離が近い。そのため、インター予測処理による効率が高く、レイヤ間予測による符号化効率の向上は大きくはない。

これに対して、例えばサブレイヤ１やサブレイヤ０におけるピクチャでは、当該ピクチャと参照ピクチャの時間軸上の距離が遠く、単一階層による符号化処理では、イントラ予測が行われるCUがより多く選択される。つまり、階層間での予測による符号化効率の向上は大きい。

つまり、下位のサブレイヤほど、レイヤ間予測を適用することにより符号化効率をより向上させることができる。そのため、レイヤ間予測を一部のサブレイヤで行う場合、最下位から所定の下位層までのサブレイヤにおいてレイヤ間予測を行うように制御するのが望ましい。

その場合、レイヤ間予測をどのサブレイヤまで許可するかを指定すれば良い。このようにすることにより、１サブレイヤを指定するのみでよいので、レイヤ間予測制御情報の情報量はさらに低減させることができる。

＜ビデオパラメータセット＞
ところで、HEVCにおいては、シーケンスパラメータセット（SPS（Sequence Parameter Set））、ピクチャパラメータセット（PPS）に加え、ビデオパラメータセット（VPS（Video Parameter Set））が規定されている。

ビデオパラメータセット（VPS）は、スケーラブル符号化された符号化データ全体に対して生成される。このビデオパラメータセット（VPS）には、全ての主レイヤに関する情報が格納される。

シーケンスパラメータセット（SPS）は、主レイヤ毎に生成される。このシーケンスパラメータセット（SPS）には、当該主レイヤに関する情報が格納される。

ピクチャパラメータセット（PPS）は、各主レイヤのピクチャ毎に生成される。このピクチャパラメータセットには、当該主レイヤの当該ピクチャに関する情報が格納される。

このようなレイヤ間予測制御情報は、例えばシーケンスパラメータセット（SPS）等において、主レイヤ毎に伝送するようにしても良いが、全主レイヤの共通情報として、ビデオパラメータセット（VPS）等において伝送するようにしてもよい。

図８にビデオパラメータセットのシンタクスの例を示す。パラメータmax_layer_minus1は、スケーラブル符号化がいくつの階層により行われるか（すなわち主レイヤ数）の最大数を示す。パラメータvps_max_sub_layer_minus1は、スケーラブル符号化の各主レイヤに含まれるサブレイヤの最大数（最大サブレイヤ数）を示す。

パラメータmax_sub_layer_for_inter_layer_prediction[i]は、レイヤ間予測を行うサブレイヤを示す。パラメータmax_sub_layer_for_inter_layer_prediction[i]は、レイヤ間予測を行うサブレイヤの最上位サブレイヤを示す。つまり、最下位サブレイヤからパラメータmax_sub_layer_for_inter_layer_prediction[i]に指定されるサブレイヤまでのサブレイヤにおいてレイヤ間予測が行なわれる。

このパラメータmax_sub_layer_for_inter_layer_prediction[i]は、主レイヤ（ｉ）毎に設定される。つまり、パラメータmax_sub_layer_for_inter_layer_prediction[i]は、パラメータmax_layer_minus1以下の主レイヤのそれぞれについて設定される。また、パラメータmax_sub_layer_for_inter_layer_prediction[i]の値は、パラメータvps_max_sub_layer_minus1以下の値に設定される。

なお、レイヤ間予測は、任意のパラメータについて行うことができる。例えば、AVCスケーラブル符号化においては、階層間予測を行うものとして、動きベクトル情報、モード情報、復号画素値、予測残差信号などがある。また、HEVCにおいては、これに加え、直交変換スキップ（Transform Skip）に関するフラグ（flag）、参照ピクチャ、量子化パラメータ、スケーリングリスト（Scaling List）、適応オフセットなどがある。また、レイヤ間予測が行なわれるパラメータの数も任意であり、１つであってもよいし、複数であってもよい。

ただし、説明の便宜上、以下においては、レイヤ間予測の一例として、レイヤ間の動き予測（動きベクトル情報の生成）を行う場合について説明する。

次に、以上のような本技術について、具体的な装置への適用例について説明する。

＜１．第１の実施の形態＞
＜スケーラブル符号化装置＞
図９は、スケーラブル符号化装置の主な構成例を示すブロック図である。

図９に示されるスケーラブル符号化装置１００は、ベースレイヤとエンハンスメントレイヤに階層化された画像データの各レイヤを符号化する。この階層化の基準として用いるパラメータは任意である。スケーラブル符号化装置１００は、共通情報生成部１０１、符号化制御部１０２、ベースレイヤ画像符号化部１０３、レイヤ間予測制御部１０４、およびエンハンスメントレイヤ画像符号化部１０５を有する。

共通情報生成部１０１は、例えばNALユニットに格納するような画像データの符号化に関する情報を取得する。また、共通情報生成部１０１は、必要に応じて、ベースレイヤ画像符号化部１０３、レイヤ間予測制御部１０４、およびエンハンスメントレイヤ画像符号化部１０５などから必要な情報を取得する。共通情報生成部１０１は、それらの情報を基に全主レイヤに関する情報である共通情報を生成する。共通情報には、例えば、ビデオパラメータセット等が含まれる。共通情報生成部１０１は、生成した共通情報を、例えばNALユニットとして、スケーラブル符号化装置１００の外部に出力する。なお、共通情報生成部１０１は、生成した共通情報を、符号化制御部１０２にも供給する。さらに、共通情報生成部１０１は、必要に応じて、生成した共通情報の一部若しくは全部をベースレイヤ画像符号化部１０３乃至エンハンスメントレイヤ画像符号化部１０５にも供給する。例えば、共通情報生成部１０１は、処理対象であるカレント主レイヤのレイヤ間予測実行最大サブレイヤ（max_sub_layer_for_inter_layer_prediction[i]）をレイヤ間予測制御部１０４に供給する。

符号化制御部１０２は、共通情報生成部１０１から供給される共通情報に基づいて、ベースレイヤ画像符号化部１０３乃至エンハンスメントレイヤ画像符号化部１０５を制御することにより、各主レイヤの符号化を制御する。

ベースレイヤ画像符号化部１０３は、ベースレイヤの画像情報（ベースレイヤ画像情報）を取得する。ベースレイヤ画像符号化部１０３は、他のレイヤを参照せずに、そのベースレイヤ画像情報を符号化し、ベースレイヤの符号化データ（ベースレイヤ符号化データ）を生成し、出力する。また、ベースレイヤ画像符号化部１０３は、符号化の際に得られたベースレイヤの符号化に関する情報をレイヤ間予測制御部１０４に供給する。

レイヤ間予測制御部１０４は、ベースレイヤ画像符号化部１０３から供給されるベースレイヤの符号化に関する情報を記憶する。また、レイヤ間予測制御部１０４は、共通情報生成部１０１から供給されるカレント主レイヤのレイヤ間予測実行最大サブレイヤ（max_sub_layer_for_inter_layer_prediction[i]）を取得する。レイヤ間予測制御部１０４は、その情報に基づいて、記憶しているベースレイヤの符号化に関する情報の、エンハンスメントレイヤ画像符号化部１０５への供給を制御する。

エンハンスメントレイヤ画像符号化部１０５は、エンハンスメントレイヤの画像情報（エンハンスメントレイヤ画像情報）を取得する。エンハンスメントレイヤ画像符号化部１０５は、そのエンハンスメントレイヤ画像情報を符号化する。その際、エンハンスメントレイヤ画像符号化部１０５は、レイヤ間予測制御部１０４の制御に従って、ベースレイヤの符号化に関する情報を参照してレイヤ間予測を行う。より具体的には、例えば、処理対象であるカレントサブレイヤが、レイヤ間予測が許可されたサブレイヤの場合、エンハンスメントレイヤ画像符号化部１０５は、レイヤ間予測制御部１０４から供給されるベースレイヤの符号化に関する情報を取得し、それを参照してレイヤ間予測を行い、その予測結果を利用してエンハンスメントレイヤ画像情報を符号化する。また、例えば、カレントサブレイヤが、レイヤ間予測が禁止されたサブレイヤの場合、エンハンスメントレイヤ画像符号化部１０５は、レイヤ間予測を行わずにエンハンスメントレイヤ画像情報を符号化する。エンハンスメントレイヤ画像符号化部１０５は、このような符号化により、エンハンスメントレイヤの符号化データ（エンハンスメントレイヤ符号化データ）を生成し、出力する。

＜ベースレイヤ画像符号化部＞
図１０は、図９のベースレイヤ画像符号化部１０３の主な構成例を示すブロック図である。図１０に示されるように、ベースレイヤ画像符号化部１０３は、A/D変換部１１１、画面並べ替えバッファ１１２、演算部１１３、直交変換部１１４、量子化部１１５、可逆符号化部１１６、蓄積バッファ１１７、逆量子化部１１８、および逆直交変換部１１９を有する。また、ベースレイヤ画像符号化部１０３は、演算部１２０、ループフィルタ１２１、フレームメモリ１２２、選択部１２３、イントラ予測部１２４、動き予測・補償部１２５、予測画像選択部１２６、およびレート制御部１２７を有する。

A/D変換部１１１は、入力された画像データ（ベースレイヤ画像情報）をA/D変換し、変換後の画像データ（デジタルデータ）を、画面並べ替えバッファ１１２に供給し、記憶させる。画面並べ替えバッファ１１２は、記憶した表示の順番のフレームの画像を、GOP（Group Of Picture）に応じて、符号化のためのフレームの順番に並べ替え、フレームの順番を並び替えた画像を、演算部１１３に供給する。また、画面並べ替えバッファ１１２は、フレームの順番を並び替えた画像を、イントラ予測部１２４および動き予測・補償部１２５にも供給する。

演算部１１３は、画面並べ替えバッファ１１２から読み出された画像から、予測画像選択部１２６を介してイントラ予測部１２４若しくは動き予測・補償部１２５から供給される予測画像を減算し、その差分情報を直交変換部１１４に出力する。例えば、イントラ符号化が行われる画像の場合、演算部１１３は、画面並べ替えバッファ１１２から読み出された画像から、イントラ予測部１２４から供給される予測画像を減算する。また、例えば、インター符号化が行われる画像の場合、演算部１１３は、画面並べ替えバッファ１１２から読み出された画像から、動き予測・補償部１２５から供給される予測画像を減算する。

直交変換部１１４は、演算部１１３から供給される差分情報に対して、離散コサイン変換やカルーネン・レーベ変換等の直交変換を施す。直交変換部１１４は、その変換係数を量子化部１１５に供給する。

量子化部１１５は、直交変換部１１４から供給される変換係数を量子化する。量子化部１１５は、レート制御部１２７から供給される符号量の目標値に関する情報に基づいて量子化パラメータを設定し、その量子化を行う。量子化部１１５は、量子化された変換係数を可逆符号化部１１６に供給する。

可逆符号化部１１６は、量子化部１１５において量子化された変換係数を任意の符号化方式で符号化する。係数データは、レート制御部１２７の制御の下で量子化されているので、この符号量は、レート制御部１２７が設定した目標値となる（若しくは目標値に近似する）。

また、可逆符号化部１１６は、イントラ予測のモードを示す情報などをイントラ予測部１２４から取得し、インター予測のモードを示す情報や差分動きベクトル情報などを動き予測・補償部１２５から取得する。さらに、可逆符号化部１１６は、シーケンスパラメータセット（SPS）、およびピクチャパラメータセット（PPS）等を含むベースレイヤのNALユニットを適宜生成する。

可逆符号化部１１６は、これらの各種情報を任意の符号化方式で符号化し、符号化データ（符号化ストリームとも称する）の一部とする（多重化する）。可逆符号化部１１６は、符号化して得られた符号化データを蓄積バッファ１１７に供給して蓄積させる。

可逆符号化部１１６の符号化方式としては、例えば、可変長符号化または算術符号化等が挙げられる。可変長符号化としては、例えば、H．264/AVC方式で定められているCAVLC（Context-Adaptive Variable Length Coding）などが挙げられる。算術符号化としては、例えば、CABAC（Context-Adaptive Binary Arithmetic Coding）などが挙げられる。

蓄積バッファ１１７は、可逆符号化部１１６から供給された符号化データ（ベースレイヤ符号化データ）を、一時的に保持する。蓄積バッファ１１７は、所定のタイミングにおいて、保持しているベースレイヤ符号化データを、例えば、後段の図示せぬ記録装置（記録媒体）や伝送路などに出力する。すなわち、蓄積バッファ１１７は、符号化データを伝送する伝送部でもある。

また、量子化部１１５において量子化された変換係数は、逆量子化部１１８にも供給される。逆量子化部１１８は、その量子化された変換係数を、量子化部１１５による量子化に対応する方法で逆量子化する。逆量子化部１１８は、得られた変換係数を、逆直交変換部１１９に供給する。

逆直交変換部１１９は、逆量子化部１１８から供給された変換係数を、直交変換部１１４による直交変換処理に対応する方法で逆直交変換する。逆直交変換された出力（復元された差分情報）は、演算部１２０に供給される。

演算部１２０は、逆直交変換部１１９から供給された逆直交変換結果である、復元された差分情報に、予測画像選択部１２６を介してイントラ予測部１２４若しくは動き予測・補償部１２５からの予測画像を加算し、局部的に復号された画像（復号画像）を得る。その復号画像は、ループフィルタ１２１またはフレームメモリ１２２に供給される。

ループフィルタ１２１は、デブロックフィルタや適応ループフィルタ等を含み、演算部１２０から供給される再構成画像に対して適宜フィルタ処理を行う。例えば、ループフィルタ１２１は、再構成画像に対してデブロックフィルタ処理を行うことにより再構成画像のブロック歪を除去する。また、例えば、ループフィルタ１２１は、そのデブロックフィルタ処理結果（ブロック歪みの除去が行われた再構成画像）に対して、ウィナーフィルタ（Wiener Filter）を用いてループフィルタ処理を行うことにより画質改善を行う。ループフィルタ１２１は、フィルタ処理結果（以下、復号画像と称する）をフレームメモリ１２２に供給する。

なお、ループフィルタ１２１が、再構成画像に対してさらに、他の任意のフィルタ処理を行うようにしてもよい。また、ループフィルタ１２１は、必要に応じて、フィルタ処理に用いたフィルタ係数等の情報を可逆符号化部１１６に供給し、それを符号化させるようにすることもできる。

フレームメモリ１２２は、供給される復号画像を記憶し、所定のタイミングにおいて、記憶している復号画像を参照画像として、選択部１２３に供給する。

より具体的には、フレームメモリ１２２は、演算部１２０から供給される再構成画像と、ループフィルタ１２１から供給される復号画像とをそれぞれ記憶する。フレームメモリ１２２は、所定のタイミングにおいて、若しくは、イントラ予測部１２４等の外部からの要求に基づいて、記憶している再構成画像を、選択部１２３を介してイントラ予測部１２４に供給する。また、フレームメモリ１２２は、所定のタイミングにおいて、若しくは、動き予測・補償部１２５等の外部からの要求に基づいて、記憶している復号画像を、選択部１２３を介して、動き予測・補償部１２５に供給する。

選択部１２３は、フレームメモリ１２２から供給される参照画像の供給先を選択する。例えば、イントラ予測の場合、選択部１２３は、フレームメモリ１２２から供給される参照画像（カレントピクチャ内の画素値）をイントラ予測部１２４に供給する。また、例えば、インター予測の場合、選択部１２３は、フレームメモリ１２２から供給される参照画像を動き予測・補償部１２５に供給する。

イントラ予測部１２４は、選択部１２３を介してフレームメモリ１２２から供給される参照画像であるカレントピクチャ内の画素値を用いて予測画像を生成するイントラ予測（画面内予測）を行う。イントラ予測部１２４は、予め用意された複数のイントラ予測モードでこのイントラ予測を行う。

イントラ予測部１２４は、候補となる全てのイントラ予測モードで予測画像を生成し、画面並べ替えバッファ１１２から供給される入力画像を用いて各予測画像のコスト関数値を評価し、最適なモードを選択する。イントラ予測部１２４は、最適なイントラ予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部１２６に供給する。

また、上述したように、イントラ予測部１２４は、採用されたイントラ予測モードを示すイントラ予測モード情報等を、適宜可逆符号化部１１６に供給し、符号化させる。

動き予測・補償部１２５は、画面並べ替えバッファ１１２から供給される入力画像と、選択部１２３を介してフレームメモリ１２２から供給される参照画像とを用いて動き予測（インター予測）を行う。動き予測・補償部１２５は、検出された動きベクトルに応じて動き補償処理を行い、予測画像（インター予測画像情報）を生成する。動き予測・補償部１２５は、予め用意された複数のインター予測モードでこのようなインター予測を行う。

動き予測・補償部１２５は、候補となる全てのインター予測モードで予測画像を生成する。動き予測・補償部１２５は、画面並べ替えバッファ１１２から供給される入力画像と、生成した差分動きベクトルの情報などを用いて、各予測画像のコスト関数値を評価し、最適なモードを選択する。動き予測・補償部１２５は、最適なインター予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部１２６に供給する。

動き予測・補償部１２５は、採用されたインター予測モードを示す情報や、符号化データを復号する際に、そのインター予測モードで処理を行うために必要な情報等を可逆符号化部１１６に供給し、符号化させる。必要な情報としては、例えば、生成された差分動きベクトルの情報や、予測動きベクトル情報として、予測動きベクトルのインデックスを示すフラグなどがある。

予測画像選択部１２６は、演算部１１３や演算部１２０に供給する予測画像の供給元を選択する。例えば、イントラ符号化の場合、予測画像選択部１２６は、予測画像の供給元としてイントラ予測部１２４を選択し、そのイントラ予測部１２４から供給される予測画像を演算部１１３や演算部１２０に供給する。また、例えば、インター符号化の場合、予測画像選択部１２６は、予測画像の供給元として動き予測・補償部１２５を選択し、その動き予測・補償部１２５から供給される予測画像を演算部１１３や演算部１２０に供給する。

レート制御部１２７は、蓄積バッファ１１７に蓄積された符号化データの符号量に基づいて、オーバフローあるいはアンダーフローが発生しないように、量子化部１１５の量子化動作のレートを制御する。

なお、フレームメモリ１２２は、記憶している復号画像を、ベースレイヤの符号化に関する情報としてレイヤ間予測制御部１０４に供給する。

＜エンハンスメントレイヤ画像符号化部＞
図１１は、図９のエンハンスメントレイヤ画像符号化部１０５の主な構成例を示すブロック図である。図１１に示されるように、エンハンスメントレイヤ画像符号化部１０５は、図１０のベースレイヤ画像符号化部１０３と基本的に同様の構成を有する。

ただし、エンハンスメントレイヤ画像符号化部１０５の各部は、ベースレイヤではなく、エンハンスメントレイヤ画像情報の符号化についての処理を行う。つまり、エンハンスメントレイヤ画像符号化部１０５のA/D変換部１１１は、エンハンスメントレイヤ画像情報をA/D変換し、エンハンスメントレイヤ画像符号化部１０５の蓄積バッファ１１７は、エンハンスメントレイヤ符号化データを、例えば、後段の図示せぬ記録装置（記録媒体）や伝送路などに出力する。

また、エンハンスメントレイヤ画像符号化部１０５は、動き予測・補償部１２５の代わりに、動き予測・補償部１３５を有する。

動き予測・補償部１３５は、動き予測・補償部１２５が行うようなピクチャ間の動き予測だけでなく、主レイヤ間の動き予測も行うことができる。動き予測・補償部１３５は、レイヤ間予測制御部１０４から供給されるベースレイヤの符号化に関する情報（例えば、ベースレイヤの復号画像）を取得する。動き予測・補償部１３５は、インター予測の候補モードの１つとして、そのベースレイヤの符号化に関する情報を用いて主レイヤの動き予測を行う。

＜共通情報生成部とレイヤ間予測制御部＞
図１２は、図９の共通情報生成部１０１およびレイヤ間予測制御部１０４の主な構成例を示すブロック図である。

図１２に示されるように、共通情報生成部１０１は、主レイヤ最大数設定部１４１、サブレイヤ最大数設定部１４２、レイヤ間予測実行最大サブレイヤ設定部１４３を有する。また、レイヤ間予測制御部１０４は、レイヤ間予測実行制御部１５１および符号化関連情報バッファ１５２を有する。

主レイヤ最大数設定部１４１は、主レイヤの最大数を示す情報（max_layer_minus1）を設定する。サブレイヤ最大数設定部１４２は、サブレイヤの最大数を示す情報（vps_max_sub_layer_minus1）を設定する。レイヤ間予測実行最大サブレイヤ設定部１４３は、カレント主レイヤのレイヤ間予測を許可するサブレイヤの最上位サブレイヤを指定する情報（max_sub_layer_for_inter_layer_prediction[i]）を設定する。

共通情報生成部１０１は、それらの情報を共通情報（ビデオパラメータセット（VPS））として、スケーラブル符号化装置１００の外部に出力する。また、共通情報生成部１０１は、その共通情報（ビデオパラメータセット（VPS））を符号化制御部１０２に供給する。さらに、共通情報生成部１０１は、カレント主レイヤのレイヤ間予測を許可するサブレイヤの最上位サブレイヤを指定する情報（max_sub_layer_for_inter_layer_prediction[i]）をレイヤ間予測制御部１０４に供給する。

レイヤ間予測実行制御部１５１は、共通情報生成部１０１から供給される共通情報に基づいて、レイヤ間予測の実行を制御する。より具体的には、レイヤ間予測実行制御部１５１は、共通情報生成部１０１から供給される、レイヤ間予測を許可するサブレイヤの最上位サブレイヤを指定する情報（max_sub_layer_for_inter_layer_prediction[i]）に基づいて、符号化関連情報バッファ１５２を制御する。

符号化関連情報バッファ１５２は、ベースレイヤ画像符号化部１０３から供給されるベースレイヤの符号化に関する情報（例えば、ベースレイヤの復号画像）を取得し、記憶する。符号化関連情報バッファ１５２は、レイヤ間予測実行制御部１５１の制御に従って、記憶しているベースレイヤの符号化に関する情報をエンハンスメントレイヤ画像符号化部１０５に供給する。

レイヤ間予測実行制御部１５１は、この符号化関連情報バッファ１５２からのベースレイヤの符号化に関する情報の供給を制御する。例えば、レイヤ間予測を許可するサブレイヤの最上位サブレイヤを指定する情報（max_sub_layer_for_inter_layer_prediction[i]）において、カレントサブレイヤのレイヤ間予測が許可されている場合、レイヤ間予測実行制御部１５１は、カレントサブレイヤについて、符号化関連情報バッファ１５２に記憶されているベースレイヤの符号化に関する情報（例えば、ベースレイヤの復号画像）を、エンハンスメントレイヤ画像符号化部１０５に供給させる。

また、例えば、レイヤ間予測を許可するサブレイヤの最上位サブレイヤを指定する情報（max_sub_layer_for_inter_layer_prediction[i]）において、カレントサブレイヤのレイヤ間予測が許可されていない場合、レイヤ間予測実行制御部１５１は、カレントサブレイヤについて、符号化関連情報バッファ１５２に記憶されているベースレイヤの符号化に関する情報（例えば、ベースレイヤの復号画像）を、エンハンスメントレイヤ画像符号化部１０５に供給させない。

以上のように、スケーラブル符号化装置１００は、サブレイヤを用いてレイヤ間予測を制御するレイヤ間予測制御情報を伝送するので、レイヤ間予測制御による符号化効率の低減を抑制することができる。これにより、スケーラブル符号化装置１００は、符号化・復号による画質の低減を抑制することができる。

＜符号化処理の流れ＞
次に、以上のようなスケーラブル符号化装置１００により実行される各処理の流れについて説明する。最初に、図１３のフローチャートを参照して、符号化処理の流れの例を説明する。

符号化処理が開始されると、ステップＳ１０１において、スケーラブル符号化装置１００の共通情報生成部１０１は、共通情報を生成する。ステップＳ１０２において、符号化制御部１０２は、最初の主レイヤを処理対象とする。

ステップＳ１０３において、符号化制御部１０２は、ステップＳ１０１において生成された共通情報に基づいて、処理対象であるカレント主レイヤがベースレイヤであるか否かを判定する。カレント主レイヤがベースレイヤであると判定された場合、処理は、ステップＳ１０４に進む。

ステップＳ１０４において、ベースレイヤ画像符号化部１０３は、ベースレイヤ符号化処理を行う。ステップＳ１０４の処理が終了すると、処理は、ステップＳ１０８に進む。

また、ステップＳ１０３において、カレント主レイヤがエンハンスメントレイヤであると判定された場合、処理は、ステップＳ１０５に進む。ステップＳ１０５において、符号化制御部１０２は、カレント主レイヤに対応する（すなわち、参照先とする）ベースレイヤを決定する。

ステップＳ１０６において、レイヤ間予測制御部１０４は、レイヤ間予測制御処理を行う。

ステップＳ１０７において、エンハンスメントレイヤ画像符号化部１０５は、エンハンスメントレイヤ符号化処理を行う。ステップＳ１０７の処理が終了すると、処理は、ステップＳ１０８に進む。

ステップＳ１０８において、符号化制御部１０２は、全ての主レイヤを処理したか否かを判定する。未処理の主レイヤが存在すると判定された場合、処理は、ステップＳ１０９に進む。

ステップＳ１０９において、符号化制御部１０２は、次の未処理の主レイヤを処理対象（カレント主レイヤ）とする。ステップＳ１０９の処理が終了すると、処理は、ステップＳ１０３に戻る。ステップＳ１０３乃至ステップＳ１０９の処理が繰り返し実行され、各主レイヤが符号化される。

そして、ステップＳ１０８において、全ての主レイヤが処理されたと判定された場合、符号化処理が終了する。

＜共通情報生成処理の流れ＞
次に、図１４のフローチャートを参照して、図１３のステップＳ１０１において実行される共通情報生成処理の流れの例を説明する。

共通情報生成処理が開始されると、主レイヤ最大数設定部１４１は、ステップＳ１２１において、パラメータ（max_layer_minus1）を設定する。ステップＳ１２２において、サブレイヤ最大数設定部１４２は、パラメータ（vps_max_sub_layers_minus1）を設定する。ステップＳ１２３において、レイヤ間予測実行最大サブレイヤ設定部１４３は、各主レイヤについて、パラメータ（max_sub_layer_for_inter_layer_prediction[i]）を設定する。

ステップＳ１２４において、共通情報生成部１０１は、ステップＳ１２１乃至ステップＳ１２３において設定された各パラメータを含むビデオパラメータセットを共通情報として生成する。

ステップＳ１２５において、共通情報生成部１０１は、ステップＳ１２４の処理により生成したビデオパラメータセットを、スケーラブル符号化装置１００の外部および符号化制御部１０２に供給する。また、共通情報生成部１０１は、ステップＳ１２３において設定したパラメータ（max_sub_layer_for_inter_layer_prediction[i]）をレイヤ間予測制御部１０４に供給する。

ステップＳ１２５の処理が終了すると、共通情報生成処理が終了し、処理は、図１３に戻る。

＜ベースレイヤ符号化処理の流れ＞
次に、図１５のフローチャートを参照して、図１３のステップＳ１０４において実行されるベースレイヤ符号化処理の流れの例を説明する。

ステップＳ１４１において、ベースレイヤ画像符号化部１０３のA/D変換部１１１は入力されたベースレイヤの画像情報（画像データ）をA/D変換する。ステップＳ１４２において、画面並べ替えバッファ１１２は、A/D変換されたベースレイヤの画像情報（デジタルデータ）を記憶し、各ピクチャを、表示する順番から符号化する順番へ並べ替える。

ステップＳ１４３において、イントラ予測部１２４は、イントラ予測モードのイントラ予測処理を行う。ステップＳ１４４において、動き予測・補償部１２５は、インター予測モードでの動き予測や動き補償を行う動き予測・補償処理を行う。ステップＳ１４５において、予測画像選択部１２６は、イントラ予測部１２４および動き予測・補償部１２５から出力された各コスト関数値に基づいて、最適なモードを決定する。つまり、予測画像選択部１２６は、イントラ予測部１２４により生成された予測画像と、動き予測・補償部１２５により生成された予測画像のいずれか一方を選択する。ステップＳ１４６において、演算部１１３は、ステップＳ１４２の処理により並び替えられた画像と、ステップＳ１４５の処理により選択された予測画像との差分を演算する。差分データは元の画像データに較べてデータ量が低減される。したがって、画像をそのまま符号化する場合に較べて、データ量を圧縮することができる。

ステップＳ１４７において、直交変換部１１４は、ステップＳ１４６の処理により生成された差分情報に対する直交変換処理を行う。ステップＳ１４８において、量子化部１１５は、レート制御部１２７により算出された量子化パラメータを用いて、ステップＳ１４７の処理により得られた直交変換係数を量子化する。

ステップＳ１４８の処理により量子化された差分情報は、次のようにして局部的に復号される。すなわち、ステップＳ１４９において、逆量子化部１１８は、ステップＳ１４８の処理により生成された量子化された係数（量子化係数とも称する）を、量子化部１１５の特性に対応する特性で逆量子化する。ステップＳ１５０において、逆直交変換部１１９は、ステップＳ１４７の処理により得られた直交変換係数を逆直交変換する。ステップＳ１５１において、演算部１２０は、予測画像を局部的に復号された差分情報に加算し、局部的に復号された画像（演算部１１３への入力に対応する画像）を生成する。

ステップＳ１５２においてループフィルタ１２１は、ステップＳ１５１の処理により生成された画像をフィルタリングする。これによりブロック歪み等が除去される。ステップＳ１５３において、フレームメモリ１２２は、ステップＳ１５２の処理によりブロック歪みの除去等が行われた画像を記憶する。なお、フレームメモリ１２２にはループフィルタ１２１によりフィルタ処理されていない画像も演算部１２０から供給され、記憶される。このフレームメモリ１２２に記憶された画像は、ステップＳ１４３の処理やステップＳ１４４の処理に利用される。

また、ステップＳ１５４において、フレームメモリ１２２は、自身に記憶された画像を、ベースレイヤの符号化に関する情報として、レイヤ間予測制御部１０４に供給し、記憶させる。

ステップＳ１５５において、可逆符号化部１１６は、ステップＳ１４８の処理により量子化された係数を符号化する。すなわち、差分画像に対応するデータに対して、可変長符号化や算術符号化等の可逆符号化が行われる。

また、このとき、可逆符号化部１１６は、ステップＳ１４５の処理により選択された予測画像の予測モードに関する情報を符号化し、差分画像を符号化して得られる符号化データに付加する。つまり、可逆符号化部１１６は、イントラ予測部１２４から供給される最適イントラ予測モード情報、または、動き予測・補償部１２５から供給される最適インター予測モードに応じた情報なども符号化し、符号化データに付加する。

ステップＳ１５６において蓄積バッファ１１７は、ステップＳ１５５の処理により得られたベースレイヤ符号化データを蓄積する。蓄積バッファ１１７に蓄積されたベースレイヤ符号化データは、適宜読み出され、伝送路や記録媒体を介して復号側に伝送される。

ステップＳ１５７においてレート制御部１２７は、ステップＳ１５６の処理により蓄積バッファ１１７に蓄積された符号化データの符号量（発生符号量）に基づいて、オーバフローあるいはアンダーフローが発生しないように、量子化部１１５の量子化動作のレートを制御する。また、レート制御部１２７は、量子化パラメータに関する情報を、量子化部１１５に供給する。

ステップＳ１５７の処理が終了すると、ベースレイヤ符号化処理が終了し、処理は図１３に戻る。ベースレイヤ符号化処理は、例えば、ピクチャ単位で実行される。つまり、カレントレイヤの各ピクチャに対してベースレイヤ符号化処理が実行される。ただし、ベースレイヤ符号化処理内の各処理は、それぞれの処理単位毎に行われる。

＜レイヤ間予測制御処理の流れ＞
次に、図１３のステップＳ１０６において実行されるレイヤ間予測制御処理の流れの例を、図１６のフローチャートを参照して説明する。

レイヤ間予測制御処理が開始されると、レイヤ間予測実行制御部１５１は、ステップＳ１７１において、図１４の共通情報生成処理により共通情報生成部１０１から供給されたパラメータ（max_sub_layer_for_inter_layer_prediction[i]）を参照する。

ステップＳ１７２において、レイヤ間予測実行制御部１５１は、そのパラメータの値に基づいて、カレントピクチャのカレントサブレイヤが、レイヤ間予測を行うレイヤであるか否かを判定する。パラメータ（max_sub_layer_for_inter_layer_prediction[i]）により指定されるレイヤが、カレントサブレイヤよりも上位のサブレイヤであり、カレントサブレイヤにおけるレイヤ間予測が許可されていると判定された場合、処理は、ステップＳ１７３に進む。

ステップＳ１７３において、レイヤ間予測実行制御部１５１は、符号化関連情報バッファ１５２を制御し、符号化関連情報バッファ１５２に記憶されているベースレイヤの符号化に関する情報を、エンハンスメントレイヤ画像符号化部１０５に供給させる。ステップＳ１７３の処理が終了すると、レイヤ間予測制御処理が終了し、処理は、図１３に戻る。

また、ステップＳ１７２において、カレントサブレイヤにおけるレイヤ間予測が許可されていないと判定された場合、ベースレイヤの符号化に関する情報の供給は行われずに、レイヤ間予測制御処理が終了し、処理は図１３に戻る。つまり、このカレントサブレイヤに対する符号化においては、レイヤ間予測は行われない。

＜エンハンスメントレイヤ符号化処理の流れ＞
次に、図１７のフローチャートを参照して、図１３のステップＳ１０７において実行されるエンハンスメントレイヤ符号化処理の流れの例を説明する。

エンハンスメントレイヤ符号化処理のステップＳ１９１乃至ステップＳ１９３、並びに、ステップＳ１９５乃至ステップＳ２０６の各処理は、ベースレイヤ符号化処理のステップＳ１４１乃至ステップＳ１４３、ステップＳ１４５乃至ステップＳ１５３、並びに、ステップＳ１５５乃至ステップＳ１５７の各処理と同様に実行される。ただし、エンハンスメントレイヤ符号化処理の各処理は、エンハンスメントレイヤ画像符号化部１０５の各処理部により、エンハンスメントレイヤ画像情報に対して行われる。

なお、ステップＳ１９４において、動き予測・補償部１３５は、エンハンスメントレイヤ画像情報に対して、動き予測・補償処理を行う。

ステップＳ２０６の処理が終了すると、エンハンスメントレイヤ符号化処理が終了され、処理は図１３に戻る。エンハンスメントレイヤ符号化処理は、例えば、ピクチャ単位で実行される。つまり、カレントレイヤの各ピクチャに対してエンハンスメントレイヤ符号化処理が実行される。ただし、エンハンスメントレイヤ符号化処理内の各処理は、それぞれの処理単位毎に行われる。

＜動き予測・補償処理の流れ＞
次に、図１８のフローチャートを参照して、図１７のステップＳ１９４において実行される動き予測・補償処理の流れの例を説明する。

動き予測・補償処理が開始されると、動き予測・補償部１３５は、ステップＳ２２１において、カレント主レイヤ内で動き予測を行う。

ステップＳ２２２において、動き予測・補償部１３５は、カレントピクチャについて、レイヤ間予測を行うか否かを判定する。レイヤ間予測制御部１０４からベースレイヤの符号化に関する情報が供給され、レイヤ間予測を行うと判定された場合、処理は、ステップＳ２２３に進む。

ステップＳ２２３において、動き予測・補償部１３５は、レイヤ間予測制御部１０４から供給されるベースレイヤの符号化に関する情報を取得する。ステップＳ２２４において、動き予測・補償部１３５は、ステップＳ２２３において取得した情報を用いてレイヤ間予測を行う。ステップＳ２２４の処理が終了すると、処理は、ステップＳ２２５に進む。

また、ステップＳ２２２において、レイヤ間予測制御部１０４からベースレイヤの符号化に関する情報が供給されておらず、レイヤ間予測を行わないと判定された場合、カレントピクチャについてレイヤ間予測が省略され、処理は、ステップＳ２２５に進む。

ステップＳ２２５において、動き予測・補償部１３５は、各予測モードについてコスト関数値を算出する。ステップＳ２２６において、動き予測・補償部１３５は、そのコスト関数値に基づいて最適なインター予測モードを選択する。

ステップＳ２２７において、動き予測・補償部１３５は、ステップＳ２２６において選択された最適なインター予測モードで動き補償を行い、予測画像を生成する。ステップＳ２２８において、動き予測・補償部１３５は、その最適なインター予測モードについて、インター予測に関する情報を生成する。

ステップＳ２２８の処理が終了すると、動き予測・補償処理が終了し、処理は、図１７に戻る。以上のように、レイヤ間予測を適宜用いた、動き予測・補償処理が行われる。この処理は、例えば、ブロック単位で実行される。ただし、動き予測・補償処理内の各処理は、それぞれの処理単位毎に行われる。

以上のように各処理を実行することにより、スケーラブル符号化装置１００は、符号化効率の低減を抑制し、符号化・復号による画質の低減を抑制することができる。

＜２．第２の実施の形態＞
＜スケーラブル復号装置＞
次に、以上のようにスケーラブル符号化（階層符号化）された符号化データ（ビットストリーム）の復号について説明する。図１９は、図９のスケーラブル符号化装置１００に対応するスケーラブル復号装置の主な構成例を示すブロック図である。図１９に示されるスケーラブル復号装置２００は、例えばスケーラブル符号化装置１００により画像データがスケーラブル符号化されて得られた符号化データを、その符号化方法に対応する方法でスケーラブル復号する。

図１９に示されるように、スケーラブル復号装置２００は、共通情報取得部２０１、復号制御部２０２、ベースレイヤ画像復号部２０３、レイヤ間予測制御部２０４、およびエンハンスメントレイヤ画像復号部２０５を有する。

共通情報取得部２０１は、符号化側から伝送される共通情報（例えば、ビデオパラメータセット（VPS））を取得する。共通情報取得部２０１は、取得した共通情報より復号に関する情報を抽出し、それを復号制御部２０２に供給する。また、共通情報取得部２０１は、共通情報の一部若しくは全部を、ベースレイヤ画像復号部２０３乃至エンハンスメントレイヤ画像復号部２０５に適宜供給する。

復号制御部２０２は、共通情報取得部２０１から供給された復号に関する情報を取得し、その情報に基づいて、ベースレイヤ画像復号部２０３乃至エンハンスメントレイヤ画像復号部２０５を制御することにより、各主レイヤの復号を制御する。

ベースレイヤ画像復号部２０３は、ベースレイヤ画像符号化部１０３に対応する画像復号部であり、例えばベースレイヤ画像符号化部１０３によりベースレイヤ画像情報が符号化されて得られたベースレイヤ符号化データを取得する。ベースレイヤ画像復号部２０３は、他のレイヤを参照せずに、そのベースレイヤ符号化データを復号し、ベースレイヤ画像情報を再構築し、出力する。また、ベースレイヤ画像復号部２０３は、その復号により得られたベースレイヤの復号に関する情報をレイヤ間予測制御部２０４に供給する。

レイヤ間予測制御部２０４は、エンハンスメントレイヤ画像復号部２０５によるレイヤ間予測の実行を制御する。レイヤ間予測制御部２０４は、ベースレイヤ画像復号部２０３から供給されるベースレイヤの復号に関する情報を取得し、記憶する。また、レイヤ間予測制御部２０４は、レイヤ間予測が許可されるサブレイヤの復号において、記憶しているベースレイヤの復号に関する情報を、エンハンスメントレイヤ画像復号部２０５に供給する。

エンハンスメントレイヤ画像復号部２０５は、エンハンスメントレイヤ画像符号化部１０５に対応する画像復号部であり、例えばエンハンスメントレイヤ画像符号化部１０５によりエンハンスメントレイヤ画像情報が符号化されて得られたエンハンスメントレイヤ符号化データを取得する。エンハンスメントレイヤ画像復号部２０５は、そのエンハンスメントレイヤ符号化データを復号する。その際、エンハンスメントレイヤ画像復号部２０５は、レイヤ間予測制御部２０４の制御に従って、ベースレイヤの復号に関する情報を参照してレイヤ間予測を行う。より具体的には、例えば、処理対象であるカレントサブレイヤが、レイヤ間予測が許可されたサブレイヤの場合、エンハンスメントレイヤ画像復号部２０５は、レイヤ間予測制御部２０４から供給されるベースレイヤの復号に関する情報を取得し、それを参照してレイヤ間予測を行い、その予測結果を利用してエンハンスメントレイヤ符号化データを復号する。また、例えば、カレントサブレイヤが、レイヤ間予測が禁止されたサブレイヤの場合、エンハンスメントレイヤ画像復号部２０５は、レイヤ間予測を行わずにエンハンスメントレイヤ符号化データを復号する。エンハンスメントレイヤ画像復号部２０５は、このような符号化により、エンハンスメントレイヤ画像情報を再構築し、出力する。

＜ベースレイヤ画像復号部＞
図２０は、図１９のベースレイヤ画像復号部２０３の主な構成例を示すブロック図である。図２０に示されるようにベースレイヤ画像復号部２０３は、蓄積バッファ２１１、可逆復号部２１２、逆量子化部２１３、逆直交変換部２１４、演算部２１５、ループフィルタ２１６、画面並べ替えバッファ２１７、およびD/A変換部２１８を有する。また、ベースレイヤ画像復号部２０３は、フレームメモリ２１９、選択部２２０、イントラ予測部２２１、動き補償部２２２、および選択部２２３を有する。

蓄積バッファ２１１は、伝送されてきたベースレイヤ符号化データを受け取る受け取り部でもある。蓄積バッファ２１１は、伝送されてきたベースレイヤ符号化データを受け取って、蓄積し、所定のタイミングにおいてその符号化データを可逆復号部２１２に供給する。このベースレイヤ符号化データには、予測モード情報などの復号に必要な情報が付加されている。

可逆復号部２１２は、蓄積バッファ２１１より供給された、可逆符号化部１１６により符号化された情報を、可逆符号化部１１６の符号化方式に対応する方式で復号する。可逆復号部２１２は、復号して得られた差分画像の量子化された係数データを、逆量子化部２１３に供給する。

また、可逆復号部２１２は、ベースレイヤ符号化データに含まれるビデオパラメータセット（VPS）、シーケンスパラメータセット（SPS）、およびピクチャパラメータセット（PPS）等を含むNALユニットを適宜抽出し、取得する。可逆復号部２１２は、それらの情報から、最適な予測モードに関する情報を抽出し、その情報に基づいて最適な予測モードにイントラ予測モードが選択されたかインター予測モードが選択されたかを判定し、その最適な予測モードに関する情報を、イントラ予測部２２１および動き補償部２２２の内、選択されたと判定したモードの方に供給する。つまり、例えば、ベースレイヤ画像符号化部１０３において最適な予測モードとしてイントラ予測モードが選択された場合、その最適な予測モードに関する情報がイントラ予測部２２１に供給される。また、例えば、ベースレイヤ画像符号化部１０３において最適な予測モードとしてインター予測モードが選択された場合、その最適な予測モードに関する情報が動き補償部２２２に供給される。

さらに、可逆復号部２１２は、例えば、量子化行列や量子化パラメータ等の、逆量子化に必要な情報をNALユニット等から抽出し、それを逆量子化部２１３に供給する。

逆量子化部２１３は、可逆復号部２１２により復号されて得られた量子化された係数データを、量子化部１１５の量子化方式に対応する方式で逆量子化する。なお、この逆量子化部２１３は、逆量子化部１１８と同様の処理部である。つまり、逆量子化部２１３の説明は、逆量子化部１１８にも準用することができる。ただし、データの入出力先等は、装置に応じて適宜、変えて読む必要がある。逆量子化部２１３は、得られた係数データを逆直交変換部２１４に供給する。

逆直交変換部２１４は、逆量子化部２１３から供給される係数データを、直交変換部１１４の直交変換方式に対応する方式で逆直交変換する。なお、この逆直交変換部２１４は、逆直交変換部１１９と同様の処理部である。つまり、逆直交変換部２１４の説明は、逆直交変換部１１９にも準用することができる。ただし、データの入出力先等は、装置に応じて適宜、変えて読む必要がある。

逆直交変換部２１４は、この逆直交変換処理により、直交変換部１１４において直交変換される前の残差データに対応する復号残差データを得る。逆直交変換されて得られた復号残差データは、演算部２１５に供給される。また、演算部２１５には、選択部２２３を介して、イントラ予測部２２１若しくは動き補償部２２２から予測画像が供給される。

演算部２１５は、その復号残差データと予測画像とを加算し、演算部１１３により予測画像が減算される前の画像データに対応する復号画像データを得る。演算部２１５は、その復号画像データをループフィルタ２１６に供給する。

ループフィルタ２１６は、供給された復号画像に対して、デブロックフィルタや適応ループフィルタ等を含むフィルタ処理を適宜施し、それを画面並べ替えバッファ２１７およびフレームメモリ２１９に供給する。例えば、ループフィルタ２１６は、復号画像に対してデブロックフィルタ処理を行うことにより復号画像のブロック歪を除去する。また、例えば、ループフィルタ２１６は、そのデブロックフィルタ処理結果（ブロック歪みの除去が行われた復号画像）に対して、ウィナーフィルタ（Wiener Filter）を用いてループフィルタ処理を行うことにより画質改善を行う。なお、このループフィルタ２１６は、ループフィルタ１２１と同様の処理部である。

なお、演算部２１５から出力される復号画像は、ループフィルタ２１６を介さずに画面並べ替えバッファ２１７やフレームメモリ２１９に供給することができる。つまり、ループフィルタ２１６によるフィルタ処理の一部若しくは全部は省略することができる。

画面並べ替えバッファ２１７は、復号画像の並べ替えを行う。すなわち、画面並べ替えバッファ１１２により符号化の順番のために並べ替えられたフレームの順番が、元の表示の順番に並べ替えられる。D/A変換部２１８は、画面並べ替えバッファ２１７から供給された画像をD/A変換し、図示せぬディスプレイに出力し、表示させる。

フレームメモリ２１９は、供給される復号画像を記憶し、所定のタイミングにおいて、若しくは、イントラ予測部２２１や動き補償部２２２等の外部の要求に基づいて、記憶している復号画像を参照画像として、選択部２２０に供給する。

また、フレームメモリ２１９は、記憶する復号画像を、ベースレイヤの復号に関する情報として、レイヤ間予測制御部２０４に供給する。

選択部２２０は、フレームメモリ２１９から供給される参照画像の供給先を選択する。選択部２２０は、イントラ符号化された画像を復号する場合、フレームメモリ２１９から供給される参照画像をイントラ予測部２２１に供給する。また、選択部２２０は、インター符号化された画像を復号する場合、フレームメモリ２１９から供給される参照画像を動き補償部２２２に供給する。

イントラ予測部２２１には、ヘッダ情報を復号して得られたイントラ予測モードを示す情報等が可逆復号部２１２から適宜供給される。イントラ予測部２２１は、イントラ予測部１２４において用いられたイントラ予測モードで、フレームメモリ２１９から取得した参照画像を用いてイントラ予測を行い、予測画像を生成する。イントラ予測部２２１は、生成した予測画像を選択部２２３に供給する。

動き補償部２２２は、ヘッダ情報を復号して得られた情報（最適予測モード情報、参照画像情報等）を可逆復号部２１２から取得する。

動き補償部２２２は、可逆復号部２１２から取得された最適予測モード情報が示すインター予測モードで、フレームメモリ２１９から取得した参照画像を用いて動き補償を行い、予測画像を生成する。

選択部２２３は、イントラ予測部２２１からの予測画像または動き補償部２２２からの予測画像を、演算部２１５に供給する。そして、演算部２１５においては、動きベクトルが用いられて生成された予測画像と逆直交変換部２１４からの復号残差データ（差分画像情報）とが加算されて元の画像が復号される。

＜エンハンスメントレイヤ画像符号化部＞
図２１は、図１９のエンハンスメントレイヤ画像復号部２０５の主な構成例を示すブロック図である。図２１に示されるように、エンハンスメントレイヤ画像復号部２０５は、図２０のベースレイヤ画像復号部２０３と基本的に同様の構成を有する。

ただし、エンハンスメントレイヤ画像復号部２０５の各部は、ベースレイヤではなく、エンハンスメントレイヤ符号化データの復号についての処理を行う。つまり、エンハンスメントレイヤ画像復号部２０５の蓄積バッファ２１１は、エンハンスメントレイヤ符号化データを記憶し、エンハンスメントレイヤ画像復号部２０５のD/A変換部２１８は、エンハンスメントレイヤ画像情報を、例えば、後段の図示せぬ記録装置（記録媒体）や伝送路などに出力する。

また、エンハンスメントレイヤ画像復号部２０５は、動き補償部２２２の代わりに、動き補償部２３２を有する。

動き補償部２３２は、動き補償部２２２が行うようなピクチャ間の動き補償だけでなく、主レイヤ間の動き補償も行うことができる。その場合、動き補償部２３２は、レイヤ間予測制御部２０４から供給されるベースレイヤの復号に関する情報（例えば、ベースレイヤの復号画像）を取得する。動き補償部２３２は、そのベースレイヤの復号に関する情報を用いて主レイヤの動き補償を行う。

＜共通情報取得部とレイヤ間予測制御部＞
図２２は、図１９の共通情報取得部２０１およびレイヤ間予測制御部２０４の主な構成例を示すブロック図である。

図２２に示されるように、共通情報取得部２０１は、主レイヤ最大数取得部２４１、サブレイヤ最大数取得部２４２、レイヤ間予測実行最大サブレイヤ取得部２４３を有する。また、レイヤ間予測制御部２０４は、レイヤ間予測実行制御部２５１および復号関連情報バッファ２５２を有する。

主レイヤ最大数取得部２４１は、符号化側から伝送された共通情報に含まれる主レイヤの最大数を示す情報（max_layer_minus1）を取得する。サブレイヤ最大数取得部２４２は、符号化側から伝送された共通情報に含まれるサブレイヤの最大数を示す情報（vps_max_sub_layer_minus1）を取得する。レイヤ間予測実行最大サブレイヤ取得部２４３は、符号化側から伝送された共通情報に含まれるカレント主レイヤのレイヤ間予測を許可するサブレイヤの最上位サブレイヤを指定する情報（max_sub_layer_for_inter_layer_prediction[i]）を取得する。

共通情報取得部２０１は、取得した共通情報に含まれる復号に関する情報（例えばビデオパラメータセット（VPS）など）を復号制御部２０２に供給する。さらに、共通情報取得部２０１は、カレント主レイヤのレイヤ間予測を許可するサブレイヤの最上位サブレイヤを指定する情報（max_sub_layer_for_inter_layer_prediction[i]）をレイヤ間予測制御部２０４に供給する。

レイヤ間予測実行制御部２５１は、共通情報取得部２０１から供給される共通情報に基づいて、レイヤ間予測の実行を制御する。より具体的には、レイヤ間予測実行制御部２５１は、共通情報取得部２０１から供給される、レイヤ間予測を許可するサブレイヤの最上位サブレイヤを指定する情報（max_sub_layer_for_inter_layer_prediction[i]）に基づいて、復号関連情報バッファ２５２を制御する。

復号関連情報バッファ２５２は、ベースレイヤ画像復号部２０３から供給されるベースレイヤの復号に関する情報（例えば、ベースレイヤの復号画像）を取得し、記憶する。復号関連情報バッファ２５２は、レイヤ間予測実行制御部２５１の制御に従って、記憶しているベースレイヤの符号化に関する情報をエンハンスメントレイヤ画像復号部２０５に供給する。

レイヤ間予測実行制御部２５１は、この復号関連情報バッファ２５２からのベースレイヤの復号に関する情報の供給を制御する。例えば、レイヤ間予測を許可するサブレイヤの最上位サブレイヤを指定する情報（max_sub_layer_for_inter_layer_prediction[i]）において、カレントサブレイヤのレイヤ間予測が許可されている場合、レイヤ間予測実行制御部２５１は、カレントサブレイヤについて、復号関連情報バッファ２５２に記憶されているベースレイヤの復号に関する情報（例えば、ベースレイヤの復号画像）を、エンハンスメントレイヤ画像復号部２０５に供給させる。

また、例えば、レイヤ間予測を許可するサブレイヤの最上位サブレイヤを指定する情報（max_sub_layer_for_inter_layer_prediction[i]）において、カレントサブレイヤのレイヤ間予測が許可されていない場合、レイヤ間予測実行制御部２５１は、カレントサブレイヤについて、復号関連情報バッファ２５２に記憶されているベースレイヤの復号に関する情報（例えば、ベースレイヤの復号画像）を、エンハンスメントレイヤ画像復号部２０５に供給させない。

以上のように、スケーラブル復号装置２００は、サブレイヤを用いてレイヤ間予測を制御するレイヤ間予測制御情報を伝送するので、レイヤ間予測制御による符号化効率の低減を抑制することができる。これにより、スケーラブル復号装置２００は、符号化・復号による画質の低減を抑制することができる。

＜復号処理の流れ＞
次に、以上のようなスケーラブル復号装置２００により実行される各処理の流れについて説明する。最初に、図２３のフローチャートを参照して、復号処理の流れの例を説明する。

復号処理が開始されると、ステップＳ３０１において、スケーラブル復号装置２００の共通情報取得部２０１は、共通情報を取得する。ステップＳ３０２において、復号制御部２０２は、最初の主レイヤを処理対象とする。

ステップＳ３０３において、復号制御部２０２は、ステップＳ３０１において取得された、符号化側から伝送された共通情報に基づいて、処理対象であるカレント主レイヤがベースレイヤであるか否かを判定する。カレント主レイヤがベースレイヤであると判定された場合、処理は、ステップＳ３０４に進む。

ステップＳ３０４において、ベースレイヤ画像復号部２０３は、ベースレイヤ復号処理を行う。ステップＳ３０４の処理が終了すると、処理は、ステップＳ３０８に進む。

また、ステップＳ３０３において、カレント主レイヤがエンハンスメントレイヤであると判定された場合、処理はステップＳ３０５に進む。ステップＳ３０５において、復号制御部２０２は、カレント主レイヤに対応する（すなわち、参照先とする）ベースレイヤを決定する。

ステップＳ３０６において、レイヤ間予測制御部２０４は、レイヤ間予測制御処理を行う。

ステップＳ３０７において、エンハンスメントレイヤ画像復号部２０５は、エンハンスメントレイヤ復号処理を行う。ステップＳ３０７の処理が終了すると、処理はステップＳ３０８に進む。

ステップＳ３０８において、復号制御部２０２は、全ての主レイヤを処理したか否かを判定する。未処理の主レイヤが存在すると判定された場合、処理はステップＳ３０９に進む。

ステップＳ３０９において、復号制御部２０２は、次の未処理の主レイヤを処理対象（カレント主レイヤ）とする。ステップＳ３０９の処理が終了すると、処理はステップＳ３０３に戻る。ステップＳ３０３乃至ステップＳ３０９の処理が繰り返し実行され、各主レイヤが復号される。

そして、ステップＳ３０８において、全ての主レイヤが処理されたと判定された場合、復号処理が終了する。

＜共通情報取得処理の流れ＞
次に、図２４のフローチャートを参照して、図２３のステップＳ３０１において実行される共通情報取得処理の流れの例を説明する。

共通情報取得処理が開始されると、共通情報取得部２０１は、ステップＳ３２１において、符号化側から伝送されたビデオパラメータセット（VPS）を取得する。

ステップＳ３２２において、主レイヤ最大数取得部２４１は、ビデオパラメータセットよりパラメータ（max_layer_minus1）を取得する。ステップＳ３２３において、サブレイヤ最大数取得部２４２は、ビデオパラメータセットよりパラメータ（vps_max_sub_layers_minus1）を取得する。ステップＳ３２４において、レイヤ間予測実行最大サブレイヤ取得部２４３は、各主レイヤについて、パラメータ（max_sub_layer_for_inter_layer_prediction[i]）を取得する。

ステップＳ３２５において、共通情報取得部２０１は、ビデオパラメータセットから復号の制御に必要な情報を抽出し、それを復号に関する情報として、復号制御部２０２に供給する。

ステップＳ３２５の処理が終了すると、共通情報取得処理が終了し、処理は、図２３に戻る。

＜ベースレイヤ復号処理の流れ＞
次に、図２５のフローチャートを参照して、図２３のステップＳ３０４において実行されるベースレイヤ復号処理の流れの例を説明する。

ベースレイヤ復号処理が開始されると、ステップＳ３４１において、ベースレイヤ画像復号部２０３の蓄積バッファ２１１は、符号化側から伝送されたベースレイヤのビットストリームを蓄積する。ステップＳ３４２において、可逆復号部２１２は、蓄積バッファ２１１から供給されるベースレイヤのビットストリーム（符号化された差分画像情報）を復号する。すなわち、可逆符号化部１１６により符号化されたＩピクチャ、Ｐピクチャ、並びにＢピクチャが復号される。このとき、ヘッダ情報などのビットストリームに含められた差分画像情報以外の各種情報も復号される。

ステップＳ３４３において、逆量子化部２１３は、ステップＳ３４２の処理により得られた、量子化された係数を逆量子化する。

ステップＳ３４４において、逆直交変換部２１４は、カレントブロック（カレントTU）を逆直交変換する。

ステップＳ３４５において、イントラ予測部２２１若しくは動き補償部２２２は、予測処理を行い、予測画像を生成する。つまり、可逆復号部２１２において判定された、符号化の際に適用された予測モードで予測処理が行われる。より具体的には、例えば、符号化の際にイントラ予測が適用された場合、イントラ予測部２２１が、符号化の際に最適とされたイントラ予測モードで予測画像を生成する。また、例えば、符号化の際にインター予測が適用された場合、動き補償部２２２が、符号化の際に最適とされたインター予測モードで予測画像を生成する。

ステップＳ３４６において、演算部２１５は、ステップＳ３４４の逆直交変換処理により生成された差分画像情報に、ステップＳ３４５において生成された予測画像を加算する。これにより元の画像が復号される。

ステップＳ３４７において、ループフィルタ２１６は、ステップＳ３４６において得られた復号画像に対して、ループフィルタ処理を適宜行う。

ステップＳ３４８において、画面並べ替えバッファ２１７は、ステップＳ３４７においてフィルタ処理された画像の並べ替えを行う。すなわち画面並べ替えバッファ１１２により符号化のために並べ替えられたフレームの順序が、元の表示の順序に並べ替えられる。

ステップＳ３４９において、D/A変換部２１８は、ステップＳ３４８においてフレームの順序が並べ替えられた画像をD/A変換する。この画像が図示せぬディスプレイに出力され、画像が表示される。

ステップＳ３５０において、フレームメモリ２１９は、ステップＳ３４７においてループフィルタ処理された画像を記憶する。

ステップＳ３５１において、フレームメモリ２１９は、ステップＳ３５０において記憶した復号画像を、ベースレイヤの復号に関する情報として、レイヤ間予測制御部２０４の復号関連情報バッファ２５２に供給し、記憶させる。

ステップＳ３５１の処理が終了すると、ベースレイヤ復号処理が終了し、処理は図２３に戻る。ベースレイヤ復号処理は、例えば、ピクチャ単位で実行される。つまり、カレントレイヤの各ピクチャに対してベースレイヤ復号処理が実行される。ただし、ベースレイヤ復号処理内の各処理は、それぞれの処理単位毎に行われる。

＜レイヤ間予測制御処理の流れ＞
次に、図２３のステップＳ３０６において実行されるレイヤ間予測制御処理の流れの例を、図２６のフローチャートを参照して説明する。

レイヤ間予測制御処理が開始されると、レイヤ間予測実行制御部２５１は、ステップＳ３７１において、図２４の共通情報生成処理により共通情報取得部２０１から供給されたパラメータ（max_sub_layer_for_inter_layer_prediction[i]）を参照する。

ステップＳ３７２において、レイヤ間予測実行制御部２５１は、そのパラメータの値に基づいて、カレントピクチャのカレントサブレイヤが、レイヤ間予測を行うレイヤであるか否かを判定する。パラメータ（max_sub_layer_for_inter_layer_prediction[i]）により指定されるレイヤが、カレントサブレイヤよりも上位のサブレイヤであり、カレントサブレイヤにおけるレイヤ間予測が許可されていると判定された場合、処理は、ステップＳ３７３に進む。

ステップＳ３７３において、レイヤ間予測実行制御部２５１は、復号関連情報バッファ２５２を制御し、復号関連情報バッファ２５２に記憶されているベースレイヤの復号に関する情報を、エンハンスメントレイヤ画像復号部２０５に供給させる。ステップＳ３７３の処理が終了すると、レイヤ間予測制御処理が終了し、処理は、図２３に戻る。

また、ステップＳ３７２において、カレントサブレイヤにおけるレイヤ間予測が許可されていないと判定された場合、ベースレイヤの符号化に関する情報の供給は行われずに、レイヤ間予測制御処理が終了し、処理は図２３に戻る。つまり、このカレントサブレイヤに対する符号化においては、レイヤ間予測は行われない。

＜エンハンスメントレイヤ復号処理の流れ＞
次に、図２７のフローチャートを参照して、図２３のステップＳ３０７において実行されるエンハンスメントレイヤ復号処理の流れの例を説明する。

エンハンスメントレイヤ復号処理のステップＳ３９１乃至ステップＳ３９４、並びに、ステップＳ３９６乃至ステップＳ４００の各処理は、ベースレイヤ復号処理のステップＳ３４１乃至ステップＳ３４４、並びに、ステップＳ３４６乃至ステップＳ３５０の各処理と同様に実行される。ただし、エンハンスメントレイヤ復号処理の各処理は、エンハンスメントレイヤ画像復号部２０５の各処理部により、エンハンスメントレイヤ符号化データに対して行われる。

なお、ステップＳ３９５において、イントラ予測部２２１若しくは動き補償部２３２は、エンハンスメントレイヤ符号化データに対して、予測処理を行う。

ステップＳ４００の処理が終了すると、エンハンスメントレイヤ復号処理が終了され、処理は図２３に戻る。エンハンスメントレイヤ復号処理は、例えば、ピクチャ単位で実行される。つまり、カレントレイヤの各ピクチャに対してエンハンスメントレイヤ復号処理が実行される。ただし、エンハンスメントレイヤ復号処理内の各処理は、それぞれの処理単位毎に行われる。

＜予測処理の流れ＞
次に、図２８のフローチャートを参照して、図２７のステップＳ３９５において実行される予測処理の流れの例を説明する。

予測処理が開始されると、動き補償部２３２は、ステップＳ４２１において、予測モードがインター予測であるか否かを判定する。インター予測であると判定した場合、処理はステップＳ４２２に進む。

ステップＳ４２２において、動き補償部２３２は、符号化の際に採用されたインター予測モードである最適インター予測モードがレイヤ間予測を行うモードであるか否かを判定する。最適インター予測モードがレイヤ間予測を行うモードであると判定された場合、処理はステップＳ４２３に進む。

ステップＳ４２３において、動き補償部２３２は、ベースレイヤの復号に関する情報を取得する。ステップＳ４２４において、動き補償部２３２は、ベースレイヤに関する情報を用いて動き補償を行い、レイヤ間予測の予測画像を生成する。ステップＳ４２４の処理が終了すると、処理はステップＳ４２７に進む。

また、ステップＳ４２２において、最適インター予測モードがレイヤ間予測を行うモードでないと判定された場合、処理は、ステップＳ４２５に進む。ステップＳ４２５において、動き補償部２３２は、カレント主レイヤ内で動き補償を行い、予測画像を生成する。ステップＳ４２５の処理が終了すると、処理はステップＳ４２７に進む。

また、ステップＳ４２１において、イントラ予測であると判定された場合、処理はステップＳ４２６に進む。ステップＳ４２６において、イントラ予測部２２１は、符号化の際に採用されたイントラ予測モードである最適イントラ予測モードで予測画像を生成する。ステップＳ４２６の処理が終了すると、処理はステップＳ４２７に進む。

ステップＳ４２７において、選択部２２３は、予測画像を選択し、演算部２１５に供給する。ステップＳ４２７の処理が終了すると、予測処理が終了し、処理が図２７に戻る。

以上のように各処理を実行することにより、スケーラブル復号装置２００は、符号化効率の低減を抑制し、符号化・復号による画質の低減を抑制することができる。

＜３．第３の実施の形態＞
＜主レイヤ毎のサブレイヤ指定＞
以上においては、共通情報として、例えばビデオパラメータセット（VPS）において、パラメータ（vps_max_sub_layers_minus1）によって、各主レイヤにおけるサブレイヤの階層数の最大値を指定するように説明したが、これに限らず、各主レイヤにおけるサブレイヤの階層数を、個別に指定するようにしてもよい。

図２９に、この場合のビデオパラメータセットのシンタクスの例を示す。図２９に示されるように、この場合、ビデオパラメータセット（VPS）において、パラメータ（vps_max_sub_layers_minus1）の代わりに、パラメータ（vps_num_sub_layers_minus1[i]）が設定される。

このパラメータ（vps_num_sub_layers_minus1[i]）は、主レイヤ毎に設定されるパラメータであり、対応する主レイヤにおけるサブレイヤの階層数（サブレイヤ数）を指定する。つまり、このパラメータによって、各主レイヤのサブレイヤ数が個別に指定される。

階層化には様々な方法があり、例えば、主レイヤ毎にサブレイヤ数（例えばGOP構造）が異なるようにすることもできる。図３０に示される例の場合、主レイヤにおいて、下位階層（ベースレイヤ）に比べて上位階層（エンハンスメントレイヤ）の方が、サブレイヤが少ない。また、図３１に示される例の場合、主レイヤにおいて、下位階層（ベースレイヤ）に比べて上位階層（エンハンスメントレイヤ）の方が、サブレイヤが多い。

パラメータ（vps_num_sub_layers_minus1[i]）によって、各主レイヤのサブレイヤ数が個別に指定することにより、スケーラブル符号化装置１００およびスケーラブル復号装置２００は、この値を用いて、レイヤ間予測の、より詳細な（より正確な）制御を行うことができるようになる。

例えば、以上においては、パラメータ（max_sub_layer_for_inter_layer_prediction）の値がパラメータ（vps_max_sub_layers_minus1）以下となるように説明したが、実際には、パラメータ（max_sub_layer_for_inter_layer_prediction）に、ベースレイヤとエンハンスメントレイヤの両方のサブレイヤ数を超えた値を設定しても、実際のサブレイヤ数が最上位レイヤとなる。つまり、レイヤ間予測を正しく制御するためには、ベースレイヤとエンハンスメントレイヤのサブレイヤ数を別途把握しておく必要がある。

そこで、パラメータ（vps_num_sub_layers_minus1[i]）の値を用いて、パラメータ（max_sub_layer_for_inter_layer_prediction）の値を、ベースレイヤのサブレイヤ数と、エンハンスメントレイヤのサブレイヤ数の内、少ない方のサブレイヤ数以下に設定するようにする。このようにすることにより、レイヤ間予測をより容易に正しく制御することができる。

＜共通情報生成部とレイヤ間予測制御部＞
図３２は、この場合の、スケーラブル符号化装置１００の共通情報生成部およびレイヤ間予測制御部の主な構成例を示すブロック図である。この場合、スケーラブル符号化装置１００は、共通情報生成部１０１の代わりに共通情報生成部３０１を有する。

図３２に示されるように、共通情報生成部３０１は、基本的に共通情報生成部１０１と同様の処理部であり、同様の構成を有するが、サブレイヤ最大数設定部１４２とレイヤ間予測実行最大サブレイヤ設定部１４３の代わりに、サブレイヤ数設定部３４２とレイヤ間予測実行最大サブレイヤ設定部３４３を有する。

サブレイヤ数設定部３４２は、対応する主レイヤのサブレイヤ数を指定する情報であるパラメータ（vps_num_sub_layers_minus1[i]）を設定する。サブレイヤ数設定部３４２は、主レイヤ（i）毎に、このパラメータ（vps_num_sub_layers_minus1[i]）を設定する。

レイヤ間予測実行最大サブレイヤ設定部３４３は、サブレイヤ数設定部３４２により設定されたパラメータ（vps_num_sub_layers_minus1[i]）の値に基づいて、対応する主レイヤの、レイヤ間予測を許可するサブレイヤの最上位サブレイヤを指定する情報であるパラメータ（max_sub_layer_for_inter_layer_prediction[i]）を設定する。

このようにすることにより、スケーラブル符号化装置１００は、レイヤ間予測をより容易に正しく制御することができる。

＜共通情報生成処理の流れ＞
この場合の共通情報生成処理の流れの例を、図３３のフローチャートを参照して説明する。共通情報生成処理が開始されると、主レイヤ最大数設定部１４１は、ステップＳ５０１において、パラメータ（max_layer_minus1）を設定する。

ステップＳ５０２において、サブレイヤ数設定部３４２は、各主レイヤについて、パラメータ（vps_num_sub_layers_minus1[i]）を設定する。

ステップＳ５０３において、レイヤ間予測実行最大サブレイヤ設定部３４３は、カレントレイヤおよび参照先レイヤのパラメータ（vps_num_sub_layers_minus1[i]）に基づいて、各主レイヤについて、パラメータ（max_sub_layer_for_inter_layer_prediction[i]）を設定する。

ステップＳ５０４において、共通情報生成部１０１は、ステップＳ５０１乃至ステップＳ５０３において設定された各パラメータを含むビデオパラメータセットを共通情報として生成する。

ステップＳ５０５において、共通情報生成部１０１は、ステップＳ５０４の処理により生成したビデオパラメータセットを、スケーラブル符号化装置１００の外部および符号化制御部１０２に供給する。また、共通情報生成部１０１は、ステップＳ５０３において設定したパラメータ（max_sub_layer_for_inter_layer_prediction[i]）をレイヤ間予測制御部１０４に供給する。

ステップＳ５０５の処理が終了すると、共通情報生成処理が終了し、処理は、図１３に戻る。

このように処理を行うことにより、スケーラブル符号化装置１００は、レイヤ間予測をより容易に正しく制御することができる。

＜４．第４の実施の形態＞
＜共通情報取得部とレイヤ間予測制御部＞
次に、スケーラブル復号装置２００について説明する。図３４は、この場合の、スケーラブル復号装置２００の共通情報取得部およびレイヤ間予測制御部の主な構成例を示すブロック図である。この場合、スケーラブル復号装置２００は、共通情報取得部２０１の代わりに共通情報取得部４０１を有する。

図３４に示されるように、共通情報取得部４０１は、基本的に共通情報取得部２０１と同様の処理部であり、同様の構成を有するが、サブレイヤ最大数取得部２４２とレイヤ間予測実行最大サブレイヤ取得部２４３の代わりに、サブレイヤ数取得部４４２とレイヤ間予測実行最大サブレイヤ取得部４４３を有する。

サブレイヤ数取得部４４２は、符号化側から伝送された共通情報に含まれる、パラメータ（vps_num_sub_layers_minus1[i]）を取得する。レイヤ間予測実行最大サブレイヤ取得部４４３は、符号化側から伝送された共通情報に含まれるパラメータ（max_sub_layer_for_inter_layer_prediction[i]）を取得する。上述したように、このパラメータ（max_sub_layer_for_inter_layer_prediction[i]）は、符号化側においてパラメータ（vps_num_sub_layers_minus1[i]）の値を用いて設定されたものである。

共通情報取得部４０１は、取得した共通情報に含まれる復号に関する情報（例えばビデオパラメータセット（VPS）など）を復号制御部２０２に供給する。さらに、共通情報取得部４０１は、カレント主レイヤのレイヤ間予測を許可するサブレイヤの最上位サブレイヤを指定する情報（max_sub_layer_for_inter_layer_prediction[i]）をレイヤ間予測制御部２０４に供給する。

このようにすることにより、スケーラブル復号装置２００は、レイヤ間予測をより容易に正しく制御することができる。

＜共通情報取得処理の流れ＞
次に、図３５のフローチャートを参照して、図２３のステップＳ３０１において実行される共通情報取得処理の流れの例を説明する。

共通情報取得処理が開始されると、共通情報取得部４０１は、ステップＳ５２１において、符号化側から伝送されたビデオパラメータセット（VPS）を取得する。

ステップＳ５２２において、主レイヤ最大数取得部２４１は、ビデオパラメータセットより、パラメータ（max_layer_minus1）を取得する。

ステップＳ５２３において、サブレイヤ数取得部４４２は、ビデオパラメータセット（VPS）より、各主レイヤについて、パラメータ（vps_num_sub_layers_minus1[i]）を取得する。

ステップＳ５２４において、レイヤ間予測実行最大サブレイヤ取得部４４３は、ビデオパラメータセット（VPS）より、各主レイヤについて、パラメータ（max_sub_layer_for_inter_layer_prediction[i]）を取得する。

ステップＳ５２５において、共通情報取得部４０１は、ビデオパラメータセットから復号の制御に必要な情報を抽出し、それを復号に関する情報として、復号制御部２０２に供給する。また、共通情報取得部４０１は、ステップＳ５２３において設定したパラメータ（max_sub_layer_for_inter_layer_prediction[i]）をレイヤ間予測制御部２０４に供給する。

ステップＳ５２５の処理が終了すると、共通情報取得処理が終了し、処理は、図２３に戻る。

このように処理を行うことにより、スケーラブル復号装置２００は、レイヤ間予測をより容易に正しく制御することができる。

＜５．第５の実施の形態＞
＜主レイヤ共通のレイヤ間予測制御情報＞
以上においては、パラメータ（max_sub_layer_for_inter_layer_prediction[i]）を、主レイヤ毎に設定するように説明したが、これに限らず、この値を、全ての主レイヤに共通の値としてもよい。

さらに、レイヤ間予測制御情報を、主レイヤ毎に設定するか、全主レイヤ共通の値とするかを制御する制御情報（フラグ）を設定するようにしてもよい。

図３６に、この場合のビデオパラメータセットのシンタクスの例を示す。図３６に示されるように、この場合、ビデオパラメータセット（VPS）において、レイヤ間予測制御情報としてどのようなパラメータを設定するかを制御するフラグ（unified_max_sub_layer_for_inter_layer_prediction_flag）が設定される。

このフラグ（unified_max_sub_layer_inter_layer_prediction_flag）が真の場合、全主レイヤ共通のパラメータ（unified_max_sub_layer_for_inter_layer_prediction）が設定される。逆に、フラグ（unified_max_sub_layer_inter_layer_prediction_flag）が偽の場合、パラメータ（max_sub_layer_for_inter_layer_prediction[i]）が主レイヤ毎に設定される。

パラメータ（max_sub_layer_for_inter_layer_prediction[i]）の代わりに、パラメータ（unified_max_sub_layer_for_inter_layer_prediction）を設定することにより、レイヤ間予測制御情報の情報量をさらに低減することができ、レイヤ間予測制御による符号化効率の低減を抑制し、符号化・復号による画質の低減を抑制することができる。

しかしながら、例えば、パラメータを全レイヤ共通の値とすると、情報量は低減されるが、その精度は低減する。そのため、レイヤ間予測の制御を十分に正確に行うことができない場合があり得る。そこで、レイヤ間予測を許可するサブレイヤの最上位サブレイヤを指定する情報を、レイヤ毎に設定するか、全レイヤ共通の値として設定するかを、フラグにより制御するようにすることにより、より多様な状況に対応することができる、より適応的なレイヤ間予測制御を実現することができる。

＜共通情報生成部とレイヤ間予測制御部＞
図３７は、この場合の、スケーラブル符号化装置１００の共通情報生成部およびレイヤ間予測制御部の主な構成例を示すブロック図である。この場合、スケーラブル符号化装置１００は、共通情報生成部１０１の代わりに共通情報生成部５０１を有する。また、スケーラブル符号化装置１００は、レイヤ間予測制御部１０４の代わりにレイヤ間予測制御部５０４を有する。

図３７に示されるように、共通情報生成部５０１は、基本的に共通情報生成部１０１と同様の処理部であり、同様の構成を有するが、レイヤ間予測実行最大サブレイヤ設定部１４３の代わりに共通フラグ設定部５４３とレイヤ間予測実行最大サブレイヤ設定部５４４を有する。

共通フラグ設定部５４３は、レイヤ間予測制御情報としてどのようなパラメータを設定するかを制御するフラグ（unified_max_sub_layer_inter_layer_prediction_flag）を設定する。

レイヤ間予測実行最大サブレイヤ設定部５４４は、共通フラグ設定部５４３が設定したフラグ（unified_max_sub_layer_inter_layer_prediction_flag）の値と、サブレイヤ最大数設定部１４２により設定されたパラメータ（vps_max_sub_layers_minus1）の値とに基づいて、レイヤ間予測を許可するサブレイヤの最上位サブレイヤを指定する情報を設定する。例えば、フラグ（unified_max_sub_layer_inter_layer_prediction_flag）が真である場合、レイヤ間予測実行最大サブレイヤ設定部５４４は、全主レイヤ共通のパラメータ（unified_max_sub_layer_for_inter_layer_prediction）を設定する。また、例えば、フラグ（unified_max_sub_layer_inter_layer_prediction_flag）が偽である場合、レイヤ間予測実行最大サブレイヤ設定部５４４は、主レイヤ毎のパラメータ（max_sub_layer_for_inter_layer_prediction[i]）を設定する。

このようにすることにより、スケーラブル符号化装置１００は、レイヤ間予測をより適応的に制御することができる。

＜共通情報生成処理の流れ＞
この場合の共通情報生成処理の流れの例を、図３８のフローチャートを参照して説明する。共通情報生成処理が開始されると、主レイヤ最大数設定部１４１は、ステップＳ６０１において、パラメータ（max_layer_minus1）を設定する。ステップＳ６０２において、サブレイヤ最大数設定部１４２は、パラメータ（vps_max_sub_layers_minus1）を設定する。

ステップＳ６０３において、共通フラグ設定部５４３は、どのようなパラメータを設定するかを制御するフラグ（unified_max_sub_layer_inter_layer_prediction_flag）を設定する。

ステップＳ６０４において、レイヤ間予測実行最大サブレイヤ設定部５４４は、フラグ（unified_max_sub_layer_inter_layer_prediction_flag）の値が真であるか否かを判定する。真であると判定された場合、処理はステップＳ６０５に進む。

ステップＳ６０５において、レイヤ間予測実行最大サブレイヤ設定部５４４は、全主レイヤ共通のパラメータ（unified_max_sub_layer_for_inter_layer_prediction）を設定する。ステップＳ６０５の処理が終了すると、処理はステップＳ６０７に進む。

また、ステップＳ６０４において、偽であると判定された場合、処理はステップＳ６０６に進む。ステップＳ６０６において、レイヤ間予測実行最大サブレイヤ設定部５４４は、主レイヤ毎のパラメータ（max_sub_layer_for_inter_layer_prediction[i]）を設定する。ステップＳ６０６の処理が終了すると、処理はステップＳ６０７に進む。

ステップＳ６０７において、共通情報生成部５０１は、ステップＳ６０１乃至ステップＳ６０６において設定された各パラメータを含むビデオパラメータセットを共通情報として生成する。

ステップＳ６０８において、共通情報生成部５０１は、ステップＳ６０７の処理により生成したビデオパラメータセットを、スケーラブル符号化装置１００の外部および符号化制御部１０２に供給する。また、共通情報生成部５０１は、ステップＳ５０３において設定したパラメータ（max_sub_layer_for_inter_layer_prediction[i]）をレイヤ間予測制御部５０４に供給する。

ステップＳ６０８の処理が終了すると、共通情報生成処理が終了し、処理は、図１３に戻る。

＜レイヤ間予測制御処理の流れ＞
次に、この場合のレイヤ間予測制御処理の流れの例を、図３９のフローチャートを参照して説明する。

レイヤ間予測制御処理が開始されると、レイヤ間予測実行制御部５５１は、ステップＳ６２１において、フラグ（unified_max_sub_layer_inter_layer_prediction_flag）の値が真であるか否かを判定する。真であると判定された場合、処理はステップＳ６２２に進む。

ステップＳ６２２において、レイヤ間予測実行制御部５５１は、全主レイヤ共通のパラメータ（unified_max_sub_layer_for_inter_layer_prediction）を参照する。ステップＳ６２２の処理が終了すると、処理は、ステップＳ６２４に進む。

また、ステップＳ６２１において、偽であると判定された場合、処理はステップＳ６２３に進む。

ステップＳ６２３において、レイヤ間予測実行制御部５５１は、主レイヤ毎のパラメータ（max_sub_layer_for_inter_layer_prediction[i]）を参照する。ステップＳ６２３の処理が終了すると、処理は、ステップＳ６２４に進む。

ステップＳ６２４において、レイヤ間予測実行制御部５５１は、これらの情報に基づいて、カレントサブレイヤがレイヤ間予測を行うレイヤであるか否かを判定する。レイヤ間予測を行うレイヤであると判定された場合、処理は、ステップＳ６２５に進む。

ステップＳ６２５において、レイヤ間予測実行制御部５５１は、符号化関連情報バッファ１５２を制御し、符号化関連情報バッファ１５２に記憶されているベースレイヤの符号化に関する情報を、エンハンスメントレイヤ画像符号化部１０５に供給させる。ステップＳ６２４の処理が終了すると、レイヤ間予測制御処理が終了し、処理は、図１３に戻る。

また、ステップＳ６２４において、カレントサブレイヤにおけるレイヤ間予測が許可されていないと判定された場合、ベースレイヤの符号化に関する情報の供給は行われずに、レイヤ間予測制御処理が終了し、処理は図１３に戻る。つまり、このカレントサブレイヤに対する符号化においては、レイヤ間予測は行われない。

以上のように各処理を行うことにより、スケーラブル符号化装置１００は、レイヤ間予測をより容易に正しく制御することができる。

＜６．第６の実施の形態＞
＜共通情報取得部とレイヤ間予測制御部＞
次にスケーラブル復号装置２００について説明する。図４０は、この場合の共通情報生成部およびレイヤ間予測制御部の主な構成例を示すブロック図である。

図４０に示されるように、この場合、スケーラブル復号装置２００は、共通情報取得部２０１の代わりに共通情報取得部６０１を有する。また、レイヤ間予測制御部２０４の代わりにレイヤ間予測制御部６０４を有する。

共通情報取得部６０１は、基本的に共通情報取得部２０１と同様の処理部であり、同様の構成を有するが、レイヤ間予測実行最大サブレイヤ取得部２４３の代わりに、共通フラグ取得部６４３とレイヤ間予測実行最大サブレイヤ取得部６４４を有する。

共通フラグ取得部６４３は、レイヤ間予測制御情報としてどのようなパラメータを設定するかを制御するフラグ（unified_max_sub_layer_inter_layer_prediction_flag）を取得する。

レイヤ間予測実行最大サブレイヤ取得部６４４は、例えば、フラグ（unified_max_sub_layer_inter_layer_prediction_flag）が真である場合、全主レイヤ共通のパラメータ（unified_max_sub_layer_for_inter_layer_prediction）を取得する。また、例えば、フラグ（unified_max_sub_layer_inter_layer_prediction_flag）が偽である場合、レイヤ間予測実行最大サブレイヤ設定部３４３は、主レイヤ毎のパラメータ（max_sub_layer_for_inter_layer_prediction[i]）を取得する。

共通情報取得部６０１は、取得した共通情報に含まれる復号に関する情報（例えばビデオパラメータセット（VPS）など）を復号制御部２０２に供給する。さらに、共通情報取得部６０１は、パラメータ（unified_max_sub_layer_for_inter_layer_prediction）若しくは、パラメータ（max_sub_layer_for_inter_layer_prediction[i]）をレイヤ間予測制御部６０４に供給する。

レイヤ間予測実行制御部６５１は、共通情報取得部６０１から供給されるパラメータ（unified_max_sub_layer_for_inter_layer_prediction）若しくは、パラメータ（max_sub_layer_for_inter_layer_prediction[i]）に基づいて、復号関連情報バッファ２５２の読み出しを制御し、レイヤ間予測の実行を制御する。

このようにすることにより、スケーラブル復号装置２００は、レイヤ間予測をより適応的に制御することができる。

＜共通情報取得処理の流れ＞
次に、図４１のフローチャートを参照して、図２３のステップＳ３０１において実行される共通情報取得処理の流れの例を説明する。

共通情報取得処理が開始されると、共通情報取得部６０１は、ステップＳ６４１において、符号化側から伝送されたビデオパラメータセット（VPS）を取得する。

ステップＳ６４２において、主レイヤ最大数取得部２４１は、ビデオパラメータセットより、パラメータ（max_layer_minus1）を取得する。

ステップＳ６４３において、サブレイヤ最大数取得部２４２は、ビデオパラメータセット（VPS）より、パラメータ（vps_max_sub_layers_minus1）を取得する。

ステップＳ６４４において、共通フラグ取得部６４３は、ビデオパラメータセット（VPS）より、フラグ（unified_max_sub_layer_inter_layer_prediction_flag）を取得する。

ステップＳ６４５において、レイヤ間予測実行最大サブレイヤ取得部６４４は、フラグ（unified_max_sub_layer_inter_layer_prediction_flag）の値が真であるか否かを判定する。真であると判定された場合、処理はステップＳ６４６に進む。

ステップＳ６４６において、レイヤ間予測実行最大サブレイヤ取得部６４４は、ビデオパラメータセット（VPS）より、全レイヤ共通のパラメータ（unified_max_sub_layer_for_inter_layer_prediction）を取得する。ステップＳ６４６の処理が終了すると、処理はステップＳ６４８に進む。

また、ステップＳ６４５において、偽であると判定された場合、処理はステップＳ６４７に進む。ステップＳ６４７において、レイヤ間予測実行最大サブレイヤ取得部６４４は、ビデオパラメータセット（VPS）より、各主レイヤについて、パラメータ（max_sub_layer_for_inter_layer_prediction[i]）を取得する。ステップＳ６４７の処理が終了すると、処理はステップＳ６４８に進む。

ステップＳ６４８において、共通情報取得部６０１は、ビデオパラメータセットから復号の制御に必要な情報を抽出し、それを復号に関する情報として、復号制御部２０２に供給する。また、共通情報取得部６０１は、ステップＳ６４６において設定したパラメータ（unified_max_sub_layer_for_inter_layer_prediction）、若しくは、ステップＳ６４７において設定したパラメータ（max_sub_layer_for_inter_layer_prediction[i]）をレイヤ間予測制御部６０４に供給する。

ステップＳ６４８の処理が終了すると、共通情報取得処理が終了し、処理は図２３に戻る。

＜レイヤ間予測制御処理の流れ＞
次に、この場合のレイヤ間予測制御処理の流れの例を、図４２のフローチャートを参照して説明する。

レイヤ間予測制御処理が開始されると、レイヤ間予測実行制御部６５１は、ステップＳ６６１において、フラグ（unified_max_sub_layer_inter_layer_prediction_flag）の値が真であるか否かを判定する。真であると判定された場合、処理はステップＳ６６２に進む。

ステップＳ６６２において、レイヤ間予測実行制御部６５１は、パラメータ（unified_max_sub_layer_for_inter_layer_prediction）を参照する。ステップＳ６６２の処理が終了すると、処理はステップＳ６６４に進む。

また、ステップＳ６６１において偽であると判定された場合、処理は、ステップＳ６６３に進む。

ステップＳ６６３において、レイヤ間予測実行制御部６５１は、パラメータ（max_sub_layer_for_inter_layer_prediction[i]）を参照する。ステップＳ６６３の処理が終了すると、処理はステップＳ６６４に進む。

ステップＳ６６４において、レイヤ間予測実行制御部６５１は、ステップＳ６６２若しくはステップＳ６６３において参照したパラメータの値に基づいて、カレントピクチャのカレントサブレイヤが、レイヤ間予測を行うレイヤであるか否かを判定する。カレントサブレイヤにおけるレイヤ間予測が許可されていると判定された場合、処理は、ステップＳ６６５に進む。

ステップＳ６６５において、レイヤ間予測実行制御部６５１は、復号関連情報バッファ２５２を制御し、復号関連情報バッファ２５２に記憶されているベースレイヤの復号に関する情報を、エンハンスメントレイヤ画像復号部２０５に供給させる。ステップＳ６６５の処理が終了すると、レイヤ間予測制御処理が終了し、処理は、図２３に戻る。

また、ステップＳ６６４において、カレントサブレイヤにおけるレイヤ間予測が許可されていないと判定された場合、ベースレイヤの符号化に関する情報の供給は行われずに、レイヤ間予測制御処理が終了し、処理は図２３に戻る。つまり、このカレントサブレイヤに対する符号化においては、レイヤ間予測は行われない。

以上のように各処理を実行することにより、スケーラブル復号装置２００は、レイヤ間予測をより適応的に制御することができる。

＜７．概要２＞
レイヤ間予測について、例えばHEVCにおいては、Liwei Guo (Chair), Yong He, Do-Kyoung Kwon, Jinwen Zan, Haricharan Lakshman, Jung Won Kang, "Description of Tool Experiment A2: Inter-layer Texture Prediction Signaling in SHVC", JCTVC-K1102, Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 1111th Meeting: Shanghai, CN, 10-19 Oct. 2012において、階層間でピクセル（Pixel）情報を用いた予測に関する検討がなされている。

また、Vadim Seregin, Patrice Onno, Shan Liu, Tammy Lee, Chulkeun Kim, Haitao Yang, Haricharan Laksman, "Description of Tool Experiment C5: Inter-layer syntax prediction using HEVC base layer", JCTVC-K1105, Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 1111th Meeting: Shanghai, CN, 10-19 Oct. 2012において、階層間でシンタクス（Syntax）情報（例えば、イントラ予測モード情報や動き情報等）を用いた予測に関する検討がなされている。

このピクセル情報を用いた予測であるピクセル予測と、シンタクス情報を用いた予測であるシンタクス予測とで、図４３を参照して特徴を比較する。

まず、ピクセル予測について、当該画像（カレントピクチャ）と同じレイヤのピクチャを参照画像（リファレンスピクチャ）とするレイヤ内予測（Intra-layer Prediction）と、カレントピクチャと異なるレイヤのピクチャをリファレンスピクチャとするレイヤ間予測（Inter-layer Prediction）とを比較する。

ピクセル予測の場合、レイヤ内予測におけるリファレンスピクチャとカレントピクチャの時間軸上の距離（予測距離とも称する）が遠いとその予測効率が高くならず、相対的に、レイヤ間予測の性能が高くなる。これに対して、レイヤ内予測における予測距離が近いとその予測効率が高くなり、相対的に、レイヤ間予測の性能が高くなくなる。

つまり、図４３に示されるように、参照画像と当該画像の時間軸上の距離が長い階層のピクチャ、すなわち、よりサブレイヤ（temporal layer depth）の低いピクチャでは、レイヤ内インター予測の予測精度が低減する可能性が高い。そのため、レイヤ内予測（intra-layer）では、インターピクチャであってもイントラ予測により符号化される可能性が高い。しかしながらレイヤ間ピクセル予測（Inter-layer Pixel Prediction）の予測精度は高いので、レイヤ内イントラ予測の場合よりも符号化効率の向上を期待することができる。

これに対して、参照画像と当該画像の時間軸上の距離が短い階層のピクチャ、すなわち、よりサブレイヤ（temporal layer depth）の高いピクチャに関しては、レイヤ内予測（intra-layer）によるインター予測が効率的である。そのため、レイヤ間ピクセル予測（Inter-layer Pixel Prediction）を適用しても、レイヤ内インター予測の場合と比べて符号化効率の大幅な向上を期待することができない。

また、ピクセル予測は、画像情報をレイヤ間で共有するためにメモリに格納する必要がある。そのため、メモリアクセスが増大する。

これに対して、レイヤ間でのシンタクスの相関性は高く、カレントピクチャのサブレイヤに関わらず、レイヤ間予測の予測効率は相対的に高い。つまり、図４３に示されるように、動き情報やイントラ予測モード情報といったシンタクス（Syntax）情報は、どのサブレイヤであっても、レイヤ間（BaselayerとEnhancementlayerとの間）で高い相関関係を有する。そのため、カレントピクチャのサブレイヤに依存せずに、レイヤ間シンタクス予測（Inter-layer Syntax Prediction）による符号化効率の向上を期待することができる。

また、シンタクス予測の場合、シンタクス情報をレイヤ間で共有すればよいので、メモリのアクセスはピクセル予測の場合ほど増大しない。つまり、レイヤ間シンタクス予測（Inter-layer Syntax Prediction）のために格納しておくべき情報は、各PU（Prediction Unit）毎に１つの予測モード情報若しくは動き情報であり、全ての画素を保存しておくべきレイヤ間ピクセル予測（Inter-layer Pixel Prediction）に比して、メモリアクセスの増大は低い。

以上のように、互いに異なる特徴を有するピクセル予測とシンタクス予測を同様に制御すると、符号化効率を十分に向上させることができない恐れがあった。

そこで、第１の実施の形態乃至第６の実施の形態において上述したようなレイヤ間予測の制御において、ピクセル予測とシンタクス予測とを互いに独立に制御するようにしてもよい。つまり、レイヤ間ピクセル予測とレイヤ間シンタクス予測のオン／オフ制御を互いに独立に行うようにしてもよい。

例えば、レイヤ間ピクセル予測（Inter-layer Pixel Prediction）のオン／オフ（on/off）を制御する情報と、レイヤ間シンタクス予測（Inter-layer Syntax Prediction）のオン／オフ（on/off）を制御する情報とを、互いに独立に符号化するようにしてもよい。

レイヤ間ピクセル予測（Inter-layer Pixel Prediction）については、どのサブレイヤ（時間階層とも称する）まで予測処理を行うかを制御する情報を、出力となる画像圧縮情報の、例えばビデオパラメータセット（VPS（Video Parameter Set）若しくは拡張ビデオパラメータセット（vps_extension）において伝送するようにしてもよい。また、このようなレイヤ間ピクセル予測に関する制御情報をナルユニット（nal_unit）において伝送するようにしてもよい。

また、レイヤ間シンタクス予測（Inter-layer Syntax Prediction）については、ピクチャ（Picture）若しくはスライス（Slice）毎にレイヤ間シンタクス予測の実行（オン／オフ（on/off））を制御する制御情報を、出力となる画像圧縮情報の、例えばピクチャパラメータセット（PPS（Picture Parameter Set）若しくはスライスヘッダ（SliceHeader）において伝送するようにしてもよい。また、このようなレイヤ間シンタクス予測に関する制御情報をナルユニット（nal_unit）において伝送するようにしてもよい。

なお、以上のようなレイヤ間予測の制御は、ベースレイヤ（Baselayer）がAVCで符号化される場合であっても適用することができる。

以上のような処理を行うことにより、演算量と符号化効率のトレードオフ（trade-off）を適切に行うことができる。

＜８．第７の実施の形態＞
＜共通情報生成部とレイヤ間予測制御部＞
図４４は、＜７．概要２＞において上述した場合の、スケーラブル符号化装置１００の共通情報生成部およびレイヤ間予測制御部の主な構成例を示すブロック図である。図４４に示されるように、この場合、スケーラブル符号化装置１００は、共通情報生成部１０１の代わりに共通情報生成部７０１を有し、レイヤ間予測制御部１０４の代わりに、レイヤ間予測制御部７０４を有する。

図４４に示されるように、共通情報生成部７０１は、レイヤ間ピクセル予測制御情報設定部７１１を有する。

レイヤ間ピクセル予測制御情報設定部７１１は、エンハンスメントレイヤにおけるレイヤ間ピクセル予測の実行（オン／オフ）を制御する制御情報であるレイヤ間ピクセル予測制御情報を設定する。レイヤ間ピクセル予測制御情報は、例えば、レイヤ間ピクセル予測の実行を許可する最上位のサブレイヤを指定する情報である。この場合、エンハンスメントレイヤにおいては、最下位から、このレイヤ間ピクセル予測制御情報により指定されるレイヤまでのサブレイヤにおいて、レイヤ間ピクセル予測が行われ、レイヤ間ピクセル予測制御情報により指定されるレイヤよりも上位のサブレイヤにおいては、レイヤ間ピクセル予測が禁止される。

なお、レイヤ間ピクセル予測制御情報設定部７１１が、このようなレイヤ間ピクセル予測制御情報を、エンハンスメントレイヤ毎に設定するようにしても良いし、全エンハンスメントレイヤに共通の制御情報として設定するようにしても良い。

また、レイヤ間ピクセル予測制御情報設定部７１１は、任意の情報に基づいて、レイヤ間ピクセル予測制御情報を設定することができる。例えば、この設定が、ユーザの指示に基づいて行われるようにしてもよいし、ハードウエアやソフトウエア等の条件に基づいて行われるようにしても良い。

レイヤ間ピクセル予測制御情報設定部７１１は、設定したレイヤ間ピクセル予測制御情報をレイヤ間予測制御部７０４（レイヤ間ピクセル予測制御部７２２）に供給する。また、レイヤ間ピクセル予測制御情報設定部７１１は、このレイヤ間ピクセル予測制御情報を、共通情報として、例えばビデオパラメータセット（VPS（Video Parameter Set）若しくは拡張ビデオパラメータセット（vps_extension）において伝送させる。また、レイヤ間ピクセル予測制御情報設定部７１１が、このレイヤ間ピクセル予測制御情報を、ナルユニット（nal_unit）において伝送させるようにしてもよい。

また、図４４に示されるように、レイヤ間予測制御部７０４は、アップサンプル部７２１、レイヤ間ピクセル予測制御部７２２、ベースレイヤピクセルバッファ７２３、ベースレイヤシンタクスバッファ７２４、レイヤ間シンタクス予測制御情報設定部７２５、および、レイヤ間シンタクス予測制御部７２６を有する。

アップサンプル部７２１は、ベースレイヤ画像符号化部１０３のフレームメモリ１２２からベースレイヤの復号画像（ベースレイヤ復号画像とも称する）を取得すると、そのベースレイヤ復号画像を、ベースレイヤとエンハンスメントレイヤの解像度等の比に応じて、アップサンプル処理（解像度変換処理）する。アップサンプル部７２１は、アップサンプル処理されたベースレイヤ復号画像（アップサンプル復号画像とも称する）をベースレイヤピクセルバッファ７２３に供給する。

レイヤ間ピクセル予測制御部７２２は、レイヤ間ピクセル予測制御情報設定部７１１からレイヤ間ピクセル予測制御情報を取得すると、その情報にしたがって、エンハンスメントレイヤの符号化におけるレイヤ間ピクセル予測の実行を制御する。つまり、レイヤ間ピクセル予測制御部７２２は、レイヤ間ピクセル予測制御情報に従って、ベースレイヤピクセルバッファ７２３に記憶されているベースレイヤのアップサンプル復号画像の、エンハンスメントレイヤ画像符号化部１０５への供給を制御する。

より具体的には、レイヤ間ピクセル予測制御部７２２は、エンハンスメントレイヤ画像符号化部１０５の符号化対象であるカレントピクチャが属するサブレイヤが、レイヤ間ピクセル予測制御情報によってレイヤ間ピクセル予測を許可されたレイヤである場合、ベースレイヤピクセルバッファ７２３に記憶されているアップサンプル復号画像の供給を許可する。また、レイヤ間ピクセル予測制御部７２２は、そのカレントピクチャが属するサブレイヤが、レイヤ間ピクセル予測制御情報によってレイヤ間ピクセル予測を禁止されたレイヤである場合、ベースレイヤピクセルバッファ７２３に記憶されているアップサンプル復号画像の供給を禁止する。

また、レイヤ間ピクセル予測制御部７２２は、エンハンスメントレイヤ画像符号化部１０５の動き予測・補償部１３５に対して、レイヤ間ピクセル予測制御情報を供給することにより、エンハンスメントレイヤ画像符号化部１０５の動き予測・補償部１３５によるレイヤ間ピクセル予測の実行を制御する。

ベースレイヤピクセルバッファ７２３は、アップサンプル部７２１から供給されるアップサンプル復号画像を記憶し、レイヤ間ピクセル予測制御部７２２の制御に従って、適宜、そのアップサンプル復号画像を、レイヤ間ピクセル予測の参照画像（リファレンス）として、エンハンスメントレイヤ画像符号化部１０５のフレームメモリ１２２に供給する。エンハンスメントレイヤ画像符号化部１０５の動き予測・補償部１３５は、レイヤ間ピクセル予測を行う場合、そのフレームメモリ１２２に記憶されたベースレイヤのアップサンプル復号画像を参照画像として使用する。

ベースレイヤシンタクスバッファ７２４は、ベースレイヤ画像符号化部１０３のイントラ予測部１２４から予測モード情報等のシンタクス情報（ベースレイヤシンタクスとも称する）を取得し、記憶する。また、ベースレイヤシンタクスバッファ７２４は、ベースレイヤ画像符号化部１０３の動き予測・補償部１２５から動き情報等のシンタクス情報（ベースレイヤシンタクスとも称する）を取得し、記憶する。

ベースレイヤシンタクスバッファ７２４は、レイヤ間シンタクス予測制御部７２６の制御に従って、適宜、そのベースレイヤシンタクスを、エンハンスメントレイヤ画像符号化部１０５のイントラ予測部１２４や動き予測・補償部１３５に供給する。

より具体的には、例えば、ベースレイヤシンタクスバッファ７２４は、エンハンスメントレイヤ画像符号化部１０５のイントラ予測部１２４のイントラ予測の処理対象であるカレントピクチャに対するレイヤ間シンタクス予測がレイヤ間シンタクス予測制御部７２６により許可されている場合、記憶している予測モード情報等のベースレイヤシンタクスを、エンハンスメントレイヤ画像符号化部１０５のイントラ予測部１２４に供給する。エンハンスメントレイヤ画像符号化部１０５のイントラ予測部１２４は、このように供給されたベースレイヤシンタクス（予測モード情報等）を用いて、レイヤ間シンタクス予測を行う。

また、例えば、ベースレイヤシンタクスバッファ７２４は、エンハンスメントレイヤ画像符号化部１０５の動き予測・補償部１３５のインター予測の処理対象であるカレントピクチャに対するレイヤ間シンタクス予測がレイヤ間シンタクス予測制御部７２６により許可されている場合、記憶している動き情報等のベースレイヤシンタクスを、エンハンスメントレイヤ画像符号化部１０５の動き予測・補償部１３５に供給する。エンハンスメントレイヤ画像符号化部１０５の動き予測・補償部１３５は、このように供給されたベースレイヤシンタクス（動き情報等）を用いて、レイヤ間シンタクス予測を行う。

レイヤ間シンタクス予測制御情報設定部７２５は、エンハンスメントレイヤにおけるレイヤ間シンタクス予測の実行（オン／オフ）を制御する制御情報であるレイヤ間シンタクス予測制御情報を設定する。レイヤ間シンタクス予測制御情報は、例えば、ピクチャ若しくはスライス毎にレイヤ間シンタクス予測の実行を許可するか否かを指定する情報である。

レイヤ間シンタクス予測制御情報設定部７２５は、任意の情報に基づいて、このレイヤ間シンタクス予測制御情報を設定することができる。例えば、この設定が、ユーザの指示に基づいて行われるようにしてもよいし、ハードウエアやソフトウエア等の条件に基づいて行われるようにしても良い。

レイヤ間シンタクス予測制御情報設定部７２５は、設定したレイヤ間シンタクス予測制御情報をレイヤ間シンタクス予測制御部７２６に供給する。

レイヤ間シンタクス予測制御部７２６は、レイヤ間シンタクス予測制御情報設定部７２５からレイヤ間シンタクス予測制御情報を取得する。レイヤ間シンタクス予測制御部７２６は、そのレイヤ間シンタクス予測制御情報にしたがって、エンハンスメントレイヤの符号化におけるレイヤ間シンタクス予測の実行を制御する。つまり、レイヤ間シンタクス予測制御部７２６は、レイヤ間シンタクス予測制御情報に従って、ベースレイヤシンタクスバッファ７２４に記憶されているベースレイヤシンタクスの、エンハンスメントレイヤ画像符号化部１０５への供給を制御する。

より具体的には、レイヤ間シンタクス予測制御部７２６は、エンハンスメントレイヤ画像符号化部１０５の符号化対象であるカレントピクチャ（若しくは、符号化対象であるカレントスライス）が、レイヤ間シンタクス予測制御情報によってレイヤ間シンタクス予測を許可されたピクチャ（若しくはスライス）である場合、ベースレイヤシンタクスバッファ７２４に記憶されているベースレイヤシンタクスの供給を許可する。また、レイヤ間シンタクス予測制御部７２６は、そのカレントピクチャ（若しくはカレントスライス）が、レイヤ間シンタクス予測制御情報によってレイヤ間シンタクス予測を禁止されたピクチャ（若しくはスライス）である場合、ベースレイヤシンタクスバッファ７２４に記憶されているベースレイヤシンタクスの供給を禁止する。

また、レイヤ間シンタクス予測制御部７２６は、エンハンスメントレイヤ画像符号化部１０５のイントラ予測部１２４や動き予測・補償部１３５に対して、レイヤ間シンタクス予測制御情報を供給することにより、エンハンスメントレイヤ画像符号化部１０５のイントラ予測部１２４や動き予測・補償部１３５によるレイヤ間シンタクス予測の実行を制御する。

以上のようにすることにより、スケーラブル符号化装置１００は、レイヤ間ピクセル予測およびレイヤ間シンタクス予測を、それぞれ、より容易かつ適切に制御することができ、演算量と符号化効率のトレードオフ（trade-off）をより適切に行うことができる。つまり、スケーラブル符号化装置１００は、レイヤ間予測をより適応的に制御し、符号化効率の低減を抑制することができる。

＜共通情報生成処理の流れ＞
この場合の共通情報生成処理の流れの例を、図４５のフローチャートを参照して説明する。共通情報生成処理が開始されると、共通情報生成部７０１は、ステップＳ７０１において、パラメータ（max_layer_minus1）を設定する。

ステップＳ７０２において、共通情報生成部７０１は、各主レイヤについて、パラメータ（vps_num_sub_layers_minus1[i]）を設定する。

ステップＳ７０３において、レイヤ間ピクセル予測制御情報設定部７１１は、各主レイヤについて、レイヤ間ピクセル予測制御情報を設定する。

ステップＳ７０４において、共通情報生成部７０１は、ステップＳ７０１乃至ステップＳ７０３において設定された各種情報を含むビデオパラメータセットを共通情報として生成する。

ステップＳ７０５において、共通情報生成部７０１は、ステップＳ７０４の処理により生成したビデオパラメータセットを、スケーラブル符号化装置１００の外部に供給し、伝送させる。

ステップＳ７０５の処理が終了すると、共通情報生成処理が終了し、処理は、図１３に戻る。

＜ベースレイヤ符号化処理の流れ＞
次に、図４６のフローチャートを参照して、この場合のベースレイヤ符号化処理の流れの例を説明する。

この場合、ベースレイヤ符号化処理が開始されると、ステップＳ７１１乃至ステップＳ７２３の各処理が、図１５のステップＳ１４１乃至ステップＳ１５３の各処理と同様に実行される。

ステップＳ７２４において、アップサンプル部７２１は、ステップＳ７２２の処理により得られたベースレイヤ復号画像をアップサンプルする。

ステップＳ７２５において、ベースレイヤピクセルバッファ７２３は、ステップＳ７２４の処理により得られたアップサンプル復号画像を記憶する。

ステップＳ７２６において、ベースレイヤシンタクスバッファ７２４は、ステップＳ７１３のイントラ予測処理やステップＳ７１４のインター動き予測処理等において得られたベースレイヤシンタクスを記憶する。

そして、ステップＳ７２７乃至ステップＳ７２９の各処理が、図１５のステップＳ１５５乃至ステップＳ１５７の各処理と同様に実行される。

ステップＳ７２９の処理が終了すると、ベースレイヤ符号化処理が終了し、処理は図１３に戻る。ベースレイヤ符号化処理は、例えば、ピクチャ単位で実行される。つまり、カレントレイヤの各ピクチャに対してベースレイヤ符号化処理が実行される。ただし、ベースレイヤ符号化処理内の各処理は、それぞれの処理単位毎に行われる。

＜レイヤ間予測制御処理の流れ＞
次に、図４７のフローチャートを参照して、この場合のレイヤ間予測制御処理の流れの例を説明する。

レイヤ間予測制御処理が開始されると、レイヤ間ピクセル予測制御部７２２は、ステップＳ７３１において、図４５のステップＳ７０３の処理により設定されたレイヤ間ピクセル予測制御情報を参照する。

ステップＳ７３２において、レイヤ間ピクセル予測制御部７２２は、エンハンスメントレイヤのカレントピクチャのサブレイヤが、レイヤ間ピクセル予測を行うレイヤであるか否かを判定する。レイヤ間ピクセル予測を行うと判定された場合、処理はステップＳ７３３に進む。

ステップＳ７３３において、ベースレイヤピクセルバッファ７２３は、記憶しているアップサンプル復号画像を、エンハンスメントレイヤ画像符号化部１０５のフレームメモリ１２２に供給する。

ステップＳ７３３の処理が終了すると、処理はステップＳ７３４に進む。また、ステップＳ７３２において、レイヤ間ピクセル予測を行わないと判定された場合、処理はステップＳ７３４に進む。

ステップＳ７３４において、レイヤ間シンタクス予測制御情報設定部７２５は、レイヤ間シンタクス予測制御情報を設定する。

ステップＳ７３５において、レイヤ間シンタクス予測制御部７２６は、ステップＳ７３４において設定されたレイヤ間シンタクス予測制御情報を参照し、エンハンスメントレイヤのカレントピクチャ（若しくはスライス）がレイヤ間シンタクス予測を行うピクチャ（若しくはスライス）であるか否かを判定する。レイヤ間シンタクス予測を行うと判定された場合、処理はステップＳ７３６に進む。

ステップＳ７３６において、ベースレイヤシンタクスバッファ７２４は、記憶しているベースレイヤシンタクスを、エンハンスメントレイヤ画像符号化部１０５のイントラ予測部１２４若しくは動き予測・補償部１３５に供給する。

ステップＳ７３６の処理が終了すると、レイヤ間予測制御処理が終了し、処理は図１３に戻る。また、図４７のステップＳ７３５において、レイヤ間シンタクス予測を行わないと判定された場合、レイヤ間予測制御処理が終了し、処理は図１３に戻る。

＜エンハンスメントレイヤ符号化処理の流れ＞
次に、図４８のフローチャートを参照して、この場合のエンハンスメントレイヤ符号化処理の流れの例を説明する。

エンハンスメントレイヤ符号化処理のステップＳ７４１およびステップＳ７４２、並びに、ステップＳ７４５乃至ステップＳ７５６の各処理は、ベースレイヤ符号化処理のステップＳ７１１およびステップＳ７１２、ステップＳ７１５乃至ステップＳ７２３、並びに、ステップＳ７２７乃至ステップＳ７２９の各処理（図４６）と同様に実行される。ただし、エンハンスメントレイヤ符号化処理の各処理は、エンハンスメントレイヤ画像符号化部１０５の各処理部により、エンハンスメントレイヤ画像情報に対して行われる。

なお、図４８のステップＳ７４３において、エンハンスメントレイヤ画像符号化部１０５のイントラ予測部１２４は、エンハンスメントレイヤについての、レイヤ間シンタクス予測にも対応したイントラ予測処理を行う。

また、ステップＳ７４４において、動き予測・補償部１３５は、エンハンスメントレイヤについての、レイヤ間ピクセル予測およびレイヤ間シンタクス予測にも対応した動き予測・補償処理を行う。

ステップＳ７５６の処理が終了すると、エンハンスメントレイヤ符号化処理が終了し、処理は図１３に戻る。エンハンスメントレイヤ符号化処理は、例えば、ピクチャ単位で実行される。つまり、カレントレイヤの各ピクチャに対してエンハンスメントレイヤ符号化処理が実行される。ただし、エンハンスメントレイヤ符号化処理内の各処理は、それぞれの処理単位毎に行われる。

＜動き予測・補償処理の流れ＞
次に、図４９のフローチャートを参照して、図４８のステップＳ７４４において実行される動き予測・補償処理の流れの例を説明する。

動き予測・補償処理が開始されると、動き予測・補償部１３５は、ステップＳ７６１において、カレント主レイヤ内で動き予測を行う。

ステップＳ７６２において、動き予測・補償部１３５は、カレントピクチャについて、レイヤ間ピクセル予測を行うか否かを判定する。レイヤ間ピクセル予測制御部７２２から供給されたレイヤ間ピクセル予測制御情報に基づいて、レイヤ間ピクセル予測を行うと判定された場合、処理はステップＳ７６３に進む。

ステップＳ７６３において、動き予測・補償部１３５は、フレームメモリ１２２からベースレイヤのアップサンプル復号画像を取得する。ステップＳ７６４において、動き予測・補償部１３５は、ステップＳ７６３において取得したアップサンプル復号画像を参照してレイヤ間ピクセル予測を行う。ステップＳ７６４の処理が終了すると、処理はステップＳ７６５に進む。

また、ステップＳ７６２において、レイヤ間ピクセル予測を行わないと判定された場合、処理はステップＳ７６５に進む。

ステップＳ７６５において、動き予測・補償部１３５は、カレントピクチャについて、レイヤ間シンタクス予測を行うか否かを判定する。レイヤ間シンタクス予測制御部７２６から供給されたレイヤ間シンタクス予測制御情報に基づいて、レイヤ間シンタクス予測を行うと判定された場合、処理はステップＳ７６６に進む。

ステップＳ７６６において、動き予測・補償部１３５は、ベースレイヤシンタクスバッファ７２４から動き情報等のベースレイヤシンタクスを取得する。ステップＳ７６７において、動き予測・補償部１３５は、ステップＳ７６６において取得したベースレイヤシンタクスを用いてレイヤ間シンタクス予測を行う。ステップＳ７６７の処理が終了すると、処理はステップＳ７６８に進む。

また、ステップＳ７６５において、レイヤ間シンタクス予測を行わないと判定された場合、処理はステップＳ７６８に進む。

ステップＳ７６８において、動き予測・補償部１３５は、各予測モードについてコスト関数値を算出する。ステップＳ７６９において、動き予測・補償部１３５は、そのコスト関数値に基づいて最適なインター予測モードを選択する。

ステップＳ７７０において、動き予測・補償部１３５は、ステップＳ７６９において選択された最適インター予測モードで動き補償を行い、予測画像を生成する。ステップＳ７７１において、動き予測・補償部１３５は、その最適インター予測モードについて、インター予測に関する情報を生成する。

ステップＳ７７１の処理が終了すると、動き予測・補償処理が終了し、処理は図４８に戻る。以上のように、レイヤ間ピクセル予測およびレイヤ間シンタクス予測に対応した動き予測・補償処理が行われる。この処理は、例えば、ブロック単位で実行される。ただし、動き予測・補償処理内の各処理は、それぞれの処理単位毎に行われる。

＜イントラ予測処理の流れ＞
次に、図５０のフローチャートを参照して、図４８のステップＳ７４３において実行されるイントラ予測処理の流れの例を説明する。

イントラ予測処理が開始されると、エンハンスメントレイヤ画像符号化部１０５のイントラ予測部１２４は、ステップＳ７８１において、レイヤ内の各イントラ予測モードでイントラ予測を行う。

ステップＳ７８２において、イントラ予測部１２４は、カレントピクチャについて、レイヤ間シンタクス予測を行うか否かを判定する。レイヤ間シンタクス予測制御部７２６から供給されたレイヤ間シンタクス予測制御情報に基づいて、レイヤ間シンタクス予測を行うと判定された場合、処理はステップＳ７８３に進む。

ステップＳ７８３において、イントラ予測部１２４は、ベースレイヤシンタクスバッファ７２４から予測モード情報等のベースレイヤシンタクスを取得する。ステップＳ７８４において、イントラ予測部１２４は、ステップＳ７８３において取得したベースレイヤシンタクスを用いてレイヤ間シンタクス予測を行う。ステップＳ７８４の処理が終了すると、処理はステップＳ７８５に進む。

また、ステップＳ７８２において、レイヤ間シンタクス予測を行わないと判定された場合、処理はステップＳ７８５に進む。

ステップＳ７８５において、イントラ予測部１２４は、イントラ予測（レイヤ間シンタクス予測を含む）を行った各イントラ予測モードでコスト関数値を算出する。

ステップＳ７８６において、イントラ予測部１２４は、ステップＳ７８５において算出したコスト関数値に基づいて、最適なイントラ予測モードを決定する。

ステップＳ７８７において、イントラ予測部１２４は、ステップＳ７８６において、決定された最適イントラ予測モードで予測画像を生成する。

ステップＳ７８７の処理が終了すると、イントラ予測処理が終了し、処理は図４８に戻る。

以上のように各処理を実行することにより、スケーラブル符号化装置１００は、レイヤ間ピクセル予測およびレイヤ間シンタクス予測を、それぞれ、より容易かつ適切に制御することができ、演算量と符号化効率のトレードオフ（trade-off）をより適切に行うことができる。つまり、スケーラブル符号化装置１００は、レイヤ間予測をより適応的に制御し、符号化効率の低減を抑制することができる。換言するに、スケーラブル符号化装置１００は、符号化・復号による画質の低減を抑制することができる。

＜９．第８の実施の形態＞
＜共通情報取得部とレイヤ間予測制御部＞
次に、スケーラブル復号装置２００について説明する。図５１は、＜７．概要２＞において上述した場合の、スケーラブル復号装置２００の共通情報取得部およびレイヤ間予測制御部の主な構成例を示すブロック図である。この場合、スケーラブル復号装置２００は、共通情報取得部２０１の代わりに共通情報取得部８０１を有し、レイヤ間予測制御部２０４の代わりにレイヤ間予測制御部８０４を有する。

図５１に示されるように、共通情報取得部８０１は、レイヤ間ピクセル予測制御情報取得部８１１を有する。

レイヤ間ピクセル予測制御情報取得部８１１は、例えばスケーラブル符号化装置１００からビデオパラメータセット等として伝送された共通情報であるレイヤ間ピクセル予測制御情報を取得する。

レイヤ間ピクセル予測制御情報取得部８１１は、取得したレイヤ間ピクセル予測制御情報をレイヤ間予測制御部８０４（レイヤ間ピクセル予測制御部８２２）に供給する。

また、図５１に示されるように、レイヤ間予測制御部８０４は、アップサンプル部８２１、レイヤ間ピクセル予測制御部８２２、ベースレイヤピクセルバッファ８２３、ベースレイヤシンタクスバッファ８２４、レイヤ間シンタクス予測制御情報取得部８２５、および、レイヤ間シンタクス予測制御部８２６を有する。

アップサンプル部８２１は、ベースレイヤ画像復号部２０３のフレームメモリ２１９からベースレイヤ復号画像を取得すると、そのベースレイヤ復号画像を、ベースレイヤとエンハンスメントレイヤの解像度等の比に応じて、アップサンプル処理（解像度変換処理）する。アップサンプル部８２１は、得られたアップサンプル復号画像をベースレイヤピクセルバッファ８２３に供給する。

レイヤ間ピクセル予測制御部８２２は、レイヤ間ピクセル予測制御情報取得部８１１からレイヤ間ピクセル予測制御情報を取得する。レイヤ間ピクセル予測制御部８２２は、そのレイヤ間ピクセル予測制御情報に従って、ベースレイヤピクセルバッファ８２３に記憶されているベースレイヤのアップサンプル復号画像の、エンハンスメントレイヤ画像復号部２０５への供給を制御する。

より具体的には、レイヤ間ピクセル予測制御部８２２は、エンハンスメントレイヤ画像復号部２０５の復号対象であるカレントピクチャが属するサブレイヤが、レイヤ間ピクセル予測制御情報によってレイヤ間ピクセル予測を許可されたレイヤである場合、ベースレイヤピクセルバッファ８２３に記憶されているアップサンプル復号画像の供給を許可する。また、レイヤ間ピクセル予測制御部８２２は、そのカレントピクチャが属するサブレイヤが、レイヤ間ピクセル予測制御情報によってレイヤ間ピクセル予測を禁止されたレイヤである場合、ベースレイヤピクセルバッファ８２３に記憶されているアップサンプル復号画像の供給を禁止する。

ベースレイヤピクセルバッファ８２３は、アップサンプル部８２１から供給されるアップサンプル復号画像を記憶し、レイヤ間ピクセル予測制御部８２２の制御に従って、適宜、そのアップサンプル復号画像を、レイヤ間ピクセル予測の参照画像（リファレンス）として、エンハンスメントレイヤ画像復号部２０５のフレームメモリ２１９に供給する。

ベースレイヤシンタクスバッファ８２４は、ベースレイヤ画像復号部２０３のイントラ予測部２２１から予測モード情報等のベースレイヤシンタクスを取得し、記憶する。また、ベースレイヤシンタクスバッファ８２４は、ベースレイヤ画像復号部２０３の動き補償部２２２から動き情報等のベースレイヤシンタクスを取得し、記憶する。

ベースレイヤシンタクスバッファ８２４は、レイヤ間シンタクス予測制御部８２６の制御に従って、適宜、そのベースレイヤシンタクスを、エンハンスメントレイヤ画像復号部２０５のイントラ予測部２２１や動き補償部２３２に供給する。例えば、ベースレイヤシンタクスバッファ８２４は、記憶している予測モード情報等のベースレイヤシンタクスを、エンハンスメントレイヤ画像復号部２０５のイントラ予測部２２１に供給する。また、例えば、ベースレイヤシンタクスバッファ８２４は、記憶している動き情報等のベースレイヤシンタクスを、エンハンスメントレイヤ画像復号部２０５の動き補償部２３２に供給する。

レイヤ間シンタクス予測制御情報取得部８２５は、例えばスケーラブル符号化装置１００からピクチャパラメータセット等として伝送されたレイヤ間シンタクス予測制御情報を、エンハンスメントレイヤ画像復号部２０５を介して取得する。

レイヤ間シンタクス予測制御情報取得部８２５は、取得したレイヤ間シンタクス予測制御情報をレイヤ間シンタクス予測制御部８２６に供給する。

レイヤ間シンタクス予測制御部８２６は、レイヤ間シンタクス予測制御情報取得部８２５からレイヤ間シンタクス予測制御情報を取得する。レイヤ間シンタクス予測制御部８２６は、そのレイヤ間シンタクス予測制御情報に従って、ベースレイヤシンタクスバッファ８２４に記憶されているベースレイヤシンタクスの、エンハンスメントレイヤ画像復号部２０５への供給を制御する。

より具体的には、レイヤ間シンタクス予測制御部８２６は、エンハンスメントレイヤ画像復号部２０５の復号対象であるカレントピクチャ（若しくは、復号対象であるカレントスライス）が、レイヤ間シンタクス予測制御情報によってレイヤ間シンタクス予測を許可されたピクチャ（若しくはスライス）である場合、ベースレイヤシンタクスバッファ８２４に記憶されているベースレイヤシンタクスの供給を許可する。また、レイヤ間シンタクス予測制御部８２６は、そのカレントピクチャ（若しくはカレントスライス）が、レイヤ間シンタクス予測制御情報によってレイヤ間シンタクス予測を禁止されたピクチャ（若しくはスライス）である場合、ベースレイヤシンタクスバッファ８２４に記憶されているベースレイヤシンタクスの供給を禁止する。

エンハンスメントレイヤ画像復号部２０５のイントラ予測部２２１は、例えばスケーラブル符号化装置１００から供給された予測モードに関する情報に基づいて、最適イントラ予測モードでイントラ予測を行い、予測画像を生成する。その際、最適イントラ予測モードとしてレイヤ間シンタクス予測が指定される場合、すなわち、符号化の際にレイヤ間シンタクス予測のイントラ予測が行われた場合、イントラ予測部２２１は、ベースレイヤシンタクスバッファ８２４から供給されるベースレイヤシンタクスを用いてイントラ予測を行い、予測画像を生成する。

エンハンスメントレイヤ画像復号部２０５の動き補償部２３２は、例えばスケーラブル符号化装置１００から供給された予測モードに関する情報に基づいて、最適インター予測モードで動き補償を行い、予測画像を生成する。その際、最適イントラ予測モードとしてレイヤ間ピクセル予測が指定される場合、すなわち、符号化の際にレイヤ間ピクセル予測のインター予測が行われた場合、動き補償部２３２は、フレームメモリ２１９に記憶されるベースレイヤのアップサンプル復号画像を参照して動き補償を行い、予測画像を生成する。

また、最適イントラ予測モードとしてレイヤ間シンタクス予測が指定される場合、すなわち、符号化の際にレイヤ間シンタクス予測のインター予測が行われた場合、動き補償部２３２は、ベースレイヤシンタクスバッファ８２４から供給されるベースレイヤシンタクスを用いて、フレームメモリ２１９に記憶されるエンハンスメントレイヤの復号画像を参照して動き補償を行い、予測画像を生成する。

以上のようにすることにより、スケーラブル復号装置２００は、レイヤ間ピクセル予測およびレイヤ間シンタクス予測を、それぞれ、より容易かつ適切に制御することができ、演算量と符号化効率のトレードオフ（trade-off）をより適切に行うことができる。つまり、スケーラブル復号装置２００は、レイヤ間予測をより適応的に制御し、符号化効率の低減を抑制することができる。

＜共通情報取得処理の流れ＞
この場合の共通情報取得処理の流れの例を、図５２のフローチャートを参照して説明する。共通情報取得処理が開始されると、共通情報取得部８０１は、ステップＳ８０１において、符号化側から伝送されたビデオパラメータセット（VPS）を取得する。

ステップＳ８０２において、共通情報取得部８０１は、ビデオパラメータセットより、パラメータ（max_layer_minus1）を取得する。

ステップＳ８０３において、共通情報取得部８０１は、ビデオパラメータセット（VPS）より、各主レイヤについて、パラメータ（vps_num_sub_layers_minus1[i]）を取得する。

ステップＳ８０４において、レイヤ間ピクセル予測制御情報取得部８１１は、ビデオパラメータセット（VPS）より、各主レイヤについて、レイヤ間ピクセル予測制御情報を取得する。

ステップＳ８０５において、レイヤ間ピクセル予測制御情報取得部８１１は、ステップＳ８０４において取得したレイヤ間ピクセル予測制御情報を、レイヤ間ピクセル予測制御部８２２に供給する。

ステップＳ８０５の処理が終了すると、共通情報取得処理が終了し、処理は、図２３に戻る。

＜ベースレイヤ復号処理の流れ＞
次に、図５３のフローチャートを参照して、この場合のベースレイヤ復号処理の流れの例を説明する。

この場合、ベースレイヤ復号処理が開始されると、ステップＳ８１１乃至ステップＳ８２０の各処理が、図２５のステップＳ３４１乃至ステップＳ３５０の各処理と同様に実行される。

ステップＳ８２１において、アップサンプル部８２１は、ベースレイヤ復号画像をアップサンプルする。

ステップＳ８２２において、ベースレイヤピクセルバッファ８２３は、ステップＳ８２１の処理により得られたアップサンプル復号画像を記憶する。

ステップＳ８２３において、ベースレイヤシンタクスバッファ８２４は、ステップＳ８１５の予測処理等において得られたベースレイヤシンタクス（イントラ予測モード情報や動き情報等）を記憶する。

ステップＳ８２３の処理が終了すると、ベースレイヤ復号処理が終了し、処理は図２３に戻る。ベースレイヤ復号処理は、例えば、ピクチャ単位で実行される。つまり、カレントレイヤの各ピクチャに対してベースレイヤ復号処理が実行される。ただし、ベースレイヤ復号処理内の各処理は、それぞれの処理単位毎に行われる。

＜レイヤ間予測制御処理の流れ＞
次に、図５４のフローチャートを参照して、この場合のレイヤ間予測制御処理の流れの例を説明する。

レイヤ間予測制御処理が開始されると、レイヤ間ピクセル予測制御部８２２は、ステップＳ８３１において、図５２のステップＳ８０５の処理により供給されたレイヤ間ピクセル予測制御情報を参照する。

ステップＳ８３２において、ベースレイヤピクセルバッファ８２３は、記憶しているアップサンプル復号画像を、エンハンスメントレイヤ画像復号部２０５のフレームメモリ２１９に供給する。

ステップＳ８３３の処理が終了すると、処理はステップＳ８３４に進む。また、ステップＳ８３２において、レイヤ間ピクセル予測を行わないと判定された場合、処理はステップＳ８３４に進む。

ステップＳ８３４において、レイヤ間シンタクス予測制御情報取得部８２５は、レイヤ間シンタクス予測制御情報を取得する。

ステップＳ８３５において、レイヤ間シンタクス予測制御部８２６は、ステップＳ８３４において取得されたレイヤ間シンタクス予測制御情報を参照し、エンハンスメントレイヤのカレントピクチャ（若しくはスライス）がレイヤ間シンタクス予測を行うピクチャ（若しくはスライス）であるか否かを判定する。レイヤ間シンタクス予測を行うと判定された場合、処理はステップＳ８３６に進む。

ステップＳ８３６において、ベースレイヤシンタクスバッファ８２４は、記憶しているベースレイヤシンタクスを、エンハンスメントレイヤ画像復号部２０５のイントラ予測部２２１若しくは動き補償部２３２に供給する。

ステップＳ８３６の処理が終了すると、レイヤ間予測制御処理が終了し、処理は図２３に戻る。また、図５４のステップＳ８３５において、レイヤ間シンタクス予測を行わないと判定された場合、レイヤ間予測制御処理が終了し、処理は図２３に戻る。

＜予測処理の流れ＞
エンハンスメントレイヤ復号処理は、図２７のフローチャートを参照して説明した場合と同様に実行されるので、その説明は省略する。

次に、図５５および図５６のフローチャートを参照して、この場合の予測処理の流れの例を説明する。

予測処理が開始されると、動き補償部２３２は、ステップＳ８４１において、予測モードがインター予測であるか否かを判定する。インター予測であると判定した場合、処理はステップＳ８４２に進む。

ステップＳ８４２において、動き補償部２３２は、最適インター予測モードがレイヤ間ピクセル予測を行うモードであるか否かを判定する。最適インター予測モードがレイヤ間ピクセル予測を行うモードであると判定された場合、処理はステップＳ８４３に進む。

ステップＳ８４３において、動き補償部２３２は、ベースレイヤのアップサンプル復号画像を取得する。

ステップＳ８４４において、動き補償部２３２は、そのベースレイヤのアップサンプル復号画像を用いて動き補償を行い、予測画像を生成する。ステップＳ８４４の処理が終了すると、処理はステップＳ８４９に進む。

また、ステップＳ８４２において、最適インター予測モードがレイヤ間ピクセル予測を行うモードでないと判定された場合、処理は、ステップＳ８４５に進む。

ステップＳ８４５において、動き補償部２３２は、最適インター予測モードがレイヤ間シンタクス予測を行うモードであるか否かを判定する。最適インター予測モードがレイヤ間シンタクス予測を行うモードであると判定された場合、処理はステップＳ８４６に進む。

ステップＳ８４６において、動き補償部２３２は、動き情報等のベースレイヤシンタクスを取得する。

ステップＳ８４７において、動き補償部２３２は、そのベースレイヤシンタクスを用いて動き補償を行い、予測画像を生成する。ステップＳ８４７の処理が終了すると、処理はステップＳ８４９に進む。

また、ステップＳ８４５において、最適インター予測モードがレイヤ間シンタクス予測を行うモードでないと判定された場合、処理はステップＳ８４８に進む。

ステップＳ８４８において、動き補償部２３２は、カレント主レイヤ内で動き補償を行い、予測画像を生成する。ステップＳ８４８の処理が終了すると、処理はステップＳ８４９に進む。

ステップＳ８４９において、動き補償部２３２は、以上のように生成した予測画像を、選択部２２３を介して演算部２１５に供給する。ステップＳ８４９の処理が終了すると、予測処理が終了し、処理が図２７に戻る。

また、図５５のステップＳ８４１において、イントラ予測であると判定された場合、処理は図５６に進む。

図５６のステップＳ８５１において、エンハンスメントレイヤ画像復号部２０５のイントラ予測部２２１は、最適イントラ予測モードがレイヤ間シンタクス予測を行うモードであるか否かを判定する。最適イントラ予測モードがレイヤ間シンタクス予測を行うモードであると判定された場合、処理はステップＳ８５２に進む。

ステップＳ８５２において、イントラ予測部２２１は、イントラ予測モード情報等のベースレイヤシンタクスを取得する。

ステップＳ８５３において、イントラ予測部２２１は、そのベースレイヤシンタクスを用いてイントラ予測を行い、予測画像を生成する。ステップＳ８５３の処理が終了すると、処理は図５５のステップＳ８４９に戻る。

また、図５６のステップＳ８５１において、最適イントラ予測モードがレイヤ間シンタクス予測を行うモードでないと判定された場合、処理はステップＳ８５４に進む。

ステップＳ８５４において、イントラ予測部２２１は、符号化の際に採用されたイントラ予測モードである最適イントラ予測モードで予測画像を生成する。ステップＳ８５４の処理が終了すると、処理は図５５のステップＳ８４９に戻る。

以上のように各処理を実行することにより、スケーラブル復号装置２００は、レイヤ間ピクセル予測およびレイヤ間シンタクス予測を、それぞれ、より容易かつ適切に制御することができ、演算量と符号化効率のトレードオフ（trade-off）をより適切に行うことができる。つまり、スケーラブル復号装置２００は、レイヤ間予測をより適応的に制御し、符号化効率の低減を抑制することができる。換言するに、スケーラブル復号装置２００は、符号化・復号による画質の低減を抑制することができる。

＜１０．概要３＞
レイヤ間予測について、例えばSHVC（Scalable High Efficiency Video Coding）の場合、Jianle Chen, Jill Boyce, Yan Ye, Miska M. Hannuksela, "SHVC Test Model 1 (SHM 1)", JCTVC-L1007, Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG1112th Meeting: Geneva, CH, 14-23 Jan. 2013において、テクスチャBL（TextureBL）とリファレンスインデックス（Ref_idx）との２つのフレームワークが提案されている。

テクスチャBL（TextureBL）フレームワークの場合、ベースレイヤ（Baselayer）の復号画像（若しくはそのアップサンプル（upsample）画像）が、イントラ予測モード（Intra Prediction Mode）の１つ（イントラBL（IntraBL）モード）として符号化される。バージョン１（Version 1）からのCUレベル（CU-level）以下でのシンタクス（Syntax）変更が可能である。

これに対して、リファレンスインデックス（Ref_idx）フレームワークの場合、ベースレイヤ（Baselayer）の復号画像（若しくはそのアップサンプル（upsample）画像）が、ロングターム（Long-Term）参照フレーム（長時間参照フレームとも称する）に格納され、これを用いた予測処理が行われる。バージョン１（Version 1）からのCUレベル（CU-level）以下でのシンタクス（Syntax）の変更は不可能である。

しかしながら、全てのピクチャ（Picture）において、レイヤ間テクスチャ予測（Inter-layer Texture Prediction）を行うことは、復号の際に、ベースレイヤ（Baselayer）とエンハンスメントレイヤ（Enhancementlayer）の両方で動き補償を行う必要があった。そのため演算量が増大し、復号処理の負荷が増大する恐れがあった。このことは、テクスチャBL（TextureBL）フレームワークの場合だけでなく、リファレンスインデックス（Ref_idx）フレームワークの場合も同様である。

そこで、ベースレイヤ（Baselayer）の復号画像（若しくはそのアップサンプル（upsample）された画像）を格納しているロングターム（Long-Term）参照フレームについてのシンタクス（syntax）の値を制御することにより、ピクチャ（Picture）毎にレイヤ間テクスチャ予測（inter-layer texture prediction）の実行を制御するようにする。

図５７および図５８は、シーケンスパラメータセット（sep_parameter_set_rbsp）のシンタクスの例を示す図である。図５８に示されるように、シーケンスパラメータセット（sep_parameter_set_rbsp）には、ロングターム参照フレームについてのシンタクスused_by_curr_pic_lt_sps_flag[i]が含まれる。

シンタクスused_by_curr_pic_lt_sps_flag[i]は、シーケンスパラメータセットにおいて指定されるロングターム参照ピクチャのi番目の候補が参照画像として使用されるか否かを制御するフラグである。この値が「０」の場合、ロングターム参照ピクチャのi番目の候補は使用されない。

また、図５９乃至図６１は、スライスヘッダ（slice_segment_header）のシンタクスの例を示す図である。図５９に示されるように、スライスヘッダ（slice_segment_header）には、ロングターム参照フレームについてのシンタクスused_by_curr_pic_lt_flag[i]が含まれる。

シンタクスused_by_curr_pic_lt_flag[i]は、カレントピクチャのロングタームRPS（Reference Picture Set）の中のi番目のエントリが、カレントピクチャによって参照画像として使用されるか否かを制御するフラグである。この値が「０」の場合、ロングタームRPSのi番目のエントリは使用されない。

例えば、これらのシンタクスの値を制御することにより、ピクチャ毎にレイヤ間テクスチャ予測の実行を制御するようにする。すなわち、例えば、レイヤ間テクスチャ予測（inter-layer texture prediction）を行うことができないようにするために、シンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値を「０」にする。逆に、レイヤ間テクスチャ予測（inter-layer texture prediction）を行うことができるようにするために、シンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値を「１」にする。

このように、ロングターム参照フレームについてのシンタクスの値を制御することにより、ピクチャ毎にレイヤ間テクスチャ予測の実行を制御することができる。したがって、復号処理における各レイヤの動き補償の実行を適切に制御することができ、復号処理の負荷の増大を抑制することができる。

＜１１．第９の実施の形態＞
＜画像符号化装置＞
次に、以上のような本技術を実現する装置とその方法について説明する。図６２は、本技術を適用した画像処理装置の一態様である、画像符号化装置を示す図である。図６２に示される画像符号化装置９００は、階層画像符号化を行う装置である。この画像符号化装置９００は、図９のスケーラブル符号化装置１００と基本的に同様の画像処理装置であるが、説明の便宜上、＜１０．概要３＞において説明した本技術と直接的な関係の少ない構成（例えば共通情報生成部１０１、符号化制御部１０２、レイヤ間予測制御部１０４等）についての説明は省略している。

図６２に示されるように、画像符号化装置９００は、ベースレイヤ画像符号化部９０１、エンハンスメントレイヤ画像符号化部９０２、および多重化部９０３を有する。

ベースレイヤ画像符号化部９０１は、ベースレイヤ画像符号化部１０３（図９）と基本的に同様の処理部であり、ベースレイヤ画像を符号化し、ベースレイヤ画像符号化ストリームを生成する。エンハンスメントレイヤ画像符号化部９０２は、エンハンスメントレイヤ画像符号化部１０５（図９）と基本的に同様の処理部であり、エンハンスメントレイヤ画像を符号化し、エンハンスメントレイヤ画像符号化ストリームを生成する。多重化部９０３は、ベースレイヤ画像符号化部９０１において生成されたベースレイヤ画像符号化ストリームと、エンハンスメントレイヤ画像符号化部９０２において生成されたエンハンスメントレイヤ画像符号化ストリームとを多重化し、階層画像符号化ストリームを生成する。多重化部９０３は、生成した階層画像符号化ストリームを復号側に伝送する。

ベースレイヤ画像符号化部９０１は、ベースレイヤの符号化において得られた復号画像（ベースレイヤ復号画像とも称する）を、エンハンスメントレイヤ画像符号化部９０２に供給する。

エンハンスメントレイヤ画像符号化部９０２は、ベースレイヤ画像符号化部９０１から供給されるベースレイヤ復号画像を取得し、記憶する。エンハンスメントレイヤ画像符号化部９０２は、その記憶したベースレイヤ復号画像を参照画像として、エンハンスメントレイヤの符号化における予測処理に用いる。

＜ベースレイヤ画像符号化部＞
図６３は、図６２のベースレイヤ画像符号化部９０１の主な構成例を示すブロック図である。図６３に示されるように、ベースレイヤ画像符号化部９０１は、A/D変換部９１１、画面並べ替えバッファ９１２、演算部９１３、直交変換部９１４、量子化部９１５、可逆符号化部９１６、蓄積バッファ９１７、逆量子化部９１８、および逆直交変換部９１９を有する。また、ベースレイヤ画像符号化部９０１は、演算部９２０、ループフィルタ９２１、フレームメモリ９２２、選択部９２３、イントラ予測部９２４、インター予測部９２５、予測画像選択部９２６、およびレート制御部９２７を有する。

A/D変換部９１１は、ベースレイヤ画像符号化部１０３のA/D変換部１１１（図１０）と同様の処理部である。画面並べ替えバッファ９１２は、ベースレイヤ画像符号化部１０３の画面並べ替えバッファ１１２（図１０）と同様の処理部である。演算部９１３は、ベースレイヤ画像符号化部１０３の演算部１１３（図１０）と同様の処理部である。直交変換部９１４は、ベースレイヤ画像符号化部１０３の直交変換部１１４（図１０）と同様の処理部である。量子化部９１５は、ベースレイヤ画像符号化部１０３の量子化部１１５（図１０）と同様の処理部である。可逆符号化部９１６は、ベースレイヤ画像符号化部１０３の可逆符号化部１１６（図１０）と同様の処理部である。蓄積バッファ９１７は、ベースレイヤ画像符号化部１０３の蓄積バッファ１１７（図１０）と同様の処理部である。

逆量子化部９１８は、ベースレイヤ画像符号化部１０３の逆量子化部１１８（図１０）と同様の処理部である。逆直交変換部９１９は、ベースレイヤ画像符号化部１０３の逆直交変換部１１９（図１０）と同様の処理部である。演算部９２０は、ベースレイヤ画像符号化部１０３の演算部１２０（図１０）と同様の処理部である。ループフィルタ９２１は、ベースレイヤ画像符号化部１０３のループフィルタ１２１（図１０）と同様の処理部である。

フレームメモリ９２２は、ベースレイヤ画像符号化部１０３のフレームメモリ１２２（図１０）と同様の処理部である。ただし、フレームメモリ９２２は、記憶している復号画像（ベースレイヤ復号画像とも称する）を、エンハンスメントレイヤ画像符号化部９０２に供給する。

選択部９２３は、ベースレイヤ画像符号化部１０３の選択部１２３（図１０）と同様の処理部である。

イントラ予測部９２４は、ベースレイヤ画像符号化部１０３のイントラ予測部１２４（図１０）と同様の処理部である。イントラ予測部９２４は、処理対象のフレームの画像であるカレントピクチャについて、所定のブロック毎に（ブロックを処理単位として）、画面内予測（イントラ予測とも称する）を行い、予測画像を生成する。イントラ予測の場合、予測に用いられる参照画像として、処理対象であるカレントブロックの空間的に周辺に位置する（つまり、カレントピクチャ内においてカレントブロックの周辺に位置する）処理済みの画素（周辺画素とも称する）の画素値が用いられる。イントラ予測部９２４は、そのような参照画像をフレームメモリ９２２に格納される再構成画像から（選択部９２３を介して）取得する。

このイントラ予測には（すなわち、予測画像の生成の仕方には）、複数の方法（イントラ予測モードとも称する）が、候補として予め用意されている。イントラ予測部９２４は、この予め用意された全てのイントラ予測モードでこのイントラ予測を行う。そして、イントラ予測部９２４は、生成した全てのイントラ予測モードの予測画像のコスト関数値を、画面並べ替えバッファ９１２から供給される入力画像を用いて算出し、そのコスト関数値に基づいて最適なモードを選択する。

イントラ予測部９２４は、最適なイントラ予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部９２６に供給する。そして、イントラ予測部９２４は、採用されたイントラ予測モードを示すイントラ予測モード情報等を、適宜可逆符号化部９１６に供給し、符号化させる。

インター予測部９２５は、ベースレイヤ画像符号化部１０３の動き予測・補償部１２５（図１０）と同様の処理部である。インター予測部９２５は、カレントピクチャについて、所定のブロック毎に（ブロックを処理単位として）、画面間予測（インター予測とも称する）を行い、予測画像を生成する。インター予測の場合、予測に用いられる参照画像として、処理対象であるカレントブロックの時間的に周辺に位置する（つまり、カレントピクチャと異なるピクチャの、カレントブロックに対応する位置のブロックの）処理済みの画素の画素値が用いられる。インター予測部９２５は、そのような参照画像をフレームメモリ９２２に格納される再構成画像から（選択部９２３を介して）取得する。

また、インター予測は、動き予測と動き補償よりなる。インター予測部９２５は、画面並べ替えバッファ９１２から供給されるカレントブロックの画像データ（入力画像）と、フレームメモリ９２２から参照画像として供給される参照画像の画像データとを用いて、カレントブロックについて動き予測を行い、動きベクトルを検出する。そして、インター予測部９２５は、参照画像を用いて、検出された動きベクトルに応じて動き補償処理を行い、カレントブロックの予測画像を生成する。

インター予測には（すなわち、予測画像の生成の仕方には）、複数の方法（インター予測モードとも称する）が、候補として予め用意されている。インター予測部９２５は、この予め用意された全てのインター予測モードでこのようなインター予測を行う。そして、インター予測部９２５は、この予め用意された全てのインター予測モードでインター予測を行う。そして、インター予測部９２５は、生成した全てのインター予測モードの予測画像のコスト関数値を、画面並べ替えバッファ９１２から供給される入力画像や、生成した差分動きベクトルの情報等を用いて算出し、そのコスト関数値に基づいて最適なモードを選択する。

インター予測部９２５は、最適なインター予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部９２６に供給する。そして、インター予測部９２５は、採用されたインター予測モードを示す情報や、符号化データを復号する際に、そのインター予測モードで処理を行うために必要な情報等を可逆符号化部９１６に供給し、符号化させる。必要な情報としては、例えば、生成された差分動きベクトルの情報や、予測動きベクトル情報として予測動きベクトルのインデックスを示すフラグなどがある。

予測画像選択部９２６は、ベースレイヤ画像符号化部１０３の予測画像選択部１２６（図１０）と同様の処理部である。レート制御部９２７は、ベースレイヤ画像符号化部１０３のレート制御部１２７（図１０）と同様の処理部である。

なお、ベースレイヤ画像符号化部９０１は、他のレイヤを参照せずに符号化を行う。つまり、イントラ予測部９２４およびインター予測部９２５は、他のレイヤの復号画像を参照画像として利用しない。

＜エンハンスメントレイヤ画像符号化部＞
図６４は、図６２のエンハンスメントレイヤ画像符号化部９０２の主な構成例を示すブロック図である。図６４に示されるように、エンハンスメントレイヤ画像符号化部９０２は、図６３のベースレイヤ画像符号化部９０１と基本的に同様の構成を有する。

つまり、エンハンスメントレイヤ画像符号化部９０２は、図６４に示されるように、A/D変換部９３１、画面並べ替えバッファ９３２、演算部９３３、直交変換部９３４、量子化部９３５、可逆符号化部９３６、蓄積バッファ９３７、逆量子化部９３８、および逆直交変換部９３９を有する。また、エンハンスメントレイヤ画像符号化部９０２は、演算部９４０、ループフィルタ９４１、フレームメモリ９４２、選択部９４３、イントラ予測部９４４、インター予測部９４５、予測画像選択部９４６、およびレート制御部９４７を有する。

これらのA/D変換部９３１乃至レート制御部９４７は、図６３のA/D変換部９１１乃至レート制御部９２７に対応し、それぞれ、対応する処理部と同様の処理を行う。ただし、エンハンスメントレイヤ画像符号化部９０２の各部は、ベースレイヤではなく、エンハンスメントレイヤ画像情報の符号化についての処理を行う。したがって、A/D変換部９３１乃至レート制御部９４７の処理の説明として、上述した図６３のA/D変換部９１１乃至レート制御部９２７についての説明を適用することができるが、その場合、処理するデータは、ベースレイヤのデータではなく、エンハンスメントレイヤのデータであるものとする必要がある。また、データの入力元や出力先の処理部は、適宜、A/D変換部９３１乃至レート制御部９４７の中の対応する処理部に置き換えて読む必要がある。

なお、エンハンスメントレイヤ画像符号化部９０２は、他のレイヤ（例えばベースレイヤ）の情報を参照して符号化を行う。そして、エンハンスメントレイヤ画像符号化部９０２は、＜１０．概要３＞において上述した処理を行う。

例えば、フレームメモリ９４２は、複数の参照フレームを記憶することができ、エンハンスメントレイヤの復号画像（エンハンスメントレイヤ復号画像とも称する）を記憶するだけでなく、ベースレイヤ画像符号化部９０１からベースレイヤ復号画像を取得し、ロングターム参照フレームとして記憶する。このとき、フレームメモリ９４２に記憶されるベースレイヤ復号画像は、アップサンプル処理されたものであってもよい（例えば、フレームメモリ９４２が、ベースレイヤ画像符号化部９０１から供給されるベースレイヤ復号画像をアップサンプルして記憶するようにしてもよい）。

ベースレイヤ画像符号化部９０１の場合と同様に、フレームメモリ９４２に記憶された画像、すなわち、エンハンスメントレイヤ復号画像やベースレイヤ復号画像は、イントラ予測部９４４やインター予測部９４５による予測処理において、参照画像として利用される。

つまり、イントラ予測部９４４は、イントラ予測の候補の１つとして、テクスチャBL（texture BL）モードを有する。テクスチャBLモードの場合、参照画像として、エンハンスメントレイヤのカレントピクチャではなく、ベースレイヤのカレントピクチャの復号画像が用いられる。つまり、イントラ予測部９４４は、ベースレイヤのカレントピクチャの、エンハンスメントレイヤにおけるカレントブロックに対応するブロック（コロケーテッドブロックとも称する）の画素値をフレームメモリ９４２のロングターム参照フレームから（選択部９４３を介して）取得し、それを参照画像として用いてイントラ予測を行う。

そして、イントラ予測部９４４は、その他のイントラ予測モードの場合と同様に、コスト関数値を算出して評価する。つまり、イントラ予測部９４４は、このテクスチャBLモードも含む、候補となる全てのイントラ予測モードの中から最適なイントラ予測モードを選択する。

インター予測部９４５も同様に、インター予測の候補の１つとして、リファレンスインデックス（Ref_idx）モードを有する。リファレンスインデックスモードの場合、参照画像として、エンハンスメントレイヤのピクチャではなく、ベースレイヤのピクチャの復号画像が用いられる。つまり、インター予測部９４５は、フレームメモリ９４２のロングターム参照フレームに格納されるベースレイヤ復号画像を参照画像として取得し、それを用いてインター予測（動き予測や動き補償等）を行う。

そして、インター予測部９４５は、その他のインター予測モードの場合と同様に、コスト関数値を算出して評価する。つまり、インター予測部９４５は、このリファレンスインデックスモードも含む、候補となる全てのインター予測モードの中から最適なインター予測モードを選択する。

ところで、図６４に示されるように、エンハンスメントレイヤ画像符号化部９０２は、さらに、ヘッダ生成部９４８を有する。

ヘッダ生成部９４８は、例えば、シーケンスパラメータセット（SPS）、ピクチャパラメータセット（PPS）、スライスヘッダ等のヘッダ情報を生成する。その際、ヘッダ生成部９４８は、シーケンスパラメータセット（sep_parameter_set_rbsp）のロングターム参照フレームについてのシンタクスused_by_curr_pic_lt_sps_flag[i]や、スライスヘッダ（slice_segment_header）のロングターム参照フレームについてのシンタクスused_by_curr_pic_lt_flag[i]の値を制御する。

例えば、ヘッダ生成部９４８は、レイヤ間テクスチャ予測を行うことができないように制御するピクチャに対して、シンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値を「０」にする。また、例えば、ヘッダ生成部９４８は、レイヤ間テクスチャ予測を行うことができるように制御するピクチャに対して、シンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値を「１」にする。

ヘッダ生成部９４８は、このように生成したヘッダ情報を可逆符号化部９３６に供給する。可逆符号化部９３６は、ヘッダ生成部９４８から供給されたヘッダ情報を、符号化し、符号化データ（符号化ストリーム）に含めて蓄積バッファ１１７に供給し、復号側に伝送させる。

また、ヘッダ生成部９４８は、このように生成したヘッダ情報を、適宜、エンハンスメントレイヤ画像符号化部９０２の各処理部に供給する。エンハンスメントレイヤ画像符号化部９０２の各処理部は、適宜、このヘッダ情報に従って、それぞれの処理を行う。

イントラ予測部９４４は、ヘッダ生成部９４８により設定されたシンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値に従ってイントラ予測を行う。例えば、シンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値が「０」の場合、イントラ予測部９４４は、テクスチャBLモードを用いずにイントラ予測を行う。つまり、このピクチャについては、イントラ予測にベースレイヤ復号画像が利用されない。すなわち、このピクチャのイントラ予測においては、レイヤ間テクスチャ予測のための動き補償が省略される。逆に、シンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値が「１」の場合、イントラ予測部９４４は、テクスチャBLモードを候補の１つとして用いてイントラ予測を行う。

また、インター予測部９４５は、ヘッダ生成部９４８により設定されたシンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値に従ってインター予測を行う。例えば、シンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値が「０」の場合、インター予測部９４５は、リファレンスインデックスモードを用いずにインター予測を行う。つまり、このピクチャについては、インター予測にベースレイヤ復号画像が利用されない。すなわち、このピクチャのインター予測においては、レイヤ間テクスチャ予測のための動き補償が省略される。逆に、シンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値が「１」の場合、インター予測部９４５は、リファレンスインデックスモードを候補の１つとして用いてインター予測を行う。

以上のように、ロングターム参照フレームについてのシンタクスの値を制御し、そのシンタクスの値に基づいてイントラ予測やインター予測を行い、さらにそのシンタクスの値を復号側に伝送することにより、画像符号化装置９００は、エンハンスメントレイヤの復号処理におけるレイヤ間テクスチャ予測の実行をピクチャ毎に制御することができる。つまり、画像符号化装置９００は、復号処理における各レイヤの動き補償の実行を適切に制御することができ、復号処理の負荷の増大を抑制することができる。

＜画像符号化処理の流れ＞
次に、以上のような画像符号化装置９００により実行される各処理の流れについて説明する。最初に、図６５のフローチャートを参照して、画像符号化処理の流れの例を説明する。

画像符号化処理が開始されると、ステップＳ９０１において、画像符号化装置９００のベースレイヤ画像符号化部９０１は、ベースレイヤの画像データを符号化する。

ステップＳ９０２において、エンハンスメントレイヤ画像符号化部９０２のヘッダ生成部９４８は、エンハンスメントレイヤのシーケンスパラメータセットを生成する。

ステップＳ９０３において、エンハンスメントレイヤ画像符号化部９０２は、ステップＳ９０２において生成されたシーケンスパラメータセットを用いて、エンハンスメントレイヤの画像データを符号化する。

ステップＳ９０４において、多重化部９０３は、ステップＳ９０１の処理により生成されたベースレイヤ画像符号化ストリームと、ステップＳ９０３の処理により生成されたエンハンスメントレイヤ画像符号化ストリームとを（すなわち、各レイヤの符号化ストリームを）多重化し、１系統の階層画像符号化ストリームを生成する。

ステップＳ９０４の処理が終了すると、画像符号化処理が終了する。

なお、ヘッダ生成部９４８は、シーケンスパラメータセット以外のヘッダ情報も生成するが、後述するスライスヘッダを除き、その説明は省略する。また、ベースレイヤ画像符号化部９０１（例えば可逆符号化部９１６）も、ベースレイヤについて、シーケンスパラメータセット、ピクチャパラメータセット、スライスヘッダ等のヘッダ情報を生成するが、その説明は省略する。

なお、ステップＳ９０１、ステップＳ９０３、およびステップＳ９０４の各処理は、ピクチャ毎に実行される。また、ステップＳ９０２の処理は、シーケンス毎に実行される。

＜ベースレイヤ符号化処理の流れ＞
次に、図６５のステップＳ９０１において実行されるベースレイヤ符号化処理の流れの例を、図６６のフローチャートを参照して説明する。

ベースレイヤ符号化処理が開始されると、ステップＳ９２１乃至ステップＳ９２３の各処理が、図１５のステップＳ１４１乃至ステップＳ１４３の各処理と同様に実行される。

ステップＳ９２４において、インター予測部９２５は、インター予測モードでの動き予測や動き補償等を行うインター予測処理を行う。

ステップＳ９２５乃至ステップＳ９３３の各処理が、図１５のステップＳ１４５乃至ステップＳ１５３の各処理と同様に実行される。ステップＳ９３４乃至ステップＳ９３６の各処理が、図１５のステップＳ１５５乃至ステップＳ１５７の各処理と同様に実行される。

ステップＳ９３７において、フレームメモリ９２２は、以上のようなベースレイヤ符号化処理において得られたベースレイヤの復号画像を、エンハンスメントレイヤの符号化処理に供給する。

ステップＳ９３７の処理が終了すると、ベースレイヤ符号化処理が終了し、処理は、図６５に戻る。

＜シーケンスパラメータセット生成処理の流れ＞
次に、図６５のステップＳ９０２において実行されるシーケンスパラメータセット生成処理の流れの例を、図６７のフローチャートを参照して説明する。

シーケンスパラメータセット生成処理が開始されると、エンハンスメントレイヤ画像符号化部９０２のヘッダ生成部９４８は、ステップＳ９４１において、ロングターム参照フレームについてのシンタクスused_by_curr_pic_lt_sps_flag[i]を設定する。

ステップＳ９４２において、ヘッダ生成部９４８は、その他のシンタクスの値を設定し、それらのシンタクスと、ステップＳ９４１において設定したシンタクスused_by_curr_pic_lt_sps_flag[i]とを含めたシーケンスパラメータセットを生成する。

ステップＳ９４２の処理が終了すると、シーケンスパラメータセット生成処理が終了し、処理は、図６５に戻る。

＜エンハンスメントレイヤ符号化処理の流れ＞
次に、図６５のステップＳ９０３において実行されるエンハンスメントレイヤ符号化処理の流れの例を、図６８のフローチャートを参照して説明する。

エンハンスメントレイヤ符号化処理が開始されると、ステップＳ９５１およびステップＳ９５２の各処理が、図１７のステップＳ１９１およびステップＳ１９２の各処理と同様に実行される。

ステップＳ９５３において、ヘッダ生成部９４８は、ロングターム参照フレームについてのシンタクスused_by_curr_pic_lt_flag[i]を設定する。

ステップＳ９５４において、ヘッダ生成部９４８は、その他のシンタクスの値を設定し、それらのシンタクスと、ステップＳ９５３において設定したシンタクスused_by_curr_pic_lt_flag[i]とを含めたスライスヘッダを生成する。

ステップＳ９５５において、イントラ予測部９４４は、イントラ予測処理を行う。

ステップＳ９５６において、インター予測部９４５は、インター予測処理を行う。

ステップＳ９５７乃至ステップＳ９６８の各処理は、図１７のステップＳ１９５乃至ステップＳ２０６の各処理と同様に実行される。

ステップＳ９６８の処理が終了すると、エンハンスメントレイヤ符号化処理が終了し、処理は、図６５に戻る。

＜イントラ予測処理の流れ＞
次に、図６８のステップＳ９５５において実行されるイントラ予測処理の流れの例を、図６９のフローチャートを参照して説明する。

イントラ予測処理が開始されると、イントラ予測部９４４は、ステップＳ９７１において、テクスチャBLモード以外の各候補モードでイントラ予測を行い、各モードの予測画像を生成する。

ステップＳ９７２において、イントラ予測部９４４は、図６７のステップＳ９４１において設定されたシーケンスパラメータセット（sep_parameter_set_rbsp）のシンタクスused_by_curr_pic_lt_sps_flag[i]、並びに、図６８のステップＳ９５３において設定されたスライスヘッダ（slice_segment_header）のシンタクスused_by_curr_pic_lt_flag[i]に基づいて、ベースレイヤの画像を参照するか否かを判定する。

例えば、これらのシンタクスの値が「１」に設定されており、ベースレイヤの画像を参照すると判定された場合、処理はステップＳ９７３に進む。ステップＳ９７３において、イントラ予測部９４４は、テクスチャBLモードでイントラ予測を行い、テクスチャBLモードの予測画像を生成する。テクスチャBLモードの予測画像が生成されると、処理はステップＳ９７４に進む。また、ステップＳ９７２において、上述したシンタクスの値が「０」に設定されており、ベースレイヤの画像を参照しないと判定された場合、処理はステップＳ９７４に進む。

ステップＳ９７４において、イントラ予測部９４４は、各イントラ予測モードの予測画像についてコスト関数値を算出する。ステップＳ９７５において、イントラ予測部９４４は、ステップＳ９７４において算出されたコスト関数値を用いて最適予測モードを決定する。ステップＳ９７６において、イントラ予測部９４４は、ステップＳ９７５において最適予測モードに決定されたイントラ予測モードに関する情報であるイントラ予測モード情報を符号化し、可逆符号化部９３６に供給する。

ステップＳ９７６の処理が終了すると、イントラ予測処理が終了し、処理は図６８に戻る。

＜インター予測処理の流れ＞
次に、図６８のステップＳ９５６において実行されるインター予測処理の流れの例を、図７０のフローチャートを参照して説明する。

インター予測処理が開始されると、インター予測部９４５は、ステップＳ９８１において、リファレンスインデックスモード以外の各候補モードでインター予測を行い、各モードの予測画像を生成する。

ステップＳ９８２において、インター予測部９４５は、図６７のステップＳ９４１において設定されたシーケンスパラメータセット（sep_parameter_set_rbsp）のシンタクスused_by_curr_pic_lt_sps_flag[i]、並びに、図６８のステップＳ９５３において設定されたスライスヘッダ（slice_segment_header）のシンタクスused_by_curr_pic_lt_flag[i]に基づいて、ベースレイヤの画像を参照するか否かを判定する。

例えば、これらのシンタクスの値が「１」に設定されており、ベースレイヤの画像を参照すると判定された場合、処理はステップＳ９８３に進む。ステップＳ９８３において、インター予測部９４５は、リファレンスインデックスモードでインター予測を行い、リファレンスインデックスモードの予測画像を生成する。リファレンスインデックスモードの予測画像が生成されると、処理はステップＳ９８４に進む。また、ステップＳ９８２において、上述したシンタクスの値が「０」に設定されており、ベースレイヤの画像を参照しないと判定された場合、処理はステップＳ９８４に進む。

ステップＳ９８４において、インター予測部９４５は、各インター予測モードの予測画像についてコスト関数値を算出する。ステップＳ９８５において、インター予測部９４５は、ステップＳ９８４において算出されたコスト関数値を用いて最適予測モードを決定する。ステップＳ９８６において、インター予測部９４５は、ステップＳ９８５において最適予測モードに決定されたインター予測モードに関する情報であるインター予測モード情報を符号化し、可逆符号化部９３６に供給する。

ステップＳ９８６の処理が終了すると、インター予測処理が終了し、処理は図６８に戻る。

以上のように各処理が実行されることにより、画像符号化装置９００（エンハンスメントレイヤ画像符号化部９０２）は、復号処理における各レイヤの動き補償の実行を適切に制御することができ、復号処理の負荷の増大を抑制することができる。

＜１２．第１０の実施の形態＞
＜画像復号装置＞
次に、以上のように符号化された符号化データの復号について説明する。図７１は、本技術を適用した画像処理装置の一態様である、図６２の画像符号化装置９００に対応する画像復号装置の主な構成例を示すブロック図である。図７１に示される画像復号装置１０００は、画像符号化装置９００が生成した符号化データを、その符号化方法に対応する復号方法で復号する（すなわち、階層符号化された符号化データを階層復号する）。この画像復号装置１０００は、図１９のスケーラブル復号装置２００と基本的に同様の画像処理装置であるが、説明の便宜上、＜１０．概要３＞において説明した本技術と直接的な関係の少ない構成（例えば共通情報取得部２０１、復号制御部２０２、レイヤ間予測制御部２０４等）についての説明は省略している。

図７１に示されるように、画像復号装置１０００は、逆多重化部１００１、ベースレイヤ画像復号部１００２、およびエンハンスメントレイヤ画像復号部１００３を有する。

逆多重化部１００１は、符号化側から伝送された、ベースレイヤ画像符号化ストリームとエンハンスメントレイヤ画像符号化ストリームとが多重化された階層画像符号化ストリームを受け取り、それを逆多重化し、ベースレイヤ画像符号化ストリームと、エンハンスメントレイヤ画像符号化ストリームとを抽出する。ベースレイヤ画像復号部１００２は、ベースレイヤ画像復号部２０３（図１９）と基本的に同様の処理部であり、逆多重化部１００１により抽出されたベースレイヤ画像符号化ストリームを復号し、ベースレイヤ画像を得る。エンハンスメントレイヤ画像復号部１００３は、エンハンスメントレイヤ画像復号部２０５（図１９）と基本的に同様の処理部であり、逆多重化部１００１により抽出されたエンハンスメントレイヤ画像符号化ストリームを復号し、エンハンスメントレイヤ画像を得る。

ベースレイヤ画像復号部１００２は、ベースレイヤの復号において得られたベースレイヤ復号画像を、エンハンスメントレイヤ画像復号部１００３に供給する。

エンハンスメントレイヤ画像復号部１００３は、ベースレイヤ画像復号部１００２から供給されるベースレイヤ復号画像を取得し、記憶する。エンハンスメントレイヤ画像復号部１００３は、その記憶したベースレイヤ復号画像を参照画像として、エンハンスメントレイヤの復号における予測処理に用いる。

＜ベースレイヤ画像復号部＞
図７２は、図７１のベースレイヤ画像復号部１００２の主な構成例を示すブロック図である。図７２に示されるようにベースレイヤ画像復号部１００２は、蓄積バッファ１０１１、可逆復号部１０１２、逆量子化部１０１３、逆直交変換部１０１４、演算部１０１５、ループフィルタ１０１６、画面並べ替えバッファ１０１７、およびD/A変換部１０１８を有する。また、ベースレイヤ画像復号部１００２は、フレームメモリ１０１９、選択部１０２０、イントラ予測部１０２１、インター予測部１０２２、および予測画像選択部１０２３を有する。

蓄積バッファ１０１１は、ベースレイヤ画像復号部２０３の蓄積バッファ２１１（図２０）と同様の処理部である。可逆復号部１０１２は、ベースレイヤ画像復号部２０３の可逆復号部２１２（図２０）と同様の処理部である。逆量子化部１０１３は、ベースレイヤ画像復号部２０３の逆量子化部２１３（図２０）と同様の処理部である。逆直交変換部１０１４は、ベースレイヤ画像復号部２０３の逆直交変換部２１４（図２０）と同様の処理部である。演算部１０１５は、ベースレイヤ画像復号部２０３の演算部２１５（図２０）と同様の処理部である。ループフィルタ１０１６は、ベースレイヤ画像復号部２０３のループフィルタ２１６（図２０）と同様の処理部である。画面並べ替えバッファ１０１７は、ベースレイヤ画像復号部２０３の画面並べ替えバッファ２１７（図２０）と同様の処理部である。D/A変換部１０１８は、ベースレイヤ画像復号部２０３のD/A変換部２１８（図２０）と同様の処理部である。

フレームメモリ１０１９は、ベースレイヤ画像復号部２０３のフレームメモリ２１９（図２０）と同様の処理部である。ただし、フレームメモリ１０１９は、記憶している復号画像（ベースレイヤ復号画像とも称する）を、エンハンスメントレイヤ画像復号部１００３に供給する。

選択部１０２０は、ベースレイヤ画像復号部２０３の選択部２２０（図２０）と同様の処理部である。

イントラ予測部１０２１には、イントラ予測モード情報等が可逆復号部１０１２から適宜供給される。イントラ予測部１０２１は、符号化の際のイントラ予測に用いられたイントラ予測モード（最適イントラ予測モード）でイントラ予測を行い、所定のブロック毎に（ブロックを処理単位として）、予測画像を生成する。その際、イントラ予測部１０２１は、選択部１０２０を介してフレームメモリ１０１９から供給される再構成画像（予測画像選択部１０２３により選択された予測画像と逆直交変換部２１４からの復号残差データ（差分画像情報）とが加算され、適宜デブロックフィルタ処理が行われた画像）の画像データを用いてイントラ予測を行う。すなわち、イントラ予測部１０２１は、この再構成画像を参照画像（周辺画素）として利用する。イントラ予測部１０２１は、生成した予測画像を予測画像選択部１０２３に供給する。

インター予測部１０２２には、最適予測モード情報や動き情報等が可逆復号部１０１２から適宜供給される。インター予測部１０２２は、符号化の際のインター予測に用いられたインター予測モード（最適インター予測モード）でインター予測を行い、所定のブロック毎に（ブロックを処理単位として）、予測画像を生成する。その際、インター予測部１０２２は、選択部１０２０を介してフレームメモリ１０１９から供給される復号画像（適宜ループフィルタ処理等が行われた再構成画像）の画像データを参照画像として利用し、インター予測を行う。インター予測部１０２２は、生成した予測画像を予測画像選択部１０２３に供給する。

予測画像選択部１０２３は、ベースレイヤ画像復号部２０３の選択部２２３（図２０）と同様の処理部である。

なお、ベースレイヤ画像復号部１００２は、他のレイヤを参照せずに復号を行う。つまり、イントラ予測部１０２１およびインター予測部１０２２は、他のレイヤの復号画像を参照画像として利用しない。

＜エンハンスメントレイヤ画像復号部＞
図７３は、図７１のエンハンスメントレイヤ画像復号部１００３の主な構成例を示すブロック図である。図７３に示されるように、エンハンスメントレイヤ画像復号部１００３は、図７２のベースレイヤ画像復号部１００２と基本的に同様の構成を有する。

つまり、エンハンスメントレイヤ画像復号部１００３は、図７３に示されるように、蓄積バッファ１０３１、可逆復号部１０３２、逆量子化部１０３３、逆直交変換部１０３４、演算部１０３５、ループフィルタ１０３６、画面並べ替えバッファ１０３７、およびD/A変換部１０３８を有する。また、エンハンスメントレイヤ画像復号部１００３は、フレームメモリ１０３９、選択部１０４０、イントラ予測部１０４１、インター予測部１０４２、および予測画像選択部１０４３を有する。

これらの蓄積バッファ１０３１乃至予測画像選択部１０４３は、図７２の蓄積バッファ１０１１乃至予測画像選択部１０２３に対応し、それぞれ、対応する処理部と同様の処理を行う。ただし、エンハンスメントレイヤ画像復号部１００３の各部は、ベースレイヤではなく、エンハンスメントレイヤ画像情報の符号化についての処理を行う。したがって、蓄積バッファ１０３１乃至予測画像選択部１０４３の処理の説明として、上述した図７２の蓄積バッファ１０１１乃至予測画像選択部１０２３についての説明を適用することができるが、その場合、処理するデータは、ベースレイヤのデータではなく、エンハンスメントレイヤのデータであるものとする必要がある。また、データの入力元や出力先の処理部は、適宜、エンハンスメントレイヤ画像復号部１００３の、対応する処理部に置き換えて読む必要がある。

なお、エンハンスメントレイヤ画像復号部１００３は、他のレイヤ（例えばベースレイヤ）の情報を参照して符号化を行う。そして、エンハンスメントレイヤ画像復号部１００３は、＜１０．概要３＞において上述した処理を行う。

例えば、フレームメモリ１０３９は、複数の参照フレームを記憶することができ、エンハンスメントレイヤの復号画像（エンハンスメントレイヤ復号画像とも称する）を記憶するだけでなく、ベースレイヤ画像復号部１００２からベースレイヤ復号画像を取得し、ロングターム参照フレームとして記憶する。このとき、フレームメモリ１０３９に記憶されるベースレイヤ復号画像は、アップサンプル処理されたものであってもよい（例えば、フレームメモリ１０３９が、ベースレイヤ画像復号部１００２から供給されるベースレイヤ復号画像をアップサンプルして記憶するようにしてもよい）。

ベースレイヤ画像復号部１００２の場合と同様に、フレームメモリ１０３９に記憶された画像、すなわち、エンハンスメントレイヤ復号画像やベースレイヤ復号画像は、イントラ予測部１０４１やインター予測部１０４２による予測処理において、参照画像として利用される。

例えば、イントラ予測部１０４１は、符号化の際のイントラ予測においてテクスチャBL（texture BL）モードが採用された場合、そのテクスチャBLモードによりイントラ予測を行う。つまり、イントラ予測部１０４１は、ベースレイヤのカレントピクチャの、エンハンスメントレイヤのコロケーテッドブロックの画素値をフレームメモリ１０３９のロングターム参照フレームから（選択部１０４０を介して）取得し、それを参照画像として用いてイントラ予測を行い、予測画像を生成する。生成された予測画像は、予測画像選択部１０４３を介して演算部１０３５に供給される。

また、例えば、インター予測部１０４２は、符号化の際のインター予測においてリファレンスインデックス（Ref_idx）モードが採用された場合、そのリファレンスインデックス（Ref_idx）モードによりインター予測を行う。つまり、インター予測部１０４２は、フレームメモリ１０３９のロングターム参照フレームに格納されるベースレイヤ復号画像を取得し、それを参照画像として用いてインター予測を行い、予測画像を生成する。生成された予測画像は、予測画像選択部１０４３を介して演算部１０３５に供給される。

ところで、図７３に示されるように、エンハンスメントレイヤ画像復号部１００３は、さらに、ヘッダ解読部１０４４を有する。

ヘッダ解読部１０４４は、可逆復号部により抽出された、例えば、シーケンスパラメータセット（SPS）、ピクチャパラメータセット（PPS）、スライスヘッダ等のヘッダ情報を解読する。その際、ヘッダ解読部１０４４は、シーケンスパラメータセット（sep_parameter_set_rbsp）のロングターム参照フレームについてのシンタクスused_by_curr_pic_lt_sps_flag[i]や、スライスヘッダ（slice_segment_header）のロングターム参照フレームについてのシンタクスused_by_curr_pic_lt_flag[i]の値も解読する。

ヘッダ解読部１０４４は、ヘッダ情報の解読結果に基づいて、エンハンスメントレイヤ画像復号部１００３の各処理部の動作を制御する。つまり、エンハンスメントレイヤ画像復号部１００３の各処理部は、適宜、このヘッダ情報に従って、それぞれの処理を行う。

イントラ予測部１０４１は、シンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値に従ってイントラ予測を行う。例えば、シンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値が「０」の場合、イントラ予測部１０４１は、そのピクチャについて、テクスチャBLモード以外のモードでイントラ予測を行う。つまり、このピクチャについては、イントラ予測にベースレイヤ復号画像が利用されない。すなわち、このピクチャのイントラ予測においては、レイヤ間テクスチャ予測のための動き補償が省略される。逆に、シンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値が「１」の場合、イントラ予測部１０４１は、最適イントラ予測モードがテクスチャBLモードであれば、そのテクスチャBLモードでイントラ予測を行う。

インター予測部１０４２は、シンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値に従ってインター予測を行う。例えば、シンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値が「０」の場合、インター予測部１０４２は、そのピクチャについて、リファレンスインデックスモード以外のモードでインター予測を行う。つまり、このピクチャについては、インター予測にベースレイヤ復号画像が利用されない。すなわち、このピクチャのインター予測においては、レイヤ間テクスチャ予測のための動き補償が省略される。逆に、シンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値が「１」の場合、インター予測部１０４２は、最適インター予測モードがリファレンスインデックスモードであれば、そのリファレンスインデックスモードでインター予測を行う。

以上のように、ロングターム参照フレームについてのシンタクスの値に基づいてイントラ予測やインター予測を行うことにより、画像復号装置１０００は、エンハンスメントレイヤの復号処理におけるレイヤ間テクスチャ予測の実行をピクチャ毎に制御することができる。つまり、画像復号装置１０００は、復号処理における各レイヤの動き補償の実行を適切に制御することができ、復号処理の負荷の増大を抑制することができる。

＜画像復号処理の流れ＞
次に、以上のような画像復号装置１０００により実行される各処理の流れについて説明する。最初に、図７４のフローチャートを参照して、画像復号処理の流れの例を説明する。

画像復号処理が開始されると、ステップＳ１００１において、画像復号装置１０００の逆多重化部１００１は、符号化側から伝送される階層画像符号化ストリームを逆多重化し、レイヤ毎のビットストリームを生成する。

ステップＳ１００２において、ベースレイヤ画像復号部１００２は、ステップＳ１００１の処理により得られたベースレイヤ画像符号化ストリームを復号する。ベースレイヤ画像復号部１００２は、この復号により生成されたベースレイヤ画像のデータを出力する。

ステップＳ１００３において、エンハンスメントレイヤ画像復号部１００３のヘッダ解読部１０４４は、ステップＳ１００１の処理により得られたエンハンスメントレイヤ画像符号化ストリームから抽出されたヘッダ情報のシーケンスパラメータセットを解読する。

ステップＳ１００４において、エンハンスメントレイヤ画像復号部１００３は、ステップＳ１００１の処理により得られたエンハンスメントレイヤ画像符号化ストリームを復号する。

ステップＳ１００４の処理が終了すると、画像復号処理が終了する。

なお、ヘッダ解読部１０４４は、シーケンスパラメータセット以外のヘッダ情報も解読するが、後述するスライスヘッダを除き、その説明は省略する。また、ベースレイヤ画像復号部１００２（例えば可逆復号部１０１２）も、ベースレイヤについて、シーケンスパラメータセット、ピクチャパラメータセット、スライスヘッダ等のヘッダ情報を解読するが、その説明は省略する。

なお、ステップＳ１００１、ステップＳ１００２、およびステップＳ１００４の各処理は、ピクチャ毎に実行される。また、ステップＳ１００３の処理は、シーケンス毎に実行される。

＜ベースレイヤ復号処理の流れ＞
次に、図７４のステップＳ１００２において実行されるベースレイヤ復号処理の流れの例を、図７５のフローチャートを参照して説明する。

ベースレイヤ復号処理が開始されると、ステップＳ１０２１乃至ステップＳ１０３０の各処理が、図２５のステップＳ３４１乃至ステップＳ３５０の各処理と同様に実行される。

ステップＳ１０３１において、フレームメモリ１０１９は、以上のようなベースレイヤ復号処理において得られたベースレイヤ復号画像を、エンハンスメントレイヤの復号処理に供給する。

ステップＳ１０３１の処理が終了すると、ベースレイヤ復号処理が終了し、処理は、図７４に戻る。

＜シーケンスパラメータセット解読処理の流れ＞
次に、図７４のステップＳ１００３において実行されるシーケンスパラメータセット解読処理の流れの例を、図７６のフローチャートを参照して説明する。

シーケンスパラメータセット解読処理が開始されると、エンハンスメントレイヤ画像復号部１００３のヘッダ解読部１０４４は、ステップＳ１０４１において、シーケンスパラメータセットの各パラメータを解読し、各処理部に対して解読結果に基づいた制御を行う。

ステップＳ１０４２において、ヘッダ解読部１０４４は、シーケンスパラメータセットのロングターム参照フレームについてのシンタクスused_by_curr_pic_lt_sps_flag[i]を解読し、イントラ予測部１０４１やインター予測部１０４２等に対して解読結果に基づいた制御を行う。

ステップＳ１０４２の処理が終了すると、シーケンスパラメータセット解読処理が終了し、処理は、図７４に戻る。

＜エンハンスメントレイヤ復号処理の流れ＞
次に、図７４のステップＳ１００４において実行されるエンハンスメントレイヤ復号処理の流れの例を、図７７のフローチャートを参照して説明する。

エンハンスメントレイヤ復号処理が開始されると、ステップＳ１０５１およびステップＳ１０５２の各処理が、図２７のステップＳ３９１およびステップＳ３９２の各処理と同様に実行される。

ステップＳ１０５３において、ヘッダ解読部１０４４は、スライスヘッダの各パラメータを解読し、各処理部に対して解読結果に基づいた制御を行う。ステップＳ１０５４において、ヘッダ解読部１０４４は、スライスヘッダのロングターム参照フレームについてのシンタクスused_by_curr_pic_lt_flag[i]を解読し、イントラ予測部１０４１やインター予測部１０４２等に対して解読結果に基づいた制御を行う。

ステップＳ１０５５およびステップＳ１０５６の各処理は、図２７のステップＳ３９３およびステップＳ３９４の各処理と同様に実行される。

ステップＳ１０５７において、イントラ予測部１０４１およびインター予測部１０４２は、予測処理を行い、イントラ予測若しくはインター予測によって予測画像を生成する。その際、イントラ予測部１０４１およびインター予測部１０４２は、図７６のステップＳ１０４２の処理によるシンタクスused_by_curr_pic_lt_sps_flag[i]の解読結果と、ステップＳ１０５４の処理によるシンタクスused_by_curr_pic_lt_flag[i]の解読結果とに基づくヘッダ解読部１０４４の制御に従って、予測処理を行う。

ステップＳ１０５８乃至ステップＳ１０６２の各処理は、図２７のステップＳ３９６乃至ステップＳ４００の各処理と同様に実行される。

ステップＳ１０６２の処理が終了すると、エンハンスメントレイヤ復号処理が終了し、処理は、図７４に戻る。

＜予測処理の流れ＞
次に、図７７のステップＳ１０５７において実行される予測処理の流れの例を、図７８のフローチャートを参照して説明する。

予測処理が開始されると、イントラ予測部１０４１およびインター予測部１０４２は、ステップＳ１０７１において、処理対象であるカレントブロックについて、最適モード（符号化の際に採用された予測処理のモード）がイントラ予測モードであるか否かを判定する。イントラ予測により予測画像が生成されたと判定された場合、処理はステップＳ１０７２に進む。

ステップＳ１０７２において、イントラ予測部１０４１は、ベースレイヤの画像を参照するか否かを判定する。ヘッダ解読部１０４４により、カレントブロックが属するカレントピクチャについてレイヤ間テクスチャ予測を行うことができるように制御されており、かつ、カレントブロックの最適イントラ予測モードがテクスチャBLモードである場合、イントラ予測部１０４１は、カレントブロックの予測処理においてベースレイヤの画像を参照すると判定する。このように判定された場合、処理はステップＳ１０７３に進む。

ステップＳ１０７３において、イントラ予測部１０４１は、参照画像として、フレームメモリ１０３９のロングターム参照フレームからベースレイヤ復号画像を取得する。ステップＳ１０７４において、イントラ予測部１０４１は、テクスチャBLモードでイントラ予測を行い、予測画像を生成する。ステップＳ１０７４の処理が終了すると、処理はステップＳ１０８０に進む。

また、ステップＳ１０７２において、ヘッダ解読部１０４４によりカレントピクチャについてレイヤ間テクスチャ予測を行うことができるように制御されており、かつ、カレントブロックの最適イントラ予測モードがテクスチャBLモードでない場合か、若しくは、ヘッダ解読部１０４４によりカレントピクチャについてレイヤ間テクスチャ予測を行わないように制御されている場合、イントラ予測部１０４１は、カレントブロックの予測処理においてベースレイヤの画像を参照しないと判定する。このように判定された場合、処理はステップＳ１０７５に進む。

ステップＳ１０７５において、イントラ予測部１０４１は、参照画像として、フレームメモリ１０３９からエンハンスメントレイヤ復号画像を取得する。そして、イントラ予測部１０４１は、テクスチャBLモードでない最適イントラ予測モードでイントラ予測を行い、予測画像を生成する。ステップＳ１０７５の処理が終了すると、処理はステップＳ１０８０に進む。

また、ステップＳ１０７１において、カレントブロックについて、最適モードがインター予測モードであると判定された場合、処理はステップＳ１０７６に進む。

ステップＳ１０７６において、インター予測部１０４２は、ベースレイヤの画像を参照するか否かを判定する。ヘッダ解読部１０４４によりカレントピクチャについてレイヤ間テクスチャ予測を行うことができるように制御されており、かつ、カレントブロックの最適インター予測モードがリファレンスインデックスモードである場合、インター予測部１０４２は、カレントブロックの予測処理においてベースレイヤの画像を参照すると判定する。このように判定された場合、処理はステップＳ１０７７に進む。

ステップＳ１０７７において、インター予測部１０４２は、参照画像として、フレームメモリ１０３９のロングターム参照フレームからベースレイヤ復号画像を取得する。ステップＳ１０７８において、インター予測部１０４２は、リファレンスインデックスモードでインター予測を行い、予測画像を生成する。ステップＳ１０７８の処理が終了すると、処理はステップＳ１０８０に進む。

また、ステップＳ１０７６において、ヘッダ解読部１０４４によりカレントピクチャについてレイヤ間テクスチャ予測を行うことができるように制御されており、かつ、カレントブロックの最適インター予測モードがリファレンスインデックスモードでない場合か、若しくは、ヘッダ解読部１０４４によりカレントピクチャについてレイヤ間テクスチャ予測を行わないように制御されている場合、インター予測部１０４２は、カレントブロックの予測処理においてベースレイヤの画像を参照しないと判定する。このように判定された場合、処理はステップＳ１０７９に進む。

ステップＳ１０７９において、インター予測部１０４２は、参照画像として、フレームメモリ１０３９からエンハンスメントレイヤ復号画像を取得する。そして、インター予測部１０４２は、リファレンスインデックスモードでない最適インター予測モードでインター予測を行い、予測画像を生成する。ステップＳ１０７９の処理が終了すると、処理はステップＳ１０８０に進む。

ステップＳ１０８０において、イントラ予測部１０４１若しくはインター予測部１０４２は、生成した予測画像を予測画像選択部１０４３を介して演算部１０３５に供給する。

ステップＳ１０８０の処理が終了すると、予測処理が終了し、処理は図７７に戻る。

以上のような予測処理において、例えば、ステップＳ１０７５の処理やステップＳ１０７９の処理のときのように、ヘッダ解読部１０４４によりカレントピクチャについてレイヤ間テクスチャ予測を行わないように制御されているピクチャに対しては（例えば、シンタクスused_by_curr_pic_lt_sps_flag[i]やシンタクスused_by_curr_pic_lt_flag[i]の値が「０」の場合）、レイヤ間テクスチャ予測のための動き補償が省略される。

したがって、以上のように各処理が実行されることにより、画像復号装置１０００（エンハンスメントレイヤ画像復号部１００３）は、復号処理の負荷の増大を抑制することができる。

＜１３．第１１の実施の形態＞
＜レイヤ間シンタクス予測制御＞
＜７．概要２＞、＜８．第７の実施の形態＞、および＜９．第８の実施の形態＞においては、レイヤ間ピクセル予測（Inter-layer Pixel Prediction）の実行とレイヤ間シンタクス予測（Inter-layer Syntax Prediction）の実行とを互いに独立に制御する例について説明した。

この場合、ベースレイヤの符号化方式がAVCであり、エンハンスメントレイヤの符号化方式がHEVCであるとすると、レイヤ間シンタクス予測では、AVCのシンタクス（syntax）を用いてHEVCのシンタクスの予測処理が行われることになる。しかしながら、実際には、HEVCとは異なる符号化方式のAVCのシンタクス（syntax）を用いて、HEVCのシンタクスの予測処理を行うことは困難であった。そこで、符号化方式がAVCのベースレイヤのシンタクスを用いてレイヤ間シンタクス予測を行うことを禁止とするようにしてもよい。

＜符号化側での制御＞
例えば、符号化側において、ベースレイヤの符号化方式がAVCであり、レイヤ0（layer = 0）を参照する場合、レイヤ間シンタクス予測の実行を制御するレイヤ間シンタクス予測制御情報が、レイヤ間シンタクス予測を実行させないように制御する値に設定され、伝送されるようにしてもよい。

この場合のスケーラブル符号化装置１００の構成は、図９を参照して説明した例と同様である。そして、スケーラブル符号化装置１００の各部の構成は、図４４を参照して説明した例と同様である。

この場合、スケーラブル符号化装置１００により実行される符号化処理は、図１３に示されるフローチャートの例と同様に実行される。そして、その符号化処理において実行される共通情報生成処理は、図４５に示されるフローチャートの例と同様に実行される。また、その符号化処理において実行されるベースレイヤ符号化処理は、図４６に示されるフローチャートの例と同様に実行される。さらに、その符号化処理において実行されるエンハンスメントレイヤ符号化処理は、図４８に示されるフローチャートの例と同様に実行される。また、そのエンハンスメントレイヤ符号化処理において実行される動き予測・補償処理は、図４９に示されるフローチャートの例と同様に実行される。さらに、その符号化処理において実行されるイントラ予測処理は、図５０に示されるフローチャートの例と同様に実行される。

そして、その符号化処理のステップＳ１０６において実行されるレイヤ間予測制御処理の流れの例を、図７９のフローチャートを参照して説明する。

ステップＳ１１０１乃至ステップＳ１１０３の各処理が、図４７のステップＳ７３１乃至ステップＳ７３３の各処理と同様に実行され、レイヤ間ピクセル予測制御情報に基づいてレイヤ間ピクセル予測に関する制御が行われる。

ステップＳ１１０４において、レイヤ間シンタクス予測制御情報設定部７２５は、ベースレイヤの符号化方式がAVCであり、参照レイヤがレイヤ0であるか否かを判定する。より具体的には、レイヤ間シンタクス予測制御情報設定部７２５は、例えば、ベースレイヤの符号化方式がAVCであるか否かを示すフラグ情報であるavc_base_layer_flagの値が「1」（avc_base_layer_flag = 1）であり、参照レイヤを表すパラメータであるlayerの値が「0」（layer = 0）であるか否かを判定する。

ステップＳ１１０４において、avc_base_layer_flag = 0 である、若しくは、layer = 0でないと判定された場合、処理はステップＳ１１０５に進む。

その場合、ステップＳ１１０５乃至ステップＳ１１０７の各処理が、図４７のステップＳ７３４乃至ステップＳ７３６の各処理と同様に実行され、任意の情報に基づいてレイヤ間シンタクス予測制御情報が設定され、レイヤ間シンタクス予測に関する制御が行われる。ステップＳ１１０７の処理が終了すると、若しくは、ステップＳ１１０６において、カレントピクチャがレイヤ間シンタクスを予測を行わないピクチャであると判定されると、レイヤ間予測制御処理が終了し、処理は図１３に戻る。

また、ステップＳ１１０４において、avc_base_layer_flag = 1 であり、layer = 0 であると判定された場合、処理はステップＳ１１０８に進む。

ステップＳ１１０８において、レイヤ間シンタクス予測制御情報設定部７２５は、レイヤ間シンタクス予測の実行をオフにするように、レイヤ間シンタクス予測制御情報を設定する。すなわち、この場合、レイヤ間シンタクス予測は行われない（省略される）。ステップＳ１１０８の処理が終了すると、レイヤ間予測制御処理が終了し、処理は図１３に戻る。

なお、レイヤ間ピクセル予測制御情報設定部７１１は、レイヤ間ピクセル予測の実行（オン／オフ）を制御する制御情報であるレイヤ間ピクセル予測制御情報を、例えばビデオパラメータセット（VPS（Video Parameter Set））、拡張ビデオパラメータセット（Vps_extension（））、またはナルユニット（nal_unit）において伝送させる。

そして、レイヤ間シンタクス予測の実行（オン／オフ）を制御する制御情報であるレイヤ間シンタクス予測制御情報は、例えばピクチャパラメータセット（PPS（Picture Parameter Set）、スライスヘッダ（SliceHeader）、またはナルユニット（nal_unit）において復号側に伝送される。なお、このレイヤ間シンタクス予測制御情報は、例えばビデオパラメータセット（VPS（Video Parameter Set））や、拡張ビデオパラメータセット（Vps_extension（））において復号側に伝送されるようにしてもよい。

このようにすることにより、スケーラブル符号化装置１００は、ベースレイヤの符号化方式がAVCである場合のレイヤ間シンタクス予測制御に関する処理の実行を省略させることができ、符号化処理の負荷の不要な増大を抑制することができる。なお、このように設定されたレイヤ間シンタクス予測制御情報を復号側に伝送することにより、復号側においても、ベースレイヤの符号化方式がAVCである場合のレイヤ間シンタクス予測制御に関する処理の実行を省略させることができる。すなわち、スケーラブル符号化装置１００は、復号処理の負荷の不要な増大も抑制することができる。

＜復号側での制御＞
また、例えば、復号側において、ベースレイヤの符号化方式がAVCであり、レイヤ0（layer = 0）を参照する場合、レイヤ間シンタクス予測制御情報の値が、実際の値に関わらず強制的に「0」であるとみなされるようにしてもよい。

この場合のスケーラブル復号装置２００の構成は、図１９を参照して説明した例と同様である。そして、スケーラブル復号装置２００の各部の構成は、図５１を参照して説明した例と同様である。

この場合、スケーラブル復号装置２００により実行される復号処理は、図２３に示されるフローチャートの例と同様に実行される。そして、その復号処理において実行される共通情報取得処理は、図５２に示されるフローチャートの例と同様に実行される。また、その復号処理において実行されるベースレイヤ復号処理は、図５３に示されるフローチャートの例と同様に実行される。さらに、その復号処理において実行されるエンハンスメントレイヤ復号処理は、図２７に示されるフローチャートの例と同様に実行される。また、そのエンハンスメントレイヤ復号処理において実行される予測処理は、図５５に示されるフローチャートの例と同様に実行される。

そして、その復号処理のステップＳ３０６において実行されるレイヤ間予測制御処理の流れの例を、図８０のフローチャートを参照して説明する。

ステップＳ１１２１乃至ステップＳ１１２３の各処理が、図５４のステップＳ８３１乃至ステップＳ８３３の各処理と同様に実行され、レイヤ間ピクセル予測制御情報に基づいてレイヤ間ピクセル予測に関する制御が行われる。

ステップＳ１１２４において、レイヤ間シンタクス予測制御部８２６は、ベースレイヤの符号化方式がAVCであり、参照レイヤがレイヤ0であるか否かを判定する。より具体的には、レイヤ間シンタクス予測制御部８２６は、例えば、符号化側から伝送された拡張ビデオパラメータセット（Vps_extension（））において、ベースレイヤの符号化方式がAVCであるか否かを示すフラグ情報であるavc_base_layer_flagの値が「1」（avc_base_layer_flag = 1）であり、参照レイヤを表すパラメータであるlayerの値が「0」（layer = 0）であるか否かを判定する。

ステップＳ１１２４において、avc_base_layer_flag = 0 である、若しくは、layer = 0でないと判定された場合、処理はステップＳ１１２５に進む。

この場合、ステップＳ１１２５乃至ステップＳ１１２７の各処理が、図５４のステップＳ８３４乃至ステップＳ８３６の各処理と同様に実行され、レイヤ間シンタクス予測制御情報に基づいてレイヤ間シンタクス予測に関する制御が行われる。ステップＳ１１２７の処理が終了すると、若しくは、ステップＳ１１２６において、カレントピクチャがレイヤ間シンタクスを予測を行わないピクチャであると判定されると、レイヤ間予測制御処理が終了し、処理は図２３に戻る。

また、ステップＳ１１２４において、avc_base_layer_flag = 1 であり、layer = 0 であると判定された場合、処理はステップＳ１１２８に進む。

ステップＳ１１２８において、レイヤ間シンタクス予測制御部８２６は、レイヤ間シンタクス予測の実行をオフにする。すなわち、この場合、レイヤ間シンタクス予測は行われない（省略される）。ステップＳ１１２８の処理が終了すると、レイヤ間予測制御処理が終了し、処理は図２３に戻る。

このようにすることにより、スケーラブル復号装置２００は、ベースレイヤの符号化方式がAVCである場合のレイヤ間シンタクス予測制御に関する処理の実行を省略することができ、復号処理の負荷の不要な増大を抑制することができる。

＜１４．その他＞
以上においては、スケーラブル符号化により画像データが階層化されて複数レイヤ化されるように説明したが、そのレイヤ数は任意である。また、例えば、図８１の例に示されるように、一部のピクチャが階層化されるようにしてもよい。また、以上においては、符号化・復号において、エンハンスメントレイヤは、ベースレイヤを参照して処理されるように説明したが、これに限らず、エンハンスメントレイヤが、処理済の他のエンハンスメントレイヤを参照して処理されるようにしてもよい。

また、以上に説明したレイヤには、多視点画像符号化・復号におけるビューも含まれる。つまり、本技術は、多視点画像符号化・多視点画像復号に適用することができる。図８２は、多視点画像符号化方式の一例を示す。

図８２に示されるように、多視点画像は、複数の視点（ビュー）の画像を含み、その複数の視点のうちの所定の１つの視点の画像が、ベースビューの画像に指定されている。ベースビューの画像以外の各視点の画像は、ノンベースビューの画像として扱われる。

図８２のような多視点画像を符号化・復号する場合、各ビューの画像を符号化・復号するが、この各ビューの符号化・復号に対して、上述した方法を適用するようにしてもよい。つまり、符号化や復号に関する情報を、このような多視点符号化・復号における複数のビューにおいて共有するようにしてもよい。

例えば、ベースビューについては、他のビューの符号化や復号に関する情報を参照せずに符号化・復号を行うようにし、ノンベースビューについては、ベースビューの符号化や復号に関する情報を参照して符号化・復号を行うようにする。そして、ベースビューについての符号化や復号に関する情報のみを伝送するようにする。

このようにすることにより、上述した階層符号化・復号の場合と同様に、多視点符号化・復号においても、符号化効率の低減を抑制することができる。

以上のように、本技術の適用範囲は、スケーラブルな符号化・復号方式に基づくあらゆる画像符号化装置及び画像復号装置に適用することができる。

また、本技術は、例えば、MPEG、H．26x等の様に、離散コサイン変換等の直交変換と動き補償によって圧縮された画像情報（ビットストリーム）を、衛星放送、ケーブルテレビジョン、インターネット、または携帯電話機などのネットワークメディアを介して受信する際に用いられる画像符号化装置および画像復号装置に適用することができる。また、本技術は、光、磁気ディスク、およびフラッシュメモリのような記憶メディア上で処理する際に用いられる画像符号化装置および画像復号装置に適用することができる。さらに、本技術は、それらの画像符号化装置および画像復号装置などに含まれる直交変換装置若しくは逆直交変換装置にも適用することができる。

＜１５．第１２の実施の形態＞
＜コンピュータ＞
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

図８３は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

図８３に示されるコンピュータ１８５０において、CPU（Central Processing Unit）１８５１、ROM（Read Only Memory）１８５２、RAM（Random Access Memory）１８５３は、バス１８５４を介して相互に接続されている。

バス１８５４にはまた、入出力インタフェース１８６０も接続されている。入出力インタフェース１８６０には、入力部１８６１、出力部１８６２、記憶部１８６３、通信部１８６４、およびドライブ１８６５が接続されている。

入力部１８６１は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部１８６２は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部１８６３は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部１８６４は、例えば、ネットワークインタフェースよりなる。ドライブ１８６５は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア１８７１を駆動する。

以上のように構成されるコンピュータでは、CPU１８５１が、例えば、記憶部１８６３に記憶されているプログラムを、入出力インタフェース１８６０およびバス１８５４を介して、RAM１８５３にロードして実行することにより、上述した一連の処理が行われる。RAM１８５３にはまた、CPU１８５１が各種の処理を実行する上において必要なデータなども適宜記憶される。

コンピュータ（CPU１８５１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア１８７１に記録して適用することができる。

その場合、プログラムは、リムーバブルメディア１８７１をドライブ１８６５に装着することにより、入出力インタフェース１８６０を介して、記憶部１８６３にインストールすることができる。

また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部１８６４で受信し、記憶部１８６３にインストールすることができる。その他、このプログラムは、ROM１８５２や記憶部１８６３に、あらかじめインストールしておくことができる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

また、以上において、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。

以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

例えば、本技術は、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

上述した実施形態に係る画像符号化装置及び画像復号装置は、例えば、衛星放送、ケーブルＴＶなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、４つの応用例について説明する。

＜１６．応用例＞
＜第１の応用例：テレビジョン受像機＞
図８４は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置１９００は、アンテナ１９０１、チューナ１９０２、デマルチプレクサ１９０３、デコーダ１９０４、映像信号処理部１９０５、表示部１９０６、音声信号処理部１９０７、スピーカ１９０８、外部インタフェース（I/F）部１９０９、制御部１９１０、ユーザインタフェース部１９１１、及びバス１９１２を備える。

チューナ１９０２は、アンテナ１９０１を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ１９０２は、復調により得られた符号化ビットストリームをデマルチプレクサ１９０３へ出力する。即ち、チューナ１９０２は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置１９００における伝送部としての役割を有する。

デマルチプレクサ１９０３は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ１９０４へ出力する。また、デマルチプレクサ１９０３は、符号化ビットストリームからEPG（Electronic Program Guide）などの補助的なデータを抽出し、抽出したデータを制御部１９１０に供給する。なお、デマルチプレクサ１９０３は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。

デコーダ１９０４は、デマルチプレクサ１９０３から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ１９０４は、復号処理により生成される映像データを映像信号処理部１９０５へ出力する。また、デコーダ１９０４は、復号処理により生成される音声データを音声信号処理部１９０７へ出力する。

映像信号処理部１９０５は、デコーダ１９０４から入力される映像データを再生し、表示部１９０６に映像を表示させる。また、映像信号処理部１９０５は、ネットワークを介して供給されるアプリケーション画面を表示部１９０６に表示させてもよい。また、映像信号処理部１９０５は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部１９０５は、例えばメニュー、ボタン又はカーソルなどのGUI（Graphical User Interface）の画像を生成し、生成した画像を出力画像に重畳してもよい。

表示部１９０６は、映像信号処理部１９０５から供給される駆動信号により駆動され、表示デバイス（例えば、液晶ディスプレイ、プラズマディスプレイ又はOELD（Organic ElectroLuminescence Display）（有機ELディスプレイ）など）の映像面上に映像又は画像を表示する。

音声信号処理部１９０７は、デコーダ１９０４から入力される音声データについてD/A変換及び増幅などの再生処理を行い、スピーカ１９０８から音声を出力させる。また、音声信号処理部１９０７は、音声データについてノイズ除去などの追加的な処理を行ってもよい。

外部インタフェース部１９０９は、テレビジョン装置１９００と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース部１９０９を介して受信される映像ストリーム又は音声ストリームが、デコーダ１９０４により復号されてもよい。即ち、外部インタフェース部１９０９もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置１９００における伝送部としての役割を有する。

制御部１９１０は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、プログラムデータ、EPGデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置１９００の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部１９１１から入力される操作信号に応じて、テレビジョン装置１９００の動作を制御する。

ユーザインタフェース部１９１１は、制御部１９１０と接続される。ユーザインタフェース部１９１１は、例えば、ユーザがテレビジョン装置１９００を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース部１９１１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部１９１０へ出力する。

バス１９１２は、チューナ１９０２、デマルチプレクサ１９０３、デコーダ１９０４、映像信号処理部１９０５、音声信号処理部１９０７、外部インタフェース部１９０９及び制御部１９１０を相互に接続する。

このように構成されたテレビジョン装置１９００において、デコーダ１９０４は、上述した実施形態に係るスケーラブル復号装置２００または画像復号装置１０００（図７１）の機能を有する。それにより、テレビジョン装置１９００での画像の復号に際して、符号化効率の低減の抑制を実現し、符号化・復号による画質の低減の抑制を実現することができる。

＜第２の応用例：携帯電話機＞
図８５は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機１９２０は、アンテナ１９２１、通信部１９２２、音声コーデック１９２３、スピーカ１９２４、マイクロホン１９２５、カメラ部１９２６、画像処理部１９２７、多重分離部１９２８、記録再生部１９２９、表示部１９３０、制御部１９３１、操作部１９３２、及びバス１９３３を備える。

アンテナ１９２１は、通信部１９２２に接続される。スピーカ１９２４及びマイクロホン１９２５は、音声コーデック１９２３に接続される。操作部１９３２は、制御部１９３１に接続される。バス１９３３は、通信部１９２２、音声コーデック１９２３、カメラ部１９２６、画像処理部１９２７、多重分離部１９２８、記録再生部１９２９、表示部１９３０、及び制御部１９３１を相互に接続する。

携帯電話機１９２０は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。

音声通話モードにおいて、マイクロホン１９２５により生成されるアナログ音声信号は、音声コーデック１９２３に供給される。音声コーデック１９２３は、アナログ音声信号を音声データへ変換し、変換された音声データをA/D変換し圧縮する。そして、音声コーデック１９２３は、圧縮後の音声データを通信部１９２２へ出力する。通信部１９２２は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部１９２２は、生成した送信信号を、アンテナ１９２１を介して基地局（図示せず）へ送信する。また、通信部１９２２は、アンテナ１９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部１９２２は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック１９２３へ出力する。音声コーデック１９２３は、音声データを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック１９２３は、生成した音声信号をスピーカ１９２４に供給して音声を出力させる。

また、データ通信モードにおいて、例えば、制御部１９３１は、操作部１９３２を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部１９３１は、文字を表示部１９３０に表示させる。また、制御部１９３１は、操作部１９３２を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部１９２２へ出力する。通信部１９２２は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部１９２２は、生成した送信信号を、アンテナ１９２１を介して基地局（図示せず）へ送信する。また、通信部１９２２は、アンテナ１９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部１９２２は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部１９３１へ出力する。制御部１９３１は、表示部１９３０に電子メールの内容を表示させると共に、電子メールデータを記録再生部１９２９に供給し、その記憶媒体に書き込ませる。

記録再生部１９２９は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、RAM又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USB（ Universal Serial Bus）メモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。

また、撮影モードにおいて、例えば、カメラ部１９２６は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部１９２７へ出力する。画像処理部１９２７は、カメラ部１９２６から入力される画像データを符号化し、符号化ストリームを記録再生部１９２９に供給し、その記憶媒体に書き込ませる。さらに、画像表示モードにおいて、記録再生部１９２９は、記憶媒体に記録されている符号化ストリームを読み出して画像処理部１９２７へ出力する。画像処理部１９２７は、記録再生部１９２９から入力される符号化ストリームを復号し、画像データを表示部１９３０に供給し、その画像を表示させる。

また、テレビ電話モードにおいて、例えば、多重分離部１９２８は、画像処理部１９２７により符号化された映像ストリームと、音声コーデック１９２３から入力される音声ストリームとを多重化し、多重化したストリームを通信部１９２２へ出力する。通信部１９２２は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部１９２２は、生成した送信信号を、アンテナ１９２１を介して基地局（図示せず）へ送信する。また、通信部１９２２は、アンテナ１９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部１９２２は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部１９２８へ出力する。多重分離部１９２８は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部１９２７、音声ストリームを音声コーデック１９２３へ出力する。画像処理部１９２７は、映像ストリームを復号し、映像データを生成する。映像データは、表示部１９３０に供給され、表示部１９３０により一連の画像が表示される。音声コーデック１９２３は、音声ストリームを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック１９２３は、生成した音声信号をスピーカ１９２４に供給して音声を出力させる。

このように構成された携帯電話機１９２０において、画像処理部１９２７は、上述した実施形態に係るスケーラブル符号化装置１００及びスケーラブル復号装置２００、または、画像符号化装置９００（図６２）および画像復号装置１０００（図７１）の機能を有する。それにより、携帯電話機１９２０での画像の符号化及び復号に際して、符号化効率の低減を抑制し、符号化・復号による画質の低減を抑制することができる。

＜第３の応用例：記録再生装置＞
図８６は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置１９４０は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置１９４０は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置１９４０は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置１９４０は、音声データ及び映像データを復号する。

記録再生装置１９４０は、チューナ１９４１、外部インタフェース（I/F）部１９４２、エンコーダ１９４３、HDD（Hard Disk Drive）１９４４、ディスクドライブ１９４５、セレクタ１９４６、デコーダ１９４７、OSD（On-Screen Display）１９４８、制御部１９４９、およびユーザインタフェース（I/F）部１９５０を備える。

チューナ１９４１は、アンテナ（図示せず）を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ１９４１は、復調により得られた符号化ビットストリームをセレクタ１９４６へ出力する。即ち、チューナ１９４１は、記録再生装置１９４０における伝送部としての役割を有する。

外部インタフェース部１９４２は、記録再生装置１９４０と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース部１９４２は、例えば、IEEE（Institute of Electrical and Electronic Engineers）1394インタフェース、ネットワークインタフェース、USBインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース部１９４２を介して受信される映像データおよび音声データは、エンコーダ１９４３へ入力される。即ち、外部インタフェース部１９４２は、記録再生装置１９４０における伝送部としての役割を有する。

エンコーダ１９４３は、外部インタフェース部１９４２から入力される映像データおよび音声データが符号化されていない場合に、映像データおよび音声データを符号化する。そして、エンコーダ１９４３は、符号化ビットストリームをセレクタ１９４６へ出力する。

HDD１９４４は、映像および音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラムおよびその他のデータを内部のハードディスクに記録する。また、HDD１９４４は、映像および音声の再生時に、これらデータをハードディスクから読み出す。

ディスクドライブ１９４５は、装着されている記録媒体へのデータの記録および読み出しを行う。ディスクドライブ１９４５に装着される記録媒体は、例えばDVD（Digital Versatile Disc）ディスク（DVD-Video、DVD-RAM（DVD - Random Access Memory）、DVD-R（DVD - Recordable）、DVD-RW（DVD - Rewritable）、DVD+R（DVD + Recordable）、DVD+RW（DVD + Rewritable）等）又はBlu-ray（登録商標）ディスクなどであってよい。

セレクタ１９４６は、映像および音声の記録時には、チューナ１９４１又はエンコーダ１９４３から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをHDD１９４４又はディスクドライブ１９４５へ出力する。また、セレクタ１９４６は、映像および音声の再生時には、HDD１９４４又はディスクドライブ１９４５から入力される符号化ビットストリームをデコーダ１９４７へ出力する。

デコーダ１９４７は、符号化ビットストリームを復号し、映像データおよび音声データを生成する。そして、デコーダ１９４７は、生成した映像データをOSD１９４８へ出力する。また、デコーダ１９４７は、生成した音声データを外部のスピーカへ出力する。

OSD１９４８は、デコーダ１９４７から入力される映像データを再生し、映像を表示する。また、OSD１９４８は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのGUIの画像を重畳してもよい。

制御部１９４９は、CPUなどのプロセッサ、並びにRAMおよびROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、およびプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置１９４０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部１９５０から入力される操作信号に応じて、記録再生装置１９４０の動作を制御する。

ユーザインタフェース部１９５０は、制御部１９４９と接続される。ユーザインタフェース部１９５０は、例えば、ユーザが記録再生装置１９４０を操作するためのボタンおよびスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース部１９５０は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部１９４９へ出力する。

このように構成された記録再生装置１９４０において、エンコーダ１９４３は、上述した実施形態に係るスケーラブル符号化装置１００または画像符号化装置９００（図６２）の機能を有する。また、デコーダ１９４７は、上述した実施形態に係るスケーラブル復号装置２００または画像復号装置１０００（図７１）の機能を有する。それにより、記録再生装置１９４０での画像の符号化及び復号に際して、符号化効率の低減を抑制し、符号化・復号による画質の低減を抑制することができる。

＜第４の応用例：撮像装置＞
図８７は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置１９６０は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。

撮像装置１９６０は、光学ブロック１９６１、撮像部１９６２、信号処理部１９６３、画像処理部１９６４、表示部１９６５、外部インタフェース（I/F）部１９６６、メモリ部１９６７、メディアドライブ１９６８、OSD１９６９、制御部１９７０、ユーザインタフェース（I/F）部１９７１、およびバス１９７２を備える。

光学ブロック１９６１は、撮像部１９６２に接続される。撮像部１９６２は、信号処理部１９６３に接続される。表示部１９６５は、画像処理部１９６４に接続される。ユーザインタフェース部１９７１は、制御部１９７０に接続される。バス１９７２は、画像処理部１９６４、外部インタフェース部１９６６、メモリ部１９６７、メディアドライブ１９６８、OSD１９６９、および制御部１９７０を相互に接続する。

光学ブロック１９６１は、フォーカスレンズ及び絞り機構などを有する。光学ブロック１９６１は、被写体の光学像を撮像部１９６２の撮像面に結像させる。撮像部１９６２は、CCD（Charge Coupled Device）又はCMOS（Complementary Metal Oxide Semiconductor）などのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部１９６２は、画像信号を信号処理部１９６３へ出力する。

信号処理部１９６３は、撮像部１９６２から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部１９６３は、カメラ信号処理後の画像データを画像処理部１９６４へ出力する。

画像処理部１９６４は、信号処理部１９６３から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部１９６４は、生成した符号化データを外部インタフェース部１９６６またはメディアドライブ１９６８へ出力する。また、画像処理部１９６４は、外部インタフェース部１９６６またはメディアドライブ１９６８から入力される符号化データを復号し、画像データを生成する。そして、画像処理部１９６４は、生成した画像データを表示部１９６５へ出力する。また、画像処理部１９６４は、信号処理部１９６３から入力される画像データを表示部１９６５へ出力して画像を表示させてもよい。また、画像処理部１９６４は、OSD１９６９から取得される表示用データを、表示部１９６５へ出力する画像に重畳してもよい。

OSD１９６９は、例えばメニュー、ボタン又はカーソルなどのGUIの画像を生成して、生成した画像を画像処理部１９６４へ出力する。

外部インタフェース部１９６６は、例えばUSB入出力端子として構成される。外部インタフェース部１９６６は、例えば、画像の印刷時に、撮像装置１９６０とプリンタとを接続する。また、外部インタフェース部１９６６には、例えば、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置１９６０にインストールされ得る。さらに、外部インタフェース部１９６６は、LAN又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース部１９６６は、撮像装置１９６０における伝送部としての役割を有する。

メディアドライブ１９６８に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ１９６８に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はSSD（Solid State Drive）のような非可搬性の記憶部が構成されてもよい。

制御部１９７０は、CPUなどのプロセッサ、並びにRAMおよびROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、およびプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置１９６０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部１９７１から入力される操作信号に応じて、撮像装置１９６０の動作を制御する。

ユーザインタフェース部１９７１は、制御部１９７０と接続される。ユーザインタフェース部１９７１は、例えば、ユーザが撮像装置１９６０を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース部１９７１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部１９７０へ出力する。

このように構成された撮像装置１９６０において、画像処理部１９６４は、上述した実施形態に係るスケーラブル符号化装置１００及びスケーラブル復号装置２００、または、画像符号化装置９００（図６２）および画像復号装置１０００（図７１）の機能を有する。それにより、撮像装置１９６０での画像の符号化及び復号に際して、符号化効率の低減を抑制し、符号化・復号による画質の低減を抑制することができる。

＜１７．スケーラブル符号化の応用例＞
＜第１のシステム＞
次に、スケーラブル符号化（階層（画像）符号化）されたスケーラブル符号化データの具体的な利用例について説明する。スケーラブル符号化は、例えば、図８８に示される例のように、伝送するデータの選択のために利用される。

図８８に示されるデータ伝送システム２０００において、配信サーバ２００２は、スケーラブル符号化データ記憶部２００１に記憶されているスケーラブル符号化データを読み出し、ネットワーク２００３を介して、パーソナルコンピュータ２００４、AV機器２００５、タブレットデバイス２００６、および携帯電話機２００７等の端末装置に配信する。

その際、配信サーバ２００２は、端末装置の能力や通信環境等に応じて、適切な品質の符号化データを選択して伝送する。配信サーバ２００２が不要に高品質なデータを伝送しても、端末装置において高画質な画像を得られるとは限らず、遅延やオーバフローの発生要因となる恐れがある。また、不要に通信帯域を占有したり、端末装置の負荷を不要に増大させたりしてしまう恐れもある。逆に、配信サーバ２００２が不要に低品質なデータを伝送しても、端末装置において十分な画質の画像を得ることができない恐れがある。そのため、配信サーバ２００２は、スケーラブル符号化データ記憶部２００１に記憶されているスケーラブル符号化データを、適宜、端末装置の能力や通信環境等に対して適切な品質の符号化データとして読み出し、伝送する。

例えば、スケーラブル符号化データ記憶部２００１は、スケーラブルに符号化されたスケーラブル符号化データ（BL+EL）２０１１を記憶するとする。このスケーラブル符号化データ（BL+EL）２０１１は、ベースレイヤとエンハンスメントレイヤの両方を含む符号化データであり、復号することにより、ベースレイヤの画像およびエンハンスメントレイヤの画像の両方を得ることができるデータである。

配信サーバ２００２は、データを伝送する端末装置の能力や通信環境等に応じて、適切なレイヤを選択し、そのレイヤのデータを読み出す。例えば、配信サーバ２００２は、処理能力の高いパーソナルコンピュータ２００４やタブレットデバイス２００６に対しては、高品質なスケーラブル符号化データ（BL+EL）２０１１をスケーラブル符号化データ記憶部２００１から読み出し、そのまま伝送する。これに対して、例えば、配信サーバ２００２は、処理能力の低いAV機器２００５や携帯電話機２００７に対しては、スケーラブル符号化データ（BL+EL）２０１１からベースレイヤのデータを抽出し、スケーラブル符号化データ（BL+EL）２０１１と同じコンテンツのデータであるが、スケーラブル符号化データ（BL+EL）２０１１よりも低品質なスケーラブル符号化データ（BL）２０１２として伝送する。

このようにスケーラブル符号化データを用いることにより、データ量を容易に調整することができるので、遅延やオーバフローの発生を抑制したり、端末装置や通信媒体の負荷の不要な増大を抑制したりすることができる。また、スケーラブル符号化データ（BL+EL）２０１１は、レイヤ間の冗長性が低減されているので、各レイヤの符号化データを個別のデータとする場合よりもそのデータ量を低減させることができる。したがって、スケーラブル符号化データ記憶部２００１の記憶領域をより効率よく使用することができる。

なお、パーソナルコンピュータ２００４乃至携帯電話機２００７のように、端末装置には様々な装置を適用することができるので、端末装置のハードウエアの性能は、装置によって異なる。また、端末装置が実行するアプリケーションも様々であるので、そのソフトウエアの能力も様々である。さらに、通信媒体となるネットワーク２００３も、例えばインターネットやLAN（Local Area Network）等、有線若しくは無線、またはその両方を含むあらゆる通信回線網を適用することができ、そのデータ伝送能力は様々である。さらに、他の通信等によっても変化する恐れがある。

そこで、配信サーバ２００２は、データ伝送を開始する前に、データの伝送先となる端末装置と通信を行い、端末装置のハードウエア性能や、端末装置が実行するアプリケーション（ソフトウエア）の性能等といった端末装置の能力に関する情報、並びに、ネットワーク２００３の利用可能帯域幅等の通信環境に関する情報を得るようにしてもよい。そして、配信サーバ２００２が、ここで得た情報を基に、適切なレイヤを選択するようにしてもよい。

なお、レイヤの抽出は、端末装置において行うようにしてもよい。例えば、パーソナルコンピュータ２００４が、伝送されたスケーラブル符号化データ（BL+EL）２０１１を復号し、ベースレイヤの画像を表示しても良いし、エンハンスメントレイヤの画像を表示しても良い。また、例えば、パーソナルコンピュータ２００４が、伝送されたスケーラブル符号化データ（BL+EL）２０１１から、ベースレイヤのスケーラブル符号化データ（BL）２０１２を抽出し、記憶したり、他の装置に転送したり、復号してベースレイヤの画像を表示したりするようにしてもよい。

もちろん、スケーラブル符号化データ記憶部２００１、配信サーバ２００２、ネットワーク２００３、および端末装置の数はいずれも任意である。また、以上においては、配信サーバ２００２がデータを端末装置に伝送する例について説明したが、利用例はこれに限定されない。データ伝送システム２０００は、スケーラブル符号化された符号化データを端末装置に伝送する際、端末装置の能力や通信環境等に応じて、適切なレイヤを選択して伝送するシステムであれば、任意のシステムに適用することができる。

そして、図８８のようなデータ伝送システム２０００においても、図１乃至図８０を参照して上述した階層符号化・階層復号への適用と同様に本技術を適用することにより、図１乃至図８０を参照して上述した効果と同様の効果を得ることができる。

＜第２のシステム＞
また、スケーラブル符号化は、例えば、図８９に示される例のように、複数の通信媒体を介する伝送のために利用される。

図８９に示されるデータ伝送システム２１００において、放送局２１０１は、地上波放送２１１１により、ベースレイヤのスケーラブル符号化データ（BL）２１２１を伝送する。また、放送局２１０１は、有線若しくは無線またはその両方の通信網よりなる任意のネットワーク２１１２を介して、エンハンスメントレイヤのスケーラブル符号化データ（EL）２１２２を伝送する（例えばパケット化して伝送する）。

端末装置２１０２は、放送局２１０１が放送する地上波放送２１１１の受信機能を有し、この地上波放送２１１１を介して伝送されるベースレイヤのスケーラブル符号化データ（BL）２１２１を受け取る。また、端末装置２１０２は、ネットワーク２１１２を介した通信を行う通信機能をさらに有し、このネットワーク２１１２を介して伝送されるエンハンスメントレイヤのスケーラブル符号化データ（EL）２１２２を受け取る。

端末装置２１０２は、例えばユーザ指示等に応じて、地上波放送２１１１を介して取得したベースレイヤのスケーラブル符号化データ（BL）２１２１を、復号してベースレイヤの画像を得たり、記憶したり、他の装置に伝送したりする。

また、端末装置２１０２は、例えばユーザ指示等に応じて、地上波放送２１１１を介して取得したベースレイヤのスケーラブル符号化データ（BL）２１２１と、ネットワーク２１１２を介して取得したエンハンスメントレイヤのスケーラブル符号化データ（EL）２１２２とを合成して、スケーラブル符号化データ（BL+EL）を得たり、それを復号してエンハンスメントレイヤの画像を得たり、記憶したり、他の装置に伝送したりする。

以上のように、スケーラブル符号化データは、例えばレイヤ毎に異なる通信媒体を介して伝送させることができる。したがって、負荷を分散させることができ、遅延やオーバフローの発生を抑制することができる。

また、状況に応じて、伝送に使用する通信媒体を、レイヤ毎に選択することができるようにしてもよい。例えば、データ量が比較的多いベースレイヤのスケーラブル符号化データ（BL）２１２１を帯域幅の広い通信媒体を介して伝送させ、データ量が比較的少ないエンハンスメントレイヤのスケーラブル符号化データ（EL）２１２２を帯域幅の狭い通信媒体を介して伝送させるようにしてもよい。また、例えば、エンハンスメントレイヤのスケーラブル符号化データ（EL）２１２２を伝送する通信媒体を、ネットワーク２１１２とするか、地上波放送２１１１とするかを、ネットワーク２１１２の利用可能帯域幅に応じて切り替えるようにしてもよい。もちろん、任意のレイヤのデータについて同様である。

このように制御することにより、データ伝送における負荷の増大を、より抑制することができる。

もちろん、レイヤ数は任意であり、伝送に利用する通信媒体の数も任意である。また、データ配信先となる端末装置２１０２の数も任意である。さらに、以上においては、放送局２１０１からの放送を例に説明したが、利用例はこれに限定されない。データ伝送システム２１００は、スケーラブル符号化された符号化データを、レイヤを単位として複数に分割し、複数の回線を介して伝送するシステムであれば、任意のシステムに適用することができる。

そして、以上のような図８９のようなデータ伝送システム２１００においても、図１乃至図８０を参照して上述した階層符号化・階層復号への適用と同様に本技術を適用することにより、図１乃至図８０を参照して上述した効果と同様の効果を得ることができる。

＜第３のシステム＞
また、スケーラブル符号化は、例えば、図９０に示される例のように、符号化データの記憶に利用される。

図９０に示される撮像システム２２００において、撮像装置２２０１は、被写体２２１１を撮像して得られた画像データをスケーラブル符号化し、スケーラブル符号化データ（BL+EL）２２２１として、スケーラブル符号化データ記憶装置２２０２に供給する。

スケーラブル符号化データ記憶装置２２０２は、撮像装置２２０１から供給されるスケーラブル符号化データ（BL+EL）２２２１を、状況に応じた品質で記憶する。例えば、通常時の場合、スケーラブル符号化データ記憶装置２２０２は、スケーラブル符号化データ（BL+EL）２２２１からベースレイヤのデータを抽出し、低品質でデータ量の少ないベースレイヤのスケーラブル符号化データ（BL）２２２２として記憶する。これに対して、例えば、注目時の場合、スケーラブル符号化データ記憶装置２２０２は、高品質でデータ量の多いスケーラブル符号化データ（BL+EL）２２２１のまま記憶する。

このようにすることにより、スケーラブル符号化データ記憶装置２２０２は、必要な場合のみ、画像を高画質に保存することができるので、画質劣化による画像の価値の低減を抑制しながら、データ量の増大を抑制することができ、記憶領域の利用効率を向上させることができる。

例えば、撮像装置２２０１が監視カメラであるとする。撮像画像に監視対象（例えば侵入者）が写っていない場合（通常時の場合）、撮像画像の内容は重要でない可能性が高いので、データ量の低減が優先され、その画像データ（スケーラブル符号化データ）は、低品質に記憶される。これに対して、撮像画像に監視対象が被写体２２１１として写っている場合（注目時の場合）、その撮像画像の内容は重要である可能性が高いので、画質が優先され、その画像データ（スケーラブル符号化データ）は、高品質に記憶される。

なお、通常時であるか注目時であるかは、例えば、スケーラブル符号化データ記憶装置２２０２が、画像を解析することにより判定しても良い。また、撮像装置２２０１が判定し、その判定結果をスケーラブル符号化データ記憶装置２２０２に伝送するようにしてもよい。

なお、通常時であるか注目時であるかの判定基準は任意であり、判定基準とする画像の内容は任意である。もちろん、画像の内容以外の条件を判定基準とすることもできる。例えば、収録した音声の大きさや波形等に応じて切り替えるようにしてもよいし、所定の時間毎に切り替えるようにしてもよいし、ユーザ指示等の外部からの指示によって切り替えるようにしてもよい。

また、以上においては、通常時と注目時の２つの状態を切り替える例を説明したが、状態の数は任意であり、例えば、通常時、やや注目時、注目時、非常に注目時等のように、３つ以上の状態を切り替えるようにしてもよい。ただし、この切り替える状態の上限数は、スケーラブル符号化データのレイヤ数に依存する。

また、撮像装置２２０１が、スケーラブル符号化のレイヤ数を、状態に応じて決定するようにしてもよい。例えば、通常時の場合、撮像装置２２０１が、低品質でデータ量の少ないベースレイヤのスケーラブル符号化データ（BL）２２２２を生成し、スケーラブル符号化データ記憶装置２２０２に供給するようにしてもよい。また、例えば、注目時の場合、撮像装置２２０１が、高品質でデータ量の多いベースレイヤのスケーラブル符号化データ（BL+EL）２２２１を生成し、スケーラブル符号化データ記憶装置２２０２に供給するようにしてもよい。

以上においては、監視カメラを例に説明したが、この撮像システム２２００の用途は任意であり、監視カメラに限定されない。

そして、図９０のような撮像システム２２００においても、図１乃至図８０を参照して上述した階層符号化・階層復号への適用と同様に本技術を適用することにより、図１乃至図８０を参照して上述した効果と同様の効果を得ることができる。

なお、本技術は、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択して使用する、例えばMPEG DASH等のようなHTTPストリーミングにも適用することができる。つまり、このような複数の符号化データ間で、符号化や復号に関する情報を共有することもできる。

＜１８．第１３の実施の形態＞
＜実施のその他の例＞
以上において本技術を適用する装置やシステム等の例を説明したが、本技術は、これに限らず、このような装置またはシステムを構成する装置に搭載するあらゆる構成、例えば、システムLSI（Large Scale Integration）等としてのプロセッサ、複数のプロセッサ等を用いるモジュール、複数のモジュール等を用いるユニット、ユニットにさらにその他の機能を付加したセット等（すなわち、装置の一部の構成）として実施することもできる。

＜ビデオセット＞
本技術をセットとして実施する場合の例について、図９１を参照して説明する。図９１は、本技術を適用したビデオセットの概略的な構成の一例を示している。

近年、電子機器の多機能化が進んでおり、その開発や製造において、その一部の構成を販売や提供等として実施する場合、１機能を有する構成として実施を行う場合だけでなく、関連する機能を有する複数の構成を組み合わせ、複数の機能を有する１セットとして実施を行う場合も多く見られるようになってきた。

図９１に示されるビデオセット２３００は、このような多機能化された構成であり、画像の符号化や復号（いずれか一方でもよいし、両方でも良い）に関する機能を有するデバイスに、その機能に関連するその他の機能を有するデバイスを組み合わせたものである。

図９１に示されるように、ビデオセット２３００は、ビデオモジュール２３１１、外部メモリ２３１２、パワーマネージメントモジュール２３１３、およびフロントエンドモジュール２３１４等のモジュール群と、コネクティビティ２３２１、カメラ２３２２、およびセンサ２３２３等の関連する機能を有するデバイスとを有する。

モジュールは、互いに関連するいくつかの部品的機能をまとめ、まとまりのある機能を持った部品としたものである。具体的な物理的構成は任意であるが、例えば、それぞれ機能を有する複数のプロセッサ、抵抗やコンデンサ等の電子回路素子、その他のデバイス等を配線基板等に配置して一体化したものが考えられる。また、モジュールに他のモジュールやプロセッサ等を組み合わせて新たなモジュールとすることも考えられる。

図９１の例の場合、ビデオモジュール２３１１は、画像処理に関する機能を有する構成を組み合わせたものであり、アプリケーションプロセッサ２３３１、ビデオプロセッサ２３３２、ブロードバンドモデム２３３３、およびRFモジュール２３３４を有する。

プロセッサは、所定の機能を有する構成をSoC（System On a Chip）により半導体チップに集積したものであり、例えばシステムLSI（Large Scale Integration）等と称されるものもある。この所定の機能を有する構成は、論理回路（ハードウエア構成）であってもよいし、CPU、ROM、RAM等と、それらを用いて実行されるプログラム（ソフトウエア構成）であってもよいし、その両方を組み合わせたものであってもよい。例えば、プロセッサが、論理回路とCPU、ROM、RAM等とを有し、機能の一部を論理回路（ハードウエア構成）により実現し、その他の機能をCPUにおいて実行されるプログラム（ソフトウエア構成）により実現するようにしてもよい。

図９１のアプリケーションプロセッサ２３３１は、画像処理に関するアプリケーションを実行するプロセッサである。このアプリケーションプロセッサ２３３１において実行されるアプリケーションは、所定の機能を実現するために、演算処理を行うだけでなく、例えばビデオプロセッサ２３３２等、ビデオモジュール２３１１内外の構成を必要に応じて制御することもできる。

ビデオプロセッサ２３３２は、画像の符号化・復号（その一方若しくは両方）に関する機能を有するプロセッサである。

ブロードバンドモデム２３３３は、インターネットや公衆電話回線網等の広帯域の回線を介して行われる有線若しくは無線（またはその両方）の広帯域通信により送信するデータ（デジタル信号）をデジタル変調する等してアナログ信号に変換したり、その広帯域通信により受信したアナログ信号を復調してデータ（デジタル信号）に変換したりする。ブロードバンドモデム２３３３は、例えば、ビデオプロセッサ２３３２が処理する画像データ、画像データが符号化されたストリーム、アプリケーションプログラム、設定データ等、任意の情報を処理する。

RFモジュール２３３４は、アンテナを介して送受信されるRF（Radio Frequency）信号に対して、周波数変換、変復調、増幅、フィルタ処理等を行うモジュールである。例えば、RFモジュール２３３４は、ブロードバンドモデム２３３３により生成されたベースバンド信号に対して周波数変換等を行ってRF信号を生成する。また、例えば、RFモジュール２３３４は、フロントエンドモジュール２３１４を介して受信されたRF信号に対して周波数変換等を行ってベースバンド信号を生成する。

なお、図９１において点線２３４１に示されるように、アプリケーションプロセッサ２３３１とビデオプロセッサ２３３２を、一体化し、１つのプロセッサとして構成されるようにしてもよい。

外部メモリ２３１２は、ビデオモジュール２３１１の外部に設けられた、ビデオモジュール２３１１により利用される記憶デバイスを有するモジュールである。この外部メモリ２３１２の記憶デバイスは、どのような物理構成により実現するようにしてもよいが、一般的にフレーム単位の画像データのような大容量のデータの格納に利用されることが多いので、例えばDRAM（Dynamic Random Access Memory）のような比較的安価で大容量の半導体メモリにより実現するのが望ましい。

パワーマネージメントモジュール２３１３は、ビデオモジュール２３１１（ビデオモジュール２３１１内の各構成）への電力供給を管理し、制御する。

フロントエンドモジュール２３１４は、RFモジュール２３３４に対してフロントエンド機能（アンテナ側の送受信端の回路）を提供するモジュールである。図９１に示されるように、フロントエンドモジュール２３１４は、例えば、アンテナ部２３５１、フィルタ２３５２、および増幅部２３５３を有する。

アンテナ部２３５１は、無線信号を送受信するアンテナおよびその周辺の構成を有する。アンテナ部２３５１は、増幅部２３５３から供給される信号を無線信号として送信し、受信した無線信号を電気信号（RF信号）としてフィルタ２３５２に供給する。フィルタ２３５２は、アンテナ部２３５１を介して受信されたRF信号に対してフィルタ処理等を行い、処理後のRF信号をRFモジュール２３３４に供給する。増幅部２３５３は、RFモジュール２３３４から供給されるRF信号を増幅し、アンテナ部２３５１に供給する。

コネクティビティ２３２１は、外部との接続に関する機能を有するモジュールである。コネクティビティ２３２１の物理構成は、任意である。例えば、コネクティビティ２３２１は、ブロードバンドモデム２３３３が対応する通信規格以外の通信機能を有する構成や、外部入出力端子等を有する。

例えば、コネクティビティ２３２１が、Bluetooth（登録商標）、IEEE 802.11（例えばWi-Fi（Wireless Fidelity、登録商標））、NFC（Near Field Communication）、IrDA（InfraRed Data Association）等の無線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した信号を送受信するアンテナ等を有するようにしてもよい。また、例えば、コネクティビティ２３２１が、USB（Universal Serial Bus）、HDMI（登録商標）（High-Definition Multimedia Interface）等の有線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した端子を有するようにしてもよい。さらに、例えば、コネクティビティ２３２１が、アナログ入出力端子等のその他のデータ（信号）伝送機能等を有するようにしてもよい。

なお、コネクティビティ２３２１が、データ（信号）の伝送先のデバイスを含むようにしてもよい。例えば、コネクティビティ２３２１が、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等の記録媒体に対してデータの読み出しや書き込みを行うドライブ（リムーバブルメディアのドライブだけでなく、ハードディスク、SSD（Solid State Drive）、NAS（Network Attached Storage）等も含む）を有するようにしてもよい。また、コネクティビティ２３２１が、画像や音声の出力デバイス（モニタやスピーカ等）を有するようにしてもよい。

カメラ２３２２は、被写体を撮像し、被写体の画像データを得る機能を有するモジュールである。カメラ２３２２の撮像により得られた画像データは、例えば、ビデオプロセッサ２３３２に供給されて符号化される。

センサ２３２３は、例えば、音声センサ、超音波センサ、光センサ、照度センサ、赤外線センサ、イメージセンサ、回転センサ、角度センサ、角速度センサ、速度センサ、加速度センサ、傾斜センサ、磁気識別センサ、衝撃センサ、温度センサ等、任意のセンサ機能を有するモジュールである。センサ２３２３により検出されたデータは、例えば、アプリケーションプロセッサ２３３１に供給されてアプリケーション等により利用される。

以上においてモジュールとして説明した構成をプロセッサとして実現するようにしてもよいし、逆にプロセッサとして説明した構成をモジュールとして実現するようにしてもよい。

以上のような構成のビデオセット２３００において、後述するようにビデオプロセッサ２３３２に本技術を適用することができる。したがって、ビデオセット２３００は、本技術を適用したセットとして実施することができる。

＜ビデオプロセッサの構成例＞
図９２は、本技術を適用したビデオプロセッサ２３３２（図９１）の概略的な構成の一例を示している。

図９２の例の場合、ビデオプロセッサ２３３２は、ビデオ信号およびオーディオ信号の入力を受けてこれらを所定の方式で符号化する機能と、符号化されたビデオデータおよびオーディオデータを復号し、ビデオ信号およびオーディオ信号を再生出力する機能とを有する。

図９２に示されるように、ビデオプロセッサ２３３２は、ビデオ入力処理部２４０１、第１画像拡大縮小部２４０２、第２画像拡大縮小部２４０３、ビデオ出力処理部２４０４、フレームメモリ２４０５、およびメモリ制御部２４０６を有する。また、ビデオプロセッサ２３３２は、エンコード・デコードエンジン２４０７、ビデオES（Elementary Stream）バッファ２４０８Ａおよび２４０８Ｂ、並びに、オーディオESバッファ２４０９Ａおよび２４０９Ｂを有する。さらに、ビデオプロセッサ２３３２は、オーディオエンコーダ２４１０、オーディオデコーダ２４１１、多重化部（MUX（Multiplexer））２４１２、逆多重化部（DMUX（Demultiplexer））２４１３、およびストリームバッファ２４１４を有する。

ビデオ入力処理部２４０１は、例えばコネクティビティ２３２１（図９１）等から入力されたビデオ信号を取得し、デジタル画像データに変換する。第１画像拡大縮小部２４０２は、画像データに対してフォーマット変換や画像の拡大縮小処理等を行う。第２画像拡大縮小部２４０３は、画像データに対して、ビデオ出力処理部２４０４を介して出力する先でのフォーマットに応じて画像の拡大縮小処理を行ったり、第１画像拡大縮小部２４０２と同様のフォーマット変換や画像の拡大縮小処理等を行ったりする。ビデオ出力処理部２４０４は、画像データに対して、フォーマット変換やアナログ信号への変換等を行って、再生されたビデオ信号として例えばコネクティビティ２３２１（図９１）等に出力する。

フレームメモリ２４０５は、ビデオ入力処理部２４０１、第１画像拡大縮小部２４０２、第２画像拡大縮小部２４０３、ビデオ出力処理部２４０４、およびエンコード・デコードエンジン２４０７によって共用される画像データ用のメモリである。フレームメモリ２４０５は、例えばDRAM等の半導体メモリとして実現される。

メモリ制御部２４０６は、エンコード・デコードエンジン２４０７からの同期信号を受けて、アクセス管理テーブル２４０６Ａに書き込まれたフレームメモリ２４０５へのアクセススケジュールに従ってフレームメモリ２４０５に対する書き込み・読み出しのアクセスを制御する。アクセス管理テーブル２４０６Ａは、エンコード・デコードエンジン２４０７、第１画像拡大縮小部２４０２、第２画像拡大縮小部２４０３等で実行される処理に応じて、メモリ制御部２４０６により更新される。

エンコード・デコードエンジン２４０７は、画像データのエンコード処理、並びに、画像データが符号化されたデータであるビデオストリームのデコード処理を行う。例えば、エンコード・デコードエンジン２４０７は、フレームメモリ２４０５から読み出した画像データを符号化し、ビデオストリームとしてビデオESバッファ２４０８Ａに順次書き込む。また、例えば、ビデオESバッファ２４０８Ｂからビデオストリームを順次読み出して復号し、画像データとしてフレームメモリ２４０５に順次書き込む。エンコード・デコードエンジン２４０７は、これらの符号化や復号において、フレームメモリ２４０５を作業領域として使用する。また、エンコード・デコードエンジン２４０７は、例えばマクロブロック毎の処理を開始するタイミングで、メモリ制御部２４０６に対して同期信号を出力する。

ビデオESバッファ２４０８Ａは、エンコード・デコードエンジン２４０７によって生成されたビデオストリームをバッファリングして、多重化部（MUX）２４１２に供給する。ビデオESバッファ２４０８Ｂは、逆多重化部（DMUX）２４１３から供給されたビデオストリームをバッファリングして、エンコード・デコードエンジン２４０７に供給する。

オーディオESバッファ２４０９Ａは、オーディオエンコーダ２４１０によって生成されたオーディオストリームをバッファリングして、多重化部（MUX）２４１２に供給する。オーディオESバッファ２４０９Ｂは、逆多重化部（DMUX）２４１３から供給されたオーディオストリームをバッファリングして、オーディオデコーダ２４１１に供給する。

オーディオエンコーダ２４１０は、例えばコネクティビティ２３２１（図９１）等から入力されたオーディオ信号を例えばデジタル変換し、例えばMPEGオーディオ方式やAC3（AudioCode number 3）方式等の所定の方式で符号化する。オーディオエンコーダ２４１０は、オーディオ信号が符号化されたデータであるオーディオストリームをオーディオESバッファ２４０９Ａに順次書き込む。オーディオデコーダ２４１１は、オーディオESバッファ２４０９Ｂから供給されたオーディオストリームを復号し、例えばアナログ信号への変換等を行って、再生されたオーディオ信号として例えばコネクティビティ２３２１（図９１）等に供給する。

多重化部（MUX）２４１２は、ビデオストリームとオーディオストリームとを多重化する。この多重化の方法（すなわち、多重化により生成されるビットストリームのフォーマット）は任意である。また、この多重化の際に、多重化部（MUX）２４１２は、所定のヘッダ情報等をビットストリームに付加することもできる。つまり、多重化部（MUX）２４１２は、多重化によりストリームのフォーマットを変換することができる。例えば、多重化部（MUX）２４１２は、ビデオストリームとオーディオストリームとを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームに変換する。また、例えば、多重化部（MUX）２４１２は、ビデオストリームとオーディオストリームとを多重化することにより、記録用のファイルフォーマットのデータ（ファイルデータ）に変換する。

逆多重化部（DMUX）２４１３は、多重化部（MUX）２４１２による多重化に対応する方法で、ビデオストリームとオーディオストリームとが多重化されたビットストリームを逆多重化する。つまり、逆多重化部（DMUX）２４１３は、ストリームバッファ２４１４から読み出されたビットストリームからビデオストリームとオーディオストリームとを抽出する（ビデオストリームとオーディオストリームとを分離する）。つまり、逆多重化部（DMUX）２４１３は、逆多重化によりストリームのフォーマットを変換（多重化部（MUX）２４１２による変換の逆変換）することができる。例えば、逆多重化部（DMUX）２４１３は、例えばコネクティビティ２３２１やブロードバンドモデム２３３３等（いずれも図９１）から供給されたトランスポートストリームを、ストリームバッファ２４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。また、例えば、逆多重化部（DMUX）２４１３は、例えばコネクティビティ２３２１により（図９１）各種記録媒体から読み出されたファイルデータを、ストリームバッファ２４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。

ストリームバッファ２４１４は、ビットストリームをバッファリングする。例えば、ストリームバッファ２４１４は、多重化部（MUX）２４１２から供給されたトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ２３２１やブロードバンドモデム２３３３（いずれも図９１）等に供給する。

また、例えば、ストリームバッファ２４１４は、多重化部（MUX）２４１２から供給されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ２３２１（図９１）等に供給し、各種記録媒体に記録させる。

さらに、ストリームバッファ２４１４は、例えばコネクティビティ２３２１やブロードバンドモデム２３３３等（いずれも図９１）を介して取得したトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部（DMUX）２４１３に供給する。

また、ストリームバッファ２４１４は、例えばコネクティビティ２３２１（図９１）等において各種記録媒体から読み出されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部（DMUX）２４１３に供給する。

次に、このような構成のビデオプロセッサ２３３２の動作の例について説明する。例えば、コネクティビティ２３２１（図９１）等からビデオプロセッサ２３３２に入力されたビデオ信号は、ビデオ入力処理部２４０１において４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式のデジタル画像データに変換され、フレームメモリ２４０５に順次書き込まれる。このデジタル画像データは、第１画像拡大縮小部２４０２または第２画像拡大縮小部２４０３に読み出されて、４：２：０Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式へのフォーマット変換および拡大縮小処理が行われ、再びフレームメモリ２４０５に書き込まれる。この画像データは、エンコード・デコードエンジン２４０７によって符号化され、ビデオストリームとしてビデオESバッファ２４０８Ａに書き込まれる。

また、コネクティビティ２３２１（図９１）等からビデオプロセッサ２３３２に入力されたオーディオ信号は、オーディオエンコーダ２４１０によって符号化され、オーディオストリームとして、オーディオESバッファ２４０９Ａに書き込まれる。

ビデオESバッファ２４０８Ａのビデオストリームと、オーディオESバッファ２４０９Ａのオーディオストリームは、多重化部（MUX）２４１２に読み出されて多重化され、トランスポートストリーム若しくはファイルデータ等に変換される。多重化部（MUX）２４１２により生成されたトランスポートストリームは、ストリームバッファ２４１４にバッファされた後、例えばコネクティビティ２３２１やブロードバンドモデム２３３３（いずれも図９１）等を介して外部ネットワークに出力される。また、多重化部（MUX）２４１２により生成されたファイルデータは、ストリームバッファ２４１４にバッファされた後、例えばコネクティビティ２３２１（図９１）等に出力され、各種記録媒体に記録される。

また、例えばコネクティビティ２３２１やブロードバンドモデム２３３３（いずれも図９１）等を介して外部ネットワークからビデオプロセッサ２３３２に入力されたトランスポートストリームは、ストリームバッファ２４１４にバッファされた後、逆多重化部（DMUX）２４１３により逆多重化される。また、例えばコネクティビティ２３２１（図９１）等において各種記録媒体から読み出され、ビデオプロセッサ２３３２に入力されたファイルデータは、ストリームバッファ２４１４にバッファされた後、逆多重化部（DMUX）２４１３により逆多重化される。つまり、ビデオプロセッサ２３３２に入力されたトランスポートストリームまたはファイルデータは、逆多重化部（DMUX）２４１３によりビデオストリームとオーディオストリームとに分離される。

オーディオストリームは、オーディオESバッファ２４０９Ｂを介してオーディオデコーダ２４１１に供給され、復号されてオーディオ信号が再生される。また、ビデオストリームは、ビデオESバッファ２４０８Ｂに書き込まれた後、エンコード・デコードエンジン２４０７により順次読み出されて復号されてフレームメモリ２４０５に書き込まれる。復号された画像データは、第２画像拡大縮小部２４０３によって拡大縮小処理されて、フレームメモリ２４０５に書き込まれる。そして、復号された画像データは、ビデオ出力処理部２４０４に読み出されて、４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式にフォーマット変換され、さらにアナログ信号に変換されて、ビデオ信号が再生出力される。

このように構成されるビデオプロセッサ２３３２に本技術を適用する場合、エンコード・デコードエンジン２４０７に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、エンコード・デコードエンジン２４０７が、上述した実施形態に係るスケーラブル符号化装置１００およびスケーラブル復号装置２００、または、画像符号化装置９００（図６２）および画像復号装置１０００（図７１）の機能を有するようにすればよい。このようにすることにより、ビデオプロセッサ２３３２は、図１乃至図８０を参照して上述した効果と同様の効果を得ることができる。

なお、エンコード・デコードエンジン２４０７において、本技術（すなわち、上述した各実施形態に係る画像符号化装置や画像復号装置の機能）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

＜ビデオプロセッサの他の構成例＞
図９３は、本技術を適用したビデオプロセッサ２３３２（図９１）の概略的な構成の他の例を示している。図９３の例の場合、ビデオプロセッサ２３３２は、ビデオデータを所定の方式で符号化・復号する機能とを有する。

より具体的には、図９３に示されるように、ビデオプロセッサ２３３２は、制御部２５１１、ディスプレイインタフェース２５１２、ディスプレイエンジン２５１３、画像処理エンジン２５１４、および内部メモリ２５１５を有する。また、ビデオプロセッサ２３３２は、コーデックエンジン２５１６、メモリインタフェース２５１７、多重化・逆多重化部（MUX DMUX）２５１８、ネットワークインタフェース２５１９、およびビデオインタフェース２５２０を有する。

制御部２５１１は、ディスプレイインタフェース２５１２、ディスプレイエンジン２５１３、画像処理エンジン２５１４、およびコーデックエンジン２５１６等、ビデオプロセッサ２３３２内の各処理部の動作を制御する。

図９３に示されるように、制御部２５１１は、例えば、メインCPU２５３１、サブCPU２５３２、およびシステムコントローラ２５３３を有する。メインCPU２５３１は、ビデオプロセッサ２３３２内の各処理部の動作を制御するためのプログラム等を実行する。メインCPU２５３１は、そのプログラム等に従って制御信号を生成し、各処理部に供給する（つまり、各処理部の動作を制御する）。サブCPU２５３２は、メインCPU２５３１の補助的な役割を果たす。例えば、サブCPU２５３２は、メインCPU２５３１が実行するプログラム等の子プロセスやサブルーチン等を実行する。システムコントローラ２５３３は、メインCPU２５３１およびサブCPU２５３２が実行するプログラムを指定する等、メインCPU２５３１およびサブCPU２５３２の動作を制御する。

ディスプレイインタフェース２５１２は、制御部２５１１の制御の下、画像データを例えばコネクティビティ２３２１（図９１）等に出力する。例えば、ディスプレイインタフェース２５１２は、デジタルデータの画像データをアナログ信号に変換し、再生されたビデオ信号として、またはデジタルデータの画像データのまま、コネクティビティ２３２１（図９１）のモニタ装置等に出力する。

ディスプレイエンジン２５１３は、制御部２５１１の制御の下、画像データに対して、その画像を表示させるモニタ装置等のハードウエアスペックに合わせるように、フォーマット変換、サイズ変換、色域変換等の各種変換処理を行う。

画像処理エンジン２５１４は、制御部２５１１の制御の下、画像データに対して、例えば画質改善のためのフィルタ処理等、所定の画像処理を施す。

内部メモリ２５１５は、ディスプレイエンジン２５１３、画像処理エンジン２５１４、およびコーデックエンジン２５１６により共用される、ビデオプロセッサ２３３２の内部に設けられたメモリである。内部メモリ２５１５は、例えば、ディスプレイエンジン２５１３、画像処理エンジン２５１４、およびコーデックエンジン２５１６の間で行われるデータの授受に利用される。例えば、内部メモリ２５１５は、ディスプレイエンジン２５１３、画像処理エンジン２５１４、またはコーデックエンジン２５１６から供給されるデータを格納し、必要に応じて（例えば、要求に応じて）、そのデータを、ディスプレイエンジン２５１３、画像処理エンジン２５１４、またはコーデックエンジン２５１６に供給する。この内部メモリ２５１５は、どのような記憶デバイスにより実現するようにしてもよいが、一般的にブロック単位の画像データやパラメータ等といった小容量のデータの格納に利用することが多いので、例えばSRAM（Static Random Access Memory）のような比較的（例えば外部メモリ２３１２と比較して）小容量だが応答速度が高速な半導体メモリにより実現するのが望ましい。

コーデックエンジン２５１６は、画像データの符号化や復号に関する処理を行う。このコーデックエンジン２５１６が対応する符号化・復号の方式は任意であり、その数は１つであってもよいし、複数であってもよい。例えば、コーデックエンジン２５１６は、複数の符号化・復号方式のコーデック機能を備え、その中から選択されたもので画像データの符号化若しくは符号化データの復号を行うようにしてもよい。

図９３に示される例において、コーデックエンジン２５１６は、コーデックに関する処理の機能ブロックとして、例えば、MPEG-2 Video２５４１、AVC/H.264２５４２、HEVC/H.265２５４３、HEVC/H.265(Scalable)２５４４、HEVC/H.265(Multi-view)２５４５、およびMPEG-DASH２５５１を有する。

MPEG-2 Video２５４１は、画像データをMPEG-2方式で符号化したり復号したりする機能ブロックである。AVC/H.264２５４２は、画像データをAVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265２５４３は、画像データをHEVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265(Scalable)２５４４は、画像データをHEVC方式でスケーラブル符号化したりスケーラブル復号したりする機能ブロックである。HEVC/H.265(Multi-view)２５４５は、画像データをHEVC方式で多視点符号化したり多視点復号したりする機能ブロックである。

MPEG-DASH２５５１は、画像データをMPEG-DASH（MPEG-Dynamic Adaptive Streaming over HTTP）方式で送受信する機能ブロックである。MPEG-DASHは、HTTP（HyperText Transfer Protocol）を使ってビデオのストリーミングを行う技術であり、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択し伝送することを特徴の１つとする。MPEG-DASH２５５１は、規格に準拠するストリームの生成やそのストリームの伝送制御等を行い、画像データの符号化・復号については、上述したMPEG-2 Video２５４１乃至HEVC/H.265(Multi-view)２５４５を利用する。

メモリインタフェース２５１７は、外部メモリ２３１２用のインタフェースである。画像処理エンジン２５１４やコーデックエンジン２５１６から供給されるデータは、メモリインタフェース２５１７を介して外部メモリ２３１２に供給される。また、外部メモリ２３１２から読み出されたデータは、メモリインタフェース２５１７を介してビデオプロセッサ２３３２（画像処理エンジン２５１４若しくはコーデックエンジン２５１６）に供給される。

多重化・逆多重化部（MUX DMUX）２５１８は、符号化データのビットストリーム、画像データ、ビデオ信号等、画像に関する各種データの多重化や逆多重化を行う。この多重化・逆多重化の方法は任意である。例えば、多重化の際に、多重化・逆多重化部（MUX DMUX）２５１８は、複数のデータを１つにまとめるだけでなく、所定のヘッダ情報等をそのデータに付加することもできる。また、逆多重化の際に、多重化・逆多重化部（MUX DMUX）２５１８は、１つのデータを複数に分割するだけでなく、分割した各データに所定のヘッダ情報等を付加することもできる。つまり、多重化・逆多重化部（MUX DMUX）２５１８は、多重化・逆多重化によりデータのフォーマットを変換することができる。例えば、多重化・逆多重化部（MUX DMUX）２５１８は、ビットストリームを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームや、記録用のファイルフォーマットのデータ（ファイルデータ）に変換することができる。もちろん、逆多重化によりその逆変換も可能である。

ネットワークインタフェース２５１９は、例えばブロードバンドモデム２３３３やコネクティビティ２３２１（いずれも図９１）等向けのインタフェースである。ビデオインタフェース２５２０は、例えばコネクティビティ２３２１やカメラ２３２２（いずれも図９１）等向けのインタフェースである。

次に、このようなビデオプロセッサ２３３２の動作の例について説明する。例えばコネクティビティ２３２１やブロードバンドモデム２３３３（いずれも図９１）等を介して外部ネットワークからトランスポートストリームを受信すると、そのトランスポートストリームは、ネットワークインタフェース２５１９を介して多重化・逆多重化部（MUX DMUX）２５１８に供給されて逆多重化され、コーデックエンジン２５１６により復号される。コーデックエンジン２５１６の復号により得られた画像データは、例えば、画像処理エンジン２５１４により所定の画像処理が施され、ディスプレイエンジン２５１３により所定の変換が行われ、ディスプレイインタフェース２５１２を介して例えばコネクティビティ２３２１（図９１）等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン２５１６の復号により得られた画像データは、コーデックエンジン２５１６により再符号化され、多重化・逆多重化部（MUX DMUX）２５１８により多重化されてファイルデータに変換され、ビデオインタフェース２５２０を介して例えばコネクティビティ２３２１（図９１）等に出力され、各種記録媒体に記録される。

さらに、例えば、コネクティビティ２３２１（図９１）等により図示せぬ記録媒体から読み出された、画像データが符号化された符号化データのファイルデータは、ビデオインタフェース２５２０を介して多重化・逆多重化部（MUX DMUX）２５１８に供給されて逆多重化され、コーデックエンジン２５１６により復号される。コーデックエンジン２５１６の復号により得られた画像データは、画像処理エンジン２５１４により所定の画像処理が施され、ディスプレイエンジン２５１３により所定の変換が行われ、ディスプレイインタフェース２５１２を介して例えばコネクティビティ２３２１（図９１）等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン２５１６の復号により得られた画像データは、コーデックエンジン２５１６により再符号化され、多重化・逆多重化部（MUX DMUX）２５１８により多重化されてトランスポートストリームに変換され、ネットワークインタフェース２５１９を介して例えばコネクティビティ２３２１やブロードバンドモデム２３３３（いずれも図９１）等に供給され図示せぬ他の装置に伝送される。

なお、ビデオプロセッサ２３３２内の各処理部の間での画像データやその他のデータの授受は、例えば、内部メモリ２５１５や外部メモリ２３１２を利用して行われる。また、パワーマネージメントモジュール２３１３は、例えば制御部２５１１への電力供給を制御する。

このように構成されるビデオプロセッサ２３３２に本技術を適用する場合、コーデックエンジン２５１６に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、コーデックエンジン２５１６が、上述した実施形態に係るスケーラブル符号化装置１００及びスケーラブル復号装置２００、または、画像符号化装置９００（図６２）および画像復号装置１０００（図７１）を実現する機能ブロックを有するようにすればよい。このようにすることにより、ビデオプロセッサ２３３２は、図１乃至図８０を参照して上述した効果と同様の効果を得ることができる。

なお、コーデックエンジン２５１６において、本技術（すなわち、上述した各実施形態に係る画像符号化装置や画像復号装置の機能）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

以上にビデオプロセッサ２３３２の構成を２例示したが、ビデオプロセッサ２３３２の構成は任意であり、上述した２例以外のものであってもよい。また、このビデオプロセッサ２３３２は、１つの半導体チップとして構成されるようにしてもよいが、複数の半導体チップとして構成されるようにしてもよい。例えば、複数の半導体を積層する３次元積層LSIとしてもよい。また、複数のLSIにより実現されるようにしてもよい。

＜装置への適用例＞
ビデオセット２３００は、画像データを処理する各種装置に組み込むことができる。例えば、ビデオセット２３００は、テレビジョン装置１９００（図８４）、携帯電話機１９２０（図８５）、記録再生装置１９４０（図８６）、撮像装置１９６０（図８７）等に組み込むことができる。ビデオセット２３００を組み込むことにより、その装置は、図１乃至図８０を参照して上述した効果と同様の効果を得ることができる。

また、ビデオセット２３００は、例えば、図８８のデータ伝送システム２０００におけるパーソナルコンピュータ２００４、AV機器２００５、タブレットデバイス２００６、および携帯電話機２００７等の端末装置、図８９のデータ伝送システム２１００における放送局２１０１および端末装置２１０２、並びに、図９０の撮像システム２２００における撮像装置２２０１およびスケーラブル符号化データ記憶装置２２０２等にも組み込むことができる。ビデオセット２３００を組み込むことにより、その装置は、図１乃至図８０を参照して上述した効果と同様の効果を得ることができる。

なお、上述したビデオセット２３００の各構成の一部であっても、ビデオプロセッサ２３３２を含むものであれば、本技術を適用した構成として実施することができる。例えば、ビデオプロセッサ２３３２のみを本技術を適用したビデオプロセッサとして実施することができる。また、例えば、上述したように点線２３４１により示されるプロセッサやビデオモジュール２３１１等を本技術を適用したプロセッサやモジュール等として実施することができる。さらに、例えば、ビデオモジュール２３１１、外部メモリ２３１２、パワーマネージメントモジュール２３１３、およびフロントエンドモジュール２３１４を組み合わせ、本技術を適用したビデオユニット２３６１として実施することもできる。いずれの構成の場合であっても、図１乃至図８０を参照して上述した効果と同様の効果を得ることができる。

つまり、ビデオプロセッサ２３３２を含むものであればどのような構成であっても、ビデオセット２３００の場合と同様に、画像データを処理する各種装置に組み込むことができる。例えば、ビデオプロセッサ２３３２、点線２３４１により示されるプロセッサ、ビデオモジュール２３１１、または、ビデオユニット２３６１を、テレビジョン装置１９００（図８４）、携帯電話機１９２０（図８５）、記録再生装置１９４０（図８６）、撮像装置１９６０（図８７）、図８８のデータ伝送システム２０００におけるパーソナルコンピュータ２００４、AV機器２００５、タブレットデバイス２００６、および携帯電話機２００７等の端末装置、図８９のデータ伝送システム２１００における放送局２１０１および端末装置２１０２、並びに、図９０の撮像システム２２００における撮像装置２２０１およびスケーラブル符号化データ記憶装置２２０２等に組み込むことができる。そして、本技術を適用したいずれかの構成を組み込むことにより、その装置は、ビデオセット２３００の場合と同様に、図１乃至図８０を参照して上述した効果と同様の効果を得ることができる。

＜１９．第１４の実施の形態＞
＜MPEG-DASHの応用例＞
なお、本技術は、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択して使用する、例えば、後述するMPEG DASH等のようなHTTPストリーミングのコンテンツ再生システムやWi-Fi規格の無線通信システムにも適用することができる。

＜コンテンツ再生システムの概要＞
まず、図９４乃至図９６を参照し、本技術を適用可能なコンテンツ再生システムについて概略的に説明する。

以下では、まず、このような各実施形態において共通する基本構成について図９４および図９５を参照して説明する。

図９４は、コンテンツ再生システムの構成を示した説明図である。図９４に示したように、コンテンツ再生システムは、コンテンツサーバ２６１０、２６１１と、ネットワーク２６１２と、コンテンツ再生装置２６２０（クライアント装置）とを備える。

コンテンツサーバ２６１０、２６１１とコンテンツ再生装置２６２０は、ネットワーク２６１２を介して接続されている。このネットワーク２６１２は、ネットワーク２６１２に接続されている装置から送信される情報の有線、または無線の伝送路である。

例えば、ネットワーク２６１２は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ethernet（登録商標）を含む各種のLAN（Local Area Network）、WAN（Wide Area Network）などを含んでもよい。また、ネットワーク２６１２は、IP-VPN（Internet Protocol-Virtual Private Network）などの専用回線網を含んでもよい。

コンテンツサーバ２６１０は、コンテンツデータを符号化し、符号化データおよび符号化データのメタ情報を含むデータファイルを生成して記憶する。なお、コンテンツサーバ２６１０がMP4形式のデータファイルを生成する場合、符号化データは「mdat」に該当し、メタ情報は「moov」に該当する。

また、コンテンツデータは、音楽、講演およびラジオ番組などの音楽データや、映画、テレビジョン番組、ビデオプログラム、写真、文書、絵画および図表などの映像データや、ゲームおよびソフトウエアなどであってもよい。

ここで、コンテンツサーバ２６１０は、同一コンテンツに関し、異なるビットレートで複数のデータファイルを生成する。またコンテンツサーバ２６１１は、コンテンツ再生装置２６２０からのコンテンツの再生要求に対して、コンテンツサーバ２６１０のURLの情報に、コンテンツ再生装置２６２０で当該URLに付加させるパラメータの情報を含めてコンテンツ再生装置２６２０に送信する。以下、図９５を参照して当該事項について具体的に説明する。

図９５は、図９４のコンテンツ再生システムにおけるデータの流れを示した説明図である。コンテンツサーバ２６１０は、同一のコンテンツデータを異なるビットレートで符号化し、図９５に示したように例えば２MbpsのファイルＡ、１．５MbpsのファイルＢ、１MbpsのファイルＣを生成する。相対的に、ファイルＡはハイビットレートであり、ファイルＢは標準ビットレートであり、ファイルＣはロービットレートである。

また、図９５に示したように、各ファイルの符号化データは複数のセグメントに区分されている。例えば、ファイルＡの符号化データは「Ａ１」、「Ａ２」、「Ａ３」、・・・「Ａｎ」というセグメントに区分されており、ファイルＢの符号化データは「Ｂ１」、「Ｂ２」、「Ｂ３」、・・・「Ｂｎ」というセグメントに区分されており、ファイルＣの符号化データは「Ｃ１」、「Ｃ２」、「Ｃ３」、・・・「Ｃｎ」というセグメントに区分されている。

なお、各セグメントはMP4のシンクサンプル（たとえば、AVC/H．264の映像符号化ではIDR−ピクチャ）で始まる単独で再生可能な１または２以上の映像符号化データおよび音声符号化データより構成サンプルで構成されてもよい。例えば、一秒３０フレームのビデオデータが１５フレーム固定長のGOP（Group of Picture）にて符号化されていた場合、各セグメントは、４GOPに相当する２秒分の映像ならびに音声符号化データであっても、２０GOPに相当する１０秒分の映像ならびに音声符号化データであってもよい。

また、各ファイルにおける配置順番が同一のセグメントによる再生範囲（コンテンツの先頭からの時間位置の範囲）は同一である。例えば、セグメント「Ａ２」、セグメント「Ｂ２」、およびセグメント「Ｃ２」の再生範囲は同一であり、各セグメントが２秒分の符号化データである場合、セグメント「Ａ２」、セグメント「Ｂ２」、およびセグメント「Ｃ２」の再生範囲は、いずれもコンテンツの２秒乃至４秒である。

コンテンツサーバ２６１０は、このような複数のセグメントから構成されるファイルＡ乃至ファイルＣを生成すると、ファイルＡ乃至ファイルＣを記憶する。そして、コンテンツサーバ２６１０は、図９５に示したように、異なるファイルを構成するセグメントをコンテンツ再生装置２６２０に順次に送信し、コンテンツ再生装置２６２０は、受信したセグメントをストリーミング再生する。

ここで、本実施形態によるコンテンツサーバ２６１０は、各符号化データのビットレート情報およびアクセス情報を含むプレイリストファイル（以下、MPD：Media Presentation Description）をコンテンツ再生装置２６２０に送信し、コンテンツ再生装置２６２０は、MPDに基づき、複数のビットレートのうちのいずれかのビットレートを選択し、選択したビットレートに対応するセグメントの送信をコンテンツサーバ２６１０に要求する。

図９４では、１つのコンテンツサーバ２６１０のみが図示されているが、本開示は係る例に限定されないことは言うまでもない。

図９６は、MPDの具体例を示した説明図である。図９６に示したように、MPDには、異なるビットレート（BANDWIDTH）を有する複数の符号化データに関するアクセス情報が含まれる。例えば、図９６に示したMPDは、２５６Kbps、１．０２４Mbps、１．３８４Mbps、１．５３６Mbps、２．０４８Mbpsの各々の符号化データが存在することを示す共に、各符号化データに関するアクセス情報を含む。コンテンツ再生装置２６２０は、かかるMPDに基づき、ストリーミング再生する符号化データのビットレートを動的に変更することが可能である。

なお、図９４にはコンテンツ再生装置２６２０の一例として携帯端末を示しているが、コンテンツ再生装置２６２０はかかる例に限定されない。例えば、コンテンツ再生装置２６２０は、PC（Personal Computer）、家庭用映像処理装置（DVDレコーダ、ビデオデッキなど）、PDA（Personal Digital Assistants）、家庭用ゲーム機器、家電機器などの情報処理装置であってもよい。また、コンテンツ再生装置２６２０は、携帯電話、PHS（Personal Handyphone System）、携帯用音楽再生装置、携帯用映像処理装置、携帯用ゲーム機器などの情報処理装置であってもよい。

＜コンテンツサーバ２６１０の構成＞
以上、図９４乃至図９６を参照し、コンテンツ再生システムの概要を説明した。続いて、図９７を参照し、コンテンツサーバ２６１０の構成を説明する。

図９７は、コンテンツサーバ２６１０の構成を示した機能ブロック図である。図９７に示したように、コンテンツサーバ２６１０は、ファイル生成部２６３１と、記憶部２６３２と、通信部２６３３とを備える。

ファイル生成部２６３１は、コンテンツデータを符号化するエンコーダ２６４１を備え、同一のコンテンツでビットレートが異なる複数の符号化データ、および上述したMPDを生成する。例えば、ファイル生成部２６３１は、２５６Kbps、１．０２４Mbps、１．３８４Mbps、１．５３６Mbps、２．０４８Mbpsの各々の符号化データを生成した場合、図９６に示したようなMPDを生成する。

記憶部２６３２は、ファイル生成部２６３１により生成されたビットレートが異なる複数の符号化データおよびMPDを記憶する。この記憶部２６３２は、不揮発性メモリ、磁気ディスク、光ディスク、およびMO（Magneto Optical）ディスクなどの記憶媒体であってもよい。不揮発性メモリとしては、例えば、EEPROM（Electrically Erasable Programmable Read-Only Memory）、EPROM（Erasable Programmable ROM）があげられる。また、磁気ディスクとしては、ハードディスクおよび円盤型磁性体ディスクなどがあげられる。また、光ディスクとしては、CD（Compact Disc、DVD-R（Digital Versatile Disc Recordable）およびBD（Blu-Ray Disc（登録商標））などがあげられる。

通信部２６３３は、コンテンツ再生装置２６２０とのインタフェースであって、ネットワーク２６１２を介してコンテンツ再生装置２６２０と通信する。より詳細には、通信部２６３３は、HTTPに従ってコンテンツ再生装置２６２０と通信するHTTPサーバとしての機能を有する。例えば、通信部２６３３は、MPDをコンテンツ再生装置２６２０に送信し、HTTPに従ってコンテンツ再生装置２６２０からMPDに基づいて要求された符号化データを記憶部２６３２から抽出し、HTTPレスポンスとしてコンテンツ再生装置２６２０に符号化データを送信する。

＜コンテンツ再生装置２６２０の構成＞
以上、本実施形態によるコンテンツサーバ２６１０の構成を説明した。続いて、図９８を参照し、コンテンツ再生装置２６２０の構成を説明する。

図９８は、コンテンツ再生装置２６２０の構成を示した機能ブロック図である。図９８に示したように、コンテンツ再生装置２６２０は、通信部２６５１と、記憶部２６５２と、再生部２６５３と、選択部２６５４と、現在地取得部２６５６とを備える。

通信部２６５１は、コンテンツサーバ２６１０とのインタフェースであって、コンテンツサーバ２６１０に対してデータを要求し、コンテンツサーバ２６１０からデータを取得する。より詳細には、通信部２６５１は、HTTPに従ってコンテンツ再生装置２６２０と通信するHTTPクライアントとしての機能を有する。例えば、通信部２６５１は、HTTP Rangeを利用することにより、コンテンツサーバ２６１０からMPDや符号化データのセグメントを選択的に取得することができる。

記憶部２６５２は、コンテンツの再生に関する種々の情報を記憶する。例えば、通信部２６５１によりコンテンツサーバ２６１０から取得されるセグメントを順次にバッファリングする。記憶部２６５２にバッファリングされた符号化データのセグメントは、FIFO（First In First Out）で再生部２６５３へ順次に供給される。

また記憶部２６５２は、後述のコンテンツサーバ２６１１から要求された、MPDに記述されているコンテンツのURLへのパラメータの付加指示に基づき、通信部２６５１でURLにパラメータを付加して、そのURLへアクセスするための定義を記憶する。

再生部２６５３は、記憶部２６５２から供給されるセグメントを順次に再生する。具体的には、再生部２６５３は、セグメントのデコード、DA変換、およびレンダリングなどを行う。

選択部２６５４は、MPDに含まれるいずれのビットレートに対応する符号化データのセグメントを取得するかを同一コンテンツ内で順次に選択する。例えば、選択部２６５４がネットワーク２６１２の帯域に応じてセグメント「Ａ１」、「Ｂ２」、「Ａ３」を順次に選択すると、図９５に示したように、通信部２６５１がコンテンツサーバ２６１０からセグメント「Ａ１」、「Ｂ２」、「Ａ３」を順次に取得する。

現在地取得部２６５６は、コンテンツ再生装置２６２０の現在の位置を取得するものであり、例えばGPS（Global Positioning System）受信機などの現在地を取得するモジュールで構成されていても良い。また現在地取得部２６５６は、無線ネットワークを使用してコンテンツ再生装置２６２０の現在の位置を取得するものであってもよい。

＜コンテンツサーバ２６１１の構成＞
図９９は、コンテンツサーバ２６１１の構成例を示す説明図である。図９９に示したように、コンテンツサーバ２６１１は、記憶部２６７１と、通信部２６７２とを備える。

記憶部２６７１は、MPDのURLの情報を記憶する。MPDのURLの情報は、コンテンツの再生を要求するコンテンツ再生装置２６２０からの求めに応じ、コンテンツサーバ２６１１からコンテンツ再生装置２６２０へ送信される。また記憶部２６７１は、コンテンツ再生装置２６２０へのMPDのURLの情報を提供する際に、当該MPDに記述されているURLにコンテンツ再生装置２６２０でパラメータを付加させる際の定義情報を記憶する。

通信部２６７２は、コンテンツ再生装置２６２０とのインタフェースであって、ネットワーク２６１２を介してコンテンツ再生装置２６２０と通信する。すなわち通信部２６７２は、コンテンツの再生を要求するコンテンツ再生装置２６２０から、MPDのURLの情報の要求を受信し、コンテンツ再生装置２６２０へMPDのURLの情報を送信する。通信部２６７２から送信されるMPDのURLには、コンテンツ再生装置２６２０でパラメータを付加させるための情報が含まれる。

コンテンツ再生装置２６２０でMPDのURLに付加させるパラメータについては、コンテンツサーバ２６１１およびコンテンツ再生装置２６２０で共有する定義情報で様々に設定することが出来る。一例を挙げれば、コンテンツ再生装置２６２０の現在位置、コンテンツ再生装置２６２０を使用するユーザのユーザID、コンテンツ再生装置２６２０のメモリサイズ、コンテンツ再生装置２６２０のストレージの容量などの情報を、コンテンツ再生装置２６２０でMPDのURLに付加させることが出来る。

以上のような構成のコンテンツ再生システムにおいて、図１乃至図８０を参照して上述したような本技術を適用することにより、図１乃至図８０を参照して上述した効果と同様の効果を得ることができる。

すなわち、コンテンツサーバ２６１０のエンコーダ２６４１は、上述した実施形態に係る画像符号化装置の機能を有する。また、コンテンツ再生装置２６２０の再生部２６５３は、上述した実施形態に係る画像復号装置の機能を有する。それにより、符号化・復号に必要な記憶容量の増大を抑制することができる。

また、コンテンツ再生システムにおいて、本技術により符号化されたデータを送受信することにより、符号化・復号に必要な記憶容量の増大を抑制することができる。

＜１６．Wi-Fi規格の無線通信システムの応用例＞
＜Wi-Fi規格の無線通信システムの応用例＞
本技術を適用可能な無線通信システムにおける無線通信装置の基本動作例について説明する。

＜無線通信装置の基本動作例＞
最初に、P2P（Peer to Peer）接続を確立して特定のアプリケーションを動作させるまでの無線パケット送受信がなされる。

次に、第２層で接続する前に、使用する特定のアプリケーションを指定してからP2P接続を確立して特定のアプリケーションを動作させるまでの無線パケット送受信がなされる。その後、第２層での接続後に、特定のアプリケーションを起動する場合の無線パケット送受信がなされる。

＜特定のアプリケーション動作開始時における通信例＞
図１００および図１０１は、上述したP2P（Peer to Peer）接続を確立して特定のアプリケーションを動作させるまでの無線パケット送受信の例であり、無線通信の基礎となる各装置による通信処理例を示すシーケンスチャートである。具体的には、Wi-Fi Allianceにおいて標準化されているWi-Fiダイレクト（Direct）規格（Wi-Fi P2Pと呼ばれることもある）での接続に至るダイレクト接続の確立手順の一例を示す。

ここで、Wi-Fiダイレクトでは、複数の無線通信装置が互いの存在を検出する（Device Discovery、Service Discovery）。そして、接続機器選択を行うとその選択された機器間において、WPS（Wi-Fi Protected Setup）で機器認証を行うことによりダイレクト接続を確立する。また、Wi-Fiダイレクトでは、複数の無線通信装置が親機（Group Owner）または子機（Client）の何れとしての役割を担うかを決定して通信グループを形成する。

ただし、この通信処理例では、一部のパケット送受信については省略して示す。例えば、初回接続時には、上述したように、WPSを使うためのパケット交換が必要であり、AuthenticationRequest／Responseのやり取り等においてもパケット交換が必要となる。しかしながら、図１００および図１０１では、これらのパケット交換についての図示を省略し、２回目以降の接続についてのみを示す。

なお、図１００および図１０１では、第１無線通信装置２７０１および第２無線通信装置２７０２間における通信処理例を示すが、他の無線通信装置間における通信処理についても同様である。

最初に、第１無線通信装置２７０１および第２無線通信装置２７０２間においてDevice Discoveryが行われる（２７１１）。例えば、第１無線通信装置２７０１は、Probe request（応答要求信号）を送信し、このProbe requestに対するProbe response（応答信号）を第２無線通信装置２７０２から受信する。これにより、第１無線通信装置２７０１および第２無線通信装置２７０２は、互いの存在を発見することができる。また、Device Discoveryにより、相手のデバイス名や種類（TV、PC、スマートフォン等）を取得することができる。

続いて、第１無線通信装置２７０１および第２無線通信装置２７０２間においてService Discoveryが行われる（２７１２）。例えば、第１無線通信装置２７０１は、Device Discoveryで発見した第２無線通信装置２７０２が対応しているサービスを問い合わせるService Discovery Queryを送信する。そして、第１無線通信装置２７０１は、Service Discovery Responseを第２無線通信装置２７０２から受信することにより、第２無線通信装置２７０２が対応しているサービスを取得する。すなわち、Service Discoveryにより、相手が実行可能なサービス等を取得することができる。相手が実行可能なサービスは、例えば、service、protocol（DLNA（Digital Living Network Alliance） DMR（Digital Media Renderer）等）である。

続いて、ユーザにより接続相手の選択操作（接続相手選択操作）が行われる（２７１３）。この接続相手選択操作は、第１無線通信装置２７０１および第２無線通信装置２７０２の何れか一方のみに発生することもある。例えば、第１無線通信装置２７０１の表示部に接続相手選択画面が表示され、この接続相手選択画面において接続相手として第２無線通信装置２７０２がユーザ操作により選択される。

ユーザにより接続相手選択操作が行われると（２７１３）、第１無線通信装置２７０１および第２無線通信装置２７０２間においてGroup Owner Negotiationが行われる（２７１４）。図１００および図１０１では、Group Owner Negotiationの結果により、第１無線通信装置２７０１がグループオーナー（Group Owner）２７１５になり、第２無線通信装置２７０２がクライアント（Client）２７１６になる例を示す。

続いて、第１無線通信装置２７０１および第２無線通信装置２７０２間において、各処理（２７１７乃至２７２０）が行われることにより、ダイレクト接続が確立される。すなわち、Association（Ｌ２（第２層） link確立）（２７１７）、Secure link確立（２７１８）が順次行われる。また、IP Address Assignment（２７１９）、SSDP（Simple Service Discovery Protocol）等によるＬ３上でのＬ４ setup（２７２０）が順次行われる。なお、Ｌ２（layer2）は、第２層（データリンク層）を意味し、Ｌ３（layer3）は、第３層（ネットワーク層）を意味し、Ｌ４（layer4）は、第４層（トランスポート層）を意味する。

続いて、ユーザにより特定のアプリケーションの指定または起動操作（アプリ指定・起動操作）が行われる（２７２１）。このアプリ指定・起動操作は、第１無線通信装置２７０１および第２無線通信装置２７０２の何れか一方のみに発生することもある。例えば、第１無線通信装置２７０１の表示部にアプリ指定・起動操作画面が表示され、このアプリ指定・起動操作画面において特定のアプリケーションがユーザ操作により選択される。

ユーザによりアプリ指定・起動操作が行われると（２７２１）、このアプリ指定・起動操作に対応する特定のアプリケーションが第１無線通信装置２７０１および第２無線通信装置２７０２間において実行される（２７２２）。

ここで、Wi-Fi Direct規格以前の仕様（IEEE802.11で標準化された仕様）の範囲内で、AP（Access Point）−STA（Station）間の接続を行う場合を想定する。この場合には、第２層で接続する前（IEEE802.11用語ではassociation前）には、どのようなデバイスと繋ごうとしているのかを事前に知ることができなかった。

これに対して、図１００および図１０１に示すように、Wi-Fi Directでは、Device discoveryやService Discovery（option）において、接続候補相手を探す際に、接続相手の情報を取得することができる。この接続相手の情報は、例えば、基本的なデバイスのタイプや、対応している特定のアプリケーション等である。そして、その取得された接続相手の情報に基づいて、ユーザに接続相手を選択させることができる。

この仕組みを拡張して、第２層で接続する前に特定のアプリケーションを指定して、接続相手を選択し、この選択後に、自動的に特定のアプリケーションを起動させる無線通信システムを実現することも可能である。このような場合の接続に至るシーケンスの一例を、図１０３に示す。また、この通信処理において送受信されるフレームフォーマット（frame format）の構成例を図１０２に示す。

＜フレームフォーマットの構成例＞
図１０２は、本技術の基礎となる各装置による通信処理において送受信されるフレームフォーマット（frame format）の構成例を模式的に示す図である。すなわち、図１０２には、第２層での接続を確立するためのMAC frameの構成例を示す。具体的には、図１０３に示すシーケンスを実現するためのAssociation Request/Response（２７８７）のフレームフォーマットの一例である。

図１０２に示されるように、MAC frameは、Frame Control（２７５１）乃至FCS（２７５８）よりなり、その内、Frame Control（２７５１）からSequence Control（２７５６）までは、MACヘッダである。また、Association Requestを送信する際には、Frame Control（２７５１）において、Ｂ３Ｂ２＝"０ｂ００"、かつ、Ｂ７Ｂ６Ｂ５Ｂ４＝"０ｂ００００"が設定される。また、Association Responseをencapsulateする際には、Frame Control（２７５１）において、Ｂ３Ｂ２＝"０ｂ００"、かつ、Ｂ７Ｂ６Ｂ５Ｂ４＝"０ｂ０００１"が設定される。なお、「０ｂ００」は、２進法で「００」であることを示し、「０ｂ００００」は、２進法で「００００」であることを示し、「０ｂ０００１」は、２進法で「０００１」であることを示す。

ここで、図１００に示すMAC frame（Frame body（２７５７））は、基本的には、IEEE802.11-2007仕様書section7.2．3.4節と7.2．3.5節に記載のAssociation Request/Responseframe formatである。ただし、IEEE802.11仕様書内で定義されているInformation Element（以下、IEと省略）（２７５９）だけでなく、独自に拡張したIEを含めている点が異なる。

また、Vendor Specific IE（２７６０）であることを示すため、IE Type（Information Element ID（２７６１））には、１０進数で１２７がセットされる。この場合、IEEE802.11−2007仕様7.3．2.26節により、Lengthフィールド（２７６２）と、OUIフィールド（２７６３）が続き、この後にvendor specific content（２７６４）が配置される。

Vendor specific content（２７６４）の内容としては、最初にvendor specific IEのtypeを示すフィールド（IE type（２７６５））を設ける。そして、この後に、複数のsubelement（２７６６）を格納することができる構成とすることが考えられる。

subelement（２７６６）の内容として、使われるべき特定のアプリケーションの名称（２７６７）や、その特定のアプリケーション動作時のデバイスの役割（２７６８）を含めることが考えられる。また、特定のアプリケーション、または、その制御のために使われるポート番号等の情報（Ｌ４セットアップのための情報）（２７６９）や、特定のアプリケーション内でのCapabilityに関する情報（Capability情報）（２７７０）を含めることが考えられる。ここで、Capability情報は、例えば、指定する特定のアプリケーションがDLNAの場合に、音声送出／再生に対応している、映像送出／再生に対応している等を特定するための情報である。

以上のような構成の無線通信システムにおいて、図１乃至図８０を参照して上述したような本技術を適用することにより、図１乃至図８０を参照して上述した効果と同様の効果を得ることができる。すなわち、符号化・復号に必要な記憶容量の増大を抑制することができる。また、上述した無線通信システムにおいて、本技術により符号化されたデータを送受信することにより、符号化・復号に必要な記憶容量の増大を抑制することができる。

また、本明細書では、各種情報が、符号化ストリームに多重化されて、符号化側から復号側へ伝送される例について説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像（スライス若しくはブロックなど、画像の一部であってもよい）と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像（又はビットストリーム）とは別の伝送路上で伝送されてもよい。また、情報は、画像（又はビットストリーム）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されてもよい。さらに、情報と画像（又はビットストリーム）とは、例えば、複数フレーム、１フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。

以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示はかかる例に限定されない。本開示の属する技術の分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

なお、本技術は以下のような構成も取ることができる。
（１）複数のレイヤを有する画像の前記複数のレイヤ間の予測であるレイヤ間予測を行う最上位のサブレイヤを決定するレイヤ間予測制御情報に基づいて、前記レイヤ間予測を行うようにして、前記画像を符号化する符号化部
を備える画像処理装置。
（２）前記符号化部は、カレントレイヤのカレントピクチャが、前記レイヤ間予測制御情報により前記レイヤ間予測を行うように決定されるサブレイヤに属する場合、前記カレントピクチャの画像を、前記レイヤ間予測を用いて符号化する
（１）に記載の画像処理装置。
（３）前記符号化部は、最下位サブレイヤから前記レイヤ間予測制御情報により決定される最上位のサブレイヤまでのサブレイヤに属するピクチャの画像を、前記レイヤ間予測を用いて符号化する
（２）に記載の画像処理装置。
（４）前記レイヤ間予測制御情報は、レイヤ毎に設定される
（１）乃至（３）のいずれかに記載の画像処理装置。
（５）前記レイヤ間予測制御情報は、全レイヤ共通のパラメータとして設定される
（１）乃至（４）のいずれかに記載の画像処理装置。
（６）前記符号化部により符号化された前記画像の符号化データと、前記レイヤ間予測制御情報とを伝送する伝送部
をさらに備える（１）乃至（５）のいずれかに記載の画像処理装置。
（７）前記符号化部は、
前記レイヤ間予測制御情報として設定された、前記複数のレイヤ間のピクセル予測であるレイヤ間ピクセル予測を行うかを制御するレイヤ間ピクセル予測制御情報に基づいて前記レイヤ間ピクセル予測を行い、
前記レイヤ間予測制御情報として、前記レイヤ間ピクセル予測制御情報とは独立に設定された、前記複数のレイヤ間のシンタクス予測であるレイヤ間シンタクス予測を行うかを制御するレイヤ間シンタクス予測制御情報に基づいて前記レイヤ間シンタクス予測を行い、
前記伝送部は、前記レイヤ間予測制御情報として、互いに独立に設定された前記レイヤ間ピクセル予測制御情報および前記レイヤ間シンタクス予測制御情報を伝送する
（６）に記載の画像処理装置。
（８）前記レイヤ間ピクセル予測制御情報は、前記レイヤ間ピクセル予測を行うかを、前記サブレイヤを用いて制御し、
前記符号化部は、前記レイヤ間ピクセル予測制御情報により指定されるサブレイヤのみ前記レイヤ間ピクセル予測を行い、
前記レイヤ間シンタクス予測制御情報は、前記レイヤ間シンタクス予測を行うかを、ピクチャ若しくはスライス毎に制御し、
前記符号化部は、前記レイヤ間シンタクス予測制御情報により指定されるピクチャ若しくはスライスのみ前記レイヤ間シンタクス予測を行う
（７）に記載の画像処理装置。
（９）前記伝送部は、前記レイヤ間ピクセル予測制御情報を、ナルユニット（nal_unit）、ビデオパラメータセット（VPS（Video Parameter Set））、若しくは、拡張ビデオパラメータセット（vps_extension）として伝送する
（８）に記載の画像処理装置。
（１０）前記伝送部は、前記レイヤ間シンタクス予測制御情報を、ナルユニット（nal_unit）、ピクチャパラメータセット（PPS（Picture Parameter Set））、若しくは、スライスヘッダ（SliceHeader）として伝送する
（８）または（９）に記載の画像処理装置。
（１１）複数のレイヤを有する画像の前記複数のレイヤ間の予測であるレイヤ間予測を行う最上位のサブレイヤを決定するレイヤ間予測制御情報に基づいて、前記レイヤ間予測を行うようにして、前記画像を符号化する
画像処理方法。
（１２）コンピュータを、
複数のレイヤを有する画像の前記複数のレイヤ間の予測であるレイヤ間予測を行う最上位のサブレイヤを決定するレイヤ間予測制御情報に基づいて、前記レイヤ間予測を行うようにして、前記画像を符号化する符号化部
として機能させるプログラムを記録したコンピュータが読み取り可能な記録媒体。
（１３）コンピュータを、
複数のレイヤを有する画像の前記複数のレイヤ間の予測であるレイヤ間予測を行う最上位のサブレイヤを決定するレイヤ間予測制御情報に基づいて、前記レイヤ間予測を行うようにして、前記画像を符号化する符号化部
として機能させるプログラム。

１００スケーラブル符号化装置，１０１共通情報生成部，１０２符号化制御部，１０３ベースレイヤ画像符号化部，１０４レイヤ間予測制御部，１０５エンハンスメントレイヤ画像符号化部，１３５動き予測・補償部，１４１主レイヤ最大数設定部，１４２サブレイヤ最大数設定部，１４３レイヤ間予測実行最大サブレイヤ設定部，１５１レイヤ間予測実行制御部，１５２符号化関連情報バッファ，２００スケーラブル復号装置，２０１共通情報取得部，２０２復号制御部，２０３ベースレイヤ画像復号部，２０４レイヤ間予測制御部，２０５エンハンスメントレイヤ画像復号部，２３２動き補償部，２４１主レイヤ最大数取得部，２４２サブレイヤ最大数取得部，２４３レイヤ間予測実行最大サブレイヤ取得部，２５１レイヤ間予測実行制御部，２５２復号関連情報バッファ，３０１共通情報生成部，３４２サブレイヤ数設定部，３４３レイヤ間予測実行最大サブレイヤ設定部，４０１共通情報取得部，４４２サブレイヤ数取得部，４４３レイヤ間予測実行最大サブレイヤ取得部，５０１共通情報生成部，５０４レイヤ間予測制御部，５４３共通フラグ設定部，５４４レイヤ間予測実行最大サブレイヤ設定部，５５１レイヤ間予測実行制御部，６０１共通情報取得部，６０４レイヤ間予測制御部，６４３共通フラグ取得部，６４４レイヤ間予測実行最大サブレイヤ取得部，６５１レイヤ間予測実行制御部，７０１共通情報生成部，７０４レイヤ間予測制御部，７１１レイヤ間ピクセル予測制御情報設定部，７２１アップサンプル部，７２２レイヤ間ピクセル予測制御部，７２３ベースレイヤピクセルバッファ，７２４ベースレイヤシンタクスバッファ，７２５レイヤ間シンタクス予測制御情報設定部，７２６レイヤ間シンタクス予測制御部，８０１共通情報取得部，８１１レイヤ間ピクセル予測制御情報取得部，８２１アップサンプル部，８２２レイヤ間ピクセル予測制御部，８２３ベースレイヤピクセルバッファ，８２４ベースレイヤシンタクスバッファ，８２５レイヤ間シンタクス予測制御情報取得部，８２６レイヤ間シンタクス予測制御部，９４８ヘッダ生成部，１０４４ヘッダ解読部

Claims

複数のレイヤを有する画像の前記複数のレイヤ間の予測であるレイヤ間予測を行う最上位のサブレイヤを決定するレイヤ間予測制御情報に基づいて、最下位のサブレイヤから前記レイヤ間予測制御情報により決定される前記最上位のサブレイヤまで前記レイヤ間予測を行うようにして、前記画像を符号化する符号化部
を備える画像処理装置。
前記符号化部は、カレントレイヤのカレントピクチャが、前記レイヤ間予測制御情報により前記レイヤ間予測を行うように決定されるサブレイヤに属する場合、前記カレントピクチャの画像を、前記レイヤ間予測を用いて符号化する
請求項１に記載の画像処理装置。
前記レイヤ間予測制御情報は、レイヤ毎に設定される
請求項１または請求項２に記載の画像処理装置。
前記レイヤ間予測制御情報は、全レイヤ共通のパラメータとして設定される
請求項１乃至請求項３のいずれかに記載の画像処理装置。
前記符号化部により符号化された前記画像の符号化データと、前記レイヤ間予測制御情報とを伝送する伝送部
をさらに備える請求項１乃至請求項４のいずれかに記載の画像処理装置。
前記符号化部は、
前記レイヤ間予測制御情報として設定された、前記複数のレイヤ間のピクセル予測であるレイヤ間ピクセル予測を行うかを制御するレイヤ間ピクセル予測制御情報に基づいて前記レイヤ間ピクセル予測を行い、
前記レイヤ間予測制御情報として、前記レイヤ間ピクセル予測制御情報とは独立に設定された、前記複数のレイヤ間のシンタクス予測であるレイヤ間シンタクス予測を行うかを制御するレイヤ間シンタクス予測制御情報に基づいて前記レイヤ間シンタクス予測を行い、
前記伝送部は、前記レイヤ間予測制御情報として、互いに独立に設定された前記レイヤ間ピクセル予測制御情報および前記レイヤ間シンタクス予測制御情報を伝送する
請求項５に記載の画像処理装置。
前記レイヤ間ピクセル予測制御情報は、前記レイヤ間ピクセル予測を行うかを、前記サブレイヤを用いて制御し、
前記符号化部は、前記レイヤ間ピクセル予測制御情報により決定されるサブレイヤのみ前記レイヤ間ピクセル予測を行い、
前記レイヤ間シンタクス予測制御情報は、前記レイヤ間シンタクス予測を行うかを、ピクチャ若しくはスライス毎に制御し、
前記符号化部は、前記レイヤ間シンタクス予測制御情報により決定されるピクチャ若しくはスライスのみ前記レイヤ間シンタクス予測を行う
請求項６に記載の画像処理装置。
前記伝送部は、前記レイヤ間ピクセル予測制御情報を、ナルユニット（nal_unit）、ビデオパラメータセット（VPS（Video Parameter Set））、若しくは、拡張ビデオパラメータセット（vps_extension）として伝送する
請求項７に記載の画像処理装置。
前記伝送部は、前記レイヤ間シンタクス予測制御情報を、ナルユニット（nal_unit）、ピクチャパラメータセット（PPS（Picture Parameter Set））、若しくは、スライスヘッダ（SliceHeader）として伝送する
請求項７または請求項８に記載の画像処理装置。
複数のレイヤを有する画像の前記複数のレイヤ間の予測であるレイヤ間予測を行う最上位のサブレイヤを決定するレイヤ間予測制御情報に基づいて、最下位のサブレイヤから前記レイヤ間予測制御情報により決定される前記最上位のサブレイヤまで前記レイヤ間予測を行うようにして、前記画像を符号化する
画像処理方法。
コンピュータを、
複数のレイヤを有する画像の前記複数のレイヤ間の予測であるレイヤ間予測を行う最上位のサブレイヤを決定するレイヤ間予測制御情報に基づいて、最下位のサブレイヤから前記レイヤ間予測制御情報により決定される前記最上位のサブレイヤまで前記レイヤ間予測を行うようにして、前記画像を符号化する符号化部
として機能させるプログラムを記録したコンピュータが読み取り可能な記録媒体。
コンピュータを、
複数のレイヤを有する画像の前記複数のレイヤ間の予測であるレイヤ間予測を行う最上位のサブレイヤを決定するレイヤ間予測制御情報に基づいて、最下位のサブレイヤから前記レイヤ間予測制御情報により決定される前記最上位のサブレイヤまで前記レイヤ間予測を行うようにして、前記画像を符号化する符号化部
として機能させるプログラム。