JP4876122B2 - 精度スケーラビリティを可能にする符号化スキーム - Google Patents

精度スケーラビリティを可能にする符号化スキーム Download PDF

Info

Publication number
JP4876122B2
JP4876122B2 JP2008505762A JP2008505762A JP4876122B2 JP 4876122 B2 JP4876122 B2 JP 4876122B2 JP 2008505762 A JP2008505762 A JP 2008505762A JP 2008505762 A JP2008505762 A JP 2008505762A JP 4876122 B2 JP4876122 B2 JP 4876122B2
Authority
JP
Japan
Prior art keywords
precision
information
encoded data
encoded
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2008505762A
Other languages
English (en)
Other versions
JP2008533949A (ja
Inventor
ハイコ シュヴァルツ
トーマス ウィーガント
トビアス ヒンツ
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2008533949A publication Critical patent/JP2008533949A/ja
Application granted granted Critical
Publication of JP4876122B2 publication Critical patent/JP4876122B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、品質、精度またはSNRのスケーラビリティに対応する画像または映像の符号化に関する。
ISO/IECのMoving Pictures Experts Group(MPEG、動画作業部会)とITU−TのVideo Coding Experts Group(VCEG、映像符号化作業部会)とのJoint Video Team(JVT、合同映像チーム)の現在のプロジェクトは、ITU−T Rec.&ISO/IEC 14496−10 AVC、「一般的オーディオビジュアル用途のための先進的映像符号化(Advanced Video Coding for Generic Audiovisual Sevices)」、バージョン3、2005年、に規定された、最新技術の映像符号化規格H.264/MPEG4−AVCのスケーラビリティ拡張の開発である。J.Reichel(ライヘル)、H.Schwarz(シュワルツ)およびM.Wien(ウィーン)編纂の現在の作業草案、「スケーラブル映像符号化−共同草案4(Scalable Video Coding−Joint Draft 4)」、合同映像チーム、文書番号JVT−Q201、フランス、ニース、2005年10月、およびJ.Reichel(ライヘル)、H.Schwarz(シュワルツ)およびM.Wien(ウィーン)編纂の「合同スケーラブル映像モデルJSVM−4(Joint Scalable Video Model JSVM−4)」、合同映像チーム、文書番号JVT−Q202、フランス、ニース、2005年10月、は、映像シーケンスまたはこれらの任意の組み合わせの時間、空間およびSNRスケーラブルな符号化に対応している。
ITU−T Rec.&ISO/IEC 14496−10 AVC、「一般的オーディオビジュアル用途のための先進的映像符号化(Advanced Video Coding for Generic Audiovisual Sevices)」、バージョン3、2005年、に記載されたH.264/MPEG4−AVCは、マクロブロックの予測信号が動き補償付予測またはイントラ予測のいずれかで生成されその後両方の予測が残差符号化されるハイブリッド映像コーディックを規定している。スケーラビリティ拡張性のないH.264/MPEG4−AVC符号化は、シングル・レイヤH.264/MPEG4−AVC符号化と呼ばれる。シングル・レイヤH.264/MPEG4−AVCに匹敵するレート歪特性であれば、通常、同じ映像再生品質が10%のビットレートで達成されることになる。上述のことから、スケーラビリティは、サポートされている任意の空間的、時間的またはSNRの分解能において、その特定の分解能におけるシングル・レイヤH.264/MPEG4−AVC符号化のレベルと同等なR−D特性を達成しながら、ビットストリームの一部を削除するための機能性と見なされる。
スケーラブル映像符号化(SVC)の基本設計は、階層化された映像コーディックとして類別することができる。H.264/MPEG4−AVCに見られるように、各レイヤにおいて、動き補償付予測およびイントラ予測の基本的なコンセプトが採用される。他方では、いくつかの空間またはSNRレイヤ間の冗長性を利用するために、さらなるレイヤ間予測メカニズムが組み込まれている。SNRスケーラビリティは基本的には残差の量子化によって達成され、空間スケーラビリティに対しては、動き補償付予測とオーバーサンプルによるピラミッド分解との組み合わせが用いられる。H.264/MPEG4−AVCの時間スケーラビリティのアプローチは維持される。
一般的に、符号化装置の構造は、アプリケーションに要求されるスケーラビリティのスペースによる。例として、図5は、2つの空間レイヤ902a、902bを有する典型的な符号化装置900を示す。各レイヤにおいて、レイヤ固有の動きパラメータ906a、bを有する独立した階層的動き補償付予測構造904a、bが採用されている。連続したレイヤ902a、bの間の冗長性は、動きパラメータ906a、bおよびテクスチャ・データ910a、bに対する予測メカニズムを含むレイヤ間予測コンセプト908によって利用される。各レイヤ902a、bの入力画面914a、bのベース表現912a、bは、H.264/MPEG4−AVCのものに類似した変換符号化916a、bにより得られ、対応するNALユニット(NAL−ネットワーク・アブストラクション・レイヤ)は、動き情報とテクスチャ・データとを含み、最低位レイヤのベース表現すなわち912aのNALユニットは、シングル・レイヤH.264/MPEG4−AVCと互換性がある。ベース表現の再構築品質については、いわゆるプログレッシブ・リファインメント・スライスの追加符号化918a、bによって向上することができ、対応するNALユニットは、細精度品質スケーラビリティ(FGS)またはフレキシブル・ビットレート適応に対応するために、任意に切り詰めることができる。
それぞれのレイヤ902a、bのベース・レイヤ符号化916a、bおよびプログレッシブSNRリファインメント・テクスチャ符号化918a、bにより出力される結果として生じるビットストリームは、スケーラブル・ビットストリーム922を生成するために、それぞれマルチプレクサ920によって多重化される。このビットストリーム922は、時間、スペースおよびSNRの品質に対してスケーラブルである。
要約すれば、映像符号化規格H.264/MPEG4−AVCの上述のスケーラブル拡張に従い階層的予測構造を用いることによって時間スケーラビリティが得られる。この階層的予測構造のために、シングル・レイヤH.264/MPEG4−AVC規格の1つを、変更をせずに使うことができる。空間およびSNRのスケーラビリティに対しては、シングル・レイヤH.264/MPEG4−AVCに付加ツールを加える必要がある。3種類すべてのスケーラビリティは、高度の組み合わせスケーラビリティに対応するビットストリームを生成するために、組み合わせることができる。
SNRスケーラビリティは、粗精度スケーラビリティ(CGS)と細精度スケーラビリティ(FGS)とに区分される。CGSは、選択されたSNRスケーラビリティ・レイヤだけをサポートし、粗レート分類に対する符号化効率は、1つのレイヤから次のレイヤに対して1.5倍〜2倍になるように最適化される。FGSでは、いかなる任意の、そして最終的にはバイト配列された時点で、NALユニットを切り詰めることができる。NALユニットはビット・パケットを表し、これらパケットは、マルチプレクサ920によって出力されるスケーラブル・ビットストリーム922を表現するために、直列に配列される。
細精度SNRスケーラビリティに対応するために、いわゆるプログレッシブ・リファインメント(PR)スライスが導入されている。プログレッシブ・リファインメント・スライスは、ベース・レイヤのビットストリーム912a、bそれぞれからの該当スライスに使用可能な再構築品質をリファインするためのリファインメント情報を含んでいる。もっと正確に言えば、PRスライスに対する各々のNALユニットは、量子化のステップ・サイズの二等分に対応するリファインメント信号を表す(QPの6増加)。これらの信号は、復号装置側で、各変換ブロックに対して一回だけ逆変換をするだけでよいような仕方で表現されている。言い換えれば、PR・NALユニットによって表現されるリファインメント信号は、映像の現在画面から分離された変換ブロックの変換係数をリファインする。復号装置側では、動き補償によるなどの空間および/または時間予測を使って実際の画面を再構築する際に用いられる予測残差のテクスチャを再構築するために、逆変換を行う前に、このリファインメント信号をベース・レイヤ・ビットストリームの中の変換係数をリファインするために使うことができる。
プログレッシブ・リファインメントNALユニットを、任意の時点で切り詰めて、SNRベース・レイヤの品質を細精度化により改善することができる。したがって、変換係数レベルの符号化順序は変更されている。(通常の)スライスで行われるような、マクロブロックごとの変換係数のスキャンに換えて、変換係数ブロックは、別々のパスでスキャンされ、各々のパスにおいて、変換係数ブロックに対する数個の符号化記号だけが符号化される。変更された符号化順序を除き、H.264/MPEG4−AVCに規定されているようなCABACエントロピ符号化が再使用される。
図5に示した符号化装置構造に対する改良が、M.Winken(ウィンケン)、H.Schwarz(シュワルツ)、D.Marpe(マープ)、およびT.Wiegand(ウィーガンド)の「FGSスライスに対する適応動きリファインメント(Adaptive motion refinement for FGS slices)」、合同映像チーム(JVT)、文書番号JVT−Q031、フランス、ニース、2005年10月、に記載されている。具体的には、同文書の記載によれば、動き/予測情報の適応リファインメントを用いた映像シーケンスの細精度SNRスケーラブル符号化のためのコンセプトが、図5の符号化構造に加えられる。SNRスケーラブル映像符号化に対する適応動き情報リファインメントによるアプローチによって、図5の映像符号化装置は、レート歪(RD)の面から、残差と動きデータとの間で符号化するためのビットレートのより良いトレードオフを選択することができる。具体的には、図5の点線924aおよび924bで示されているように、動き補償付予測をサポートするベース・レイヤ・スライス(いわゆるPおよびBスライス)に対応するプログレッシブ・リファインメント・スライス中の各マクロブロックに対して、リファインメント符号化ブロック918aおよび918bは、下記の2つの可能な符号化モードのいずれを使うのかを追加設定する。具体的には、第1モードによれば、符号化ブロック918a、bは、SNRベース・レイヤと同じ動き情報を使い、このように残差データのリファインメントだけを送信する。このモードは、前記した、図5の符号化構造の機能性の内容と等しい。一方、別の符号化モードでは、符号化ブロック918a、bは、新しい動き情報を新しい残差と共にリファインメント・スライス情報の中に入れて送信する。この新しい動きおよび残差データの双方をSNR下位レイヤから予測して、より良好なRD特性を実現することができる。可能な動きモードは、符号化規格H.264/MPEG4−VCによってサポートされるものと同じ、すなわち、マクロブロックを、Pスライスにおいては16動きベクトルまで、Bスライスにおいては32動きベクトルまでの小さなブロックにサブ分割して、動き補償付予測を伝送することができる。
ブロック918a、bによって行われる動き情報に関する2つの符号化モードの間での選定は、所与のλに対してラグランジュ・コスト関数J=D+λRが最小化されるラグランジュ・アプローチを使って行われる。ここで、Dは、元の信号と再構築(復号)された信号との間の歪を表し、Rは、マクロブロックを符号化するため必要なビットレートである。残差データだけをリファインするコストが、可能な動きリファインメント・モードの1つに対するコストより高い場合、レート歪の面から当該マクロブロックに対する動き情報の新しいセットを送信する方がよいのは明らかである。このように、適応動き情報リファインメントを使って、同一のビットレートでより高い画面品質を達成することが可能である。
前記で説明した、映像符号化規格H.264/MPEG4−AVCのスケーラブル拡張は、プログレッシブ・ソース・マテリアル、すなわち、画面またはフレームごとに、トップフィールドかボトムフィールドかの成分に関係なく、効率的に画面を処理できる映像、に対してはうまく機能する。しかしながら、インタレース方式のソース・マテリアル、すなわち、各フレームが2つの交互的フィールドで構成され、そのフィールドがフレームのように個々に処理される(フィールド符号化)方式の映像、もしくは、マクロブロックのペアごとに、トップフィールドまたはボトムフィールドとの帰属関係またはフレーム内のマクロブロックペア領域のトップハーフまたはボトムハーフへの帰属関係に従って、それぞれのマクロブロック部分を2つのマクロブロックに分割するかどうかを設定する方式の映像に対して、より良好なRD特性を有する精度スケーラビリティを実施できる符号化構造を有することが望ましい。
J.Reichel(ライヘル)、H.Schwarz(シュワルツ)およびM.Wien(ウィーン)著、「スケーラブル映像符号化−共同草案4(Scalable Video Coding−Joint Draft 4)」、合同映像チーム、文書番号JVT−Q201、フランス、ニース、2005年10月 J.Reichel(ライヘル)、H.Schwarz(シュワルツ)およびM.Wien(ウィーン)著、「合同スケーラブル映像モデルJSVM−4(Joint Scalable Video Model JSVM−4)」、合同映像チーム、文書番号JVT−Q202、フランス、ニース、2005年10月 M.Winken(ウィンケン)、H.Schwarz(シュワルツ)、D.Marpe(マープ)、およびT.Wiegand(ウィーガンド)著、「FGSスライスに対する適応動きリファインメント(Adaptive motion refinement for FGS slices)」、合同映像チーム(JVT)、文書番号JVT−Q031、フランス、ニース、2005年10月
それゆえに、本願発明の目的は、特にインタレース方式映像マテリアルに対して、符号化効率の向上を可能にする精度スケーラビリティを備えた符号化スキームを提供することである。
この目的は、請求項1による復号装置、および請求項13による符号化装置、請求項22または23による方法、および請求項21の精度スケーラブル・ビットストリームによって達成される。
本発明を構成する基本的考え方は、符号化装置に対し、第二精度は第一精度よりも高精度の、第一精度符号化データと第二精度符号化データとの間で、個別の画面部分のフィールド/フレーム処理方式を変更できる機能を持たせることによって、符号化効率の改善を達成できる、ということである。
本発明の好適な実施形態によれば、対応するベース品質スライスのフレーム/フィールド設定と関係なく、プログレッシブ・リファインメント・スライス中のフレーム/フィールド設定を行い、符号化することによって、インタレース方式フレームの細精度SNRスケーラブル符号化に対するコンセプトが実現される。これと比べ、動き情報リファインメントをサポートしていないH.264/MPEG4−AVC規格の前記のスケーラブル拡張では、変換係数のリファインメントだけが符号化される。動きおよび予測情報は、対応するベース・レイヤ・スライスからコピーされる。さらに、SNRおよび空間スケーラビリティをサポートするツールは、プログレッシブ方式のソース・マテリアルに対してしか設計されていない。インタレース方式のソース・マテリアルに対する符号化効率を向上させるための特別なツールは組み込まれていない。前述の動き情報リファインメントを含むスケーラブル拡張によれば、FGS符号化スキームは、特に大きなビットレート量に対し、細精度SNRスケーラブル符号化の符号化効率を改善するために、動きおよび予測情報の適応的リファインメントを行う。しかしながら、後者の方式のFGS符号化スキームも、プログレッシブ方式のソース・マテリアルに対してしか設計されていない。
以下に説明するFGS符号化スキームの実施形態は、前述の動き情報リファインメント・スケーラブル拡張を、同一場所に所在するマクロブロックのペア、およびベース品質スライスのフレーム/フィールド設定の改定もサポートするように拡張し、これにより、向上されたR/D比率を持つ精度スケーラブル・データストリームを実現することができる。
以下に、図を参照して本出願の好適な実施形態を説明する。具体的には以下の図を参照する。
(本発明の好適な実施の形態が添付図面を参照して以下に詳細に説明されるが、これらの図面としては:)
図1は、本発明の実施形態による映像符号化装置のブロック図である。
図2は、画面のマクロブロック・ペアへのサブ分割、およびマクロブロック適応フレーム/フィールド設定を持つ符号化フレームのスライスがアクティブな場合の、プログレッシブ・リファインメント・スライスのマクロブロックのスキャンを示す概略図である。
図3aは、ベース・レイヤ・データストリームの生成に関連し、図1の符号化装置の動作のモードを示す概略ブロック図である。
図3bは、第一拡張レイヤの生成に関連し、図1の符号化装置の動作のモードを示す概略ブロック図である。
図4は、本発明の実施形態による、復号装置側において実施されるステップを示すフローチャートである。
図5は、スケーラブル映像符号化のための従来型の符号化装置の構造である。
以下に、図5の従来型の符号化装置構造と類似の構造を持つ実施形態を使って本発明を説明する。但し、本発明による改良をさらに明瞭に示すために、まず最初に、図5に関連させて本明細書の導入部分で提示した、H.264/MPEG4−AVC規格のスケーラブル拡張に従った動作に関し、図1の本発明の実施形態を表す映像符号化装置を説明する。その後で、図5の映像構造による動作モードとの違いに重点を置いて、図1の符号化装置の実際の動作が説明される。以降の説明で明らかになるように、この違いはリファインメント符号化のやり方にある。
前記のJoint Drafts(合同草案)の定義に沿って動作する図1の映像符号化装置は、2つの空間レイヤに対応している。このため、100で示された図1の符号化装置は、2つのレイヤ部分、すなわち、レイヤ102aおよび102bを含み、このうちレイヤ102bは、より粗な空間解像度に関する、所望のスケーラブル・ビットストリームの部分を生成するために設けられており、他方のレイヤ102aは、レイヤ102bからのビットストリーム出力に対し、入力映像信号104のさらに高解像度の表現に関する情報を補うために設けられている。したがって、符号化装置100によって符号化される映像信号104は、レイヤ102aには直接入力され、符号化装置100は、映像信号104を空間的に間引きするために、空間デシメータ106を含み、該デシメータは、得られた空間的間引き映像信号108をレイヤ102bに入力する。
空間デシメータ106で行われるこの間引きは、例えば、元の映像信号104の各画面104aに対するピクセルの数を、列および行方向に一つおきに放棄することによって四分の1に間引くことが含まれる。
低解像度レイヤ102bは、動き補償付予測ブロック110b、ベース・レイヤ符号化ブロック112b、およびリファインメント符号化ブロック114bを含む。予測ブロック110bは、間引き映像信号108の他の参照画面ら108aから、間引き映像信号108の画面108aを予測するために、間引き映像信号108の画面108aに対する動き補償予測を実施する。例えば、ある特定の画面108aについて、予測ブロック110bは、映像信号108の他の画面、すなわち、参照画面からどのようにして当該画面を予測するか、を示す動き情報を生成する。具体的には、この目的のため、該動き情報は、動きベクトルのペアらおよび関連する参照画面指標を含め、各ペアが、例えば、どのようにして、指標の参照画面から、それぞれの動きベクトルによって、それぞれの画面を変位させることによって現在画面の特定部分またはマクロブロックを予測するかを示すことができる。各マクロブロックは、一つ以上の動きベクトル・ペアおよび参照画面指標を割り当てることができる。さらに、画面の一部のマクロブロックについては、イントラ予測、すなわち、現在の画面の情報を使った予測をすることができる。具体的には、予測ブロック110bは、間引き映像信号108に対し階層的動き補償因子予測を行うことができる。
予測ブロック110bは、動き情報116b、および、予測と実際の間引き画面108aとの間の差を表す映像テクスチャ情報118bの予測残差を出力する。具体的には、予測ブロック110bにおける動き情報116bおよびテクスチャ情報118bの設定は、望ましくは、次のベース・レイヤ符号化110bよって得られる当該情報の符号化が最適のレート歪特性を持つベース表現ビットストリームとして出力されるように行われる。
前記のように、ベース・レイヤ符号化ブロック112bは、ブロック110bから第一動き情報116bとテクスチャ情報118bとを受信し、それら情報を、ベース表現ビットストリーム120bに符号化する。ブロック112bにより実施される符号化には、テクスチャ情報118bの変換と量子化とが含まれる。特に、ブロック112bによって使用される量子化は比較的、粗である。そこで、ビットストリーム120bの品質アップまたは精度アップを可能にするために、リファインメント符号化ブロック114bが、ビットストリーム120b中のテクスチャ情報を表す粗く量子化された変換係数をリファインするための情報を含む、各種リファインメント・レイヤに対する追加ビットストリームを使って、ビットストリーム120bをサポートする。後記でさらに詳細を説明するように、リファインメント符号化ブロック114bには、前記のスケーラブル拡張のところで説明した機能性として、例えば、予測ブロック110bと協働し、特定のリファインメント・レイヤ・ビットストリーム122bにリファインされた動き情報116bを含める必要を判定させることもできる。但し、本発明の実施形態によれば、この機能性は、フレーム/フィールド設定を新規に符号化する機能性と関連しており、したがって、以降は、これらの機能性については、以下に説明する。先行して出力されたより低いリファインメント・レイヤのビットストリーム122bのベース表現120bに関連する残差テクスチャ情報のリファインメントには、例えば、現在の変換係数の量子化誤差を符号化し、これによりもっと細かな量子化予測によってテクスチャ情報を表現することを含む。
ビットストリーム120bおよび122bの双方は、符号化装置100が発信する最終的スケーラブル・ビットストリーム126の中に挿入するために、符号化装置100に含まれるマルチプレクサ124によって多重化される。
レイヤ102aは、実質的にレイヤ102bと同様に動作する。したがって、レイヤ102aは、動き補償予測ブロック110a、ベース・レイヤ符号化ブロック112a、およびリファインメント符号化ブロック114aを含む。レイヤ102bに基づいて、予測ブロック110aは、動き情報116aおよびテクスチャ情報118aを得るために、映像信号104を受信し、これに対し動き補償付予測を行う。出力された動き情報116aおよびテクスチャ情報118aは、符号化ブロック112aによって受信され、該ブロックは、ベース表現ビットストリーム120aを得るために、これら情報を符号化する。リファインメント符号化ブロック114aは、ビットストリーム120aの変換係数と、元のテクスチャ情報118aから得られた実際の変換係数とを比較することによって、ベース表現120a上に現れている量子化誤差のリファインメントを符号化し、これに沿って、各種のリファインメント・レイヤのためのリファインメント・レイヤ・ビットストリーム122aを出力する。
レイヤ102aと102bとの唯一の違いは、レイヤ102aはレイヤ間予測されることである。すなわち、予測ブロック110aは、映像信号104の高解像度画面104aを予備予測するために、ビットストリーム120bおよび122bの一つ以上から導き出すことが可能な、残差テクスチャ情報、動き情報、または再構築された映像信号といった、レイヤ102bから得られる情報を使用する。その後、間引き映像信号108に関する予測ブロック110bの動作に関連して前記で説明したのと同様に、該予備予測残差に対し動き補償付予測を実施する。これに代えて、予測ブロック110aは、動き補償付予測118aを予測するために、レイヤ102bから得られる情報を使う。この場合、イントラ・ブロックに対しては、再構築されたベース・レイヤ画面を使って画面コンテント104aを予測することができる。インタ・ブロック104aについて、再構築された対応ベース・レイヤの動きベクトルから、110aから出力される動きベクトル116aを予測することができる。さらに、レイヤ102aの動き補償付残差118aが推定された後、同残差を、対応する画面に対し再構築されたベース・レイヤ残差から予測することができ、残差は次いでブロック112a、114aにおいてさらに処理される。
ここまで、図1の符号化装置の動作モードの説明は、リファインメント符号化手段114a、bによる残差情報の処理に絞ってきた。具体的には、ブロック110a、bによって出力され、符号化手段112a、bにおいて、ベース・レイヤの精度に符号化された残差情報またはテクスチャ情報は、リファインメント符号化手段114a、bにおいて、リファインされる。但し、同時に、リファインメント符号化手段114a、bは、レイヤごとに動き情報のリファインメントまたは変更でき、ブロック118a、bによって決められたフレーム/フィールド設定を変更をすることができる。
ここまで説明してきた図1の符号化装置の機能性は、プログレッシブ方式映像のソース・マテリアルの事例、またはベース・レイヤ符号化手段112a、bが、1に等しいframe_MBS_only_flagの事例、ここでは映像を表す画面シーケンスは符号化フレームだけで構成されており、フレームのフィールドへの分解は無視されているわけだが、これらの事例にはよく適している。しかしながら、これまでに説明した機能性を備えた図1の符号化装置によって提供されるSNRおよび空間スケーラビリティは、インタレース方式のソース・マテリアルに対しては理想的なものではない。このような理由のために、本発明の実施形態により動作する図1の符号化装置は、テクスチャ情報だけでなく動き情報、第一には、フレーム/フィールド設定のリファインメントを可能にし、これによりインタレース方式の元情報対応型の拡張を形成する。
但し、図1の符号化装置のこの別の機能を説明する前に、いくつかのインタレース用ツールが組み込まれているH.264/MPEG4−AVC規格を参照する。第一のツールでは、フレームは、符号化フレーム、あるいは2つの符号化フィールドいずれでも符号化することができる。これは、ピクチャ適応型フレーム・フィールド符号化(picture−adaptive frame field coding)といわれる。すなわち、フレームまたは映像を、トップ(top)とボトム(bottom)との2つの交互配置フィールドを含むように設定することができる。トップフィールドは、偶数番号のライン0、2、…H/2−1を包含し、Hは、フレームの総ライン数であり、ボトムフィールドは、フレームの2番目のラインから始まる奇数番号ラインを含む。フレームの2つのフィールドが異なる時間インスタンスで配信される場合、該フレームはインタレース方式フレームといわれ、また、他方は、プログレッシブ方式フレームと呼ばれる。H.264/MPEG4−AVCにおける符号化表現は、この映像特性、すなわち、元の配信画像を構成するインタレースまたはプログレッシブ方式のタイミングについては基本的に関知しない。代わりに、該規格の符号化では、タイミングに基づくのでなく、主として幾何的コンセプトに基づいて表現が規定される。また、前述したピクチャ適応型フレーム・フィールド符号化の考え方は、マクロブロック適応フレーム・フィールド符号化に拡張される。フレームが、単一のフレームとして符号化され、シーケンス・パラメータ・セット中で送信されるmb_adaptive_frame_field_flagフラグが1に等しい場合、図2に示されるように、スライス内のマクロブロックのスキャンが変更される。図2は、画面200の例示的な部分を示す。画面は、マクロブロック202にサブ分割されている。さらに、マクロブロック適応フレーム/フィールド符号化が作動され、縦方向に隣接するマクロブロック202の各ペアは、マクロブロック・ペア204としてグループ化される。後記の説明でさらに明確になるが、画面200のマクロブロック202へのサブ分割は、量子化の基礎単位を提供する大きな役割を果たし、これにより、符号化装置は、高い符号化効率で、それぞれの画面領域における映像コンテンツに適合させることが必要な符号化パラメータの設定をすることができる。マクロブロック・ペア204は、画面200を空間的にマクロブロック・ペア204の矩形のアレイにサブ分割する。一つのマクロブロック・ペア204の2つのマクロブロック202aと202bとは、画面200の垂直方向解像度の半分の垂直方向解像度を持つ画面200の、マクロブロック・ペアのほぼ全体部分を空間的に占めるか、あるいはマクロブロック・ペア204の領域を、上部半分と下部半分とに空間的に分割する。どの場合においても、第一、第三、…のラインを含む、または該上部半分を占めるマクロブロックは、トップ(top)マクロブロック202aと呼ばれ、もう一方はボトム(bottom)マクロブロックと呼ばれる。言い換えれば、このような縦方向に隣接する2つのマクロブロックは、マクロブロック・ペアと呼ばれ、該ペアを、図2に示すように矩形アレイに配列することができる。各マクロブロック・ペアに対し、構文要素(syntax element)mb_field_decoding_flagが送信または推測される。mb_field_decoding_flagが0に等しい場合、当該マクロブロック・ペアは、幾何的意味合いで、マクロブロック・ペアの上側半分を表すトップマクロブロックと、マクロブロック・ペアの下側半分を表すボトムマクロブロックとを持つフレーム・マクロブロック・ペアとして符号化される。該トップおよびボトムマクロブロック双方に対しては、マクロブロック適応フレーム・フィールド符号化が非作動にされ、フレーム・マクロブロックだけが存在することを表す、0に等しいmb_adaptive_frame_field_codingを持つフレームのマクロブロックとして、動き補償予測および変換の符号化が適用される。mb_field_decoding_flagが1に等しい場合、当該マクロブロック・ペアは、マクロブロック・ペアのトップフィールド・ラインを表すトップマクロブロックと、マクロブロック・ペアのボトムフィールド・ラインを表すボトムマクロブロックとを持つフィールド・マクロブロック・ペアを表す。したがって、前者の場合、トップとボトムマクロブロックとは、実質的に画面の同一の領域、すなわちマクロブロック・ペア領域をカバーする。しかしながら、これらのマクロブロックでは、垂直方向解像度幅は水平方向解像度の2倍となる。後者のフィールド・マクロブロック・ペアの場合、動き補償予測および変換の符号化は、フィールド・ベースで行われる。ベース・レイヤおよびリファインメント・レイヤ内の画面コンテンツの符号化は、スライス、すなわちマクロブロックまたはマクロブロック・ペアのグループの単位で行われる。一つの画面またはフレームを、一つ以上のスライスで構成することができる。図2では、同一のスライスに属するマクロブロック・ペアとして想定されており、図2中の矢印は、それぞれのレイヤにおいてマクロブロックが符号化されて行く順序を示している。図から分かるように、マクロブロックは、ペア単位で、トップマクロブロックが最初に次いで対応ボトムマクロブロックがスキャンされ、その後、次のマクロブロック・ペアに移る。
符号化されたフィールドのマクロブロック、または符号化されたフレームの1に等しいmb_field_decoding_flagを持つマクロブロックは、フィールド・マクロブロックといわれる。フィールド・マクロブロックの各変換ブロックは、水平方向解像幅の2倍に等しい垂直解像幅を持つ画像領域を表現するので、ゼロでない変換係数レベルの分布が水平方向の低周波方向にシフトされ易く、レート歪最適化符号化のため、フィールド・マクロブロックに対する変換ブロック内の変換係数のスキャンは、フレーム・マクロブロックのものと変更される。
以下の、図1の符号化装置の説明は、動き情報のリファインメント、およびそれぞれのマクロブロック・ペアに対して行うフレーム/フィールド設定の更改に重点を置く。但し、これらデータのリファインメント更改について説明する前に、ブロック110a、bおよび112a、bによって、ベース・レイヤ912a、bを得るために行うステップを概略的に示している図3aを参照する。図3aにおいても同様に、開始点として、符号化対象の現在画面200と、マクロブロック202にサブ分割された画面200と、マクロブロック・ペア204にグループ化されたマクロブロック202とが示され、マクロブロック・ペア204が、画面200を空間的に、矩形の配列にサブ分割しているのが示されている。画面200の符号化において、ブロック110a、bは、各マクロブロック・ペア204に対し、当該マクロブロック・ペアのマクロブロックを、フィールド符号化マクロブロックまたはフレーム符号化のマクロブロックのいずれとすべきかを設定する。言い換えれば、ブロック904a、bは、各マクロブロック・ペアに対し、該ペアが、フィールドまたはフレームのいずれのモードで符号化されるべきかを設定し、この設定は、図3の206に示されている。マクロブロック・ペア204の一つを、円208で囲んで、例として目立たせることによって、マクロブロック・ペア単位での設定206を示している。設定206の結果は、210aおよびbに示されている。図で分かるように、フレーム符号化マクロブロック202aおよび202bがマクロブロック・ペア204を構成している場合には、これらマクロブロックは、マクロブロック・ペア204が占めている画面領域を、上部半分と下部半分とに空間的にサブ分割する。したがって、マクロブロック・ペアの双方202aおよび202bは、画面の奇数番号ラインおよび偶数番号ラインの双方の中に含まれる画面情報を含み、奇数番号のラインは白い長方形で示され、偶数番号ラインは斜線で示されている。一方、フィールド・モードの場合には、トップマクロブロック202aは、奇数番号ラインすなわちトップフィールド中に含まれるマクロブロック・ペア領域内の画面情報だけを含み、ボトムマクロブロックは、偶数番号ライン中に含まれるマクロブロック・ペア領域内の画面情報を含む。これは、210aと210bとを比較すれば明らかである。フィールド・モードの場合には、垂直方向の画面解像幅は半分位に狭くなる。ブロック104a、bによるフレーム/フィールド・モード設定206は、何らかの形でベース・レイヤ・ビットストリーム120a、bに反映され、復号装置側では、設定206を、スケーラブル・ビットストリーム126、特にスケーラブル・ビットストリーム126中のベース・レイヤ・ビットストリームの中から抽出することができ、該反映を、図3aの設定206から、ベース・レイヤ・データストリーム216に含まれるブロック214に向かう矢印212によって示される。なお、場合の処置としてだけであるが、フレーム/フィールド・モード設定は、必ずしもベース・レイヤ・データストリーム216内の連続したブロック中に配置または符号化する必要はない。それぞれのマクロブロック・ペア204に対する設定を、解析可能な方法でベース・レイヤ・データストリーム216上に割り当てることができる。さらなる詳細についてはH.264/MPEG4−AVC規格を参照することができる。
しかしながら、ブロック110a、bが行う設定は、フレーム/フィールド・モード設定206だけではない。218によって示すように、ブロック110a、bは、さらに、各マクロブロックに対する動きパラメータも設定する。これらの動きパラメータは、例えば、それぞれのマクロブロックに対し、動きベクトルの空間解像度が設定されるかについて規定する。例えば、図3aの220aに示されるように、トップマクロブロック202aは、4つパーティション222にさらにサブ分割されており、各々のパーティション222に対し、動きベクトル224が定義されている。これに対して、ボトムマクロブロック202bは、一つのパーティションのままとされ、このマクロブロックに対しては、一つの動きベクトル224しか定義されていない。当然のことながら、動きパラメータの設定218は、レート/歪最適化の面で、フレーム/フィールド設定206と別のものではない。前記パーティション分割は、マクロブロック201aおよび202bに対する例示的パーティション区画中の、フィールド符号化マクロブロックの場合を表す220bによって示され、その上に記載された220aはフレーム符号化マクロブロックの場合を反映したものである。同220aについてのパーティション区画も例示されているが、フレーム/フィールド設定206に基づいて区画を変えることができるのは明らかである。それぞれのマクロブロックを、予測動き補償された形で予測するために使う参照画面の番号を、さらなる動きパラメータで設定することができる。これら設定は、パーティション・ベース、マクロブロック・ベースまたは画面ベース、あるいはスライス・ベースで行うことができる。しかしながら、図3aでは、簡明化のため、各パーティション222に対し一つだけの動きベクトルが示される。これらに加え、当然、動きパラメータ218は、方向および長さなど動きベクトル自体を規定する。動きベクトルは、再構築された参照画面の画面コンテンツをマクロブロック202a、bに含める画面情報の予測として取り入れる前に実施する必要のある、再構築参照画面の変位を規定する。残差または予測誤差226の算定において、動きベクトル224の規定に従い変位された再構築参照画面から取られた画面コンテンツは、当然ながら、フィールド符号化マクロブロックとフレーム符号化マクロブロックとでは異なっている。フレーム符号化マクロブロックの場合には、変位され再構築された参照画面から使われる画面情報は、連続した空間的サブ領域を表現する。一方、フィールド符号化マクロブロックの場合には、変位され再構築された参照画面から使われる画面情報は、前記領域の2倍の量の領域に関連している。特定のパーティション222に対してこのように得られた、フレーム符号化マクロブロックに対する残差が228に、フィールド符号化マクロブロックに対する残差が222bに示されている。これらのパーティション228a、bに包含されている残差サンプルは、ベース・レイヤ・ビットストリーム中に直接には符号化されない。これに代え、228a、b中に包含される残差情報を表す変換係数マトリックスを得るために、これら残差サンプルに対し、DCTまたは何らかの他のスペクトル分解のような変換が行われる。全パーティション、または全マクロブロック202a、bに対して変換230を実施することができる。また一方、変換230は、パーティション228a中の点線232で例示したような、マクロブロック202a、bまたはパーティション228a、bのサブ部分に対しても実施することができる。これにより、一つのマクロブロックまたはパーティションから、一つ以上の変換係数マトリックス234を得ることができる。
動きパラメータ218、およびマトリックス234中の変換係数(前記したように後者は比較的粗い量子化形である)は、矢印236と238とで示すように、ベース・レイヤ符号化手段112a、bによって、ベース・レイヤ・データストリーム216または120a、bに組み入れられ、これにより、ベース・レイヤ・データストリーム120a、b中に動き情報240および残差情報242を得る。
ラグランジュ・アプローチを使って、レート/歪比を何らかの形で最適化しながら、フレーム/フィールド・モード設定および動きパラメータ設定218を決めることができる。レート/歪の面から、設定206および218を、ベース・レイヤ・データストリームに関連する品質について最適化することはできるが、さらに高い品質を考慮し、これらと異なる設定を最適とすることができる。この考慮は、本出願の実施形態による、図1の符号化装置の動作モードが得られ、これによれば、符号化装置によって、一度決めたフレーム/フィールド・モード設定206が必ずしも維持される必要はない。それどころか、符号化装置および復号装置は、リファインメント・レイヤ中の個別のマクロブロック・ペアに対するフレーム/フィールド・モードを変更することができる。図1の実施形態によれば、フレーム/フィールド・モード設定の変更は、必然的に動きパラメータおよび残差変換係数の更改を伴う。但し、後記するように、必ず変更しなければならないわけではない。
図3bは、本発明の実施形態による、リファインメント符号化手段114a、bの動作モードを概略的に示す。図3bは、典型的なマクロブロック・ペア204のリファインメントに焦点を合わせており、例として、2つのフレーム符号化マクロブロック202aおよび202bで構成され、トップマクロブロック202aは4つのパーティション222に区画されており、ボトムマクロブロック202bは一つだけのパーティションで構成されている。典型的なマクロブロック・ペア204に対して、そのように決められるフレーム/フィールド・モード設定、および動きパラメータは、図3aの220aで示されるものに対応する。また、図3aに関連して既に述べたように、マクロブロック・ペア204に関する残差情報は、変換係数マトリックス234中に配列された変換係数を使って伝送される。変換係数マトリックス234中の変換係数は、水平方向244および垂直方向246のいろいろな周波数に対応する。例えば、図3bでは、上部左の変換係数はDC成分に対応し、この変換係数は248aとして示されている。
次に、マクロブロック・ペア204に対するリファインメント、もしくは品質または精度向上について検討することとし、リファインメント符号化手段114a、bは、ベース・レイヤに関して、ブロック110a、bが決めたフレーム/フィールド・モード設定を維持するか、またはこれを変更するかの設定250を行う。
最初に、フレーム/フィールド・モード設定を維持する場合が検討される。この場合、マクロブロック・ペア204は、リファインメント・レイヤにおいてフレーム符号化を維持したまま取り扱われる。但し、リファインメント符号化手段114a、bは、動き情報については、レート歪の面からこれを維持するのがよいのか、すなわち下位レイヤつまりベース・レイヤからの動き情報を採用し残差情報だけをリファインするのがよいのか、あるいは、ベース・レイヤの動き情報および残差情報を変更するのがよいのかどうかを検討設定する。この設定は、図3b中の252で示されている。リファインメント符号化手段114a、bが、特定のマクロブロック・ペア204に対し、フレーム/フィールド・モード設定および動き情報の双方を維持すると決めた場合には、リファインメント符号化手段114a、bは、その設定250および252の結果を、第一拡張レイヤ・データストリーム122a、bに組み入れる。設定250の結果は、点線258で示されているように、モード変更インジケータ256の形でデータストリーム122a、bに組み入れられる。同様に、設定252の結果は、点線262で示すように、動き精度拡張オン/オフ・インジケータ260としてデータストリーム122a、bに組み入れられる。さらに、リファインメント符号化手段114a、bは、残差精度拡張情報266をデータストリーム122a、bに組み入れ、この組み入れが点線矢印263によって示されている。現下の好適な実施形態において、263において組み入れられる残差精度拡張情報266は、それまで下位レイヤ、すなわち、下位リファインメント・レイヤまたはベース・レイヤにより規定されていた、それぞれの変換係数レベルの残差を表す残差変換係数レベルを、下位レイヤのステップサイズ幅を半分にするといった狭い幅の量子化ステップサイズによる実数変換係数に関連させて表現しなければならない。また一方、以下に示すように、ストリーム122a、b内のさらなるフラッグ/インジケータを使って、復号装置側が、特定のマクロブロックに対する残差精度拡張情報266は、下位レイヤにまで遡上可能な現在変換係数レベルとは別な変換係数レベルを表す、更改変換係数レベルとして解釈するよう示すことができる。
リファインメント符号化手段114a、bは、特定のマクロブロックに対する動き情報を維持せず、ベース・レイヤの情報をリファインすることができる。この場合、リファインメント符号化手段114a、bは、この置き換え設定252の結果を、第一拡張レイヤデータストリーム122a、b中のそれぞれのインジケータ260によって示すことができる。さらに、リファインメント符号化手段114a、bは、動き精度拡張情報264および残差精度拡張情報266をデータストリーム122a、bに組み入れ、これは点線矢印268および270によって示されている。動き精度拡張情報264および/または残差精度拡張情報266は、それぞれ、全く新規の動き情報/残差情報、あるいは、下位レイヤ、すなわち、図3bに示されたケースではベース・レイヤの動き情報および残差情報をリファインするためのリファインメント情報を表すことができる。完全な新規拡張情報264または266は、残差データに関して前述したように、下位拡張レイヤ、つまり、ベース・レイヤのそれぞれの拡張情報完全に置き換える拡張情報を表している必要がある。これに対し、下位レイヤの動き/残差情報をリファインするための拡張情報264および266の場合は、現在リファインメント・レイヤ、すなわち、図3bの場合は、第一拡張レイヤの動き/残差情報は、2つの連続するリファインメント・レベルの対応する変換係数レベルまたは動きベクトル成分レベルを加算することによって、現在拡張情報264、266と下位レイヤの動き/残差情報との双方を組み合わせるだけで導き出される。
第一拡張レイヤ中の動き情報の変更の影響を例示するために、フレーム/フィールド・モード設定を維持するが、動き情報を変更した場合の作用が、図3bの272に示される。示されるように、第一拡張レイヤ中のマクロブロック・ペア204に関連する動き情報は、ベース・レイヤにおけるそのマクロブロック・ペア204に関連する動き情報とは異なっており、該図では、該マクロブロック・ペア内の画面コンテンツを予測するために2つの参照画面が使われている。これによれば、各パーティション222は、2つの動きベクトル224aおよび224bに関連付けられている。さらに、第一リファインメント・レイヤの動き情報は、ボトムマクロブロック202bのパーティション区画を変更し、該マクロブロックは、ベース・レイヤでの状態であった一つだけのパーティション形成に換えて、4つのパーティションに区画されている。第一リファインメント・レイヤの動き情報、すなわち、参照画面番号、動きベクトル224aおよび224b、ならびにマクロブロック202aおよび202bのパーティション区分は、第一拡張レイヤ・データストリーム122a、b中に全く新規に符号化するか、あるいはベース・レイヤの動き情報を予測因子として用い符号化することができる。例えば、動きベクトルら224aが、同一の参照画面に対応している場合、ベース・レイヤの動きベクトル224に対する動きベクトルら224aのオフセットだけを、動き精度拡張情報264の中に符号化することができる。時間的にリニアな動きが想定される場合は、該動きベクトル224は、異なる参照画面に対する新しい動きベクトル224bの予測のベースとしても用いることができる。これに加え、ボトムマクロブロック202bの単一のパーティションの単一の動きベクトル224は、第一拡張レイヤ中のボトムマクロブロック202bの各パーティションの動きベクトルに対する予測因子として用いることができる。
同様に、第一拡張レイヤ・データストリーム122a、bの中で送信される、変換係数マトリックス234の変換係数に対する変換係数レベルは、ベース・レイヤの変換係数レベルをもっと細かな量子化ステップサイズで量子化したレベルに対する残差またはオフセットだけを表すか、あるいは、予測因子としてベース・レイヤの変換係数を使わずに、全面的に更改された変換係数マトリックス234の変換係数を表すことができる。
ここまで、リファインメント符号化手段114a、bが、マクロブロック・ペア204に対するフレーム/フィールド・モード設定の維持のために決めるケースについて説明してきた。しかしながら、設定250の結果が、第一拡張レイヤの中のフレーム/フィールド・モードの変更である場合、このことは、それぞれのモードの変更インジケータ256によって示され、新規の残差情報と共に新規動き情報が、動き精度拡張情報264および残差精度拡張情報266の形で、点線矢印274と276で示すように、第一拡張レイヤ・データストリーム122a、bの中に挿入される。具体的には、図3bの例によれば、マクロブロック・ペア204の動き情報は、ベース・レイヤから第一拡張レイヤに変更されて、トップマクロブロック202aのパーティション222に対する新規動きベクトル224が定義され、ボトムマクロブロック202bは、各パーティション222に対して、一つの動きベクトル224を持つ4つのパーティションに区画される。278で示すように、ここでは、マクロブロック202aおよび202bは、フィールド符号化され、例えば、マクロブロック202aは奇数番号のラインだけを含んでいる。残差情報は、それぞれの変換係数マトリックス234中の変換係数の変換係数レベルを使って符号化され、ベース・レイヤのマトリックス234の変換係数レベルを予測因子として使わずにレベルが符号化される。
また一方、本実施形態によれば、フレーム/フィールド・モード設定を維持しない場合には、動きおよび残差情報は、全面的に新しく符号化することになるが、これに換えて、異なったフレーム/フィールド・モードに対し定義されたベース・レイヤの動き情報および残差情報を予測因子として使うことができる。例えば、変換係数を考える。ベース・レイヤ中の残差サンプルの垂直方向解幅度は、第一拡張レイヤの残差サンプルの垂直解像幅の2倍である。したがって、その変換係数を含むベース・レイヤのマトリックス234に対する垂直方向246中の最高周波数成分の大きさは、その変換係数が第一拡張レイヤのマトリックス234に含まれている垂直方向246中の最高周波数成分の2倍である。したがって、少なくともベース・レイヤのマトリックス234の一部を、第一拡張レイヤのマトリックス234の変換係数に対する予測因子として使うことができる。もっと正確に言えば、DC成分を表し、第一拡張レイヤ・データストリーム122a、b中の残差精度拡張情報266内で送信される、変換係数248aの変換係数レベルを、ベース・レイヤ・データストリーム120a、bで送信される対応する変換係数248aの変換係数レベルに対するオフセットで表すことができる。同じことが、高周波の水平成分に対しても適用される。さらに、一段階高い垂直周波数成分280のため送信される第一拡張レイヤの変換係数レベルを、282で示された、ベース・レイヤ中の次の垂直周波数成分に対する予測誤差として符号化することができる。同様に、ベース・レイヤのフレーム符号化のマクロブロックの動きベクトルを、第一拡張レイヤの動きベクトルに対する予測因子として使うことができる。
当然ながら、ベース・レイヤからのフレーム符号化マクロブロック・ペアを、第一拡張レイヤのフィールド符号化マクロブロック・ペアに変換する前述の例は、考えられる単なる例である。当然、ベース・レイヤのフィールド符号化マクロブロック・ペアを、第一拡張レイヤのフレーム符号化マクロブロック・ペアに変換することもできる。さらに、特定のマクロブロック・ペアに対するフレーム/フィールド・モード設定を、第一拡張レイヤについては変更しないが、第二またはその後の拡張レイヤについては変更することも可能である。映像の画面品質または精度は、例えば、変換係数レベルを送信するための量子化ステップサイズ幅を小さくし、動きベクトルを定義する解像度を増大し、および/または、より細かいパーティション区画および動き補償のため、より多数の参照画面を使うことによって向上でき、一つのレイヤから次のレイヤへの画面歪みを低減することができる。さらに、インジケータ256および260とは別に、第一拡張レイヤ・データストリーム122a、bによって他のインジケータを送信することもできる。例えば、第一拡張レイヤ・データストリーム122a、bによって、特定のマクロブロックについて、動き情報または残差情報のどちらかだけか、あるいはその双方を置き換えまたはリファインするのかを示すために、インジケータは、第一拡張レイヤ・データストリーム122a、bに入れて送信することができる。同様に、特定のマクロブロックに対する動き精度拡張情報または残差精度拡張情報によって定義するために使われる指標インジケータは、下位レイヤのそれぞれの動き/残差情報を置き換えまたはリファインする。
なお、本発明の好適な実施形態によれば、第一拡張レイヤの変換係数レベルが、現在の拡張レイヤ・データストリーム122a、bに挿入される順序は、設定250の結果による。例えば、現在拡張レイヤで、特定のマクロブロックがフレーム符号化マクロブロックの場合、第一拡張レイヤの変換係数レベルを、残差精度拡張情報266中に挿入する順序を定めるために使われるスキャンパス284は、下位拡張レイヤ中のそれぞれのフィールド符号化マクロブロックの変換係数レベルに対して使われるスキャンパス286とは異なる。フィールド符号化マクロブロックとフレーム符号化マクロブロックとに対するスキャンパスの違いは、フレーム符号化マクロブロックの変換係数マトリックス234の中に、フィールド符号化マクロブロックに比べ高い周波数の垂直成分が存在することを反映している。具体的には、望ましくは、変換係数は、非有意な変換係数、すなわち下位レイヤによる変換係数レベルが0の変換係数に対する変換係数レベルを最初に送信するようにして、残差精度拡張情報266中に送信される。非有意な変換係数の変換係数レベルは、いわゆるシグニフィカント・パスで符号化される。続いて行われる有意な変換係数の変換係数レベルの符号化は、リファインメント・パスと呼ばれる。シグニフィカンス・パスは、数サイクル行われる。例えば、第一サイクルでは、スキャンパス284または286に沿って、第一マクロブロック中の第一変換ブロック(図3aの232参照)中の第一の非有意な変換係数が符号化される。直ぐ続いて、現在の変換ブロック内の次の非有意変換係数の変換係数レベルが、スキャンパス284または286の方向に、変換ブロックのサイズに従い最後まで符号化される。次いで、現在のマクロブロック内のすべての変換ブロックへのアクセスが完了するまで、現在マクロブロック内の変換ブロック・スキャン順番の次の変換ブロックへと移る。この後、現在のスライス内のマクロブロックのスキャン順番の次のマクロブロックに移り、当該マクロブロック内で上記手順が繰り返し実施され、このマクロブロック・スキャン順序は、図2の288で示されている。現在のスライスの最後のマクロブロック中の最後の変換ブロックへのアクセスの後、さらなるサイクルが実施される。非有意な変換係数の変換係数レベルの符号化完了後、重要な変換係数の変換係数レベルがリファインメント・パスで符号化される。リファインメント・パスを、構文要素をビットストリーム126の中に符号化するため用いられる符号化スキームに応じて、例えば、スライス内のマクロブロックらを一回だけスキャンまたは一定のサイクル数スキャンする可変長符号化または算術符号化とすることができ、各々のスキャンは、スキャン順序284または286における特定の変換係数位置に対する専用のスキャンとし、ある特定の変換係数位置に対する個別の変換係数レベルは、該変換係数が有意な場合にだけ符号化される。
シグニフィカンス・パスおよびリファインメント・パスにおいて、それぞれの変換ブロック内の変換係数の間でのアクセス順序を決めるために使われるスキャンパスは、現在のリファインメント・レイヤによるフレーム/フィールド・モードによる。すなわち、第一拡張レイヤ・データストリーム122a、b中の変換係数の順序付けは、得られる第一拡張レイヤ・データストリーム122a、bのレート/歪比に影響を与えることができる、すなわち、状況対応型符号化スキーム(context−adaptive coding scheme)が使われる場合、第一拡張レイヤ中の変換係数レベルの順番を、第一拡張レイヤ・データストリーム122a、b内で、類似の確率分布を持つ変換係数レベルが並列位置に配置されるようにすると、符号化のため用いる確率推定をよりうまく適合させることができる。したがって、設定250および252は、符号化効率、または構文要素の、および特に第一拡張レイヤ中の変換係数レベルの符号化のため使われる、確率推定の質に対するこれら設定の影響に基づいて決めることができる。
リファインメント符号化手段114a、bが、設定250および252を決める仕方を、ブロック110a、bが、ベース・レイヤ符号化ブロック112a、bと共に、ベース・レイヤ・ビットストリーム120a、bを生成する仕方と同様にすることができる。より正確に言えば、レート/歪の面から設定を最適化するために、ラグランジュ・アプローチが用いられる。
図3bに関連させてリファインメント符号化手段114a、bの機能性について説明したので、H.264/MPEG4−AVC規格をより具体的に参照しながら、図1および図3bに関連させて、図1の符号化装置の動作モードを説明する。言い換えれば、H.264/MPEG4−AVC規格のスケーラブル拡張として、スケーラブル・ビットストリーム126を生成する面から、図1の符号化装置の機能性をさらに詳しく説明する。前述の2005年10月のSVC作業草案の中で、スケーラビリティ・ツールは、特に、1に等しいfram_MBS_only_flagに対してだけ使うことができた。すなわち、これらの草案によれば、マクロブロックは、フレーム方式マクロブロックだけであった。SNRおよび空間スケーラビリティをサポートするコンセプトは、プログレッシブ方式のソース・マテリアルに対するものだけデザインされていた。これに対し、図1の符号化装置は、インタレース方式のソース・マテリアルの特性を取り入れることによって、インタレース方式のソースへの拡張を形成する。具体的には、図1の符号化装置は、インタレース方式元信号に関する前記作業草案JVT−Q031中に記載されるような、適応的動きリファインメントを持つプログレッシブ・リファインメント・スライスの符号化を最適化する。動きおよび残差リファインメントに加え、ベース品質レイヤのフレーム/フィールド設定のマクロブロック・ベースでの改定を、FGS拡張レイヤにおいて送信することができる。
具体的には、図1の符号化装置は、マクロブロック適応フレーム/フィールド設定のインタレース方式フレームに対する、適応的リファインメントを持つプログレッシブ・リファインメント・スライスの符号化を拡張し、該拡張においては、マクロブロック適応フレーム/フィールド符号化が有効な場合、符号化フレームのプログレッシブ・リファインメント・スライスのすべてのマクロブロック・ペアまたはマクロブロック・ペアのサブセットに対し、それらマクロブロック・ペアが、ペア・マクロブロックまたはフィールド・マクロブロックまたはフレーム・マクロブロックのいずれとして符号化されるのかを信号伝達する構文要素が送信される。マクロブロック・ペアおよびプログレッシブ・リファインメント・スライスのフレーム/フィールド・モード、ならびに、下位SNRレイヤ中の、同所所在のマクロブロックのペアのフレーム/フィールド・モードに応じ、以下が適用される、(1)現在マクロブロック202a(図3b)が、フィールド−フレーム・モードで符号化され、下位SNRレイヤ(図3bではベース・レイヤ)中の同所所在のマクロブロックのペアが、前記と同じフィールド−フレーム・モードで符号化されている場合(図3bの設定250からスタートしているyes経路を参照)、該SNR下位レイヤのマクロブロック・ペアのフィールド−フレーム設定が用いられる。動きおよび予測情報は、該フィールド−フレーム設定とは関係なく、追加のインジケータまたは構文要素262、268および270による伝達によってリファインすることができる。これに関するさらなる詳細については、PCT/EP2005/010972を参照でき、その内容は、フレーム/フィールド・モード設定が変更なく維持された場合における動き情報およびリファインメント情報のリファインメントに関する参考として、本明細書に組み込まれる。(2)前記と違って、現在スライスにおけるフレーム/フィールド設定が、下位SNRレイヤにおけるフレーム/フィールド設定と異なる場合(250からのyes分岐を参照)、マクロブロック・ペアの双方のマクロブロックに対し、対応する動きおよび予測情報(264)と共に新しいマクロブロック・モード(260)が、残差信号のリファインメント(266)に加えて送信される。可能なマクロブロック・モードは、符号化規格H.264/MPEG4−AVCにサポートされているものと同じであり、このことは、Pスライスについては16動きベクトルまで、Bスライスについては32動きベクトルまでの、動き補償付予測のためのマクロブロックのより小さなブロックへの分割、またはパーティション区画の信号伝達が可能なことを意味する。
プログレッシブ・リファインメント・スライスにおけるこのフレーム/フィールド設定を決める一つのやり方は、ラグランジュ・アプローチを用いることであり、所与のλに対し、ラグランジュのコスト関数J=D+λRが最小化される。ここで、Dは、元の信号と再構築(復号)された信号との間の歪みを表し、Rは、マクロブロック・ペアを符号化するため必要なビットレートを表す。下位SNRレイヤのフレーム/フィールド設定を破棄するコストが、該下位SNRレイヤのフレーム/設定を維持するコストよりも低い場合には、レート−歪の面から、マクロブロック・ペアのフレーム/フィールド設定を破棄して、動きおよび/または予測情報を送信する方が明らかにベターである(設定250のnoの経路を参照)。このように、適応的フレーム/フィールド・リファインメントを用いて、同一のビットレートでより高い画面品質を実現することができる。
図1および3bに関連させて本明細書で提示したFGS符号化スキームの利点は、復号装置側で、各変換ブロックに対する逆変換が一回しか必要でないことである。マクロブロック・ペアが、継続維持されたフレーム/フィールド符号化モードを有する場合においては、ベース品質レイヤのスケールされた変換係数と、関連するすべてのプログレッシブ・リファインメント・スライスとが加算され、得られた利用可能な最高の品質を表現する変換係数に変換することが必要なだけである。また、図1および3bのFGS符号化スキームによれば、適応的リファインメントに関してもこのコンセプトが適用される。適応的動きフレーム/フィールド設定を伴うFGS符号化スキームに対し、復号装置側での複雑さを増大させないために、望ましくは、下位SNRレイヤのフレーム/フィールド設定が変更されるケースに対し特別な制限が導入される。特定のリファインメント・レイヤにおいて適応的リファインメントを伴うFGS符号化スキームを使って、新たなマクロブロックのモードが送信される場合、追加の構文要素residual_prediction_flag信号によって、SNRベース・レイヤ(または下位リファインメント・レイヤ)の残差信号を再構築に使うかどうかが信号伝達される。このフラッグが1に等しい場合、SNRベース・レイヤで送信された変換係数は、拡張レイヤ表現の残差を再構築するために使われる。また、このフラグが0の場合、該拡張レイヤ表現の残差は、FGS拡張レイヤ122a、bで送信された変換係数レベル266だけを使って再構築される。フィールド・マクロブロック・ペアに対し行われる変換は、フレーム・マクロブロック・ペアに対し行われる変換とは異なるサンプル・セットが使われるので、フレーム/フィールド設定が変更された場合には、残差予測を禁止することによって、重複した変換を避ける利点がある。したがって、本発明の好適な実施形態において、前記のSNRベース・レイヤからの残差の使用を規定する構文要素、すなわち構文要素residual_prediction_flagは、SNRベース・レイヤのフレーム/フィールド設定が、SNR拡張レイヤにおいて変更されていないときだけ送信される。それ以外の場合は、復号装置側では、構文要素residual_prediction_flagは0に等しいと推定される。
本発明のある実施形態によれば、フレーム/フィールド設定、およびFGSに対するマクロブロックのモードを規定する構文を、以下の擬似コードで表現することができる。ここでは、以下のコードは、ブロック114a、bによって、前述の構文要素をリファインメント・データストリーム122a、b内に符号化するため実施されるステップを定義している。
(10) …
(12) if(! field_pic_flag && mb_adaptive_frame_field_flag) {
(14) …
(16) mb_field_decoding_flag_EL // frame/field decision in
(18) // enhancement layer
(20) if(mb_field_decoding_flag_EL == mb_field_decoding_flag){
(22) // frame/field decision of is not modified
(24) // top macroblock
(26) change_top_pred_info_flag // modified
(28) // motion/prediction
(30) if( change_top_pred_info_flag){
(32) transmission of macroblock mode, motion and
(34) prediction data
(36) transmission of residual_prediction_flag
(38) }
(40) start transmission of transform coefficient
(42) levels for the top macroblock
(44) // bottom macroblock
(46) change_bot_pred_info_flag // modified
(48) // motion/prediction
(50) if(change_bot_pred_info_flag){
(52) transmission of macroblock mode, motion and
(54) prediction data
(56) transmission of residual_prediction_flag
(58) }
(60) start transmission of transform coefficient
(62) levels for the bottom macroblock
(64) }else {
(66) // frame/field decision is modified
(68) // top macroblock
(70) transmission of macroblock mode, motion and
(72) prediction data
(74) residual_prediction_flag is inferred to be equal
(76) to 0
(78) // bottom macroblock
(80) transmission of macroblock mode, motion and
(82) prediction data
(84) residual_prediction_flag is inferred to be equal
(86) to 0
(88) // coding of transform coefficients
(90) start transmission of transform coefficient
(92) levels for the macroblock pair
(94) }
(96) …
(98) }
第一の条件節(ライン12)は、ベース・レイヤ符号化ブロック112a、bによって、映像のソース・マテリアルは、マクロブロック適応フレーム/フィールド設定が作動されるように、符号化されているかどうかをチェックする。そうなっている場合は、当該拡張レイヤでの該マクロブロック・ペアのフレーム/フィールド設定を定義するために、拡張レイヤ中の現在マクロブロック・ペアまたはいくつかのマクロブロック・ペアに対し、構文要素mb_field_decoding_flag_ELが送信される(ライン16)。第二の条件節(ライン20)は、フレーム/フィールド設定がmb_field_decoding_flag中に符号化されているベース・レイヤに対し、拡張レイヤにおいてフレーム/フィールド設定が変更されているかどうかをチェックする。
次のライン群(ライン22〜62)は、フレーム/フィールド設定が変更されていなかった場合に送信される情報を定義する。この場合、まず、構文要素change_top_pred_info_flagが送信、符号化されて(ライン26)、現在のトップマクロブロックに対する動き/予測情報が、下位レイヤのものから変更されているかどうかを示す。したがって、この構文要素は、図3bに示されたインジケータ260を表す。この場合には(ライン30の第三条件節)、新規マクロブロック・モード、新規動きベクトルおよび参照画面番号が送信される(ライン32および34)。次いで、構文要素residual_prediction_flagの送信は、現在のトップマクロブロックに適用される変換係数レベルが、現在のより粗い量子化済み変換係数をリファインするための自己完結的な新規変換係数またはリファインメント情報として、送信されているかどうかが信号伝達のために行われる(ライン36)。このとき、動き情報が、下位レイヤから取り入れるよう指示されている場合(ライン30の条件節のno経路)、またはresidual_prediction_flagと一緒に、新規の動き情報が送信されている場合(ライン32〜36)、change_top_pred_info_flagがセットされているならば、ライン36で送信されたresidual_prediction_flagに応じ、新規の変換係数レベル情報、または作動符号化された残差変換係数レベルを表す変換係数レベルによって、変換係数レベルの送信が行われる(ライン40、42)。他の場合、すなわち、change_top_pred_info_flagがセットされていない場合、変換係数レベルは、残差変換係数レベルを表す、すなわちresidual_prediction_flagは、差動符号化を示すものと推定される。これは、ボトムマクロブロックに対しても繰り返し実施される(ライン44〜60)。
言い換えれば、本実施形態によれば、フレーム/フィールド設定が変更されない場合、どの場合においても、残差情報の「リファインメント」が行われる。当然、このリファインメントをゼロにすることができ、または「リファインメント」を、それまで送信されてきたビットストリームを使わずに、差動符号化でなく全面的に更改された信号を送信することを意味するものとすることもできる。第一フラグ、すなわち、change_top/bot_pred_info_flagは、残差のリファインメントが「ノーマル・モード」で実施されたのか、すなわち、下位レイヤと同じ動きパラメータが使われ、ベース・レイヤ、および存在する場合下位リファインメント・レイヤによって送信されてきた変換係数に対する差分として、残差リファインメントが符号化されているのかどうかを示す。change_top/bot_pred_info_flagがセットされていない場合、新規の動きパラメータが、送信され(このケースでは差動符号化は使われていないが、前記に示すようにこれも可能である)、追加のフラグ、すなわち、residual_prediction_flagが送信され、このフラグは、今まで使われていた残差が有効かどうかを表す。後者のフラグがセットされる場合、リファインメントは、差分/残差/リファインメントとして符号化され、セットされない場合は、残差信号は全面的に更改され符号化される。
また一方、フレーム/フィールド設定が、ベース・レイヤの設定から変更された場合は、構文要素residual_prediction_flagが信号伝達されることなく、現在のトップマクロブロックに対する新規のマクロブロックのパーティション区画モード、動きベクトル、および参照画面番号が送信され(ライン70、72)、この場合、復号装置側において、該構成要素は0に等しいと推定する(ライン74、76)。同じことがボトムマクロブロックに対して繰り返される(ライン78〜86)。全体のマクロブロック・ペアのトップおよびボトムマクロブロックに対する動き情報の送信を終えた後、現在のマクロブロック・ペアに対する変換係数レベルの送信が開始される(ライン90および92)。当然ながら、10〜92のステップは、さらなるマクロブロック・ペアに対しても同様に実施される。
なお、前記の擬似コードの実施形態に関し、これら変更構文は、フレーム符号化の場合、すなわち、field_pic_flagが0に等しい場合であって、マクロブロック適応フレーム/フィールド符号化が有効の場合、すなわちmb_adaptive_frame_field_flagが1に等しい場合(ライン12)にだけ適用される。さらに、フレーム/フィールド設定は、プログレッシブ・リファインメント・スライスの符号化の過程で、当該マクロブロック・ペアが最初にアクセスされたときにだけ伝送される(ライン16、18)。構文要素がベースSNRレイヤの対応する構文要素と異なる場合には、マクロブロック・モード、動きおよび/または予測情報の新規セットが、マクロブロック・ペアの双方のマクロブロックに対し伝送され(ライン70、72、80、82)、マクロブロック・ペアの双方のマクロブロックに対し、residual_prediction_flagは0に等しいと推定される(ライン74、76、84、86)。加えて、変換サイズを定義する構文要素を送信することもできよう。前述したシグニフィカンス・パスにおいて、トップマクロブロックの第一変換係数レベルから符号化が進む(ライン90、92)。フレーム/フィールド設定を定義する構文要素の値が、ベース品質スライスの対応値と同一の場合、FGS符号化は、前述のPCT出願またはJVT−Q031のコンセプトに従って行われる。該符号化は、トップマクロブロックを進め、最初に、マクロブロック・モードおよび関連する動きおよび予測データの変更を定義する構文要素、change_top_pred_info_flagが送信される(ライン26)。この構文要素が1に等しい場合、新規のマクロブロック・モードおよび関連する動きおよび予測データ、ならびにベース・レイヤからの残差予測の使用を定義するフラグが送信される(ライン32〜36)。次いで、符号化は、シグニフィカント・パスにおけるトップマクロブロックの第一変換係数レベルを進める(ライン40、42)。
引き続くマクロブロック・ペアまたはマクロブロックへのすべてのアクセスにおいて、mb_field_decoding_flag_EL、およびchange_top_pred_info_flagまたはchange_bot_pred_info_flag(適用される場合)、および変更マクロブロック予測モードを定義する対応構文要素が、既に送信されてしまっている場合には、前記した順番で追加の変換係数レベルだけが符号化される。すなわち、構文要素mb_field_decoding_flag_EL(および、対応マクロブロック・ペアに対するマクロブロック予測情報のあり得る変更)は、最初のアクセスのときにだけ送信され、現在プログレッシブ・リファインメント・スライスにおいて、当該マクロブロック・ペア変換係数レベルは送信されない。同様に、構文要素change_top_pred_info_flagまたはchange_bot_pred_info_flag、およびマクロブロック予測情報の変更内容は、mb_field_decoding_flag_ELが、SNRベース・レイヤ中の同所所在のマクロブロックのペアのmb_field_decoding_flagと等しく、当該マクロブロックへの最初のアクセスであり、該マクロブロックに対し、変換係数レベルがまだ送信されていないときにだけ送信される。
図4に関連して、スケーラブル・ビットストリーム126の復号するために、復号装置により実施されるステップが説明される。復号装置は、ステップ800において、スケーラブル・ビットストリーム126中に含まれるベース・レイヤ・ビットストリーム122aおよび122bの構文解析から作業開始する。ステップ800の結果として、復号装置は、各マクロブロック・ペアに対するフィールド/フレーム・モード、各マクロブロックに対する動きパラメータ、および存在する残差情報を把握する。すなわち、ステップ800において、復号装置は、ベース・レイヤ・データストリーム122a、bから情報214、240、および242を抽出する。次のステップ、ステップ802において、復号装置は、さらなるリファインメントまたは品質拡張が、要求/必要とされているかどうかをチェックする。必要ない場合、復号装置は、そのまま復号ステップ804に進みベース・レイヤ・データストリーム122a、bを復号する。要求/必要とされる空間解像度によって、復号804は、H.264/MPEG4−AVC規格に従ってベース・レイヤ・ビットストリーム120bだけが復号されるか、または、同規格に従ってベース・レイヤ・ビットストリーム120a、bの両方が復号され、次いで、粗く再構築された画面は、より細密に再構築された画面へとリファインされる。
さらなるリファインメントが要求/必要な場合、復号装置はステップ806に移行し、フレーム/フィールド・モード変更表示(mb_field_decoding_flag)および、変更が指示されていない場合には、動き拡張オン/オフ指示(change_*_pred_info_flag)が、次により高位のリファインメント・レイヤ・ビットストリーム122a、bから抽出される。ステップ806において、復号装置は、現在のリファインメント・レイヤ中のマクロブロック・ペアらのフレーム/フィールド・モード、およびベース・レイヤまたは下位レイヤ中の変換係数レベルの有意性から、現在リファインメント・レイヤに対して、符号化装置側で使われたシグニフィカンス・パスおよびリファインメント・パスを再構築することができる。これにより、次のステップ808において、復号装置は、現在の動き情報の置き換えを示す動き拡張オン/オフ指示を有するすべてのマクロブロック、および変更されたフレーム/フィールド・モード設定を有するすべてのマクロブロックに対する動き情報を抽出するために、ならびに、change_*_pred_info_flagがセットされている場合には、リファインメント・データストリームから構文解析された、またはchange_*_pred_info_flagがセットされていない場合には、差動符号化を示すために推定された、residual_prediction_flagに応じ、差動符号化された残差情報、または自己完結的残差情報を表す残差情報とを抽出するために、リファインメント・レイヤを構文解析し、次いで、ステップ810において、復号装置は、各マクロブロック・ペアに対し、フレーム/フィールド・モードが下位レイヤのものから変更されているかどうかをチェックする。yesの場合は、復号装置は、ステップ812に移行し、residual_prediction_flagが0に等しいと推定されるので、現在の符号化データ、すなわち、現在の動き/残差データを、現在の拡張レイヤの拡張レイヤ・データストリームから抽出した動き/リファインメント情報264および266と置き換える。また一方、フレーム/フィールド・モードが変更されていないすべてのマクロブロック・ペアに対して、復号装置は、動き拡張オン/オフ・インジケータ、すなわち、構文要素change_bot_pred_info_flagをチェックし、マクロブロック・ペアのそれぞれのマクロブロックに対する動き拡張情報264または266が存在しないかどうかを点検する。存在する場合、復号装置は、当該マクロブロックに対する現在の動きデータ、すなわち、動き情報を置き換え(別の実施形態ではリファインし)、また、着信データストリーム中に送信されてきた、それぞれのフラグ、すなわち、residual_prediction_flagに応じ、当該マクロブロックに対する残差データを置き換えまたはリファインする。さらに正確に言えば、前記擬似コードよって拡張レイヤ・データストリームを復号する場合には、動き情報は、必ず置き換えられ、フレーム/フィールド設定が変更されていない場合には、残差情報は、ある特定のインジケータ、前述の擬似コード拡張レイヤ・データストリームの場合であれば、residual_prediction_flagに基づいて、置き換えられるかリファインされる。置き換える場合には、拡張レイヤに含まれる特定のマクロブロックに対する動き情報は、下位レイヤの動き情報を全面的に置き換えたものとなる。リファインメントの場合には、下位レイヤの情報は、拡張レイヤ中のそれぞれの情報と組み合わされる。特に、拡張レイヤの変換係数レベルは、逆量子化され、既に逆量子化またはスケールされた(および最終的に合算された)下位レイヤの対応変換係数の変換係数レベルに加算される。
他の場合、すなわち、動き拡張オン/オフ・インジケータは、拡張レイヤが個別のマクロブロックに対する動き拡張情報を持たないことを示している場合、当該マクロブロックに対する動きデータに関する変更は行われないが、復号装置は、ステップ818において、それまでに着信データストリームから得られた現在の変換係数の組み合わせと、現在リファインメント・レイヤ残差データからの、リファインのための(逆量子化を介した)リファインメント情報、すなわち、狭められた量子化ステップサイズ幅により定義された変換係数レベルとを使って、残差データをリファインする。
上記の後、すなわち、現在の画面のすべてのマクロブロックに対し、ステップ812,816、および818のどれかを実施した後、手順は、さらなるリファインメントが要求/必要かどうかをチェックするために、ステップ802に戻る。yesの場合、次のリファインメント・レイヤに対し、ステップ806〜818が繰り返し実施される。noの場合、手順はステップ804に進み、現在の符号データが復号され、すなわち、逆スペクトル分解などの再変換が行われ、現在の動き情報を使うことにより、マクロブロックの画面コンテンツが予測され、既に再構築されている参照画面、および再変換と前記により得られた予測と組み合わせから得られた残差情報に基づいて、再構築された形の現在画面が生成される。
前記の実施形態を要約すれば、これらは、以下の特質を備えたFGS符号化スキームを表している。第一には、上下に隣り合ったマクロブロックのペアが、フレームのペア、またはフィールド・マクロブロックのペアのいずれかに符号化される、マクロブロック適応フレーム/フィールド設定を持つフレームに対する符号化がサポートされている。さらに、ベースSNRレイヤのマクロブロック・ペアに対するフレーム/フィールド設定は、FGS拡張レイヤにおいて状況に応じ変更することができる。該FGS拡張レイヤに対するフレーム/フィールド設定は、FGS拡張レイヤ中の各マクロブロック・ペアまたはマクロブロック・ペアのサブセットに対する構文要素によって信号伝達することができる。フレーム/フィールド設定が信号伝達されないマクロブロック・ペアについては、既に送信されている構文要素を使うことによって、フレーム/フィールド設定が推定される。一つの実施形態において、拡張レイヤ中のフレーム/フィールド設定が、SNRベース・レイヤのフレーム/フィールド設定と異なる場合は、マクロブロックの動きおよび予測情報の完全なセットが送信される。拡張レイヤ中のフレーム/フィールド設定が、SNRベース・レイヤのフレーム/フィールド設定と異なる場合は、SNRベース・レイヤからの残差予測の使用を規定している構文要素はXに等しいと予測することができる。前記のXの値は、残差予測が適用されず、再構築された残差信号が、現在FGS拡張レイヤの変換係数レベルだけを使って得られたものであることを規定する。これに代えて、拡張レイヤにおけるマクロブロック・ペアのフレーム/フィールド設定が、SNRベース・レイヤのフレーム/フィールド設定と同一場合に、マクロブロック・ペアの双方のマクロブロックに対し構文要素を送ることもできる。この構文要素で、新規のマクロブロックの動きおよび/または予測情報をFGS拡張レイヤで送信するかどうか、またはSNRベース・レイヤ中の同所所在のマクロブロックの動きおよび/または予測情報を用いるかどうかを規定することができる。フィールド・マクロブロックに対する動き補償は、フィールド・ベースで行われ、フレーム・マクロブロックに対する動き補償は、フレーム・ベースで行われる。同様に、フィールド・マクロブロックに対する逆変換は、フィールド・ベースで行うことができ、フレーム・マクロブロックに対する逆変換はフレーム・ベースで行うことができる。さらに同様に、変換ブロック内の変換係数のスキャン順序は、対象マクロブロックが、フィールド・マクロブロックまたはフレーム・マクロブロックのどちらであるかによって決まる。
終わりに、マクロブロック・ペアのフレーム/フィールド・モードを規定するための構文要素を、条件エントロピ符号を使って送信することができ、該条件は、SNRベース・レイヤ中の同所所在マクロブロック・ペアフレーム/フィールド・モードにより決まる。例えば、構文要素258を、ベース・レイヤ中のフィールド/フレーム・モード設定212に依存する確率推定を用いたエントロピ符号を使って送信することができる。
最後に、前述の実施形態は、特にH.264/MPEG4−AVC規格に関連するものであった。しかしながら、本発明は、他の符号化スキームに対しても適用が可能である。
実際の実行形態に応じて、本発明の符号化スキームをハードウエアまたはソフトウエアに実装することができる。したがって、本発明は、CD、ディスク、または任意の他のデータ・キャリヤのような、コンピュータ可読の媒体に格納することが可能なコンピュータプログラムにも関係する。それ故に、本発明は、コンピュータで実行されると、前記の図に関連させて説明した本発明の方法実施するプログラム・コードを備えたコンピュータプログラムもある。
さらになお、流れ図に示されたすべてのステップを個別の手段で実行することができ、該実行には、CPU、ASICの回路部分などで実行されるサブルーチンを含めることができる。
特定の実施形態を参照して、本発明を具体的に提示、説明しているが、本発明の精神および範囲から逸脱することなく、これらの形態および細部に多様な変更を加えることができることを、当業者は理解していよう。本明細書に開示され、添付特許請求範囲に包括される広義の概念から逸脱することなく、各種の実施形態に合わせて、さまざまな変更を加えることができるのを理解されよう。
本発明の実施形態による映像符号化装置のブロック図である。 画面のマクロブロック・ペアへのサブ分割、およびマクロブロック適応フレーム/フィールド設定を持つ符号化フレームのスライスがアクティブな場合の、プログレッシブ・リファインメント・スライスのマクロブロックのスキャンを示す概略図である。 ベース・レイヤ・データストリームの生成に関連し、図1の符号化装置の動作のモードを示す概略ブロック図である。 第一拡張レイヤの生成に関連し、図1の符号化装置の動作のモードを示す概略ブロック図である。 本発明の実施形態による、復号装置側において実施されるステップを示すフローチャートである。 スケーラブル映像符号化のための従来型の符号化装置の構造である。

Claims (23)

  1. 所定画面(200)を符号化する符号化された精度スケーラブル・データストリーム(126)を復号するための復号装置であって、前記符号化された精度スケーラブル・データストリームは、
    前記所定画面の所定部分(202a、b)のために、フレーム符号化モードおよびフィールド符号化モードのうちの一方を使用して、前記所定画面が、第一精度で符号化される、第一精度符号化データ(120a、b)と、
    前記所定部分(202a、b)のために、前記フレーム符号化モードおよび前記フィールド符号化モードのうちの他方を使用して、前記所定部分が、前記第一精度より高い第二精度で符号化され、前記符号化された所定部分を含む第二精度符号化データを表すか、または前記第二精度符号化データを得るために、前記第一精度符号化データをリファインするリファインメント情報を表すさらに高精度の情報(122a、b)と、
    前記第一精度符号化データと前記第二精度符号化データとの間で、前記所定部分に使用される前記フレームおよびフィールド符号化モードの変更があることを表す指示情報(256)とを含み、
    前記復号装置は、
    前記指示情報が、前記第一精度符号化データと前記第二精度符号化データとの間で前記所定部分に使用される前記フレームおよびフィールド符号化モードの変更があることまたはないことを表示しているかどうかについて、前記指示情報をチェックするためのチェック手段(810)と、
    前記指示情報が、前記フレームおよびフィールド符号化モードの変更があること表示している場合、前記所定部分に関する前記第一精度符号化データを少なくとも部分的に無視し、その代わりに、復号のためのデータとして前記第二精度符号化データを準備するか、あるいは、前記さらに高精度の情報に基づいて、前記第二精度符号化データを得るために、前記所定部分に関する前記第一精度符号化データをリファインし、そして復号のためのデータとして前記得られた第二精度符号化データを準備する、準備手段(810〜816)と、
    前記第二精度で前記所定画面を再構築するために、前記所定画面の前記所定部分のために、フレームおよびフィールド符号化モードのうちの他方使用して、前記準備されたデータを復号するための復号手段(804)とを含む、復号装置。
  2. 前記第一精度符号化データおよび前記さらに高精度の情報を実現するために、前記符号化された精度スケーラブル・データストリームを構文解析するための構文解析手段(800〜808)をさらに含む、請求項1に記載の復号装置。
  3. 前記構文解析手段は、前記指示情報に基づいて前記さらに高精度の情報の前記構文解析を行うよう構成されている、請求項2に記載の復号装置。
  4. 前記所定画面は映像画面シーケンス(104)の一部であり、前記復号手段は、復号のための前記データから、前記所定部分に対する動き情報および個別残差情報を抽出し、前記所定部分に対する動き補償付予測を得るために前記動き情報を再構築参照画面に適用し、そして、前記動き補償付予測と前記残差情報とに基づいて前記所定部分を再構築するために構成されている、請求項1ないし請求項3のいずれかに記載の復号装置。
  5. 前記復号手段は、前記残差情報を抽出するために、逆スペクトル分解を行うよう構成されている、請求項4に記載の復号装置。
  6. 前記復号手段は、前記指示情報に基づき、前記動き情報の前記適用および前記所定部の前記再構築を実施するよう構成されている、請求項4または請求項5に記載の復号装置。
  7. 前記準備手段(810〜816)は、前記復号装置に対する指示が、前記所定画像を前記第一精度だけで再構築することを伝えるものである場合には、前記第二精度符号化データを無視し、復号のためのデータとして前記第一精度符号化データを準備するために構成されている、請求項1ないし請求項6のいずれかに記載の復号装置。
  8. 前記準備手段(810〜816)は、前記指示情報が、前記第一精度符号化データと前記第二精度符号化データとの間で前記所定部分のために、前記フレームおよびフィールド符号化モード前記変更がないことを表示している場合には、前記所定部分に関し前記第一精度符号化データをリファインするかどうかについて、前記符号化された精度スケーラブル・データストリーム中のリファインメント変更情報(260)をチェック(814)し、前記チェックの結果に応じ、前記所定部分に関し、前記復号対象データとして前記第一精度符号化データを維持するか、または前記第二精度符号化データを得るために、前記高精度情報に基づいて前記第一精度符号化データをリファイン(816)し、前記復号対象データとして前記得られた第二精度符号化データを準備するよう構成されている、請求項1ないし請求項7のいずれかに記載の復号装置。
  9. 前記指示情報は、前記所定部分に関する第一構文要素によって伝達され、前記所定画面は別の所定部分を含み、前記さらに高精度の情報は、前記第一精度符号化データと前記第二精度符号化データとの間で、前記別の所定部分に関する前記フレームおよびフィールド符号化モードの変更がないことまたはあることを伝達するための、前記別の所定部分に関するいかなる第二構文要素をも持たず、前記チェック手段は、前記さらに高精度の情報の中の既に送信されている構文要素を使うことにより、前記第二構文要素の値を推定するために構成されている、請求項1ないし請求項8のいずれかに記載の復号装置。
  10. 第二チェック手段をさらに含み、該手段は、前記指示情報が、前記第一精度符号化データと前記第二精度符号化データとの間で、前記所定部分に関する前記フレームおよびフィールド符号化モードの変更がないことを示している場合、前記第二精度符号化データが動き情報および残差情報のうちの少なくとも一方を含むかどうか、前記所定部分に関連して、前記第一精度符号化データで前記第二精度符号化データが置き換えられるのか、またはチェック結果を得るために、前記第二精度符号化データが、前記第二精度符号化データを得るように前記第一精度符号化データをリファインするために設けられるかどうかについて、前記さらに高精度の情報からなる下位情報(260)をチェックして、前記準備手段は、前記チェック結果に基づいて、前記動き情報または残差情報に関し、前記無視および準備、または前記リファインおよび準備を実施するよう構成されている、請求項1ないし請求項9のいずれかに記載の復号装置。
  11. 前記第二精度符号化データは、前記所定部分の少なくとも一部の動き補償付残差を表す変換係数マトリックスの変換係数に対する変換係数レベルを含み、前記構文解析手段は、前記変換係数の間でのスキャン順序を使用するよう準備され、前記スキャン順序は、前記指示情報に応じ、第一スキャン順序および前記第一スキャン順序とは異なる第二スキャン順序の一つに等しい、請求項1ないし請求項10のいずれかに記載の復号装置。
  12. 前記準備手段と復号手段とは、前記指示情報(256)が、前記第一精度符号化データと前記第二精度符号化データとの間で、前記所定部分のために、前記フレームおよびフィールド符号化モード前記変更があることを示している場合、前記動き補償付残差を得るために、前記変換マトリックスに逆変換を適用し、前記動き補償付残差と、フィールドまたはフレーム符号化モードを使用して符号化される再構築参照画面の部分とを組み合わせ、前記フレーム符号化モードおよびフィールド符号化モードうちの他方が、フレーム符号化モードである場合において、前記再構築画面と等しい再構築画面候補を得るために、前記さらに高精度の情報または前記第一精度符号化データに示された動き情報によって、前記所定部分から変位され、そして、前記フレームおよびフィール符号化モードうちの他方フィールド符号化モードである場合においては、前記再構築画面を得るために、前記再構築画面候補をフレーム表現からフィールド表現に変換するように構成されている、請求項11に記載の復号装置。
  13. 所定画面を符号化するための符号化装置であって、
    第一精度符号化データ(120a、b)を得るために、前記所定画面の所定部分(202a、b)のために、フレーム符号化モードおよびフィールド符号化モードのうちの一方を使用して、前記所定画面を第一精度で符号化するためのベース符号化手段(110a、b、112a、b)と、
    フレーム符号化モードおよびフィールド符号化モードのうちの他方を使用して、前記所定部分が、前記第一精度より高い第二精度で符号化され、前記符号化された所定部分を含む第二精度符号化データを表すか、または前記第二精度符号化データを得るために、前記第一精度符号化データをリファインするリファインメント情報を表す、さらに高精度の情報(120a、b)を設定するための設定手段(114a、b)と
    前記所定画面を符号化している符号化された精度スケーラブル・データストリーム(126)を構築するための構築手段(124)であって、該ストリームは、前記第一精度符号化データ(120a、b)、前記さらに高精度の情報(122a、b)、および、前記第一精度符号化データと前記第二精度符号化データとの間で、前記所定部分に使用される前記フレームおよびフィールド符号化モードの変更を示す指示情報(256)を包含する、構築手段とを含む、符号化装置。
  14. 前記所定画面は、別の所定部分をさらに含み、前記さらに高精度の情報は、前記別の所定部分が、前記第二精度およびフレームおよびフィールド符号化モードのうちの一方を使用して符号化され、前記符号化された別の所定部分を含む別の第二精度符号化データも表すか、または、前記別の所定部分が、前記第一精度で符号化される別の第一精度符号化データリファインする別の個別リファインメント情報表しており、前記設定手段は、前記第二精度符号化データを、同データが前記所定部分の動き補償付残差を表す第一変換係数マトリックスの変換係数に対する第一変換係数レベルを含むように設定し、前記別の第二精度符号化データを、同データが前記別の所定部分の動き補償付残差を表す第二変換係数マトリックスの変換係数に対する第二変換係数レベルを含むように設定するよう構成されており、前記構築手段は、前記第一変換係数レベルを、前記第一変換係数マトリックスの前記変換係数の間での第一スキャン順序に従って、前記符号化された精度スケーラブル・データストリームに符号化し、前記第二変換係数レベルを、前記第二変換係数マトリックスの前記変換係数の間での前記第一スキャン順序とは異なる第二スキャン順序に従って、前記符号化された精度スケーラブル・データストリームに符号化するために構成されている、請求項13に記載の符号化装置。
  15. 前記構築手段は、前記指示情報に基づいて前記さらに高精度の情報が正しく構文解析されるようにして前記構築を行うために構成されている、請求項13または請求項14に記載の符号化装置。
  16. 前記所定画面は、映像画面シーケンス(104)の一部であり、前記ベース符号化手段と前記設定手段とは、前記第二精度符号化データ、前記符号化された精度スケーラブル・データストリームから、前記所定部分に対する動き情報および個別残差情報のうちの少なくとも一方を得ることと、前記所定部分に対する動き補償付予測を得るために、前記動き情報を既に符号化され再構築された参照画面に適用し、そして、前記動き補償付予測および前記残差情報に基づき前記所定部分を再構築することとが可能になるよう設計されている、請求項13ないし請求項15のいずれかに記載の符号化装置。
  17. 前記ベース符号化手段と前記設定手段とは、前記残差情報を抽出するために逆スペクトル分解が実施されなければならないように構成されている、請求項16に記載の符号化装置。
  18. 前記ベース符号化手段と前記設定手段とは、前記指示情報に基づいて前記動き情報の前記適用および前記所定部分の前記再構築が実施されなければならないように構成されている、請求項16または請求項17に記載の符号化装置。
  19. 前記構築手段(114a、b)は、前記第一精度符号化データと前記第二精度符号化データとの間で、前記所定画面の別の所定部分に使用される前記フレームおよびフィールド符号化モードの前記変更ないことを前記指示情報が示すよう構成され、前記構築手段と前記設定手段とは、前記別の所定部分に関し前記第一精度符号化データがリファインされるのかどうかを示すリファインメント変更情報(260)を前記符号化された精度スケーラブル・データストリームが含み、前記さらに高精度の情報が、前記第二精度で前記所定部分を符号化している別の第二精度符号化データを得るために、前記別の所定部分に関し前記第一精度符号化データをリファインするさらなるリファインメント情報を追加して表すように構成されている、請求項13ないし請求項18のいずれかに記載の符号化装置。
  20. 前記構築手段(114a、b)は、前記第一精度符号化データと前記第二精度符号化データとの間で、前記所定画面の別の所定部分に使用される前記フレームおよびフィールド符号化モードの前記変更がないことを前記指示情報が示すよう構成され、前記構築手段と前記設定手段とは、前記符号化された精度スケーラブル・データストリームが前記さらに高精度の情報からなる下位情報(260)を含むように構成され、該下位情報は、前記さらに高精度の情報が前記別の所定部分に対する動き情報および残差情報のうちの少なくとも一方を包含する別の第二精度符号化データを含むかどうかを示し、前記所定部分に関し前記第一精度符号化データに前記別の第二精度符号化データが置き換えられるのか、または前記別の第二精度符号化データは、前記第二精度符号化データを得るために、前記別の所定部分に関し前記第一精度符号化データをリファインするために設けられるかどうかを示す、請求項13ないし請求項19のいずれかに記載の符号化装置。
  21. 符号化された所定画面を有する精度スケーラブル・ビットストリームであって、前記精度スケーラブル・ビットストリームは、
    前記所定画面の所定部分(202a、b)のために、フレームおよびフィールド符号化モードのうちの一方を使用して前記所定画面が、第一精度で符号化される、精度符号化データ(120a、b)と、
    前記所定部分(202a、b)のために、前記フレームおよびフィールド符号化モードのうちの他方を使用して、前記所定部分(202a、b)が、第一精度より高い第二精度で符号化され、前記符号化された所定部分を含む第二精度符号化データを表すか、または前記第二精度符号化データを得るために、前記第一精度符号化データをリファインするファインメント情報を表すさらに高精度の情報(122a、b)と、
    前記第一精度符号化データと前記第二精度符号化データとの間で前記フレームおよびフィールド符号化モードの変更があることを示す指示情報(256)とを含む、ビットストリーム。
  22. 所定画面(200)を符号化した符号化された精度スケーラブル・データストリーム(126)を復号する方法であって、前記符号化された精度スケーラブル・データストリームは、
    前記所定画面の所定部分(202a、b)のために、フレーム符号化モードおよびフィールド符号化モードのうちの一方を使用して、前記所定画面が、第一精度で符号化される、第一精度符号化データ(120a、b)と、
    前記所定部分(202a、b)のために、前記フレーム符号化モードおよび前記フィールド符号化モードのうちの他方を使用して、前記所定部分(202a、b)が、前記第一精度より高い第二精度で符号化され、前記符号化された所定部分を含む第二精度符号化データを表すか、または前記第二精度符号化データを得るために、前記第一精度符号化データをリファインするリファインメント情報を表すさらに高精度の情報(122a、b)と、
    前記第一精度符号化データと前記第二精度符号化データとの間で、前記所定部分に使用される前記フレームおよびフィールド符号化モードの変更があることを表す指示情報(256)とを含み、
    前記方法は、
    前記指示情報が、前記第一精度符号化データと前記第二精度符号化データとの間で前記所定部分に使用される前記フレームおよびフィールド符号化モードの変更があることまたはないことを表示しているかどうかについて、前記指示情報をチェックするステップ(810)と、
    前記指示情報が、前記フレームおよびフィールド符号化モードの変更があることを表している場合、(810〜816)前記所定部分に関し前記第一精度符号化データを少なくとも部分的に無視し、その代わりに、復号のためのデータとして前記第二精度符号化データを準備するか、あるいは、前記さらに高精度の情報に基づいて、前記第二精度符号化データを得るために、前記所定部分に関する前記第一精度符号化データをリファインし、そして復号のためのデータとして前記得られた第二制度符号化データ準備するステップと、
    前記第二精度で前記所定画面を再構築ために、前記所定画面の前記所定部分のために、フレームおよびフィールド符号化モードのうちの他方使用して、前記準備されたデータを復号するステップ(804)とを含み、ハードウェアにより実行される、方法。
  23. 所定画面を符号化する方法であって、
    所定画面(200)の所定部分(202a、b)のために、フレーム符号化モードおよびフィールド符号化モードのうちの一方を使用して、第一精度符号データ(120a、b)を得るために、前記所定画面が第一精度で符号化されるステップと、
    フレーム符号化モードおよびフィールド符号化モードのうちの他方を使用して、前記所定部分が、前記第一精度より高い第二精度で符号化される、第二精度符号化データを表すか、または前記第二精度符号化データを得るために、前記第一精度符号化データをリファインするリファインメント情報を表す、さらに高精度の情報(120a、b)を設定するステップと
    前記所定画面を符号化している符号化され精度スケーラブル・データストリーム(126)を構築するステップであって、該ストリームは、前記第一精度符号化データ(120a、b)、前記さらに高精度の情報(122a、b)、および前記第一精度符号化データと前記第二精度符号化データとの間で前記所定部分に使用される前記フレームおよびフィールド符号化モードの変更を示す指示情報(256)を包含する、構築するステップとを含み、ハードウェアにより実行される、方法。
JP2008505762A 2006-03-22 2006-03-22 精度スケーラビリティを可能にする符号化スキーム Expired - Lifetime JP4876122B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2006/002634 WO2007107170A1 (en) 2006-03-22 2006-03-22 Coding scheme enabling precision-scalability

Publications (2)

Publication Number Publication Date
JP2008533949A JP2008533949A (ja) 2008-08-21
JP4876122B2 true JP4876122B2 (ja) 2012-02-15

Family

ID=37696248

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008505762A Expired - Lifetime JP4876122B2 (ja) 2006-03-22 2006-03-22 精度スケーラビリティを可能にする符号化スキーム

Country Status (5)

Country Link
US (1) US8428143B2 (ja)
EP (1) EP1859630B1 (ja)
JP (1) JP4876122B2 (ja)
BR (1) BRPI0608004B1 (ja)
WO (1) WO2007107170A1 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2084913B1 (en) 2006-10-25 2019-02-20 GE Video Compression, LLC Quality scalable coding
US8243798B2 (en) * 2006-12-20 2012-08-14 Intel Corporation Methods and apparatus for scalable video bitstreams
KR101365597B1 (ko) * 2007-10-24 2014-02-20 삼성전자주식회사 영상 부호화장치 및 방법과 그 영상 복호화장치 및 방법
DK2835976T3 (en) * 2008-04-16 2016-12-05 Ge Video Compression Llc Bit depth scalability
KR101233627B1 (ko) * 2008-12-23 2013-02-14 한국전자통신연구원 스케일러블 부호화 장치 및 방법
US20110002391A1 (en) * 2009-06-11 2011-01-06 Motorola, Inc. Digital image compression by resolution-adaptive macroblock coding
US20110002554A1 (en) * 2009-06-11 2011-01-06 Motorola, Inc. Digital image compression by residual decimation
DE102009039095A1 (de) * 2009-08-27 2011-03-10 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Erzeugen, Decodieren und Transcodieren eines codierten Videodatenstroms
JP2011109469A (ja) * 2009-11-18 2011-06-02 Canon Inc コンテンツ受信装置及びコンテンツ受信装置の制御方法
WO2011127964A2 (en) * 2010-04-13 2011-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for intra predicting a block, apparatus for reconstructing a block of a picture, apparatus for reconstructing a block of a picture by intra prediction
BR112013001354B1 (pt) 2010-07-21 2022-03-29 Velos Media International Limited Método e dispositivo para codificação de imagem
US9497472B2 (en) * 2010-11-16 2016-11-15 Qualcomm Incorporated Parallel context calculation in video coding
US9049444B2 (en) 2010-12-22 2015-06-02 Qualcomm Incorporated Mode dependent scanning of coefficients of a block of video data
US20120163456A1 (en) 2010-12-22 2012-06-28 Qualcomm Incorporated Using a most probable scanning order to efficiently code scanning order information for a video block in video coding
US9490839B2 (en) 2011-01-03 2016-11-08 Qualcomm Incorporated Variable length coding of video block coefficients
JP5982734B2 (ja) * 2011-03-11 2016-08-31 ソニー株式会社 画像処理装置および方法
US20130083856A1 (en) * 2011-06-29 2013-04-04 Qualcomm Incorporated Contexts for coefficient level coding in video compression
US9445093B2 (en) * 2011-06-29 2016-09-13 Qualcomm Incorporated Multiple zone scanning order for video coding
US9516316B2 (en) 2011-06-29 2016-12-06 Qualcomm Incorporated VLC coefficient coding for large chroma block
US9338456B2 (en) 2011-07-11 2016-05-10 Qualcomm Incorporated Coding syntax elements using VLC codewords
US9584819B2 (en) * 2011-10-24 2017-02-28 Qualcomm Incorporated Grouping of tiles for video coding
RS64003B1 (sr) * 2012-04-13 2023-03-31 Ge Video Compression Llc Kodiranje slike sa niskim kašnjenjem
US20130287109A1 (en) * 2012-04-29 2013-10-31 Qualcomm Incorporated Inter-layer prediction through texture segmentation for video coding
KR102659283B1 (ko) 2012-06-29 2024-04-22 지이 비디오 컴프레션, 엘엘씨 비디오 데이터 스트림 개념
EP4593395A3 (en) * 2012-10-01 2025-10-01 GE Video Compression, LLC Scalable video coding using inter-layer prediction contribution to enhancement layer prediction
US9756613B2 (en) 2012-12-06 2017-09-05 Qualcomm Incorporated Transmission and reception timing for device-to-device communication system embedded in a cellular system
US9380305B2 (en) * 2013-04-05 2016-06-28 Qualcomm Incorporated Generalized residual prediction in high-level syntax only SHVC and signaling and management thereof
US9807421B2 (en) * 2013-04-05 2017-10-31 Sharp Kabushiki Kaisha NAL unit type restrictions
US20150016502A1 (en) * 2013-07-15 2015-01-15 Qualcomm Incorporated Device and method for scalable coding of video information
FR3011429A1 (fr) * 2013-09-27 2015-04-03 Orange Codage et decodage video par heritage d'un champ de vecteurs de mouvement
US10547834B2 (en) * 2014-01-08 2020-01-28 Qualcomm Incorporated Support of non-HEVC base layer in HEVC multi-layer extensions
TWI625955B (zh) * 2016-10-12 2018-06-01 國立清華大學 合作式多媒體通訊方法及其系統
US11962782B2 (en) * 2018-01-29 2024-04-16 Interdigital Vc Holdings, Inc. Encoding and decoding with refinement of the reconstructed picture
KR20250079887A (ko) * 2023-11-27 2025-06-04 한국전자통신연구원 계층적 양자화에 기반한 잠재 표현 부호화/복호화 방법 및 이를 기록한 컴퓨터로 판독 가능한 기록 매체

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4974171A (en) 1989-08-03 1990-11-27 Eastman Kodak Company Page buffer system for an electronic gray-scale color printer
US5144424A (en) 1991-10-15 1992-09-01 Thomson Consumer Electronics, Inc. Apparatus for video data quantization control
US5533173A (en) 1991-10-21 1996-07-02 Polaroid Corporation Method and apparatus for processing a color map using discrete cosine transforms
DE4310727C2 (de) 1992-04-06 1996-07-11 Hell Ag Linotype Verfahren und Einrichtung zur Analyse von Bildvorlagen
US5253055A (en) 1992-07-02 1993-10-12 At&T Bell Laboratories Efficient frequency scalable video encoding with coefficient selection
US5671298A (en) 1994-08-30 1997-09-23 Texas Instruments Incorporated Image scaling using cubic filters
JP3600372B2 (ja) 1995-06-27 2004-12-15 株式会社リコー 色再現域補正装置および方法
US6094454A (en) 1997-06-19 2000-07-25 International Business Machines Corporation Multi-spectral image compression and transformation
US6658056B1 (en) * 1999-03-30 2003-12-02 Sony Corporation Digital video decoding, buffering and frame-rate converting method and apparatus
JP3975629B2 (ja) * 1999-12-16 2007-09-12 ソニー株式会社 画像復号装置及び画像復号方法
JP2002247375A (ja) 2001-02-15 2002-08-30 Canon Inc 画像符号化装置及びその方法並びにプログラムコード、記憶媒体
JP4576770B2 (ja) 2001-08-03 2010-11-10 セイコーエプソン株式会社 画像ファイルの生成
US7092573B2 (en) 2001-12-10 2006-08-15 Eastman Kodak Company Method and system for selectively applying enhancement to an image
JP4015934B2 (ja) * 2002-04-18 2007-11-28 株式会社東芝 動画像符号化方法及び装置
JP2004112566A (ja) 2002-09-20 2004-04-08 Ricoh Co Ltd 画像処理装置、画像処理方法、画像処理プログラム、及び画像処理プログラムを記憶する記憶媒体
JP2004328634A (ja) * 2003-04-28 2004-11-18 Sony Corp 画像復号化装置及び方法
US7924921B2 (en) * 2003-09-07 2011-04-12 Microsoft Corporation Signaling coding and display options in entry point headers
US20050129130A1 (en) 2003-12-10 2005-06-16 Microsoft Corporation Color space coding framework
KR100596705B1 (ko) * 2004-03-04 2006-07-04 삼성전자주식회사 비디오 스트리밍 서비스를 위한 비디오 코딩 방법과 비디오 인코딩 시스템, 및 비디오 디코딩 방법과 비디오 디코딩 시스템
US20050259730A1 (en) 2004-05-18 2005-11-24 Sharp Laboratories Of America, Inc. Video coding with residual color conversion using reversible YCoCg
KR20050113501A (ko) 2004-05-29 2005-12-02 삼성전자주식회사 에이치 264 비디오 디코더를 위한 구문 분석기
EP1756950B1 (en) * 2004-06-07 2009-04-29 Agency for Science, Technology and Research Systems and methods for scalably encoding and decoding data
KR100763178B1 (ko) * 2005-03-04 2007-10-04 삼성전자주식회사 색 공간 스케일러블 비디오 코딩 및 디코딩 방법, 이를위한 장치
WO2007042063A1 (en) * 2005-10-12 2007-04-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Video codec supporting quality-scalability
CN101356825B (zh) 2006-01-13 2013-06-12 弗劳恩霍夫应用研究促进协会 使用自适应色彩空间变换的画面编码

Also Published As

Publication number Publication date
US20080002767A1 (en) 2008-01-03
JP2008533949A (ja) 2008-08-21
BRPI0608004B1 (pt) 2019-08-27
EP1859630B1 (en) 2014-10-22
BRPI0608004A2 (pt) 2009-11-03
US8428143B2 (en) 2013-04-23
EP1859630A1 (en) 2007-11-28
WO2007107170A1 (en) 2007-09-27
HK1114988A1 (zh) 2008-11-14

Similar Documents

Publication Publication Date Title
JP4876122B2 (ja) 精度スケーラビリティを可能にする符号化スキーム
CN102547277B (zh) 产生质量可缩放视频数据流的设备及其方法
US7535383B2 (en) Methods and systems for signaling multi-layer bitstream data
US7885471B2 (en) Methods and systems for maintenance and use of coded block pattern information
KR101265371B1 (ko) 복호 장치, 복호 방법 및 기록 매체
US8532176B2 (en) Methods and systems for combining layers in a multi-layer bitstream
CN104335585A (zh) 图像解码方法和使用其的装置
WO2007079782A1 (en) Quality scalable picture coding with particular transform coefficient scan path
CN100588259C (zh) 具有精度可缩放性的编码方案
KR20080002936A (ko) 하나 이상의 디지털 영상을 인코딩하는 방법, 인코더 및컴퓨터 프로그램 생성물
WO2007042063A1 (en) Video codec supporting quality-scalability
HK1114988B (en) Coding scheme enabling precision-scalability
KR20150011740A (ko) 복수의 레이어를 지원하는 영상의 부호화 및 복호화 방법 및 이를 이용하는 장치
HK1135827B (zh) 质量可缩放视频数据流
Peixoto Fernandes da Silva Advanced heterogeneous video transcoding

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101207

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110304

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110309

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110311

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111101

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111128

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141202

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4876122

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250