JP6567100B2 - 符号化単位の変換単位を符号化および復号する方法、装置、およびシステム - Google Patents

符号化単位の変換単位を符号化および復号する方法、装置、およびシステム Download PDF

Info

Publication number
JP6567100B2
JP6567100B2 JP2018009529A JP2018009529A JP6567100B2 JP 6567100 B2 JP6567100 B2 JP 6567100B2 JP 2018009529 A JP2018009529 A JP 2018009529A JP 2018009529 A JP2018009529 A JP 2018009529A JP 6567100 B2 JP6567100 B2 JP 6567100B2
Authority
JP
Japan
Prior art keywords
transform
color difference
chrominance
unit
residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018009529A
Other languages
English (en)
Other versions
JP2018101984A (ja
Inventor
ジェームズ ロゼワーン クリストファー
ジェームズ ロゼワーン クリストファー
コレスニコフ ウォロジミール
コレスニコフ ウォロジミール
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2018101984A publication Critical patent/JP2018101984A/ja
Application granted granted Critical
Publication of JP6567100B2 publication Critical patent/JP6567100B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/40Tree coding, e.g. quadtree, octree
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

関連出願の相互参照
本出願は、2012年9月28日に出願されたオーストラリア国特許出願第2012232992号の出願日の権利を米国特許法第119条の下で主張し、本明細書において十分に示されるようにその全体を参考文献として援用する。
本発明は、一般的に、デジタルビデオ信号処理に関し、特に、変換単位(TU)の残差係数を符号化し復号化するための方法、装置およびシステムに関する。ここで、変換単位(TU)は、1つ以上の変換単位(TU)を含み、4:2:2色差フォーマットを含む複数の色差フォーマット用に構成されてもよい。
現在、ビデオデータの伝送および記憶のためのアプリケーションを含む、ビデオ符号化のための多くのアプリケーションが存在する。多くのビデオ符号化規格も開発されていて、他の規格も現在開発中である。ビデオ符号化の規格化における最近の展開は、「映像符号化共同研究部会」(JCT−VC)と呼ばれるグループの形成に結びついた。映像符号化共同研究部会(JCT−VC)は、映像符号化専門家グループ(VCEG)として知られている国際電気通信連合(ITU)の電気通信標準化部門(ITU−T)の第16研究グループQuestion6(SG16/Q6)のメンバーと、動画専門家グループ(MPEG)として知られている国際標準化機構/国際電気標準会議第一合同技術委員会/小委員会29/作業部会11(ISO/IEC JTC1/SC29/WG11)のメンバーとを含む。
映像符号化共同研究部会(JCT−VC)は、「H.264/MPEG−4 AVC」として知られている現存するビデオ符号化規格よりも著しく性能が優れている新規のビデオ符号化規格を生み出すことを目標とする。H.264/MPEG−4 AVC規格は、それ自体、従来のビデオ符号化規格(MPEG−4およびITU−T H.263)に対する大規模な改良である。開発中の新規のビデオ符号化規格は「高効率動画像符号化方式(HEVC)」と命名された。映像符号化共同研究部会JCT−VCは、また、リアルタイムまたは高フレームレートにおいて高分解能で動作する規格の実施態様をスケーリングする際に困難さが生じる高効率動画像符号化方式(HEVC)のために提案された技術から生じる実施課題を検討している。1つの実施課題は、周波数領域と空間領域との間でビデオデータを変換するための複数「変換」サイズサポートするために用いられるロジックの複雑性およびサイズである。
本発明は、既存の仕組みの1つ以上の短所を、実質的に克服するか、または少なくとも改善することを目的とする。
本開示の1つの態様によれば、ビデオビットストリームから、4:2:2フォーマットの符号化単位内の変換単位に含まれる、2つの色差チャネルにそれぞれ関連付けられた2つの色差残差係数配列を復号し、前記復号された色差残差係数配列を周波数領域から空間領域の色差残差サンプルへ変換する方法であって、
符号化単位のサイズおよび前記符号化単位内の変換単位の階層レベルに従って、正方形ブロックで表される前記変換単位の変換サイズを決定するステップと、
各色差チャンネルにおいて、
前記ビデオビットストリームから、前記変換単位が有する2つの色差残差係数配列のそれぞれに対応する2つの符号化ブロックフラグ値を復号するステップと、
前記2つの符号化ブロックフラグ値のうちの対応する符号化ブロックフラグ値に従って、前記2つの色差残差係数配列の各々を前記ビデオビットストリームから復号するステップと、
前記決定された変換サイズに対応する正方形ブロックのための変換を、前記復号された色差残差係数配列の各々に対して適用することにより、色差残差サンプルを生成するステップと、
を備え、
前記2つの色差残差係数配列の各々を前記ビデオビットストリームから復号するステップにおいて、前記2つの色差残差係数配列の各々に対して同じスキャンパターンを適用することにより、正方形ブロックで表される前記決定された変換サイズの変換単位を生成することを特徴とする方法が提供される。
他の態様も開示される。
ここで、本発明の少なくとも1つの実施形態が、以下の図面を参照しながら記載されることになる。
ビデオ符号化/復号化システムを示す概略ブロック図である。 図1のビデオ符号化/復号化システムの一方または双方が実施されてもよい汎用コンピュータシステムの概略ブロック図を形成する。 図1のビデオ符号化/復号化システムの一方または双方が実施されてもよい汎用コンピュータシステムの概略ブロック図を形成する。 ビデオエンコーダの機能モジュールを示す概略ブロック図である。 ビデオデコーダの機能モジュールを示す概略ブロック図である。 フレームデータを表現するための色差フォーマットを概略的に図示する。

フレームデータを表現するための色差フォーマットを概略的に図示する。 符号化単位の例示的な変換ツリーの概略図である。 輝度サンプルグリッド上に配置された例示的な変換ツリーの概略図である。 色差サンプルグリッド上に配置された例示的な変換ツリーの概略図である。 例示的な変換ツリーの輝度チャネルを表現するデータ構造の略図である。 例示的な変換ツリーの色差チャネルを表現するデータ構造を図示する。 例示的な変換ツリーを符号化するビットストリーム構造を概略的に示す。 例示的な変換ツリーを符号化するビットストリーム構造を概略的に示す。 例示的な変換ツリーを符号化する代替的なビットストリーム構造を概略的に示す。 例示的な変換ツリーを符号化する代替的なビットストリーム構造を概略的に示す。 例示的な変換ツリーを符号化する方法を示す概略フローシートである。 例示的な変換ツリーを復号化する方法を示す概略フローシートである。 4×8変換単位の残差スキャンパターンを概略的に図示する。 4×8変換単位の残差スキャンパターンを概略的に図示する。 4×8変換単位の残差スキャンパターンを概略的に図示する。
添付の図面のいずれか1つ以上において、同一の参照符号を有するステップおよび/または特徴を参照する場合、それらのステップおよび/または特徴は、別段の意図が示されている場合を除いて、この記述にとって同一の機能または動作を有する。
図1は、色差チャネルのために変換単位を複数の変換に暗黙的に細分割(inferred subdivision)することを表現するコード化構文要素のための技術を利用できるビデオ符号化/復号化システム100の関数モジュールを示す概略ブロック図である。システム100は、ソース装置110と宛先装置130とを含む。通信チャネル120は、ソース装置110から宛先装置130に符号化映像情報を通信するために用いられる。いくつかのケースにおいて、ソース装置110および宛先装置130は、それぞれの携帯電話ハンドセットを備えてもよく、その場合、通信チャネル120は、無線チャネルである。他のケースにおいて、ソース装置110および宛先装置130は、ビデオ会議装置を備えてもよく、その場合、通信チャネル120は、通常はインターネット接続などの有線チャネルである。さらに、ソース装置110および宛先装置130は、テレビ放送、ケーブルテレビアプリケーション、インターネットビデオアプリケーションをサポートする装置を含み、符号化ビデオがいくつかの記憶媒体またはファイルサーバ上で取り込まれるアプリケーションを含む、任意の広範囲の装置を備えてもよい。
図示するように、ソース装置110は、ビデオソース112と、ビデオエンコーダ114と、送信器116とを含む。ビデオソース112は、通常は、撮像センサ、非一時的な記録媒体に記憶された予め取り込まれたビデオシーケンス、またはリモート撮像センサから供給されたビデオなどの、取り込まれたビデオフレームデータのソースを備える。ビデオソース112のような撮像センサを含んでもよいソース装置110の例は、スマートフォン、ビデオカムコーダ、およびネットワークビデオカメラを含む。ビデオエンコーダ114は、ビデオソース112から取り込まれたフレームデータを符号化ビデオデータに変換し、図3を参照しながらさらに記述されることになる。符号化ビデオデータは、通常は、符号化ビデオ情報として通信チャネル120を通じて送信器116によって送信される。また、符号化ビデオデータは、後で通信チャネル120を通じて送信されるまでは、「フラッシュ」メモリまたはハードディスクドライブなどの何らかの記憶装置に記憶されることも可能である。
宛先装置130は、受信器132と、ビデオデコーダ134と、ディスプレイ装置136とを含む。受信器132は、通信チャネル120から符号化ビデオ情報を受信し、受信されたビデオデータをビデオデコーダ134に渡す。その後、ビデオデコーダ134は、ディスプレイ装置136に対して復号化フレームデータを出力する。ディスプレイ装置136の例は、スマートフォン、タブレット型コンピュータ、コンピュータ用モニタ内の、またはスタンドアロン型テレビジョンセット内の、ブラウン管、液晶ディスプレイを含む。また、ソース装置110および宛先装置130の各々の機能性にとって、単一の装置で具体化されることも可能である。
上述の例示的な装置にもかかわらず、ソース装置110および宛先装置130の各々は、汎用コンピューティングシステム内で、通常は、ハードウェアおよびソフトウェアコンポーネントの組み合わせを通じて構成されてもよい。図2Aは、このようなコンピュータシステム200を図示しており、コンピュータシステム200は、コンピュータモジュール201と、キーボード202、マウスポインタ装置203、スキャナ226、ビデオソース112として構成されてもよいカメラ227、およびマイクロホン280などの入力装置と、およびプリンタ215、ディスプレイ装置136として構成されてもよいディスプレイ装置214、およびスピーカ217を含む出力装置とを含む。外部変調器復調器(モデム)トランシーバ装置216は、接続221を介して通信ネットワーク220間で通信するためにコンピュータモジュール201によって用いられてもよい。通信チャネル120に相当してもよい通信ネットワーク220は、インターネット、セルラ電気通信ネットワーク、またはプライベートWANなどのワイドエリアネットワーク(WAN)であってもよい。接続221が電話線である場合、モデム216は、従来の「ダイアルアップ」モデムであってもよい。または、接続221が高容量(例えばケーブル)接続である場合、モデム216は、ブロードバンドモデムであってもよい。無線モデムも、また、通信ネットワーク220に対する無線接続のために用いられてもよい。トランシーバ装置216は、送信器116および受信器132の機能性を提供してもよく。通信チャネル120は、接続221において具体化されてもよい。
コンピュータモジュール201は、通常は、少なくとも1つのプロセッサー205と、メモリユニット206とを含む。例えば、メモリユニット206は、半導体ランダムアクセスメモリ(RAM)と半導体読み取り専用メモリ(ROM)とを有してもよい。コンピュータモジュール201は、また、ビデオディスプレイ214、スピーカ217、およびマイクロホン280に連結されるオーディオビデオインタフェース207と、キーボード202、マウス203、スキャナ226、カメラ227、および必要に応じてジョイスティック、または他のヒューマンインタフェース装置(図示せず)に連結されるI/Oインタフェース213と、外部モデム216およびプリンタ215のためのインタフェース208とを含むいくつかの入出力(I/O)インタフェースを含む。いくつかの実施態様において、モデム216は、コンピュータモジュール201内に、例えばインタフェース208内に、組み込まれてもよい。コンピュータモジュール201は、また、ローカルエリアネットワーク(LAN)として知られているローカルエリア通信ネットワーク222に対する接続223を介してコンピュータシステム200の連結を可能にする、ローカルネットワークインタフェース211を有する。図2Aに図示されるように、ローカル通信ネットワーク222は、また、接続224を介してワイドネットワーク220に連結されてもよく、通常はいわゆる「ファイアウォール」装置または同様の機能性の装置を含むであろう。ローカルネットワークインタフェース211は、Ethernet(登録商標)回路カード、Bluetooth(登録商標)無線設備、またはIEEE802.11無線設備を備えてもよいが、但し、多数の他のタイプのインタフェースが、インタフェース211のために実施されてもよい。ローカルネットワークインタフェース211は、また、送信器116および受信器132の機能性を提供してもよく、通信チャネル120も、また、ローカル通信ネットワーク222において具体化されてもよい。
I/Oインタフェース208、213は、シリアル接続およびパラレル接続のいずれか一方若しくは双方を利用してもよく、前者は、通常は、ユニバーサルシリアルバス(USB)規格によって実施され、対応するUSBコネクタ(不図示)を有する。記憶装置209が設けられ、通常はハードディスクドライブ(HDD)210を含む。フロッピー(登録商標)ディスクドライブや磁気テープドライブ(不図示)などの他の記憶装置も、また、用いられてもよい。光ディスクドライブ212は、通常は、不揮発性のデータソースとして機能するために備えられる。ポータブルメモリ装置、このような光ディスク(例えばCD−ROM、DVD、ブルーレイディスク(商標))、USB−RAM、ポータブルな外部ハードドライブ、およびフロッピー(登録商標)ディスクは、例えば、コンピュータシステム200に対する適切なデータソースとして用いられてもよい。通常は、HDD210、光ドライブ212、ネットワーク220、222のいずれかは、ディスプレイ214を介した再生のために記憶された復号化ビデオデータのための、ビデオソース112として、または送信先として、動作するように構成されてもよい。
コンピュータモジュール201のコンポーネント205〜213は、通常は、相互接続バス204を介して、および関連する当該技術分野のものに対して既知のコンピュータシステム200の従来のオペレーションモードをもたらす方式で、通信する。例えば、プロセッサー205は、接続218を用いて、システムバス204に連結される。同様に、メモリ206および光ディスクドライブ212は、接続219によってシステムバス204に連結される。記載の設備が実行され得るコンピュータの例は、IBM PCおよびその互換機、サン・マイクロシステムズのスパークステーション、アップル社のMac(商標)、または同様のコンピュータシステムを含む。
妥当若しくは所望の場合、ビデオエンコーダ114およびビデオデコーダ134は、下記の方法だけでなく、コンピュータシステム200を用いて実施されてもよく、ここで、ビデオエンコーダ114、ビデオデコーダ134、および後述の図10〜図13の処理は、コンピュータシステム200内で実行可能な1つ以上のソフトウェアアプリケーションプログラム233として実施されてもよい。特に、ビデオエンコーダ114、ビデオデコーダ134、および記載の方法のステップは、コンピュータシステム200内で実行されるソフトウェア233内の命令231(図2Bを参照)によって達成される。ソフトウェア命令231は、1つ以上の特定のタスクを各々実行するために、1つ以上のコードモジュールとして形成されてもよい。ソフトウェアは2つの部分に分かれていてもよく、第1の部分および対応するコードモジュールは、記載の方法を実行し、第2の一部および対応するコードモジュールは、第1の部分とユーザとの間のユーザインタフェースを管理する。
ソフトウェアは、例えば下記の記憶装置を含むコンピュータ読み取り可能媒体内に記憶されてもよい。ソフトウェアは、コンピュータ読み取り可能媒体からコンピュータシステム200内にロードされ、その後、コンピュータシステム200によって実行される。コンピュータ読み取り可能媒体に記録されたこのようなソフトウェアまたはコンピュータプログラムを有するコンピュータ読み取り可能媒体は、コンピュータプログラムプロダクトである。コンピュータシステム200内のコンピュータプログラムプロダクトの使用は、ビデオエンコーダ114、ビデオデコーダ134、および記載の方法を実施するために有利な装置を好ましくはもたらす。
ソフトウェア233は、通常は、HDD210またはメモリ206内に記憶される。ソフトウェアは、コンピュータ読み取り可能媒体からコンピュータシステム200内にロードされ、コンピュータシステム200によって実行される。従って、例えば、ソフトウェア233は、光ディスクドライブ212によって読み取られる、光学的に読み取り可能なディスク記憶媒体(例えばCD−ROM)225に記憶されてもよい。
いくつかのの実例では、アプリケーションプログラム233は、ユーザに供給され、1つ以上のCD−ROM225上で符号化され、対応する駆動装置212を介して読み取られてもよいし、または、その代わりにユーザによってネットワーク220または222から読み込まれてもよい。さらにまた、ソフトウェアは、他のコンピュータ読み取り可能なディスク記憶媒体からコンピュータシステム200内にロードすることもできる。コンピュータ読み取り可能な記憶媒体は、実行および/または処理のために、コンピュータシステム200に対して、記録された命令および/またはデータを提供する、あらゆる非一時的な有形的記憶媒体を指す。このような記憶媒体の例は、フロッピー(登録商標)ディスク、磁気テープ、CD−ROM、DVD、ブルーレイディスク、ハードディスクドライブ、ROM、集積回路、USBメモリ、光磁気ディスク、またはPCMCIAカードおよびその他同種のものなどのコンピュータ読み取り可能なカードを含み、このような装置は、コンピュータモジュール201の内部にあるか外部にあるかを問わない。コンピュータモジュール401に対するソフトウェア、アプリケーションプログラム、命令および/またはビデオデータまたは符号化ビデオデータの提供にも関与してもよい一時的若しくは非有形的コンピュータ読み取り可能な伝送媒体の例は、別のコンピュータまたはネットワーク接続された装置に対するネットワーク接続だけでなく無線若しくは赤外線の送信チャネル、および電子メール送信並びにウェブサイトに記録された情報やその他同種のものを含むインターネットまたはイントラネットを含む。
上述のアプリケーションプログラム233および対応するコードモジュールの第2の部分は、ディスプレイ214上に描画されるか、さもなければ表現される1つ以上のグラフィカルユーザインタフェース(GUI)を実施するために実行されてもよい。通常はキーボード202およびマウス203の操作を通じて、コンピュータシステム200およびアプリケーションのユーザは、GUIに関連するアプリケーションに対して制御コマンドを提供および/または入力する機能的に適応可能な方式で、インタフェースを操作してもよい。機能的に適応可能なユーザインタフェースの他の形式も、また、スピーカ217を介して出力される音声プロンプトおよびマイクロホン280を介して入力されるユーザ音声コマンドを利用するオーディオインタフェースなどにより、実施されてもよい。
図2Bは、プロセッサー205および「メモリ」234の詳細な概略ブロック図である。メモリ234は、図2Aのコンピュータモジュール201によってアクセスすることができる、(HDD209および半導体メモリ206を含む)すべてのメモリモジュールの論理的な集約を表現する。
コンピュータモジュール201が最初に起動されるとき、電源投入時自己診断テスト(POST)プログラム250が実行する。POSTプログラム250は、通常は図2Aの半導体メモリ206のROM249内に記憶される。ソフトウェアを記憶するROM249などのハードウェアデバイスは、時として、ファームウェアと呼ばれる。POSTプログラム250は、正常な機能を保証するためにコンピュータモジュール201内のハードウェアを検査し、通常は、プロセッサー205、メモリ234(209、206)、および通常はROM249内にも記憶される正常動作のための基本入出力システムソフトウェア(BIOS)モジュール251をチェックする。一旦POSTプログラム250の実行が成功すれば、BIOS251は、図2Aのハードディスクドライブ210を作動させる。ハードディスクドライブ210の起動は、ハードディスクドライブ210上に常駐するブートストラップローダプログラム252を、プロセッサー205を介して実行させる。これは、オペレーティングシステム253が動作を始めるRAMメモリ206内に、オペレーティングシステム253をロードする。オペレーティングシステム253はプロセッサー管理、メモリ管理、装置管理、記憶管理、ソフトウェアアプリケーションインタフェース、および総括的なユーザインタフェースを含む様々な高レベルの機能を実現する、プロセッサー205により実行可能な、システムレベルアプリケーションである。
オペレーティングシステム253は、コンピュータモジュール201上で動作する各処理またはアプリケーションが、別の処理に対して割り当てられたメモリと衝突せずに実行するのに十分なメモリを有することを保証するためにメモリ234(209、206)を管理する。さらに、図2Aのコンピュータシステム200において利用可能な異なるタイプのメモリは、各処理が効率的に動作することができるように、適切に用いられなければならない。従って、集約されたメモリ234は、(特に断らない限り)メモリの特定のセグメントがどのように割り当てられるか示すのではなく、むしろ、コンピュータシステム200によってアクセス可能なメモリおよびこのようなものがどのように用いられるかの一般的概念を提供するように意図される。
図2Bにおいて示されるように、プロセッサー205は、制御部239と、算術論理演算ユニット(ALU)240と、時としてキャッシュメモリと呼ばれるローカルまたは内部メモリ248とを含む、いくつかの機能モジュールを含む。キャッシュメモリ248は、通常は、レジスタ部内にいくつかの記憶レジスタ244〜246を含む。1つ以上の内部バス241は、これらの機能モジュールを機能的に相互に連結する。また、プロセッサー205は、通常は、接続218を用いて、システムバス204を介して外部装置と通信するための1つ以上のインタフェース242を有する。メモリ234は、接続219を用いて、バス204に連結される。
アプリケーションプログラム233は、条件分岐およびループ命令を含んでもよい命令231のシーケンスを含む。プログラム233は、また、プログラム233の実行に用いられるデータ232を含んでもよい。命令231およびデータ232は、それぞれ、メモリ位置228、229、230および235、236、237に記憶される。命令231の相対的なサイズおよびメモリ位置228〜230に応じて、特定の命令は、メモリ位置230内に示される命令によって表現されるような単一のメモリ位置内に記憶されてもよい。交互に、メモリ位置228、229に示される命令セグメントによって表現されるように、命令は、各々が個別のメモリ位置に記憶されるいくつかの部分にセグメント化されてもよい。
一般的に、プロセッサー205は、プロセッサー205の中で実行される1セットの命令を与えられる。プロセッサー205は、別の命令のセットを実行することによってプロセッサー205が反応する、次の入力を待つ。各入力は、すべて図2Aに表現されている、入力装置202、203の1つ以上によって生成されたデータ、ネットワーク220、202の1つを介して外部ソースから受信されたデータ、記憶装置206、209の1つから検索されたデータ、または対応する読み取り装置212内に挿入された記憶媒体225から検索されたデータを含む、いくつかのソースの1つ以上から提供されてもよい。1セットの命令の実行は、いくつかのケースにおいてデータの出力をもたらしてもよい。実行は、また、データまたは変数をメモリ234に記憶することを含んでもよい。
ビデオエンコーダ114、ビデオデコーダ134および記載の方法は、対応するメモリ位置255、256、257のメモリ234内の記憶される入力変数254を用いてもよい。ビデオエンコーダ114、ビデオデコーダ134および記載の方法は、対応するメモリ位置262、263、264のメモリ234内に記憶される出力変数261を生成する。中間変数258は、メモリ位置259、260、266、267に記憶されてもよい。
図2Bのプロセッサー205を参照すると、レジスタ244、245、246、算術論理演算ユニット(ALU)240、および制御部239は、プログラム233を作成する命令セット内の命令ごとの「フェッチ、復号化、実行」サイクルを実行するために必要とされるマイクロオペレーションのシーケンスを実行するために相互に動作する。各々のフェッチ、復号化、および実行のサイクルは、以下の動作を備える。
(a)メモリ位置228、229、230から命令231をフェッチまたは読み込むフェッチ動作。
(b)どの命令がフェッチされたかを制御部239が判定する復号化動作。
(c)制御部239および/またはALU240が命令を実行する実行動作。
その後、次の命令のためのさらなるフェッチ、復号化、および実行のサイクルが実行されてもよい。同様に、制御部239がメモリ位置232に対する値を記憶するまたは書き込む記憶サイクルが実行されてもよい。
後述する図10〜図13の処理の各ステップまたはサブ工程は、1つ以上のプログラム233のセグメントに関連づけられ、通常は、プログラム233の言及されたセグメントのために命令セット内の命令ごとにフェッチ、復号化、および実行サイクルを実行するために共動するプロセッサー205内のレジスタ部244、245、247、ALU240、および制御部239によって実行される。
図3は、ビデオエンコーダ114の機能モジュールを示す概略ブロック図である。図4は、ビデオデコーダ134の機能モジュールを示す概略ブロック図である。ビデオエンコーダ114およびビデオデコーダ134は、図2Aおよび図2Bに図示するように、汎用コンピュータシステム200を用いて実施されてもよく、ここではコンピュータシステム200内の専用ハードウェアによって実施されてもよいし、または、コンピュータシステム200内で実行可能なソフトウェア、例えば、ハードディスクドライブ205上に常駐し、且つプロセッサー205によって実行を制御されるソフトウェアアプリケーションプログラム233の1つ以上のソフトウェアコードモジュールなどの様々な機能モジュールによって実施されても良いし、または、コンピュータシステム200内で実行可能な専用ハードウェアおよびソフトウェアの組み合わせによって実施されても良い。ビデオエンコーダ114、ビデオデコーダ134および記載の方法は、代わりに、記載の方法の機能またはサブ機能を実行する1つ以上の集積回路などの専用ハードウェアにより実現されられてもよい。このような専用ハードウェアは、グラフィックプロセッサー、デジタル信号プロセッサー、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)または1つ以上のマイクロプロセッサーおよび関連メモリを含む。特に、ビデオエンコーダ114は、モジュール320〜344を備え、ビデオデコーダ134は、ソフトウェアアプリケーションプログラム233の1つ以上のソフトウェアコードモジュールとして各々実装されてもよいモジュール420〜434を備える。
図3のビデオエンコーダ114は高効率動画像符号化方式(HEVC)ビデオ符号化パイプラインの例であるが、モジュール320−344によって実行される処理段階は、VC−1またはH.264/MPEG−4 AVCなどの他のビデオコーデックと共通である。ビデオエンコーダ114は、一連のフレームとして、取得されたフレームデータなどの取得されたフレームデータを受信し、各フレームは1つ以上の色チャネルを含む。各フレームは、色チャネルごとに1つのサンプルグリッドを備える。色情報は、勧告ITU−R BT.709(「YUV」))などの「色空間」を用いて表現されるが、他の色空間も可能である。YUV色空間が用いられる場合、色チャネルは、輝度チャネル(「Y」)および2つの色差チャネル(「U」および「V」)を含む。さらに、異なる情報量は、画像のサンプリングに応じて、または取得されたフレームデータを再サンプリングするフィルタリングアプリケーションを通じて、各色チャネルのサンプルグリッド内に含まれてもよい。「色差フォーマット」として知られているいくつかのサンプリングアプローチが存在し、そのうちのいくつかが、図5Aおよび図5Bを参照して説明する。
ビデオエンコーダ114は、フレームデータ310などの取得されたフレームデータの各フレームを、一般的に「符号化ツリーブロック」(CTB)と呼ばれる領域に分割する。各符号化ツリーブロック(CTB)は、「符号化単位」(CU)の集合への一部のフレームの階層的四分木細分割(hierarchical quad−tree subdivision)を含む。符号化ツリーブロック(CTB)は、一般的に、64×64輝度サンプルの領域を占めるが、16×16または32×32などの他のサイズも可能である。いくつかのケースにおいて、さらに大規模なサイズ(例えば128×128)が用いられてもよい。符号化ツリーブロック(CTB)は、新規の階層レベルを生成するために、4つの等しいサイズの領域への分割をへて、細分割されてもよい。分割は、再帰的に適用されても良く、その結果、四分木階層内をもたらす。符号化ツリーブロック(CTB)側の寸法が常に2の累乗であるので、四分木分割は、常に幅および高さの半値化するので、領域側寸法も、また、常に2の累乗である。それ以上分割領域が行われない場合、「符号化単位」(CU)は、領域内に存在すると言える。符号化ツリーブロックのトップレベルで分割が実行されない場合、符号化ツリーブロック全体を占有する領域は「最大符号化単位」(LCU)と一般的に呼ばれる1つの符号化単位(CU)を含む。最小サイズは、また、8×8輝度サンプルによって占められた領域などのように、各々の符号化単位ごとに存在するが、他の最小サイズも可能である。このサイズの符号化単位は、一般的に「最小符号化単位」(SCU)と呼ばれる。この四分木階層の結果として、符号化ツリーブロック(CTB)の全体は、1つ以上の符号化単位(CU)によって占有される。
ビデオエンコーダ114は、各符号化単位(CU)に対して、一般的に「予測単位」(PU)と呼ばれるサンプルの1つ以上の配列を生成する。各符号化単位(CU)における予測単位(PU)の様々な配列は、予測単位(PU)がオーバラップせず、符号化単位(CU)の全体が1つ以上の予測単位(PU)によって占有されるという要件によって可能である。このスキームは、予測単位(PU)がフレーム領域全体をカバーすることを保証する。
ビデオエンコーダ114は、マルチプレクサモジュール340、予測単位(PU)382からの出力によって動作する。差分モジュール344は、フレームデータ310の符号化ツリーブロック(CTB)の符号化単位(CU)から、予測単位(PU)382とデータサンプルの対応する2次元配列との間の差分を出力し、差分は「残差サンプル配列」360として知られている。差分モジュール344からの残差サンプル配列360は、変換モジュール320によって受信されるが、変換モジュール320は「順方向変換」を適用することによって残差サンプル配列360を空間表現から周波数領域表現に変換する(または「符号化」する)。変換モジュール320は、一般的に「変換ツリー」と呼ばれる1つ以上の変換単位(TU)への符号化単位(CU)の階層的細分割において変換単位(TU)における各変換のための変換係数362を生成する。開発中の高効率動画像符号化方式(HEVC)規格に関しては、周波数領域表現への変換は、修正離散コサイン変換(DCT)を用いて実行され、修正離散コサイン変換では、従来のDCTは、シフトおよび加算を用いて実施されるように修正される。残差サンプル配列360および変換係数362のための様々なサイズは、サポートされた変換サイズに従って可能である。開発中の高効率動画像符号化方式(HEVC)規格において、変換は、32×32、16×16、8×8、および4×4などの特定のサイズを有する2次元配列のサンプルに対して実行される。ビデオエンコーダ114に対して利用可能な変換サイズの所定のセットは、したがって、存在すると言える。さらに、以上に予示されるように、変換サイズのセットは、輝度チャネルと色差チャネルとの間で異なってもよい。2次元変換は一般的に「分離可能に」構成され、2次元配列のサンプル上の一方向(例えば行上)で動作する1次元変換の第1のセットとして、その後、他の方向(例えば列上)の1次元変換の第1のセットから出力される2次元配列のサンプル上で動作する1次元変換の第2のセットとして、実施を可能とすえる。同一の幅と高さを有する変換は、一般的に「正方形変換」と呼ばれる。さらに、異なる幅と高さを有する変換も、また可能であり、一般的に「非正方形変換」と呼ばれる。最適化された変換の実施態様は、4×4変換モジュールまたは8×8変換モジュールなどの特定のハードウェアまたはソフトウェアモジュールへの行および列の1次元変換を組み合わせてもよい。たとえそれらが頻繁に用いられなくても、より大きな寸法を有する変換は、実施するために多くの量の回路を要する。従って、32×32の最大変換サイズが、開発中の高効率動画像符号化方式(HEVC)規格内に存在する。変換の実施の統合的な本質は、また、通常は全体に新規のハードウェアが実施されることを要するので、対応する正方形変換から存在する既存の1次元変換ロジックを再使用する代わりに、サポートされた非正方形変換サイズの数を低減するための優先度を導入する。変換は、輝度チャネルおよび色差チャネルの両方に適用される。変換単位(TU)に関する輝度チャネルと色差チャネルとの取扱の差異が存在し、差異に関しては図5Aおよび図5Bを参照して以下に論じる。各変換ツリーは、1つの符号化単位(CU)を占有し、変換ツリー(四分木)階層の各リーフノードにおいて1つの変換単位(TU)、各変換単位(TU)は、サポートされた変換サイズの変換を利用することができる、を含む階層への符号化単位(CU)の四分木分解として定義される。符号化ツリーブロック(CTB)と同様に、符号化単位(CU)の全体は1つ以上の変換単位(TU)によって占有されることが必要である。変換ツリー四分木階層の各レベルにおいて、それ以上分割が存在しない場合は現在の階層レベルにおいて、「符号化ブロックフラグ値」は、各色チャネル内での変換の存在が有りうることを信号伝達し、または下位階層レベルが結果として生じる変換単位(TU)への少なくとも1つの変換を含んでもよいと信号伝達する。符号化ブロックフラグ値がゼロである場合、現在の階層レベルまたはより低い階層レベルにおける、変換ツリーのいかなる変換単位(TU)の対応する色チャネルに対しても、変換は実行されない。符号化ブロックフラグ値が1である場合、領域は、少なくとも1つのゼロでない残差係数を有しなければならない変換を含む。このように、各色チャネルに対して、ゼロまたはそれ以上の変換は、符号化単位(CU)なしから符号化単位(CU)全体まで変動する符号化単位(CU)の領域の一部をカバーしてもよい。個別の符号化ブロックフラグ値は、各色チャネルに存在する。1つの有りうる符号化ブロックフラグ値のみがあるケースが存在する場合、各符号化ブロックフラグ値は、符号化される必要がない。
その後、変換係数362は、スケール/量子化モジュール322に入力され、残差係数配列364を生成するために決定された量子化パラメータ384によって、スケールされ、量子化される。スケール/量子化処理は、決定された量子化パラメータ384値に依存して、精度の損失をもたらす。決定された量子化パラメータ384の高い値は、変換係数から大きな情報が失われる結果をもたらす。これにより、ビデオデコーダ134からの出力の視覚的品質を低減することを犠牲にして、ビデオエンコーダ114によって達成された圧縮を増大する。決定された量子化パラメータ384はフレームデータ310の各フレームの符号化の間に適応されてもよいし、または、全体のフレームなどフレームデータ310の一部に固定されてもよい。また、決定された量子化パラメータ384の他の適応は、個別の値による異なる残差係数の量子化などで、可能である。残差係数配列364および決定された量子化パラメータ384は、逆スケールモジュール326に対する入力として用いられるが、逆スケールモジュール326は、残差係数配列364のりスケールされたバージョンであるリスケールされた変換係数配列366を生成するためにスケール/量子化モジュール322によって実行されたスケール処理を反転させる。
残差係数配列364および決定された量子化パラメータ384も、符号化ビットストリーム312(または「ビデオビットストリーム」)内の残差係数を符号化するエントロピーエンコーダモジュール324に対する入力として使用される。各変換単位(TU)内の各変換の残差係数配列364は、「サブブロック」として一般的に知られているグループにおいて符号化される。これがサブブロック処理に関連するロジックの再使用を可能にするので、サブブロックは、好ましくは、変換のサイズに関わらず、同一の寸法を有するべきである。1つのサブブロック内の残差係数は、一般的に「係数グループ」と呼ばれ、各係数グループに対して、係数グループフラグは、一般的に、係数グループ内の少なくとも1つの残差係数がゼロでないか否かを示すために符号化される。いくつかのケースにおいて、係数グループフラグは、暗示され、したがって符号化されない。フラグは、残差係数がゼロでない(「有意」)か、ゼロである(「非有意」)か、を示すために1である係数グループフラグ値を有する係数グループに対する属する各残差係数に対して符号化される。スケール/量子化モジュール322から起因する精度の損失のために、スケール処理された変換係数配列366は、オリジナルの変換係数362と同一でない。逆スケールモジュール326からスケール処理された変換係数配列366は、その後、逆変換モジュール328に出力される。ビデオデコーダ134で生成される空間領域表現と同一のスケール変更された変換係数配列366の空間領域表現368を生成するために、逆変換モジュール328は、周波数領域から空間領域に対して逆変換を実行する。
動き推定モジュール338は、一般的にはメモリ206内に構成されているフレームバッファモジュール332内に記憶された1セット以上のフレームからの前フレームデータと、フレームデータ310とを比較することによって、運動ベクトル374を生成する。フレームのセットは「基準画像リスト」として知られている。運動ベクトル374は、その後、運動ベクトル374から派生した空間オフセットを考慮に入れて、フレームバッファモジュール332内に記憶されたサンプルをフィルタリングすることによって、インター予測された予測単位(PU)376を生成する動き補償モジュール334に入力される。図3には図示されないが、運動ベクトル374も、また、符号化ビットストリーム312内で符号化するためにエントロピーエンコーダモジュール324に対する構文要素として渡される。イントラフレーム予測モジュール336は、総和モジュール342から取得されたサンプル370を用いて、インター予測された予測単位(PU)378を生成する。総和モジュール342は、マルチプレクサモジュール340からの予測単位(PU)382と、逆変換モジュール328からの空間領域表現368とを総和する。イントラフレーム予測モジュール336は、また、符号化ビットストリーム312に符号化するためのエントロピーエンコーダ324に対して送信されるイントラ予測モード380を生成する。
予測単位(PU)は、イントラ予測方法またはインター予測方法のいずれかを用いて生成されてもよい。イントラ予測方法は、予測単位(PU)内の基準サンプルを生成するために(通常は、予測単位の上および左に)予め復号化された予測単位(PU)に隣接するサンプルを使用する。「イントラ予測モード」と呼ばれる、イントラ予測を様々な方向にすることは可能である。インター予測方法は、選択された基準フレームからブロックまで参照するために動きベクトルを利用する。ブロックがサブサンプル精度(例えばサンプルの8分の1)までのあらゆるアラインメントを有するので、フィルタリングは、予測単位(PU)のための基準サンプルのブロックを生成するのに必要となる。結果として生じる符号化ビットストリーム312の所望のビットレートと、イントラ予測またはインター予測方法のいずれかによって導入された画質歪みの量との間のレート歪みトレードオフに従って、用いる方法が決定される。イントラ予測が用いられる場合、1つのイントラ予測モードは、また、レート歪みトレードオフに従ってイントラ予測の可能なモードのセットから選択される。マルチプレクサモジュール340は、レート歪みアルゴリズムによって行なわれた決定に依存して、イントラフレーム予測モジュール336からインター予測された基準サンプル378を選択するか、または動き補償ブロック334からインター予測された予測単位(PU)376を選択する。総和モジュール342は、デブロッキングフィルタモジュール330に入力される総和370を生成する。デブロッキングフィルタモジュール330は、メモリ206内で構成されたフレームバッファモジュール332に対して書き込まれる、デブロッキングされたサンプル372を生成して、ブロック境界に沿ってフィルタリングを実行する。フレームバッファモジュール332は、基準画像リストの一部として将来の参考のための1つ以上の過去フレームからのデータを保持するのに十分な容量を有するバッファである。
開発中の高効率動画像符号化方式(HEVC)規格に関しては、エントロピーエンコーダ324によって生成された符号化ビットストリーム312は、ネットワーク抽象化層(NAL)単位に描写される。一般的に、フレームの各スライスは、1つのNAL単位内に含まれる。エントロピーエンコーダ324は、コンテキスト適応可能な2進算術演算符号化(CABAC)アルゴリズムを実行することによって符号化ビットストリーム312内に残差係数配列364、イントラ予測モード380、動きベクトル、および他のパラメータ(まとめて「構文要素」と呼ばれる)を符号化する。構文要素は、「構文構造」にグループ化され、これらのグループ化は、階層構造を記載するために再帰を含んでもよい。イントラ予測モードなどの序数値、または動きベクトルなどの整数値に加えて、構文要素は、四分木分割などを示すために、フラグを含む。動き推定モジュール338および動き補償モジュール334は、フレームデータ310内のフレーム間の動きの高精度モデリングを可能にする、輝度サンプルの1/8の精度を有する、運動ベクトル374上で動作する。
図4のビデオデコーダ134は、高効率動画像符号化方式(HEVC)ビデオ復号化パイプラインを参照して説明するが、モジュール420〜434によって実行される処理段階は、エントロピーコーディング(H.264/MPEG−4 AVC、MPEG2およびVC−1)を用いる他のビデオコーデックと共通である。符号化ビデオ情報は、また、メモリ206、ハードディスクドライブ210、CD−ROM、ブルーレイ(商標)ディスク、または他のコンピュータ読み取り可能記録媒体から読み取ってもよい。または、符号化ビデオ情報は、通信ネットワーク220に接続されたサーバまたは無線周波数受信器などの外部ソースから受信してもよい。
図4でわかるように、符号化ビットストリーム312などの受信されたビデオデータは、ビデオデコーダ134に入力される。符号化ビットストリーム312は、メモリ206、ハードディスクドライブ210、CD−ROM、ブルーレイ(商標)ディスク、または他のコンピュータ読み取り可能記録媒体から読み取ってもよい。または、符号化ビットストリーム312は、通信ネットワーク220に接続されたサーバまたは無線周波数受信器などの外部ソースから受信してもよい。符号化ビットストリーム312は、復号化される取得されたフレームデータを表現する、符号化された構文要素を含む。
符号化ビットストリーム312は、符号化ビットストリーム312から構文要素を抽出し、且つ構文要素の値をビデオデコーダ134内の他のブロックに渡す、エントロピーデコーダモジュール420に入力される。エントロピーデコーダモジュール420は、符号化ビットストリーム312から構文要素を復号化するためにコンテキスト適応可能な2進算術演算符号化(CABAC)アルゴリズムを適用する。復号化された構文要素は、ビデオデコーダ134内のパラメータを再製するために用いられる。パラメータは、0以上の残差係数配列450、動きベクトル452、および予測モード454を含む。残差係数配列450は、逆スケール/変換モジュール422に渡され、動きベクトル452は、動き補償モジュール434に渡され、予測モード454は、イントラフレーム予測モジュール426およびマルチプレクサ428に渡される。逆スケール/変換モジュール422は、再製された変換係数を生成するために残差係数データに逆スケール処理を実行する。逆スケール/変換モジュール422は、その後、再製された変換係数を周波数領域表現から空間領域表現に変換する(「または復号化する」)ために「逆変換」を適用して、残差サンプル配列456を生成する。逆スケール/変換モジュール422における逆変換は、逆変換328と同一の動作を実行する。そのため、逆スケール/変換モジュール422は、開発中の高効率動画像符号化方式(HEVC)規格に準拠した符号化ビットストリーム312を復号化するのに必要な変換サイズの所定のセットを提供するように、構成されなければならない。
動き補償モジュール434は、出力復号化フレームデータの予測である、予測単位(PU)に対してインター予測された予測単位(PU)462を生成するためにメモリ206内で構成された、フレームバッファブロック432からの基準フレームデータ460に組み合わされた、エントロピーデコーダモジュール420からの動きベクトル452を用いる。現在の予測単位がイントラ予測を用いて符号化されたことを予測モード454が示す場合、イントラフレーム予測モジュール426は、予測モード454によって供給された予測単位(PU)および予測方向に隣接するサンプルを空間的に用いて予測単位(PU)に対してインター予測された予測単位(PU)464を生成する。空間的に近隣のサンプルは、総和モジュール424から出力された総和458から取得される。マルチプレクサモジュール428は、現在の予測モード454に基づいて、予測単位(PU)466に対してインター予測された予測単位(PU)464またはインター予測された予測単位(PU)462を選択する。マルチプレクサモジュール428から出力された予測単位(PU)466は、その後、デブロッキングフィルタモジュール430の各々に対して入力される総和458を生成する総和モジュール424およびイントラフレーム予測モジュール426によって、逆スケール/変換モジュール422から残差サンプル配列456に加えられる。デブロッキングフィルタモジュール430は、可視のアーチファクトを平滑化するために、変換単位(TU)境界などのデータブロック境界に沿ってフィルタリングを実行する。デブロッキングフィルタモジュール430の出力は、メモリ206内で構成されたフレームバッファモジュール432に書き込まれる。フレームバッファモジュール432は、将来の参考のための1つ以上の復号化フレームを保持するのに十分なストレージを提供する。復号化フレーム412も、また、フレームバッファモジュール432からディスプレイ装置136などのディスプレイ装置まで出力される。
図5Aおよび図5Bは、各々、それぞれ4:2:0および4:2:2色差フォーマットを用いて符号化されたフレーム部分500およびフレーム部分510のサンプルグリッドを示す。ビデオエンコーダ114に対して構成パラメータとして色差フォーマットが指定され、ビデオエンコーダ114は、色差フォーマットを指定する符号化ビットストリーム312に「chroma_format_idc」構文要素を符号化する。ビデオデコーダ134は、使用中の色差フォーマットを決定するために符号化ビットストリーム312から「chroma_format_idc」構文要素を復号化する。例えば、4:2:0色差フォーマットが使われている場合、chroma_format_idcの値は1であり、4:2:2色差フォーマットが使用中である場合、chroma_format_idcの値は2であり、4:4:4色差フォーマットが使用中である場合、chroma_format_idcの値は3である。図5Aおよび図5Bにおいて、輝度サンプル位置501などの輝度サンプル位置は「X」のシンボルを用いて図示され、色差サンプル位置502などの色差サンプル位置は「O」のシンボルを用いて図示される。示されたポイントでのフレーム部分500をサンプリングすることによって、4:2:0色差フォーマットが適用される場合、サンプルグリッドは、各色チャネルに対して取得される。各輝度サンプル位置Xにおいて、輝度チャネル(「Y」)がサンプリングされ、各々の色差サンプル位置Oにおいて、双方の色差チャネル(「U」および「V」)がサンプリングされる。図5Aに示されるように、各色差サンプル位置に対して輝度サンプル位置の2×2配置が存在する。フレーム部分510内に示された輝度サンプル位置での輝度サンプルおよび色差サンプル位置での色差サンプルをサンプリングすることによって、サンプルグリッドは、4:2:2色差フォーマットが適用される場合に、各色チャネルに対して取得される。色チャネルに対する同一のサンプル割り当ては、フレーム部分510に対して、フレーム部分500と同様に作成される。フレーム部分500とは対照的に、2倍の数の色差サンプル位置がフレーム部分510内に存在する。フレーム部分510において、色差サンプル位置は、2番目の輝度サンプル位置ごとに配置される。従って、図5Bにおいて、各色差サンプル位置に対して、2×1輝度サンプル位置の配置が存在する。
以上、変換単位の様々な許容寸法を、輝度サンプルの単位において、説明した。輝度チャネルに対して適用された変換によってカバーされる領域は、したがって、変換単位寸法と同一の寸法を有することになる。変換単位も色差チャネルを符号化するので、各々の色差チャネルに対して適用される変換は、使用中の特定の色差フォーマットに従って適応された寸法を有することになる。例えば、4:2:0色差フォーマットが使用中である場合、16×16変換単位(TU)は、16×16変換を輝度チャネルに対して用い、8×8変換を各色差チャネルに対して用いることになる。4×4変換が輝度チャネルに対して用いられる1つの特殊なケースは、色差チャネルに対して用いることができた(4:2:0色差フォーマットが適用される場合に)利用可能な対応する2×2変換、または(4:2:2色差フォーマットが適用される場合に)利用可能な4×2変換が存在しないという場合である。この特殊なケースにおいては、各色差チャネルに対する4×4変換は、複数の輝度変換によって占有された領域をカバーしてもよい。
図6Aは、フレームの符号化ツリーブロック(CTB)600内の(太い境界線で表現された)符号化単位(CU)602の例示的な変換ツリーの概略図である。単一の四分木細分割は、符号化ツリーブロック(CTB)600を、符号化単位(CU)602などの4つの32×32符号化単位(CU)に分割する。例示的な変換ツリーは、符号化単位(CU)602内に存在する。例示的な変換ツリーは、図6A(例えば変換単位#9(TU)604)のように番号付けされた10個の変換単位(TU)をもたらす、いくつかの四分木細分割を含む。変換単位#1〜#10は、符号化単位(CU)602の全体をカバーする。各四分木細分割は、領域を4つの象限に空間的に分割し、4つのさらに小さな領域をもたらす。各変換単位(TU)は、変換ツリー内の変換単位(TU)の階層レベルに対応する変換深度値を有する。階層レベルは、四分木細分割の数が、終了した四分木細分割の前に実行され、結果として、対応する領域を占有する変換単位(TU)のインスタンスをもたらすことを示す。例えば変換単位#9(TU)604は、符号化単位(CU)602の4分の1の領域を占めており、そのため、1である変換深度を有する。各変換単位(TU)は、輝度サンプルグリッド上に変換単位(TU)を含む領域の寸法として一般的に記載される、関係付けられたサイズ(または「変換サイズ」)を有する。サイズは、符号化単位(CU)のサイズおよび変換深度に依存する。ゼロである変換深度を有する変換単位(TU)は、対応する符号化単位(CU)のサイズと同等サイズを有する。各変換深度のインクリメントは、所定の変換深度での変換ツリー内にある変換単位(TU)のサイズの半値をもたらす。フレームが一つの輝度チャネルおよび複数の色差チャネルを含むので、符号化単位(CU)602は、輝度サンプルグリッドおよび色差サンプルグリッドの両方の領域を占有し、したがって、各変換単位(TU)は、輝度サンプルグリッド上の輝度サンプルおよび色差サンプルグリッド上の色差サンプルの両方を記載する情報を含む。各変換単位(TU)に対する情報の性質は、ビデオエンコーダ114またはビデオデコーダ134の処理段階に依存する。変換モジュール320への入力および逆スケール/変換モジュール422の出力時、残差サンプル配列360、456は、それぞれ、空間領域内の各変換単位(TU)に対する情報を含んでいる。残差サンプル配列360、456は、輝度チャネルと色差チャネルとの間の処理時の差分に起因して、「色差残差サンプル配列」および「輝度残差サンプル配列」にさらに分割されてもよい。スケール/量子化モジュール322からの出力および逆スケール/変換モジュール422への入力時において、残差係数配列364、450は、それぞれ、周波数領域内の各変換単位(TU)に対する情報を含む。残差係数配列364、450は、輝度チャネルと色差チャネルとの間の処理の差分に起因して、「色差残差係数配列」および「輝度残差係数配列」にさらに分割されてもよい。
図6Bは、輝度サンプルグリッド上の32×32輝度サンプル配列を占有する、1セットの変換単位(TU)を含んで符号化単位(CU)602を占有する、32×32符号化単位(CU)の輝度チャネルに関して、図6Aの例示的な変換ツリーに対応する、例示的な変換ツリー630を図示する。図7は、例示的な変換ツリー630を表現するデータ構造700を図示する。図6Bにおいて、1〜10と番号付けられたボックスは、(いくつかの変換単位(TU)640によって例示された)領域632内に存在する変換単位を示し、各ボックスは、さらに細分割された(破線の境界線を有するボックスによって示された)領域内に含まれる。
図6Bにおいて、1および9と番号付けられたボックスは、輝度チャネルに対する16×16変換を含み、2、3および8と番号付けられたボックスは、輝度チャネルに対する8×8変換を含む、4〜7と番号付けられたボックスは、輝度チャネルに対する4×4変換を含む。これらのボックスの各々に対応する領域(破線のボックス)は、変換の存在を示すために符号化ブロックフラグ値1を有する。
各色チャネルに対する変換の有無は、以下に論じられるように、ビットストリームの各々の符号化/復号化に用いられるが、ビットストリームにおいては送信される必要はない、個別の符号化ブロックフラグ値によって指定される。結果的に、エントロピーデコーダ420から出力される残差係数配列450の数は、符号化ブロックフラグ値に依存する。どの色チャネル内にも有意係数がない場合、エントロピーデコーダ420から出力される残差係数配列450の数は、ゼロである。
図7において、円は、対応する円の内部に示される分割変換フラグ値とともに分割変換フラグ値を表現する。図7において、三角形は、対応する三角形の内部に示される符号化ブロックフラグ値とともに符号化ブロックフラグ値を表現する。正方形は、図6Bにある変換番号に一致するように番号付けされた各変換とともに変換単位を表現する。
例示的な変換ツリー630の最上部の階層レベルは、32×32符号化単位(CU)を占有する領域632を含んでいる。分割変換フラグ値702は、領域632が4つの16×16領域(例えば領域634)に細分割されることを示し、したがって例示的な変換ツリー630の「非リーフ」ノードを定義する。各16×16領域に関しては、分割変換フラグ値704などのさらなる分割変換フラグ値は、それぞれの16×16領域が4つの8×8領域にさらに細分割されるべきであることを示す。例えば、ゼロである分割変換フラグ値704によって示されるように、領域634はさらに細分割されず、したがって例示的な変換ツリー630の「リーフ」ノードを定義する。対照的に、1である分割変換フラグ値712によって示されるように、領域638は、領域636などの4つの4×4領域にさらに細分割される。変換ツリー630内に存在する再帰的な分割構造は、符号化ツリーブロック(CTB)内にある四分木分割に類似する。輝度チャネルに関しては、四分木の「リーフ」ノードにおいて、変換単位(TU)内の変換の有無が符号化ブロックフラグ値によって信号伝達され、例えば、1である符号化ブロックフラグ値708は、領域634内の変換710の有無を示す。
変換が各領域内の残差データを表現するために用いられてもよいので、輝度チャネルに対して4×4輝度サンプルなど、領域がサポートされた最小変換サイズより小さくなることを許可しない。その上、利用可能な最大変換サイズより大きな領域に関しては、1である分割変換フラグ値が暗示される。例えば、64×64符号化単位のトップレベルを有する変換ツリーに関しては、サポートされた最大変換サイズが32×32輝度サンプルである場合、4つの32×32領域への自動細分割(すなわち:符号化ビットストリーム312内で信号伝達されない)が発生する。
右下の16×16領域642は、輝度チャネルに対する変換がない変換単位(TU)(10と番号付けされ、網掛けされている)を含んでおり、そのため、対応するゼロである符号化ブロックフラグ値716を有する。
図6Cおよび図8は、4:2:2色差フォーマットに構成され、輝度チャネルに対する変換ツリー630に対応し且つデータ構造800によって表現された色差チャネルに対する1セットの変換を含む、色差チャネルに対する、図6Aの例示的な変換ツリーに対応する例示的な変換ツリー630を図示する。変換ツリー階層が輝度チャネルと色差チャネルとの間の図6Aの構造によって共通するので、分割変換フラグ値は、データ構造700と800との間で共有される。データ構造700とは対照的に、データ構造800は、1である各変換分割フラグ値を有する符号化ブロックフラグ値を含む(すなわち変換ツリーの非リーフノード上に)。例えば、1である符号化ブロックフラグ値802は、変換分割フラグ702に関連づけられる。変換ツリーの非リーフノード上の符号化ブロックフラグ値がゼロである場合、子ノード上の符号化ブロックフラグ値は、ゼロとして暗示される(および、対応する符号化ブロックフラグは、符号化ビットストリーム312内で符号化されない)。非リーフ領域における符号化ブロックフラグ値は、たとえ大幅な残差係数が輝度チャネル内にあり得るとしても、大幅な残差係数が子領域のどれにもなければ、各色差チャネルに対する変換ツリーの下位レベルでの符号化ブロックフラグの符号化を終了することを可能にする。大部分の情報が輝度チャネル内にあるので、これは典型的な取得されたフレームデータに共通の状態である。
ビデオエンコーダ114およびビデオデコーダ134が4:4:4色差フォーマット用に構成される場合、変換単位(TU)サイズの所定のセットの1つでないサイズの任意の変換単位(TU)の各色差チャネルの色差領域は、所定の変換単位(TU)の輝度領域と同一の寸法を有する(すなわち、暗黙的分割が行なわない場合)。ビデオエンコーダ114およびビデオデコーダ134が4:4:4色差フォーマットに構成される場合、変換単位(TU)サイズの所定のセットの1つであるサイズの任意の変換単位(TU)の各色差チャネルの色差領域は、所定の変換単位(TU)の輝度領域よりも小さな寸法を有する(すなわち、暗黙的分割が行なれる場合)。
4:2:2色差フォーマットが使用されている場合、これは、各色差チャネルに対して図6Cの色差サンプルの16×32領域662を含み、したがって、色差サンプルグリッド上の16×32領域を占有する、符号化単位(CU)602をもたらす。図6Cは、(図5Bとは対照的に)水平および垂直に等間隔に配置された各色差サンプルとともに、色差サンプルの配列として描画された、色差サンプルグリッド上の領域を図示する。4:2:2色差フォーマットの使用に起因して、図6Cの各色差領域は、図6Bの対応する輝度領域に対して水平に圧縮されたように見える。1である分割変換フラグ値702は、符号化単位(CU)602に対応する、16×32領域662を、8×16領域664などの4つの8×16領域に分割する。8×16領域664は、非正方形形状を有し、また、4×8領域670などの図6Cに図示された他の非正方形領域のサイズより大きい。各8×16領域に関しては、分割変換フラグ値704などの分割変換フラグ値は、輝度サンプル配列に対する変換ツリー630内にある四分木分割に類似した方式で、対応する8×16領域が4つのより小さな4×8領域にさらに細分割されるべきか否かを示す。右上の8×16領域672は、4つの4×8領域にさらに細分割される。1である符号化ブロックフラグ値804は、4つの4×8領域の各々が大幅な残差係数を含むかもしれないことを示す。各4×8領域に対する符号化ブロックフラグは、したがって、対応する領域に対する変換の有無を示すように要求される。これらの4つの4×8領域のうち、(網掛けされた)左下の4×8領域674は、変換単位(TU)を含むが、変換を含んでおらず、そのため、ゼロである符号化ブロックフラグ値814を有する。残りの4×8領域(領域670)は、各々、変換を有し、そのため、対応する1である符号化ブロックフラグ値を有する。左上の8×16領域は、2つの等しいサイズの8×8領域に細分割される。四分木細分割とは対照的に、対応する分割変換フラグは、符号化ビットストリーム312内にない。
符号化ビットストリーム312内にある信号伝達を行わずに、複数の領域(その各々は変換を有してもよい)への、変換単位(TU)の色差チャネルなどのチャネルの領域の分割は、「暗黙的分割」と呼ばれる。暗黙的分割は、このケース(8×16)のための非正方形変換をサポートするハードウェアを導入する必要を省く。その代わりに、第1の8×8変換666などの変換が用いられる。暗黙的分割から起因する領域の各々にとって、ゼロ残差情報をすべて含むことが可能であるので、暗黙的分割から起因する各領域内の変換の有無を指定することが必要である。従って、個別の符号化ブロックフラグ値は、暗黙的分割から起因する各領域に必要である。この場合、符号化ブロックフラグ値806および808は、第1の8×8変換666および第2の8×8変換668にそれぞれ対応する。暗黙的分割が行なわない変換単位(TU)に関しては、各色差チャネルに対する符号化ブロックフラグ値は、色差チャネルに対する変換単位(TU)によって占有された領域に対する変換の有無を指定する。暗黙的分割を行なう場合、個別の符号化ブロックフラグ値(図8には図示せず)は、結果として生じる領域の各々に対して必要であるが、しかしながら、実施態様は、全体の変換単位(TU)に帰着可能な符号化ブロックフラグ値を保持してもよい。すべてのケースのうちの「1つ」として個別の符号化ブロックフラグ値を暗示することができるかもしれないし、または、分割から起因する各領域の符号化ブロックフラグ値に対する論理的「OR」動作を実行することによって、個別の符号化ブロックフラグ値を決定することができるかもしれない。個別の符号化ブロックフラグ値が分割に起因する各領域の符号化ブロックフラグ値から決定される場合、個別の符号化ブロックフラグ値は、エントロピーエンコーダ324によって符号化ビットストリーム312内で符号化され、付加的な符号化ブロックフラグ(図9には図示せず)としてエントロピーデコーダ420によって符号化ビットストリーム312から復号化されてもよい。このようなケースにおいて、個別の符号化ブロックフラグ値がゼロである場合、分割から各領域の符号化ブロックフラグ値はゼロであると推論されてもよく、個別の符号化ブロックフラグ値が1である場合、分割から各々の領域に対する符号化ブロックフラグは、エントロピーエンコーダ324によって符号化ビットストリーム312内で符号化され、エントロピーデコーダ420によって符号化ビットストリーム312から復号化される。
16×32領域662の左下の8×16領域680は、8×8変換が上部の8×8暗示領域682内にあるが、8×8変換が下の8×8暗示領域684内にない暗黙的分割を図示する。右下の(網掛けされた)8×16配列676は、変換単位(TU)を含むが、暗黙的分割から起因する一方の正方形の8×8領域内の変換を含まず、そのため、ゼロである符号化ブロックフラグ値810、812を有する。
2つの色差チャネルの有無は、各色差チャネルに対する変換の有無を指定するために用いられる個別の符号化ブロックフラグ値により、図6Cに表現された構造の複製をもたらす。この実施態様において、分割は、サイズ4×8以外の色差に対する領域サイズに対して推測され、結果として、(領域670内に含まれる)4×8変換816などの4×8の長方形変換を用いて他のケース(例えば8×8、16×16)における既存の正方形変換の再使用を可能にする。従って、8×16および16×32などの1セットの所定の領域サイズは、2つの領域への分割のために存在すると言ってもよく、したがって、(サイズ8×8および16×16の)2つの変換を用いることができる。また、推測分割が発生する領域サイズの所定のセットの個別の定義が可能であり、既存の正方形変換および長方形変換の個別の組み合わせが用いられることを可能にすることになる。また、分割を常に推測することはある実施態様にとって可能であり、その場合には、長方形変換は、色差4:2:2色チャネルに対して導入されない。このようなケースにおいて、推測分割が発生する領域サイズの所定のセットは、あらゆる色差領域サイズ(例えば、4:2:2色差フォーマットに対する4×8、8×16、および16×32、または4:4:4色差フォーマットに対する4×4、8×8、16×16、および32×32)を含んでいる。
4:2:0色差フォーマットが使用中である場合、推測分割は、変換単位(TU)内のいずれの色差領域に対しても行なわれないので、各色差チャネルに対する最大変換数は、常に1である(各色差チャネルに対する符号化ブロックフラグ値は、色差変換が発生するか否かをコントロールする)。
ビデオエンコーダ114およびビデオデコーダ134は、輝度と色差チャネルとの間の差分と無関係に記載され、色差フォーマットから起因する、異なるサンプルグリッドは、モジュール内の差分の必要性を要する。実際的な実施態様は、輝度チャネルおよび色差チャネルに対する個別の「処理経路」を有してもよい。このような実施態様は、したがって、輝度サンプルおよび色差サンプルの処理を分離してもよい。符号化ビットストリーム312が輝度チャネルおよび色差チャネルの両方に対して単一のビットストリームであるので、エントロピーエンコーダ324およびエントロピーデコーダ420は分離されない。その上、フレームバッファ332、432などの単一のフレームバッファは、輝度サンプルおよび色差サンプルを保持しており、したがって分離されない。但し、モジュール322〜330および334〜340、モジュール422〜430および434は、実施態様が分離された輝度処理および色差処理を有し、輝度および色差に対して個別のロジックを有することを可能にして、それにより、「輝度処理経路」および「色差処理経路」を生成してもよい。
ある実施態様は、2つの16×16領域への変換単位(TU)の色差チャネルの16×32領域に対する分割を推測してもよいが、8×16および4×8のケースに対する分割を推測しなくてもよい。このような実施態様は、当該技術分野において確立された4、8または16ポイントの変換ロジックに頼ることができる代わりに、色差処理経路に対して32ポイントの変換ロジックを導入する必要性を回避する。
図9Aおよび図9Bは、変換ツリーの階層レベルを符号化するか、さもなければ表現するために用いることができる構文構造を図示する。変換ツリーの非リーフノードにおいて、変換ツリーに対応する符号化ビットストリーム312の一部にある構文要素を定義するために、構文構造900は、データ構造700、800などのデータ構造によって再帰的に拡大される。変換ツリーのリーフノード(変換ツリー内で細分割が行なわれない)において、構文構造930は、符号化ビットストリーム312の一部にある構文要素を定義する。通常は、付加データ構造は、アルファチャネルまたは深度マップを符号化するためなどに可能であるが、輝度のための1つのデータ構造および色差のための2つのデータ構造がある。または、少数のデータ構造は、単一のデータ構造が色差チャネルによって共有され、符号化ブロックフラグ値が色差チャネルの間で共有されることができるケースなどで利用されてもよい。変換ツリーの非リーフノード構文構造902は、変換ツリー630などの変換ツリーの1つの階層レベルの符号化を定義する。分割変換フラグ910は、分割変換フラグ値702などの、1である分割変換フラグ値を符号化する。この値は、変換ツリー非リーフノード構文構造902が変換ツリー非リーフノード構文構造902または変換ツリーリーフノード構文構造932の付加的な実例を含む低階層レベル、または「子ノード」を含むことを示す。符号化ブロックフラグ912は、「U」色差チャネルに対して1つの符号化ブロックフラグ値802を符号化し、符号化ブロックフラグ914は、「V」色差チャネルに対するさらなる符号化ブロックフラグ値を符号化する。変換ツリー非リーフノード構文構造902が変換ツリー階層のトップレベルを定義しているのであれば、符号化ブロックフラグ912、914が存在する。変換ツリー非リーフノード構文構造902が変換ツリー階層のトップレベルを定義していないのであれば、符号化ブロックフラグ912、914は、変換ツリー階層の親レベル内に対応する符号化ブロックフラグが存在して一価であれば、単に存在するだけである。(最上部の階層レベルに比べて)より低い階層レベルが変換ツリー630内に存在するとき、四分木細分割は行なわれる。この細分割は、変換ツリー非リーフノード構文構造902内に含まれる4つの変換ツリー構文構造916、918、920、922をもたらす。
構文構造930は、変換ツリーリーフノード932のリーフノードの符号化を定義する(すなわち、それ以上細分割が行なわない場合)。分割変換フラグ940は、分割変換フラグ値704などの0である分割変換フラグ値を符号化する。
対応する領域が最小サイズより大きい場合、分割変換フラグは、単に符号化される。例えば、領域636は、(サポートされた最小輝度変換サイズに対応する)4×4輝度サンプルの領域に対する容認できる最小サイズを有する。従って、変換分割フラグ値714は、ゼロとして推測され、分割変換フラグは、対応する変換ツリー構文構造に対して符号化されない。
領域636に関しては、色差残差サンプルは、4×8色差変換を用いて変換され、従って、推測された変換分割は存在しない。符号化ブロックフラグ942および符号化ブロックフラグ946などの符号化ブロックフラグは、色差チャネルの各々に対する変換の有無を信号伝達するために存在してもよい。符号化ブロックフラグ950は、輝度チャネルに対する変換の有無を信号伝達する。輝度チャネルおよび色差チャネルのための残差係数(もし存在すれば)は、変換単位(TU)構文構造952内に存在する。符号化ブロックフラグ950の値が1であるならば、輝度残差ブロック954は、符号化ビットストリーム312内にある。各色差チャネルに対する符号化ブロックフラグの値が1であるならば、対応する色差残差ブロック956、960は、符号化ビットストリーム312内に存在する。
領域664に関しては、色差残差サンプルが2つの8×8色差変換を用いて変換され、従って、推測された変換分割は存在する。符号化ブロックフラグ942、946は、もし存在すれば、第1の8×8変換666の各色差チャネルに対して8×8変換の有無を信号伝達する。符号化ブロックフラグ944、符号化ブロックフラグ948は、もし存在すれば、第2の8×8変換668の各色差チャネルに対して8×8変換の有無を信号伝達する。符号化ブロックフラグ944の値が1であるならば、色差残差ブロック958は、符号化ビットストリーム312内に存在する。符号化ブロックフラグ948の値が1であるならば、色差残差ブロック962は、符号化ビットストリーム312内に存在する。
図9Bに図示されるような構文構造930は、推測された変換分割に隣接して符号化された各色差チャネルの第1および第2の変換を示す。隣接する各色差チャネルに対して構文要素を符号化するか、または他の構文要素とともに散在した各色差チャネルに対して構文要素を符号化する他の配列が、または用いられてもよい。
図9Cおよび図9Dは、変換ツリーの階層レベルを符号化するか、さもなければ表現するために用いることができる、代替的な構文構造9100を図示する。変換ツリーの非リーフノードにおいて、変換ツリーに対応する符号化ビットストリーム312の一部内にある構文要素を定義するために、代替的な構文構造9100は、データ構造700、800などのデータ構造に従って再帰的に拡大される。代替的な構文構造9100のインスタンスは、各変換単位(TU)を含む、リーフノードを含む変換ツリー内の各々のノードごとに存在する。各色差チャネルに対する変換単位(TU)を細分化するために「推測分割」が発生する場合、構文構造9130は、符号化ビットストリーム312の一部内にある構文要素を定義する。通常は、付加データ構造は、アルファチャネルまたは深度マップを符号化するためなどに可能であるが、輝度のための1つのデータ構造および色差のための2つのデータ構造がある。または、少数のデータ構造は、単一のデータ構造が色差チャネルによって共有され、符号化ブロックフラグ値が色差チャネルの間で共有されることができるケースなどで利用されてもよい。変換ツリー構文構造9102は、変換ツリー630などの変換ツリーの1つの階層レベルの符号化を定義する。
変換ツリー630などの変換ツリーの非リーフノードにおける変換ツリー構文構造9102のインスタンスに関しては、分割変換フラグ9110は、分割変換フラグ値702などの1である分割変換フラグ値を符号化する。この値は、変換ツリー構文構造9102のインスタンスが変換ツリー構文構造9102または「子ノード」の付加的な実例を含む、低い階層レベルを含むことを示す。符号化ブロックフラグ9112は、符号化ブロックフラグ912の記述によって符号化ブロックフラグ値を符号化する。符号化ブロックフラグ9114は、符号化ブロックフラグ914の記述によって符号化ブロックフラグ値を符号化する。(最上部の階層レベルに比べて)より低い階層レベルが変換ツリー630内に存在するとき、四分木細分割は行なわれる。この細分割は、変換ツリーノード構文構造9102内に含まれている、4つの変換ツリー構文構造9116、9118、9120、9122をもたらす。変換ツリー構文構造9116、9118、9120、9122の各々は、変換ツリー構文構造9102の別のインスタンスである。符号化ブロックフラグ9124および輝度変換単位部分9126は、変換ツリー構文構造9102から存在しないことになる。
実施態様は、また、変換ツリー構文構造9102を符号化ブロックフラグ9124および輝度変換単位部分9126(もし存在すれば)が、符号化ブロックフラグ9114と変換ツリー構文構造9116との間などの、変換ツリー構文構造9102内に初期に配置されるように配置してもよい。
変換ツリー630などの変換ツリーのリーフノードにおける変換ツリー構文構造9102のインスタンスに関しては、分割変換フラグ9110は、分割変換フラグ値704などのゼロである分割変換フラグ値を符号化する。変換ツリー構文構造9102のインスタンスは、したがって、変換ツリー930内の変換単位(TU)に対応する。変換単位(TU)は、符号化単位(CU)602などの変換単位(CU)および変換深度を含む符号化単位(CU)によって決定されたサイズを有する。符号化ブロックフラグ9112は、「U」色差チャネルに対する推測分割に起因するあらゆる色差領域が1である符号化ブロックフラグ値を有してもよいことを示すために、1である符号化ブロックフラグ値を符号化する。符号化ブロックフラグ9112がゼロの値を符号化するならば、「U」色差チャネルに対する推測分割に起因する各色差領域に対する符号化ブロックフラグ値は、ゼロとして推測された符号化ブロックフラグ値を有する。符号ブロックフラグ9112が1である値を符号化する場合でさえ、実施態様は、推測分割から起因する各色差領域に対してゼロである値を有する符号化ブロックフラグをさらに符号化してもよい。そのため、実施態様は、符号化ビットストリーム312から符号化ブロックフラグ9112を省略してもよいが、その代り、省略された符号化ブロックフラグ9112に対して1つの符号化ブロックフラグ値を常に推測する。符号化ブロックフラグ9114は、符号化ブロックフラグ9112と同様の方式で「V」色差チャネルに対してさらなる符号化ブロックフラグ値を符号化する。4つの色差領域への推測分割が発生するものに一致する変換単位(TU)サイズに関して(色差残差係数配列の最大数は4である)、4つの変換ツリー構文構造9116、9118、9120、9122は、変換ツリーノード構文構造9102内に含まれる。2つの色差領域への推測分割が発生するものに一致する変換単位(TU)サイズに関して(色差残差係数配列の最大数は2である)、変換ツリー構文構造9116、9118などの2つの変換ツリー構文構造は、変換ツリーノード構文構造9102内に含まれる。変換ツリー構文構造9116、9118、9120、9122の各々は、色差構文構造9132に対する変換ツリーのインスタンスである。符号化ブロックフラグ9124は、変換単位(TU)の輝度チャネルに対する変換の欠如の有無を指定する、符号化ブロックフラグ値708などの符号化ブロックフラグ値を符号化する。変換単位9126の輝度部分は、輝度残差構文要素9128として輝度残差係数配列を符号化する。
推測分割が行なわれる場合に各色差領域対して存在するのみの、色差構文構造9132に対する変換ツリーは、変換ツリー構文構造930の構文の縮小されたセットを含む。符号化ブロックフラグ9142は、色差領域の「U」色差チャネルに対する符号化ブロックフラグ値を符号化する。符号化ブロックフラグ9144は、色差領域の「V」色差チャネルに対する符号化ブロックフラグ値を符号化する。変換単位(TU)9146の色差部分は、変換単位(TU)構文構造952のサブセットを符号化する。符号化ブロックフラグ9142の値が1であるならば、変換単位(TU)9146の色差部分は、「U」色差チャネルに対する色差残差構文要素9150として色差残差係数配列を符号化する。符号化ブロックフラグ9144の値が1であるならば、変換単位(TU)9146の色差部分は、「V」色差チャネルに対する色差残差構文要素9152として色差残差係数配列を符号化する。
図9Dに図示されるような構文構造9130は、隣接して符号化された第1および第2の符号化ブロックフラグに続く、推測された変換分割に対する各色差チャネルの第1および第2の色差残差係数配列を示す。各色差チャネルに隣接して符号化ブロックフラグおよび色差残差係数配列を符号化するなどの他の配列が、代わりに用いられてもよい。
推測された変換分割は、2つの8×8領域への8×16領域664分割により図示されるが、代替的な実施態様は、他の領域に対する分割を実行してもよい。例えば、いくつかの実施態様は、2つの16×16領域への16×32領域の分割を推測してもよい。このような実施態様は、色差処理経路内の32ポイントの1次元変換に対する必要性を有利に回避する。4:2:0色差フォーマットが適用される場合、32ポイントの1次元変換が色差処理経路には必要でないので、32ポイントの1次元変換に対する要件は、色差処理経路から全体に取り除かれる。輝度および色差チャネルを分離する個別の処理回路を用いる実施態様は、したがって、色差処理回路の低実装コストを達成することができる。
各輝度サンプル位置に対する1つの色差サンプル位置があるところに、4:4:4色差フォーマットは存在する。従って、この形式により、色差チャネルおよび輝度チャネルに対する変換は、同一のサイズを有してもよい。輝度処理経路内の32×32の最大変換サイズにより、これは、分離された実装に対して色差処理経路内の32×32変換を導入することを要するだろう。特定の実施態様は、色差処理経路内の現存の16×16変換の再使用を可能にする、4つの16×16領域に、32×32領域を分割するために各色差チャネルに対する分割を推測してもよい。32×32変換が4:4:4色差フォーマットに対して色差処理経路においてのみ用いられるので、4つの16×16領域への32×32領域を分割する各々の色差チャネルに対する分割の推測は、必要とされる処理回路を低減して、32×32変換が色差処理経路から取り除かれるのを可能にする。このような実施態様は、各色差チャネルに対する4つの符号化ブロックフラグ値、したがって、符号化ビットストリーム312内の各色差チャネルに対して構文構造930内で符号化された4つの符号化ブロックフラグまで、を必要とするだろう。
4:2:2色差フォーマットをサポートする実施態様は、また、各色差チャネルが4つの8×16領域に32×16領域を分岐するために分割を推測してもよい。このような実施態様は、各色差チャネルに対する4つの符号化ブロックフラグ値を要し、したがって、符号化ビットストリーム312内の各色差チャネルに対して構文構造930内で符号化された4つの符号化ブロックフラグ、したがって「CU3」、「CU4」、「CV3」および「CV4」符号化ブロックフラグ(図9Bには図示せず)は、変換単位(TU)構文構造952内に導入されてもよい。このような実施態様は、色差処理経路への32ポイントの変換ロジックの導入を回避するとともに、8×16領域が細分割されない場合には、色差チャネルに対してサイズ8×16の変換を要する(輝度チャネル内の)サイズ16×16の変換単位(TU)に必要な8×16変換ロジックを再使用してもよい。
図10は、変換ツリー非リーフノード構文構造902および変換ツリーリーフノード構文構造932の符号化によって、変換単位(TU)を符号化する方法1000を示す概略フロー図である。方法1000は、変換単位(TU)の色差チャネルを参照しながら説明するが、方法1000は、変換単位(TU)のあらゆる色差チャネルに適用されてもよい。変換ツリー非リーフノード構文構造902および変換ツリーリーフノード構文構造932が、変換ツリー内の1つのノードを記載するため、方法1000は、符号化ビットストリーム312への変換ツリーの1つのノードを符号化する。例えば、方法1000は、ハードウェアにおいて、またはプロセッサー205上で実行可能なソフトウェアによって、実施されてもよい。方法1000は、変換ツリーのトップレベルに対して最初に起動され、変換ツリーの子ノードを符号化するためにそれ自体(再帰的に)起動することができる。変換単位サイズを決定するステップ1002は、変換ツリーおよび変換単位(TU)の変換深度値を含む符号化単位(CU)サイズに従って変換ツリーにおける変換単位(TU)のサイズを決定する。方法1000が変換ツリーのトップレベルで起動される場合、変換深度値は、ゼロに設定される。さもなければ、変換深度値は、方法1000の親インスタンスによって提供される。分割変換フラグ値702などの分割変換フラグ値は、変換深度値が変換深度を可能にする最大値未満であれば、分割変換フラグ910として符号化ビットストリーム312内で符号化される。
分割変換フラグ値が1である場合、変換ツリー階層の親ノードが、1である対応する符号化ブロックフラグ値を有する場合にのみ、色差符号化ブロックフラグ912、914は、各色差チャネルに対して符号化される。方法1000は、その後、変換ツリーの(変換ツリー構文構造916、918、920、922によって符号化ビットストリーム312の部分において表現された)各子ノードに対して方法1000の新規のインスタンスを起動する。子ノードに対して起動された方法1000の各インスタンスには、1インクリメントした現在の方法1000インスタンス変換深度値に等しい変換深度値が提供される。
分割変換フラグ値がゼロである場合、順方向変換の最大数を識別するステップ1004は、符号化されている領域の各色差チャネルに対して変換最大数(n)を決定する。推測分割が行なわれない場合、この数nは1になる。4:2:2色差フォーマットが使用され、8×16領域664などの色差チャネルの長方形領域に接触し、領域サイズが所定の領域サイズ(例えば16×32、8×16など)のセットの1つである場合、推測分割は行なわれ、最大変換数は2になるだろう(さもなければ、変換数は1になる)。さもなければ(領域サイズが所定の領域サイズのセットの1つではない場合)最大変換数は1になる。例えば、4×8が所定の領域サイズのセットの1つでなければ、最大変換数は1になる。4:4:4色差フォーマットが使用され、接触した領域サイズが所定の領域サイズ(例えば32×32領域など)のセットの1つである場合、推測分割は行なわれ、最大変換数は4になる。さもなければ(領域サイズが所定の領域サイズのセットの1つではない場合)最大数は1になる。例えば、8×8が所定の領域サイズのセットの1つでなければ、最大変換数は1になる。所定の領域サイズのセットは8×16を含むが、他の所定の領域サイズのセットは、4:2:2色差フォーマットが使用中のある場合に16×32、または4:4:4色差フォーマットが使用中のある場合に32×32などの場合のみに可能である。
各々の色差チャネルに対して、親ノードが1つの符号化ブロックフラグ値を有する場合、nの各々に対して、符号化ブロックフラグは、符号化ビットストリーム312内で符号化される。例えば、変換数が2に等しい場合、符号化ブロックフラグ942、944は、分割によって推測された2つの領域の各々に対する変換の有無を示す。順方向変換を選択するステップ1006は、変換深度に順番に依存し、したがって、最大符号化単位内の変換単位の階層レベルに関係する、変換単位(TU)のサイズに基づいて、最大変換数の各々に対して、所定の順方向変換のセットから順方向変換を選択する。変換深度がゼロに等しい場合、変換単位(TU)サイズは、符号化単位(CU)サイズに等しい。変換深度の各インクリメントに対して、変換単位(TU)サイズは半分になる。32×32符号化単位(CU)のサイズ、ゼロである変換深度、および4:2:2色差フォーマットを用いることに関しては、変換単位(TU)サイズは、したがって32×32になり、色差に対する変換サイズは、したがって16×32になる。例えば、最大変換数が2で、色差に対する領域サイズが16×32である場合、16×16順方向変換は、推測分割に起因する色差に対して16×16領域の各々に対して選択される。
順方向変換を適用するステップ1008は、1である符号化ブロックフラグ値を有する、対応する領域上で最大変換数の各々に対して順方向変換を実行する。色差残差サンプル配列を符号化するステップ1008は、一般的に、変換モジュール320によって実行される。これは、色差残差係数配列(周波数領域表現)への各色差残差サンプル配列(空間領域表現)の変換をもたらす。
色差残差係数配列を符号化するステップ1010は、1である符号化ブロックフラグ値を有する各色差チャネルの変換領域の最大数の各々に対して、色差残差係数配列を符号化ビットストリーム312に符号化する。所定の色差チャネルについて所定の変換単位に対して符号化された色差残差係数配列の数は、各変換の符号化ブロックフラグ値に依存し、したがって、ゼロから(多くても)最大変換数まで変化することになる。例えば、変換数が2であり、双方の色差チャネルがカウント値の各々に対して1である符号化ブロックフラグ値を有する場合、色差残差ブロック956、958、960、962は、符号化ビットストリーム312内で符号化される。所定の色差チャネルに関して各変換に対する符号化ブロックフラグ値がゼロであるならば、色差残差ブロックは、その色差チャネルに対する符号化ビットストリーム312内で符号化されない。色差残差係数配列を符号化するステップ1010は、一般的に、エントロピーエンコーダ324によって実行される。
図11は、変換ツリー非リーフノード構文構造902および変換ツリーリーフノード構文構造932の復号化によって、変換単位(TU)を復号化する方法1100を示す概略フロー図である。方法1100は、変換単位(TU)の色差チャネルを参照して説明するが、方法1100は、変換単位(TU)のあらゆる色差チャネルに適用されてもよい。変換ツリー非リーフノード構文構造902および変換ツリーリーフノード構文構造932が、変換ツリー内の1つのノードを記載するため、方法1100は、符号化ビットストリーム312から変換ツリーの1つのノードを復号化する。方法1100は、適切なハードウェア、または代わりに例えばプロセッサー205によって実行可能なソフトウェアにおいて、実行されてもよい。方法1100は、変換ツリーのトップレベルに対して最初に起動され、変換ツリーの子ノードを復号化するためにそれ自体(再帰的に)起動することができる。変換単位(TU)サイズを決定するステップ1102は、変換単位サイズを決定するステップ1002と同一の方式で変換単位(TU)サイズを決定する。変換単位サイズを決定するステップ1102は、変換ツリーおよび変換単位(TU)の変換深度値を含む符号化単位(CU)サイズに従って変換ツリーにおける変換単位(TU)のサイズを決定する。方法1100が変換ツリーのトップレベルで起動される場合、変換深度値は、ゼロに設定されるか、さもなければ、変換深度値は、方法1100の親インスタンスによって提供される。分割変換フラグ値702などの分割変換フラグ値は、変換深度値が変換深度を可能にする最大値未満であれば、分割変換フラグ910として符号化ビットストリーム312から復号化される。
分割変換フラグ値が1である場合、変換ツリー階層の親ノードが、1である対応する符号化ブロックフラグ値を有する場合にのみ、色差符号化ブロックフラグ912、914は、各色差チャネルに対して復号化される。方法1100は、その後、変換ツリーの(変換ツリー構文構造916、918、920、922によって符号化ビットストリーム312の部分において表現された)各子ノードに対して方法1100の新規のインスタンスを起動する。子ノードに対して起動された方法1100の各インスタンスには、1インクリメントした現在の方法1100インスタンス変換深度値に等しい変換深度値が提供される。
分割変換フラグ値がゼロである場合、逆変換の最大数を識別するステップ1104は、順方向変換の最大数(n)を識別するステップ1004と同一の方式で、復号化されている領域の各色差チャネル内にある少なくとも1つの色差残差係数配列の各々に対して(最大)変換数(n)を決定する。推測分割が行なわれない場合、この数nは1になる。4:2:2色差フォーマットが使用されており、8×16領域664などの色差チャネルの長方形領域に接触し、領域サイズが所定の領域サイズ(例えば16×32、8×16など)のセットの1つである場合、推測分割は行なわれ、最大変換数は2なる(さもなければ、変換数は1になる)。さもなければ(領域サイズが所定の領域サイズのセットの1つではない場合)最大変換数は1になる。例えば、4×8が所定の領域サイズのセットの1つでなければ、最大変換数は1になる。4:4:4色差フォーマットが使用されており、接触した領域サイズが所定の領域サイズ(例えば32×32領域など)のセットの1つである場合、推測分割は行なわれ、最大変換数は4になる。さもなければ(領域サイズが所定の領域サイズのセットの1つではない場合)最大数は1になる。例えば、8×8が所定の領域サイズのセットの1つでなければ、最大変換数は1になる。所定の領域サイズのセットは8×16を含むが、他の所定の領域サイズのセットは、4:2:2色差フォーマットが使用されている場合は16×32、または4:4:4色差フォーマットが使用されている場合は32×32などの場合のみに可能である。各々の色差チャネルに対して、親ノードが符号化ブロックフラグ値1を有する場合、(n個)の変換各々に対して、符号化ブロックフラグは、符号化ビットストリーム312内で復号化される。例えば、最大変換数が2に等しい場合、符号化ブロックフラグ942、944は、分割によって推測された2つの領域の各々に対する変換の有無を示す。
色差残差係数配列を復号化するステップ1106は、その後、符号化ブロックフラグ値1を有する符号化ビットストリーム312から各色差チャネルの最大変換数領域の各々に対して残差係数配列を復号化する。所定の色差チャネルについて所定の変換単位に対して復号化された色差残差係数配列の数は、各変換の符号化ブロックフラグ値に依存し、したがって、ゼロから(多くても)「変換数(n)」まで変化することになる。例えば、変換数が2であり、双方の色差チャネルがカウント値の各々に対して1である符号化ブロックフラグを有する場合、色差残差ブロック956、958、960、962は、符号化ビットストリーム312から復号化される。色差残差係数配列を復号化するステップ1106は、一般的に、1である符号化ブロックフラグ値を有する各色差残差係数配列についてエントロピーデコーダ420によって実行される。
逆変換を選択するステップ1108は、その後、各色差チャネルに対して1である符号化ブロックフラグ値を有する最大変換数の各々に対して、所定の逆変換のセットから逆変換を選択する。例えば、最大変換数が2であり、領域サイズが16×32であり、2つの変換の各々に対する符号化ブロックフラグ値が1である場合、16×16逆変換が、推測分割から起因する16×16領域の各々に対して選択される。
逆変換を適用するステップ1110は、符号化ブロックフラグ値1を有する、対応する領域上の最大変換数の各々に対して逆変換を実行する。これは、復号化されたビデオフレームを表現する色差残差サンプル配列(空間領域表現)への各色差残差係数配列(周波数領域表現)の変換をもたらす。逆変換を適用するステップ1110は、一般的に、逆スケール/変換モジュール422によって実行される。
図12Aは、対角スキャンパターン1201を示し、図12Bは、水平スキャンパターン1202を示し、図12Cは、垂直走査パターン1203を示しており、各々は4×8変換単位1200に対するスキャンパターンを示す。図示されたスキャンパターンを用いて4×8変換単位1200をスキャンするそれらの実施態様は、残差係数が「サブブロック」として知られている4×4ブロックにおいてグループ化される特性を有する。そのため、符号化ビットストリーム312内にある「係数グループ」フラグは、各サブブロックに対して、少なくとも1つの有意な(ゼロでない)残差係数の有無を示すために用いられてもよい。4×8変換に対する4×4サブブロックサイズの適用は、係数がサブブロックに常にグループ化される、他の変換サイズ中のスキャンパターンとの整合性を実現する。
特定の実施態様は、各サブブロック内の少なくとも1つのゼロでない残差係数の有無を信号伝達するために係数グループフラグを適用してもよい。有利なことに、これらのスキャンパターンは、すべての変換サイズに対してサブブロック処理を再使用することによって、残差係数を処理する制御ソフトウェアまたはデジタル回路の再使用を可能にする。用いられる特定のスキャンパターンは、配置された予測単位(PU)のイントラ予測方向などの基準に従って選択されてもよい。変換によりが4:2:2色差フォーマットサンプルグリッド上の色差サンプルを符号化する場合、各色差サンプルが、輝度サンプルの非正方形(2×1)配列にマッピングされるためイントラ予測モードの「方向」または角度に影響を与えるので、イントラ予測方向とスキャンパターンとの間の関連性が変更される。スキャニングは、変換単位(TU)の左上隅に配置された、DC係数にて終了する「逆」方向に示される。さらに、スキャニングは、変換単位(TU)の右下コーナーから開始するようにする必要はない。変換単位(TU)の左上領域内のゼロでない残差係数の優位性に起因して、スキャニングは、「最後の有意係数位置」から開始して、左上係数に達する方向で逆方向に進んでもよい。
他の実施態様は、残差係数を符号化するために所定の領域に対して単一のスキャンを適用し、その後、これらの残差係数に対して1つ以上の変換を適用してもよい。この場合、1つの符号化ブロックフラグのみが領域に対して、従ってスキャンパターンによってカバーされるすべての変換に対して、用いられる。少なくとも1つの有意な残差係数がいずれかのスキャン内に存在する場合、符号化ブロックフラグは1に設定される。例えば、図12A〜図12Cの4×8スキャンパターンは、2つの4×4変換の残差係数を符号化するために適用されてもよい。残差係数の2つの4×4配列は、スキャンパターンに適している4×8配列を形成するために連結されてもよい。単一のスキャンが配列を通じて実行されるので、単一の「最後の有意係数」の位置は、スキャンパターンに対してビットストリーム内で符号化され、単一の符号化ブロックフラグ値は、配列にとって十分である。修正離散コサイン変換(DCT)のエネルギー圧縮性は、長方形の係数配列へのスキャンパターンの経路に沿って各正方形変換の係数を交互配置するなどの他のスキームに対する有利性を与える。これは、各4×4残差係数配列内の残差係数値の密度が、エントロピーデコーダ420による後続の復号化に対して、高圧縮効率がエントロピーエンコーダ324によって生成されることを可能にする、組み合わされた4×8配列とほぼ等しくなるという有利性を与える。
色差の色チャネルを符号化するある実施態様は、4:2:0色差サンプルグリッドに対応する色差サンプル位置で残差サンプルを符号化する第1の変換と、4:2:0色差サンプルグリッドに対して、4:2:2色差サンプルグリッド内に導入された付加的な色差サンプル位置で残差サンプルを符号化する第2の変換とを用いてもよい。このような実施態様は、第2の変換の出力が第1の変換にたいして、第2の変換に対する残差サンプルを生成するために残差サンプルに加えられる(さもなければ組み合わされる)、アダマール変換などの、第2の変換に対して単純化された変換を有利に用いてもよい。有利には、ハール変換などの変換を実施する前処理段階は、4:2:0色差フォーマットに対する色差サンプルグリッドに、4:2:2色差フォーマットに対する色差サンプルグリッドをサンプリングするために用いられてもよい。このような構成はサイド情報として前処理段階から付加的な残差係数を伝送しなければならない。このような残差は、前処理変換が最大符号化単位(LCU)レベルで適用されるケースにおいて各最大符号化単位(LCU)に適用される。
所定の領域に対する複数の変換を有する実施態様は、全体領域をカバーする単一の組み合わされたスキャンまたは個別のスキャンのいずれかを各々の変換に対して用いてもよい。複数の変換に対するスキャニングが単一のスキャンに組み合わされた場合、1つの符号化ブロックフラグのみが、スキャンされる各領域に必要である。単一の組み合わされたスキャンを用いるそれら実施態様は、同様の分光特性を有する各変換から残差係数を配置するために、係数ごとに基づいて交互配置するなど、各変換の残差係数を交互配置することによって、残差係数の高圧縮を実現してもよい。
付録Aは、構文構造900および構文構造930に関連する開発中の高効率動画像符号化方式(HEVC)規格にありうる「テキスト」を図示する。付録Aにおけるtransform_tree()関数の各インスタンスは、図9Aおよび図9Cにおいて「TT」とラベルづけされた構文構造の一部として表現され、付録Aにおけるtransform_unit()関数の各インスタンスは、図9Aおよび図9Bにおいて「TU」とラベルづけされた構文構造の一部として表現される。付録A内に提示されるテキストは、構文構造900、930に対応するテキストの一例であり、他の例も可能である。構文構造900、930に対応するテキストは、ビデオエンコーダ114がビットストリームを符号化する方法1000を実行し、ビデオデコーダ134がビットストリームを復号化する方法1100を実行する、ということを暗に示す。
付録Bは、構文構造9100および構文構造9130に関連する開発中の高効率動画像符号化方式(HEVC)規格にありうる「テキスト」を図示する。付録Bにおけるtransform_tree()関数の各インスタンスは、図9Cおよび図9Dにおいて「TT」とラベルづけされた構文構造の一部として表現され、付録Aにおけるtransform_unit()関数の各インスタンスは、図9Cおよび図9Dにおいて「TU」とラベルづけされた構文構造の一部として表現される。付録B内に提示されるテキストは、構文構造9100、9130に一致するテキストの一例であり、他の例も可能である。構文構造9100、9130に対応するテキストは、ビデオエンコーダ114がビットストリームを符号化する方法1000を実行し、ビデオデコーダ134がビットストリームを復号化する方法1100を実行する、ということを暗に示す。
付録Aおよび付録B内のテキストは、結果として実装され、それによって、4:4:4色差フォーマットに対して構成されたサイズ32×32の変換単位(TU)において接する32×32色差領域は、適用される(最大数の)4つの16×16色差変換をもたらし、4:2:2色差フォーマットに対して構成されたサイズ32×32の変換単位(TU)において接する16×32色差領域は、適用される(最大数の)2つの16×16色差変換をもたらす。付録Aおよび付録B内のテキストに起因する実装は、より小さなサイズの変換単位(TU)に適用されて4:2:2色差フォーマットに対して構成された場合、(最大の)1つの色差変換が適用される。例えば、8×16変換は、8×16色差領域に適用され、4×8変換は、4×8色差領域に対する適用される。
記載の構成は、コンピュータおよび情報処理産業に適用可能であり、特にビデオ信号などの信号の符号化および復号化のためのデジタル信号処理に適用可能である。
前述のものは、本発明のいくつかの実施形態のみを記載しており、変形および/または変更は、本発明の範囲および精神、例示的であり限定的でない実施形態から逸脱せずに行なうことができる。
(オーストラリアのみ)この明細書との関連において、単語「備える(comprising)」は、「主として但し必ずではなく単に含む(including )」または「有する(having)」または「含む(including)」ことを意味し、「だけから構成される(consisting only of)」ことは意味しない。「備える(comprise)」および「備える(comprises)」などの単語「備える」の多様性は、対応する多様の意味を有する。
[付録A]
transform_tree ()およびtransform_unit()は、ループ構成体を用いて推測された色差分割を実施する
7.3.11 変換ツリー構文
Figure 0006567100
7.3.12 変換単位構文
Figure 0006567100
7.4.8.1 概略の符号化単位セマンティックス
変数TrafoCrCbHorCntおよびTrafoCrCbVertCntは、以下の通りに導き出される:
・log2TrafoSizeが5に等しく、split_transform_flagが0に等しい場合、TransformIdxMaxは、以下のように導き出される:
・chroma_format_idcが1に等しい場合、TrafoCrCbHorCntおよびTrafoCrCbVertCntは、1に等しい。
・chroma_format_idcが2に等しい場合、TrafoCrCbHorCntは、1に等しく、TrafoCrCbVertCntは、2に等しい。
・さもなければ、chroma_format_idcが3に等しい場合、TrafoCrCbHorCntおよびTrafoCrCbVertCntは、2に等しい。
・さもなければ、TrafoCrCbHorCntおよびTrafoCrCbVertCntは、1に等しい。
変数TrafoCrCbCntは、TrafoCrCbHorCnt×TrafoCrCbVertCntとして導き出される。
変数log2CrCbTrafoHorSizeおよびlog2CrCbTrafoVertSizeは、以下の通りに導き出される:
・chroma_format_idcが1に等しい場合、log2CrCbTrafoHorSizeおよびlog2CrCbTrafoVertSizeは、log2TrafoSize−1に等しい。
・さもなければ、chroma_format_idcが2に等しい場合、log2CrCbTrafoHorSizeは、log2TrafoSizeに等しく、log2CrCbTrafoVertSizeは、min(log2TrafoSize−1,4)に等しい。
・さもなければ、chroma_format_idcが3に等しい場合、log2CrCbTrafoHorSizeおよびlog2CrCbTrafoVertSizeは、min(log2TrafoSize,4)に等しい。
付録Aの終了
[付録B]
transform_tree()を、推測分割から起因する各色差変換に対する色差チャネルのペアにつき一度起動する。
7.3.11 変換ツリー構文
Figure 0006567100
7.3.12 変換単位構文
Figure 0006567100
7.4.8.1 概略の符号化単位セマンティックス
変数TrafoCrCbHorCntおよびTrafoCrCbVertCntは、以下の通りに導き出される:
・log2TrafoSizeが5に等しく、split_transform_flagが0に等しい場合、TransformIdxMaxは、以下のように導き出される:
・chroma_format_idcが1に等しい場合、TrafoCrCbHorCntおよびTrafoCrCbVertCntは、1に等しい。
・chroma_format_idcが2等しい場合、TrafoCrCbHorCntは、1に等しく、TrafoCrCbVertCntは、2に等しい。
・他の場合には、chroma_format_idcが3に等しい場合、TrafoCrCbHorCntおよびTrafoCrCbVertCntは、2に等しい。
・他の場合には、TrafoCrCbHorCntおよびTrafoCrCbVertCntは、1に等しい。
変数TrafoCrCbCntは、TrafoCrCbHorCnt×TrafoCrCbVertCntとして導き出される。
付録Bの終了

Claims (12)

  1. ビデオビットストリームから、4:2:2フォーマットの符号化単位内の変換単位に含まれる2つの色差チャネルにそれぞれ関連付けられた2つの色差残差係数配列を復号し、前記復号された色差残差係数配列を周波数領域から空間領域の色差残差サンプルへ変換する方法であって、
    符号化単位のサイズおよび前記符号化単位内の変換単位の階層レベルに従って、正方形ブロックで表される前記変換単位の変換サイズを決定するステップと、
    各色差チャンネルにおいて、
    前記ビデオビットストリームから、前記変換単位が有する2つの色差残差係数配列のそれぞれに対応する2つの符号化ブロックフラグ値を復号するステップと、
    前記2つの符号化ブロックフラグ値のうちの対応する符号化ブロックフラグ値に従って、前記2つの色差残差係数配列の各々を前記ビデオビットストリームから復号するステップと、
    前記決定された変換サイズに対応する正方形ブロックのための変換を、前記復号された色差残差係数配列の各々に対して適用することにより、色差残差サンプルを生成するステップと、
    を備え、
    前記2つの色差残差係数配列の各々を前記ビデオビットストリームから復号するステップにおいて、前記2つの色差残差係数配列の各々に対して同じスキャンパターンを適用することにより、正方形ブロックで表される前記決定された変換サイズの変換単位を生成することを特徴とする方法。
  2. 空間領域の色差残差サンプルを周波数領域への変換を行うことにより、2つの色差チャネルのそれぞれにおいて、4:2:2フォーマットの符号化単位内の変換単位に含まれる2つの色差残差係数配列としてビットストリームに符号化する方法であって、
    各色差チャンネルにおいて、
    前記符号化単位のサイズおよび前記符号化単位内の前記変換単位の階層レベルに従って決定されるサイズの正方形ブロックのための変換を、前記変換単位の2セットの色差残差サンプルの少なくとも1つに対して適用することにより、前記2つの周波数領域の色差残差係数配列を生成するステップと、
    前記変換単位の2つの色差残差係数配列にそれぞれ対応する2つの符号化ブロックフラグ値および前記2つの色差残差係数配列を前記ビデオビットストリームに符号化するステップと、を備え、
    前記2つの色差残差係数配列を生成するステップにおいて、前記変換によって生成される2セットの残差係数に対して同じスキャンパターンを適用することにより、前記2つの色差残差係数配列を生成することを特徴とする方法。
  3. 請求項1において、前記符号化ブロックフラグ値は、対応する色差残差係数配列にゼロではない残差係数が含まれるか否かを示すことを特徴とする方法。
  4. 請求項2において、前記符号化ブロックフラグ値は、対応する色差残差係数配列にゼロではない係数が含まれるか否かを示すことを特徴とする方法。
  5. ビデオビットストリームから、4:2:2フォーマットの符号化単位内の変換単位に含まれる2つの色差チャネルにそれぞれ関連付けられた2つの色差残差係数配列を復号し、復号された複数の色差残差係数配列を周波数領域から空間領域の色差残差サンプルへ変換する復号装置であって、
    符号化単位のサイズおよび前記符号化単位内の変換単位の階層レベルに従って、正方形ブロックで表される前記変換単位の変換サイズを決定するステップと、
    各色差チャンネルにおいて、
    前記ビデオビットストリームから、前記変換単位が有する2つの色差残差係数配列のそれぞれに対応する2つの符号化ブロックフラグ値を復号する手段と、
    前記2つの符号化ブロックフラグ値のうちの対応する符号化ブロックフラグ値に従って、前記2つの色差残差係数配列の各々を前記ビデオビットストリームから復号する手段と、
    前記決定された変換サイズに対応する正方形ブロックのための変換を、前記復号された色差残差係数配列の各々に対して適用することにより、色差残差サンプルを生成する手段と、
    を備え
    前記2つの色差残差係数配列の各々を前記ビデオビットストリームから復号する手段において、前記2つの色差残差係数配列の各々に対して同じスキャンパターンを適用することにより、正方形ブロックで表される前記決定された変換サイズの変換単位を生成することを特徴とする復号装置。
  6. 請求項5において、前記符号化ブロックフラグ値は、対応する色差残差係数配列にゼロではない残差係数が含まれるか否かを示すことを特徴とする復号装置。
  7. 請求項5または請求項6の復号装置の処理を実行させるためのプログラム。
  8. 請求項7のプログラムを記憶したコンピュータ可読な記憶媒体。
  9. 空間領域の色差残差サンプルを周波数領域への変換を行うことにより、2つの色差チャネルのそれぞれにおいて、4:2:2フォーマットの符号化単位内の変換単位に含まれる2つの色差残差係数配列としてビットストリームに符号化する符号化装置であって、
    各色差チャンネルにおいて、
    前記符号化単位のサイズおよび前記符号化単位内の前記変換単位の階層レベルに従って決定されるサイズの正方形ブロックのための変換を、前記変換単位の2セットの色差残差サンプルの少なくとも1つに対して適用することにより、前記2つの周波数領域の色差残差係数配列を生成する手段と、
    前記変換単位の2つの色差残差係数配列にそれぞれ対応する2つの符号化ブロックフラグ値および前記2つの色差残差係数配列を前記ビデオビットストリームに符号化する手段と、を備え、前記2つの色差残差係数配列を生成する手段において、前記変換によって生成される2セットの残差係数に対して同じスキャンパターンを適用することにより、前記2つの色差残差係数配列を生成することを特徴とする符号化装置
  10. 請求項9において、前記符号化ブロックフラグ値は、対応する色差残差係数配列にゼロではない残差係数が含まれるか否かを示すことを特徴とする符号化装置。
  11. 請求項9または請求項10の符号化装置の処理を実行させるためのプログラム。
  12. 請求項11のプログラムを記憶したコンピュータ可読な記憶媒体。
JP2018009529A 2012-09-28 2018-01-24 符号化単位の変換単位を符号化および復号する方法、装置、およびシステム Active JP6567100B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AU2012232992 2012-09-28
AU2012232992A AU2012232992A1 (en) 2012-09-28 2012-09-28 Method, apparatus and system for encoding and decoding the transform units of a coding unit

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2015533379A Division JP6282278B2 (ja) 2012-09-28 2013-09-27 符号化単位の変換単位を符号化および復号化する方法、装置、およびシステム

Publications (2)

Publication Number Publication Date
JP2018101984A JP2018101984A (ja) 2018-06-28
JP6567100B2 true JP6567100B2 (ja) 2019-08-28

Family

ID=50386719

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2015533379A Active JP6282278B2 (ja) 2012-09-28 2013-09-27 符号化単位の変換単位を符号化および復号化する方法、装置、およびシステム
JP2017248473A Pending JP2018085738A (ja) 2012-09-28 2017-12-25 残差係数を符号化および復号するための方法、残差サンプルから残差係数を符号化する方法、装置、プログラム、およびコンピュータ可読記憶媒体
JP2018009529A Active JP6567100B2 (ja) 2012-09-28 2018-01-24 符号化単位の変換単位を符号化および復号する方法、装置、およびシステム

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2015533379A Active JP6282278B2 (ja) 2012-09-28 2013-09-27 符号化単位の変換単位を符号化および復号化する方法、装置、およびシステム
JP2017248473A Pending JP2018085738A (ja) 2012-09-28 2017-12-25 残差係数を符号化および復号するための方法、残差サンプルから残差係数を符号化する方法、装置、プログラム、およびコンピュータ可読記憶媒体

Country Status (11)

Country Link
US (4) US9854241B2 (ja)
EP (2) EP3684057B1 (ja)
JP (3) JP6282278B2 (ja)
KR (5) KR20170054558A (ja)
CN (5) CN108683914B (ja)
AU (4) AU2012232992A1 (ja)
BR (2) BR112015004116B1 (ja)
ES (1) ES2788757T3 (ja)
PL (1) PL2901673T3 (ja)
RU (3) RU2673704C1 (ja)
WO (1) WO2014047693A1 (ja)

Families Citing this family (131)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9609354B2 (en) * 2010-12-14 2017-03-28 M&K Holdings Inc. Apparatus for decoding a moving picture
CN107105282B (zh) * 2010-12-14 2019-11-12 M&K控股株式会社 用于解码运动画面的设备
US9473789B2 (en) * 2010-12-14 2016-10-18 M&K Holdings Inc. Apparatus for decoding a moving picture
WO2013109026A1 (ko) * 2012-01-18 2013-07-25 엘지전자 주식회사 엔트로피 부호화/복호화 방법 및 그 장치
US9654139B2 (en) 2012-01-19 2017-05-16 Huawei Technologies Co., Ltd. High throughput binarization (HTB) method for CABAC in HEVC
US9743116B2 (en) 2012-01-19 2017-08-22 Huawei Technologies Co., Ltd. High throughput coding for CABAC in HEVC
US9860527B2 (en) 2012-01-19 2018-01-02 Huawei Technologies Co., Ltd. High throughput residual coding for a transform skipped block for CABAC in HEVC
US20130188736A1 (en) 2012-01-19 2013-07-25 Sharp Laboratories Of America, Inc. High throughput significance map processing for cabac in hevc
US10616581B2 (en) 2012-01-19 2020-04-07 Huawei Technologies Co., Ltd. Modified coding for a transform skipped block for CABAC in HEVC
DK2869557T3 (da) 2012-06-29 2023-11-06 Electronics & Telecommunications Res Inst Fremgangsmåde og anordning til kodning/afkodning af billeder
AU2012232992A1 (en) 2012-09-28 2014-04-17 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the transform units of a coding unit
US9332257B2 (en) * 2012-10-01 2016-05-03 Qualcomm Incorporated Coded black flag coding for 4:2:2 sample format in video coding
EP2918078A4 (en) * 2012-11-08 2016-10-19 Canon Kk METHOD, DEVICE AND SYSTEM FOR CODING AND DECODING THE TRANSFORMATION UNITS OF A CODING UNIT
GB2512825A (en) * 2013-04-05 2014-10-15 British Broadcasting Corp Transmitting and receiving a composite image
GB2512658B (en) * 2013-04-05 2020-04-01 British Broadcasting Corp Transmitting and receiving a composite image
US9686561B2 (en) * 2013-06-17 2017-06-20 Qualcomm Incorporated Inter-component filtering
WO2015056566A1 (ja) * 2013-10-15 2015-04-23 ソニー株式会社 画像処理装置および方法
JP6066945B2 (ja) * 2014-02-21 2017-01-25 キヤノン株式会社 画像復号装置、画像復号方法及びプログラム
WO2015131330A1 (en) * 2014-03-04 2015-09-11 Microsoft Technology Licensing, Llc Encoding strategies for adaptive switching of color spaces, color sampling rates and/or bit depths
WO2015139010A1 (en) * 2014-03-14 2015-09-17 Vid Scale, Inc. Systems and methods for rgb video coding enhancement
WO2016054774A1 (en) * 2014-10-08 2016-04-14 Mediatek Singapore Pte. Ltd. A method for the co-existence of color-space transform and cross-component prediction
EP3292690B1 (en) * 2015-06-23 2020-05-06 MediaTek Singapore Pte Ltd. Method and apparatus for transform coefficient coding of non-square blocks
US11076153B2 (en) * 2015-07-31 2021-07-27 Stc.Unm System and methods for joint and adaptive control of rate, quality, and computational complexity for video coding and video delivery
US10681379B2 (en) * 2015-09-29 2020-06-09 Qualcomm Incorporated Non-separable secondary transform for video coding with reorganizing
KR102644185B1 (ko) * 2015-09-30 2024-03-06 엘지전자 주식회사 비디오 코딩 시스템에서 레지듀얼 신호 코딩 방법 및 장치
US10277896B2 (en) 2016-01-22 2019-04-30 Apple Inc. Intra-frame prediction systems and methods
KR102859935B1 (ko) * 2016-02-04 2025-09-12 삼성전자주식회사 크로마 다중 변환에 의한 비디오 복호화 방법 및 장치,크로마 다중 변환에 의한 비디오 부호화 방법 및 장치
CN115052152B (zh) * 2016-02-11 2025-11-25 交互数字Vc控股公司 用于对图像单元进行编码/解码的方法和设备
EP3430808A4 (en) * 2016-03-16 2020-01-15 Mediatek Inc. METHOD AND APPARATUS FOR PROCESSING VIDEO DATA WITH A RESTRICTED BLOCK LENGTH IN VIDEO CODING
ES2817100B1 (es) * 2016-03-28 2022-04-13 Kt Corp Metodo y aparato para procesar senales de video
US11876999B2 (en) * 2016-07-05 2024-01-16 Kt Corporation Method and apparatus for processing video signal
CN113965747B (zh) 2016-07-05 2024-06-14 株式会社Kt 对视频进行解码或编码的方法和计算机可读介质
CN115914625B (zh) * 2016-08-01 2025-07-11 韩国电子通信研究院 图像编码/解码方法
CN117425005A (zh) 2016-08-31 2024-01-19 株式会社Kt 用于处理视频信号的方法和设备
ES3063575T3 (en) 2016-10-04 2026-04-17 B1 Institute Image Technology Inc Image data encoding/decoding method and apparatus
CN117041574A (zh) * 2016-10-28 2023-11-10 韩国电子通信研究院 视频编码/解码方法和设备以及存储比特流的记录介质
CN117119179A (zh) * 2016-11-18 2023-11-24 株式会社Kt 视频解码方法、视频编码方法和压缩视频数据发送设备
CN116744022A (zh) * 2016-11-25 2023-09-12 株式会社Kt 用于对视频进行编码和解码的方法
US10609367B2 (en) * 2016-12-21 2020-03-31 Qualcomm Incorporated Low-complexity sign prediction for video coding
CN110100438B (zh) * 2016-12-28 2022-04-15 索尼公司 图像处理装置和方法
WO2018174457A1 (ko) * 2017-03-22 2018-09-27 엘지전자(주) 영상 처리 방법 및 이를 위한 장치
US10779007B2 (en) * 2017-03-23 2020-09-15 Mediatek Inc. Transform coding of video data
JP6680260B2 (ja) * 2017-04-28 2020-04-15 株式会社Jvcケンウッド 画像符号化装置、画像符号化方法及び画像符号化プログラム、並びに画像復号化装置、画像復号化方法及び画像復号化プログラム
EP3451663A1 (en) * 2017-08-31 2019-03-06 Thomson Licensing Pools of transforms for local selection of a set of transforms in video coding
US20190116374A1 (en) * 2017-10-17 2019-04-18 Qualcomm Incorporated Coding motion information of video data using coding structure-based candidate list construction
US10368071B2 (en) * 2017-11-03 2019-07-30 Arm Limited Encoding data arrays
CN115022631B (zh) 2018-01-05 2025-09-09 Sk电信有限公司 对视频进行编码或解码的方法和非暂时性计算机可读介质
KR102524628B1 (ko) 2018-01-05 2023-04-21 에스케이텔레콤 주식회사 영상을 부호화 또는 복호화하는 방법 및 장치
US10812797B2 (en) * 2018-02-05 2020-10-20 Tencent America LLC Method, apparatus and medium for decoding or encoding using a low-complexity transform
CN112166614B (zh) * 2018-03-27 2023-07-14 株式会社Kt 用于处理视频信号的方法和设备
EP3777150A4 (en) * 2018-04-18 2021-02-17 Huawei Technologies Co., Ltd. BLOCK DIVISION IN VIDEO ENCODING
US10798382B2 (en) * 2018-04-26 2020-10-06 Tencent America LLC Sub-block transform
US10630748B1 (en) * 2018-05-01 2020-04-21 Amazon Technologies, Inc. Video-based encoder alignment
US10630990B1 (en) 2018-05-01 2020-04-21 Amazon Technologies, Inc. Encoder output responsive to quality metric information
US10958987B1 (en) 2018-05-01 2021-03-23 Amazon Technologies, Inc. Matching based on video data
EP3694210A4 (en) * 2018-05-03 2020-12-16 LG Electronics Inc. -1- METHOD AND APPARATUS FOR IMAGE DECODING USING A BLOCK SIZE TRANSFORM IN AN IMAGE CODING SYSTEM
US11449256B2 (en) 2018-05-15 2022-09-20 Samsung Electronics Co., Ltd. Method for accelerating image storing and retrieving differential latency storage devices based on access rates
US10949087B2 (en) 2018-05-15 2021-03-16 Samsung Electronics Co., Ltd. Method for rapid reference object storage format for chroma subsampled images
WO2019219685A1 (en) 2018-05-17 2019-11-21 Telefonaktiebolaget Lm Ericsson (Publ) Deblocking of implicit transform unit boundaries
HRP20230521T1 (hr) 2018-06-03 2023-08-04 Lg Electronics Inc. Postupak i uređaj za obradu video signala pomoću smanjene transformacije
GB2588004B (en) 2018-06-05 2023-03-01 Beijing Bytedance Network Tech Co Ltd Interaction between IBC and affine
WO2019244119A1 (en) 2018-06-21 2019-12-26 Beijing Bytedance Network Technology Co., Ltd. Sub-block mv inheritance between color components
WO2019244117A1 (en) 2018-06-21 2019-12-26 Beijing Bytedance Network Technology Co., Ltd. Unified constrains for the merge affine mode and the non-merge affine mode
CN110662050B (zh) 2018-06-29 2022-06-14 北京字节跳动网络技术有限公司 处理视频数据的方法、装置及存储介质
TWI719520B (zh) * 2018-06-29 2021-02-21 大陸商北京字節跳動網絡技術有限公司 零單元的濾波
AU2019308493B2 (en) * 2018-07-17 2023-04-20 Huawei Technologies Co., Ltd. Constrained coding tree for video coding
AU2018217336B2 (en) 2018-08-17 2025-04-24 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a transformed block of video samples
AU2018217333B2 (en) 2018-08-17 2025-04-24 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a transformed block of video samples
CN119363978A (zh) * 2018-08-24 2025-01-24 三星电子株式会社 视频解码方法和设备、以及视频编码方法和设备
AU2018233042B2 (en) * 2018-09-21 2024-06-13 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a tree of blocks of video samples
CN110944193B (zh) 2018-09-24 2023-08-11 北京字节跳动网络技术有限公司 视频编码和解码中的加权双向预测
WO2020094151A1 (en) 2018-11-10 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Rounding in pairwise average candidate calculations
US11539951B2 (en) * 2018-12-03 2022-12-27 Interdigital Vc Holdings, Inc. Method and device for picture encoding and decoding
US11064219B2 (en) * 2018-12-03 2021-07-13 Cloudinary Ltd. Image format, systems and methods of implementation thereof, and image processing
PH12019000380A1 (en) * 2018-12-17 2020-09-28 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
WO2020141908A1 (ko) * 2019-01-01 2020-07-09 엘지전자 주식회사 변환 스킵 플래그를 이용한 영상 코딩 방법 및 장치
EP3906671A2 (en) * 2019-01-02 2021-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Unified transform type signaling and transform type dependent transform coefficient level coding
WO2020146007A1 (en) 2019-01-09 2020-07-16 Futurewei Technologies, Inc. Machine learning network model compression
WO2020145798A1 (ko) * 2019-01-13 2020-07-16 엘지전자 주식회사 변환 스킵 플래그를 이용한 영상 코딩 방법 및 장치
WO2020176459A1 (en) 2019-02-28 2020-09-03 Interdigital Vc Holdings, Inc. Method and device for picture encoding and decoding
US12114000B2 (en) 2019-03-08 2024-10-08 Qualcomm Incorporated Combined residual coding in video coding
EP3912343A4 (en) 2019-03-08 2022-07-20 Beijing Bytedance Network Technology Co., Ltd. Constraints on model-based reshaping in video processing
AU2019201653A1 (en) 2019-03-11 2020-10-01 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a tree of blocks of video samples
US11418811B2 (en) * 2019-03-12 2022-08-16 Apple Inc. Method for encoding/decoding image signal, and device therefor
CN117793345A (zh) 2019-03-22 2024-03-29 华为技术有限公司 用于视频译码的变换单元分割方法
US11451826B2 (en) * 2019-04-15 2022-09-20 Tencent America LLC Lossless coding mode and switchable residual coding
WO2020211869A1 (en) 2019-04-18 2020-10-22 Beijing Bytedance Network Technology Co., Ltd. Parameter derivation in cross component mode
HUE071720T2 (hu) * 2019-04-20 2025-09-28 Beijing Bytedance Network Tech Co Ltd Szintaxiselemek jelzése krominanciamaradékok együttes kódolására
BR112021019675A2 (pt) 2019-04-23 2021-12-07 Beijing Bytedance Network Tech Co Ltd Método para processamento de mídia visual, aparelho codificador de vídeo, aparelho decodificador de vídeo, e, mídia legível por computador
WO2020223496A1 (en) * 2019-04-30 2020-11-05 Beijing Dajia Internet Informationtechnology Co., Ltd. Methods and apparatus of joint coding of chroma residuals
CN113796072B (zh) 2019-05-08 2023-10-03 北京字节跳动网络技术有限公司 跨分量编解码的适用性条件
CN113841409B (zh) 2019-05-10 2023-12-19 北京字节跳动网络技术有限公司 用于视频处理的简化二次变换的有条件使用
WO2020239119A1 (en) 2019-05-30 2020-12-03 Beijing Bytedance Network Technology Co., Ltd. Adaptive loop filtering for chroma components
US11381847B2 (en) * 2019-05-31 2022-07-05 Qualcomm Incorporated Coefficient coding for transform skip mode in video coding
CN113950828B (zh) 2019-06-07 2024-07-05 北京字节跳动网络技术有限公司 视频比特流中的简化二次变换的有条件信令
WO2020256595A2 (en) 2019-06-21 2020-12-24 Huawei Technologies Co., Ltd. Method and apparatus of still picture and video coding with shape-adaptive resampling of residual blocks
JP7418478B2 (ja) 2019-06-22 2024-01-19 北京字節跳動網絡技術有限公司 クロマ残差スケーリングのためのシンタックス要素
MX2022000028A (es) 2019-06-24 2022-03-11 Lg Electronics Inc Método y aparato de codificación/decodificación de imágenes usando ajuste de tamaño de transformación máximo para bloque de croma, y método para transmitir flujo de bits.
EP3790275A4 (en) * 2019-06-25 2022-03-16 Wilus Institute of Standards and Technology Inc. VIDEO SIGNAL PROCESSING METHOD AND APPARATUS USING SECONDARY TRANSFORMATION
CN116668699A (zh) * 2019-07-05 2023-08-29 Lg电子株式会社 图像编码/解码设备和图像数据的发送方法
US11202054B2 (en) * 2019-07-05 2021-12-14 Tencent America LLC Method and apparatus for inter-channel prediction and transform for point-cloud attribute coding
JP7460748B2 (ja) 2019-07-07 2024-04-02 北京字節跳動網絡技術有限公司 クロマ残差スケーリングのシグナリング
US11232599B2 (en) * 2019-07-11 2022-01-25 Tencent America LLC Method and apparatus for inter-channel prediction and transform for point cloud attribute coding
WO2021023151A1 (en) 2019-08-03 2021-02-11 Beijing Bytedance Network Technology Co., Ltd. Position based mode derivation in reduced secondary transforms for video
CN118632034A (zh) 2019-08-17 2024-09-10 北京字节跳动网络技术有限公司 为视频中的缩减二次变换的边信息的上下文建模
CN114365490B (zh) * 2019-09-09 2024-06-18 北京字节跳动网络技术有限公司 高精度图像和视频编解码的系数缩放
CN119996693A (zh) 2019-09-12 2025-05-13 阿里巴巴集团控股有限公司 视频编解码的计算机实现的方法及计算机可读存储介质
CN120151546B (zh) 2019-09-13 2026-02-24 阿里巴巴(中国)有限公司 一种标识子块变换信息的方法和装置
CN114731392B (zh) 2019-09-21 2025-01-03 北京字节跳动网络技术有限公司 用于图像和视频编解码的高精度变换和量化
MX2022003555A (es) * 2019-09-24 2022-06-14 Huawei Tech Co Ltd Señalización de encabezado de imagen en codificación de video.
MX2022004216A (es) * 2019-10-10 2022-05-03 Electronics & Telecommunications Res Inst Metodo y aparato de codificacion/decodificacion de imagenes y medio de grabacion que almacena flujo de bits.
KR20220066350A (ko) * 2019-11-13 2022-05-24 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
CN121309814A (zh) * 2019-11-22 2026-01-09 Lg电子株式会社 图像解码和编码方法、比特流的发送方法及介质
KR102192631B1 (ko) * 2019-11-28 2020-12-17 주식회사우경정보기술 병렬 포렌식 마킹 장치 및 방법
AU2019275553B2 (en) * 2019-12-03 2022-10-06 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a coding tree unit
AU2019275552B2 (en) * 2019-12-03 2022-10-13 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a coding tree unit
WO2021112950A1 (en) * 2019-12-05 2021-06-10 Alibaba Group Holding Limited Method and apparatus for chroma sampling
US12184853B2 (en) * 2019-12-06 2024-12-31 Qualcomm Incorporated Residual coding selection and low-level signaling based on quantization parameter
CN116248901A (zh) * 2020-02-05 2023-06-09 Lg电子株式会社 用于图像编解码方法的编解码设备和发送图像数据的设备
EP4535791A3 (en) 2020-02-21 2025-06-11 LG Electronics Inc. Image coding method based on transform, and device therefor
CN115552900B (zh) * 2020-02-21 2025-12-23 阿里巴巴(中国)有限公司 用信号通知最大变换大小和残差编码的方法
CN119011872A (zh) * 2020-02-25 2024-11-22 Lg电子株式会社 图像编码/解码设备及发送数据的设备
KR20240059003A (ko) * 2020-06-12 2024-05-07 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 4:4:4 색 포맷의 비디오 코딩 방법 및 장치
US12058310B2 (en) 2021-02-26 2024-08-06 Lemon Inc. Methods of coding images/videos with alpha channels
US20220279185A1 (en) * 2021-02-26 2022-09-01 Lemon Inc. Methods of coding images/videos with alpha channels
US20240422329A1 (en) * 2021-10-05 2024-12-19 Interdigital Ce Patent Holdings, Sas Transform unit partitioning for cloud gaming video
US11949920B2 (en) * 2021-10-20 2024-04-02 Mediatek Inc. Method and apparatus for contorlling coefficient transmission by early determining whether to decode information that inverse transform needs
US12610082B2 (en) * 2021-12-06 2026-04-21 Intel Corporation Unrestricted intra content to improve video quality of real-time encoding
AU2022202470A1 (en) * 2022-04-13 2023-11-02 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a tensor
US12368888B2 (en) * 2022-05-27 2025-07-22 Tencent America LLC Dynamic mesh compression using inter and intra prediction
US20240430455A1 (en) * 2023-06-26 2024-12-26 Dolby Laboratories Licensing Corporation Luminance based coding tools for video compression

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5196946A (en) * 1990-03-14 1993-03-23 C-Cube Microsystems System for compression and decompression of video data using discrete cosine transform and coding techniques
US5278647A (en) * 1992-08-05 1994-01-11 At&T Bell Laboratories Video decoder using adaptive macroblock leak signals
JP3423835B2 (ja) 1996-05-01 2003-07-07 沖電気工業株式会社 スクランブル付き圧縮符号化装置及びその伸長再生装置
AU716228B2 (en) * 1996-06-06 2000-02-24 Matsushita Electric Industrial Co., Ltd. Recording apparatus, reproducing apparatus and conversion apparatus
WO2000004725A1 (en) 1998-07-15 2000-01-27 Koninklijke Philips Electronics N.V. Recording and editing hdtv signals
US7035337B2 (en) * 2000-11-29 2006-04-25 Sony Corporation Stream processing apparatus
JP4217398B2 (ja) * 2001-09-12 2009-01-28 キヤノン株式会社 画像データ処理方法、画像データ処理装置、記憶媒体、及びプログラム
EP2222084A2 (en) * 2001-11-16 2010-08-25 NTT DoCoMo, Inc. Image coding and decoding method
KR100884402B1 (ko) * 2002-06-20 2009-02-17 삼성전자주식회사 데이터의 영역 별 수신 우선 순위에 따라 상이한 개수의파일럿 톤을 삽입하는 디지털방송 송신기
US7292634B2 (en) * 2002-09-24 2007-11-06 Matsushita Electric Industrial Co., Ltd. Image coding method and apparatus
JP4617644B2 (ja) 2003-07-18 2011-01-26 ソニー株式会社 符号化装置及び方法
RU2368095C1 (ru) 2005-07-22 2009-09-20 Мицубиси Электрик Корпорейшн Кодер изображения и декодер изображения, способ кодирования изображения и способ декодирования изображения, программа кодирования изображения и программа декодирования изображения и компьютерно-считываемый носитель записи, на котором записана программа кодирования изображения, и компьютерно-считываемый носитель записи, на котором записана программа декодирования изображения
US7933337B2 (en) 2005-08-12 2011-04-26 Microsoft Corporation Prediction of transform coefficients for image compression
JP5026092B2 (ja) * 2007-01-12 2012-09-12 三菱電機株式会社 動画像復号装置および動画像復号方法
WO2010007590A2 (en) * 2008-07-17 2010-01-21 Amimon Ltd. Methods circuits and systems for transmission and reconstruction of a video block
US8483285B2 (en) * 2008-10-03 2013-07-09 Qualcomm Incorporated Video coding using transforms bigger than 4×4 and 8×8
WO2010041857A2 (en) * 2008-10-06 2010-04-15 Lg Electronics Inc. A method and an apparatus for decoding a video signal
JP5234368B2 (ja) 2009-09-30 2013-07-10 ソニー株式会社 画像処理装置および方法
KR101703327B1 (ko) * 2010-01-14 2017-02-06 삼성전자 주식회사 계층적 데이터 단위의 패턴 정보를 이용하는 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
US8942282B2 (en) * 2010-04-12 2015-01-27 Qualcomm Incorporated Variable length coding of coded block pattern (CBP) in video compression
US9172963B2 (en) 2010-11-01 2015-10-27 Qualcomm Incorporated Joint coding of syntax elements for video coding
WO2012090504A1 (en) * 2010-12-28 2012-07-05 Panasonic Corporation Methods and apparatuses for coding and decoding video stream
US9210442B2 (en) 2011-01-12 2015-12-08 Google Technology Holdings LLC Efficient transform unit representation
US8948271B2 (en) 2011-01-13 2015-02-03 Texas Instruments Incorporated Method and apparatus for a low complexity transform unit partitioning structure for HEVC
US9848197B2 (en) 2011-03-10 2017-12-19 Qualcomm Incorporated Transforms in video coding
US9807426B2 (en) * 2011-07-01 2017-10-31 Qualcomm Incorporated Applying non-square transforms to video data
US9807401B2 (en) 2011-11-01 2017-10-31 Qualcomm Incorporated Transform unit partitioning for chroma components in video coding
US9451287B2 (en) * 2011-11-08 2016-09-20 Qualcomm Incorporated Context reduction for context adaptive binary arithmetic coding
US20130128971A1 (en) * 2011-11-23 2013-05-23 Qualcomm Incorporated Transforms in video coding
US9912944B2 (en) * 2012-04-16 2018-03-06 Qualcomm Incorporated Simplified non-square quadtree transforms for video coding
GB2501535A (en) 2012-04-26 2013-10-30 Sony Corp Chrominance Processing in High Efficiency Video Codecs
AU2012232992A1 (en) 2012-09-28 2014-04-17 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the transform units of a coding unit
US9332257B2 (en) * 2012-10-01 2016-05-03 Qualcomm Incorporated Coded black flag coding for 4:2:2 sample format in video coding

Also Published As

Publication number Publication date
BR112015004116B1 (pt) 2022-10-11
JP6282278B2 (ja) 2018-02-21
BR112015006767A2 (pt) 2017-07-04
US20150249828A1 (en) 2015-09-03
KR20170104646A (ko) 2017-09-15
CN108683913A (zh) 2018-10-19
EP2901673B1 (en) 2020-03-18
CN108769676B (zh) 2022-01-11
AU2012232992A1 (en) 2014-04-17
RU2673704C1 (ru) 2018-11-29
CN108683913B (zh) 2023-03-10
KR20150050559A (ko) 2015-05-08
EP3684057B1 (en) 2023-08-16
CN104685872B (zh) 2018-07-17
US10382756B2 (en) 2019-08-13
EP3684057A1 (en) 2020-07-22
RU2604986C2 (ru) 2016-12-20
KR101802322B1 (ko) 2017-11-29
US20180270481A1 (en) 2018-09-20
AU2017201208A1 (en) 2017-03-16
AU2013325121B2 (en) 2017-03-09
KR20170132342A (ko) 2017-12-01
US20150326883A1 (en) 2015-11-12
BR112015004116A2 (pt) 2017-07-04
KR20170054558A (ko) 2017-05-17
KR101911200B1 (ko) 2018-10-23
CN108683912B (zh) 2022-05-03
KR20170000394A (ko) 2017-01-02
PL2901673T3 (pl) 2020-09-21
AU2017201208B2 (en) 2018-11-15
US9854241B2 (en) 2017-12-26
WO2014047693A1 (en) 2014-04-03
JP2015534373A (ja) 2015-11-26
CN108683912A (zh) 2018-10-19
CN104685872A (zh) 2015-06-03
EP2901673A1 (en) 2015-08-05
EP2901673A4 (en) 2016-03-30
JP2018101984A (ja) 2018-06-28
BR112015006767B1 (pt) 2022-11-29
AU2012247040A1 (en) 2014-04-17
RU2642825C1 (ru) 2018-01-29
CN108683914B (zh) 2022-05-03
ES2788757T3 (es) 2020-10-22
CN108683914A (zh) 2018-10-19
US10075713B2 (en) 2018-09-11
US20180098068A1 (en) 2018-04-05
RU2015115514A (ru) 2016-11-20
CN108769676A (zh) 2018-11-06
JP2018085738A (ja) 2018-05-31
AU2013325121A1 (en) 2015-03-05
KR101969620B1 (ko) 2019-04-16

Similar Documents

Publication Publication Date Title
JP6567100B2 (ja) 符号化単位の変換単位を符号化および復号する方法、装置、およびシステム
RU2714108C1 (ru) Способ, устройство и система для кодирования и декодирования карты значимости для остаточных коэффициентов единицы преобразования
RU2641223C2 (ru) Способ, устройство и система для кодирования и декодирования единиц преобразования единицы кодирования
KR101822765B1 (ko) 비디오 데이터의 인코딩 및 디코딩을 위한 방법, 장치 및 시스템
JP2016518761A (ja) イントラ予測されたサンプルを生成するための方法、装置、およびシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190730

R151 Written notification of patent or utility model registration

Ref document number: 6567100

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151