JP6018012B2 - 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、およびそれらのプログラム並びに記録媒体 - Google Patents

画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、およびそれらのプログラム並びに記録媒体 Download PDF

Info

Publication number
JP6018012B2
JP6018012B2 JP2013079732A JP2013079732A JP6018012B2 JP 6018012 B2 JP6018012 B2 JP 6018012B2 JP 2013079732 A JP2013079732 A JP 2013079732A JP 2013079732 A JP2013079732 A JP 2013079732A JP 6018012 B2 JP6018012 B2 JP 6018012B2
Authority
JP
Japan
Prior art keywords
value
image
scaling
axis
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013079732A
Other languages
English (en)
Other versions
JP2014204332A (ja
Inventor
誠明 松村
誠明 松村
翔平 松尾
翔平 松尾
誠之 高村
誠之 高村
藤井 寛
寛 藤井
清水 淳
淳 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
NTT Inc USA
Original Assignee
Nippon Telegraph and Telephone Corp
NTT Inc USA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, NTT Inc USA filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013079732A priority Critical patent/JP6018012B2/ja
Publication of JP2014204332A publication Critical patent/JP2014204332A/ja
Application granted granted Critical
Publication of JP6018012B2 publication Critical patent/JP6018012B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、画像信号の符号化および復号に関し、特に色空間変換を用いて画像信号を符号化または復号する技術に関する。
現在策定中の次世代映像符号化国際標準方式High Efficiency Video Coding(HEVC)のVersion 1として定義される初期プロファイル群は3種類のプロファイルから構成され、それぞれMain Profile、Main 10 Profile(10−bitの入力信号用)、Main Still Picture Profile(静止画用)として提供される。各プロファイルの入力画像信号はYUV 4:2:0の色フォーマット(以下、4:2:0と称する)のみとなっている。4:2:0とは輝度に対して色差のサンプリングを水平方向と垂直方向に半分に間引かれているフォーマットを示す。4:2:0以外に下記のフォーマットが挙げられるが、これらは主にプロフェッショナル向け映像編集や放送局の素材伝送に用いられる。
YUV 4:4:4フォーマット(以下4:4:4と称する):輝度と色差のサンプリングが同じフォーマット
YUV 4:2:2フォーマット(以下4:2:2と称する):輝度に対して色差のサンプリングを水平方向に半分に間引くフォーマット
色空間としては先に示したYUVフォーマット以外に、RGBフォーマットも存在する。RGBフォーマットはデジタルカメラや各種ディスプレイの出力などの映像再現において幅広く利用されており、RGBフォーマットの場合は一般的に各チャンネル4:4:4相当のサンプリングが行われている。
4:4:4、4:2:2、RGB、および10−bit以上の入力信号にも対応するため、HEVC Version 2(例えば、非特許文献1参照)の標準化がVersion 1と並行して進められており、特に色差信号の圧縮について高能率な符号化ツールが提案されている。例えば、復号済みの信号から色空間の変換行列を導出し、Coding Unit単位で予測後の残差信号に対して前記変換行列を適用した信号を符号化し、復号側で逆方向の色空間変換を行って元の色空間に戻す方式(例えば、非特許文献2参照)が提案されている。
D. Flynn, J. S. Rojals, T. Suzuki, "High Efficiency Video Coding (HEVC) Range Extensions text specification: Draft 2 (for PDAM)," JCTVC-L1005.doc, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 12th Meeting: Geneva, CH, 14-23 Jan. 2013. K. Kawamura, T. Yoshino, S. Naito, "AHG7: In-loop color-space transformation of residual signals for range extensions," JCTVC-L0371.doc, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 12th Meeting: Geneva, CH, 14-23 Jan. 2013.
ところで、非特許文献2に記載の手法では、符号化済みの隣接Coding Unitの画素群や動き予測による参照ブロック内の画素群を用いて色空間変換行列をオーバーヘッドなしに生成している。しかし、色空間変換処理が符号化ループの内側に位置するため、符号化装置や復号装置に遅延を発生させる原因にもなり、チャンネル間の情報を用いているため、RGBまたはYUVの各チャンネル独立で処理を行うことができないなどの問題がある。
また、色空間変換は符号化対象シーケンスに対してプレフィルタで事前に変換した信号を原信号として符号化装置に入力し、復号時にポストフィルタにて色空間の逆変換を行うことで、同様の効果を実現することができる。プレフィルタとポストフィルタを用いて色空間変換を行う場合、各チャンネル独立処理の問題も解決する上、符号化ループの内側の色空間変換処理がなくなるため、符号化装置や復号装置の遅延をなくすことができる。また、色空間変換は画素ごと独立に行列式の乗算や加減算にて実現されるため、並列演算に特化したプロセッサにより計算負荷を大きく減らすことができる。ただし、プレフィルタとポストフィルタを用いて色空間変換を行う場合、色変換行列を復号装置に伝送する必要があり、その行列を表記するためのオーバーヘッドが発生する。
一方、色空間変換には主成分分析を用いて回転行列を導出する手法がある。主成分分析による色空間変換では、信号群の集中度の順に第一主成分〜第三主成分に割り当てられるよう、与えられた信号群を異なる色空間に変換する。ここで、得られる回転行列は正負の符号反転を考慮すればxyz軸による直交する3軸の回転角度で表現可能であり、これにより3×3の回転行列を3軸の回転角度のみで表記できるようになる。
例えば符号化装置側で得られた回転行列MENCは、3軸の回転角度(rxENC,ryENC,rzENC)から生成される回転行列を用いて、zyx順の回転により下記のように表記される。
Figure 0006018012
Figure 0006018012
Figure 0006018012
Figure 0006018012
このとき、復号装置側で適用すべき逆変換の回転行列MDECは、xyz順の回転により下記のように表記できる。
Figure 0006018012
Figure 0006018012
Figure 0006018012
Figure 0006018012
ここで、プレフィルタとして原画像の色空間を変換する場合、回転行列によって、従来の色空間では数値的に表現できない値(8−bitシーケンスの場合は0以下の値や255以上の値)が発生してしまう可能性がある。これらの値はクリッピングによって強制的に0からシーケンスのビット深度が許容する最大値に制限したり、スケーリングすることによって回避できるが、クリッピングの場合は著しく原画再現性が劣る可能性があり、また、スケーリングの場合はどの程度の値で除算するのかを明示する必要がある。
また、色空間変換によって第一主成分にグレイスケールの輝度相当を示す信号が割り当てられるとき、第二、三主成分の信号には色差相当の信号が割り当てられる。画像における色差成分の寄与率は輝度と比較して低く、輝度信号よりも大きく量子化しても原画再現性を大きく損なうことはない。ここで、ITU−RBT.709(Rec. ITU-R BT.709-3, PARAMETER VALUES FOR THE HDTV STANDARDS FOR PRODUCTION AND INTERNATIONAL PROGRAMME EXCHANGE, Feb. 1998.)にて定義されるYCbCr変換における色差成分の信号は、RGB信号値を0.0〜1.0として、下記のように定義されており、これら係数値は主観的/客観的に大きな損失が生じないように設計されたものである。
Y=0.2126R+0.7152G+0.0722B ・・・(9)
Cb=0.5389(B−Y)=−0.1146R−0.3854G+0.5000B ・・・(10)
Cr=0.6350(R−Y)=0.5024R−0.4563G−0.0461B ・・・(11)
また、主成分分析による回転行列によって各係数値を求める場合、第一主成分〜第三主成分まで、各係数値の二乗和が必ず1.0になるように設計される。このとき、色差成分相当の第二、第三主成分についてスケーリングしなければ原画再現性は高くなるが、色差成分の発生符号量が大きくなるため、符号化効率はあまり向上しないという問題がある。
本発明は、このような事情に鑑みてなされたもので、原画再現性を大きく損なうことのない範囲でスケーリングすることで、輝度成分に対してはスケーリング値を明示する発生符号量を抑制し、色差成分に対してはプレフィルタ後の画像を符号化する際の符号化効率を改善することができる画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、およびそれらのプログラム並びに記録媒体を提供することを目的とする。
本発明は、RGB信号として入力された画像に対して行列を用いて異なる色空間の信号に変換し、変換後の信号を符号化する画像符号化装置が行う画像符号化方法であって、前記行列を直交する3軸回転角度で表現し、各軸の回転角度を符号化するステップと、前記色空間変換後の座標軸における各軸のスケーリング値を符号化するステップと、各軸の1つ以上のスケーリング値に対して所定の値との差分情報を符号化し、色空間変換された各軸上の値を前記スケーリング値でそれぞれ除算した値を符号化対象画像として用いる符号化するステップとを有することを特徴とする。
本発明は、前記所定の値の内、1つの軸の値が√3、またはそれに準じる整数演算時の整数値であることを特徴とする。
本発明は、前記色空間変換された各軸上の値を前記スケーリング値でそれぞれ除算した値を符号化対象画像に対して、入力された前記画像のビット深度の最大値を上回る値および最小値を下回る値をクリッピングすることを特徴とする。
本発明は、入力された符号化ストリームに含まれる各軸のスケーリング値で復号信号を乗算し、前記符号化ストリームに含まれる直交する3軸回転角度から行列を生成し、復号信号をRGB信号に変換する画像復号装置が行う画像復号方法であって、前記スケーリング値に対し、復号する情報が所定の値からの差分スケーリング値であり、前記所定の値から前記差分スケーリング値を減算して本来のスケーリング値を導出するステップを有することを特徴とする。
本発明は、前記所定の値の内、1つの軸の値が√3、またはそれに準じる整数演算時の整数値であることを特徴とする。
本発明は、RGB信号として入力された画像に対して行列を用いて異なる色空間の信号に変換し、変換後の信号を符号化する画像符号化装置であって、前記行列を直交する3軸回転角度で表現し、各軸の回転角度を符号化する手段と、前記色空間変換後の座標軸における各軸のスケーリング値を符号化する手段と、各軸の1つ以上のスケーリング値に対して所定の値との差分情報を符号化し、色空間変換された各軸上の値を前記スケーリング値でそれぞれ除算した値を符号化対象画像として用いる符号化する手段とを備えることを特徴とする。
本発明は、入力された符号化ストリームに含まれる各軸のスケーリング値で復号信号を乗算し、前記符号化ストリームに含まれる直交する3軸回転角度から行列を生成し、復号信号をRGB信号に変換する画像復号装置であって、前記スケーリング値に対し、復号する情報が所定の値からの差分スケーリング値であり、前記所定の値から前記差分スケーリング値を減算して本来のスケーリング値を導出する手段を備えることを特徴とする。
本発明は、コンピュータに、前記画像符号化方法を実行させるための画像符号化プログラムである。
本発明は、コンピュータに、前記画像復号方法を実行させるための画像復号プログラムである。
本発明は、前記画像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体である。
本発明は、前記画像復号プログラムを記録したコンピュータ読み取り可能な記録媒体である。
本発明によれば、原画再現性を大きく損なうことのない範囲でスケーリングすることで、輝度成分に対してはスケーリング値を明示する発生符号量を抑制し、色差成分に対してはプレフィルタ後の画像を符号化する際の符号化効率を改善することができる。
本発明の一実施形態における画像符号化装置の構成を示すブロック図である。 図1に示す画像符号化装置の動作を示すフローチャートである。 図1に示すプレフィルタ用色変換行列生成部101の詳細な構成を示すブロック図である。 図3に示すプレフィルタ用色変換行列生成部101の動作を示すフローチャートである。 図1に示すプレフィルタ処理部102の詳細な構成を示すブロック図である。 図5に示すプレフィルタ処理部102の動作を示すフローチャートである。 本発明の一実施形態における画像復号装置の構成を示すブロック図である。 図7に示す画像復号装置の動作を示すフローチャートである。 図7に示すポストフィルタ処理部210の詳細な構成を示すブロック図である。 図9に示すポストフィルタ処理部210の動作を示すフローチャートである。 画像符号化装置をコンピュータとソフトウェアプログラムとによって構成したシステムのハードウェア構成例を示す図である。 画像復号装置をコンピュータとソフトウェアプログラムとによって構成したシステムのハードウェア構成例を示す図である。
以下、図面を参照して、本発明の一実施形態による画像符号化装置、画像復号装置を説明する。始めに画像符号化装置について説明する。図1は同実施形態における画像符号化装置の構成を示すブロック図である。なお、本明細書において、画像とは、静止画像や動画像を構成する1フレーム分の画像のことをいう。また映像とは、動画像と同じ意味である。図1に示す画像符号化装置が、HEVC等に代表される一般的な画像符号化装置と比較して異なる点は、プレフィルタ用色変換行列生成部101、プレフィルタ処理部102が新たに設けられている点と、エントロピー符号化部112の機能が一部が異なる点である。プレフィルタ用色変換行列生成部101、プレフィルタ処理部102及びエントロピー符号化部112を除く構成は、一例でありこの構成に限定されるものではない。
ここで、図1を参照して、画像符号化装置の構成を説明する。画像符号化装置は、符号化対象シーケンスを入力し、各符号化対象画像をブロックに分割してブロックごとに符号化し、そのビットストリームを符号化ストリームとして出力する。
符号化対象ブロックはイントラ予測部103もしくはインター予測部104の予測ブロックとの差分を減算器114によって求め、それを予測残差信号とする。変換部105では予測残差信号に対する直交変換(DCT)等が行われ、変換係数を出力する。量子化部106は変換係数を量子化し、量子化後変換係数を出力する。逆量子化部107では量子化部106の出力の逆量子化が行われ、逆変換部108では変換部105の逆変換が行われる。逆変換後の値は予測ブロックと加算器115によって加算合成され、復号画像記憶部109に格納される。
復号画像記憶部109の画像はイントラ予測部103にて使用される。処理対象フレームの全てのブロックに対して前述の処理が終了すると、インループフィルタ処理部110にて復号画像の符号化歪を除去する画像処理フィルタリングが施され、フィルタリング後の復号画像はフレームバッファ111に格納される。フレームバッファ111に格納された復号画像はインター予測部104にて使用される。イントラ予測部103、インター予測部104の予測情報や量子化後変換係数、インループフィルタ処理部110のインループフィルタ情報はエントロピー符号化部112に入力され、符号化ストリームを出力する。符号化情報記憶部113には復号装置側でも参照可能な符号化済みの各種ブロックサイズや予測情報、量子化後の係数値、インループフィルタオーバーヘッドなど、各種値が格納され、符号化情報記憶部113の情報は同装置内の様々な処理部で引用される。
次に、前述した一般的な画像符号化装置に対して新たに設けたプレフィルタ用色変換行列生成部101、プレフィルタ処理部102、エントロピー符号化部112の機能を説明する。プレフィルタ用色変換行列生成部101は、符号化対象シーケンスに適用して色変換行列を生成し、色変換情報およびスケーリング情報を出力する。プレフィルタ処理部102は、色変換行列を符号化対象画像に適用して色空間を変換して出力する。エントロピー符号化部112は、プレフィルタ用色変換行列生成部101が出力する色変換情報およびスケーリング情報を符号化して出力する。
次に、図2を参照して、図1に示す画像符号化装置の動作を説明する。図2は、図1に示す画像符号化装置の動作を示すフローチャートである。まず、プレフィルタ用色変換行列生成部101は、入力した符号化対象シーケンスから色変換行列、色変換情報およびスケーリング情報を生成する(ステップS1)。続いて、プレフィルタ処理部102は、符号化対象画像を符号化対象シーケンスから読み込み(ステップS2)、プレフィルタ用色変換行列生成部101が生成した情報に基づき符号化対象画像に対して色変換を適用する(ステップS3)。
次に、符号化対象画像をブロック毎に読み込み(ステップS4)、減算器114は、予測ブロックとの差分をとり、差分ブロックを生成して出力する(ステップS5)。続いて、変換部105は、差分ブロックに対して直交変換を適用して出力する(ステップS6)。これを受けて、量子化部106は、直交変換後の係数値を量子化して出力する(ステップS7)。
次に、逆量子化部107は、量子化後の係数値を逆量子化して出力する(ステップS8)。これを受けて、逆変換部108は、逆量子化後の係数値を逆直交変換して出力する(ステップS9)。続いて、加算器115は、予測ブロックと加算合成し、復号画像記憶部109に記憶する(ステップS10)。そして、全てのブロックの処理が終了したかの判定を行い(ステップS11)、未処理のブロックがある場合はステップS4に戻る。
次に、インループフィルタ処理部110は、復号画像記憶部109に記憶した復号画像に対してインループフィルタを適用し、フレームバッファ111に記憶する(ステップS12)。続いて、エントロピー符号化部112は、予測情報、量子化後係数値、インループフィルタ情報、色変換情報およびスケーリング情報などをエントロピー符号化する(ステップS13)。そして、全てのフレームの処理が終了したかの判定を行い(ステップS14)、未処理のフレームがある場合はステップS2に戻って処理を繰り返し、全てのフレームが終了した時点で、エントロピー符号化部112は、符号化ストリームを出力する(ステップS15)。
次に、図3を参照して、図1に示すプレフィルタ用色変換行列生成部101の詳細な構成を説明する。図3は、図1に示すプレフィルタ用色変換行列生成部101の詳細な構成を示すブロック図である。プレフィルタ用色変換行列生成部101は、符号化対象シーケンスを入力し、入力した符号化対象シーケンスから色変換行列、色変換情報及びスケーリング情報を出力する。主成分分析部1011は、符号化対象シーケンスを入力し、色変換行列を得る。色変換行列の生成手法には、例えば主成分分析を用いて得る手法が考えられる。転置行列変換部1012は、色変換行列を転置行列に変更して、3軸回転角度解析部1013に対して出力する。3軸回転角度解析部1013は入力された転置行列と直交する3軸回転行列の乗算にて出力される値との誤差を最小化し、各軸周りの回転角度を出力する。出力する回転角度を整数精度に丸める場合、転置行列変換部1012の出力値と3つの回転角度から再構成される回転行列が一致しない可能性があるため、3軸回転角度解析部1013は回転角度に加え、再構成可能な色変換行列を出力する。
スケーリング値解析部1014は、符号化対象シーケンスに回転行列を適用し、色空間変換後の各軸における絶対値の最大値を算出してスケーリング値を算出する。このとき得るスケーリング値は、RGBの各信号からシーケンスのビット深度が許容する最大画素値の半分を減算して色変換行列を乗算したときの絶対値を前記ビット深度が許容する最大画素値の半分で除算した値である。ここで得られたスケーリング値で色変換行列の各行を除算し、スケーリング済み色変換行列を出力する。スケーリング値解析部1014はスケーリング値と所定の値との差分をスケーリング情報として出力する。色変換行列の生成は、例えば全てのフレームが画面内予測で符号化されるAll Intraの場合はフレーム単位で、Closed GOP(Group of Picture)構造の場合はGOP構造のサイズ毎に、もしくはシーケンス全体で1つ生成するパターン等が想定される。
次に、図4を参照して、図3に示すプレフィルタ用色変換行列生成部101の動作を説明する。図4は、図3に示すプレフィルタ用色変換行列生成部101の動作を示すフローチャートである。まず、主成分分析部1011は、主成分分析により符号化対象シーケンスから色変換行列を生成して出力する(ステップS21)。続いて、転置行列変換部1012は、色変換行列に対して転置行列変換を行って出力する(ステップS22)。
次に、3軸回転角度解析部1013は、3軸回転角度解析を行い、各軸周りの回転角度および再構成可能な色変換行列を出力する(ステップS23)。続いて、スケーリング値解析部1014は、符号化対象シーケンス内の各符号化対象画像の色空間を変換し、軸ごとに変換時の絶対値の最大値を算出してスケーリング値を算出して出力する(ステップS24)。
次に、スケーリング差分算出部1015は、色変換行列の各行をスケーリング値で除算してスケーリング済み色変換行列を出力する(ステップS25)。そして、スケーリング値と所定の値との差分をスケーリング情報として出力する(ステップS26)。
次に、図5を参照して、図1に示すプレフィルタ処理部102の詳細な構成を説明する。図5は、図1に示すプレフィルタ処理部102の詳細な構成を示すブロック図である。プレフィルタ処理部102は、符号化対象シーケンスにおける各符号化対象画像と色変換行列を入力し、符号化対象シーケンスにおける各符号化対象画像に色変換行列を適用して、プレフィルタ適用後の各符号化対象画像を出力する。プレフィルタ実行部1021は符号化対象シーケンスにおける各符号化対象画像とプレフィルタ用色変換行列生成部101によって出力された色変換行列を入力し、RGBの各チャンネルを異なる色空間に変換する。この変換では、RGBの各信号からシーケンスのビット深度が許容する画素最大値の半分を減算して色変換行列を乗算し、スケーリングを行った後、前記ビット深度最大値の半分を加算して0から前記ビット深度が許容する画素最大値の間にクリッピングした値を出力する。
次に、図6を参照して、図5に示すプレフィルタ処理部102の動作を説明する。図6は、図5に示すプレフィルタ処理部102の動作を示すフローチャートである。まず、プレフィルタ実行部1021は、各符号化対象画像に色変換を実行する(ステップS31)。そして、プレフィルタ実行部1021は、プレフィルタ適用後の各符号化対象画像を出力する(ステップS32)。
ここで、色空間変換について説明する。一般的な自然画のRGB信号を対象として色空間変換を行うとき、ほとんどの場合R=G=Bのグレイスケールに高い集中が現れるため、R=G=Bの軸を第一主成分として割り当てるように回転が行われることが多い。例えばR=G=Bの軸が第一主成分を表すx軸上に割り当てられたと仮定すると、第二、三主成分を表すyz軸への信号値の分散は比較的小さいものとなる。また、一般的な自然画であれば、被写体の階調が最もコントラストが高く鮮明に見えるよう、撮影時にカメラのISO感度やアイリスの調整で、ビット深度の許容するレンジ一杯に映像を撮影するのが通常である。これらの映像を対象とした場合、8−bitシーケンスの場合は輝度値が広く分散し、ほとんどが最大値RGB(255、255、255)、最小値RGB(0、0、0)となる。これより、第一主成分のスケーリング値は一辺1の立方体における対角成分の長さに当たる√3(≒1.73205)に集中する。そのため、第一主成分のスケーリング値は√3からの差分を符号化した方が0への集中が高くなるため、スケーリング値そのままを符号化する場合と比較して発生符号量を抑制することができる。
また、原画再現性を大きく損なうことのないスケーリング値として、例えば、前述のYCbCr変換における各係数値の二乗和の平方根との比を用いることができる。Cb、Crの導出に使用される各係数値の二乗和の平均値0.4372の平方根0.6612と主成分分析による回転行列の各係数値の二乗和1.0との比を計算すると約1.512となり、色差成分のスケーリング値を符号化する場合はこの値との差分を符号化する。これにより、スケーリング値をそのまま符号化する場合と比較して、より少ない符号量で記述できるようになり、かつ寄与率が低い色差成分の発生符号量を抑制することができるため、符号化効率の向上が期待できる。
なお、2.2873の代表値はYCbCr変換の係数値から算出した一例であり、この値以外を設定してもよい。HEVCVersion2(非特許文献1)にて複数のパターンで実験したところ、約1.7818で良好な符号化効率の改善が確認できたため、このような値を使ってもよい。
次に、画像復号装置について説明する。図7は、本発明の実施形態における画像復号装置の構成を示すブロック図である。図7に示す画像復号装置が、HEVC等に代表される一般的な画像復号装置と比較してエントロピー復号部201およびポストフィルタ処理部210が異なる。エントロピー復号部201及びポストフィルタ処理部210を除く構成は、一例でありこの構成に限定されるものではない。
ここで、図7に示す画像復号装置の構成を説明する。画像復号装置は、符号化ストリームを入力し、符号化ストリームを復号シーケンスに変換して、復号シーケンスを出力信号として出力する。エントロピー復号部201は、符号化ストリームを入力しブロック毎の予測情報や量子化後変換係数、インループフィルタ情報を復号する。逆量子化部202は、復号された量子化後変換係数の逆量子化を行う。逆変換部203は、逆量子化後の出力を逆直交変換(IDCT)を行う。逆変換部203の出力信号はイントラ予測部204、もしくはインター予測部205の予測ブロックと加算器211によって加算合成され、復号画像記憶部206に記憶する。復号画像記憶部206の画像はイントラ予測部204にて使用される。処理対象のフレームの全てのブロックに対して前述した処理が終了すると、インループフィルタ処理部207にて復号画像の符号化歪を除去する画像処理フィルタリングが施され、フィルタリング後の復号画像はフレームバッファ208に記憶する。フレームバッファ208の画像はインター予測部205にて使用される。符号化情報記憶部209は各種ブロックサイズや予測情報、量子化後の係数値、インループフィルタオーバーヘッドなど、各種値を記憶する。符号化情報記憶部209の情報は同装置内の様々な処理部で引用される。
ここでは、前述した画像復号装置に加え、エントロピー復号部201は、ポストフィルタ処理部210の実行に必要な色変換情報およびスケーリング情報を復号する。続いてポストフィルタ処理部210をインループフィルタ処理部207の出力画像に適用し、色空間の逆変換を行った画像を最終の出力信号としてディスプレイに表示もしくは記録装置に保存する。
次に、図8を参照して、図7に示す画像復号装置の動作を説明する。図8は、図7に示す画像復号装置の動作を示すフローチャートである。まず、エントロピー復号部201は、符号化ストリームを読み込む(ステップS41)。続いて、エントロピー復号部201は、符号化ストリームをエントロピー復号し、予測情報や量子化後の係数値、インループフィルタオーバーヘッド等の情報、色変換情報、スケーリング情報などを復号する(ステップS42)。
次に、逆量子化部202は、量子化後の係数値を逆量子化して出力する(ステップS43)これを受けて、逆変換部203は、逆量子化後の係数値を逆直交変換する(ステップS44)。続いて、加算器211は、予測ブロックと加算合成し、復号画像記憶部206に記憶する(ステップS45)。そして、全てのブロックの処理が終了したかの判定を行い(ステップS46)、未処理のブロックがある場合はステップS43に戻る。
次に、インループフィルタ処理部207は、復号画像に対してインループフィルタを適用し、復号画像をフレームバッファ208に記憶する(ステップS47)。そして、全てのフレームの処理が終了したかの判定を行い(ステップS48)、未処理のフレームがある場合はステップS43に戻る。
次に、ポストフィルタ処理部210は、色変換情報およびスケーリング情報を用いてポストフィルタを適用し(ステップS49)、復号シーケンスを出力信号として出力する(ステップS50)。
次に、図9を参照して、図7に示すポストフィルタ処理部210の詳細な構成を説明する。図9は、図7に示すポストフィルタ処理部210の詳細な構成を示すブロック図である。ポストフィルタ処理部210は、復号画像、色変換情報、スケーリング情報を入力し、復号画像に色変換行列を適用して、ポストフィルタ適用後の復号画像を出力する。ポストフィルタ用色変換行列生成部2101は色変換情報(3軸回転角度)とスケーリング情報を入力とし、所定の値からスケーリング情報に記される差分スケーリング値を減算して本来のスケーリング値を導出し、正負を反転させた3軸回転角度から生成される色変換行列の各行に前記本来のスケーリング値を乗算する。ポストフィルタ実行部2102は色変換行列と復号画像を入力とし、復号画像をRGB色空間に逆変換する。この逆変換処理において、復号画像の各信号にはシーケンスのビット深度が許容する画素最大値の半分を減算して色変換行列を乗算し、スケーリングを行った後、前記ビット深度が許容する画素最大値の半分を加算して0から前記ビット深度最大値の間にクリッピングした値を出力する。
次に、図10を参照して、図9に示すポストフィルタ処理部210の動作を説明する。図10は、図9に示すポストフィルタ処理部210の動作を示すフローチャートである。まず、ポストフィルタ用色変換行列生成部2101は、所定の値からスケーリング情報に記される差分スケーリング値を減算し、スケーリング値を生成する(ステップS61)。そして、ポストフィルタ用色変換行列生成部2101は、色変換情報(3軸回転角度)から色変換行列を生成し、色変換行列の各行に該当するスケーリング値を積算する(ステップS62)。続いて、ポストフィルタ実行部2102は、復号画像に色逆変換を実行し(ステップS63)、ポストフィルタ適用後の復号画像を出力する(ステップS64)。
以上説明した画像符号化および画像映像復号の処理は、コンピュータとソフトウェアプログラムとによっても実現することができ、そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも、ネットワークを通して提供することも可能である。
図11は、前述した画像符号化装置をコンピュータとソフトウェアプログラムとによって構成したシステムのハードウェア構成例を示す図である。本システムは、プログラムを実行するCPU・A0と、CPU・A0がアクセスするプログラムやデータが格納されるRAM等のメモリA1と、カメラ等からの符号化対象の画像信号を入力する画像信号入力部A2 ディスク装置等による画像信号を記憶する記憶部でもよい)と、前述した手法により入力画像を符号化する処理をCPU・A1に実行させるソフトウェアプログラムである画像符号化プログラムA4が格納されたプログラム記憶装置A3と、CPU・A0がメモリA1にロードされた画像符号化プログラムA4を実行することにより生成された符号化データを、例えばネットワークを介して出力する符号化データ出力部A5(ディスク装置等による符号化データを記憶する記憶部でもよい)とが、バスで接続された構成になっている。
図12は、前述した画像復号装置をコンピュータとソフトウェアプログラムとによって構成したシステムのハードウェア構成例を示す図である。本システムは、プログラムを実行するCPU・B0と、CPU・B0がアクセスするプログラムやデータが格納されるRAM等のメモリB1と、画像符号化装置が符号化した符号化データを入力する符号化データ入力部B2(ディスク装置等による多重化符号化データを記憶する記憶部でもよい)と、前述した手法により符号化データを復号する処理をCPU・B1に実行させるソフトウェアプログラムである画像復号プログラムB4が格納されたプログラム記憶装置B3と、CPU・B0がメモリB1にロードされた画像復号プログラムB4を実行することにより、符号化データを復号して得られた復号画像を、再生装置などに出力する復号画像出力部B5とが、バスで接続された構成になっている。
以上説明したように、RGB信号に対して回転行列を用いて異なる色空間に変換する符号化方法、また、復号信号を逆方向の回転行列を用いた色空間の変換によりRGB信号に戻す復号方法において、回転行列の表記に直交する3軸の回転角度および各軸のスケーリング値を符号化するとき、色空間変換後の座標系における1つ以上の軸のスケーリング値に対し、それぞれ所定の値との差分をとることにより、3軸のスケーリング値をそのまま符号化する場合と比較して、より少ない符号量で記述可能となる。このため、色差成分の発生符号量を抑制し、符号化効率を改善することができる。
前述した実施形態における画像符号化装置、画像復号装置をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、PLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されるものであってもよい。
以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものではないことは明らかである。したがって、本発明の技術思想及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行っても良い。
色空間変換において、その行列情報の表記に回転角度を用いて明示するとき、発生符号量を抑制して符号化効率を改善する用途に利用できる。
101・・・プレフィルタ用色変換行列生成部、1011・・・主成分分析部、1012・・・転置行列変換部、1013・・・3軸回転角度解析部、1014・・・スケーリング値解析部、1015・・・スケーリング差分算出部、102・・・プレフィルタ処理部、1021・・・プレフィルタ実行部、112・・・エントロピー符号化部、201・・・エントロピー復号部、210・・・ポストフィルタ処理部、2101・・・ポストフィルタ用色変換行列生成部、2102・・・ポストフィルタ実行部

Claims (11)

  1. RGB信号として入力された画像に対して行列を用いて異なる色空間の信号に変換し、変換後の信号を符号化する画像符号化装置が行う画像符号化方法であって、
    前記行列を直交する3軸回転角度で表現し、各軸の回転角度を符号化するステップと、
    色空間変換後の座標軸における各軸のスケーリング値を符号化するステップと、
    各軸の1つ以上のスケーリング値に対して所定の値との差分情報を符号化し、色空間変換された各軸上の値を前記スケーリング値でそれぞれ除算した値を符号化対象画像として用いる符号化するステップと
    を有することを特徴とする画像符号化方法。
  2. 前記所定の値の内、1つの軸の値が√3、またはそれに準じる整数演算時の整数値であることを特徴とする請求項1に記載の画像符号化方法。
  3. 前記色空間変換された各軸上の値を前記スケーリング値でそれぞれ除算した値を符号化対象画像に対して、入力された前記画像のビット深度の最大値を上回る値および最小値を下回る値をクリッピングすることを特徴とする請求項1に記載の画像符号化方法。
  4. 入力された符号化ストリームに含まれる各軸のスケーリング値で復号信号を乗算し、前記符号化ストリームに含まれる直交する3軸回転角度から行列を生成し、復号信号をRGB信号に変換する画像復号装置が行う画像復号方法であって、
    前記スケーリング値に対し、復号する情報が所定の値からの差分スケーリング値であり、前記所定の値から前記差分スケーリング値を減算して本来のスケーリング値を導出するステップを
    有することを特徴とする画像復号方法。
  5. 前記所定の値の内、1つの軸の値が√3、またはそれに準じる整数演算時の整数値であることを特徴とする請求項4に記載の画像復号方法。
  6. RGB信号として入力された画像に対して行列を用いて異なる色空間の信号に変換し、変換後の信号を符号化する画像符号化装置であって、
    前記行列を直交する3軸回転角度で表現し、各軸の回転角度を符号化する手段と、
    色空間変換後の座標軸における各軸のスケーリング値を符号化する手段と、
    各軸の1つ以上のスケーリング値に対して所定の値との差分情報を符号化し、色空間変換された各軸上の値を前記スケーリング値でそれぞれ除算した値を符号化対象画像として用いる符号化する手段と
    を備えることを特徴とする画像符号化装置。
  7. 入力された符号化ストリームに含まれる各軸のスケーリング値で復号信号を乗算し、前記符号化ストリームに含まれる直交する3軸回転角度から行列を生成し、復号信号をRGB信号に変換する画像復号装置であって、
    前記スケーリング値に対し、復号する情報が所定の値からの差分スケーリング値であり、前記所定の値から前記差分スケーリング値を減算して本来のスケーリング値を導出する手段を
    備えることを特徴とする画像復号装置。
  8. コンピュータに、請求項1から3にいずれか1項に記載の画像符号化方法を実行させるための画像符号化プログラム。
  9. コンピュータに、請求項4または5に記載の画像復号方法を実行させるための画像復号プログラム。
  10. 請求項8に記載の画像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体。
  11. 請求項9に記載の画像復号プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2013079732A 2013-04-05 2013-04-05 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、およびそれらのプログラム並びに記録媒体 Active JP6018012B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013079732A JP6018012B2 (ja) 2013-04-05 2013-04-05 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、およびそれらのプログラム並びに記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013079732A JP6018012B2 (ja) 2013-04-05 2013-04-05 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、およびそれらのプログラム並びに記録媒体

Publications (2)

Publication Number Publication Date
JP2014204332A JP2014204332A (ja) 2014-10-27
JP6018012B2 true JP6018012B2 (ja) 2016-11-02

Family

ID=52354404

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013079732A Active JP6018012B2 (ja) 2013-04-05 2013-04-05 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、およびそれらのプログラム並びに記録媒体

Country Status (1)

Country Link
JP (1) JP6018012B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102784625B1 (ko) * 2018-11-01 2025-03-19 세종대학교산학협력단 칼라 좌표축 변환을 이용한 영상 부호화/복호화 방법 및 장치
EP4229869A1 (en) * 2020-10-14 2023-08-23 Dolby Laboratories Licensing Corporation Color transformation for hdr video with a coding-efficiency constraint

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06139345A (ja) * 1992-10-23 1994-05-20 Toshiba Corp 特異値展開符号化方式
JP2009005041A (ja) * 2007-06-21 2009-01-08 Sony Corp 符号化装置および方法、復号装置および方法、プログラム、記録媒体、並びにデータ構造
EP2144432A1 (en) * 2008-07-08 2010-01-13 Panasonic Corporation Adaptive color format conversion and deconversion

Also Published As

Publication number Publication date
JP2014204332A (ja) 2014-10-27

Similar Documents

Publication Publication Date Title
JP6335365B2 (ja) 復号装置
KR101672607B1 (ko) 부호화 장치, 복호화 장치, 부호화 방법, 복호화 방법, 및 컴퓨터 판독가능 기억 매체
CN107637078B (zh) 整数变换系数的视频译码系统和方法
JP6042899B2 (ja) 映像符号化方法および装置、映像復号方法および装置、それらのプログラム及び記録媒体
JP2014116733A (ja) 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
CN108353175A (zh) 使用系数引起的预测处理视频信号的方法和装置
US20230007311A1 (en) Image encoding device, image encoding method and storage medium, image decoding device, and image decoding method and storage medium
WO2017196128A1 (ko) 계수 유도 복원을 이용하여 비디오 신호를 처리하는 방법 및 장치
JP2013146038A (ja) 画像量子化装置、画像量子化方法及びプログラム、画像逆量子化装置、画像逆量子化方法及びプログラム
JP2022140573A (ja) 動画像復号装置、動画像復号方法及びプログラム
JP2021515494A (ja) 適応乗算係数を用いた画像フィルタリングのための方法および装置
CN119135900A (zh) 图像解码装置、解码方法和存储介质
JP5800362B2 (ja) 動画像送出装置、動画像受信装置、動画像伝送システム、動画像送出方法、動画像受信方法、およびプログラム
CN106028031B (zh) 视频编码装置和方法、视频解码装置和方法
JP6018012B2 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、およびそれらのプログラム並びに記録媒体
JP6457248B2 (ja) 画像復号装置、画像符号化装置および画像復号方法
JP6013964B2 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、およびそれらのプログラム並びに記録媒体
JP6030989B2 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、それらのプログラム並びにプログラムを記録した記録媒体
JP2023027401A (ja) 復号装置、プログラム、及び復号方法
JP2025534504A (ja) 成分間予測のフィルタ係数導出の単純化
CN110603811A (zh) 视频编码系统和方法中的残差变换和逆向变换
JP2011004051A (ja) 動画像符号化方法,動画像符号化装置および動画像符号化プログラム
US12238308B2 (en) Image encoding method and image decoding method
JP2011166228A (ja) 画像処理装置、符号化装置、復号装置及びプログラム
JP2020195096A (ja) 映像符号化装置及びプログラム、並びに、映像復号装置及びプログラム、並びに、映像処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151207

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160927

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160929

R150 Certificate of patent or registration of utility model

Ref document number: 6018012

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350