JP6530304B2 - 符号化方法、符号化装置及び符号化プログラム - Google Patents

符号化方法、符号化装置及び符号化プログラム Download PDF

Info

Publication number
JP6530304B2
JP6530304B2 JP2015222887A JP2015222887A JP6530304B2 JP 6530304 B2 JP6530304 B2 JP 6530304B2 JP 2015222887 A JP2015222887 A JP 2015222887A JP 2015222887 A JP2015222887 A JP 2015222887A JP 6530304 B2 JP6530304 B2 JP 6530304B2
Authority
JP
Japan
Prior art keywords
texture
component
area
image
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015222887A
Other languages
English (en)
Other versions
JP2017092801A (ja
Inventor
崇元 佐々木
崇元 佐々木
隆一 谷田
隆一 谷田
清水 淳
淳 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
NTT Inc USA
Original Assignee
Nippon Telegraph and Telephone Corp
NTT Inc USA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, NTT Inc USA filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015222887A priority Critical patent/JP6530304B2/ja
Publication of JP2017092801A publication Critical patent/JP2017092801A/ja
Application granted granted Critical
Publication of JP6530304B2 publication Critical patent/JP6530304B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

本発明は、符号化方法、符号化装置及び符号化プログラムに関する。
モバイル通信網の発達に伴い、映像を非常に低いビットレート条件で符号化する需要が高まっている。また、映像表示装置の大型化、高精細化に伴い、従来使われてきた固定通信網を用いて解像度やフレームレートが非常に高く、情報量の大きい映像を符号化する需要も高まっている。しかし、従来の規格H.264やHEVC(High Efficiency Video Coding)などによる符号化技術では、厳しいビットレート条件において、ブロックノイズやモスキートノイズなど符号化特有の劣化が大きく生じるため、主観的な品質が大きく損なわれる。
この問題を回避するために、Texture(テクスチャ)構造が似通った広い領域を、小面積の代表Textureから合成するTexture合成を利用した符号化方式(擬似表現符号化)が有効である(例えば、非特許文献1参照)。擬似表現符号化では、従来の符号化技術が捉えられなかったTexture構造の類似性を捉えて、非常にコンパクトに表現することができるため、大幅なビットレート削減と主観画質改善が可能である。
ここで図5を参照して、従来の擬似表現符号化器が実行する擬似表現符号化の処理について説明する。
図5は、従来の擬似表現符号化処理のフローチャートである。処理が開始されると、擬似表現符号化器は、原画F=[fi,j]をCartoon(カートゥーン)−Texture信号分解し、Cartoon成分C=[ci,j]とTexture成分T=[ti,j]との2成分に分解する(ステップS901)。ただし、原画FのサイズをN×Mとすると、1≦i≦N、1≦j≦Mであり、fi,jは原画Fのi,j成分を表している。またci,jやti,j、さらにはこれ以降の記述ついても同様に、下添字i,jは位置i,jの画素における成分を示す。Cartoon成分は画像のマクロな輝度変化、Texture成分は画像のミクロな輝度変化を表現するもので、2成分を同じ位置の画素毎に足し合わせると原画となる。すなわち、fi,j=ci,j+ti,jである(例えば、非特許文献2参照)。
続いて擬似表現符号化器は、原画Fを用いて、Texture特徴量を算出する(ステップS902)。この特徴量は様々に定義されているが、代表的なのはGLCM(Gray-Level Co-Occurrence Matrix)という統計量を用いたものや(例えば、非特許文献3参照)、複数のガボール基底との内積を計算するフィルタバンク処理によるもの(例えば、非特許文献4参照)などである。
続いて、擬似表現符号化器は、ステップS902において算出されたTexture特徴量をクラスタリングし、Textureの領域分割情報SEG=[segi,j]とクラスタ中心C,C,…,Cを算出する(ステップS903)。このクラスタリングは、予め指定したクラス数kのクラスタ(領域)に分割するもので、位置i,jにおいてTextureがl番目のクラスタであるクラスl(1≦l≦k)に所属することを、segi,j=lと表記する。クラスタリングのアルゴリズムは様々な手法から選択することができ、例えば、k-means法(例えば、非特許文献4参照)などが代表的である。
続いて、擬似表現符号化器は、ステップS903において算出されたTextureの領域分割情報をもとに、非合成領域NSR=[nsri,j]を算出する(ステップS904)。非合成領域は、Cartoon成分とTexture成分とを分離せずに符号化する領域であり、すなわち、復号時にTexture成分が合成されない領域である。一方、合成領域は、Cartoon成分とTexture成分とを分離して符号化する領域であり、すなわち、復号時にTexture成分が合成される領域である。各nsri,jは1か0の値をとる。nsri,j=1の位置i,jは非合成領域であり、nsri,j=0の位置i,jは合成領域であるとする。非合成領域NSRは、領域分割結果の面積に基づいて算出される。非合成領域算出の詳細については図6を用いて後に詳説する。
続いて、擬似表現符号化器は、ステップS904において算出された非合成領域NSRをもとに、ステップS901で算出されたTexture成分Tの中で、Texture合成を行わない非合成Texture成分NST=[nsti,j]を算出する(ステップS905)。nsti,jは各位置i,jについて、以下の式(1)のように計算される。nsti,jは、位置i,jが非合成領域である(nsri,j=1)場合はCartoon−Texture信号分解部901が出力したその位置のTexture成分ti,jであり、位置i,jが合成領域である(nsri,j=0)場合は0である。
Figure 0006530304
続いて、擬似表現符号化器は、ステップS903において算出されたTextureの領域分割情報SEGと、ステップS904において算出された非合成領域NSRを合成して、拡張Texture領域分割情報ESEG=[esegi,j]を算出する(ステップS906)。esegi,jは、各位置i,jについて、以下の式(2)のように計算される。esegi,jは、位置i,jが合成領域(nsri,j=0)である場合はその位置が属するクラスタのクラスを表すsegi,jであり、位置i,jが非合成領域である(nsri,j=1)場合は0である。
Figure 0006530304
続いて、擬似表現符号化器は、ステップS901において算出されたCartoon成分Cと、ステップS905において算出された非合成Texture成分NSTを各位置i,jについて足しあわせて、非合成成分NSC=[nsci,j]=[ci,j+nsti,j]を算出する(ステップS907)。つまり、位置i,jが非合成領域の場合は、原画Fにおける位置i,jの成分であり、位置i,jが合成領域の場合は、Cartoon−Texture信号分解部901が出力した位置i,jのCartoon成分である。
続いて、擬似表現符号化器は、ステップS901において算出されたTexture成分TとステップS902において算出されたTexture特徴量情報と、ステップS903において算出されたクラスタ中心情報と、ステップS906において算出された拡張Texture領域分割情報ESEGとを用いて、代表Texture情報を算出する(ステップS908)。代表Texture情報の算出には、様々な算出方法が考えられるが、例えば、各ESEGの値毎に、予め定めた窓でラスタ順にスキャンし、各Texture特徴量とクラスタ中心との距離の窓内総和が最も小さくなる窓位置で、そのクラスの代表Textureとするなどが考えられる。
続いて、擬似表現符号化器は、ステップS907において算出された非合成成分NSCを符号化し、非合成成分ストリームを生成する(ステップS909)。この生成には、例えば、JPEG(Joint Photographic Experts Group)やJPEG2000、H.264、HEVCなどの従来の画像符号化方法を用いることができる。
続いて、擬似表現符号化器は、ステップS908において算出された代表Texture情報を符号化し、代表Texture情報ストリームを生成する(ステップS910)。この生成には、例えば、JPEGやJPEG2000、H.264、HEVCなどの従来の画像符号化方法を用いることができる。
続いて、擬似表現符号化器は、ステップS906において生成された拡張Texture領域分割情報ESEGを符号化し、拡張Texture領域分割ストリームを生成する(ステップS911)。この生成には、例えば、PNG(Portable Network Graphics)やGIF(Graphics Interchange Format)、ランレングス、JEPG、HEVCなどの従来の符号化方法を用いることができる。
続いて、擬似表現符号化器は、ステップS909において生成された非合成成分ストリームを復号する(ステップS912)。復号方法は、ステップS909において非合成成分ストリームの生成に用いた画像符号化方法に従う。また、擬似表現符号化器は、ステップS910において生成された代表Texture情報ストリームを復号する(ステップS913)。復号方法は、ステップS910において代表Texture情報ストリームの生成に用いた画像符号化方法に従う。さらに、擬似表現符号化器は、ステップS911において生成された拡張Texture領域分割ストリームを復号する(ステップS914)。復号方法は、ステップS911において拡張Texture領域分割ストリームの生成に用いた符号化方法に従う。
擬似表現符号化器は、ステップS913において復号された代表Texture情報と、ステップS914において復号された拡張Texture領域分割情報を用いて、復号された合成成分を生成する(ステップS915)。この処理において、擬似表現符号化器は、復号された代表Texture情報をそれぞれTexture合成してから、復号された拡張Texture領域分割情報に合わせて切り出し、合成成分を算出する。Texture合成の方法は様々あるが、Image Quilting(例えば、非特許文献4参照)などが代表的である。
擬似表現符号化器は、ステップS912において復号された非合成成分と、ステップS915において生成された、復号された合成成分とを足し合わせて、復号された画像を生成し、この画像を出力して処理を終了する(ステップS916)。
上記のように、従来の擬似表現符号化処理では、領域分割面積を用いて非合成領域を算出する。
続いて図6を参照して、図5のステップS904において領域分割面積から非合成領域算出する方法について説明する。
図6は、領域分割面積による非合成領域算出処理のフローチャートである。初めに、擬似表現符号化器は、ステップS903において算出されたTexture領域分割情報SEGを用いて、クラスタリングされた各領域の面積を計数する(ステップS9041)。続いて、擬似表現符号化器は、ステップS9041において算出された各領域の面積をソートし、面積順位情報を算出する。ここでは、領域番号1,2,…,kの領域を、面積が大きい順にl,l,…,lと求めて面積順位情報とする(ステップS9042)。
続いて、擬似表現符号化器は、ステップS903において算出されたTexture領域分割情報SEGと、ステップS9042において算出された面積順位情報l,l,…,lとを用いて、非合成領域情報NSR=[NSRi,j]を算出する(ステップS9043)。まず、擬似表現符号化器は、出力である非合成領域NSR=[nsri,j]を全てのi,jについてnsri,j=1と初期化し、さらに画像の全領域を予め定めたブロックサイズに分割する。擬似表現符号化器は、予め定めた合成領域数p(1≦p≦k)個の領域l=l,l,…,lについて、先ほどのブロックがsegi,j=lの領域に包含される場合、そのブロックに属する領域i,jについて、nsri,j=0とする(ステップS9043)。
図9は、画像サイズが24×36、ブロックサイズが4×4、領域分割数が3、合成領域数が2の場合に、上記の動作を行った例を示す図である。
このように図6で示した処理手順に従って非合成領域情報を算出し、図5で示した処理手順に従って画像の符号化、及び、復号を行うことができる。
次に、図5で示した擬似表現符号化処理を行う擬似表現符号化器の構成について説明する。
図7は、図5に示す擬似表現符号化処理を実現する擬似表現符号化器9の構成を示すブロック図である。擬似表現符号化器9は、Cartoon−Texture信号分解部901、Texture特徴量算出部902、特徴量クラスタリング算出部903、非合成領域算出部904、非合成Texture抽出部905、領域情報合成部906、加算器907、代表Texture算出部908、非合成成分符号化部909、代表Texture符号化部910、領域情報符号化部911、非合成成分復号部912、代表Texture復号部913、領域情報復号部914、Texture合成部915、及び、加算器916を備えて構成される。擬似表現符号化器9は原画Fを入力とし、復号された画像を出力とする。以下、擬似表現符号化器9を構成する各部について詳細に記述する。
Cartoon−Texture信号分解部901は、原画Fを入力としてステップS901のCartoon−Texture信号分解処理を行う。Cartoon−Texture信号分解部901は、Cartoon−Texture信号分解処理により得られた、Cartoon成分CとTexture成分Tとを出力する。
Texture特徴量算出部902は、原画Fを入力としてステップS902のTexture特徴量算出処理を行う。Texture特徴量算出部902は、Texture特徴量算出処理により得られた、Texture特徴量情報を出力する。
特徴量クラスタリング算出部903は、Texture特徴量算出部902が出力したTexture特徴量情報を入力としてステップS903の特徴量クラスタリング算出処理を行う。特徴量クラスタリング算出部903は、特徴量クラスタリング算出処理によって得られた、クラスタ中心情報とTexture領域分割情報SEGとを出力する。
非合成領域算出部904は、特徴量クラスタリング算出部903が出力したTexture領域分割情報SEGを入力としてステップS904の領域分割面積による非合成領域算出処理を行う。非合成領域算出部904は、領域分割面積による非合成領域算出処理により得られた、非合成領域情報NSRを出力する。
非合成Texture抽出部905は、Cartoon−Texture信号分解部901が出力したTexture成分Tと、非合成領域算出部904が出力した非合成領域情報NSRを入力としてステップS905の非合成Texture抽出処理を行う。非合成Texture抽出部905は、非合成Texture抽出処理により得られた、非合成Texture成分NSTを出力する。
領域情報合成部906は、特徴量クラスタリング算出部903が出力したTexture領域分割情報SEGと、非合成領域算出部904が出力した非合成領域情報NSRを入力としてステップS906の領域情報合成処理を行う。領域情報合成部906は、領域情報合成処理により得られた、拡張Texture領域分割情報ESEGを出力する。
加算器907は、Cartoon−Texture信号分解部901が出力したCartoon成分Cと、非合成Texture抽出部905が出力した非合成Texture成分NSTとを入力としてステップS907の非合成成分算出処理を行う。加算器907は、非合成成分算出処理により得られた、非合成成分NSCを出力する。
代表Texture算出部908は、Cartoon−Texture信号分解部901が出力したTexture成分Tと、Texture特徴量算出部902が出力したTexture特徴量情報と、特徴量クラスタリング算出部903が出力したクラスタ中心情報と、領域情報合成部906が出力した拡張Texture領域分割情報とを入力としてステップS908の代表Texture算出処理を行う。代表Texture算出部908は、代表Texture算出処理により得られた、代表Texture情報を出力する。
非合成成分符号化部909は、加算器907が出力した非合成成分NSCを入力としてステップS909の非合成成分符号化処理を行う。非合成成分符号化部909は、非合成成分符号化処理により得られた、非合成成分ストリームを生成する。
代表Texture符号化部910は、代表Texture算出部908が出力した代表Texture情報を入力としてステップS910の代表Texture符号化処理を行う。代表Texture符号化部910は、代表Texture符号化処理により得られた、代表Texture情報ストリームを出力する。
領域情報符号化部911は、領域情報合成部906が出力した拡張Texture領域分割情報ESEGを入力としてステップS911の領域情報符号化処理を行う。領域情報符号化部911は、領域情報符号化処理により得られた、拡張Texture領域分割ストリームを出力する。
非合成成分復号部912は、非合成成分符号化部909が出力した非合成成分ストリームを入力としてステップS912の非合成成分復号処理を行う。非合成成分復号部912は、非合成成分復号処理によって復号された非合成成分を出力する。
代表Texture復号部913は、代表Texture符号化部910が出力した代表Texture情報ストリームを入力としてステップS913の代表Texture復号処理を行う。代表Texture復号部913は、代表Texture復号処理によって復号された代表Texture情報を出力する。
領域情報復号部914は、領域情報符号化部911が出力した拡張Texture領域分割ストリームを入力としてステップS914の領域情報復号処理を行う。領域情報復号部914は、領域情報復号処理により復号された拡張Texture領域分割情報を出力する。
Texture合成部915は、代表Texture復号部913により復号された代表Texture情報と、領域情報復号部914により復号された拡張Texture領域分割情報とを入力としてステップS915のTexture合成処理を行う。Texture合成部915は、Texture合成処理により復号された合成成分を出力する。
加算器916は、非合成成分復号部912により復号された非合成成分と、Texture合成部915により復号された合成成分とを入力としてステップS916の復号画像生成処理を行う。加算器916は、復号画像生成処理により復号された画像を出力する。
次に、図6で示した領域分割面積による非合成領域算出処理を行う非合成領域算出部904の詳細な構成について説明する。
図8は、図6に示す領域分割面積による非合成領域算出処理を実現する非合成領域算出部904の詳細な構成を示すブロック図である。非合成領域算出部904は、領域面積計数部9041、ソート計算部9042、及び、非合成領域決定部9043を備えて構成される。
領域面積計数部9041は、Texture領域情報SEGを入力としてステップS9041の領域面積係数処理を行う。領域面積計数部9041は、領域面積係数処理により得られた面積情報を出力する。
ソート計算部9042は、面積情報を入力としてステップS9042のソート処理を行う。ソート計算部9042は、ソート処理により得られた面積順位情報l,l,…,lを出力する。
非合成領域決定部9043は、Texture領域情報SEGと面積順位情報l,l,…,lを入力としてステップS9043の領域面積情報に基づく非合成領域決定処理を行う。非合成領域決定部9043は、領域面積情報に基づく非合成領域決定処理により得られた非合成領域情報NSRを出力する。
このように、図7及び図8に示す構成の擬似表現符号化器9は、図5及び図6に示すように、擬似表現符号化により画像の符号化、及び、復号を行う際に、領域分割面積を用いて非合成領域の算出を行う。
Y. Shi, Y. Hou, B. Yin, and W. Ding, "Image coding approach based on image decomposition," IEEE, 28th Picture Coding Symposium, PCS2010, 2010., p.534-537 J Gilles and Y Meyer, "Properties of BV- G Structures+Textures Decomposition Models. Application to Road Detection in Satellite Images," IEEE Transactions on Image Processing, 2010, Volume19 Issue11 横矢直和,「画像処理ハンドブック」,12章4節 テクスチャ解析,昭晃堂,1987年,p.295-303 A. A. Efros and W. T. Freeman, "Image quilting for texture synthesis and transfer," Proceedings of the 28th annual conference on Computer graphics and interactive techniques, ACM, 2001, p.341-346
上述した従来の非合成領域算出方法では、Texture領域分割の各面積及び形状に基づいて非合成領域を決定する。このため、原画の大部分をいくつかのTextureが占める場合において有効に働く。例えば、芝生や海、空などが大きく写る自然の風景の画像や、布地や木材のなどの素材に特化した画像が当てはまる。しかし、このような性質を持たないその他の画像については、Texture領域分割の面積や形状からはTexture合成が不向きな領域であるか否かの判断が困難な場合がある。従って、この方法で算出された非合成領域を用いると、Texture合成に不向きな領域でTexture合成をしてしまい、結果として復号画像の主観品質を損なうことがあるという課題があった。
上記事情に鑑み、本発明は、復号画像の主観品質を向上することができる符号化方法、符号化装置及び符号化プログラムを提供することを目的としている。
本発明の一態様は、符号化装置が実行する符号化方法であって、符号化対象の画像をカートゥーン成分とテクスチャ成分とに分解する分解ステップと、カートゥーン成分とテクスチャ成分との合成に向いているか否かと相関が高い物理量を前記画像から取得し、取得した前記物理量に基づいて前記画像において復号時にテクスチャ成分を合成しない領域である非合成領域を算出する非合成領域算出ステップと、前記カートゥーン成分と前記非合成領域の前記テクスチャ成分とを加算して非合成成分を算出する加算ステップと、前記非合成成分を符号する非合成成分符号化ステップと、前記非合成領域を除いた領域の前記テクスチャ成分を符号化するテクスチャ符号化ステップと、を有する。
本発明の一態様は、上述の符号化方法であって、前記非合成領域算出ステップにおいては、前記画像の画素ごとに、合成領域に向いているか否かを定量的に表す値である合成指標値を前記物理量から算出し、算出された前記合成指標値に基づいて前記画素が非合成領域に属するか否かを判定する。
本発明の一態様は、上述の符号化方法であって、前記非合成領域算出ステップは、前記画像の画素ごとに、前記画像から取得した前記物理量を用いて前記合成指標値を得る合成指標値算出ステップと、前記画素ごとに、前記合成指標値と閾値とを比較して非合成領域に属するか否かを判定する閾値処理ステップと、を有する。
本発明の一態様は、上述の符号化方法であって、前記物理量は、前記画像又は前記テクスチャ成分のアクティビティ、前記画像の顕著性、及び、前記テクスチャ成分の特徴量と前記画素が属するクラスタのクラスタ中心との距離のうち1以上を含む。
本発明の一態様は、上述の符号化方法であって、前記合成指標値算出ステップにおいては、前記アクティビティが大きいほど、前記画像の顕著性が高いほど、又は、前記テクスチャ成分の特徴量と前記クラスタ中心との距離が大きいほど、合成領域に向いていないことを示す値となるように合成指標値を算出する。
本発明の一態様は、符号化対象の画像をカートゥーン成分とテクスチャ成分とに分解する分解部と、カートゥーン成分とテクスチャ成分との合成に向いているか否かと相関が高い物理量を前記画像から取得し、取得した前記物理量に基づいて前記画像において復号時にテクスチャ成分を合成しない領域である非合成領域を算出する非合成領域算出部と、前記カートゥーン成分と前記非合成領域の前記テクスチャ成分とを加算して非合成成分を算出する加算部と、前記非合成成分を符号する非合成成分符号化部と、前記非合成領域を除いた領域の前記テクスチャ成分を符号化するテクスチャ符号化部と、を有する符号化装置である。
本発明の一態様は、コンピュータに、上述の符号化方法を実行させる符号化プログラムである。
本発明により、復号画像の主観品質を向上することが可能となる。
本発明の一実施形態による擬似表現符号化器のブロック図である。 同実施形態による非合成領域算出部のブロック図である。 同実施形態による擬似表現符号化処理のフローチャートである。 同実施形態による合成指標に基づく非合成領域算出処理のフローチャートである。 従来の擬似表現符号化処理のフローチャートである。 従来の領域分割面積による非合成領域算出処理のフローチャートである。 従来の擬似表現符号化器のブロック図である。 従来の非合成領域算出部のブロック図である。 従来の領域分割面積による非合成領域算出の例を示す図。
以下、図面を参照して、本発明の一実施形態による符号化装置、符号化方法、及び、符号化プログラムを説明する。本実施形態の符号化装置は、映像を符号化する際に、Texture(テクスチャ)合成の向き不向きと相関の高い物理量を予め算出する。符号化装置は、この物理量を算出するための入力として、Texture成分、Texture特徴量情報、Texture領域分割情報、クラスタ中心情報、そして原画の中から必要な情報を用いる。そして、符号化装置は、これらから得られる物理量としては、アクティビティやサリエンシー、Texture特徴量のクラスタ中心との距離を用いることができる。本実施形態の符号化装置は、この算出された物理量から算出された各画素の合成指標値を示す合成指標値マップを生成し、これを閾値処理することで非合成領域を算出する。合成指標値は、合成領域に向いているか否かを定量的に表す値である。また、非合成領域は、符号化対象の画像をCartoon(カートゥーン)成分(構造成分)とTexture成分とを分離せずに符号化する領域であり、すなわち、復号時にTexture成分が合成されない領域である。上記のように算出された非合成領域はTexture合成のしやすさが加味されているため、検出精度が向上し、結果として復号画像の主観品質を向上させることができる。
図1は、本発明の一実施形態による擬似表現符号化器1の構成を示すブロック図である。擬似表現符号化器1は、合成指標を用いて非合成領域を算出する符号化装置の一例である。擬似表現符号化器1は、Cartoon−Texture信号分解部101(分解部)、Texture特徴量算出部102、特徴量クラスタリング算出部103、非合成領域算出部104、非合成Texture抽出部105、領域情報合成部106、加算器107(加算部)、代表Texture算出部108、非合成成分符号化部109、代表Texture符号化部110(テクスチャ符号化部)、領域情報符号化部111(テクスチャ符号化部)、非合成成分復号部112、代表Texture復号部113、領域情報復号部114、Texture合成部115、及び、加算器116を備えて構成される。
Cartoon−Texture信号分解部101、Texture特徴量算出部102、特徴量クラスタリング算出部103、非合成Texture抽出部105、領域情報合成部106、加算器107、代表Texture算出部108、非合成成分符号化部109、代表Texture符号化部110、領域情報符号化部111、非合成成分復号部112、代表Texture復号部113、領域情報復号部114、Texture合成部115、及び、加算器116はそれぞれ、図7に示すCartoon−Texture信号分解部901、Texture特徴量算出部902、特徴量クラスタリング算出部903、非合成Texture抽出部905、領域情報合成部906、加算器907、代表Texture算出部908、非合成成分符号化部909、代表Texture符号化部910、領域情報符号化部911、非合成成分復号部912、代表Texture復号部913、領域情報復号部914、Texture合成部915、及び、加算器916と同様の機能を有するため、説明を省略する。
非合成領域算出部104は、Texture成分、Texture特徴量情報、Texture領域分割情報、クラスタ中心情報、原画を入力とし、これらから非合成領域情報NSR=[nsri,j]を算出し、出力する。下添字i,jは、画像における位置i,jの成分を示す。各nsri,jは1か0の値をとり、nsri,j=1の位置i,jは非合成領域であり、nsri,j=0の位置i,jは合成領域であるとする。非合成領域算出部104への入力は、Texture成分、Texture特徴量情報、Texture領域分割情報、クラスタ中心情報、及び、原画の全部でもよく、あらかじめ設定された非合成領域算出部104における処理内容に合わせて、それらのうち使用する一部の入力値のみを入力してもよい。非合成領域算出部104は、Cartoon成分とTexture成分との合成に向いているか否かと相関が高い物理量を入力された情報から取得する。非合成領域算出部104は、画素ごとに、取得した物理量から合成指標値を得る。非合成領域算出部104は、合成指標値に基づいて、各画素が非合成領域に属するか否かを判定して非合成領域情報NSRを生成する。
図2は、図1に示す非合成領域算出部104の詳細な構成を示すブロック図である。同図に示すように、非合成領域算出部104は、合成指標値算出部1041、及び、閾値処理部1042を備える。
合成指標値算出部1041は、Cartoon−Texture信号分解部101が出力したTexture成分、Texture特徴量算出部102が出力したTexture特徴量情報、特徴量クラスタリング算出部103が出力したTexture領域分割情報及びクラスタ中心情報、及び、擬似表現符号化器1が入力した原画の全て又は一部を入力とする。合成指標値算出部1041は、入力したこれらの情報の全て又は一部から、Cartoon成分とTexture成分との合成に向いているか否かと相関が高い物理量を画素ごとに取得する。合成指標値算出部1041は、取得した物理量から合成指標値を画素ごとに算出する。合成指標値算出部1041は、各画素の合成指標値を示す情報である合成指標値マップを生成し、出力する。合成指標値の算出に用いられる物理量には、アクティビティやサリエンシー、Texture特徴量のクラスタ中心との距離のうち1以上を用いることができる。
閾値処理部1042は、合成指標値算出部1041が出力した合成指標値マップを入力として、非合成領域情報NSRを生成し、出力する。閾値処理部1042は、合成指標値マップが示す各画素の合成指標値と閾値を比較することにより、各画素が非合成領域であるか否かを示す非合成領域情報NSRを生成する。
次に、図3及び図4を用いて、本実施形態の擬似表現符号化器1による符号化処理を説明する。
図3は、擬似表現符号化器1による擬似表現符号化処理のフローチャートである。
同図に示すステップS101からS103の処理は、既に述べた図5に示すフローチャートにおけるステップS901からS903の処理と同一の処理であるので、詳細な説明を省略する。
Cartoon−Texture信号分解部101は、符号化対象の画像である原画F=[fi,j]をCartoon−Texture信号分解し、Cartoon成分C=[ci,j]とTexture成分T=[ti,j]の2成分に分解する(ステップS101)。ただし、原画FのサイズはN×Mであり、1≦i≦N、1≦j≦Mである。fi,jは原画Fのi,j成分、ci,jは位置i,jのCartoon成分、ti,jは位置i,jのTexture成分である。Cartoon−Texture信号分解には、TV−L1信号分解、TV−L2信号分解、MCA(Morphological Component Analysis)などを用いることができるが、任意の他のCartoon−Texture信号分解方法を用いてもよい。
Texture特徴量算出部102は、原画Fを用いて、Texture特徴量を算出する(ステップS102)。Texture特徴量の算出には、GLCM、ガボールフィルタバンクのほか、Wavelet変換などを用いることができるが、任意の他の特徴量算出方法を用いてもよい。
特徴量クラスタリング算出部103は、ステップS102において算出された特徴量をクラス数kにクラスタリングし、Textureの領域分割情報SEG=[segi,j]とクラスタ中心C,C,…,Cとを算出する(ステップS103)。segi,j=l(1≦l≦k)は、位置i,jがl番目のクラスタに属することを示す。クラスタリングのアルゴリズムには、k-means法、k-means++、GMM(Gaussian Mixture Model)などを用いることができるが、任意の他のクラスタリングのアルゴリズムを用いてもよい。
続いて、非合成領域算出部104は、ステップS103までに得られたTexture成分、Texture特徴量情報、Texture領域分割情報、クラスタ中心情報、及び、原画の全て又は一部を入力として合成指標に基づく非合成領域算出処理を行う(ステップS104)。非合成領域算出部104は、合成指標に基づく非合成領域算出処理において、各画素の合成指標値を計算し、合成指標値と閾値との比較に基づいて非合成領域NSR=[nsri,j]を算出する。
同図に示すステップS105からS116の処理は、既に述べた図5に示すフローチャートにおけるステップS905からS916の処理と同一の処理であるので、詳細な説明を省略する。
すなわち、非合成Texture抽出部105は、ステップS103において算出された非合成領域NSRをもとに、ステップS101において算出されたTexture成分Tの中で、Texture合成を行わない非合成Texture成分NST=[nsti,j]を、式(1)により算出する(ステップS105)。
続いて、領域情報合成部106は、ステップS103において算出されたTextureの領域分割情報SEGと、ステップS104において算出された非合成領域NSRとを合成して、式(2)により、拡張Texture領域分割情報ESEG=[esegi,j]を算出する。
続いて、加算器107は、ステップS101において算出されたCartoon成分Cと、ステップS105において算出された非合成Texture成分NSTを各位置i,jについて足しあわせて、非合成成分NSC=[ncxi,j]=[ci,j+nsti,j]を計算する(ステップS107)。
続いて、代表Texture算出部108は、ステップS101において算出されたTexture成分TとステップS102において算出されたTexture特徴量情報と、ステップS103において算出されたクラスタ中心情報と、ステップS106において算出された拡張Texture領域分割情報ESEGとを用いて、代表Texture情報を算出する(ステップS108)。なお、代表Texture情報の算出には、ステップS908で説明したクラスタ中心との距離基準を用いる他、Inverse Texture Synthesisなどを用いることができるが、任意の他の算出方法を用いてもよい。
続いて、非合成成分符号化部109は、ステップS107において算出された非合成成分NSCを符号化し、非合成成分ストリームを生成する(ステップS109)。代表Texture符号化部110は、ステップS108において算出された代表Texture情報を符号化し、代表Texture情報ストリームを生成する(ステップS110)。領域情報符号化部111は、ステップS106において生成された拡張Texture領域分割情報ESEGを符号化し、拡張Texture領域分割ストリームを生成する(ステップS111)。
続いて、非合成成分復号部112は、ステップS109において生成された非合成成分ストリームを復号する(ステップS112)。また、代表Texture復号部113は、ステップS110において生成された代表Texture情報ストリームを復号する(ステップS113)。さらに、領域情報復号部114は、ステップS111において生成された拡張Texture領域分割ストリームを復号する(ステップS114)。
なお、ステップS109及びステップS110における符号化、ならびに、ステップS112及びステップS113における復号には、JPEG(Joint Photographic Experts Group)、JPEG2000、H.264、HEVCなどの画像符号化方法を用いることができるが、任意の他の画像符号化方法を用いてもよい。また、ステップS111における符号化ならびにステップS114における復号には、PNG(Portable Network Graphics)、GIF(Graphics Interchange Format)、ランレングス、JEPG、HEVCなどを用いることができるが、任意の他の符号化方法を用いてもよい。
Texture合成部115は、ステップS113において復号された代表Texture情報と、ステップS114において復号された拡張Texture領域分割情報を用いて、復号された合成成分を生成する(ステップS115)。Texture合成の方法には、Image Quilting、Chaos Mosaic、Graphcut Texturesなどを用いることができるが、他のTexture合成の方法を用いてもよい。加算器116は、ステップS112において復号された非合成成分と、ステップS115において復号された合成成分とを足し合わせて、復号された画像を生成し、この画像を出力して処理を終了する(ステップS116)。
図4は、図3のステップS104における合成指標に基づく非合成領域算出処理の詳細な処理を示すフローチャートである。
合成指標値算出部1041は、は、Cartoon−Texture信号分解部101が出力したTexture成分、Texture特徴量算出部102が出力したTexture特徴量情報、特徴量クラスタリング算出部103が出力したTexture領域分割情報及びクラスタ中心情報、及び、擬似表現符号化器1が入力した原画の全て又は一部から、各種合成指標値を計算する(ステップS1041)。非合成領域算出部104は、この合成指標値を画素(i,j)毎に計算し、合成指標値のマップMAP=[mapi,j]を算出する。
合成指標値を算出する物理量として、(1)原画又はTexture成分のアクティビティ、(2)原画のサリエンシー、(3)Texture特徴量、Texture領域分割及びクラスタ中心から求まるクラスタ中心との距離、などが用いられ得る。
(1)のアクティビティは、原画又はTexture成分を入力とし、隣接画素差分に対して予め定めた窓で畳み込むことにより算出される。
また、(2)のサリエンシー(顕著性)は、原画を入力とし、輝度、色、角度、動きベクトルなどの低レベルの特徴量を複数統合することで算出される。
また(3)のクラスタ中心との距離は、Texture特徴量とTexture領域分割情報、クラスタ中心情報を入力とし、各Texture領域内の各位置i,jにおけるTexture特徴量とその位置i,jが属するクラスタのクラスタ中心との特徴量空間における距離として算出される。
また、上述の(1)〜(3)のいずれかの物理量に、単調関数を施したものを合成指標値として用いてもよく、(1)〜(3)のうち任意の複数の物理量(又はその物理量に単調関数を施したもの)の線形結合を合成指標値として用いてもよい。
なお、合成指標値算出部1041は、アクティビティが大きいほど、画像のサリエンシー(顕著性)が高いほど、又は、Texture特徴量とクラスタ中心との特徴量空間における距離が大きいほど、合成領域に向いていないことを示す値となるように合成指標値を算出する。
閾値処理部1042は、S1041において合成指標値算出部1041が算出した合成指標値マップMAP=[mapi,j]に対し、予め設定された閾値λを用いて、非合成領域情報NSR=[nsri,j]を、以下の式(3)のように計算する(ステップS1042)。
Figure 0006530304
ここでNSRは、nsri,j=1のとき位置i,jが非合成画素であり、nsri,j=0のとき合成画素であることを示している。非合成画素は、復号時にTexture成分の画素が合成されない画素であり、合成画素は、復号時にCartoon成分とTexture成分とが合成される画素である。
このように、図2に示す非合成領域算出部104を用いることにより、図4に示す処理動作に従って、合成指標を用いて非合成領域情報を算出し、出力することができる。そして、図1に示す擬似表現符号化器1を用いることにより、図3に示す処理動作に従って、画像の符号化、復号を行うことができる。
次に、具体例を挙げて、図1に示す擬似表現符号化器1及び図2に示す非合成領域算出部104が、図3及び図4に示す処理を行うときの動作を説明する。
ここでは、原画Fを、N×Mの8bit(ビット)モノクロ画像信号とする。また各処理手順において、Cartoon−Texture信号分解にはTV−L1信号分解を、Texture特徴量算出にはガボールフィルタバンクを、特徴量クラスタリング算出にはk-means法を、代表Texture算出にはクラスタ中心との距離基準を、非合成成分、代表Textureの符号化および復号にはHEVCを、領域情報の符号化および復号にはPNGを、Texture合成処理にはImage Quiltingを、合成指標値算出にはTexture成分のアクティビティを用いるものとする。
擬似表現符号化器1が行う、図3のステップS101からS103、及び、ステップS105からS116の処理手順は、従来の処理手順と同一である。ステップS102においてはTV−L1信号分解、ステップS102においてはガボールフィルタバンク、ステップS103においてはk-means法、ステップS108においてはクラスタ中心との距離基準、ステップS109及びS110においてはHEVCの符号化処理、ステップS111においはPNGの符号化処理、ステップS112及びS113においてはHEVCの復号処理、ステップS114においてはPNGの復号処理、ステップS115においてはImage Quiltingを適用すればよい。
図4に示すステップS104の詳細な処理手順の具体例を説明する。
この具体例では、ステップS1041において、合成指標値算出部1041は、Texture成分のみを用いて合成指標値となるアクティビティを計算する。アクティビティは、注目位置i,jを中心にしたある窓内における隣接画素差分の絶対値和として定義することができる。例えば、窓関数をwi,jとすると、合成指標値のマップMAP=[mapi,j]は、以下の式(4)により算出することができる。
Figure 0006530304
ステップS1042ではS1041で算出された合成指標値マップMAP=[mapi,j]に対し、予め設定された閾値λを用いて閾値処理を施す。例えば閾値としてλ=10を選ぶことができ、以下の式(5)のように計算することができる。
Figure 0006530304
このように図4で示した処理手順に従って非合成領域情報NSRを計算し、図3で示した処理手順に従って画像の符号化、復号を行うことができる。
上述した実施形態によれば、符号化装置の一例である擬似表現符号化器1は、符号化対象の画像をCartoon成分とTexture成分とに分解する。擬似表現符号化器1は、Cartoon成分とTexture成分との合成に向いているか否かと相関が高い物理量を符号化対象の画像から取得し、取得した物理量に基づいて、符号化対象の画像においてTexture成分を合成しない領域である非合成領域を算出する。擬似表現符号化器1は、Cartoon成分と非合成領域のTexture成分とを加算した非合成成分を符号化し、さらに、非合成領域を除いた領域のTexture成分を符号化する。
上記実施形態によれば、Texture合成に不向きな領域の検出精度を向上し、適切な非合成領域を用いることで、復号画像の主観品質を向上することができる。
上述した実施形態における擬似表現符号化器1の各部の機能をコンピュータで実現するようにしてもよい。その場合、この擬似表現符号化器1の各部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
なお、上述した実施形態の符号化装置、符号化方法、及び、符号化プログラムは、パターンマッチングに用いられてもよい。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
映像を符号化する装置に利用可能である。
1、9 擬似表現符号化器
101、901 Cartoon−Texture信号分解部
102、902 Texture特徴量算出部
103、903 特徴量クラスタリング算出部
104、904 非合成領域算出部
105、905 非合成Texture抽出部
106、906 領域情報合成部
107、116、907、916 加算器
108、908 代表Texture算出部
109、909 非合成成分符号化部
110、910 代表Texture符号化部
111、911 領域情報符号化部
112、912 非合成成分復号部
113、913 代表Texture復号部
114、914 領域情報復号部
115、915 Texture合成部
1041 合成指標値算出部
1042 閾値処理部
9041 領域面積計数部
9042 ソート計算部
9043 非合成領域決定部

Claims (7)

  1. 符号化装置が実行する符号化方法であって、
    符号化対象の画像をカートゥーン成分とテクスチャ成分とに分解する分解ステップと、
    カートゥーン成分とテクスチャ成分との合成に向いているか否かと相関が高い物理量を前記画像から取得し、取得した前記物理量に基づいて前記画像において復号時にテクスチャ成分を合成しない領域である非合成領域を算出する非合成領域算出ステップと、
    前記カートゥーン成分と前記非合成領域の前記テクスチャ成分とを加算して非合成成分を算出する加算ステップと、
    前記非合成成分を符号する非合成成分符号化ステップと、
    前記テクスチャ成分の特徴量を分類したクラスタごとに、前記特徴量とクラスタ中心との距離の総和が最も小さくなる窓位置を代表テクスチャとして算出し、算出された前記代表テクスチャの前記テクスチャ成分と、前記非合成領域を除いた領域が属する前記クラスタとを符号化するテクスチャ符号化ステップと、
    を有することを特徴とする符号化方法。
  2. 前記非合成領域算出ステップにおいては、前記画像の画素ごとに、合成領域に向いているか否かを定量的に表す値である合成指標値を前記物理量から算出し、算出された前記合成指標値に基づいて前記画素が非合成領域に属するか否かを判定する、
    を有することを特徴とする請求項1に記載の符号化方法。
  3. 前記非合成領域算出ステップは、
    前記画像の画素ごとに、前記画像から取得した前記物理量を用いて前記合成指標値を得る合成指標値算出ステップと、
    前記画素ごとに、前記合成指標値と閾値とを比較して非合成領域に属するか否かを判定する閾値処理ステップと、
    を有することを特徴とする請求項2に記載の符号化方法。
  4. 前記物理量は、前記画像又は前記テクスチャ成分のアクティビティ、前記画像の顕著性、及び、前記テクスチャ成分の前記特徴量と前記画素が属する前記クラスタの前記クラスタ中心との距離のうち1以上を含む、
    ことを特徴とする請求項3に記載の符号化方法。
  5. 前記合成指標値算出ステップにおいては、前記アクティビティが大きいほど、前記画像の顕著性が高いほど、又は、前記テクスチャ成分の特徴量と前記クラスタ中心との距離が大きいほど、合成領域に向いていないことを示す値となるように合成指標値を算出する、
    ことを特徴とする請求項4に記載の符号化方法。
  6. 符号化対象の画像をカートゥーン成分とテクスチャ成分とに分解する分解部と、
    カートゥーン成分とテクスチャ成分との合成に向いているか否かと相関が高い物理量を前記画像から取得し、取得した前記物理量に基づいて前記画像において復号時にテクスチャ成分を合成しない領域である非合成領域を算出する非合成領域算出部と、
    前記カートゥーン成分と前記非合成領域の前記テクスチャ成分とを加算して非合成成分を算出する加算部と、
    前記非合成成分を符号する非合成成分符号化部と、
    前記テクスチャ成分の特徴量を分類したクラスタごとに、前記特徴量とクラスタ中心との距離の総和が最も小さくなる窓位置を代表テクスチャとして算出し、算出された前記代表テクスチャの前記テクスチャ成分と、前記非合成領域を除いた領域が属する前記クラスタとを符号化するテクスチャ符号化部と、
    を有することを特徴とする符号化装置。
  7. コンピュータに、請求項1から請求項5のいずれか一項に記載の符号化方法を実行させる符号化プログラム。
JP2015222887A 2015-11-13 2015-11-13 符号化方法、符号化装置及び符号化プログラム Expired - Fee Related JP6530304B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015222887A JP6530304B2 (ja) 2015-11-13 2015-11-13 符号化方法、符号化装置及び符号化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015222887A JP6530304B2 (ja) 2015-11-13 2015-11-13 符号化方法、符号化装置及び符号化プログラム

Publications (2)

Publication Number Publication Date
JP2017092801A JP2017092801A (ja) 2017-05-25
JP6530304B2 true JP6530304B2 (ja) 2019-06-12

Family

ID=58771144

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015222887A Expired - Fee Related JP6530304B2 (ja) 2015-11-13 2015-11-13 符号化方法、符号化装置及び符号化プログラム

Country Status (1)

Country Link
JP (1) JP6530304B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102323395B1 (ko) * 2017-11-02 2021-11-08 삼성전자주식회사 로우-퀄리티 부호화 모드에 따라 영상을 부호화하는 방법 및 장치, 및 영상을 복호화하는 방법 및 장치
CN112637593B (zh) * 2020-12-18 2022-08-02 郑州师范学院 基于人工智能和视频分析的视频编码优化方法

Also Published As

Publication number Publication date
JP2017092801A (ja) 2017-05-25

Similar Documents

Publication Publication Date Title
TWI874661B (zh) 點雲壓縮方法、編碼器、解碼器及儲存媒介
CN115086660B (zh) 基于点云属性预测的解码、编码方法、解码器及编码器
Deng et al. Content-based image compression for arbitrary-resolution display devices
CN113678466A (zh) 用于预测点云属性编码的方法和设备
Lee et al. Colorization-based compression using optimization
CN111028308A (zh) 一种图像中信息的隐写及读取方法
KR102801264B1 (ko) 호모그래피 변환을 사용하는 포인트 클라우드 코딩
US10708601B2 (en) Methods and apparatuses for encoding and decoding superpixel borders
Vázquez et al. Using normalized compression distance for image similarity measurement: an experimental study
JP6530304B2 (ja) 符号化方法、符号化装置及び符号化プログラム
CN113902844A (zh) 点云编码的方法、装置、电子设备、介质和程序产品
Yu et al. Hierarchical distortion learning for fast lossy compression of point clouds
Ruivo et al. Double-deep learning-based point cloud geometry coding with adaptive super-resolution
KR100708180B1 (ko) 화상 압축 장치 및 방법
CN119831845B (zh) 一种图像处理以及模型训练方法和装置
CN116601958A (zh) 虚拟视点绘制、渲染、解码方法及装置、设备、存储介质
Nayak et al. A novel saliency based image compression algorithm using low complexity block truncation coding
Kumar et al. Enhanced block truncation coding for gray scale image
Sultana et al. An optimised clustering algorithm with dual tree DS for lossless image compression
KR20020055864A (ko) 칼라 정지영상의 부호화 및 복호화 방법
Pensiri et al. A lossless image compression algorithm using predictive coding based on quantized colors
El Gallab et al. On-the-fly Image Compression Using Overfitted Shallow CNN Autoencoders
Kong et al. Progressive image compression for Gaussian mixture model quartile intervals: W. Kong and M. Sun
WO2024074121A9 (en) Method, apparatus, and medium for point cloud coding
US20260073572A1 (en) 3d gaussian splatting data compression

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181009

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190516

R150 Certificate of patent or registration of utility model

Ref document number: 6530304

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees