JP4987085B2 - 画像符号化装置及び復号装置、画像符号化方法及び復号方法、それらのプログラム並びにプログラムを記録した記録媒体 - Google Patents

画像符号化装置及び復号装置、画像符号化方法及び復号方法、それらのプログラム並びにプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP4987085B2
JP4987085B2 JP2009538086A JP2009538086A JP4987085B2 JP 4987085 B2 JP4987085 B2 JP 4987085B2 JP 2009538086 A JP2009538086 A JP 2009538086A JP 2009538086 A JP2009538086 A JP 2009538086A JP 4987085 B2 JP4987085 B2 JP 4987085B2
Authority
JP
Japan
Prior art keywords
prediction
image
signal
slope
intra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009538086A
Other languages
English (en)
Other versions
JPWO2009051091A1 (ja
Inventor
翔平 松尾
誠之 高村
一人 上倉
由幸 八島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
NTT Inc USA
Original Assignee
Nippon Telegraph and Telephone Corp
NTT Inc USA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, NTT Inc USA filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009538086A priority Critical patent/JP4987085B2/ja
Publication of JPWO2009051091A1 publication Critical patent/JPWO2009051091A1/ja
Application granted granted Critical
Publication of JP4987085B2 publication Critical patent/JP4987085B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、画面内予測を用いて画像を符号化する画像符号化装置およびその方法と、その画像符号化技術により符号化された符号化データを復号する画像復号装置およびその方法と、その画像符号化装置の実現に用いられる画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体と、その画像復号装置の実現に用いられる画像復号プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体とに関する。
本願は、2007年10月15日に出願された特願2007−267614号に基づき優先権を主張し、その内容をここに援用する。
同一の画面内で予測を実行する画面内予測符号化は、異なる画面間で予測を実行する画面間予測符号化ほど大きな圧縮効率を達成できないため、圧縮効率の高い画面内予測符号化方式が望まれている。また、画面内符号化による圧縮効率の向上は、その画像を参照する画面間符号化の圧縮効率の向上にも寄与する可能性があり、この点からしても、画面内予測符号化方式の圧縮効率の向上は期待される領域である。
空間次元で同一の画面内から予測を行う画面内予測は、映像符号化標準H.264/MPEG−4AVCから取り入れられている(例えば、非特許文献1のpp.106参照)。
画面内予測はブロック単位で行われ、H.264/MPEG−4AVCでは、輝度信号に対して3種類のブロックサイズ(4×4、8×8、16×16)が利用可能となっている。また、各ブロックサイズではそれぞれ複数の予測モードが選択可能である。4×4または8×8のブロックサイズの場合は9種類の予測モード、16×16のブロックサイズの場合は4種類の予測モードが用意されている。
色差信号に対しては8×8のブロックサイズのみが利用可能であり、予測方向に関しては輝度信号に対する16×16ブロックの場合と同じである。ただし、予測モード番号と予測方向との対応付けが異なる(例えば、非特許文献1のpp.106-112、非特許文献2のpp.116-135参照)。
これら各種ブロックサイズと予測モードにおいて、どの場合も例外なく、画面内予測で生成される画素は、符号化対象ブロックに隣接するブロック上の符号化対象ブロックに最近傍に位置する画素の値を変化させずに、同じ値をコピーするようにしている。
図36に、具体的な例として、符号化対象ブロックが輝度信号の4×4ブロックで、予測モードが垂直予測(予測モード0)の場合を示す。以下、特に断りがない場合は、輝度信号を前提として説明を行う。
この図36に示す具体例では、符号化対象ブロックの左上に位置するブロックの持つ画素Xの値と、符号化対象ブロックの上に位置するブロックの持つ画素A,B,C,Dの値と、符号化対象ブロックの右上に位置するブロックの持つ画素E,F,G,Hの値と、符号化対象ブロックの左に位置するブロックの持つ画素I,J,K,Lの値とを予測に用いる。
予測モード0は、垂直方向の予測のため、画素Aの値(73)をその真下に続く4画素にコピーする。以下同様に、画素Bの値(79)、画素Cの値(86)、画素Dの値(89)のそれぞれをその真下に続く4画素にコピーする。
このように、従来技術では、画面内予測で生成される画素は、符号化対象ブロックに隣接するブロック上の符号化対象ブロックに最近傍に位置する画素の値を変化させずに、同じ値をコピーするようにしている。
この場合にあって、符号化対象ブロックの存在する位置によっては、参照すべきブロックがない場合が存在する。その場合は128の値を代入するか、もしくは隣の画素の値を代入することで予測を可能としている。例えば、画面の一番上の行を包含するブロックでは、XからHまでの9画素は常に参照することができないため、128を用いる。また、左上と上のブロックは存在するが、右上のブロックが存在しない場合は、画素Dの有する値を画素E,F,G,Hに代入して予測画素を生成する。
また、画面内予測の改良技術として、マクロブロック内のブロックのスキャン順序を変更することで、ブロックの右や下方向に位置する画素からの内挿予測を可能にする手法が提案されている(例えば、非特許文献3参照)。
この手法では、複数の予測モード候補から2種類の予測モードA,Bを選択して、画素位置(i,j)に適用した場合の予測値をそれぞれsA (i,j),sB (i,j)で表すならば、画素位置(i,j)における画素の予測値sbipred(i,j)を、

bipred(i,j)=a・sA (i,j)+b・sB (i,j)
ただし、a,bは重み
という算出式に従って算出することを提案している。
大久保榮,角野眞也,菊池義浩,鈴木輝彦:"改訂版H.264/AVC教科書",pp. 106-112, 2006 ITU-T Study Group 16-Question 6/16:"Draft new Corrigendum 1 to H.264 "Advanced video coding for generic audiovisual services", pp. 116-135, 2005 塩寺太一郎, 谷沢昭行,中條健:"ブロックベース外挿/内挿予測に基づくイントラ符号化",画像符号化シンポジウム 第21回シンポジウム資料, pp.123-124, 2006
非特許文献1に記載されるように、従来の画面内予測では、予測画素を生成する場合に、参照画素の有する画素値を変えずにそのままコピーしていた。
原信号が予測方向に対してその値を変化させない場合には、従来の画面内予測で問題はない。しかしながら、一般的には、原信号は予測方向に対して順次その値を変化させていくという性質を持つ。
これから、従来の画面内予測に従っていると、残差信号の増加が避けられず、圧縮効率が悪化するという問題がある。
すなわち、従来の画面内予測では、原信号の値が空間的に変化する画像、すなわちグラデーションが多く含まれる画像(このような画像が一般的である)に適用すると、残差信号の増加につながり、圧縮効率が悪化するという問題がある。
一方、非特許文献3に記載される手法では、2種類の予測モードを適用した際の予測値に基づいて画面内予測を行うという方法を用いているが、この方法は、原信号の持つグラデーションの性質を利用して予測を行っている訳ではない。これから、圧縮効率を大きく向上させることは期待できない。
本発明はかかる事情に鑑みてなされたものであって、グラデーションが多く含まれる画像を画面内予測で符号化するときに、圧縮効率を向上できるようにする新たな画像符号化技術の提供を目的とする。
〔1〕第1の態様
前記の目的を達成するために、本発明は、画面内予測を用いて画像を符号化するという構成を採るときにあって、(i) 複数の傾斜候補の中から、予測対象となる画像信号の示す画素値の傾斜を選択する選択手段と、(ii) 選択手段の選択した傾斜に基づいて、予測参照画素からの距離に応じて傾斜を付けて予測信号を生成する生成手段と、(iii) 生成手段の生成した予測信号に基づいて、予測対象となる画像信号を画面内符号化する画面内符号化手段と、(iv) 選択手段の選択した傾斜の大きさを示す情報(大きさそのものの情報や、大きさを特定可能とするインデックスなどの情報)を符号化する傾斜情報符号化手段とを備える画像符号化装置を提供する。
以上の各処理手段はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。
この本発明の画像符号化装置に対応して、本発明は、画面内予測を用いて符号化された画像の符号化データを復号するという構成を採るときにあって、(i) 予測参照画素からの距離に応じて予測信号に画素値の傾斜を付けるための情報を復号することで、画像符号化側で用いた傾斜の情報を獲得する獲得手段と、(ii) 獲得手段の獲得した傾斜に基づいて、画像符号化側で生成した予測信号を復元する復元手段と、(iii) 画像符号化側で符号化した残差信号を復号して、その復号した残差信号と復元手段の復元した予測信号とに基づいて復号画像信号を生成する生成手段とを備える画像復号装置を提供する。
以上の各処理手段はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。
このように構成される本発明の第1の態様では、画像符号化装置は、例えば、複数の傾斜候補に基づいて、傾斜の異なる複数の予測信号候補を生成して、それらの予測信号候補の中から符号化コストが最小となる予測信号候補を特定することで、複数の傾斜候補の中から、予測対象となる画像信号の示す傾斜を選択する。
続いて、選択した傾斜に基づいて、予測参照画素からの距離に応じて傾斜を付けて予測信号を生成して、その生成した予測信号に基づいて、予測対象となる画像信号を画面内符号化する。そして、画像復号装置に対して、選択した傾斜の大きさを知らせるために、選択した傾斜の大きさを示す情報を符号化する。
この画像符号化装置の生成する符号化データを受けて、画像復号装置は、符号化された傾斜の大きさを示す情報を復号することで、画像符号化側で用いた傾斜の情報を獲得する。続いて、獲得した傾斜に基づいて、画像符号化側で生成した予測信号を復元する。そして、画像符号化側で符号化した残差信号を復号して、その復号した残差信号と復元した予測信号とに基づいて復号画像信号を生成する。
〔2〕第2の態様
また、前記の目的を達成するために、本発明は、画面内予測を用いて画像を符号化するという構成を採るときにあって、(i) 既に符号化済みの画像信号に基づいて、予測対象となる画像信号の示す画素値の傾斜を推定する推定手段と、(ii) 推定手段の推定した傾斜に基づいて、予測参照画素からの距離に応じて傾斜を付けて予測信号を生成する生成手段と、(iii) 生成手段の生成した予測信号に基づいて、予測対象となる画像信号を画面内符号化する画面内符号化手段とを備える画像符号化装置を提供する。
以上の各処理手段はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。
この本発明の画像符号化装置に対応して、本発明は、画面内予測を用いて符号化された画像の符号化データを復号するという構成を採るときにあって、(i) 既に復号済みの画像信号に基づいて、予測対象となる画像信号の示す画素値の傾斜を推定する推定手段と、(ii) 推定手段の推定した傾斜に基づいて、予測参照画素からの距離に応じて傾斜を付けて予測信号を生成する予測信号生成手段と、(iii) 画像符号化側で符号化した残差信号を復号して、その復号した残差信号と予測信号生成手段の生成した予測信号とに基づいて復号画像信号を生成する復号画像信号手段とを備える画像復号装置を提供する。
以上の各処理手段はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。
このように構成される本発明の第2の態様では、画像符号化装置は、既に符号化済みの画像信号に基づいて、予測対象となる画像信号の示す傾斜を推定する。続いて、推定した傾斜に基づいて、予測参照画素からの距離に応じて傾斜を付けて予測信号を生成して、その生成した予測信号に基づいて、予測対象となる画像信号を画面内符号化する。
この画像符号化装置の生成する符号化データを受けて、画像復号装置は、既に復号済みの画像信号に基づいて、予測対象となる画像信号の示す傾斜を推定する。続いて、その推定した傾斜に基づいて、予測参照画素からの距離に応じて傾斜を付けて予測信号を生成する。そして、符号化側で符号化した残差信号を復号して、その復号した残差信号とその生成した予測信号とに基づいて復号画像信号を生成する。
本発明の第2の態様では、画像符号化装置と画像復号装置とが同一のアルゴリズムに従って傾斜を推定するという処理を行うので、画像符号化装置は、画像復号装置に対して、推定した傾斜の大きさを知らせる必要はない。これにより、画像符号化装置の生成する符号化データのデータ量はその分小さなものになるが、画像復号装置は傾斜を推定するという演算を実行しなければならない。
そこで、画像復号装置の演算量を削減する必要がある場合には、画像符号化装置は、推定した傾斜の大きさを示す情報を符号化する傾斜情報符号化手段(この手段についてもコンピュータプログラムで実現可能である)を備えるようにすれば良い。
この場合には、画像復号装置は、前述の第1の態様と同様に、画像符号化装置の生成した符号化データを復号するようにする。
このように、本発明の第2の態様もまた、本発明の第1の態様と同様に、参照画素の信号値をそのまま予測信号とするのではなく、傾斜を付けることで、より予測誤差の少ない画面内予測を実現する。即ち、参照画素の値に傾斜を付けることで、より予測誤差を低減可能な画素を生成でき、その結果として、本発明の目的である効率的な画面内予測が実現可能となる。
なお、画面内予測の予測モードが、映像符号化標準H.264/MPEG−4AVCにおけるDC予測である場合用に、本発明は、(i) 画素値に加算される値を示す複数の傾斜候補の中から、予測対象となる画像信号に付加する傾斜を選択する手段と、(ii) 前記選択した傾斜が付加された予測信号を生成する手段と、(iii) 前記生成した予測信号に基づいて、予測対象となる画像信号を画面内符号化する手段と、(iv) 前記選択した傾斜の大きさを示す情報を符号化する手段とを備える画像符号化装置を提供する。
同様に、映像符号化標準H.264/MPEG−4AVCにおけるDC予測である場合用に、本発明は、(i) 既に符号化済みの画像信号に基づいて、予測対象となる画像信号の画素値に加算される値を示す傾斜を推定する手段と、(ii) 前記推定した傾斜が付加された予測信号を生成する手段と、(iii) 前記生成した予測信号に基づいて、予測対象となる画像信号を画面内符号化する手段とを備える画像符号化装置を提供する。
これら符号化装置は、前述の第1および第2の態様にそれぞれ対応しているが、「傾斜」の設定(性格)がDC予測に合わせたものとなっている。
即ち、傾斜を選択もしくは推定し、傾斜に基づいて予測信号を生成したりなどの基本動作は、第1および第2の態様と共通している。
本発明は、これらDC予測に対応した画像符号化装置に対応する、以下の画像復号装置をそれぞれ提供する。
(i)予測信号の画素値への加算値を示す傾斜を付加するための情報を復号することで、画像符号化側で用いた傾斜の情報を獲得する手段と、前記獲得した傾斜に基づいて、画像符号化側で生成した予測信号を復元する手段と、画像符号化側で符号化した残差信号を復号して、その復号した残差信号と前記復元した予測信号とに基づいて復号画像信号を生成する手段とを備える画像復号装置。
(ii)既に復号済みの画像信号に基づいて、予測対象となる画像信号の画素値に加算される値を示す傾斜を推定する手段と、前記推定した傾斜が付加された予測信号を生成する手段と、画像符号化側で符号化した残差信号を復号して、その復号した残差信号と前記生成した予測信号とに基づいて復号画像信号を生成する手段とを備える画像復号装置。
以上説明したように、本発明によれば、従来の画面内予測では予測誤差が増大し、符号化効率が悪化すると考えられるグラデーションを含む画像に対して、効率的な画面内予測を実行することが可能となり、圧縮効率を向上させることができるようになる。
本発明の画面内予測と従来の画面内予測との違いを説明する図である。 本発明の画面内予測符号化装置の一実施形態例である。 同実施形態の画面内予測符号化装置の実行する画面内予測の説明図である。 同実施形態の画面内予測符号化装置の実行するフローチャートである。 本発明の画面内予測復号装置の一実施形態例である。 同実施形態の画面内予測復号装置の実行するフローチャートである。 本発明の画面内予測符号化装置の他の実施形態例である。 同実施形態の画面内予測符号化装置の実行する画面内予測の説明図である。 同実施形態の画面内予測符号化装置の実行するフローチャートである。 本発明の画面内予測復号装置の他の実施形態例である。 同実施形態の画面内予測復号装置の実行するフローチャートである。 本発明の画面内予測符号化装置の他の実施形態例である。 同実施形態の画面内予測符号化装置の実行するフローチャートである。 図2の画面内予測符号化装置の有効性を検証する実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 同様に、実験結果の説明図である。 従来技術の説明図である。 H.264/MPEG−4AVCにおけるDC予測の説明図である。
符号の説明
10 画面内予測符号化装置
101 傾斜選択部
102 予測モード選択部
103 画面内予測部
104 レート歪みコスト算出部
105 コスト最小値記憶部
106 コスト最小値初期化部
107 コスト判定部
108 最適符号化情報記憶部
109 ループ終了判定部
110 最適符号化情報符号化部
111 画面内符号化部
本発明では、参照画素の信号値をそのまま予測信号とするのではなく、傾斜を付けることで、より予測誤差の少ない画面内予測を実現する。
すなわち、図1に示すように、符号化対象ブロックがグラデーションを含む場合を想定する。この場合、本発明では、図1の下段に示すように、予測信号に対して一定の傾斜を付けることで、原信号に近い予測信号を生成し、これにより、残差信号を小さくすることができ、画面内予測の効率向上を実現できるのである。
従来の画面内予測では、図1の上段に示すように、参照画素の有する値を直接全ての予測方向の予測画素に適用していたため、原信号が空間的に変化するグラデーションを有する場合、予測誤差の増大を回避できなかった。
これに対して、本発明では、参照画素の値に傾斜を付けることで、より予測誤差を低減可能な画素を生成でき、その結果として、本発明の目的である効率的な画面内予測が実現可能となる。
以下、実施の形態に従って本発明を詳細に説明する。
図2に、本発明の一実施形態例としての画面内予測符号化装置10を図示する。
本発明の画面内予測符号化装置10は、静止画像を処理対象としたり、映像に含まれるイントラ(画面内)符号化対象の画像を処理対象として、処理対象の画像を画面内予測を用いて符号化するものであり、図2に示すように、傾斜選択部101と、予測モード選択部102と、画面内予測部103と、レート歪みコスト算出部104と、コスト最小値記憶部105と、コスト最小値初期化部106と、コスト判定部107と、最適符号化情報記憶部108と、ループ終了判定部109と、最適符号化情報符号化部110と、画面内符号化部111とを備える。
この傾斜選択部101は、予測信号に傾きを付けるための傾斜(傾斜選択部101が選択する段階では、正確に表現するならば、そのような傾斜の候補である)を選択する。
予測モード選択部102は、画面内予測の予測モードを選択する。
画面内予測部103は、傾斜選択部101の選択した傾斜と、予測モード選択部102の選択した予測モードとに基づいて、画面内予測で用いられる傾斜付きの予測信号を生成する。
レート歪みコスト算出部104は、画面内予測部103の生成した予測信号に基づいて、符号化コストであるレート歪みコストを算出する。
コスト最小値記憶部105は、レート歪みコスト算出部104の算出したレート歪みコストの最小値を記憶する。
コスト最小値初期化部106は、画面内予測符号化に入る時点で、コスト最小値記憶部105に対して、大きな値を示すレート歪みコストの初期値を書き込む。
コスト判定部107は、レート歪みコスト算出部104の算出したレート歪みコストと、コスト最小値記憶部105の記憶するレート歪みコストとを比較して、レート歪みコスト算出部104の算出した方のが小さい場合には、レート歪みコスト算出部104の算出したレート歪みコストを用いて、コスト最小値記憶部105の記憶するレート歪みコストを更新し、さらに、その時点における傾斜および予測モードに従って、最適符号化情報記憶部108の記憶する傾斜および予測モードの情報を更新する。
最適符号化情報記憶部108は、コスト判定部107により更新されることになる最適な傾斜および予測モードの情報を記憶する。
ループ終了判定部109は、傾斜選択部101に対して次の傾斜の選択を指示するとともに、予測モード選択部102に対して次の予測モードの選択を指示することで、全ての傾斜と予測モードの組み合わせが選択されるように制御するとともに、全ての傾斜と予測モードの組み合わせの選択が終了したときには、最適符号化情報符号化部110および画面内符号化部111に対して、符号化を行うことを指示する。
最適符号化情報符号化部110は、ループ終了判定部109から符号化指示があると、最適符号化情報記憶部108から傾斜および予測モードの情報を読み出し、それを符号化する。
画面内符号化部111は、ループ終了判定部109から符号化指示があると、最適符号化情報記憶部108から傾斜および予測モードの情報を読み出し、その読み出した傾斜および予測モードに従って傾斜付きの予測信号を生成して、符号化対象ブロックの画像信号とその生成した予測信号との残差信号を符号化する。
次に、図3に従って、本実施形態の画面内予測符号化装置10の実行する画面内予測について説明する。ここで、図3では、符号化対象ブロックが4×4ブロックであることを想定している。
本発明の画面内予測符号化装置10では、傾斜の基準となる大きさを傾斜定数Δ、取り得る傾斜の範囲を傾斜調整係数 gradient[n] と定義する。ここで、Δは定数とし、nの値は整数で、取り得る傾斜の(種類の)数を示す。
図3は、Δ=1、n=3、垂直予測での例を示している。また、1画素離れたときの傾斜αを、α=Δ× gradient[i] (0≦i<n)で定義する。
即ち、n=3の場合は、1画素離れる毎に、1×gradient[0]、1×gradient[1]、1×gradient[2] の3種類の傾斜が得られる。
gradient[0]、gradient[1]、gradient[2]の値は任意に設定できるが、図3の例では、「−1,0,1」と設定されている。
以上より、予測画素の画素値をy、参照画素から予測画素までの距離をx、参照画素の画素値をβとすると、予測画素の画素値yは、
y=αx+β ・・・・ 式(1)
で定義できる。即ち、参照画素から予測画素までの距離に対し、傾斜αが付加される。
図2のように構成される本実施形態の画面内予測符号化装置10では、この式(1)に従って予測信号を生成するのである。
図4に、本実施形態の画面内予測符号化装置10の実行するフローチャートを図示する。次に、このフローチャートに従って、画面内予測符号化装置10の実行する動作について説明する。
本実施形態の画面内予測符号化装置10は、画面内予測符号化の処理対象となる符号化対象ブロックが与えられると、図4のフローチャートに示すように、まず最初に、ステップS101で、後述するステップS107で用いるレート歪みコストJi,j の最小値Jmin を、十分大きな値(レート歪みコストJi,jが実際に取る可能性のない値)を示すMAXcostで初期化する。
続いて、ステップS102で、傾斜定数Δの値を予め定めた値で初期化する。
続いて、ステップS103で、傾斜の大きさを指定するループ1(変数i)を開始する。即ち、傾斜の種類の数であるn回のループとなる。初回では、初期値としてi=0を代入する。
続いて、ステップS104で、Δおよび gradient[i] から傾斜αを算出して、保存する。図3に示す例で説明するならば、i=0のときには、“α=−1”を算出するのである。
続いて、ステップS105で、符号化対象ブロックが取る予測モードを指定するループ2(変数j)を開始する。
符号化対象ブロックは、その画像内に存在する位置において取り得る予測モードが異なってくるため、ここではψを符号化対象ブロックが取り得る全ての予測モードの集合と定義する。初期値としてj=γ(γは取り得るモードで最も予測モード番号が小さい数値)を代入する。
続いて、ステップS106で、ステップS104で得られた傾斜αを用いて、式(1)に従って傾斜付きの予測信号を生成する。
続いて、ステップS107で、レート歪みコストJi,j を求める。レート歪みコストの計算には、下記の式(2)を用いる。
i,j =SSD+λ(Rblock +Rgradient) ・・・・ 式(2)
ここで、SSDは予測誤差の絶対値の2乗和、λは予測モード判定に対するラグランジュ未定乗数、Rblock は符号化対象ブロックを、選択した予測モードjで符号化した場合の発生符号量、Rgradientは傾斜情報iを符号化した場合の発生符号量を示す。
続いて、ステップS108で、
i,j <Jmin ・・・・ 式(3)
が成立するのか否かを判断することで、ステップS107で算出したコストJi,j が最小かどうかの判定を行う。
このステップS108の判断処理に従って、ステップS107で算出したコストJi,j が最小コストJmin を下回ることを判断するときには、ステップS109に進んで、その際の傾斜情報iと予測モードjの値を記録するとともに、Jmin も更新する。
すなわち、
best_gradient=i ・・・・ 式(4)
best_mode=j ・・・・ 式(5)
min =Ji,j ・・・・ 式(6)
とする。
一方、ステップS108の判断処理に従って、ステップS107で算出したコストJi,j が最小コストJmin を下回らないことを判断するときには、ステップS109の処理を行わず、式(4)〜式(6)に示す更新処理は行わない。
以上のコスト計算処理を、ループ2をj∈ψの範囲内(すなわち、取り得る全ての予測モードについて)で繰り返し、ループ2が終わったら、次の gradient[i] に移り、0≦i<nの範囲内でループ1を繰り返す。
この2種類のループ構造を実行することで、最小のレート歪みコストを実現するbest_gradient、best_modeが得られる。
続いて、ステップS110で、得られたbest_gradient、best_modeの情報を符号化する。符号化手法は算術符号化などの一般に用いられる方法を利用する。符号化した情報はヘッダなどに挿入する。
続いて、ステップS111で、得られたbest_gradient、best_modeを用いて傾斜付きの予測信号を生成し、符号化対象ブロックを符号化する。
以上の流れにより、従来の画面内予測では、符号化対象ブロックにおいて、予測方向における全ての予測信号が同じ値に固定されていた状態から、傾斜を付けた予測信号を生成することが可能となり、予測誤差を小さくすることができるようになる。
なお、以上の説明では、4×4ブロックについての説明を行ったが、4×4ブロック以外の大きさにも本発明の概念は適用可能である。また、輝度信号だけでなく、色差信号に対しても同様に適用可能である。
図5に、図2のように構成される画面内予測符号化装置10の生成した符号化データを復号する、本発明の一実施形態としての画面内予測復号装置20を図示する。
この図に示すように、画面内予測復号装置20は、画面内予測符号化装置10の生成した符号化データを復号するために、傾斜・予測モード復号部201と、予測信号復元部202と、残差信号復号部203と、復号画像生成部204とを備える。
この傾斜・予測モード復号部201は、符号化データのヘッダなどに挿入されている傾斜および予測モードの情報を復号する。
予測信号復元部202は、傾斜・予測モード復号部201の復号した傾斜および予測モードに基づいて、画面内予測符号化装置10で生成された傾斜付きの予測信号を復元する。
残差信号復号部203は、符号化データから画面内予測符号化装置10の符号化した残差信号を復号する。
復号画像生成部204は、予測信号復元部202の復元した予測信号と、残差信号復号部203の復号した残差信号とに基づいて、復号画像信号を生成する。
図6に、本実施形態の画面内予測復号装置20の実行するフローチャートを図示する。次に、このフローチャートに従って、画面内予測復号装置20の実行する処理について説明する。
本実施形態の画面内予測復号装置20は、画面内予測符号化装置10の生成した符号化データを入力すると、図6のフローチャートに示すように、まず最初に、ステップS201で、入力した符号化データのヘッダなどに挿入されているbest_gradient、best_modeの情報を復号する。
続いて、ステップS202で、復号したbest_gradient、best_modeに従って、画面内予測符号化装置10で生成された傾斜付きの予測信号を復元する。
続いて、ステップS203で、入力した符号化データから画面内予測符号化装置10の符号化した残差信号((元の)画像信号と予測信号との差分値)を復号する。
続いて、ステップS204で、復元した傾斜付きの予測信号と、復号した残差信号とに基づいて、復号画像信号を生成する。
このようにして、図5のように構成される画面内予測復号装置20は、図2のように構成される画面内予測符号化装置10の生成した符号化データを復号するのである。
図7に、本発明の他の実施形態としての、画面内予測符号化装置100を図示する。
この図に示すように、画面内予測符号化装置100は、予測モード選択部301と、傾斜算出部302と、画面内予測部303と、レート歪みコスト算出部304と、コスト最小値記憶部305と、コスト最小値初期化部306と、コスト判定部307と、最適符号化情報記憶部308と、ループ終了判定部309と、最適予測モード符号化部310と、画面内符号化部311とを備える。
この予測モード選択部301は、画面内予測の予測モードを選択する。
傾斜算出部302は、予測モード選択部301の選択した予測モードに基づいて、予測信号に傾きを付けるための傾斜を算出する。
画面内予測部303は、予測モード選択部301の選択した予測モードと、傾斜算出部302の算出した傾斜とに基づいて、画面内予測で用いられる傾斜付きの予測信号を生成する。
レート歪みコスト算出部304は、画面内予測部303の生成した予測信号に基づいて、符号化コストであるレート歪みコストを算出する。
コスト最小値記憶部305は、レート歪みコスト算出部304の算出したレート歪みコストの最小値を記憶する。
コスト最小値初期化部306は、画面内予測符号化に入る時点で、コスト最小値記憶部305に対して、大きな値を示すレート歪みコストの初期値を書き込む。
コスト判定部307は、レート歪みコスト算出部304の算出したレート歪みコストと、コスト最小値記憶部305の記憶するレート歪みコストとを比較して、レート歪みコスト算出部304の算出した方のが小さい場合には、レート歪みコスト算出部304の算出したレート歪みコストを用いて、コスト最小値記憶部305の記憶するレート歪みコストを更新し、さらに、その時点における予測モードおよび傾斜の情報に従って、最適符号化情報記憶部308の記憶する予測モードおよび傾斜の情報を更新する。
最適符号化情報記憶部308は、コスト判定部307により更新されることになる最適な予測モードおよび傾斜の情報を記憶する。
ループ終了判定部309は、予測モード選択部301に対して次の予測モードの選択を指示することで、全ての予測モードが選択されるように制御するとともに、全ての予測モードの選択が終了するときには、最適予測モード符号化部310および画面内符号化部311に対して、符号化を行うことを指示する。
最適予測モード符号化部310は、ループ終了判定部309から符号化指示があると、最適符号化情報記憶部308から予測モードの情報を読み出し、それを符号化する。
画面内符号化部311は、ループ終了判定部309から符号化指示があると、最適符号化情報記憶部308から予測モードおよび傾斜の情報を読み出し、その読み出した予測モードおよび傾斜に従って傾斜付きの予測信号を生成して、符号化対象ブロックの画像信号とその生成した予測信号との残差信号を符号化する。
次に、図8に従って、このように構成される本実施形態の画面内予測符号化装置100の実行する画面内予測について説明する。ここで、図8では、符号化対象ブロックが4×4ブロックであることを想定している。
本実施形態の画面内予測符号化装置100では、垂直予測の予測モードを具体例にして説明するならば、図8に示すように、符号化対象ブロックに最近傍の参照画素をA0 〜D0 で表し、符号化対象ブロックから離れるに従って、参照画素をA1,A2,A3,・・・・ ,Ak 、B1,B2,B3,・・・・ ,Bk 、C1,C2,C3,・・・・ ,Ck 、D1,D2,D3,・・・・ ,Dk で表すならば、これらの参照画素の画素値の示す傾斜α’から、予測画素の画素値をy、参照画素から予測画素までの距離をx、参照画素の画素値をβとすると、予測画素の画素値yを、
y=α’x+β ・・・・ 式(7)
と推定する。
このとき、例えば、A,B,C,Dの4本のそれぞれについて傾斜α’を求めて、それぞれ独立に推定結果とするようにしてもよいし、それらの平均値をとることなどにより共通となる傾斜α’を求めて、それを推定結果とするようにしてもよい。
図7のように構成される画面内予測符号化装置100では、この式(7)に従って予測信号を生成するのである。
この傾斜α’の推定処理については、画像復号側でも実行できることから、図7のように構成される本発明の画面内予測符号化装置100では、画像復号側に対して、傾斜α’を通知する必要がない。これから、図2のように構成される画面内予測符号化装置10に比べて、付加情報が不要になり、その分だけ符号化データのデータ量を削減できることになる。
図9に、本実施形態の画面内予測符号化装置100の実行するフローチャートを図示する。次に、このフローチャートに従って、画面内予測符号化装置100の実行する処理について説明する。
画面内予測符号化装置100は、画面内予測符号化の処理対象となる符号化対象ブロックが与えられると、図9のフローチャートに示すように、まず最初に、ステップS301で、後述するステップS306で用いるレート歪みコストJi の最小値Jmin を、十分大きな値(レート歪みコストJiが実際に取る可能性のない値)を示すMAXcostで初期化する。
続いて、ステップS303で、符号化対象ブロックが取る予測モードを指定するループ(変数i)を開始する。
符号化対象ブロックは画像内に存在する位置において取り得る予測モードが異なってくるため、ここではψを符号化対象ブロックが取り得る全ての予測モードの集合と定義する。初期値としてi=γ(γは取り得るモードで最も予測モード番号が小さい数値)を代入する。
続いて、ステップS304で、図8で説明したように、選択した予測モードiの規定する予測方向のk個の参照画素を用いて、1画素離れたときの傾斜αi ’を推定する。この推定については最小二乗法などを用いて行う。
続いて、ステップS305で、ステップS304で得られた傾斜αi ’を用いて、前述の式(7)に従って傾斜付きの予測信号を生成する。
続いて、ステップS306で、レート歪みコストJi を求める。レート歪みコストの計算には、下記の式(8)を用いる。
i =SSD+λ×Rblock ・・・・ 式(8)
ここで、SSDは予測誤差の絶対値の2乗和、λは予測モード判定に対するラグランジュ未定乗数、Rblock は符号化対象ブロックを選択した予測モードiで符号化した場合の発生符号量を示す。
なお、傾斜情報については符号化する必要がないので、この式(8)では、前述した式(2)で考慮したRgradientについては考慮する必要がない。
続いて、ステップS307で、
i <Jmin ・・・・ 式(9)
が成立するのか否かを判断することで、ステップS306で算出したコストJi が最小かどうかの判定を行う。
このステップS307の判断処理に従って、ステップS306で算出したコストJi が最小コストJmin を下回ることを判断するときには、ステップS308に進んで、その際の予測モードiの値と傾斜αi ’とを記録し、Jmin も更新する。
すなわち、
best_mode=i ・・・・ 式(10)
gradient=αi ’ ・・・・ 式(11)
min =Ji ・・・・ 式(12)
とする。
一方、ステップS307の判断処理に従って、ステップS306で算出したコストJi が最小コストJmin を下回らないことを判断するときには、ステップS308の処理を行わず、式(10)〜式(12)に示す更新処理は行わない。
以上のコスト計算処理を、予測モードに関するループをi∈ψの範囲内(すなわち、取り得る全ての予測モードについて)で繰り返す。
このループを実行することで、最小のレート歪みコストを実現するbest_modeと、その予測モードにおける傾斜α’とが得られる。
続いて、ステップS309で、得られたbest_modeのみを符号化する。符号化手法は算術符号化などの一般に用いられる方法を利用する。符号化した情報はヘッダなどに挿入する。
続いて、ステップS310で、得られたbest_mode、傾斜α’を用いて傾斜付きの予測信号を生成し、符号化対象ブロックを符号化する。
以上の流れにより、従来全ての予測信号が予測方向に対して同じ値に固定されていた状態から、傾斜を付けた予測信号を生成することが可能となり、予測誤差を小さくすることができるようになる。
なお、以上の説明では、4×4ブロックについての説明を行ったが、4×4ブロック以外の大きさにも本発明の概念は適用可能である。また、輝度信号だけでなく、色差信号に対しても同様に適用可能である。
図10に、図7のように構成される本実施形態の画面内予測符号化装置100の生成した符号化データを復号する、本発明の一実施形態としての画面内予測復号装置200を図示する。
この図に示すように、画面内予測復号装置200は、画面内予測符号化装置100の生成した符号化データを復号するために、予測モード復号部401と、傾斜推定部402と、予測信号生成部403と、残差信号復号部404と、復号画像生成部405とを備える。
この予測モード復号部401は、符号化データのヘッダなどに挿入されている予測モードの情報を復号する。
傾斜推定部402は、予測モード復号部401の復号した予測モードの規定する参照画素に基づき、画面内予測符号化装置100と同一の推定アルゴリズムを実行することで、画面内予測符号化装置100で推定された予測信号の傾斜を推定する。
予測信号生成部403は、予測モード復号部401の復号した予測モードと、傾斜推定部402の推定した傾斜とに基づいて、画面内予測符号化装置100で生成された傾斜付きの予測信号を生成する。
残差信号復号部404は、符号化データから画面内予測符号化装置100の符号化した残差信号を復号する。
復号画像生成部405は、予測信号生成部403の生成した予測信号と、残差信号復号部404の復号した残差信号とに基づいて、復号画像信号を生成する。
図11に、本実施形態の画面内予測復号装置200の実行するフローチャートを図示する。次に、このフローチャートに従って、画面内予測復号装置200の実行する処理について説明する。
本実施形態の画面内予測復号装置200は、画面内予測符号化装置100の生成した符号化データを入力すると、図11のフローチャートに示すように、ステップS401で、入力した符号化データのヘッダなどに挿入されているbest_modeの情報を復号する。
続いて、ステップS402で、復号したbest_modeの規定する参照画素に基づき、画面内予測符号化装置100と同一の推定アルゴリズムを実行することで、画面内予測符号化装置100で推定された予測信号の傾斜を推定する。
続いて、ステップS403で、復号したbest_modeと、推定した傾斜とに従って、画面内予測符号化装置100で生成された傾斜付きの予測信号を生成する。
続いて、ステップS404で、入力した符号化データから画面内予測符号化装置100の符号化した残差信号((元の)画像信号と予測信号との差分値)を復号する。
続いて、ステップS405で、生成した傾斜付きの予測信号と、復号した残差信号とに基づいて、復号画像信号を生成する。
このようにして、図10のように構成される画面内予測復号装置200は、図7のように構成される画面内予測符号化装置100の生成した符号化データを復号するのである。
図7に示す画面内予測符号化装置100では、最適予測モード符号化部310を備えて、図9のフローチャートのステップS309に記載するように、この最適予測モード符号化部310が最適符号化情報記憶部308からbest_modeのみを読み出して、それを符号化するという構成を採ったが、最適符号化情報記憶部308からbest_modeおよび傾斜α‘を読み出して、それらを符号化するという構成を採ることも可能である。
この構成を採る場合には、図12に示すように、最適予測モード符号化部310に代えて、最適符号化情報符号化部312を備えるようにして、(図9のフローチャートに対応する)図13のフローチャートのステップS309pに記載するように、この最適符号化情報符号化部312が最適符号化情報記憶部308からbest_modeおよび傾斜α’を読み出して、それらを符号化するようにすれば良い。
また、この構成を採る場合には、傾斜α’の値が画像復号側に通知されることになるので、図10に示す画面内予測復号装置200に代えて、図5に示す画面内予測復号装置20を用いることになる。
次に、図2のように構成される画面内予測符号化装置10の有効性を検証するために行った実験について説明する。
この実験は、5種類の傾斜定数Δ=2,4,6,8,10を用意し、それぞれに対して、11種類の傾斜調整係数 gradient[11] ={-1.0, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0}を定めて、各傾斜がどれだけ選択されたのかを、その選択確率分布を求めることで行った。
図14および図15に、その実験結果を図示する。ここで、実験条件は下記に示す通りである。
・使用ソフトウェア :KTA(Key Technical Area) ver.1.4
・KTAは次世代符号化方式のための参照ソフトウェア
・http://iphome.hhi.de/suehring/tml/download/KTA/
・プロファイル(符号化ツールの機能を規定する)
:High プロファイル
・符号化フレーム枚数:各画像の先頭1枚(画面内予測符号化、Iピクチャ)
・QP(量子化パラメータ)値
:12,27
・画像種類 :Foreman(標準画像)
・画像サイズ :QCIF(176×144画素)
・使用ブロックサイズ:4×4
図14および図15の横軸は最良と判断された傾斜調整係数を示しており、縦軸はその選択確率を示している。
ここで、図14はQP=12の実験結果であり、図15はQP=27の実験結果である。
図14および図15において、 gradient =0の部分は傾斜が付かないので、従来手法に相当する。従来手法の採用される確率はΔによって変化している。
Δ=8,10の場合、従来手法の選択率は8割程度になる。また、Δ=4,6の場合は5割程度、そしてΔ=2の場合は2割程度であった。
すなわち、Δ=2では約8割、Δ=4,6では約半分、Δ=8,10の場合は約2割に対して本発明の手法が選択される。図14と図15の傾向に大きな差がないことから、QPを変えても、この傾向が変わらないことが分かる。
以上に示された実験結果より、QPの値は従来手法と本発明による手法の選択率に大きな影響を与えず、採用されるΔに依存すると考えられる。
Δを変えても、本発明による手法は2割から8割程度、選択されることが確認できた。傾斜情報の符号量を考慮しない場合では、確実にレート歪み特性が向上することが分かる。
続いて、図2のように構成される画面内予測符号化装置10において、(1)従来手法、(2)傾斜情報量加味前の本発明による手法(傾斜情報の符号量を考慮しない場合)、(3)傾斜情報量加味後の本発明による手法(傾斜情報の符号量を考慮した場合)の計3種類の符号化性能を比較した。
図16に、その実験結果を図示する。ここで、傾斜定数Δ=10、QP=12,17,22,27,32,37以外の実験条件については前述したものと同じである。
図16において、KTA original が従来手法の実験結果を示し、Δ=10 without OHが傾斜情報量加味前の本発明による手法の実験結果を示し、Δ=10 with OHが傾斜情報量加味後の本発明による手法を示す。
なお、ここで求めた傾斜情報量は、図14および図15に示すような各符号化対象画像の選択確率分布から0次エントロピー(当該情報を損失なく符号化するのに必要な下限(理想的な)ビット数)を測定して算出している。
ここでは、上記の手法のそれぞれについてPSNR(Peak Signal to Noise Ratio)およびビットレートを求めて、それらを比較した(“Y PSNR”は、輝度信号のPSNRを示す)。
ここで、PSNRについては、上記KTAソフトウェアのログの値(処理結果)を用いた。
この実験結果から分かるように、傾斜情報量加味前の本発明による手法は、常に従来手法よりも性能が良い。ただし、傾斜情報量加味後の本発明による手法は、従来手法よりも向上する場合が多いが、わずかに劣化する場合もある。
符号化全体の情報量(横軸)が増加する場合(すなわち、高ビットレート条件下)だと、本発明の効果が大きくなる。これは、傾斜情報量が占める割合が相対的に小さくなるためと考えられる。
以上の結果より、従来手法に比べて、本発明は高ビットレート条件下で、レート歪み特性の改善が得られることを示せた。
さらに、多様な画像を用いて、図2のように構成される画面内予測符号化装置10の有効性を検証するために、傾斜定数Δ=2,10を用意し、それぞれに対して、11種類の傾斜調整係数 gradient[11] ={ -1.0, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0 }を定めて、
・使用ソフトウェア :KTA(Key Technical Area) ver.1.4
・プロファイル :High プロファイル
・符号化フレーム枚数:各画像の先頭1枚(画面内予測符号化、Iピクチャ)
・QP値 :7,12,17,22
・画像種類 :Container, Foreman, Silent,Paris, Mobile, Tempete, WhaleShow,CrowdedCrosswalk(いづれも標準画像)
・画像サイズ :QCIF,CIF(352×288画素),SD(720×480画素)
・使用ブロックサイズ:4×4,8×8
という実験条件で、本発明と従来手法のそれぞれについて上記のようなPSNR、およびビットレートを求めて、それらを比較する実験を行った。
図17A〜図35に、その実験結果を図示する。なお、この実験においては、本発明では傾斜情報量を加味してビットレートを求めた。また、実線が本発明の実験結果を示し、破線("Original")が従来手法の実験結果を示している。
また、本発明の手法と従来手法との結果の差の平均を示すΔPSNRとΔBitrateは、下記の参考文献に記載される標準的な算出手順を用いて算出した。
〔参考文献〕G.Bjontegaard,"Calculation of average PSNR differences between RD-Curves," ITU-TQ.6/SG16 VCEG, VCEG-M33, March, 2001.
(1)図17A,17Bの実験結果
図17A,17Bは、画像種類がContainerで、画像サイズがQCIFで、ブロックサイズが4×4の実験結果であり、図17AはΔ=10の実験結果、図17BはΔ=2の実験結果である。
図17Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.114dB画質が改善され、ビットレートについては平均で0.873%発生符号量が削減されたことを示している。
また、図17Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.246dB画質が改善され、ビットレートについては平均で1.69%発生符号量が削減されたことを示している。
(2)図18A,18Bの実験結果
図18A,18Bは、画像種類がForemanで、画像サイズがQCIFで、ブロックサイズが4×4の実験結果であり、図18AはΔ=10の実験結果、図18BはΔ=2の実験結果である。
図18Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.273dB画質が改善され、ビットレートについては平均で2.20%発生符号量が削減されたことを示している。
また、図18Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.417dB画質が改善され、ビットレートについては平均で3.06%発生符号量が削減されたことを示している。
(3)図19A,19Bの実験結果
図19A,19Bは、画像種類がSilent で、画像サイズがQCIFで、ブロックサイズが4×4の実験結果であり、図19AはΔ=10の実験結果、図19BはΔ=2の実験結果である。
図19Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.223dB画質が改善され、ビットレートについては平均で1.62%発生符号量が削減されたことを示している。
また、図19Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.337dB画質が改善され、ビットレートについては平均で2.12%発生符号量が削減されたことを示している。
(4)図20A,20Bの実験結果
図20A,20Bは、画像種類がParisで、画像サイズがCIFで、ブロックサイズが4×4の実験結果であり、図20AはΔ=10の実験結果、図20BはΔ=2の実験結果である。
図20Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.167dB画質が改善され、ビットレートについては平均で1.28%発生符号量が削減されたことを示している。
また、図20Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.347dB画質が改善され、ビットレートについては平均で2.32%発生符号量が削減されたことを示している。
(5)図21A,21Bの実験結果
図21A,21Bは、画像種類がForemanで、画像サイズがCIFで、ブロックサイズが4×4の実験結果であり、図21AはΔ=10の実験結果、図21BはΔ=2の実験結果である。
図21Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.147dB画質が改善され、ビットレートについては平均で1.32%発生符号量が削減されたことを示している。
また、図21Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.280dB画質が改善され、ビットレートについては平均で2.28%発生符号量が削減されたことを示している。
(6)図22A,22Bの実験結果
図22A,22Bは、画像種類がMobile で、画像サイズがCIFで、ブロックサイズが4×4の実験結果であり、図22AはΔ=10の実験結果、図22BはΔ=2の実験結果である。
図22Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.395dB画質が改善され、ビットレートについては平均で2.70%発生符号量が削減されたことを示している。
また、図22Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.546dB画質が改善され、ビットレートについては平均で3.47%発生符号量が削減されたことを示している。
(7)図23A,23Bの実験結果
図23A,23Bは、画像種類がTempeteで、画像サイズがCIFで、ブロックサイズが4×4の実験結果であり、図23AはΔ=10の実験結果、図23BはΔ=2の実験結果である。
図23Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.282dB画質が改善され、ビットレートについては平均で2.04%発生符号量が削減されたことを示している。
また、図23Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.405dB画質が改善され、ビットレートについては平均で3.60%発生符号量が削減されたことを示している。
(8)図24A,24Bの実験結果
図24A,24Bは、画像種類がWhaleShow で、画像サイズがSDで、ブロックサイズが4×4の実験結果であり、図24AはΔ=10の実験結果、図24BはΔ=2の実験結果である。
図24Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.254dB画質が改善され、ビットレートについては平均で1.99%発生符号量が削減されたことを示している。
また、図24Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.376dB画質が改善され、ビットレートについては平均で2.62%発生符号量が削減されたことを示している。
(9)図25A,25Bの実験結果
図25A,25Bは、画像種類がCrowdedCrosswalkで、画像サイズがSDで、ブロックサイズが4×4の実験結果であり、図25AはΔ=10の実験結果、図25BはΔ=2の実験結果である。
図25Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.118dB画質が改善され、ビットレートについては平均で1.06%発生符号量が削減されたことを示している。
また、図25Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.201dB画質が改善され、ビットレートについては平均で1.72%発生符号量が削減されたことを示している。
(10)図26A,26Bの実験結果
図26A,26Bは、画像種類がContainerで、画像サイズがQCIFで、ブロックサイズが8×8の実験結果であり、図26AはΔ=10の実験結果、図26BはΔ=2の実験結果である。
図26Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.0794dB画質が改善され、ビットレートについては平均で0.688%発生符号量が削減されたことを示している。
また、図26Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.188dB画質が改善され、ビットレートについては平均で1.60%発生符号量が削減されたことを示している。
(11)図27A,27Bの実験結果
図27A,27Bは、画像種類がForemanで、画像サイズがQCIFで、ブロックサイズが8×8の実験結果であり、図27AはΔ=10の実験結果、図27BはΔ=2の実験結果である。
図27Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.179dB画質が改善され、ビットレートについては平均で1.61%発生符号量が削減されたことを示している。
また、図27Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.368dB画質が改善され、ビットレートについては平均で3.23%発生符号量が削減されたことを示している。
(12)図28A,28Bの実験結果
図28A,28Bは、画像種類がSilent で、画像サイズがQCIFで、ブロックサイズが8×8の実験結果であり、図28AはΔ=10の実験結果、図28BはΔ=2の実験結果である。
図28Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.234dB画質が改善され、ビットレートについては平均で1.99%発生符号量が削減されたことを示している。
また、図28Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.369dB画質が改善され、ビットレートについては平均で3.07%発生符号量が削減されたことを示している。
(13)図29A,29Bの実験結果
図29A,29Bは、画像種類がParisで、画像サイズがCIFで、ブロックサイズが8×8の実験結果であり、図29AはΔ=10の実験結果、図29BはΔ=2の実験結果である。
図29Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.157dB画質が改善され、ビットレートについては平均で1.29%発生符号量が削減されたことを示している。
また、図29Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.313dB画質が改善され、ビットレートについては平均で2.49%発生符号量が削減されたことを示している。
(14)図30A,30Bの実験結果
図30A,30Bは、画像種類がForemanで、画像サイズがCIFで、ブロックサイズが8×8の実験結果であり、図30AはΔ=10の実験結果、図30BはΔ=2の実験結果である。
図30Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.0956dB画質が改善され、ビットレートについては平均で0.939%発生符号量が削減されたことを示している。
また、図30Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.283dB画質が改善され、ビットレートについては平均で2.71%発生符号量が削減されたことを示している。
(15)図31A,31Bの実験結果
図31A,31Bは、画像種類がMobile で、画像サイズがCIFで、ブロックサイズが8×8の実験結果であり、図31AはΔ=10の実験結果、図31BはΔ=2の実験結果である。
図31Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.202dB画質が改善され、ビットレートについては平均で1.39%発生符号量が削減されたことを示している。
また、図31Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.285dB画質が改善され、ビットレートについては平均で1.94%発生符号量が削減されたことを示している。
(16)図32A,32Bの実験結果
図32A,32Bは、画像種類がTempeteで、画像サイズがCIFで、ブロックサイズが8×8の実験結果であり、図32AはΔ=10の実験結果、図32BはΔ=2の実験結果である。
図32Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.210dB画質が改善され、ビットレートについては平均で1.69%発生符号量が削減されたことを示している。
また、図32Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.330dB画質が改善され、ビットレートについては平均で2.60%発生符号量が削減されたことを示している。
(17)図33A,33Bの実験結果
図33A,33Bは、画像種類がWhaleShow で、画像サイズがSDで、ブロックサイズが8×8の実験結果であり、図33AはΔ=10の実験結果、図33BはΔ=2の実験結果である。
図33Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.183dB画質が改善され、ビットレートについては平均で1.70%発生符号量が削減されたことを示している。
また、図33Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.333dB画質が改善され、ビットレートについては平均で3.00%発生符号量が削減されたことを示している。
(18)図34A,34Bの実験結果
図34A,34Bは、画像種類がCrowdedCrosswalkで、画像サイズがSDで、ブロックサイズが8×8の実験結果であり、図34AはΔ=10の実験結果、図34BはΔ=2の実験結果である。
図34Aの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.101dB画質が改善され、ビットレートについては平均で1.08%発生符号量が削減されたことを示している。
また、図34Bの実験結果は、本発明によれば、従来手法に比べて、PSNRについては平均で0.225dB画質が改善され、ビットレートについては平均で2.32%発生符号量が削減されたことを示している。
図35に、図17A〜図34Bの実験結果を一覧表にしたものを示す。
図17A〜図34Bに示した実験結果と、この図35の一覧表を見れば分かるように、本発明によれば、従来手法に比べて、PSNRを改善できるようになるとともに、発生符号量を減少させることができるようになる。
次に、本発明の「予測信号に適応的に傾斜を付ける」手法を、画面内予測の予測モードがH.264/MPEG−4AVCにおけるDC予測(予測モード2(平均値予測):当該ブロックに対し、上側ブロックの隣接画素と左ブロックの隣接画素を参照し、斜め方向に画素値を内挿し予測値とするモード)に適用する場合の例を説明する。
上述の画面内予測符号化装置10の実行する画面内予測では、式(1)に示したように、実施例1において、予測画素の画素値をy、参照画素から予測画素までの距離をx、参照画素の画素値をβとすると、予測画素の画素値yは、
y=αx+β
で定義された。
これに対し、上記DC予測では、利用可能な参照画素の平均値で、予測対象ブロックを生成する。即ち、DC予測では「予測方向」という概念がないため、下記の式(13)を用いて予測信号を生成する。
y(DC)=(ΣRi) / m + α (13)
ここで、RiはDC予測使用時に利用可能なi番目の参照画素の信号値を示しており、mは利用可能な参照画素の総数である。
具体的には、図37に示すように、予測対象ブロックの上側と左側が利用可能である場合(m=8の場合)、H.264/AVCにおいては、
y(DC of H.264) =(ΣRi ) / m
=(A+B+C+D+I+J+K+L+4) >> 5
=(69+76+73+82+71+70+70+68+4)>>5
=72
と計算される。ここで、>>はビットシフト処理を示す。
上記の計算は、すなわち、8画素の平均値をとって四捨五入する処理と同義である((69+76+…+70+68)/8 = 72.375≒72)。
本実施例では、これに更にαを加えることで、予測誤差をより低減させる傾斜相当分を得て、それを傾斜情報として符号化することになる(αは、本発明における「画素値に加算される値」であり、正負いずれの値も可能である)。
すなわち、上述の画面内予測符号化装置10の例で示したΔ=1、n=3、gradient=「−1、0、1」の場合、当該ブロックの予測信号は、図37に示す72だけでなく、
gradient[0]の場合、 y(DC) = 72+(−1)=71
gradient[1]の場合、 y(DC) = 72+(0)=72 (従来のH.264/AVC相当)
gradient[2]の場合、 y(DC) = 72+(+1)=73
という形で、71、72、73の3種類の候補を得て、その中から最良のコストを実現するものを選択する。この点が、他の予測モードと比較した場合の、本発明をDC予測に適用した場合の特長である。
なお、図37において、上側の画素が利用できないような場合、H.264
/AVCでは、左側の画素により「(I+J+K+L+2)>>4」を計算し、逆に、左側の画素が利用できないような場合、上側の画素により「(A+B+C+D+2)>>4」を計算する。
これは、4画素を足して4で割って四捨五入する処理と同じである。
本実施例では、その各場合についても、同様にαを更に足すことで、残差信号を画像の性質に基づいて柔軟に減らす予測を可能としている。
また、特開平10−224804に、先行する画像データブロックに基づいて勾配予測を実行する手法の開示がある。
この手法は、新しい画像データブロックについての予測において、新しいブロックより対角線方向に上にある1つのブロックからの水平勾配及び垂直勾配を決定し、これらの勾配に基づき、符号器は、新しいブロックに対し水平方向に隣接するブロック又は垂直に隣接するブロック又は垂直方向に隣接するブロックのいずれかの画像処理に基づく画像情報を予測するものであり、本願発明の手法とは根本的に異なる。
本発明は、画面内予測を用いて画像を符号化する場合に適用できるものであり、予測信号を実際の画像に合わせて傾斜を付ける形で生成することで、予測誤差を減少させることが可能になり、これにより、圧縮効率を向上させることができるようになる。

Claims (20)

  1. 画面内予測を用いて画像を符号化する画像符号化装置であって、
    複数の傾斜候補の中から、予測対象となる画像信号の示す画素値の傾斜を選択する手段と、
    前記選択した傾斜に基づいて、予測参照画素からの距離に応じて傾斜を付けて予測信号を生成する手段と、
    前記生成した予測信号に基づいて、予測対象となる画像信号を画面内符号化する手段と、
    前記選択した傾斜の大きさを示す情報を符号化する手段とを備えることを、
    特徴とする画像符号化装置。
  2. 請求項1に記載の画像符号化装置において、
    前記傾斜を選択する手段は、前記複数の傾斜候補に基づいて、傾斜の異なる複数の予測信号候補を生成して、それらの予測信号候補の中から符号化コストが最小となる予測信号候補を特定することで、前記複数の傾斜候補の中から、予測対象となる画像信号の示す傾斜を選択することを、
    特徴とする画像符号化装置。
  3. 画面内予測を用いて画像を符号化する画像符号化装置であって、
    既に符号化済みの画像信号に基づいて、予測対象となる画像信号の示す画素値の傾斜を推定する手段と、
    前記推定した傾斜に基づいて、予測参照画素からの距離に応じて傾斜を付けて予測信号を生成する手段と、
    前記生成した予測信号に基づいて、予測対象となる画像信号を画面内符号化する手段と、
    前記推定した傾斜の大きさを示す情報を符号化する手段とを備えることを、
    特徴とする画像符号化装置。
  4. 画面内予測を用いて符号化された画像の符号化データを復号する画像復号装置であって、
    予測参照画素からの距離に応じて予測信号に画素値の傾斜を付けるための情報を復号することで、画像符号化側で用いた傾斜の情報を獲得する手段と、
    前記獲得した傾斜に基づいて、画像符号化側で生成した予測信号を復元する手段と、
    画像符号化側で符号化した残差信号を復号して、その復号した残差信号と前記復元した予測信号とに基づいて復号画像信号を生成する手段とを備えることを、
    特徴とする画像復号装置。
  5. 画面内予測を用いて画像を符号化する画像符号化装置が実行する画像符号化方法であって、
    複数の傾斜候補の中から、予測対象となる画像信号の示す画素値の傾斜を選択する過程と、
    前記選択した傾斜に基づいて、予測参照画素からの距離に応じて傾斜を付けて予測信号を生成する過程と、
    前記生成した予測信号に基づいて、予測対象となる画像信号を画面内符号化する過程と、
    前記選択した傾斜の大きさを示す情報を符号化する過程とを備えることを、
    特徴とする画像符号化方法。
  6. 請求項に記載の画像符号化方法において、
    前記傾斜を選択する過程では、前記複数の傾斜候補に基づいて、傾斜の異なる複数の予測信号候補を生成して、それらの予測信号候補の中から符号化コストが最小となる予測信号候補を特定することで、前記複数の傾斜候補の中から、予測対象となる画像信号の示す傾斜を選択することを、
    特徴とする画像符号化方法。
  7. 画面内予測を用いて画像を符号化する画像符号化装置が実行する画像符号化方法であって、
    既に符号化済みの画像信号に基づいて、予測対象となる画像信号の示す画素値の傾斜を推定する過程と、
    前記推定した傾斜に基づいて、予測参照画素からの距離に応じて傾斜を付けて予測信号を生成する過程と、
    前記生成した予測信号に基づいて、予測対象となる画像信号を画面内符号化する過程と、
    前記推定した傾斜の大きさを示す情報を符号化する過程とを備えることを、
    特徴とする画像符号化方法。
  8. 画面内予測を用いて符号化された画像の符号化データを復号する画像復号装置が実行する画像復号方法であって、
    予測参照画素からの距離に応じて予測信号に画素値の傾斜を付けるための情報を復号することで、画像符号化側で用いた傾斜の情報を獲得する過程と、
    前記獲得した傾斜に基づいて、画像符号化側で生成した予測信号を復元する過程と、
    画像符号化側で符号化した残差信号を復号して、その復号した残差信号と前記復元した予測信号とに基づいて復号画像信号を生成する過程とを備えることを、
    特徴とする画像復号方法。
  9. 画面内予測を用いて画像を符号化する画像符号化装置であって、
    前記画面内予測の予測モードが、映像符号化標準H.264/MPEG−4AVCにおけるDC予測であり、
    画素値に加算される値を示す複数の傾斜候補の中から、予測対象となる画像信号に付加する傾斜を選択する手段と、
    前記選択した傾斜が付加された予測信号を生成する手段と、
    前記生成した予測信号に基づいて、予測対象となる画像信号を画面内符号化する手段と、
    前記選択した傾斜の大きさを示す情報を符号化する手段とを備えることを、
    特徴とする画像符号化装置。
  10. 請求項に記載の画像符号化装置において、
    前記傾斜を選択する手段は、前記複数の傾斜候補に基づいて、傾斜の異なる複数の予測信号候補を生成して、それらの予測信号候補の中から符号化コストが最小となる予測信号候補を特定することで、前記複数の傾斜候補の中から、予測対象となる画像信号の示す傾斜を選択することを、
    特徴とする画像符号化装置。
  11. 画面内予測を用いて画像を符号化する画像符号化装置であって、
    前記画面内予測の予測モードが、映像符号化標準H.264/MPEG−4AVCにおけるDC予測であり、
    既に符号化済みの画像信号に基づいて、予測対象となる画像信号の画素値に加算される値を示す傾斜を推定する手段と、
    前記推定した傾斜が付加された予測信号を生成する手段と、
    前記生成した予測信号に基づいて、予測対象となる画像信号を画面内符号化する手段とを備えることを、
    特徴とする画像符号化装置。
  12. 請求項11に記載の画像符号化装置において、
    さらに、前記推定した傾斜の大きさを示す情報を符号化する手段を備えることを、
    特徴とする画像符号化装置。
  13. 画面内予測を用いて符号化された画像の符号化データを復号する画像復号装置であって、
    前記画面内予測の予測モードが、映像符号化標準H.264/MPEG−4AVCにおけるDC予測であり、
    予測信号の画素値への加算値を示す傾斜を付加するための情報を復号することで、画像符号化側で用いた傾斜の情報を獲得する手段と、
    前記獲得した傾斜に基づいて、画像符号化側で生成した予測信号を復元する手段と、
    画像符号化側で符号化した残差信号を復号して、その復号した残差信号と前記復元した予測信号とに基づいて復号画像信号を生成する手段とを備えることを、
    特徴とする画像復号装置。
  14. 画面内予測を用いて符号化された画像の符号化データを復号する画像復号装置であって、
    前記画面内予測の予測モードが、映像符号化標準H.264/MPEG−4AVCにおけるDC予測であり、
    既に復号済みの画像信号に基づいて、予測対象となる画像信号の画素値に加算される値を示す傾斜を推定する手段と、
    前記推定した傾斜が付加された予測信号を生成する手段と、
    画像符号化側で符号化した残差信号を復号して、その復号した残差信号と前記生成した予測信号とに基づいて復号画像信号を生成する手段とを備えることを、
    特徴とする画像復号装置。
  15. 画面内予測を用いて画像を符号化する画像符号化方法であって、
    前記画面内予測の予測モードが、映像符号化標準H.264/MPEG−4AVCにおけるDC予測であり、
    画素値に加算される値を示す複数の傾斜候補の中から、予測対象となる画像信号に付加する傾斜を選択する過程と、
    前記選択した傾斜が付加された予測信号を生成する過程と、
    前記生成した予測信号に基づいて、予測対象となる画像信号を画面内符号化する過程と、
    前記選択した傾斜の大きさを示す情報を符号化する過程とを備えることを、
    特徴とする画像符号化方法。
  16. 請求項15に記載の画像符号化方法において、
    前記傾斜を選択する過程では、前記複数の傾斜候補に基づいて、傾斜の異なる複数の予測信号候補を生成して、それらの予測信号候補の中から符号化コストが最小となる予測信号候補を特定することで、前記複数の傾斜候補の中から、予測対象となる画像信号の示す傾斜を選択することを、
    特徴とする画像符号化方法。
  17. 画面内予測を用いて画像を符号化する画像符号化方法であって、
    前記画面内予測の予測モードが、映像符号化標準H.264/MPEG−4AVCにおけるDC予測であり、
    既に符号化済みの画像信号に基づいて、予測対象となる画像信号の画素値に加算される値を示す傾斜を推定する過程と、
    前記推定した傾斜が付加された予測信号を生成する過程と、
    前記生成した予測信号に基づいて、予測対象となる画像信号を画面内符号化する過程とを備えることを、
    特徴とする画像符号化方法。
  18. 請求項17に記載の画像符号化方法において、
    さらに、前記推定した傾斜の大きさを示す情報を符号化する過程を備えることを、
    特徴とする画像符号化方法。
  19. 画面内予測を用いて符号化された画像の符号化データを復号する画像復号方法であって、
    前記画面内予測の予測モードが、映像符号化標準H.264/MPEG−4AVCにおけるDC予測であり、
    予測信号の画素値への加算値を示す傾斜を付加するための情報を復号することで、画像符号化側で用いた傾斜の情報を獲得する過程と、
    前記獲得した傾斜に基づいて、画像符号化側で生成した予測信号を復元する過程と、
    画像符号化側で符号化した残差信号を復号して、その復号した残差信号と前記復元した予測信号とに基づいて復号画像信号を生成する過程とを備えることを、
    特徴とする画像復号方法。
  20. 画面内予測を用いて符号化された画像の符号化データを復号する画像復号方法であって、
    前記画面内予測の予測モードが、映像符号化標準H.264/MPEG−4AVCにおけるDC予測であり、
    既に復号済みの画像信号に基づいて、予測対象となる画像信号の画素値に加算される値を示す傾斜を推定する過程と、
    前記推定した傾斜が付加された予測信号を生成する過程と、
    画像符号化側で符号化した残差信号を復号して、その復号した残差信号と前記生成した予測信号とに基づいて復号画像信号を生成する過程とを備えることを、
    特徴とする画像復号方法。
JP2009538086A 2007-10-15 2008-10-14 画像符号化装置及び復号装置、画像符号化方法及び復号方法、それらのプログラム並びにプログラムを記録した記録媒体 Active JP4987085B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009538086A JP4987085B2 (ja) 2007-10-15 2008-10-14 画像符号化装置及び復号装置、画像符号化方法及び復号方法、それらのプログラム並びにプログラムを記録した記録媒体

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007267614 2007-10-15
JP2007267614 2007-10-15
JP2009538086A JP4987085B2 (ja) 2007-10-15 2008-10-14 画像符号化装置及び復号装置、画像符号化方法及び復号方法、それらのプログラム並びにプログラムを記録した記録媒体
PCT/JP2008/068547 WO2009051091A1 (ja) 2007-10-15 2008-10-14 画像符号化装置及び復号装置、画像符号化方法及び復号方法、それらのプログラム並びにプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JPWO2009051091A1 JPWO2009051091A1 (ja) 2011-03-03
JP4987085B2 true JP4987085B2 (ja) 2012-07-25

Family

ID=40567355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009538086A Active JP4987085B2 (ja) 2007-10-15 2008-10-14 画像符号化装置及び復号装置、画像符号化方法及び復号方法、それらのプログラム並びにプログラムを記録した記録媒体

Country Status (10)

Country Link
US (1) US9008173B2 (ja)
EP (3) EP4164220A1 (ja)
JP (1) JP4987085B2 (ja)
KR (1) KR101159292B1 (ja)
CN (1) CN101822062B (ja)
BR (1) BRPI0818590B1 (ja)
CA (1) CA2701893C (ja)
RU (1) RU2479940C2 (ja)
TW (1) TWI415478B (ja)
WO (1) WO2009051091A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3337171A1 (en) * 2009-10-22 2018-06-20 Thomson Licensing Methods and apparatus for dc intra prediction mode for video encoding and decoding
JP2011151682A (ja) * 2010-01-22 2011-08-04 Sony Corp 画像処理装置および方法
JP2011166218A (ja) * 2010-02-04 2011-08-25 Victor Co Of Japan Ltd 画像信号符号化装置、画像信号符号化方法、画像信号復号装置、及び、画像信号復号方法
JP5259879B2 (ja) * 2010-07-15 2013-08-07 株式会社東芝 画像符号化方法及び画像復号化方法
AU2015201843B2 (en) * 2010-07-15 2017-03-09 Kabushiki Kaisha Toshiba Image encoding method and image decoding method
AU2015202668B2 (en) * 2010-07-16 2015-12-10 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding image through intra prediction
KR101530284B1 (ko) 2010-07-16 2015-06-19 삼성전자주식회사 영상의 인트라 예측 부호화, 복호화 방법 및 장치
CN103299637B (zh) 2011-01-12 2016-06-29 三菱电机株式会社 图像编码装置、图像译码装置、图像编码方法以及图像译码方法
WO2012098878A1 (ja) 2011-01-19 2012-07-26 パナソニック株式会社 動画像符号化方法及び動画像復号化方法
HUE067788T2 (hu) * 2011-04-25 2024-11-28 Lg Electronics Inc Intra predikciós eljárás videó dekódoláshoz és videó kódoláshoz
EP2721827A4 (en) * 2011-06-20 2016-03-02 Mediatek Singapore Pte Ltd PROCESS AND DEVICE FOR DIRECTED INTRAPREDICTION
JP5389297B2 (ja) * 2011-06-24 2014-01-15 三菱電機株式会社 画像復号装置及び画像復号方法
JP5795525B2 (ja) 2011-12-13 2015-10-14 日本電信電話株式会社 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラムおよび画像復号プログラム
TWI577185B (zh) * 2012-04-16 2017-04-01 Jvc Kenwood Corp Dynamic image decoding device, dynamic image decoding method, and dynamic image decoding program
EP2870753B1 (en) 2012-07-04 2018-04-25 Thomson Licensing Spatial prediction with increased number of possible coding modes
JP2014082541A (ja) * 2012-10-12 2014-05-08 National Institute Of Information & Communication Technology 互いに類似した情報を含む複数画像のデータサイズを低減する方法、プログラムおよび装置
KR20140072231A (ko) * 2012-11-26 2014-06-13 한국전자통신연구원 율-왜곡 비용의 확률분포를 이용한 비디오 부호화기의 고속 예측모드 결정 방법
GB2516425B (en) 2013-07-17 2015-12-30 Gurulogic Microsystems Oy Encoder and decoder, and method of operation
JP2015070488A (ja) * 2013-09-30 2015-04-13 Kddi株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
JP6468703B2 (ja) * 2013-12-20 2019-02-13 キヤノン株式会社 動き検出装置、動き検出方法及びプログラム
US9743092B2 (en) * 2015-10-13 2017-08-22 Nokia Technologies Oy Video coding with helper data for spatial intra-prediction
US10390021B2 (en) 2016-03-18 2019-08-20 Mediatek Inc. Method and apparatus of video coding
CN108259913A (zh) * 2016-12-29 2018-07-06 北京大学深圳研究生院 一种用于帧间预测帧中的帧内预测方法
BR112021000569A2 (pt) * 2018-07-20 2021-04-06 Huawei Technologies Co., Ltd. Método e dispositivo de interpolação de amostra de referência de intrapredição bidirecional
WO2020171046A1 (en) * 2019-02-20 2020-08-27 Panasonic Intellectual Property Corporation Of America Image encoder and image decoder

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006352181A (ja) * 2005-02-18 2006-12-28 Hitachi Ltd 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4166305B2 (ja) 1996-09-20 2008-10-15 エイ・ティ・アンド・ティ・コーポレーション ビデオの画像コーディング及びイントラコーディングのための暗黙の係数予測及び走査適合化を提供するビデオコーダー
EP1691560B1 (en) * 1996-09-20 2017-03-08 AT&T Corp. Video coder providing implicit coefficient prediction for image coding and intra coding of video
AR016812A1 (es) 1997-08-14 2001-08-01 Samsung Electronics Co Ltd Metodo para transmitir informacion de video comprimida, disposiciones de compresion y de grabacion de video y aparato de reproduccion de video
ES2788534T3 (es) * 2002-05-28 2020-10-21 Dolby Int Ab Método y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes
KR100987765B1 (ko) 2003-09-30 2010-10-13 삼성전자주식회사 동영상 부호화기에서의 예측 수행 방법 및 장치
US7369707B2 (en) * 2003-10-28 2008-05-06 Matsushita Electric Industrial Co., Ltd. Intra-picture prediction coding method
CN100536573C (zh) * 2004-01-16 2009-09-02 北京工业大学 基于方向的dc预测方法及用于视频编码的帧内预测方法
EP1808024B1 (en) 2004-11-04 2013-04-17 Thomson Licensing Fast intra mode prediction for a video encoder
FR2881898A1 (fr) * 2005-02-10 2006-08-11 Thomson Licensing Sa Procede et dispositif de codage d'une image video en mode inter ou intra
WO2007032600A1 (en) 2005-07-21 2007-03-22 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding video signal by extending application of directional intra-prediction
KR100750145B1 (ko) * 2005-12-12 2007-08-21 삼성전자주식회사 영상의 인트라 예측 부호화, 복호화 방법 및 장치
KR101311402B1 (ko) * 2006-03-23 2013-09-25 삼성전자주식회사 영상의 부호화 방법 및 장치, 복호화 방법 및 장치
JP4350102B2 (ja) 2006-03-30 2009-10-21 株式会社クボタ 乗用型田植機

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006352181A (ja) * 2005-02-18 2006-12-28 Hitachi Ltd 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法

Also Published As

Publication number Publication date
BRPI0818590A2 (pt) 2015-07-21
TWI415478B (zh) 2013-11-11
CN101822062B (zh) 2013-02-06
CA2701893A1 (en) 2009-04-23
KR101159292B1 (ko) 2012-06-22
WO2009051091A1 (ja) 2009-04-23
EP2200324A4 (en) 2012-10-17
EP4164220A1 (en) 2023-04-12
TW200931986A (en) 2009-07-16
EP2200324A1 (en) 2010-06-23
US20100208803A1 (en) 2010-08-19
US9008173B2 (en) 2015-04-14
JPWO2009051091A1 (ja) 2011-03-03
CA2701893C (en) 2015-09-29
BRPI0818590B1 (pt) 2020-10-20
KR20100065183A (ko) 2010-06-15
RU2479940C2 (ru) 2013-04-20
RU2010113343A (ru) 2011-10-20
EP3410712A1 (en) 2018-12-05
CN101822062A (zh) 2010-09-01

Similar Documents

Publication Publication Date Title
JP4987085B2 (ja) 画像符号化装置及び復号装置、画像符号化方法及び復号方法、それらのプログラム並びにプログラムを記録した記録媒体
KR101103699B1 (ko) 영상 부호화 방법 및 복호 방법, 그들의 장치, 그들의 프로그램 및 프로그램을 기록한 기록매체
KR101697056B1 (ko) 화상 처리 장치 및 방법, 컴퓨터 판독가능 기록 매체
KR101362590B1 (ko) 화상 처리 장치 및 방법
JP5400798B2 (ja) 動画像復号化方法及び装置、動画像符号化方法及び装置
JP2009094828A (ja) 画像符号化装置及び画像符号化方法、画像復号化装置及び画像復号化方法
JP4994877B2 (ja) ビデオのフレームシーケンスにおけるマクロブロックの符号化モードを選択する方法及びシステム
JP2009049969A (ja) 動画像符号化装置及び方法並びに動画像復号化装置及び方法
JP2007013298A (ja) 画像符号化装置
WO2022140905A1 (zh) 预测方法、编码器、解码器以及存储介质
JP2005268879A (ja) 画像符号化方法およびその装置
KR20070077955A (ko) 인트라 예측 모드 결정 방법 및 장치
JP7392764B2 (ja) 映像符号化装置、映像符号化方法および映像システム
KR100989437B1 (ko) H.264/avc에서 움직임 벡터 맵을 이용한 적응적 부호화모드 결정 방법
JP2009111718A (ja) 映像再符号化装置、映像再符号化方法、映像再符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120417

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120424

R151 Written notification of patent or utility model registration

Ref document number: 4987085

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150511

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350