JPH0955939A

JPH0955939A - 動画像圧縮方法および装置

Info

Publication number: JPH0955939A
Application number: JP20410895A
Authority: JP
Inventors: Hideo Arai; 英雄新井; Ryozo Abe; 良三阿部; Toshibumi Sakaguchi; 俊文坂口; Yoshizumi Wataya; 由純綿谷
Original assignee: GRAPHICS COMMUN LAB KK
Current assignee: GRAPHICS COMMUN LAB KK
Priority date: 1995-08-10
Filing date: 1995-08-10
Publication date: 1997-02-25

Abstract

(57)【要約】【課題】本発明は、簡便な方法で確実に歪み量を推定
することのできる動画像圧縮方法を実現し、定ビットレ
ートで最良の画像を得ることのできる低コストの動画像
圧縮装置を提供することを目的とする。【解決手段】動画像または動画像の予測差分画像を所
定のブロック単位に直交変換するとともに、前記直交変
換の結果得られる直交変換係数を量子化して、前記画像
の符号化データを発生する動画像圧縮方法であって、前
記直交変換又はその量子化により得られるデータに基づ
いて前記符号化データの発生量を制御する工程を含んで
いる。量子化後に変換係数のＤＣ成分が非零となるブロ
ックの数に応じて符号量を制御するのが好ましい。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、ディジタル動画像
を圧縮する動画像圧縮方法および装置に関し、特にディ
ジタル動画像を構成する各画像を所定のブロック単位に
直交変換し、その結果得られる直交変換係数を量子化し
て符号化処理する動画像圧縮方法および装置に関する。

【０００２】

【従来の技術】近年、マルチメディア時代に対応するオ
ーディオ・ビデオ符号化方式として、ＭＰＥＧ（Moving
Picture Experts Group）１が、続いてＭＰＥＧ２が、
それぞれ国際標準となった。これらＭＰＥＧの動画像圧
縮方式を採用してディジタル動画像データから圧縮情報
を生成するエンコーダは、動画像の各画面を構成する画
像（以下、ピクチャーともいう）を小さなブロック（マ
クロブロック＝１６画素×１６画素の矩形ブロック）に
分割し、時間的に前後の画像の中から圧縮しようとする
マクロブロックに似た領域（参照画像領域）を抽出した
後、参照画像領域との空間的な距離および方位を示す動
きベクトルと、参照画像領域と圧縮しようとする領域の
差分情報とを計算して、これらの情報をＤＣＴ（Discre
te CosineTransform；離散コサイン変換）直交変換、量
子化および可変長符号化により圧縮するようになってい
る。このように動きベクトルと差分情報を圧縮すると、
現画像そのものを圧縮するよりも、はるかに効率良く圧
縮できるからである。また、差分情報によって圧縮され
るピクチャーは参照するピクチャーがないと復元できな
いため、他の画像を参照しないＩピクチャー（Intra-Pi
cture；フレーム内符号化画像）が周期的に設けられて
いる。このＩピクチャーを圧縮する際には、Ｉピクチャ
ーの全マクロブロックが、他の画像を参照しないイント
ラブロックとしてそのままＤＣＴ直交変換、量子化およ
び可変長符号化されて圧縮される。そして、このＩピク
チャーを参照画像として、次の画像が圧縮され、さら
に、既に圧縮された画像を参照画像として他の画像が圧
縮されていく。参照画像を用いて圧縮するピクチャーに
は、時間的に前方のピクチャーのみを参照画像とするＰ
(Predictive)ピクチャーと、時間的に前後のピクチャー
を参照画像とするＢ(Bidirectionally-Predictive)ピク
チャーがある。なお、ＰピクチャーはＩピクチャーと同
様に他の画像の参照画像として利用され得るが、Ｂピク
チャーは他の画像の参照画像として利用されない。ま
た、動きベクトルによる補償を行うか否かは、入力画像
のマクロブロック毎にその補償の有無による発生ビット
量の差を推定判断して、決定される。一方、圧縮された
情報（ビットストリーム）から動画像を復元（伸長）す
るデコーダでは、エンコードの逆処理、すなわち、逆量
子化、逆ＤＣＴ、参照画像との合成（加算）を行って動
画像を復元する。

【０００３】ところで、ＭＰＥＧによる圧縮、伸長で
は、量子化、逆量子化の過程で歪みを生じるため、圧縮
されたデータ（ビットストリーム）から復元された画像
は、現画像とはわずかに異なる。細かく量子化すれば前
記歪みは小さくなるが、圧縮効率が低下する。そのた
め、定められたビットレートで最良の画質を得るために
は量子化特性を適切に制御する必要がある。

【０００４】また、量子化特性は、マクロブロック毎に
定まる量子化係数（テレビジョン学会誌１９９５年Ｖｏ
ｌ．４９、Ｎｏ．４（以下、文献１という）第45頁(10)
式のquantiser scaleに相当する）と、ＤＣＴ係数の次
数によって定まる量子化マトリックス（文献１の第45頁
(10)式のW[w][v][u]に相当する）とをパラメータとして
制御され、通常は量子化係数を調整することにより量子
化のステップ幅を設定し、発生ビット量を調整するよう
になっている。

【０００５】従来の量子化制御方法としては、文献１の
第４９〜５０頁、「３−２−５レート制御とバッファ
制御」に記載されるように、過去にエンコードした画面
の発生符号量と量子化係数を基に、全体の画質が最適化
されるようなビット配分を推定し、量子化制御を行うも
のが提案されている。また、他の従来の量子化制御方法
として、１９９４年画像符号化シンポジウム（ＰＣＳＪ
９４）の第９回シンポジウム資料第１８５〜１８６頁、
「動画像符号化の符号量制御に関する一検討」（以下、
文献２という）に記載されるように、復元画像の歪み
（ＳＮＲ：Signal to Noise Ratio）を定量的に評価
し、ＳＮＲが最良になるように量子化制御を行う方法も
提案されている。

【０００６】

【発明が解決しようとする課題】しかしながら、上記文
献１に記載される従来の動画像圧縮方法および装置にあ
っては、実際の歪み量を評価するのではなく、量子化係
数を評価して符号量制御を行っているため、歪みを最小
にするような調整をすることが困難であった。量子化係
数と歪み量との間には強い相関があるものの、両者は多
少異なるものだからである。すなわち、かかる従来の動
画像圧縮方法および装置は、量子化係数から歪み量を推
定する簡便な方法では歪み量を正確に把握することがで
きず、歪み量を求める装置が複雑になるという課題を抱
えていた。

【０００７】また、上記文献２に記載される他の従来例
にあっては、ＳＮＲを定量的に評価するために、エンコ
ードされた画像を全てデコードして現画像と比較するた
め、膨大な計算が必要となり、圧縮装置のコストを増加
させてしまうという問題があった。なお、通常のＭＰＥ
Ｇエンコーダでも、参照画像とするためにデコード画像
を作成する必要があるが、参照画像としてはＩピクチャ
ー、Ｐピクチャーのみがあれば良いので、Ｂピクチャー
をデコードする必要はなかった。

【０００８】本発明は、上述のような従来の課題を解決
すべく、簡便な方法で確実に歪み量を推定することので
きる動画像圧縮方法を実現し、定ビットレートで最良の
画像を得ることのできる低コストの動画像圧縮装置を提
供することを目的とする。

【０００９】

【課題を解決するための手段】本願発明者は、ＭＰＥＧ
において、量子化係数が歪み量を正確には反映しない原
因が次の点にあることに着目した。まず、ＭＰＥＧにお
いて、デコーダのノンイントラマクロブロックでの逆量
子化は、次の式で定められている。（上記文献１の第４
３〜４８頁、「３−２−４ＤＣＴ符号化、量子化、可変
長符号化」の(10)式および(11)式。但し、文献１ではノ
ンイントラブロックを「非イントラブロック」と表記し
ている。） F_dash[v][u]= ((2×QF[v][u]+k)× W[1][v][u]×quantiser scale)/32 ..(1) k=Sign(QF[v][u]) ..(2) ここで、 F_dash[v][u]：逆量子化後のＤＣＴ係数 QF[v][u]：逆量子化前のＤＣＴ係数（つまり、量子化後
のＤＣＴ係数） W[1][v][u]：量子化マトリックス（ノンイントラマクロ
ブロック用） quantiser scale：量子化係数 Sign()：引数の符号が正であれば１、負であれば−１、
０であれば０を返す関数 / ：切捨て除算このような特性を持つ逆量子化に対しては、通常、次の
式で量子化を行う。

【００１０】 QF[v][u]= ((F[v][u]×16+W[1][v][u]/2)/W[1][v][u])/quantiser scale)/32 ..(3) ここで、 F[v][u]：量子化前のＤＣＴ係数 / ：切捨て除算これらの変換式を用い、ＤＣＴ係数 F[v][u]を量子化し
て逆量子化前のＤＣＴ係数ＱＦ[v][u]を求め、さらにこ
のＱＦ[v][u]を逆量子化して逆量子化後のＤＣＴ係数 F
_dash[v][u]を得る。量子化前のＤＣＴ係数 F[v][u]と
逆量子化後のＤＣＴ係数 F_dash[v][u]との間の差が、
量子化、逆量子化による歪みである。

【００１１】この式において、単なる乗算による逆量子
化と異なる点は、Sign(QF[v][u])の項があることであ
り、この項があることで、図６に示すようにＱＦ[v]
[u]が０となるF[u][v]の範囲の方がＱＦ[v][u]が１以上
又は−１以下になるF[u][v]の範囲より広くなるような
逆量子化がなされる（以下、この作用域をデッドゾーン
という）。したがって、より広い範囲が０として量子化
されることになり、ビット削減を効率よく行うことがで
きる。なお、図６は W[1][v][u]＝１６、quantiser_sca
le＝８の条件で F[v][u]と F_dash[v][u]の関係を示し
たもので、複数の黒丸印と実線で表した線がF[v][u]とF
_dash[v][u]の関係を、点線で表した線が歪み０の変換
式をそれぞれ示している。つまり、実線と点線の差が量
子化歪みを表している。また、F_dash＝０のレベルがＱ
Ｆ[v][u]＝０に、F_dash＝±１２がＱＦ[v][u]±１にそ
れぞれ相当し、F_dash＝±２０がＱＦ[v][u]±２に相当
する。ＱＦ[v][u]＝０の範囲はＦの値にして−７〜７ま
での１５の幅が存在しているのに対し、他の値は８の幅
しかない。このように、ＱＦ[v][u]＝０の幅は他の値の
場合よりも広いため、ＱＦ[v][u]＝０の時の量子化誤差
は、他の値の場合の量子化誤差よりも大きくなってしま
う。付言すれば、ＱＦ[v][u]＝０の場合は、点線（歪み
０の変換式）からのずれとして示される最大７の量子化
歪みが発生しているのに対し、その他の場合は最大４の
誤差しか発生していない。このように同一の量子化係数
であっても、ＱＦ[v][u]の値が異なると、量子化誤差が
異なってくるという現象により、量子化係数が歪み量を
正確に反映しなくなる。

【００１２】そこで、本発明では、正確に歪み量を把握
し符号量制御の精度を高めるべく、量子化係数のみなら
ず、量子化される直交変換係数情報を把握してそれを符
号量制御に反映させる。そして、量子化後に非零となる
マクロブロックが少ない場合は、より大きな歪みを持つ
ため、量子化係数が小さくなるように制御し、量子化後
に非零となるマクロブロックが多い場合には、量子化係
数が大きくなるように制御する。このようにすれば、歪
みが均一になり、良好な復元画像を得ることができる。
特に、ＰピクチャーとＢピクチャーの間で、非零係数の
割合に大きな違いがあるような動画像に対して、この効
果が顕著に現れる。

【００１３】例えば、図７に示すように、画面の輝度が
連続的にゆっくりと変化する動画像（フェード画像）に
おいて、Ｐピクチャーでは参照画像（Ｉピクチャー）か
らの差分Ｄ₁が通常画像よりも大きくなるため、非零係
数の数が多くなる。一方、Ｂピクチャーは、前後の画像
の平均を参照画像とするため、参照画像からの差分Ｄ ₂
があまり大きくならず、非零係数の増加はさほどでな
い。つまり、ＰピクチャーとＢピクチャーの間で、非零
係数の割合に大きな違いが生じる。このような動画像に
対しては、文献１の手法のように量子化係数から判断し
て適切なビット配分になるように制御すると、Ｐピクチ
ャーとＢピクチャーの間で歪み量に大きな差が発生し、
ＰピクチャーとＢピクチャーの繰返し周期で歪み量が増
大する所謂フリッカ現象が発生して、非常に見苦しい復
元画像となる。

【００１４】これに対し、例えば量子化後に直流成分
（ブロック内の画素データの平均値に相当する）が非零
となるブロックの数と量子化係数とを基に符号量制御を
行うようにすれば、非零係数の多いＰピクチャーでは従
来よりも量子化ステップ幅を大きくし、非零係数の少な
いＢピクチャーは従来方法よりも量子化ステップ幅を小
さくするようにして、歪みの均一化された復元画像を得
ることが可能になる。特に、ＤＣ（直流）成分、低周波
成分の歪みは、目立ち易いので、これらの成分が非零と
なるブロックの数を把握することで、より効果的に符号
量、画質の制御を行うことができる。

【００１５】また、符号量制御のためであれば、復元画
像の歪みでなくＤＣＴ係数の歪みを求めるだけでも良い
から、第２の発明として、ＤＣＴ係数の歪み（図６中の
黒丸の点線からのずれ）を算出して、これを符号量制御
に反映させるようにする。このようにすると、文献２に
記載されたような符号量制御と同様な効果を、それより
簡単な装置で実現可能になる。

【００１６】本発明の発明者は、上述のような観点か
ら、次のような解決手段に到達した。すなわち、請求項
１に記載の発明は、動画像または動画像の予測差分画像
を所定のブロック単位に直交変換するとともに、前記直
交変換の結果得られる直交変換係数を量子化して、前記
画像の符号化データを発生する動画像圧縮方法であっ
て、前記直交変換又はその量子化により得られるデータ
に基づいて前記符号化データの発生量を制御する工程を
含むことを特徴とするものである。この場合、実空間で
なく直交変換空間の情報（空間周波数領域の情報）を符
号量制御に反映させることにより、量子化歪みをより正
確に把握し、符号量制御の精度を高めることができる。
さらに、請求項２に記載のように、前記量子化後に前記
直交変換係数の直流成分が非零となるブロックの数に応
じて前記符号化データの発生量を制御することが好まし
い。量子化後に非零となる直交変換係数の数と量子化係
数とを基に符号量制御を行うようにすれば、非零係数の
多いＰピクチャーでは従来よりも量子化ステップ幅を大
きくし、非零係数の少ないＢピクチャーは従来方法より
も量子化ステップ幅を小さくするようにして、歪み（Ｓ
ＮＲ）の均一化された復元画像が簡単に得られるからで
ある。

【００１７】また、請求項３に記載の発明は、動画像ま
たは動画像の予測差分画像を所定のブロック単位に直交
変換するとともに、前記直交変換の結果得られる直交変
換係数を量子化して、前記画像の符号化データを発生す
る動画像圧縮方法であって、前記量子化後の直交変換係
数を逆量子化して得られる直交変換係数と前記量子化前
の直交変換係数との差分を算出する工程と、前記差分の
総和に基づいて前記符号化データの発生量を制御する工
程とを含むことを特徴とするものである。この場合、直
交変換係数の量子化前後の差分を算出し計数してその総
和を求めることで、実空間における画像の歪みを算出す
ることなく、歪みを正確に推定することができ、良好な
画像を得ることができる。

【００１８】請求項４に記載の発明は、動画像または動
画像の予測差分画像を所定のブロック単位に直交変換す
る直交変換手段と、前記直交変換の結果得られる直交変
換係数を量子化する量子化手段と、を備え、前記直交変
換および量子化を含む符号化処理により前記画像の符号
化データを発生する動画像圧縮装置において、前記量子
化手段による量子化の結果得られるデータ値または量子
化の途中段階で得られるデータ値を計数するデータ値計
数手段と、該データ値計数手段の計数結果に応じ前記符
号化データの発生量を制御する符号量制御手段と、を設
けたことを特徴とするものであり、請求項５に記載のよ
うに、前記データ値計数手段が前記データ値について前
記ブロック単位の画像のブロック属性を判別する手段を
有し、該ブロック属性の判別結果に基づいて特定のブロ
ック属性に対応するデータ値を選択的に計数するのが好
ましい。この計数結果を符号発生量の制御に反映して効
果が得られるノンイントラブロックのみを選択し、効率
良く処理することができるからである。また、請求項６
に記載のように、前記データ値計数手段が、前記データ
値について前記直交変換の変換次数を判別する手段を有
し、該変換次数の判別結果に基づいて特定の変換次数に
対応するデータ値を選択的に計数するものであってもよ
く、さらに、請求項７に記載のように、前記データ値計
数手段が、前記データ値について前記直交変換係数が零
値か否かを判別する手段を有し、該判別結果に基づいて
前記非零値に対応する特定のデータ値を選択的に計数す
るものであってもよい。ＤＣ（直流）成分が非零となる
ブロック、あるいは更に低周波成分の歪みも目立ち易い
ので、該成分が非零となるブロックの数を把握すること
で、効果的に符号量、画質の制御を行うことができるか
らである。

【００１９】さらに、請求項８に記載の発明は、動画像
または動画像の予測差分画像を所定のブロック単位に直
交変換する直交変換手段と、前記直交変換の結果得られ
る直交係数を量子化する量子化手段と、を備え、前記直
交変換および量子化を含む符号化処理により前記画像の
符号化データを発生する動画像圧縮装置において、前記
量子化手段の出力を逆量子化する逆量子化手段と、逆量
子化手段によって逆量子化された直交変換係数と量子化
前の直交変換係数との差分を算出する直交変換係数差分
算出手段と、直交変換係数差分算出手段の出力を計数す
るデータ値計数手段と、データ値計数手段の計数結果に
基づいて前記符号化データの発生量を制御する符号量制
御手段と、を設けたことを特徴とするものであり、請求
項９に記載のように、前記データ値計数手段が、前記デ
ータ値について前記直交変換の変換次数を判別する手段
を有し、該変換次数の判別結果に基づいて特定の変換次
数に対応するデータ値を選択的に計数するのが望まし
い。

【００２０】

【発明の実施の形態】以下、本発明の好ましい実施の形
態について図面を参照しつつ説明する。本実施形態の動
画像圧縮装置は、図１のブロック図に示されるように、
動画像または動画像の予測差分画像を所定のブロック単
位に直交変換する直交変換手段、例えばＤＣＴ（Discre
te Cosine Transform；離散コサイン変換）手段１３
と、前記直交変換の結果得られる直交変換係数、例えば
ＤＣＴ係数を量子化する量子化手段１４とを備えてお
り、前記直交変換および量子化を含む符号化処理により
前記画像の符号化データを発生するようになっている。
この動画像圧縮装置は、更に、前記量子化手段１４によ
る量子化の結果得られるデータ値または量子化の途中段
階で得られるデータ値を計数するデータ値計数手段４１
と、該データ値計数手段４１の計数結果に応じ前記符号
化データの発生量を制御する符号量制御手段４２と、を
備えている。データ値計数手段４１は、量子化手段１４
による量子化の結果得られるデータ値又は量子化の途中
段階で得られるデータ値を計数することで、直交変換係
数情報、すなわち直交変換空間の情報を把握する。ま
た、符号量制御手段４２は、データ値計数手段４１によ
る計数の結果から直交変換係数情報を把握し、その結果
に応じて前記符号化データの前記ブロック単位の発生量
を制御する。

【００２１】この装置を用いて本発明の動画像圧縮方法
を実施する場合の態様としては、まず、動画像または動
画像の予測差分画像を直交変換手段１３によって所定の
ブロック単位に直交変換するとともに、この直交変換の
結果得られる直交変換係数を量子化手段１４によって量
子化して、前記画像の符号化データを発生する方法であ
り、前記直交変換係数又はその量子化により得られるデ
ータ、例えば前記直交変換係数の量子化後のデータを計
数するデータ値計数手段４１からの情報に基づき、符号
量制御手段４２により量子化手段１４を制御して、前記
符号化データの発生量を制御する工程を含むことにな
る。

【００２２】このようにして、直交変換係数情報を符号
量制御に反映させる際、量子化後に直交変換係数が非零
となるブロックが少なく量子化歪みが大きくなる場合
は、量子化係数が小さくなるように制御し、一方、量子
化後に非零となるマクロブロックが多く量子化歪みが小
さくなる場合には、量子化係数が大きくなるように制御
すると、歪みが均一になるから良好な復元画像を得るこ
とができる。

【００２３】前記符号量制御工程において、前記直交変
換係数の直流成分（ＤＣ成分）が非零となるブロックの
数に応じて前記符号化データの発生量を制御することが
でき、その場合、特にＰピクチャーとＢピクチャーの間
で、非零係数の割合に大きな違いがあるような動画像に
対して、顕著な効果が得られる。前記データ値計数手段
４１は前記データ値について前記ブロック単位の画像の
ブロック属性を判別する手段５１を有するものとするこ
とができ、その場合、該ブロック属性の判別結果に基づ
いて特定のブロック属性に対応するデータ値を選択的に
計数することができる。また、データ値計数手段４１
は、前記データ値について前記直交変換の変換次数を判
別する手段５２を有し、該変換次数の判別結果に基づい
て特定の変換次数に対応するデータ値を選択的に計数す
るものであってもよく、更に前記データ値について前記
直交変換係数が零値か否かを判別する手段５３を設けて
の判別結果に基づいて前記非零値に対応する特定のデー
タ値を選択的に計数するようにすることもできる。

【００２４】なお、本発明でいう「直交変換」は好まし
くは離散コサイン変換（ＤＣＴ）であるが、これに限る
ものではない。また、直交変換の結果得られる「直交変
換係数」はＤＣ成分のみならず他の次数を含むものであ
ってもよく、例えば一次までの次数の直交変換係数を含
んでも好ましい。

【００２５】

【実施例】図１〜図３は本実施形態の動画像圧縮装置の
詳細な実施例を示す図であり、図１はこの実施例のブロ
ック図である。図１において、１は図外のフレームメモ
リ等を介してディジタル動画像信号を入力する画像信号
入力端子であり、画像信号入力端子１には前記動画像の
各画面を構成する画像（ピクチャー）の輝度や色差を含
むデータが入力される。入力画像データはブロック化手
段１１によって動画像の各画面を例えば１６画素×１６
画素の矩形ブロック（以下、マクロブロックという）に
分割するようブロック化され、マクロブロック単位で差
分画像生成手段１２および動きベクトル探索手段３１に
送られる。動きベクトル探索手段３１は、エンコード
（符号化）しようとするマクロブロックの画像を復元画
像記録手段２４中に記憶された参照画像（既にエンコー
ドされたＩまたはＰピクチャー）と比較し、参照画像の
中から、入力マクロブロックに最も似た画像領域を探索
して、その結果得られる動きベクトルを参照領域抽出手
段３２に出力する。この参照領域抽出手段３２は、動き
ベクトル探索手段３１による探索の結果得られた動きベ
クトルに基づき、復元画像記録手段２４中の参照画像の
中から圧縮しようとするマクロブロックに似た領域を参
照領域として抽出する。

【００２６】差分画像生成手段１２は、ブロック化手段
１１および参照領域抽出手段３２からのデータに基づい
て、予め入力画像の空間周波数の分布や動きベクトルを
用いて動き補償した差分画像の空間周波数等を推定する
処理を実行し、発生ビット量が少なくなるマクロブロッ
ク属性を（動き補償を行うか否かを）選択して入力画像
又は動きベクトルを用いて動き補償した差分画像の何れ
かを出力する。選択されるマクロブロックの属性として
は、動き補償を行わずに現画像をエンコードするイント
ラ（Intra；フレーム内符合化）マクロブロック、動き
補償を行って差分画像をエンコードするノンイントラマ
クロブロック、１フレームの画像を２つのフィールドに
分割してエンコードするフィールドエンコード等があ
る。

【００２７】より具体的には、例えば、入力画像が空間
周波数の高い成分を多く含むのに対して、差分画像が空
間周波数の低い成分しか持たない場合は、差分画像を直
交変換した方がより少ないデータ量に変換できるので、
入力したマクロブロックをノンイントラマクロブロック
としてエンコードした方が効率がよい。そこで、差分画
像生成手段１２は、入力画像をそのままイントラブロッ
クとしてエンコードした場合の交流成分（ＡＣ成分）に
相当する値と、差分画像であるノンイントラブロックと
してエンコードした場合のＡＣ成分に相当する値とをそ
れぞれ算出し、両方の値の比較結果に応じて有利なマク
ロブロック属性を判断する。ＤＣＴ変換によって得られ
るＤＣＴ係数の交流成分（ＡＣ成分）が多くなると発生
符号量が増加するという一般的な傾向を利用して、発生
ビット量を推定し、判断できるからである。差分画像生
成手段１２は、この判断結果により必要に応じて入力画
像と参照画像との間の間の減算処理を行い、差分画像を
生成してＤＣＴ手段１３に出力する。なお、ブロック化
手段１１への入力画像がＩピクチャー（Intra-Pictur
e；フレーム内符号化画像）である場合、Ｉピクチャー
内の全マクロブロックがイントラブロックとなって、ブ
ロック化手段１１からのデータがそのままＤＣＴ手段１
３に出力され、一方、ブロック化手段１１への入力画像
がＰピクチャー（Predictive-Picture；フレーム間順方
向予測符号化画像）若しくはＢピクチャー（Bidirectio
nally predictive-Picture；双方向予測符号化画像）で
ある場合に、上述のように量子化するマクロブロックの
属性がマクロブロック毎に決定されることになる。

【００２８】ＤＣＴ手段１３は、差分画像生成手段１２
からのマクロブロック毎の予測誤差信号（イントラマク
ロブロックでは入力信号、ノンイントラマクロブロック
では前記差分画像の信号）を例えば８×８画素のブロッ
クに分割した後、そのブロック単位で公知の２次元のＤ
ＣＴ演算を行い、入力画像を直流成分（ＤＣ成分）およ
び交流成分（ＡＣ成分）を含む低周波項から高周波項ま
での複数のＤＣＴ係数に変換する。なお、このＤＣＴ変
換によって、入力画像は、第１低周波項であるＤＣ成分
（平均値画像）から高周波項のＡＣ成分まで、徐々に精
細さを表現する段階的な複数の画像成分に分解されるこ
とになる。また、自然画像では、ＤＣＴ変換前にランダ
ムに分布していた画素値（例えば輝度又は色差）が、Ｄ
ＣＴ変換後には低周波項に集中することから、高周波項
を除去することで有効な情報圧縮が可能になる。

【００２９】ＤＣＴ手段１３から出力されるＤＣＴ係数
は、量子化手段１４により、マクロフロック属性（イン
トラマクロブロック、ノンイントラマクロブロック）に
応じた量子化手法で、周波数に応じた量子化マトリック
スとマクロブロック毎に定まる量子化係数とを用いて量
子化される。量子化手段１４は、ＤＣＴ変換により得ら
れたＤＣＴ係数の直流成分（ＤＣ成分）と交流成分（Ａ
Ｃ成分）とを独立に、各々量子化ステップと呼ばれる除
数で割り算し、高周波項を除去するよう余りを丸める処
理を行って、各ＤＣＴ係数を量子化するようになってい
る。量子化手段１４による量子化の量子化ステップ幅
は、後述する符号量制御手段４２によって制御され、こ
れによってマクロブロック毎の発生符号量（発生ビット
量）が制御可能になっている。

【００３０】量子化手段１４によって量子化されたデー
タは、可変長符号化手段１５にて可変長符号化された
後、バッファ１６にてビットレートを平均化しながら出
力端子２より出力され、図外の伝送路を経て外部デコー
ダへ伝送される。すなわち、画像信号はその画像の複雑
さや動きの激しさによって情報発生量が変動するため、
この変動を吸収して略一定の伝送速度で伝送するために
送信バッファ１６を設けている。また、このバッファの
占有率に基づいて量子化特性を制御できるよう発生符号
量を計数する符号量計数手段１７（後述する）が設けら
れている。

【００３１】一方、量子化手段１４によって量子化され
たデータは、逆量子化手段２１にも入力され、逆量子化
手段２１による逆量子化と逆ＤＣＴ手段２２による逆Ｄ
ＣＴ変換とで、すなわちデコーダと同じ処理によって復
元される。復元された画像、例えば復元されたＩピクチ
ャー画像はローカルデコード画像として復元画像記録手
段２４に保存され、次にエンコードする画像の参照画像
となる。このような処理をするのは、デコーダで復元さ
れるＩピクチャーの画像と現画像との間の差異を抑える
ために、Ｉピクチャーを参照画像として他の画像を伝送
する場合、デコーダにより復元するＩピクチャー画像と
全く同じ画像をデコーダ側でも作成しなければならない
という理由からである。なお、Ｐピクチャーは、Ｉピク
チャーと同様に、逆量子化手段２１、逆ＤＣＴ手段２２
で処理され、復元画像生成手段２３にてエンコード時に
用いた参照領域抽出手段３２からの参照画像と合成（加
算）されることで、デコーダの処理と同様にして復元さ
れ、復元画像記憶手段２４に保存される。

【００３２】ところで、エンコード過程において符号化
（直交変換および量子化）されたデータ（ビットストリ
ーム）のビットレートを目的のレートに保ち、かつ、よ
りよい復元画像画質を得るためには、従来技術について
先に述べた通り、量子化ステップ幅を適切に制御する必
要がある。そのため、本実施例においては、発生符号量
を計数する符号量計数手段１７と、量子化係数を計数す
る量子化係数計数手段１８とが設けられており、符号量
制御手段４２は両手段１７，１８からの情報として入力
される発生符号量と平均量子化係数を基に次にエンコー
ドする画像の割り当てビット量を決定し、量子化手段１
４の量子化ステップ幅を変化させて発生符号量を制御す
ることができる。

【００３３】なお、これだけの制御であれば、文献１に
あげた従来の動画像圧縮装置で発生符号量を計数し、発
生符号量と平均量子化係数をもとに次にエンコードする
画像の割り当てビット量を決定しているのとほぼ同様の
処理内容となる。文献１中、４９頁の(18)〜(25)式はこ
の制御を表わしているが、この場合、量子化係数の平均
が画質を反映しているという仮定から、Ｉ、Ｐ、Ｂピク
チャーの量子化係数が一定の比率（１：Ｋｐ：Ｋｂ）と
なるように制御されている。

【００３４】これに対し本実施例では、発生符号量と量
子化係数のみならず、ＤＣＴ空間の情報を含む直交変換
および量子化（すなわち符号化処理）されたデータ値を
も考慮して発生符号量制御を行うようになっており、そ
のためにデータ値分布計数手段４１が設けられている。
図２は本実施例におけるデータ値分布計数手段４１の詳
細図であり、同図において、５１は量子化手段１４から
入力されるデータ値についてマクロブロックの属性を判
別し、そのブロック属性の判別結果に基づいてノンイン
トラマクロブロックに対応するデータを抽出するノンイ
ントラマクロブロック抽出手段である。また、５２はノ
ンイントラマクロブロック抽出手段５１からのデータの
うち各マクロブロックの画素データ（例えば輝度）の平
均値を表わすＤＣ成分のデータを抽出するＤＣ成分抽出
手段、５３はＤＣ成分抽出手段５２からのデータのうち
非零成分のデータである非零係数を抽出する非零係数抽
出手段であり、非零係数抽出手段５３によって抽出され
た非零係数は計数手段５４によって計数される。すなわ
ち、データ値計数手段４１は、マクロブロック属性の判
別結果に基づいて特定のブロック属性であるノンイント
ラマクロブロックのＤＣ成分のデータ値を選択的に計数
するとともに、その計数結果を符号量制御手段４２に出
力するようになっている。このようにノンイントラマク
ロブロックのＤＣ成分を抽出するのは、本発明がノンイ
ントラマクロブロックに対して有効だからであり、ＭＰ
ＥＧではノンイントラマクロブロックの非零係数の数が
量子化歪みの目安となるとともに、ＤＣ成分が最も目に
付き易い周波数成分だからである。

【００３５】図３は、本実施例における符号量制御手段
４２の詳細図である。同図に示すように、符号量制御手
段４２は、Ｘi,Ｘp,Ｘb算出手段６１、Ｘi記憶手段６
２、Ｘp記憶手段６３、Ｘb記憶手段６４、Ｔi,Ｔp,Ｔb
算出手段６５、ｄｊi,ｄｊp,ｄｊb算出手段６６および
Ｑ算出手段６７を有している。Ｘi,Ｘp,Ｘb算出手段６
１は、前記符号量計数手段１７、量子化係数計数手段１
８および非零係数計数手段５４からの情報を基に、エン
コードした画像の複雑さを表わす値Ｘi，ＸpおよびＸb
をそれぞれ次式により算出する。

【００３６】 Xi = Si × Qi .. (4) Xp = Sp × Qp × (1-α × (N_nonintra_dc_nonzero_p - N_nonintra_dc_nonzero_b)) .. (5) Xb = Sb × Qb × (1+α × (N_nonintra_dc_nonzero_p - N_nonintra_dc_nonzero_b)) .. (6)

【００３７】ここで、Ｘi：Ｉピクチャーとしてエンコードした画像の複雑さ
を表わす値。Ｘp：Ｐピクチャーとしてエンコードした画像の複雑さ
を表わす値。Ｘb：Ｂピクチャーとしてエンコードした画像の複雑さ
を表わす値。Ｓi：Ｉピクチャーとしてエンコードされた画像の発生
ビット量。Ｓp：Ｐピクチャーとしてエンコードされた画像の発生
ビット量。Ｓb：Ｂピクチャーとしてエンコードされた画像の発生
ビット量。Ｑi：Ｉピクチャーとしてエンコードした画像の平均量
子化係数。Ｑp：Ｐピクチャーとしてエンコードした画像の平均量
子化係数。Ｑb：Ｂピクチャーとしてエンコードした画像の平均量
子化係数。

【００３８】N_nonintra_dc_nonzero_p：Ｐピクチャー
としてエンコードした画像のノンイントラマクロブロッ
クＤＣ成分の非零係数の割合。計数手段５４の計数値。 N_nonintra_dc_nonzero_b：Ｂピクチャーとしてエンコ
ードした画像のノンイントラマクロブロックＤＣ成分の
非零係数の割合。計数手段５４の計数値。 α：非零係数の割合が画質に及ぼす影響を示す定数（０
≦α）。

【００３９】また、Ｘi記憶手段６２、Ｘp記憶手段６３
およびＸb記憶手段６４は、Ｘi,Ｘp,Ｘb算出手段６１に
より算出された画像の複雑さを表わす値Ｘi，Ｘpおよび
Ｘbをそれぞれ記憶するようになっており、エンコード
開始時には、Ｘi記憶手段６２、Ｘp記憶手段６３および
Ｘb記憶手段６４にはそれぞれ適切な初期値が設定され
ている。また、Ｔi,Ｔp,Ｔb算出手段６５は、Ｘi記憶手
段６２、Ｘp記憶手段６３およびＸb記憶手段６４からの
データに基づいて次画面をＩ，ＰおよびＢピクチャーと
してエンコードする場合のそれぞれの割り当てビット量
Ｔi,Ｔp,Ｔbを次式により算出する。なお、次式は１画
面のＩピクチャーと１画面以上のＰ，Ｂピクチャーから
なる所定のピクチャー集合体（ＧＯＰ＝Group of pictu
res）の合計ビット量を決めておき、その中で、各ピク
チャーに割り当てるビット量を決定してエンコードする
ようにした例である。

【００４０】 Ti=max{R/1(1+(NpXp)/(XiKp) +(NbXb)/(XiKb)),bit rate/(8×picture rate)} ..(7) Tp=max{R/1(Np+(NbKbXb)/(KbXp)),bit rate/(8×picture rate) ..(8) Tb=max{R/1(Nb+(NpKbXp)/(KpXb)),bit rate/(8×picture rate) ..(9)

【００４１】ここで、 Ti：次画面をＩピクチャーとしてエンコードする場合の
割り当てビット量。 Tp：次画面をＰピクチャーとしてエンコードする場合の
割り当てビット量。 Tb：次画面をＢピクチャーとしてエンコードする場合の
割り当てビット量。 R ：ＧＯＰの中で残されているビット量。 Np：ＧＯＰの中でまだエンコードされていないＰピクチ
ャーの数。 Nb：ＧＯＰの中でまだエンコードされていないＢピクチ
ャーの数。

【００４２】Kp：Ｉピクチャーの量子化スケールコード
を基準としたＰピクチャーの量子化スケールコードの比
率。 Kb：Ｉピクチャーの量子化スケールコードを基準とした
Ｂピクチャーの量子化スケールコードの比率。 max{a,b}：ａとｂのうち大きい方の値を返す関数。

【００４３】このようにして割り当てビット量が算出さ
れると、各画面をその割り当てビット量におさめるた
め、各マクロブロックの量子化係数が適切に制御される
ことになる。そのために導入されている上式中のｄｊ
i，ｄｊp，ｄｊbというパラメータは、仮想的なバッフ
ァの残量を示し、ｄｊi，ｄｊp，ｄｊb算出手段６６に
よって次式により算出される（文献１中(28)〜(30)式に
相当する）。

【００４４】ｄｊi ＝ｄ0i＋Ｂj-1 − Ti × (j-1)/ ＭＢcnt ..(10) ｄｊp ＝ｄ0p＋Ｂj-1 − Tp × (j-1)/ ＭＢcnt ..(11) ｄｊi ＝ｄ0i＋Ｂj-1 − Tb × (j-1)/ ＭＢcnt ..(12) ここで、ｄｊi：Ｉピクチャー用仮想バッファの残量ｄｊp：Ｐピクチャー用仮想バッファの残量ｄｊb：Ｂピクチャー用仮想バッファの残量

【００４５】d0p：Ｐピクチャー用仮想バッファの最初
のマクロブロックエンコード開始時の残量。初期値は
０。 d0b：Ｂピクチャー用仮想バッファの最初のマクロブロ
ックエンコード開始時の残量。初期値は０。 Bj-1：画面内でエンコード済のマクロブロックに要した
ビット量。ｊ-1:画面内でエンコード済のマクロブロック数。ＭＢcnt：画面内のマクロブロック数。

【００４６】上記ｄｊi，ｄｊp，ｄｊb を用い、次にエ
ンコードするマクロブロックの量子化係数Ｑを、Ｑ算出
手段６７により次の式に従って算出する（文献１の(31)
〜(32)式）。Ｑｊ＝ｄｊ × 31/(2×bit rate/picture rate) ..(13) ここで、Ｑｊ：ｊ番目のマクロブロックの量子化係数（quantise
r scale code）。ｄｊ：ピクチャータイプに応じた仮想バッファ残量、即
ち、ｄｊi ，ｄｊpまたはｄｊb 。

【００４７】このようにマクロブロック単位で設定され
る量子化係数を用いて、量子化手段１４による適切な量
子化がなされ、その量子化に用いられた量子化係数は量
子化係数計数手段１８にて計数される。そして、量子化
係数計数手段１８の係数値が次の画面の割り当てビット
量を算出する際に用いられる。

【００４８】上述のように、非零係数の頻度を考慮して
符号量制御を行うようにすると、例えば、N_nonintra_d
c_nonzero_p は大きく、N_nonintra_dc_nonzero_b は小
さいフェード画像のような場合、従来の符号量制御（文
献１に記載されたもの）と比較して、Ｐピクチャーとし
てエンコードした画像の複雑さを表わす値Ｘp が小さ
く、Ｂピクチャーとしてエンコードした画像の複雑さを
表わす値Ｘb が大きくなる。このような値Ｘp ，Ｘb の
変化は、次画面をＰピクチャーとしてエンコードする場
合の割り当てビット量Ｔp を小さくし、次画面をＢピク
チャーとしてエンコードする場合の割り当てビット量Ｔ
b を大きくする役割を果たす。したがって、Ｐピクチャ
ー用仮想バッファの残量ｄｊp が小さく、Ｂピクチャー
用仮想バッファの残量ｄｊb が大きくなり、結果的に、
Ｐピクチャーの量子化係数が大きくなり、Ｂピクチャー
の量子化係数が小さくなる。この制御は、上述したデッ
ドゾーンの効果、すなわち、量子化後のＤＣＴ係数ＱＦ
[v][u]＝０の幅が他の値の場合よりも広くなる（そのた
めに量子化後のＤＣＴ係数ＱＦ[v][u]＝０の時の量子化
誤差が他の値の場合の量子化誤差よりも大きくなってし
まい、同一の量子化係数であっても量子化後のＤＣＴ係
数ＱＦ[v][u]の値が異なると量子化誤差が異なって量子
化係数が歪み量を正確に反映しなくなる）現象を打ち消
すように作用するので、フェード画像等に対してＰピク
チャーとＢピクチャーの歪みの差が増加するのを防止す
ることができる。その結果、ＰピクチャーとＢピクチャ
ーの間で歪み量に大きな差が発生することによりＰピク
チャーとＢピクチャーの繰返し周期で歪み量が増大する
フリッカ現象によって復元画像が見苦しくなるといった
従来の問題が解消され、良好な復元画像が得られること
になる。しかも、本実施例の動画像圧縮装置は、データ
値計数手段４１を用いてＤＣＴ係数の量子化後のデータ
を計数することにより、実際の復元画像の歪み（ＳＮ
Ｒ）を計算することなく歪み量を推定し、その情報を符
号量制御に反映させるという簡便な処理を採用している
ので、復元画像の歪みを計算するための複雑な演算回路
を設ける必要がなく、低コストの装置にすることができ
る。

【００４９】このように、本発明では、ＤＣＴ空間の情
報を符号量制御に反映させるだけの簡便な方法で、歪み
量（ＳＮＲ）を一定にするようなレート制御を簡単に行
なうことのできる動画像圧縮方法を実現でき、定ビット
レートで最良の画像を得ることができるとともに、この
方法を実施することにより定ビットレートで最良の画像
を得ることのできる低コストの動画像圧縮装置を提供す
ることができる。

【００５０】

【発明の実施の形態】次に、第２の発明の好ましい実施
の形態について説明する。本実施形態の動画像圧縮装置
は、図４のブロック図に示されるように、動画像または
動画像の予測差分画像を所定のブロック単位に直交変
換、例えばＤＣＴ変換する直交変換手段としてのＤＣＴ
手段１３と、前記直交変換、例えばＤＣＴの結果得られ
る直交変換係数を量子化する量子化手段１４とを備え、
前記直交変換および量子化を含む符号化処理により前記
画像の符号化データを発生するようになっている。この
動画像圧縮装置は、さらに、前記量子化手段１４の出力
を逆量子化する逆量子化手段２２と、逆量子化手段２２
によって逆量子化された直交変換係数と量子化前の直交
変換係数との差分を算出する直交変換係数差分算出手段
としての量子化誤差算出手段７３と、量子化誤差算出手
段７３の出力を計数するデータ値計数手段７１と、デー
タ値計数手段７１の計数結果に基づいて前記符号化デー
タの前記ブロック単位の発生量を制御する符号量制御手
段７２とを具備している。また、前記データ値計数手段
７１は、前記データ値について前記直交変換の変換次数
を判別する手段５２を有し、該変換次数の判別結果に基
づいて特定の変換次数に対応するデータ値を選択的に計
数するものであってもよい。

【００５１】この装置を用いて本発明の動画像圧縮方法
を実施する場合の態様としては、動画像の予測差分画像
を所定のブロック単位に直交変換するとともに、前記直
交変換の結果得られる直交変換係数を量子化して、前記
画像の符号化データを発生する。また、前記量子化後の
直交変換係数を逆量子化して得られる直交変換係数と前
記量子化前の直交変換係数との差分を算出する工程と、
前記差分の総和に基づいて前記符号化データの前記ブロ
ック単位の発生量を制御する工程とを含むことになる。

【００５２】なお、ここでいう「直交変換」は好ましく
は離散コサイン変換（ＤＣＴ）であるが、これに限るも
のではない。また、直交変換の結果得られる「直交変換
係数」はＤＣ成分のみならず他の次数を含むものであっ
てもよく、例えば一次までの次数の直交変換係数を含ん
でも好ましい。

【００５３】

【実施例】図４および図５は本実施形態の動画像圧縮装
置の一実施例を示す図である。この第２実施例の動画像
圧縮装置は、直交変換係数差分算出手段である量子化誤
差算出手段７３とそれに関連する構成が上述の実施例
（第１実施例）と異なるものの、他の大部分はほぼ同様
である。したがって、第１実施例と同一又はそれに相当
する構成には同一符号を付し、ここでは異なる構成部分
についてのみ説明する。

【００５４】図４に示すように、量子化誤差算出手段７
３は、ＤＣＴ係数の量子化誤差を計算するもので、ＤＣ
Ｔ手段１３から出力される量子化前のＤＣＴ係数と、逆
量子化手段２１から出力される逆量子化後のＤＣＴ係数
（逆ＤＣＴ変換前のデータ）との差分を量子化誤差とし
て算出し、この量子化誤差の算出値をデータ値計数手段
７１に出力する。

【００５５】データ値計数手段７１は、図５に示すよう
に、誤差算出手段７３からのデータのうち各マクロブロ
ックの画素データ（例えば輝度）の平均値を表わすＤＣ
成分のデータを抽出するＤＣ成分抽出手段８２と、この
ＤＣ成分抽出手段８２からのデータを計数する計数手段
８４とを有している。すなわち、データ値計数手段７１
は、ＤＣＴ係数の量子化誤差のうちＤＣ成分のみを抽出
して計数し、その計数結果を符号量制御手段７２に送る
ようになっている。

【００５６】符号量制御手段７２は、第１実施例の符号
量制御手段４２と略同様に構成されており、Ｘi,Ｘp,Ｘ
b算出手段６１と同様なＸi,Ｘp,Ｘb算出手段、Ｘi記憶
手段６２、Ｘp記憶手段６３、Ｘb記憶手段６４、Ｔi,Ｔ
p,Ｔb算出手段６５、ｄｊi,ｄｊp,ｄｊb算出手段６６お
よびＱ算出手段６７を含むものである。そして、そのＸ
i,Ｘp,Ｘb算出手段は、データ値計数手段７１からの量
子化誤差ＤＣ成分の計数値を基に、エンコードした画像
の複雑さを表わす値Ｘi，ＸpおよびＸb をそれぞれ次式
により算出する。

【００５７】 Xi = Si × Qi × (1+ β×dc_distortion_i) .. (14) Xp = Sp × Qp × (1+ β×dc_distortion_p) .. (15) Xb = Sb × Qb × (1+ β×dc_distortion_b) .. (16)

【００５８】ここで、Ｘi：Ｉピクチャーとしてエンコードした画像の複雑さ
を表わす値。Ｘp：Ｐピクチャーとしてエンコードした画像の複雑さ
を表わす値。Ｘb：Ｂピクチャーとしてエンコードした画像の複雑さ
を表わす値。Ｓi：Ｉピクチャーとしてエンコードされた画像の発生
ビット量。Ｓp：Ｐピクチャーとしてエンコードされた画像の発生
ビット量。Ｓb：Ｂピクチャーとしてエンコードされた画像の発生
ビット量。

【００５９】Ｑi：Ｉピクチャーとしてエンコードした
画像の平均量子化係数。Ｑp：Ｐピクチャーとしてエンコードした画像の平均量
子化係数。Ｑb：Ｂピクチャーとしてエンコードした画像の平均量
子化係数。 β：ＤＣ成分の歪みの総和が画質に及ぼす影響を示す定
数（０≦β）。 dc_distortion_i：ＩピクチャーのＤＣ成分の歪みの総
和。 dc_distortion_p：ＰピクチャーのＤＣ成分の歪みの総
和。 dc_distortion_b：ＢピクチャーのＤＣ成分の歪みの総
和。

【００６０】そして、算出された値Ｘi，ＸpおよびＸb
に基づき、第１実施例と同様な処理を実行して量子化手
段１４による量子化の量子化ステップ幅を変化させ、発
生符号量を制御する。

【００６１】このようにＤＣ成分の歪みの総和を考慮し
て符号量制御を行うようにすると、例えば、Ｐピクチャ
ーのＤＣ成分の歪みの総和dc_distortion_p は小さく、
ＢピクチャーのＤＣ成分の歪みの総和dc_distortion_b
は大きいフェード画像のような場合、従来の符号量制御
（文献１に記載されたもの）と比較して、Ｐピクチャー
としてエンコードした画像の複雑さを表わす値Ｘp がよ
り小さく、Ｂピクチャーとしてエンコードした画像の複
雑さを表わす値Ｘb がより大きくなる。このような値Ｘ
p ，Ｘb の変化は、次画面をＰピクチャーとしてエンコ
ードする場合の割り当てビット量Ｔp を小さくし、次画
面をＢピクチャーとしてエンコードする場合の割り当て
ビット量Ｔb を大きくする役割を果たすので、Ｐピクチ
ャー用仮想バッファの残量ｄｊp が小さく、Ｂピクチャ
ー用仮想バッファの残量ｄｊb が大きくなり、結果的
に、Ｐピクチャーの量子化係数が大きくなり、Ｂピクチ
ャーの量子化係数が小さくなる。この制御は、上述した
デッドゾーン効果による悪影響を打ち消すように作用す
るので、フェード画像等に対してＰピクチャーとＢピク
チャーの歪み差が増加するのを防止することができ、フ
リッカ現象によって復元画像が見苦しくなるといった従
来の問題を解消して良好な復元画像を得ることができ
る。しかも、本実施例の動画像圧縮装置は、量子化誤差
算出手段７３を用いて各ＤＣＴ係数の量子化誤差を把握
し、その情報を符号量制御に反映させているので、符号
量制御のための歪み推定を正確に行なうことができ、よ
り良好な復元画像を得ることができる。

【００６２】さらに、復元画像の歪みを求めるのではな
く、ＤＣＴ係数の歪みを算出してこれを符号量制御に反
映させているので、文献２に記載されたような符号量制
御と同様な効果を、より簡単な装置で実現可能になる。
なお、装置としては、構成の簡単な第１実施例を採用す
るか、正確な歪みの推定ができる第２実施例の動画像圧
縮装置を採用するかを選択するのが好ましいが、動画像
圧縮方法としてはこれらの実施例で実行する工程の双方
を含むようにしてもよい。例えば、動画像の種類に応じ
て２つの方法を使い分けることができる。

【００６３】また、上述の各実施例のように、ＤＣ成分
の非零係数のみを符号量制御に反映させるだけでなく、
人間の視覚特性に応じて、他の次数の係数を適応的に反
映させることによって、さらに効果的な符号量制御を行
うことができる。さらに、文献１に記載されるような符
号量制御法でなく他の符号量制御法を採用する場合で
も、非零計数の頻度を符号量制御に反映させることによ
り、同等の効果を得ることは可能である。

【００６４】例えば、Ｔp ，Ｔb の式について、非零係
数の数を反映させた次式を採用することができる。 Tp=max{R/(Np+(NbKpXb)/(KbXp))×(1-α×(N_nonintra_dc_nonzero_p - N_nonintra_dc_nonzero-b)),bit_rate/(8×picture_rate) ..(8') Tb=max{R/(Nb+(NpKbXp)/(KpXb))×(1+α×(N_nonintra_dc_nonzero_p - N_nonintra_dc_nonzero-b)),bit rate/(8×picture_rate) ..(9')

【００６５】ここで、Ｘi：Ｉピクチャーとしてエンコードした画像の複雑さ
を表わす値。Ｘp：Ｐピクチャーとしてエンコードした画像の複雑さ
を表わす値。Ｘb：Ｂピクチャーとしてエンコードした画像の複雑さ
を表わす値。

【００６６】N_nonintra_dc_nonzero_p：Ｐピクチャー
としてエンコードした画像のノンイントラマクロブロッ
クＤＣ成分の非零係数の割合。計数手段５４の計数値。 N_nonintra_dc_nonzero_b：Ｂピクチャーとしてエンコ
ードした画像のノンイントラマクロブロックＤＣ成分の
非零係数の割合。計数手段５４の計数値。 α：非零係数の割合が画質に及ぼす影響を示す定数（０
≦α）。 R ：ＧＯＰの中で残されているビット量。

【００６７】Np：ＧＯＰの中でまだエンコードされてい
ないＰピクチャーの数。 Nb：ＧＯＰの中でまだエンコードされていないＢピクチ
ャーの数。 Kp：Ｉピクチャーの量子化スケールコードを基準とした
Ｐピクチャーの量子化スケールコードの比率を示す定
数。 Kb：Ｉピクチャーの量子化スケールコードを基準とした
Ｂピクチャーの量子化スケールコードの比率を示す定
数。

【００６８】max{a,b}：ａとｂのうち大きい方の値を返
す関数。この場合、算出された割り当てビット量Ｔp ，Ｔb を式
(10)〜(13)に代入して量子化係数を求める。このように
すると、例えば、N_nonintra_dc_nonzero_p は大きく、
N_nonintra_dc_nonzero_b は小さいフェード画像のよう
な場合、従来の符号量制御（文献１に記載されたもの）
と比較して、次画面をＰピクチャーとしてエンコードす
る場合の割り当てビット量Ｔp を小さくし、次画面をＢ
ピクチャーとしてエンコードする場合の割り当てビット
量Ｔb を大きくすることができ、Ｐピクチャーの量子化
係数Ｑjpがより大きくなり、Ｂピクチャーの量子化係数
Ｑｊbが小さくなる。その結果、Ｂピクチャーの歪みが
減少する。したがって、Ｂピクチャーの歪みと上述のデ
ッドゾーン効果により歪み量の減少するＰピクチャーと
の歪みが均一化され、フリッカ現象のない良好な復元画
像を得ることができる。

【００６９】また、量子化係数Ｑを変更することにより
非零係数の割合をレート制御に反映させる例としては、
次式があげられる。Ｑｊp＝ｄｊp × 31/(2×bit rate/picture rate) × (1+α(N_nonintra_dc_nonzero_p - N_nonintra_dc_nonzero_b)) ..(13) Ｑｊb＝ｄｊp × 31/(2×bit rate/picture rate) × (1-α(N_nonintra_dc_nonzero_p - N_nonintra_dc_nonzero_b)) ..(14)

【００７０】ここで、Ｑｊp：Ｐピクチャーのｊ番目のマクロブロックの量子
化係数。Ｑｊb：Ｂピクチャーのｊ番目のマクロブロックの量子
化係数。ｄｊp：Ｐピクチャーのマクロブロック毎の仮想バッフ
ァ残量を示す値。ｄｊb：Ｂピクチャーのマクロブロック毎の仮想バッフ
ァ残量を示す値。 α：非零係数の割合が画質に及ぼす影響を示す定数（０
≦α）。このようにすると、例えば、N_nonintra_dc_nonzero_p
は大きく、N_nonintra_dc_nonzero_b は小さいフェード
画像のような場合、従来の符号量制御（文献１に記載さ
れたもの）と比較して、Ｐピクチャーの量子化係数Ｑjp
を大きく、Ｂピクチャーの量子化係数Ｑｊbを小さくす
ることができ、Ｂピクチャーの歪みが減少する。したが
って、Ｂピクチャーの歪みと上述のデッドゾーン効果に
より歪み量の減少するＰピクチャーとの歪みが均一化さ
れ、フリッカ現象のない良好な復元画像を得ることがで
きる。

【００７１】また、上述の各実施例では、ＭＰＥＧを例
としたが、ＭＰＥＧ以外の動画像圧縮方法であっても、
逆量子化のステップに異なる偏りがある場合は、上述の
実施例と同様な技術思想に基づいて、その偏りに応じた
量子化値の分布を求めて符号量制御に反映させることに
より、その逆量子化ステップに応じた符号量制御を実現
することが可能である。

【００７２】

【発明の効果】請求項１に記載の発明によれば、直交変
換又はその量子化により得られるデータ、すなわち直交
変換の変換係数の分布情報に基づいて符号発生量を制御
するようにしているので、実空間でなく直交変換空間の
情報（空間周波数領域の情報）を符号量制御に反映させ
ることにより、復元画像の歪み量算出を行うことなく歪
み量を推定して定ビットレートで最良の画像を得ること
ができる。

【００７３】請求項２に記載の発明によれば、前記量子
化後に前記直交変換係数の直流成分が非零となるブロッ
クの数に応じて符号発生量を制御するようにしているの
で、ノンイントラマクロブロックの非零係数の数を量子
化歪みの目安とし、最も目に付き易い周波数成分の画像
について特に良好な画像を得ることができる。請求項３
に記載の発明によれば、量子化後の直交変換係数を逆量
子化して得られる直交変換係数と前記量子化前の直交変
換係数との差分を算出し、該差分の総和に基づいて符号
量を制御するようにしているので、実空間における画像
の歪みを算出することなく、歪みを正確に推定すること
ができ、良好な画像を得ることができる。

【００７４】請求項４に記載の発明は、量子化手段によ
る量子化の結果得られるデータ値または量子化の途中段
階で得られるデータ値を計数するデータ値計数手段と、
該データ値計数手段の計数結果に応じ符号化データのブ
ロック単位の発生量を制御する符号量制御手段とを設け
ているので、実空間でなく直交変換空間の係数情報を符
号量制御に反映させることにより、復元画像の歪み量算
出を行うことなく歪み量を推定して定ビットレートで最
良の画像を得ることのできる低コストの動画像圧縮装置
を提供することができる。

【００７５】請求項５に記載の発明によれば、ブロック
単位の画像のブロック属性を判別する手段を有し、該ブ
ロック属性の判別結果に基づいて特定のブロック属性に
対応するデータ値を選択的に計数するので、その計数結
果を符号発生量の制御に反映して効果が得られるノンイ
ントラブロックのみを選択することができ、効率的な処
理を行なうことができる。

【００７６】請求項６に記載の発明によれば、前記デー
タ値計数手段が直交変換係数の変換次数を判別する手段
を有し、該変換次数の判別結果に基づいて特定の変換次
数に対応するデータ値を選択的に計数するので、直交変
換により得られる直交変換係数の直流成分や低周波数成
分が非零となるブロックの数を把握することで、より効
果的に符号量、画質の制御を行うことができる。

【００７７】請求項７に記載の発明によれば、前記デー
タ値計数手段により、前記データ値について前記直交変
換係数が零値か否かを判別し、該判別結果に基づいて前
記非零値に対応する特定のデータ値を選択的に計数する
ようにしているので、目立ち易いＤＣ（直流）成分ある
いは更に低周波成分が非零となるブロックの数を把握す
ることで、より効果的に符号量、画質の制御を行うこと
ができる。

【００７８】請求項８に記載の発明によれば、量子化手
段の出力を逆量子化する逆量子化手段と、逆量子化手段
によって逆量子化された直交変換係数と量子化前の直交
変換係数との差分を算出する直交変換係数差分算出手段
と、直交変換係数差分算出手段の出力を計数するデータ
値計数手段と、データ値計数手段の計数結果に基づいて
前記符号化データの前記ブロック単位の発生量を制御す
る符号量制御手段と、を設けているので、実空間におけ
る画像の歪みを算出することなく、歪みを正確に推定す
ることができ、良好な画像を得ることができる。

【００７９】請求項９に記載の発明によれば、前記デー
タ値計数手段が直交変換の変換次数を判別し、該変換次
数の判別結果に基づいて特定の変換次数に対応するデー
タ値を選択的に計数するので、直交変換により得られる
直交変換係数の直流成分や低周波数成分が非零となるブ
ロックの数を把握することで、より効果的に符号量、画
質の制御を行うことができる。

【図面の簡単な説明】

【図１】本発明に係る動画像圧縮装置の実施形態の一例
を示すブロック図である。

【図２】第１実施例のデータ値計数手段の構成を示すブ
ロック図である。

【図３】第１実施例の符号量制御手段の構成を示すブロ
ック図である。

【図４】本発明に係る動画像圧縮装置の他の実施形態を
示すブロック図である。

【図５】他の実施形態におけるデータ値計数手段の構成
を示すブロック図である。

【図６】量子化による歪みと量子化計数の関係を示すグ
ラフである。

【図７】フェード画像とＰ，Ｂピクチャーの歪み量の相
違を示すグラフである。

【符号の説明】

１画像信号入力端子２ビットストリーム出力端子１１ブロック化手段１２差分画像発生手段１３ＤＣＴ手段（直交変換手段）１４量子化手段１５可変長符号化手段１６バッフア１７符号量計数手段１８量子化係数計数手段２１逆量子化手段２２逆ＤＣＴ手段２３復元画像生成手段２４復元画像記憶手段３１動きベクトル探索手段３２参照領域抽出手段４１，７１データ値分布計数手段４２，７２符号量制御手段５１ブロック属性を判別する手段５２直交変換の変換次数を判別する手段５３直交変換係数が零値か否かを判別する手段７２符号量制御手段７３ＤＣＴ係数量子化誤差手段（直交変換係数差分
算出手段）

───────────────────────────────────────────────────── フロントページの続き (72)発明者坂口俊文東京都渋谷区代々木４丁目36番19号株式会社グラフィックス・コミュニケーション・ラボラトリーズ内 (72)発明者綿谷由純東京都渋谷区代々木４丁目36番19号株式会社グラフィックス・コミュニケーション・ラボラトリーズ内

Claims

【特許請求の範囲】

【請求項１】動画像または動画像の予測差分画像を所定
のブロック単位に直交変換するとともに、前記直交変換
の結果得られる直交変換係数を量子化して、前記画像の
符号化データを発生する動画像圧縮方法であって、前記直交変換又はその量子化により得られるデータに基
づいて前記符号化データの発生量を制御する工程を含む
ことを特徴とする動画像圧縮方法。
【請求項２】前記量子化後に前記直交変換係数の直流成
分が非零となるブロックの数に応じて前記符号化データ
の発生量を制御することを特徴とする請求項１に記載の
動画像圧縮方法。
【請求項３】動画像または動画像の予測差分画像を所定
のブロック単位に直交変換するとともに、前記直交変換
の結果得られる直交変換係数を量子化して、前記画像の
符号化データを発生する動画像圧縮方法であって、前記量子化後の直交変換係数を逆量子化して得られる直
交変換係数と前記量子化前の直交変換係数との差分を算
出する工程と、前記差分の総和に基づいて前記符号化デ
ータの発生量を制御する工程とを含むことを特徴とする
動画像圧縮方法。
【請求項４】動画像または動画像の予測差分画像を所定
のブロック単位に直交変換する直交変換手段（１３）
と、前記直交変換の結果得られる直交変換係数を量子化
する量子化手段（１４）と、を備え、前記直交変換およ
び量子化を含む符号化処理により前記画像の符号化デー
タを発生する動画像圧縮装置において、前記量子化手段（１４）による量子化の結果得られるデ
ータ値または量子化の途中段階で得られるデータ値を計
数するデータ値計数手段（４１）と、該データ値計数手段（４１）の計数結果に応じ前記符号
化データの発生量を制御する符号量制御手段（４２）
と、を設けたことを特徴とする動画像圧縮装置。
【請求項５】前記データ値計数手段（４１）が、前記デ
ータ値について前記ブロック単位の画像のブロック属性
を判別する手段（５１）を有し、該ブロック属性の判別
結果に基づいて特定のブロック属性に対応するデータ値
を選択的に計数することを特徴とする請求項３または４
に記載の動画像圧縮装置。
【請求項６】前記データ値計数手段（４１）が、前記デ
ータ値について前記直交変換の変換次数を判別する手段
（５２）を有し、該変換次数の判別結果に基づいて特定
の変換次数に対応するデータ値を選択的に計数すること
を特徴とする請求項３または４に記載の動画像圧縮装
置。
【請求項７】前記データ値計数手段（４１）が、前記デ
ータ値について前記直交変換係数が零値か否かを判別す
る手段（５３）を有し、該判別結果に基づいて前記非零
値に対応する特定のデータ値を選択的に計数することを
特徴とする請求項４〜６の何れかに記載の動画像圧縮装
置。
【請求項８】動画像または動画像の予測差分画像を所定
のブロック単位に直交変換する直交変換手段（１３）
と、前記直交変換の結果得られる直交変換係数を量子化
する量子化手段（１４）と、を備え、前記直交変換およ
び量子化を含む符号化処理により前記画像の符号化デー
タを発生する動画像圧縮装置において、前記量子化手段（１４）の出力を逆量子化する逆量子化
手段（２２）と、逆量子化手段（２２）によって逆量子化された直交変換
係数と量子化前の直交変換係数との差分を算出する直交
変換係数差分算出手段（７３）と、直交変換係数差分算出手段（７３）の出力を計数するデ
ータ値計数手段（７１）と、データ値計数手段（７１）の計数結果に基づいて前記符
号化データの発生量を制御する符号量制御手段（７２）
と、を設けたことを特徴とする動画像圧縮装置。
【請求項９】前記データ値計数手段（７１）が、前記デ
ータ値について前記直交変換の変換次数を判別する手段
（８２）を有し、該変換次数の判別結果に基づいて特定
の変換次数に対応するデータ値を選択的に計数すること
を特徴とする請求項８に記載の動画像圧縮装置。