JPH10336652A - 符号化方法およびこれを使用した符号化装置 - Google Patents
符号化方法およびこれを使用した符号化装置Info
- Publication number
- JPH10336652A JPH10336652A JP13890697A JP13890697A JPH10336652A JP H10336652 A JPH10336652 A JP H10336652A JP 13890697 A JP13890697 A JP 13890697A JP 13890697 A JP13890697 A JP 13890697A JP H10336652 A JPH10336652 A JP H10336652A
- Authority
- JP
- Japan
- Prior art keywords
- code amount
- value
- encoding
- quantization
- target code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/152—Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/177—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/192—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/527—Global motion vector estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
とすることで符号化/復号化による画質劣化を改善す
る。 【解決手段】N個の固定量子化器でのGOP単位の発生
符号量の結果から、入力データが符号化/復号化された
ものであるかを判定する判定手段50と、上述した発生
符号量の結果と判定結果を用いて、入力データの性質を
推定し、推定結果から目標符号量に加えるフィードバッ
クスレッショールド値FBTを算出するコントロール手
段とを有する。判定手段では、符号化/復号化されてい
るとの判定結果が得られたときには、N個の固定量子化
器からのGOP単位の発生符号量を用いて、各マクロブ
ロック間での量子化値の変動が少なくなるようなFBT
にコントロールされ、それ以外の判定結果では、再現性
を重視したFBTにコントロールされる。これで符号化
/復号化による画質劣化が防止される。
Description
方法およびこれを使用した符号化装置に関する。詳しく
は、画像などの入力データを符号化するに当たり、発生
符号量と目標符号量との差分をフィードバックして次回
以降の目標符号量に反映させる場合、入力データの性質
に依存したフィードバックスレッショールド値を算出し
て目標符号量を更新することによって、符号化/復号化
を繰り返した場合でも画質の劣化が発生しないようにし
たものである。
し、MPEG2(Moving Picture Coding Experts Grou
p2)のような符号化方法にあっては、パッケージメデ
ィアや通信容量などの制限によって、ある符号化処理単
位、例えばGOP(Group Of Pictures)に対して予め
定められた目標符号量以内に各GOPでの発生符号量を
抑えなければならない。
符号量と発生符号量との間には差が生じ、その分の画質
劣化が生じる。一般に、このような問題を解決するため
に、目標符号量と発生符号量の差を観測し、その差分値
をそれ以降符号化する入力データに対しての目標符号量
に反映させ、できるだけ発生符号量を目標符号量に近付
けるフィードバック制御方法などが採用されている。
化装置の要部の系統図である。入力データとしては画像
データを示す。
変換手段12に供給されてDCT係数に変換される。D
CT係数は固定の量子化手段14に供給されて量子化さ
れる。量子化手段14には量子化値の異なる複数の量子
化器が設けられている。MPEG2の場合、31通りの
量子化値でそれぞれ量子化されるものであるが、この量
子化手段14は最適な目標符号量を算出するために用い
られるものであるから、実際より少ない数の量子化器に
よって量子化される。
異なるN個(例えば、N=8)の量子化器14a〜14
hが使用される。量子化されたDCT係数は演算手段1
6でGOP単位および符号化の最小単位であるマクロブ
ロック単位でそれぞれの量子化値での発生符号量の計算
が行われる。したがってこの演算手段16も図32のよ
うに8個の演算器16a〜16hで構成される。
号量が目標符号量割り当て手段(目標符号量決定手段)
18に供給されて、GOP単位で予め定められた目標符
号量TMBから、マクロブロック毎の符号量(ターゲッ
トビットレート)となる目標符号量TMB(TMBb)
が割り当てられる。
れぞれQサーチ手段30に供給されてマクロブロック毎
に得られるこの目標符号量TBRを越えない最小の量子
化値が演算によって求められる。この最小量子化値とD
CT係数がバックサーチ手段32に供給される。この手
段32は符号化/復号化での画質劣化を防ぐためのバッ
クサーチアルゴリズムによって処理されるブロックであ
り、ここで量子化のための最終的な量子化値が選択され
る。
てDCT係数が量子化される。量子化されたDCT係数
は可変長符号化手段36で発生頻度に応じた符号語VL
C(Variable Length Code)に変換される。
ため、またはQサーチ手段30で選択した量子化値をバ
ックサーチ手段32のバックサーチアルゴリズムが一番
最初に符号化されたときの量子化値に置き換えてしまう
ために、目標符号量割り当て手段18で割り当てた目標
符号量TMBと、可変長符号化手段36で発生されるマ
クロブロック毎の発生符号量は、必ずしも一致しない。
にマクロブロック毎の目標符号量TMBと実際の発生符
号量の差分値DFが目標符号量割り当て手段18にフィ
ードバックされる。
GOP単位毎に加算し、GOP単位内でそれ以降符号化
されるマクロブロックの目標符号量TMBに上乗せする
ことで、より目標符号量に近付けるようにしている。
体例を示す。図33において、補間手段22では、GO
P単位の目標符号量TBRが、8個の固定量子化器14
a〜14hでのGOP単位での発生符号量のどこに位置
しているのかを判定すると共に、目標符号量を越えない
最小の量子化値が補間処理されて出力される。
量子化値の結果と、その量子化値を挟む2個の固定量子
化器での各マクロブロック単位の発生符号量の結果か
ら、それぞれのマクロブロック毎の目標符号量TMBa
を割り当てる。実際には計算して求める。
長符号化手段36からの差分値DFを目標符号量の単位
と同じ単位であるGOP単位で加算する。そしてその値
がフィードバックスレッショールド値FBT(固定値)
を越えるまでは加算出力DFが出力される。フィードバ
ックスレッショールド値FBTを越えたときにはリミッ
タされるので、固定のフィードバックスレッショールド
値FBTが出力される。
同じ単位であるGOP単位内で、それ以降に符号化され
るマクロブロック毎の目標符号量TMBaにフィードバ
ック値FBを加えたものをマクロブロックごとの目標符
号量TMBbとして出力される。
定のフィードバックスレッショールド値FBTを使用し
ているために、GOP単位での発生符号量が目標符号量
TMBbを上回ることはない。なぜなら、目標符号量割
り当て手段24において、GOP単位内でのすべてのマ
クロブロックに対して目標符号量を割り当てているから
である。
ク毎に割り当てた目標符号量TMBaと、その目標符号
量を超えないような量子化値で量子化された発生符号量
との差分DFを、目標符号量と同じ単位であるGOP単
位毎に加算したものにフィードバックスレッショールド
値FBTによってリミッタをかけた量である。補間手段
22によってGOP単位の目標符号量を越えない最小の
量子化値を選ぶ限り、このようなフィードバック制御を
行なってもGOP単位で発生符号量が目標符号量を越え
ることはない。
ードバック値として外部からそのスレッショールド値を
設定できるものの、入力画像データの性質には無関係に
決定される値であるため、符号化/復号化を繰り返すと
画質劣化が激しくなってしまう問題を持っていた。
解決したものであって、符号化/復号化を繰り返しても
画質の劣化が発生しない符号化方法およびこれを使用し
た符号化装置を提案するものである。
ため請求項1に記載したこの発明に係る符号化方法で
は、所定の符号化処理単位に対して予め決められた目標
符号量以内に各符号化処理単位での発生符号量を抑えな
ければならない符号化方法において、発生符号量と目標
符号量との差分値を目標符号量割り当て手段にフィード
バックして、入力データが過去に符号化/復号化されて
いるかを自動判定し、その判定結果に基づいて上記目標
符号量に加算するフィードバックスレッショールド量を
決定することによって、発生符号量を目標符号量に近づ
けるようにしたことを特徴とする。
符号化装置では、入力データを圧縮符号化するに際し、
実際に発生する発生符号量を目標符号量に近づける目標
符号量割り当て手段を有する符号化装置において、N
(Nは整数)個の固定量子化器でのGOP単位の発生符
号量の結果から、入力データが過去に符号化/復号化さ
れたものであるかを自動判定する判定手段と、上記N個
の固定量子化器でのGOP単位の発生符号量の結果と、
上記判定結果を用いて、上記入力データの性質を推定
し、その推定結果から上記目標符号量に加えるフィード
バックスレッショールド値を算出するフィードバックコ
ントロール手段とを有することを特徴とする。
置では、符号量予測のための複数の固定量子化器での発
生符号量の結果から、入力データが過去に符号化/復号
化されているかを自動判定し、その判定結果から、符号
化/復号化されていない場合には、入力データの性質に
依存したフィードバック制御を行う。これとは逆に入力
データが過去に符号化/復号化されている場合には、再
現性を重視したフィードバック制御を行う。
ィードバック制御を行うことによって発生符号量が目標
符号量に近くなり、符号化/復号化を繰り返しても画質
の劣化が目立たなくなる。
法およびこれを使用した符号化装置の一実施形態を図面
を参照して詳細に説明する。ただし、この例でも入力デ
ータとしては画像データであり、符号化手段としてはM
PEG2を例示する。
た符号化装置10の一実施形態を示す。この実施形態は
図31に示す従来例とその基本構成は全く同じであり、
同一部分については同一の符号を使用するとすれば、従
来例と大幅に相違する点は目標符号量割り当て手段20
だけである。したがって、基本構成およびその動作につ
いては説明を割愛する。
例を示す。この割り当て手段20には図32に示したよ
うに補間手段22、割り当て器24、フィードバック量
決定手段26および加算手段28を有する他、判定手段
50とフィードバックコントロール手段60とが設けら
れている。
/復号化されているかどうかを判定するためのもので、
同図のようにN個(N=8)の固定量子化器14a〜1
4hでのGOP単位の発生符号量と、マクロブロック単
位の目標符号量TMBとが供給され、これらの結果か
ら、入力データが過去に符号化/復号化されたものであ
るかを自動判定するマイクロプロセッサで構成されてい
る。
8個の固定量子化器14a〜14hでのGOP単位の発
生符号量が供給される他、判定手段50からの判定結果
が供給される。ここでは判定結果を参酌して入力データ
の性質を推定し、その推定結果と発生符号量および目標
符号量を用いてフィードバックスレッショールド値FB
Tを決定するマイクロプロセッサで構成されている。
る。8個の固定量子化器14a〜14hの量子化値をFi
xQ(i),i=1,2,・・・,8)としたとき、 FixQ(i)くFixQ(i+1) ・・・(1) ここに、i=1,・・・,7 のような関係に選ばれている。そして、それぞれの量子
化値でのGOP単位での発生符号量(GenBit(FixQ
(i)),i=1,2,・・・,8)から、その固定量子
化値間の発生符号量の傾きを求める。その傾きの結果か
ら入力画像データが過去に符号化/復号化されたかどう
かを判定する。
し、次にステップ72で発生符号量の傾き(GD
(i),i=1,・・・,7)を計算する。計算式は、例
えば以下のようにする。 GD(i)=(GenBit(FixQ(i))−GenBit(FixQ(i+1))/(FixQ(i+1) −FixQ(i))×(GOP内のマクロブロック数) ・・・(2) (2)式により8個の固定量子化器14a〜14hの間
の傾きを求める。そのため、iがN=8となるまではi
をインクリメントする(ステップ73,74)。全ての
固定量子化器14a〜14h間の傾きを求めたなら、i
を初期化して(ステップ75)、それぞれの傾きの間の
関係が単調な変化、この例ではiが大きくなるにつれて
単調減少(GD(i)>GD(i+1))しているかどうかを調
べる(ステップ76)。
をインクリメントしながら順次同様な判定を行い(ステ
ップ77,78)、全てに亘って単調な変化であるとき
にはその入力画像データは過去に符号化/復号化されて
いない画像データであると判断する(ステップ79)。
そして、単調な変化をしていない場合には、その入力画
像データは過去に符号化/復号化されている画像データ
であると判断する(ステップ80)。
は、上述したように入力画像データの性質を推定し、そ
の推定結果からフィードバックスレッショールド値を決
定する。図4を参照して説明する。
1)、GOP単位での目標符号量TMBと8個の固定量
子化器14a〜14hからのGOP単位での発生符号量
の関係を調べ、目標符号量を挟みこむような2個の固定
量子化器の発生符号量GenBit(FixQ(i)),GenBit
(FixQ(i+1))を見つけ出す。つまり、 GenBit(FixQ(i))>目標符号量>GenBit(FixQ(i+1)) ・・・・(3) となるような量子化値を、iをインクリメントしながら
見つけ出す(ステップ82,83,84)。
出したときには、入力画像データが符号化/復号化され
ているかどうかの判定結果を参酌する(ステップ8
5)。そして、符号化/復号化されていないときには、
符号化/復号化されていないときのフィードバックスレ
ッショールド値を求める計算アルゴリズムが実行される
(ステップ90)。符号化/復号化されているときに
は、符号化/復号化されているときのフィードバックス
レッショールド値を求める計算アルゴリズムが実行され
る(ステップ100)。
14hからの発生符号量で挟み込めない場合は(ステッ
プ82)、入力データに対して目標符号量が極端に多い
か少ないかの場合である。この場合には例えば従来の方
法のような例外処理(ステップ88)が行なわれる。本
来ならばこのようなことがないように、目標符号量また
は8個の固定量子化値が決定されなければならない。
あって、その一例を図5に示す。同図のフィードバック
スレッショールド計算アルゴリズムにおいては、図4ス
テップ82で選択された2個の固定量子化値FixQ
(i)とFixQ(i+1)の関係を調べる。
る最小の量子化ステップ(==minQステップと定義す
る)であるかを判定する(ステップ91)。FixQ
(i)とFixQ(i+1)との関係がこの最小量子化ス
テップ(FixQ(i+1)−FixQ(i)==minQステ
ップと定義する)であるならば、ステップ82で選択し
た量子化値FixQ(i)とFixQ(i+1)をそのまま補
間後の量子化ステップ(InterpQ(j))として使用す
る(ステップ92)。
関係が最小量子化ステップでないならば、FixQ(i)
とFixQ(i+1)との間で最小の量子化ステップにな
る量子化ステップ(InterpQ(j))を補間によって求
める(ステップ93,94)。
位の発生符号量を、GenBit(FixQ(i))とGenBit(F
ixQ(i+1))から補間により求める。ここでは、直
線補間により求めるものとする。 GenBit(InterpQ(y)) =GenBit(FixQ(i+1))+{((j+X−1)−y) /((j+X−1)−j)}*(GenBit(FixQ(i)) −GenBit(FixQ(i+1))) ・・・(5) ここに、y=j,j+1,・・・,j+X−1
号量に対して、GOP単位の目標符号量との関係が、 GenBit(InterpQ(j))>目標符号量>GenBit(InterpQ(j+1)) ・・・(6) となるjを見つけ出す(ステップ95)。(6)式を満
たすInterpQ(j)とInterpQ(j+1)との関係は、
最小量子化ステップとなる。
された、InterpQ(j),InterpQ(j+1)さらにそ
のGOP単位の発生符号量GenBit(InterpQ(j)),
GenBit(InterpQ(j+1))およびGOP単位の目標
符号量から、フィードバックスレッショールド値が算出
される(ステップ97)。
(x),LNC=g(x)を定義する。ここに、 UNC=f((GenBit(InterpQ(j))−目標符号量) /(GOP単位のマクロブロック数)) ・・・・(7) LNC=g((目標符号量−GenBit(InterpQ(j+1))) /(GOP単位のマクロブロック数)) ・・・・(8) ステップ97ではこの計算を行い、 フィードバック=FNC(UNC,LNC) ・・・(9a) をフィードバックスレッショールドFBTの値とする。
る。
えるにしたがって、フィードバックスレッショールド値
を大きくし、かつ、LNCの値が小さくなるにしたがっ
てフィードバックスレッショールド値を小さくする。そ
してこのフィードバックスレッショールドFBTと差分
値DFとから、そのうちの小さい方の値をフィードバッ
ク量決定手段26の出力(フィードバック量FB)とし
て用いる。
により、ほぼ各マクロブロックの目標符号量を最小量子
化ステップ(InterpQ(j)とInterpQ(j+1))内
での変動に収めることができる。最小量子化ステップ内
での変動に抑えられるために量子化値が安定化する。ま
た、この計算アルゴリズムは、入力データに対する8個
の固定量子化器14a〜14hからの発生符号量から出
発しているので、入力画像データの性質を的確に反映す
ることができる。
4)での計算アルゴリズムの具体例である。まず、図4
ステップ82で選択された2個の固定量子化器の1つで
あるFixQ(i)とGOP単位の目標符号量から、例え
ば以下のような関数h(x)を定義する(ステップ10
1)。
(ステップ102)。
る。UCの値が増えるにしたがって、フィードバックス
レッショールド値を大きくする。
合でもフィードバックスレッショールド値は0としない
である正の値Sを持たせる。また、LNCなどのように
フィードバックスレッショールド値を小さくする要素は
導入しない。これは、以下の理由による。
のようにしてしまうと、バックサーチ手段32でのアル
ゴリズムにおいて、最初に符号化した際の量子化値を見
つけにくなってしまう。発生符号量が目標符号量を越え
てはならない本発明のような符号化では、「目標符号量
を越えない最小の量子化値を選ばなくてはならない」と
言う大前提がある。バックサーチアルゴリズムを通過し
た後でも、この大前提は当然満たされなければならな
い。
子化(Q(i),i=1,2,・・・,M)を行ない、そ
の量子化の際の余りの最小となる量子化値Q(j)を見
つけ、それを最初の符号化の際に量子化された量子化値
と判定する。
での余りに差がなくなることもある。このような場合に
はバックサーチアルゴリズムでは、量子化値の変更を行
なわない。
いて、バックサーチ手段32を通過した後でも、この大
前提を満足するためには、M段の量子化の最小の量子化
値は、目標符号量を越えない最小のものを選ぶ必要があ
る。そして、その最小の量子化値から量子化値を増やす
方向にM段の量子化を行ない、余りが最小となる量子化
値を見つけ出す。
かつバックサーチアルゴリズムで最初に符号化した際の
量子化値を見つけられるようにするためには、目標符号
量を適度に多くして、最初に符号化された量子化値での
発生符号量を越えるように選ぶ必要がある。
バックスレッショールドFBTは、UCが0の場合でも
ある正の値Sとする必要があり、また、バックサーチア
ルゴリズムが確実に最初の符号化の際の量子化値を検出
することによる可変長符号化手段36からの目標符号量
と発生符号量との差分値DFは増加するので、LNCを
導入してフィードバックスレッショールド値を小さくす
る必要がない。
単位の目標符号量が最初に符号化した際の量子化値での
発生符号量を上回り、その結果バックサーチアルゴリズ
ムを十分活用することができるので、符号化/復号化を
繰り返したときの劣化を抑えることが可能となる。
の差異を述べる。その前提として、入力画像のマクロブ
ロックデータのY信号、Cr信号、Cb信号がそれぞれ
図10〜図12であるとする。図の例はそれぞれ4ライ
ン単位の繰り返しである。このマクロブロックMBが2
個で1GOPとする。またGOP単位の目標符号量を1
520ビットとする。従来の方法の場合のフィードバッ
クスレッショールドは30ビットの固定値とする。従来
例から説明する。
の量子化値は例えば「1,2,3,4,5,6,7,
8,10,12,14,16,18,20,22,2
4,28,32,36,40,44,48,52,5
6,64,72,80,88,96,104,112」
である。
GMBを抑えるために、あらかじめ固定量子化器14に
おいてGOP単位とマクロブロック単位での発生符号量
を求め、この発生符号量を用いて符号量の割り当てを行
う。固定量子化器14として31個全ての量子化器を備
えればよいが、回路規模の削減から、例えばN=8とし
て8個の量子化値の代表点を選び、その8個の量子化値
に対してGOP単位とマクロブロック単位の発生符号量
を求める。
1個の異なる量子化値でDCT係数を量子化する31個
の量子化器が備えられている。
選んだときの各固定量子化器14での発生符号量は、図
14のようになる。マクロブロックが2個で1GOPで
あるので、図14におけるGOP単位はマクロブロック
単位の2倍になっている。
から、N=8個の固定量子化器14のGOP単位の発生
符号量から、このGOP単位の目標符号量の1520ビ
ットを挟む2つの量子化値を求めると、図14から量子
化値は「18」と「24」となる。
GOP単位の発生符号量から、GOP単位の目標符号量
である1520ビットに対する量子化値Qを直線近似に
よって求める。 Q=18+[(1520−1352)/(1572−1352)] ×(24−18)=22.582 ・・・(11)
マクロブロック単位の発生符号量から、マクロブロック
単位の目標符号量Target-MB(TMB)を、(11)
式で求めた量子化値Q=22.582を用いて直線近似
する。 Target-MB=TMBa=676+[(22.582−18) /(24−18)]×(786−676) =760ビット ・・・(12) (1c)フィードバックスレッショールド値を予め与え
られた固定値(この例では30ビット)とする。
の出力)はTarget-MB=760ビットである。第2の
加算手段28は初期化され、「0」であるので、第1の
加算手段26の出力のフィードバック値も「0」とな
る。したがって、第2の加算手段28では TMBb=TMBa+FB=760+0=760ビット ・・・(13) となり、これがフィードバック制御を行ったときに出力
される目標符号量TMBbとなる。
位での発生符号量が760ビットを越えない量子化値を
求める。実際、量子化値とマクロブロック単位の発生量
を抜粋すると図15のようになっているから、760ビ
ットを越えない量子化値として「22」を選択する。
30より得られる量子化値以上の量子化値に対して、マ
クロブロック単位でDCT係数の量子化後の余り(剰
余)の総和を求め、その総和の最大値と最小値の関係
(例えば、最大値が最小値の100倍以上)から、1回
目に符号化された際の量子化値を求める。
で122ビット、総和の最大値は量子化値が「112」
のときで917ビットとなる。最大値は最小値の7.5
2倍であるので、Qサーチ手段30の量子化値出力「2
2」をバックサーチ手段32の出力とする。
2より出力された量子化値「22」を用いてDCT係数
の量子化を行う。
化されたDCT係数から可変長符号を発生させる。ま
た、マクロブロック単位の目標符号量TMBbと可変長
符号化手段36で実際に発生した符号量の差分DFを求
め、割り当て手段20にフィードバックする。
の発生符号量は図15より734ビットであるので、マ
クロブロック単位の目標符号量TMBb=760ビット
との差分値DF、 DF=760−734=26ビット ・・・(14) が割り当て手段20に対して出力される。
式より、 TMBb=Target-MB=760ビット ・・・(15A) である。第1の加算手段26は(14)式から明らかな
ように1番目のマクロブロックにおけるマクロブロック
単位の目標符号量TMBbと発生符号量との差分値DF
である26ビットとなっている。フィードバックスレッ
ショールド値は上述したように30ビットであるので、
第1の加算手段26の出力は26ビットとなる。第1の
加算手段26からはそのフィードバック値として26ビ
ットを既に出力してしまっているので、結果として
「0」ビットとなる。第2の加算手段28では、 TMBb=760+26=786ビット ・・・(15B) となり、これがフィードバック制御を行ったときの目標
符号量TMBbとなる。
位での発生符号量が786ビットを越えない量子化値を
求める。実際、量子化値とマクロブロック単位の発生量
を抜粋すると図15のようになっているから、786ビ
ットを越えない量子化値として「18」を選択する。
にQサーチ手段30より得られる量子化値以上の量子化
値に対して、マクロブロック単位でDCT係数の量子化
後の余り(剰余)の総和を求め、その総和の最大値と最
小値の関係から、1回目に符号化された際の量子化値を
求める。
で73ビット、総和の最大値は量子化値が「112」の
ときで917ビットとなる。最大値は最小値の12.5
6倍であるので、Qサーチ手段30の量子化値出力「1
8」をバックサーチ手段32の出力とする。
2より出力された量子化値「18」を用いてDCT係数
の量子化を行う。
化されたDCT係数から可変長符号を発生させる。ま
た、マクロブロック単位の目標符号量TMBbと可変長
符号化手段36で実際に発生した符号量の差分DFを求
め、割り当て手段20にフィードバックする。
の発生符号量は図15より786ビットであるので、マ
クロブロック単位の目標符号量TMBb=786ビット
との差分値DF DF=786−786=0ビット ・・・(16) が割り当て手段20に対して出力される。
可変長符号化手段36より得られるVLCを復号化して
次に2回目の符号化を行う。
から8個の固定量子化値を選ぶ(図13参照)。この量
子化値は1回目の符号化のときと同じ値である。このと
きの各固定量子化器14での発生符号量は図16のよう
になる。図16において、1番目のマクロブロックと2
番目のマクロブロックで発生符号量が異なっているの
は、1回目の符号化において量子化値が「22」と「1
8」と異なっているからである。
から、N=8個の固定量子化器14のGOP単位の発生
符号量から、このGOP単位の目標符号量TMBの15
20ビットを挟む2つの量子化値を求めると、図14か
ら「18」と「24」となる。
GOP単位の発生符号量から、GOP単位の目標符号量
である1520ビットに対する量子化値Qを直線近似に
よって求める。 Q=18+[(1520−1452)/(1550−1452)] ×(24−18)=22.163 ・・・(17)
マクロブロック単位の発生符号量から、マクロブロック
単位の目標符号量Target-MB(TMB)を、(17)
式で求めた量子化値Q=22.163を用いて直線近似
する。
量は、 TMBa=Target-MB =732+[(22.163−18)/(24−18)] ×(764−732) =754ビット ・・・(18)
量は、 TMBa=Target-MB =720+[(22.163−18)/(24−18)] ×(786−720) =765ビット ・・・(19) (2c)フィードバックスレッショールド値は、1回目
と同じく30ビットの固定値である。
の出力)はTarget-MB=754ビットである。第2の
加算手段28は初期化され、「0」であるので、第1の
加算手段26の出力のフィードバック値も「0」とな
る。したがって、第2の加算手段28では TMBb=TMBa+FB=754+0=754ビット ・・・(20) となり、これがフィードバック制御を行ったときに出力
される目標符号量TMBbとなる。
位での発生符号量が(20)式で求めた754ビットを
越えない量子化値を求める。実際、量子化値とマクロブ
ロック単位の発生量を抜粋すると図17のようになって
いるから、754ビットを越えない量子化値として「2
0」を選択する。
30より得られる量子化値以上の量子化値に対して、マ
クロブロック単位でDCT係数の量子化後の余り(剰
余)の総和を求め、その総和の最大値と最小値の関係か
ら、1回目に符号化された際の量子化値を求める。
で4ビット、総和の最大値は量子化値が「112」のと
きで8167ビットとなる。最大値は最小値の204倍
であるので、1回目の符号化では量子化値「22」が使
用されたものと判断し、量子化値「22」をバックサー
チ手段32の出力とする。
2より出力された量子化値「22」を用いてDCT係数
の量子化を行う。
CT係数から可変長符号を発生させる。また、マクロブ
ロック単位の目標符号量TMBbと可変長符号化手段3
6で実際に発生した符号量の差分DFを求め、割り当て
手段20にフィードバックする。
の発生符号量は図20より734ビットであるので、マ
クロブロック単位の目標符号量TMBb=754ビット
との差分値DF DF=754−734=20ビット ・・・(21) が割り当て手段20にフィードバックされる。
(19)式より、 TMBb2=Target-MB=765ビット ・・・(22) である。第1の加算手段26は(21)式から明らかな
ように1番目のマクロブロックにおけるマクロブロック
単位の目標符号量TMBbと発生符号量との差分値DF
である20ビットとなっている。フィードバックスレッ
ショールドは上述したように30ビットであるので、第
1の加算手段26の出力は20ビットとなる。第1の加
算手段26はフィードバックFBとして20ビットを出
力してしまっているので、結果として「0」となる。第
2の加算手段28では、 TMBb=765+20=785ビット ・・・(23) となり、これがフィードバック制御を行ったときの目標
符号量TMBbとなる。
位での発生符号量が786ビットを越えない量子化値を
求める。実際、量子化値とマクロブロック単位の発生量
を抜粋すると図18のようになっているから、786ビ
ットを越えない量子化値として「20」を選択する。
にQサーチ手段30より得られる量子化値以上の量子化
値に対して、マクロブロック単位でDCT係数の量子化
後の余り(剰余)の総和を求め、その総和の最大値と最
小値の関係から、1回目に符号化された際の量子化値を
求める。
で37ビット、総和の最大値は量子化値が「104」の
ときで851ビットとなる。最大値は最小値の23倍で
あるので、Qサーチ手段30の量子化値出力「20」を
バックサーチ手段32の出力とする。
2より出力された量子化値「20」を用いてDCT係数
の量子化を行う。
CT係数から可変長符号を発生させる。また、マクロブ
ロック単位の目標符号量TMBbと可変長符号化手段3
6で実際に発生した符号量の差分DFを求め、割り当て
手段20にフィードバックする。
の発生符号量は図21より784ビットであるので、マ
クロブロック単位の目標符号量TMBb=785ビット
との差分値 DF=785−784=1ビット ・・・(24) が割り当て手段20に対して出力される。以上の処理で
2回目の符号化が終了する。
うになる。
の符号化と2回目の符号化で量子化値は同じである。し
かし、2番目のマクロブロックについては1回目の符号
化と2回目の符号化で量子化値が異なっている。このこ
とはつまり、符号化/復号化を繰り返すと画質劣化が起
きることを意味している。
ときのSNRと2回目の符号化のときのSNRをマクロ
ブロック単位で計算してみると図20のようになる。同
図は輝度信号Yについての計算例である。
量をコントロールしながら目標符号量を設定する場合に
ついて説明する。上述した説明と重複する説明文が出現
することを断っておく。
適応的なフィードバックスレッショールド値の設定方法
について以下に説明する。
と、そのときの各固定量子化器14での発生符号量は図
14のようになる。
トとする。N=8個の固定量子化器14のGOP単位の
発生符号量から、このGOP単位の目標符号量の152
0ビットを挟む2つの量子化値を求めると、図14から
18と24となる。
GOP単位の発生符号量から、GOP単位の目標符号量
である1520ビットに対する量子化値Qを直線近似に
よって求める。 Q=18+[(1520−1352)/(1572−1352)] ×(24−18)=22.582 ・・・(25A)
マクロブロック単位の発生符号量から、マクロブロック
単位の目標符号量Target-MB(TMB)を、(25
A)式で求めた量子化値Q=22.582を用いて直線
近似する。 Target-MB=TMBa =676+[(22.582−18)/(24−18)] ×(786−676)=760ビット ・・・(25B)
値の算出 フィードバックスレッショールドの値を8個の固定量子
化器14におけるGOP単位での発生符号量から計算に
より算出する。
像が過去に符号化/復号化されているかを調べる。具体
的には、各GOP単位の発生符号量の傾きを計算し、そ
の傾きが単調であるかを調べ、単調であれば過去に符号
化/復号化されていないと判断し、傾きが単調でない場
合にはその入力画像が過去に符号化/復号化されている
と判断する。
で、iは「1」から「7」までである。 GD=α/β ・・・(26) α=(i番目の固定量子化器でのGOP単位の発生符号量 −(i+1)番目の固定量子化器でのGOP単位の発生符号量) ・・・(27) β=((i+1)番目の量子化値−i番目の量子化値) ・・・(28) 実際に傾きGDを計算すると図21のようになり、傾き
は単調であるので判定手段42では過去に符号化/復号
化されていないという判定結果が得られる。
4ではこの判定結果を基づいて8個の固定量子化器14
でのGOP単位の発生符号量からフィードバックスレッ
ショールド値を計算する。
ないと判定されたときには、各マクロブロック間での量
子化値の変動をできるだけ少なくなるようなフィードバ
ックスレッショールド値が算出され、これとは逆に符号
化/復号化されていると判定したときには、バックサー
チ手段32でのバックサーチアルゴリズムによって、最
初に符号化した際の量子化値を見つけられるようなフィ
ードバックスレッショールド値が算出される。フィード
バックスレッショールド値の算出は、以下に示すステッ
プ(4d−1)〜(4d−4)によって求められる。
のGOP単位の発生符号量からGOP単位の目標符号量
1520ビットを挟む2つの量子化値を求める。図22
からも明らかなように、目標符号量を挟む2つの量子化
値として「18」と「24」が選ばれる。
ので、最小量子化幅となる量子化値に対するGOP単位
の発生符号量を、量子化値「18」と「24」でのGO
P単位の発生符号量を利用して直線近似により求める。
化値「20」と「22」が存在し、量子化値「22」に
対するGOP単位の発生符号量の近似値は、以下のよう
になる。 1352+[(24−22)/(24−18)]×(1572−1352) =1425.33 ・・・(29) 量子化値「20」に対するGOP単位の発生符号量の近
似値は、以下のようになる。 1352+[(24−20)/(24−18)]×(1572−1352) =1498.67 ・・・(30)
と、量子化値「20」と「22」に対して上述の近似式
によって求めたGOP単位の発生符号量とから、改めて
GOP単位の目標符号量1520ビットを挟む2つの量
子化値を求めると、その値は上の数値から明らかなよう
に「18」と「20」となる。そのときのGOP単位の
発生符号量はそれぞれ整数化すると、1572ビットと
1499ビットとなる。
の発生符号量からフィードバックスレッショールド値を
計算する。まずUNC,LNCという量を定義する。U
NCはステップ(4d−3)で求めた2つのGOP単位
の発生符号量のうちの目標符号量を越える発生符号量1
572ビットと、GOP単位の目標符号量1520ビッ
トとの差分値を示すものである。
ビットと、ステップ(4d−3)で求めた2つのGOP
単位の発生符号量のうち目標符号量を越えない発生符号
量1499ビットとの差分値であるから、以下のように
なる。 UNC=1572−1520=52ビット ・・・(31) LNC=1520−1499=21ビット ・・・(32)
ド値FBTとしては例えば以下のように選ぶことができ
る。 FBT=min[UNC×(3/8),LNC] ・・・(33) その結果、 以上の計算により、フィードバックコントロール手段6
0から出力されるフィードバックスレッショールド値は
20ビットとなる。
の出力)はTarget-MB=760ビットである。第2の
加算手段28は初期化され、「0」であるので、第1の
加算手段26の出力のフィードバック値も「0」とな
る。したがって、第2の加算手段28では TMBb=TMBa+FB=760+0=760ビット ・・・(35) となり、これがフィードバック制御を行ったときに出力
される目標符号量TMBbとなる。
位での発生符号量が(35)式で求めた760ビットを
越えない量子化値を求める。実際、量子化値とマクロブ
ロック単位の発生量を抜粋すると図15のようになって
いるから、760ビットを越えない量子化値として「2
2」を選択する。
30より得られる量子化値以上の量子化値に対して、マ
クロブロック単位でDCT係数の量子化後の余り(剰
余)の総和を求め、その総和の最大値と最小値の関係か
ら、1回目に符号化された際の量子化値を求める。
で122ビット、総和の最大値は量子化値が「112」
のときで917ビットとなる。最大値は最小値の7.5
2倍であるので、1回目の符号化では量子化値「22」
をバックサーチ手段32の出力とする。
2より出力された量子化値「22」を用いてDCT係数
の量子化を行う。
化されたDCT係数から可変長符号を発生させる。ま
た、マクロブロック単位の目標符号量TMBbと可変長
符号化手段36で実際に発生した符号量の差分DFを求
め、割り当て手段20にフィードバックする。
の発生符号量は図15より734ビットであるので、マ
クロブロック単位の目標符号量TMBb=760ビット
との差分値 DF=760−734=26ビット ・・・(36) が割り当て手段20にフィードバックされる。
ように1番目のマクロブロックにおけるマクロブロック
単位の目標符号量TMBbと発生符号量との差分値DF
である26ビットとなっている。算出されたフィードバ
ックスレッショールド値は上述したように20ビットで
あるので、第1の加算手段26の出力は20ビットとな
る。第1の加算手段26はフィードバックFBとして2
0ビットを出力してしまっているので、結果として
「6」ビットとなる。第2の加算手段28では、 TMBb=760+20=780ビット ・・・(38) となり、これがフィードバック制御を行ったときの目標
符号量TMBbとなる。
位での発生符号量が780ビットを越えない量子化値を
求める。実際、量子化値とマクロブロック単位の発生量
を抜粋すると図23のようになっているから、780ビ
ットを越えない量子化値として「20」を選択する。
にQサーチ手段30より得られる量子化値以上の量子化
値に対して、マクロブロック単位でDCT係数の量子化
後の余り(剰余)の総和を求め、その総和の最大値と最
小値の関係から、1回目に符号化された際の量子化値を
求める。
で97ビット、総和の最大値は量子化値が「112」の
ときで917ビットとなる。最大値は最小値の9.45
倍であるので、Qサーチ手段30からの量子化値「2
0」をバックサーチ手段32の出力とする。
2より出力された量子化値「20」を用いてDCT係数
の量子化を行う。
CT係数から可変長符号を発生させる。また、マクロブ
ロック単位の目標符号量TMBbと可変長符号化手段3
6で実際に発生した符号量の差分DFを求め、割り当て
手段20にフィードバックする。
の発生符号量は図23より766ビットであるので、マ
クロブロック単位の目標符号量TMBb=780ビット
との差分値 DF=780−766=14ビット ・・・(39) が割り当て手段20に対して出力される。以上の処理で
1回目の符号化が終了する。可変長符号化手段36より
得られるVLCを復号化して次に2回目の符号化を行
う。
から8個の固定量子化値を選ぶ(図13参照)。この量
子化値は1回目の符号化のときと同じ値である。このと
きの各固定量子化器14での発生符号量は図24のよう
になる。図24において、1番目のマクロブロックと2
番目のマクロブロックで発生符号量が異なっているの
は、1回目の符号化において量子化値が「22」と「2
0」と異なっているからである。
から、N=8個の固定量子化器14のGOP単位の発生
符号量から、このGOP単位の目標符号量TMBの15
20ビットを挟む2つの量子化値を求めると、図24か
ら量子化値は「18」と「24」となる。この2つの量
子化値「18」と「24」のGOP単位の発生符号量か
ら、GOP単位の目標符号量である1520ビットに対
する量子化値Qを直線近似によって求める。 Q=18+[(1520−1482)/(1534−1482)] ×(24−18)=22.385 ・・・(40)
マクロブロック単位の発生符号量から、マクロブロック
単位の目標符号量Target-MB(TMB)を、(40)
式で求めた量子化値Q=22.385を用いて直線近似
する。
量は、 TMBa=Target-MB =732+[(22.385−18)/(24−18)] ×(764−732) =755ビット ・・・(41)
量は、 TMBa=Target-MB =750+[(22.385−18)/(24−18)] ×(770−750) =764ビット ・・・(42)
値の算出 フィードバックスレッショールド値は、GOP単位での
発生符号量から計算による求めることになる。1回目の
符号化と同様に、まず始めに、判定手段42において入
力画像が過去に符号化/復号化されているかを調べる。
具体的には、各GOP単位の発生符号量の傾きを計算
し、その傾きが単調であるかを調べ、単調であれば過去
に符号化/復号化されていないと判断し、傾きが単調で
ない場合にはその入力画像が過去に符号化/復号化され
ていると判断する。
で、iは「1」から「7」までである。 GD=α/β ・・・(43) α=(i番目の固定量子化器でのGOP単位の発生符号量 −(i+1)番目の固定量子化器でのGOP単位の発生符号量) ・・・(44) β=((i+1)番目の量子化値−i番目の量子化値) ・・・(45)
になり、傾きは単調ではないので、判定手段42では過
去に符号化/復号化されているという判定結果が得られ
る。次に、フィードバックコントロール手段44ではこ
の判定結果を基づいて8個の固定量子化器14でのGO
P単位の発生符号量からフィードバックスレッショール
ド値を計算する。これは以下に示すステップ(6d−
1)〜(6d−4)によって求められる。
のGOP単位の発生符号量からGOP単位の目標符号量
1520ビットを越える最小の発生符号量を求める。図
26から量子化値が「18」であるときの発生符号量1
534ビットが選ばれる。
発生符号量からフィードバックスレッショールド値を計
算する。そのために、UCという量を定義する。UCは
ステップ(6d−1)で求めたGOP単位の発生符号量
を越える発生符号量と、GOP単位の目標符号量との差
分値を示すものである。 UC=1534−1520=14ビット ・・・(46)
ド値FBTとしては例えば以下のように選ぶことができ
る。 FBT=5+UC×(3/4) ・・・(47) その結果、 以上の計算により、フィードバックスレッショールド値
は16ビットとなる。
の出力)はTarget-MB=755ビットである。第2の
加算手段28は初期化され、「0」であるので、第1の
加算手段26の出力のフィードバック値も「0」とな
る。したがって、第2の加算手段28では TMBb=TMBa+FBT=755+0=755ビット ・・・(49) となり、これがフィードバック制御を行ったときに出力
される目標符号量TMBbとなる。
位での発生符号量が(49)式で求めた755ビットを
越えない量子化値を求める。実際、量子化値とマクロブ
ロック単位の発生量を抜粋すると図27のようになって
いるから、755ビットを越えない量子化値として「2
0」を選択する。
30より得られる量子化値以上の量子化値に対して、マ
クロブロック単位でDCT係数の量子化後の余り(剰
余)の総和を求め、その総和の最大値と最小値の関係か
ら、1回目に符号化された際の量子化値を求める。
で4ビット、総和の最大値は量子化値が「112」のと
きで816ビットとなる。最大値は最小値の204倍で
ある値「22」をバックサーチ手段32の出力とする。
より出力された量子化値「22」を用いてDCT係数の
量子化を行う。
CT係数から可変長符号を発生させる。また、マクロブ
ロック単位の目標符号量TMBbと可変長符号化手段3
6で実際に発生した符号量の差分DFを求め、割り当て
手段20にフィードバックする。
の発生符号量は図27より734ビットであるので、マ
クロブロック単位の目標符号量TMBb=755ビット
との差分値DF DF=755−734=21ビット ・・・(50) が割り当て手段20にフィードバックされる。
ように1番目のマクロブロックにおけるマクロブロック
単位の目標符号量TMBbと発生符号量との差分値DF
である21ビットとなっている。算出されたフィードバ
ックスレッショールド値は上述したように16ビットで
あるので、第1の加算手段26の出力は16ビットとな
る。第1の加算手段26はフィードバックスレッショー
ルド値FBTとして16ビットを出力してしまっている
ので、結果として「5」ビットとなる。第2の加算手段
28では、 TMBb=764+16=780ビット ・・・(52) となり、これがフィードバック制御を行ったときの目標
符号量TMBbとなる。
位での発生符号量が780ビットを越えない量子化値を
求める。実際、量子化値とマクロブロック単位の発生量
を抜粋すると図28のようになっているから、780ビ
ットを越えない量子化値として「18」を選択する。
にQサーチ手段30より得られる量子化値以上の量子化
値に対して、マクロブロック単位でDCT係数の量子化
後の余り(剰余)の総和を求め、その総和の最大値と最
小値の関係から、1回目に符号化された際の量子化値を
求める。
で4ビット、総和の最大値は量子化値が「112」のと
きで780ビットとなる。最大値は最小値の195倍で
あるので、Qサーチ手段30からの量子化値「20」を
バックサーチ手段32の出力とする。
2より出力された量子化値「20」を用いてDCT係数
の量子化を行う。可変長符号化手段36では量子化され
たDCT係数から可変長符号を発生させる。また、マク
ロブロック単位の目標符号量TMBbと可変長符号化手
段36で実際に発生した符号量の差分DFを求め、割り
当て手段20にフィードバックする。
の発生符号量は図28より766ビットであるので、マ
クロブロック単位の目標符号量TMBb=780ビット
との差分値 DF=780−766=14ビット ・・・(53) が割り当て手段20に対して出力される。以上の処理で
2回目の符号化が終了する。
うになる。
目のマクロブロックに対する量子化値の差は、本発明の
場合には2(=22−20)である。これに対して図1
9のように従来の方法では4(=22−18)となる。
したがって本発明方法による場合の方が量子化値の安定
化を図ることができる。
マクロブロックにおいてそれぞれ1回目の符号化と2回
目の符号化で量子化値が同じになる。これによって符号
化と復号化とを繰り返しても量子化値の再現性が保つこ
とができるから、従来の方法に比べて画質劣化が起きに
くいことを意味する。
回目のSNRをマクロブロック単位で計算してみると、
輝度信号Yに関して図30のような結果が得られた。従
来例を示す図20と比較すれば明らかなように、2回目
の符号化では本発明の方がSNRが改善されていること
が判る。
上述したようにフィードバックスレッショールド値とし
て従来では固定値(例えば30)を使用していたことに
他ならない。換言すれば、従来例では入力画像の性質を
考慮していないので、マクロブロック単位での目標符号
量と実際の発生符号量との差分の、GOP単位の加算結
果が、フィードバックスレッショールド値以下になる場
合がある。そのためにフィードバック量がマクロブロッ
ク単位で大きく変動してしまう。このフィードバック量
の大きな変動が、第2の加算手段28で加算されたマク
ロブロック単位の目標符号量FBTに反映されてしまう
ために、その結果として量子化値の大きな変動を引き起
こすことになる。
化で量子化値が大きく変動しているので、マクロブロッ
ク単位の目標符号量が、1回目の符号化での発生符号量
を下回り、バックサーチ手段32において1回目の量子
化値を探すことができなくなってしまい、量子化値の再
現性が保たれなくなる。これにより画質の劣化が生じて
しまう。
OP単位の発生符号量からフィードバックスレッショー
ルド値を計算する。これによりマクロブロック単位での
目標符号量と実際の発生符号量との差分の、GOP単位
の加算結果が、フィードバックスレッショールド値より
上回るようになる。これによって、フィードバック量が
マクロブロック単位で変動することなく、フィードバッ
クスレッショールド値がほぼ一定値に抑えられる。この
ようにフィードバック量がほとんど変動することがない
ので、量子化値の変動を抑えることができる。
化で量子化値がほとんど変動していないので、マクロブ
ロック単位の目標符号量が1回目の符号化での発生符号
量を上回る。そのためにバックサーチ手段32において
1回目の量子化値を探すことができ、量子化値の再現性
が保たれる。以上の処理によって画質の劣化を防ぐこと
ができる。
から入力画像データが既に符号化/復号化されているか
どうかを判定できると説明した。以下にその理由を説明
する。説明を簡単にするため発生符号量ではなく、量子
化後のDCT係数の値にとどめる。
1)というDCT係数が得られたとする。1回目の符号
化での量子化を10で行なうものとする。量子化を行な
うと(0.2,0.5,0.8,1.0,1.4,2.
1)となり、四捨五入が行なわれ量子化後の値として
(0,1,1,1,1,2)が得られる。これを量子化
と同じ値10で逆量子化した場合には(0,10,1
0,10,10,20)となる。
0)に対して2回目の符号化での量子化について考え
る。まず、1回目の符号化と同じ量子化値10を使い量
子化を行なうと、(0.0,1.0,1.0,1.0,
1.0,2.0)となり、四捨五入後(0,1,1,
1,1,2)となる。逆量子化を10で行なうと(0,
10,10,10,10,20)となる。また、2回目
の符号化で1回目の符号化と同じ量子化値10ではな
く、12で量子化することを考える。このときは、
(0.0,5/6,5/6,5/6,5/3)となり、
四捨五入後(0,1,1,1,1,2)となることがわ
かる。逆量子化を行なうと(0,12,12,12,1
2,24)となる。
逆量子化後の値(0,10,10,10,10,20)
は12で量子化した場合のそれ(0,12,12,1
2,12,24)と明らかに違うが、発生符号量という
観点から注目した場合には、10,12での量子化での
差はなく、共に(0,1,1,1,1,2)となること
がわかる。量子化後の値が同じということは、発生符号
量が同じになるということである。つまり、2nd g
en.での量子化で10で量子化しようが12で量子化
しようが同じ発生符号量になることがわかる。
同様のことが言えない。実際、上記の例題で1回目の符
号化で12で量子化した場合には(1/6,5/12,
2/3,5/6,7/6,7/4)となり、四捨五入を
すると(0,0,1,1,1,2)となり、10で量子
化した場合のそれ(0,1,1,1,1,2)とは異な
り、発生符号量も変わってしまう。
号量と、一度量子化をされた2回目の符号化での発生符
号量には大きな違いがある。どのような条件で2回目の
符号化以降の発生符号量が同じになるかを次に説明す
る。
い換えると、ある量子化値Qで量子化した際に1となる
場合である。1となるのは、量子化後の四捨五入を考え
ると0.5以上1.5未満である必要がある。つまり、
ある量子化値Pでの結果が0.5以上1.5未満となる
量子化値Pの範囲が2回目の符号化以降で発生符号量が
同じになる量子化の範囲になる。 1/2<=(Q/P)<3/2 ・・・(54) 2Q/3<P<=2Q ・・・(55) の範囲の量子化Pを使えば、量子化Qでの発生符号量と
同じになる。
い換えると、ある量子化値Qで量子化した際に2となる
場合である。2となるのは、量子化後の四捨五入を考え
ると1.5以上2.5未満である必要がある。つまり、
ある量子化値Pでの結果が1.5以上2.5未満となる
量子化値Pの範囲が2回目の符号化以降で発生符号量が
同じになる量子化の範囲になる。 3/2<=(2Q/P)<5/2 ・・・(56) 4Q/5<P<=4Q/3 ・・・(57) の範囲の量子化Pを使えば、量子化Qでの発生符号量と
同じになる。
の場合について発生符号量が同じになる量子化の範囲を
計算することができる。そして、発生符号量が同じにな
ると言うことは、量子化値を横軸と発生符号量を縦軸と
してグラフを描いた場合、平坦な部分があることを意味
する。よって、この平坦な部分があるかないか、つまり
単調に変化しているか否かを判定することにより、その
画像が1回目の符号化であるのか、2回目の符号化であ
るのかを判別できることになる。
ち上記のような完全に平坦な部分が表れることはまずな
い。しかしながら、各量子化値間での傾きを求めると、
その傾きが連続(単調)ではない部分が表れるの、この
傾きによって1回目の符号化か2回目の符号化であるか
を判別できるものである。
変形例を以下に示す。
OPを用いたが、特にGOPである必要はない。最小の
処理単位であるマクロブロック単位のN倍(N>1)を
目標符号量の単位とした場合でも本発明は有効である。
ただし、この場合フィードバックスレッショールド値の
計算の単位としては目標符号量の単位を上回ることはで
きない。
算の単位としてGOPを用いていたが、GOPを用いた
場合には、厳密にはマクロブロック単位に見ると符号化
/復号化の場合必ずしも量子化値が安定しているわけで
はない。
でのフィードバックスレッショールドの計算をマクロブ
ロック単位のN倍(N>=1)にするとよい。例えば、
N=1の場合には図9のようにフィードバックコントロ
ール手段60としてマクロブロックの発生符号量を利用
すればよい。
GOP単位での目標符号量がマクロブロック単位での目
標符号量になり、GOP単位での目標符号量を挟む2個
の固定量子化器のGOP単位の発生符号量がマクロブロ
ック単位での目標符号量を挟む2個の固定量子化器のマ
クロブロック単位の発生符号量に置き換えるだけで良
い。
アクテビティ(Activty)制御がある。これは、画面上
で例えば空のような平坦な部分でのブロックノイズを防
ぐために、このようなマクロブロックに対しては量子化
値を小さくし、複雑な部分、例えばランダムノイズのよ
うな劣化がわかりにくいマクロブロックに対しては量子
化値を大きくする。このようなことを行なうことで、画
質の改善が計れる。
合、N個の固定量子化器で、各マクロブロック単位でそ
れぞれ固定の量子化値(FixQ(i),i=1,・・・,
N)を使わなくなり、それぞれの固定の量子化値に対し
てアクテビティ制御を行なったことによる変動分が加わ
った量子化値を用いることになる。
を行なった場合に対しても、アクテビティ制御を行なっ
てないものとして計算アルゴリズムを適用することで、
マクロブロック単位での量子化値の変動分をアクテビテ
ィ制御による変動分に抑えることが可能である。
る量子化値の変動をそのままにし、アクテビティ制御に
かからない部分の量子化値の安定化が行なえる。また、
符号化/復号化における量子化値の再現性も行なえる。
用した符号化装置では、符号量予測のための複数の固定
量子化器での発生符号量の結果から、入力データが、過
去に符号化/復号化されているかを自動判定し、その判
定結果から符号化/復号化されていない場合には、入力
データの性質に依存したフィードバック制御を行い、符
号化/復号化されている場合には、再現性を重視したフ
ィードバック制御を行うようにしたものである。
より近付けることができるようになり、これによって量
子化値の安定化が図られると共に、符号化/復号化を繰
り返しても画質の劣化を防止でき、さらに画質の安定化
を図ることができるなどの特徴を有する。
像データ圧縮符号化装置に適用して極めて好適である。
置の一実施形態を示す要部の系統図である。
統図である。
トである。
ャートである。
定するための一例を示すフローチャートである。
定するための一例を示すフローチャートである。
系統図である。
る。
ある。
ある。
である。
の関係を示す図である。
14の抜粋図である。
の関係を示す図である。
16の抜粋図である。
の関係を示す図である。
を示す図である。
の関係を示す図である。
22の抜粋図である。
図である。
の関係を示す図である。
26の抜粋図である。
26の抜粋図である。
を示す図である。
統図である。
段、14・・・固定量子化手段、16・・・発生符号量
算出手段、18,20・・・目標符号量割り当て手段、
22・・・補間手段、24・・・目標符号量割り当て
器、26・・・第1の加算手段、28・・・第2の加算
手段、36・・・VLC、50・・・判定手段、60・
・・フィードバックコントロール手段
Claims (6)
- 【請求項1】 所定の符号化処理単位に対して予め決め
られた目標符号量以内に各符号化処理単位での発生符号
量を抑えなければならない符号化方法において、 発生符号量と目標符号量との差分値を目標符号量割り当
て手段にフィードバックして、入力データが過去に符号
化/復号化されているかを自動判定し、 その判定結果に基づいて上記目標符号量に加算するフィ
ードバックスレッショールド量を決定することによっ
て、発生符号量を目標符号量に近づけるようにしたこと
を特徴とする符号化方法。 - 【請求項2】 符号化/復号化されていない場合には、
入力データの性質に依存したフィードバック制御を行
い、 符号化/復号化されている場合には、再現性を重視した
フィードバック制御を行うようにしたことを特徴とする
請求項1記載の符号化方法。 - 【請求項3】 上記符号化はMPEG2であって、その
符号化処理単位はGOPであることを特徴とする請求項
1記載の符号化方法。 - 【請求項4】 入力データを圧縮符号化するに際し、実
際に発生する発生符号量を目標符号量に近づける目標符
号量割り当て手段を有する符号化装置において、 N(Nは整数)個の固定量子化器でのGOP単位の発生
符号量の結果から、入力データが過去に符号化/復号化
されたものであるかを自動判定する判定手段と、 上記N個の固定量子化器でのGOP単位の発生符号量の
結果と、上記判定結果を用いて、上記入力データの性質
を推定し、その推定結果から上記目標符号量に加えるフ
ィードバックスレッショールド値を算出するフィードバ
ックコントロール手段とを有することを特徴とする符号
化装置。 - 【請求項5】 上記入力データはDCT係数に変換され
たあとGOP単位およびマクロブロック単位で発生符号
量と目標符号量が求められるようになされたことを特徴
とする請求項4記載の符号化装置。 - 【請求項6】 上記判定手段では、符号化/復号化され
ているとの判定結果が得られたときには、上記N個の固
定量子化器からのGOP単位の発生符号量を用いて、各
マクロブロック間での量子化値の変動が少なくなるよう
なフィードバックスレッショールド値に設定され、 符号化/復号化されているとの判定結果が得られたとき
には、バックサーチアルゴリズムが最初に符号化した際
の量子化値を見つけられるような再現性を重視したフィ
ードバックスレッショールド値に設定されるようになさ
れたことを特徴とする請求項4記載の符号化装置。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP13890697A JP3978810B2 (ja) | 1997-05-28 | 1997-05-28 | 符号化方法およびこれを使用した符号化装置 |
| PCT/JP1998/002245 WO1998054904A1 (fr) | 1997-05-28 | 1998-05-22 | Procede de codage et dispositif de codage utilisant ledit procede |
| US09/237,697 US6023297A (en) | 1997-05-28 | 1999-01-26 | Encoding method and encoder using it |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP13890697A JP3978810B2 (ja) | 1997-05-28 | 1997-05-28 | 符号化方法およびこれを使用した符号化装置 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JPH10336652A true JPH10336652A (ja) | 1998-12-18 |
| JPH10336652A5 JPH10336652A5 (ja) | 2005-03-17 |
| JP3978810B2 JP3978810B2 (ja) | 2007-09-19 |
Family
ID=15232908
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP13890697A Expired - Lifetime JP3978810B2 (ja) | 1997-05-28 | 1997-05-28 | 符号化方法およびこれを使用した符号化装置 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US6023297A (ja) |
| JP (1) | JP3978810B2 (ja) |
| WO (1) | WO1998054904A1 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6904227B1 (en) | 1999-02-15 | 2005-06-07 | Nec Corporation | Device and method for editing video and/or audio data recorded in a disc storage medium |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8374237B2 (en) | 2001-03-02 | 2013-02-12 | Dolby Laboratories Licensing Corporation | High precision encoding and decoding of video images |
| US7003167B2 (en) * | 2001-11-01 | 2006-02-21 | Hewlett-Packard Development Company, L.P. | Single-pass guaranteed-fit data compression using rate feedback |
| US7751633B1 (en) | 2006-08-31 | 2010-07-06 | Hewlett-Packard Development Company, L.P. | Method for compressing an image |
| JP4569840B2 (ja) * | 2007-09-12 | 2010-10-27 | ソニー株式会社 | 画像符号化装置、画像符号化方法 |
| CN101785318B (zh) * | 2008-06-27 | 2012-12-12 | 索尼公司 | 图像处理装置和图像处理方法 |
| CN101779468B (zh) * | 2008-06-27 | 2012-07-04 | 索尼公司 | 图像处理装置和图像处理方法 |
| CN107749989B (zh) * | 2017-10-17 | 2019-11-05 | 西安万像电子科技有限公司 | 图像的编码方法和装置 |
Family Cites Families (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2952000B2 (ja) * | 1990-04-19 | 1999-09-20 | オリンパス光学工業株式会社 | 画像データの符号化装置および符号化方法 |
| US5291282A (en) * | 1990-04-19 | 1994-03-01 | Olympus Optical Co., Ltd. | Image data coding apparatus and method capable of controlling amount of codes |
| JP3143487B2 (ja) * | 1991-04-17 | 2001-03-07 | キヤノン株式会社 | 画像処理装置 |
| JP3187852B2 (ja) * | 1991-02-08 | 2001-07-16 | ソニー株式会社 | 高能率符号化方法 |
| JPH05236465A (ja) * | 1992-02-24 | 1993-09-10 | Sony Corp | ビデオ信号の伝送方法 |
| JP2734905B2 (ja) * | 1992-10-07 | 1998-04-02 | 日本電気株式会社 | 画像符号化装置 |
| JP2968666B2 (ja) * | 1993-06-10 | 1999-10-25 | 日本電気株式会社 | 画像符号化方法および装置 |
| JPH07203430A (ja) * | 1993-12-28 | 1995-08-04 | Sharp Corp | 画像符号化装置 |
| JPH07312754A (ja) * | 1994-05-19 | 1995-11-28 | Mitsubishi Electric Corp | 動画像符号化装置 |
| JP3050047B2 (ja) * | 1994-06-24 | 2000-06-05 | 日本ビクター株式会社 | 動画像符号化装置及び動画像符号化方法 |
| JP3543412B2 (ja) * | 1995-04-05 | 2004-07-14 | 富士ゼロックス株式会社 | 画像符号化装置 |
| JP2907063B2 (ja) * | 1995-05-24 | 1999-06-21 | 日本ビクター株式会社 | 総符号量制御を行なう動画像符号化装置 |
| JPH0965332A (ja) * | 1995-08-23 | 1997-03-07 | Sony Corp | 画像符号化装置とその方法 |
| US5926222A (en) * | 1995-09-28 | 1999-07-20 | Intel Corporation | Bitrate estimator for selecting quantization levels for image encoding |
| JPH09107293A (ja) * | 1995-10-12 | 1997-04-22 | Casio Comput Co Ltd | 符号量制御方法、及びその装置 |
| JPH09120802A (ja) * | 1995-10-26 | 1997-05-06 | Toshiba Battery Co Ltd | マンガン乾電池 |
-
1997
- 1997-05-28 JP JP13890697A patent/JP3978810B2/ja not_active Expired - Lifetime
-
1998
- 1998-05-22 WO PCT/JP1998/002245 patent/WO1998054904A1/ja not_active Ceased
-
1999
- 1999-01-26 US US09/237,697 patent/US6023297A/en not_active Expired - Fee Related
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6904227B1 (en) | 1999-02-15 | 2005-06-07 | Nec Corporation | Device and method for editing video and/or audio data recorded in a disc storage medium |
Also Published As
| Publication number | Publication date |
|---|---|
| WO1998054904A1 (fr) | 1998-12-03 |
| US6023297A (en) | 2000-02-08 |
| JP3978810B2 (ja) | 2007-09-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0535960B1 (en) | Coding signal processor | |
| US5959675A (en) | Image compression coding apparatus having multiple kinds of coefficient weights | |
| US5598213A (en) | Transmission bit-rate controlling apparatus for high efficiency coding of moving picture signal | |
| US5892548A (en) | Adaptive quantizer with modification of high frequency coefficients | |
| US7388995B2 (en) | Quantization matrix adjusting method for avoiding underflow of data | |
| US7460597B2 (en) | Encoding apparatus and method | |
| EP0861003B1 (en) | Code-amount control device and video coding device including the code-amount control device | |
| US20050152450A1 (en) | Coding apparatus and method, program, and recording medium | |
| US7925108B2 (en) | Encoding device and dynamic image recording system having the encoding device | |
| KR0162203B1 (ko) | 양자화스텝사이즈의 가변을 이용한 적응적 부호화방법 및 그 장치 | |
| JPH09200758A (ja) | 画像符号化装置 | |
| JPH10336652A (ja) | 符号化方法およびこれを使用した符号化装置 | |
| EP0720375B1 (en) | Quantizing apparatus and quantizing method | |
| US7965768B2 (en) | Video signal encoding apparatus and computer readable medium with quantization control | |
| JP3069144B2 (ja) | 動画像符号化装置 | |
| JPH07203430A (ja) | 画像符号化装置 | |
| JPH09149412A (ja) | ビデオデータ圧縮方式 | |
| US6266447B1 (en) | Coding apparatus | |
| EP1220546A2 (en) | Quantization step setting apparatus, quantization step setting method, coding apparatus, coding method, and information record medium | |
| JP3200518B2 (ja) | 画像信号符号化装置 | |
| US7606436B2 (en) | Image encoding apparatus and quantization control method | |
| US7391916B2 (en) | Quantization matrix adjusting method for quality improvement | |
| JP3013602B2 (ja) | 映像信号符号化装置 | |
| JPH05219496A (ja) | 画像符号化装置及び動画像符号化装置 | |
| KR0128877B1 (ko) | 동영상 부호화 시스템에서 양자화기의 대표값 결정 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040412 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040412 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060316 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060704 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060904 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070313 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070511 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070605 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070618 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100706 Year of fee payment: 3 |