JPH10164574A

JPH10164574A - ビデオ圧縮

Info

Publication number: JPH10164574A
Application number: JP9315588A
Authority: JP
Inventors: Rian Jii; リアンジー
Original assignee: Texas Instruments Inc
Current assignee: Texas Instruments Inc
Priority date: 1996-11-15
Filing date: 1997-11-17
Publication date: 1998-06-19
Also published as: EP0848557A3; EP0848557A2

Abstract

(57)【要約】【課題】ビデオ圧縮および圧縮解除を行うための、画
像の効率的な低ビットレートのエンコード方法を提供す
る。【解決手段】画像をローパスフィルタリングおよびハ
イパスフィルタリングにより、階層に従って区分された
サブバンドへ分解し、それに続いて、最高レベルのロー
パス画像の独立した（ＤＰＣＭなどによる）コーディン
グと高バンドのゼロツリーコーディングとを併せて用い
ることにより、ビデオ圧縮および圧縮解除を行うための
画像のエンコーディングを行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、電子ビデオ方法お
よび装置に関し、特に、圧縮されたビデオを用いるディ
ジタル通信および記憶システムに関する。

【０００２】

【従来の技術】ビデオ通信（テレビジョンやテレビ会議
など）は、典型的には、オーディオと共にビデオフレー
ム（ピクチャー，画像）のストリームをリアルタイムで
視聴または記憶のために送信チャネルを介して送信す
る。しかし、送信チャネルは、妨害雑音をしばしば与
え、かつ、制限された帯域幅を有する。従って、圧縮を
行うディジタルビデオ送信が広く用いられている。特
に、ディジタルビデオの圧縮のためにはさまざまな規格
が現れ、それらには、Ｈ．２６１，ＭＰＥＧ−１および
ＭＰＥＧ−２が含まれ、発展中のＨ．２６３およびＭＰ
ＥＧ−４を含むもっと多くのものが続こうとしている。
同様のオーディオ圧縮方法がある。

【０００３】テカルプ（Ｔｅｋａｌｐ）著，「ディジタ
ルビデオ処理（ＤｉｇｉｔａｌＶｉｄｅｏＰｒｏｃ
ｅｓｓｉｎｇ）」，（プレンティス・ホール（Ｐｒｅｎ
ｔｉｃｅＨａｌｌ）１９９５年），クラーク（ｃｌａ
ｒｋｅ）著，「静止画およびビデオのディジタル圧
縮」，（アカデミックプレス１９９５年）およびシェ
イファ（Ｓｃｈａｆｅｒ）ら著，「ディジタルビデオコ
ーディング規格およびビデオ通信におけるそれらの役割
（ＤｉｇｉｔａｌＶｉｄｅｏＣｏｄｉｎｇＳｔａ
ｎｄａｒｄｓａｎｄＴｈｅｉｒＲｏｌｅｉｎ
ＶｉｄｅｏＣｏｍｍｕｎｉｃａｔｉｏｎｓ）」，８３
Ｐｒｏｃ．ＩＥＥＥ９０７（１９９５年）には、
Ｈ．２６１，ＭＰＥＧ−１およびＭＰＥＧ−２規格と
Ｈ．２６３勧告およびＭＰＥＧ−４の所望の機能性の表
示との記述が含まれている。これらの参考文献および引
用されている全ての他の参考文献は、ここで参照してそ
の内容を本願に取り込むこととする。

【０００４】Ｈ．２６１圧縮は、時間的冗長性を低減す
るためにフレーム間予測を用い、また、空間的冗長性を
低減するために高い空間的周波数のカットオフと共にブ
ロックレベルにおける離散的コサイン変換（ＤＣＴ）を
用いる。Ｈ．２６１は、６４Ｋｂｐｓ（キロビット毎
秒）乃至２Ｍｂｐｓ（メガビット毎秒）の倍数の伝送速
度用として勧告されている。

【０００５】Ｈ．２６３の勧告はＨ．２６１に類似して
いるが、約２２Ｋｂｐｓ（撚り対電話線とコンパチブ
ル）のビットレートのためのものであり、多くの計算と
１６×１６マクロブロックおよび８×８ブロックによる
動き補償間の適応性スイッチングとを負担することによ
り、高密度の動きフィールド（動きベクトルの集合）を
得るための半ピクセル精度での動き予測（これはＨ．２
６１において利用されるループフィルタリングを不必要
にする）およびオーバラップ動き補償を行う。

【０００６】ＭＰＥＧ−１およびＭＰＥＧ−２はまた、
時間的予測を用い、それに続いてＨ．２６１のようにブ
ロックレベルにおける２次元ＤＣＴ変換を行うが、それ
らはさらに、動き補償予測と補間とフレーム間コーディ
ングとのさまざまな組合せをさらに用いる。ＭＰＥＧ−
１は、ビデオＣＤを目標としており、約３６０ピクセル
×２４０ラインのフレームおよび２４乃至３０フレーム
毎秒に対して約１乃至１．５Ｍｂｐｓレートにおいて良
好に動作する。ＭＰＥＧ−１は、Ｉ，ＰおよびＢフレー
ムを定めており、Ｉフレームはイントラフレームであ
り、Ｐフレームは前のＩまたはＰフレームからの動き補
償予測を用いてコーディングされたものであり、Ｂフレ
ームは隣接するＩおよびＰフレームからの動き補償双方
向予測／補間を用いたものである。

【０００７】ＭＰＥＧ−２はディジタルテレビジョン
（７２０ピクセル×４８０ライン）を目標としており、
Ｉ，ＰおよびＢフレームと追加されたスケーラビリティ
とによるＭＰＥＧ−１形動き補償を行い、約１０Ｍｂｐ
ｓに達するビットレートを用いる（低解像度の画像を送
信するためには低ビットレートが抽出され得る）。

【０００８】しかし、上述のＭＰＥＧの圧縮方法は、極
めて低いビットレートにおいて動作する時には、ブロッ
ク性および不自然な対象の運動のような、いくつかの受
け入れえないアーティファクトを生じる。これらの技術
は、ブロックレベルにおける信号の統計的依存性のみを
用い、ビデオストリームの意味内容を考慮しないので、
極めて低いビットレート（高量子化因子）のもとではブ
ロック境界にアーティファクトが導入される。通常は、
これらのブロック境界は運動対象の物理的境界に対応し
ていないので、視覚的に邪魔なアーティファクトを生じ
る。制限された帯域幅がフレームレートを強制的に滑ら
かな運動に必要なフレームレートより低く抑える時に
は、不自然な動きが発生する。

【０００９】ＭＰＥＧ−４は、１０Ｋｂｐｓ乃至１Ｍｂ
ｐｓの送信ビットレートを適用し、スケーラビリティ，
内容に基づく操作，エラー傾向のある環境における堅牢
性，マルチメディアデータアクセスツール，改善された
コーディング効率，グラフィックスおよびビデオの双方
をエンコードする能力および改善されたランダムアクセ
スなどの機能性による、内容に基づくコーディングアプ
ローチを用いる。ビデオコーディングスキームは、もし
コーディングされる同時的な対象の数および／または品
質を変化させ得れば、内容スケーラブルであると考えら
れる。対象スケーラビリティは、コーディングされる同
時的な対象の数の制御に関し、品質スケーラビリティ
は、コーディングされる対象の空間的および／または時
間的解像度の制御に関する。スケーラビリティは、制限
された帯域幅の送信チャネルと帯域幅が動的であるチャ
ネルとを介して動作するビデオコーディング方法の重要
な特徴である。例えば、内容スケーラブルビデオコーダ
は、シーン内の重要な対象のみを高品質でエンコードし
て送信することにより、制限された帯域幅によるパフォ
ーマンスを最適化する能力を有する。それは次に、残余
の対象を省略するかまたは著しく低い品質でコーディン
グするかを選択し得る。チャネルの帯域幅が増加する
と、コーダは追加のビットを送信して、劣ったコーディ
ングを行った対象の品質を改善し、あるいは失われた対
象を再生することができる。

【００１０】Ｉフレームのコーディングに関しては、シ
ャピロ（Ｓｈａｐｉｒｏ）著，「ウェーブレット係数の
ゼロツリーを用いた埋込み形画像コーディング（Ｅｍｂ
ｅｄｄｅｄＩｍａｇｅＣｏｄｉｎｇＵｓｉｎｇ
ＺｅｒｏｔｒｅｅｓｏｆＷａｖｅｌｅｔＣｏｅｆｆ
ｉｃｉｅｎｔｓ）」，４１ＩＥＥＥＴｒ．Ｓｉｇ．
Ｐｒｏｃ３４４５（１９９３年）が、異なるスケール
におけるウェーブレット係数をグループ化し、かつスケ
ールと交差するゼロを予測する、ウェーブレット階層サ
ブバンドへの分解を記載している。これは、低ビットレ
ートのビットストリームが高ビットレートのビットスト
リーム内に埋込まれているという意味で、完全に埋込ま
れたビットストリームを与える。

【００１１】ビラセナー（Ｖｉｌｌａｓｅｎｏｒ）ら
著，「画像圧縮のためのウェーブレットフィルタ評価
（ＷａｖｅｌｅｔＦｉｌｔｅｒＥｖａｌｕａｔｉｏ
ｎｆｏｒＩｍａｇｅＣｏｍｐｒｅｓｓｉｏ
ｎ）」，４ＩＥＥＥＴｒ．ＩｍａｇｅＰｒｏｃ．
１０５３（１９９５年）は、さまざまなマザーウェーブ
レットを用いるウェーブレットサブバンドへの分解を論
じている。しかし、低ビットレートにおけるもっと効率
的なコーディングが、問題として残る。

【００１２】Ｈ．２６１，ＭＰＥＧ−１およびＭＰＥＧ
−２の圧縮および圧縮解除（伸長）のハードウェアおよ
びソフトウェア・インプリメンテーションは存在する。
さらに、適切なソフトウェアを実行する、ウルトラスパ
ーク（Ｕｌｔｒａｓｐａｒｃ）またはＴＭＳ３２０Ｃ８
０のようなプログラム可能なマイクロプロセッサまたは
ディジタル信号プロセッサは、大抵の圧縮および圧縮解
除を扱うことができ、また、能力の低いプロセッサは低
ビットレートの圧縮および圧縮解除を扱い得る。

【００１３】

【発明が解決しようとする課題】本発明は、ビデオ圧縮
および圧縮解除を行うための効率的な低ビットレートの
ビデオコーディングを提供することを目的とする。

【００１４】

【課題を解決するための手段】本発明は、サブバンドの
最初の区間を階層に従ってベースバンドと３組の高バン
ドとに区分してゼロツリーを用いる、（ウェーブレット
を含む）階層サブバンドのコーディングによるビデオ圧
縮および圧縮解除を提供する：最初ベースバンドを独立
して（ＤＰＣＭによるなどして）コーディングし、次に
高バンドの組のそれぞれをそれ自身の初期スレショルド
によりゼロツリーコーディングする。

【００１５】本発明はまた、このコーディングに関する
アプリケーションを有する、ランダムアクセスメモリ内
への記憶を伴うビデオ電話およびセキュリティのための
低速度撮影監視を含む固定カメラ監視のようなビデオシ
ステムをも提供する。

【００１６】利点には、完全に埋込まれた特徴を保持し
つつ、埋込み形ゼロツリーウェーブレットコーディング
よりも効率的である、低ビットレートのビデオコーディ
ングを実現していることが含まれる。これにより、低ビ
ットレートのテレビ会議および監視情報記憶が可能にな
る。

【００１７】

【発明の実施の形態】実施例の単一フレームゼロツリーコーディング図面は、わかりやすくするために概略的なものとしてあ
る。図１は、第１の実施例のフレームエンコーディング
のフローダイヤグラムであり、このフレームエンコーデ
ィングは、ベースバンドにおけるＰＣＭおよび高バンド
におけるゼロツリーと共にウェーブレット階層分解を用
いる。このフローダイヤグラムを、簡単にするため例を
用いて説明する。すなわち、８ビットピクセル（−１２
８乃至＋１２７）の１４４×１７６フレームを仮定し、
ウェーブレット階層分解においては４つのスケールレベ
ルを仮定する。（ｊ，ｋ）にあるピクセルの値はｘ
（ｊ，ｋ）で表される。ただし、０≦ｊ≦１４３および
０≦ｋ≦１７５である。

【００１８】分解を開始するには、まず１４４×１７６
フレームを４つのフィルタｈ₀（ｊ）ｈ₀（k ），ｈ₀
（ｊ）ｈ₁（k ），ｈ₁（ｊ）ｈ₀（k ）およびｈ
₁（ｊ）ｈ₁（k ）のそれぞれによりフィルタし、１４
４×１７６のフィルタされたフレームを与える（境界ピ
クセルの値は計算用のフレームを拡大するのに用いら
れ、それはそうでない場合でもフレームを越えて拡大し
得る）。計算上簡単なｈ₀（k ）関数は、ｋ＝０，１に
おいて１／√２に等しく、全ての他のｋに対して０とな
る。ｈ₁（k ）は、ｋ＝０において１／√２に等しく、
ｋ＝１において−１／√２に、ｋ＝２，３において１／
８√２に、ｋ＝−１，−２において−１／８√２に等し
く、また全ての他のｋに対して０となる。従来の技術の
項において引用したビラセナーの文献は、他のフィルタ
関数をリストしている。フィルタリングは、数学的には
これらの関数による畳込みであり、それゆえ、ｈ₀は１
次元のローパスフィルタ（２つの隣接ピクセルにおける
平均）であり、ｈ₁は１次元のハイパスフィルタ（本質
的には隣接ピクセルの差）である。従って、これら４つ
のフィルタはそれぞれ、２次元のローパス−ローパス，
ローパス−ハイパス，ハイパス−ローパス，およびハイ
パス−ハイパスである。

【００１９】次に、ｊおよびｋの双方が偶数である
（ｊ，ｋ）におけるピクセルのみを保持することによ
り、因子“４”によりそれぞれのフィルタされたフレー
ムをサブサンプリングする。このサブサンプリングは４
つの７２×８８ピクセル画像を生じ、それらはＬＬ１，
ＬＨ１，ＨＬ１およびＨＨ１でそれぞれ表され、それら
のピクセル位置（ｊ，ｋ）は０≦ｊ≦７１および０≦ｋ
≦８７に対するものとして再表示される。これは分解の
第１レベルをなし、これら４つの画像はいっしょに配置
されると単一の１４４×１７６画像を形成することがで
き、この画像は、図２（ａ）に示されているように分解
を簡単に視覚化したものを与える。このようにして、Ｌ
Ｌ１は、原フレームの低解像度バージョンであり、原フ
レームの圧縮バージョンとして用いられ得る。

【００２０】ＬＬ１，ＬＨ１，ＨＬ１およびＨＨ１の画
像は、まずそれぞれの画像を因子“４”により補間して
（１４４×１７６サイズを再生し）、次に４つの１４４
×１７６画像を、フィルタｇ₀（ｊ）ｇ₀（k ），ｇ₀
（ｊ）ｇ₁（k ），ｇ₁（ｊ）ｇ₀（k ）およびｇ
₁（ｊ）ｇ₁（k ）によりそれぞれフィルタし、最後に
これら４つのフィルタされた画像をピクセル毎に互いに
加算することにより、原フレームを再構成するために用
いられ得る。関数ｇ₀，ｇ₁はそれぞれ、ローパスフィ
ルタおよびハイパスフィルタであり、ｈ₀およびｈ₁と
ｇ₀（ｎ）＝（−１）ⁿｈ₁（ｎ）およびｇ₁（ｎ）＝
（−１）ⁿｈ₀（ｎ）の関係にある。ｈ₀，ｈ₁，ｇ₀
およびｇ₁の関数は、奇数タップフィルタの場合におけ
るように０の回りではなく、１／２の回りに対称であ
り、それゆえ、再構成の後には、ピクセルインデックス
は２回のフィルタリングにおける１／２ピクセルシフト
のための調節として“１”だけシフトされる。

【００２１】分解の第２レベルは、ｈ₀およびｈ₁関数
による４種のフィルタリングおよび因子“４”によるサ
ブサンプリングを単に繰返すのであるが、入力としては
ＬＬ１画像を用いる。このようにして、４つのフィルタ
された画像はそれぞれ３６×４４となり、ＬＬ２，ＬＨ
２，ＨＬ２およびＨＨ２により表される。前と同様に、
ＬＬ２，ＬＨ２，ＨＬ２およびＨＨ２は、ＬＬ１の分解
を視覚化するように配置することができ、また、ｇ₀お
よびｇ₁に基づくフィルタによるＬＬ１の再構成のため
に用いることができる。ＬＨ１，ＨＬ１およびＨＨ１の
画像は、フィルタされないまま残される。

【００２２】この分解はＬＬ２に対しても繰返され、そ
れはｈ₀およびｈ₁に基づく４つのフィルタによるフィ
ルタリングとそれに続くサブサンプリングとにより行わ
れて、１８×２２ピクセル画像であるＬＬ３，ＬＨ３，
ＨＬ３およびＨＨ３が得られる。再び、ＬＬ３，ＬＨ
３，ＨＬ３およびＨＨ３は、ＬＬ２の分解を視覚化する
ように配置され得る。

【００２３】原フレームの４レベルの階層分解は、ＬＬ
３のｈ₀およびｈ₁に基づく４つのフィルタによる最後
のフィルタリングとそれに続くサブサンプリングとによ
り完成され、９×１１ピクセル画像であるＬＬ４，ＬＨ
４，ＨＬ４およびＨＨ４が得られる。図２（ｃ）は、全
体として１４４×１７６ピクセルレイアウトを形成する
ように配列された、全ての得られた画像を示している。
図２（ｃ）はまた、分解のさまざまなレベルにおけるピ
クセルのツリー関係を表示している。実際、ＬＨ４内の
ピクセルｙ（ｊ，ｋ）は、ＬＬ３内のピクセルｘ（ｊ，
ｋ）のフィルタリングおよびサブサンプリングの結果で
あり、次の関係がある。

【００２４】

【数１】

【００２５】フィルタリングとサブサンプリングとを併
せたものは基本的にはＬＬ３内の２×２領域からｙ
（ｊ，ｋ）を計算することであり（ｋ＝０，１以外では
ｈ₁（ｋ）の値は小さい）、ＬＬ３内には、ＬＨ４内の
ｙ（ｊ，ｋ）を決定する４つのピクセル（ｘ（２ｊ−
１，２ｋ−１），ｘ（２ｊ−１，２ｋ），ｘ（２ｊ，２
ｋ−１）およびｘ（２ｊ，２ｋ））がある。ここでは、
ＬＬ３内のこれら４つのピクセルは、ＬＨ３内の同じ位
置（（２ｊ−１，２ｋ−１），（２ｊ−１，２ｋ），
（２ｊ，２ｋ−１）および（２ｊ，２ｋ））の４つのピ
クセルに関係している。そのわけは、それらは全てＬＬ
２内の本質的に同じ１６位置から計算されているからで
ある。従って、ＬＨ４内のピクセルｙ（ｊ，ｋ）は、Ｌ
Ｈ３内の関連するピクセルｚ（２ｊ−１，２ｋ−１），
ｚ（２ｊ−１，２ｋ），ｚ（２ｊ，２ｋ−１）およびｚ
（２ｊ，２ｋ）の親と呼ばれ、ＬＨ３内のこれら４つの
ピクセルのそれぞれは、ＬＨ４内の親ピクセルの子であ
る。

【００２６】原フレームをＬＬ４，ＬＨ４，．．．，Ｈ
Ｈ１へ分解した後、まず９×１１のＬＬ４をＰＣＭ（パ
ルス符号変調）によりエンコードし、これはちょうど９
９個のピクセル値のそれぞれを量子化して、空間的相関
を無視することにあたる。基本的には、ＬＬ４内のそれ
ぞれのピクセルは、原フレーム内の対応する１６×１６
マクロブロックの直流成分（平均）であり、従って、そ
れは原フレームの低解像度バージョンである。ＬＬ４の
このエンコーディングは、それぞれのピクセルをエンコ
ードするためにＮビットが用いられるとすると、９９Ｎ
ビットを用いる。

【００２７】次に、３つのハイパスチャネルのそれぞれ
に対してゼロツリーコーディングを用いる。特に、ま
ず、ＬＨ４，ＬＨ３，ＬＨ２およびＬＨ１内のピクセル
の最大振幅を見出す。次に、その最大振幅の１／２に等
しい初期量子化スレショルドＴ _LHをセットする。８ビッ
トピクセルを有する例においては、Ｔ_LHは約１００であ
り得る。次に、９９ピクセルのそれぞれを以下に挙げる
クラスの１つの中に配置することにより、ＬＨ４をエン
コードする。（ｉ）もしピクセル値が正でＴ_LHより大き
ければ、ＰＯＳ（正の意味）、（ii）もしピクセル値が
負で振幅がＴ_LHより大きければ、ＮＥＧ（負の意味）、
（iii)もしピクセル値がＴ_LH以下で、かつ全ての子孫の
ピクセル（ＬＨ３内の子ピクセル、これらのＬＨ３子ピ
クセルのＬＨ２子ピクセル、これらのＬＨ２子ピクセル
のＬＨ１子ピクセル）もまたＴ_LH以下の振幅を有すれ
ば、ＺＴＲ（ゼロツリールート（ｚｅｒｏｔｒｅｅｒ
ｏｏｔ））、（iv）もし、ピクセルはＴ_LH以下の振幅を
有するが、少なくとも１つの子孫ピクセルがＴ_LHより大
きい振幅を有すれば、ＩＺ（孤立したゼロ）。ＬＨ４内
の９９ピクセルはラスタ走査され、それぞれのピクセル
は２ビットを用いるので、このエンコーディングは１９
８ビットを用いる。

【００２８】次に、ＨＬ４，ＨＬ３，ＨＬ２およびＨＬ
１内のピクセルにおける最大ピクセル振幅およびスレシ
ョルドＴ_HLを見出すために同じステップを行い、同じク
ラスＰＯＳ，ＮＥＧ，ＺＴＲおよびＩＺによりエンコー
ドするが、その際量子化スレショルドとしてはＴ_HLを用
いる。次に、ＨＨ４，ＨＨ３，ＨＨ２およびＨＨ１に対
してスレショルドＴ_HHを用いて同じことを行う。ＬＨ
４，ＨＬ４およびＨＨ４のこれらのエンコーディングの
送信を前のＬＬ４のエンコーディングに追加すれば、最
終再構成フレームの解像度は、ＬＨ４においてコーディ
ングされたＰＯＳ，ＮＥＧ内のピクセルに対し±１．５
Ｔ_LHの値を用い、ＬＨ４内においてコーディングされた
ＺＴＲ，ＩＺのピクセルに対し０の値を用い、同様にし
てＨＬ４およびＨＨ４に対しては±１．５Ｔ_HLおよび±
１．５Ｔ_HHを用いることにより、増大する。

【００２９】ＬＨ３，ＨＬ３，ＨＨ３，ＬＨ２，ＨＬ
２，ＨＨ２，ＬＨ１，ＨＬ１およびＨＨ１に対するコー
ディングを、対応するＴ_LH，Ｔ_HLまたはＴ_HHを用いて続
行する。ゼロツリールートの定義により、ゼロツリール
ートピクセルの全ての子ピクセルをコーディングする必
要はなく、それゆえ、これらのピクセルを走査において
スキップして、ビットストリームを受けるデコーダによ
りゼロを補充し得ることに注意すべきである。ＬＨ１，
ＨＬ１およびＨＨ１においては子孫のピクセルがなく、
それゆえ、単純なゼロがゼロツリールートおよび孤立し
たゼロの代わりに用いられることにも注意すべきであ
る。このエンコーディングは、本質的に、（スレショル
ドより大きい）有効ピクセルの位置（および正負符号）
の写像である。

【００３０】次に、（ＰＯＳまたはＮＥＧとしてエンコ
ードされた）有効ピクセルを経ての走査を行い、それぞ
れを追加のビットによりエンコードして、範囲（Ｔ_XX，
１．５Ｔ_XX］および（１．５Ｔ_XX，２Ｔ_XX］内のピクセ
ル値を区別する。ただし、添字Ｔ_XXは適切なスレショル
ドを意味する。

【００３１】ＬＨ４，ＨＬ４，．．．，ＨＬ１，ＨＨ１
における全ての有効ピクセルをゼロにより置換する。有
効ピクセルは、前述のエンコーディングにおいて識別さ
れており、それらの値は、後のもっと精密な量子化およ
びエンコーディングのためにリストされている。また、
Ｔ_LHをＴ_LH／２により、Ｔ_HLをＴ_HL／２により、またＴ
_HHをＴ_HH／２により置換し、前の有効ピクセルをゼロに
より置換して改変されたＬＨ４，ＨＬ４，．．．，ＨＬ
１，ＨＨ１のための新しいこれらのスレショルドによ
り、ＰＯＳ，ＮＥＧ，ＺＴＲまたはＩＺとしてのエンコ
ーディングを繰返す。これは本質的に量子化を精密化
し、新しい有効ピクセルを定める。ゼロにより置換され
た前の有効ピクセルをスキップしてＬＨ４，ＨＬ
４，．．．，ＨＬ１，ＨＨ１を再び走査し、エンコーデ
ィングＰＯＳ，ＮＥＧ，ＺＴＲおよびＩＺを送信する。
再び、これは、有効ピクセルに対する値を量子化範囲の
中点として用いることにより、これまでに発生せしめら
れたコードから再構成されたフレームにおける解像度の
さらなる増大を与える。

【００３２】再び、有効ピクセルの新しいリストを経て
の走査を繰返し、追加のビットをエンコードして、適切
な量子化範囲の上半分（０．７５Ｔ_XX，Ｔ_XX］，（１．
２５Ｔ_XX，１．５Ｔ_XX］および（１．７５Ｔ_XX，２
Ｔ_XX］と前記範囲の下半分（０．５Ｔ_XX，０．７５
Ｔ_XX］，（Ｔ_XX，１．２５Ｔ_XX］および（１．５Ｔ_XX，
１．７５Ｔ_XX］との中のピクセル値を区別する。

【００３３】同様にして、再び、有効ピクセルをゼロに
より置換し、かつスレショルドをその半分により、すな
わちＴ_LH／２をＴ_LH／４により、Ｔ_HL／２をＴ_HL／４に
より、またＴ_HH／２をＴ_HH／４により置換し、前の有効
ピクセルをゼロにより置換して改変されたＬＨ４，ＨＬ
４，．．．，ＨＬ１，ＨＨ１のための新しいこれらのス
レショルドにより、ＰＯＳ，ＮＥＧ，ＺＴＲまたはＩＺ
としてエンコーディングを繰返す。

【００３４】量子化スレショルドの相次ぐ増加は、原フ
レームのますます高解像度の再構成を与える。さらに、
もし３つの初期スレショルドＴ_LH，Ｔ_HL，およびＴ_HHが
著しく異なっていれば、小さいスレショルドを有する画
像のビットストリームは、大きいスレショルドが繰返し
に際して比較可能な大きさへ減少せしめられるまで、延
ばされ得る。例えば、もしＴ_LHがＴ_HLの２倍ならば、Ｌ
Ｈ内の全てのピクセルはＴ_HLより小さく、ＨＬ内の少な
くとも１つのピクセルと比較すると有効でない。これ
は、ＨＬ内の最大ピクセルの解像度によれば、ＬＨ内の
全てのピクセルはゼロであり、この解像度においては再
構成のために不必要であることを意味する。逆に、もし
３つの初期スレショルドの大きさが全てある程度匹敵し
ていれば、簡単にするために全ての３つのチャネルに対
して単一のスレショルドを用いることができる。

【００３５】ＬＬ４の独立したＰＣＭエンコーディング
は最大振幅のピクセルをしばしば除去し、それにより、
小さい初期量子化スレショルドによるＬＨ４，ＨＬ
４，．．．，ＨＨ１のエンコーディングの開始を可能に
し、また、該エンコーディングをＬＬ４の独立したエン
コーディングを行わない場合よりも効率的にする。同様
にして、３つのハイパスチャネルのそれぞれに対し別個
のスレショルドを決定すると、単一スレショルドの代わ
りに３つの初期量子化スレショルドを送信するという負
担はあるが、初期量子化スレショルドはより正確にな
る。

【００３６】全ビットストリームは、ＬＬ４を完全にエ
ンコードした初期ビットブロックと、次に初期量子化ス
レショルドＴ_LH，Ｔ_HL，Ｔ_HHを用いて有効ピクセル位置
をエンコードしたビットブロックと、次に有効ピクセル
のそれぞれに対して１ビットの正確さを追加したビット
ブロックと、次に精密化された量子化スレショルドＴ _LH
／２，Ｔ_HL／２，Ｔ_HH／２を用いて有効ピクセル位置を
エンコードしたビットブロックと、次に（初期量子化ス
レショルドおよび精密化されたスレショルドの双方によ
り）有効ピクセルのそれぞれに対して１ビットの正確さ
を追加したビットブロックとなどを、目標の量子化の精
密化または他のビットレート制約が生じるまで、含む。

【００３７】完全埋込み形の実施例前述の第１の実施例は、別個の初期量子化スレショルド
によりＬＨ，ＨＬまたはＨＨ画像をエンコードする前
に、（例においては９×１１のＬＬ４である）最高レベ
ルのＬＬ画像をコーディングした。これとは対照的に、
第２の実施例は、ＬＨ，ＨＬおよびＨＨ画像のゼロツリ
ーコーディングにおける量子化スレショルドの精密化に
類似した相次ぐ量子化コーディングの精密化を最高レベ
ルのＬＬ画像に対して適用する。例えば、ＬＬ４ピクセ
ルのＰＣＭコードの最上位ビットは、送信される最初の
９９ビットブロックであり、次はＬＨ，ＨＬおよびＨＨ
に対する第１レベルのゼロツリーコーディングであり、
その次にはＬＬ４ＰＣＭコードの第２最上位ビットに対
する９９ビットブロックなどが続く。これは、多重スケ
ールに基づく高解像度情報の初期部分としての低解像度
情報の完全な埋込みを与える。

【００３８】ＤＰＣＭの実施例前述の第１および第２の実施例は、最高レベルのＬＬ画
像（例においては９×１１のＬＬ４）をＰＣＭによりコ
ーディングしたので、空間的相関を利用し得なかった。
第３の実施例は、第１の実施例に追随するものである
が、最高ＬＬレベルのＤＰＣＭコーディングを用いる。

【００３９】詳述すると、まずプリセットされた量子化
ステップサイズにより、それぞれのピクセル値に対する
量子化値を計算する。次に、それぞれのピクセル値に対
し、隣接ピクセルとの差を以下のように計算する。上お
よび左の境界（量子化）ピクセルｗ（０，ｋ），ｗ
（ｊ，０）から開始して、ピクセル差ｚ（ｊ，０）＝ｗ
（ｊ，０）−ｗ（ｊ−１，０）［ただし、１≦ｊ≦９］
およびｚ（０，ｋ）＝ｗ（０，ｋ）−ｗ（０，ｋ−１）
［ただし、１≦ｋ≦１１］を再帰的に形成する。このよ
うにすれば、ｗ（０，０）と差ｚ（ｊ，０），ｚ（０，
ｋ）とにより、ｗ（ｊ，０）およびｗ（０，ｋ）を再構
成し得るが、ｚ（ｊ，０）およびｚ（０，ｋ）の振幅は
通常著しく小さいので、エンコードするために必要なビ
ットは少ない。

【００４０】次に、より小さい導関数からの予測によ
り、全ての他の差を再帰的に形成する。すなわち、もし
｜ｗ（ｊ，ｋ−１）−ｗ（ｊ−１，ｋ−１）｜＜｜ｗ
（ｊ−１，ｋ）−ｗ（ｊ−１，ｋ−１）｜ならば、ｚ
（ｊ，ｋ）＝ｗ（ｊ，ｋ）−ｗ（ｊ−１，ｋ）、それ以
外の場合はｚ（ｊ，ｋ）＝ｗ（ｊ，ｋ）−ｗ（ｊ，ｋ−
１）。再び、ｗ（ｊ，ｋ）はｗ（０，０）とｚ（ｊ，
ｋ）とから再構成され得るが、ｚ（ｊ，ｋ）の振幅はｗ
（ｊ，ｋ）の振幅よりも小さくなければならない。もち
ろん、ｗ（０，０）は大きくてもよく、直接エンコード
される。

【００４１】次に、ｚ（ｊ，ｋ）を適応可変長エントロ
ピーコードにより以下のようにエンコードする。経験的
に、ｚ（ｊ，ｋ）は次の２つのクラスに属する。（Ａ）
予測の有効性により典型的に１５未満である小さい値、
および（Ｂ）データの分散により比較的に大きい値。こ
の実施例は、コードを２つの組に分割する。１つの組
は、短い長さのコードによりコーディングされる小さい
値のためのものであり、他の組は、大きい値のためのも
のである。それぞれの組内においては、一般に値が一様
に分布する（高エントロピー）ので、簡単なインプリメ
ンテーションのためには、それぞれの記号を同数のビッ
トを用いてコーディングする。

【００４２】次に、｜ｚ（ｊ，ｋ）｜の最大値を計算
し、これを最大値Ｇと呼ぶ。残りのｚ（ｊ，ｋ）のそれ
ぞれをエンコードするための最大ビット数ｎ_bitsは次の
ようになる。

【００４３】

【数２】ただし、「ｃｅｉｌ〔．〕」はシーリング関数であり、
その値はこの関数の引数以下の最小の整数である。

【００４４】次に、ビットの最適数ｎ_optを求める。こ
の最適数ｎ_optはｚ（ｊ，ｋ）を２つの組に分割し、そ
の１つの組はｎ_optビットによりコーディングされ、他
の組は、ｎ_bits＋１ビットによりコーディングされる。
総計Ｎ個のｚ（ｊ，ｋ）（例においてはこれは９８とな
る）に対し、ｂを、最小振幅ｚ（ｊ，ｋ）の組内のそれ
ぞれのｚ（ｊ，ｋ）のために必要なビット数とする。そ
の時、ＰＣＭにおける記号あたりのコーディング利得は
次のようになる。

【００４５】

【数３】

【００４６】このようにして、ｂの全ての値（ｂ＝０，
１，２，．．．，ｎ_bits）を経てループし、この利得を
最大化するｂの値としてのｎ_optを採用することによ
り、ｎ _optを見出す。このＤＰＣＭは、典型的には、Ｐ
ＣＭにおいて用いられる総ビットの約２０％を節約す
る。

【００４７】カラー実施例以上の実施例は、単一値ピクセルのみを考慮していた。
カラーフレームとしては、３つの別個のフレーム（強度
ピクセルのＹフレーム、赤および青のクロミナンスピク
セルＣｒ，ＣｂのためのＵおよびＶフレーム）が用いら
れ、それらは典型的に異なるサイズを有する（Ｙは１４
４×１７６などの全解像度、ＵおよびＶは７２×８８な
どの半解像度のものである）。この時、３つのフレーム
のそれぞれは、前述の実施例の１つによりエンコードさ
れる。ビットストリームは、次のように連結され得る：
｜Ｙストリーム｜Ｃｒストリーム｜Ｃｂストリーム｜。

【００４８】実施例のシンタックス実施例のビットストリームは、ベースバンドのそれぞれ
のカラー成分に対し以下のシンタックスを有する：｜Ｑ
ｂ｜バイト｜Ｗ０｜ビット０｜ビット１｜ＤＰＣＭスト
リーム｜、ただし「Ｑｂ」（８ビット）はベースバンド
のための量子化ステップサイズであり、「バイト」はバ
イトを単位とするベースバンドビットストリームの長さ
であり、「Ｗ０」はｗ（０，０）の量子化された値であ
り、「ビット０」はベースバンドｚ（ｊ，ｋ）のための
ビットの最大数であり、「ビット１」は小さい値の組の
ための記号毎のビット数であり、「ＤＰＣＭストリー
ム」はｗ（０，０）以外の量子化されたｚ（ｊ，ｋ）の
ためのビットストリームである。

【００４９】より高いバンドにおいては、シンタックス
は次のようになり得る：｜Ｑ｜サイズ｜ストリーム｜、
ただし「Ｑ」はゼロツリー量子化のための初期スレショ
ルド（１６ビット）であり、「サイズ」（１６ビット）
はバイトを単位とする「ストリーム」の長さであり、
「ストリーム」はビットストリームである。

【００５０】経験的結果図３から図５までは、さまざまなビットレートにおける
３つの異なる標準テストフレームに対する、従来の技術
の項において述べたシャピロのゼロツリーの方法と比較
した場合の、第３の実施例におけるピーク信号対雑音比
（ＰＳＮＲ）の比較を示す。実施例は、大体１ｄＢに達
する改善を与える。

【００５１】圧縮および圧縮解除の概説図６は、実施例の圧縮とエンコーディングとデコーディ
ングとエンコーディングおよびデコーディングによるエ
ラーの補正を含む圧縮解除とを用いて話者の音声および
画像の双方を送信する実施例のビデオ電話（テレビ会
議）システムのブロック図を示す。もちろん、図６は、
１つの受信機のみへの一方向の送信のみを示している
が、実際には、第２のカメラおよび第２の受信機が反対
方向への送信に用いられ、このシステム内に第３または
それ以上の受信機および送信機を接続することもでき
る。ビデオおよび音声は別個に圧縮され、ビデオおよび
音声の送信チャネル帯域幅の割当ては状況に依存して動
的に調節され得る。電話網の帯域幅は、経費上、低ビッ
トレート送信を要求する。実際、極めて低いビットレー
トのビデオ圧縮はマルチメディアへ応用され、その場
合、視覚上の品質は劣化し得る。

【００５２】図７は、全体が参照番号２００により示さ
れている第１の実施例の監視システムを示し、それは、
定置背景２０４（運動対象２０６がたまたま視野内を通
過している）上に焦点を合わせた１つまたはそれ以上の
固定ビデオカメラ２０２と、ビデオ圧縮機２０８と、遠
隔メモリ２１０と、検出器およびディスプレイ２２０と
を含む。圧縮機２０８は、シーンのビデオ画像のストリ
ーム（例えば、３０フレーム毎秒で、それぞれのフレー
ムは１４４×１７６の８ビット白黒ピクセルを有する）
を、高品質画像を保持しつつ、圧縮機２０８からメモリ
２１０へのデータ通信速度が極めて低く（例えば、２２
Ｋｂｐｓ）なるように圧縮する。システム２００は定置
背景に依存しており、運動対象（これは背景に対して運
動するフレーム内の領域として現れる）は、低いデータ
通信速度を実現するために予測運動を用いてエンコード
されるのみである。この低いデータ通信速度は、カメラ
からモニタおよびパーソナルコンピュータ用の磁気ハー
ドディスクのようなランダムアクセスメモリ装置への伝
送チャネルを簡単化し得る。実際、モデムを有する単一
電話線は、圧縮されたビデオ画像ストリームを遠隔モニ
タへ伝送し得る。さらに、特定の監視状況が必要とする
１日または１週間などのある時間間隔の間のビデオ画像
ストリームの記憶装置は、そのような圧縮の後には遙か
に少ないメモリしか必要としない。

【００５３】ビデオカメラ２０２は、圧縮機２０８への
出力が図７に一般的に示されているようにディジタルフ
レームのシーケンスであるよう、カメラ内アナログ／デ
ィジタル変換器を有するＣＣＤカメラであればよい。あ
るいは、追加のハードウェアを有するアナログカメラを
用いても、フレームのディジタルビデオストリームを発
生し得る。圧縮機２０８は、ハードワイヤード形のもの
でもよく、または、もっと便利ものとして、圧縮ステッ
プをオンボードメモリであるＲＡＭまたはＲＯＭまたは
双方に記憶している、ディジタル信号プロセッサ（ＤＳ
Ｐ）であってもよい。例えば、ＴＭＳ３２０Ｃ５０また
はＴＭＳ３２０Ｃ８０形のＤＳＰならば十分である。ま
た、図１に示されているようなテレビ会議システムにお
いては、リアルタイム受信に関するエラー補正が含ま
れ、汎用プロセッサ上に具体化され得る。

【００５４】図８は、実施例のビデオ圧縮方法の高レベ
ルフローダイヤグラムを示し、該方法は、それぞれのフ
レームが１７６ピクセルを１４４行または３５２ピクセ
ルを２８８行有しかつ１０フレーム毎秒のフレームレー
トを有するフレームＦ₀，Ｆ ₁，Ｆ₂，．．．のシーケ
ンスから成る入力に対する後述のステップを含む。それ
ぞれのステップの詳細は、以下のそれぞれの項に述べ
る。

【００５５】上述の２つのサイズのフレームは、それぞ
れのマクロブロックが１６ピクセル×１６ピクセルであ
るとして１１マクロブロックを９行含むアレイへまたは
２２マクロブロックを１８行含むアレイへ区分される。
これらのフレームは、ＩピクチャまたはＰピクチャとし
てエンコードされる。Ｂピクチャは後方への補間を有
し、極めて低いビットレートの伝送においては過度に大
きい時間遅延を生じる。Ｉピクチャは５または１０秒毎
に一度だけ発生し、大部分のフレームはＰピクチャであ
る。１７６ピクセルを１４４行含むサイズのフレームに
おいては、ほぼＩピクチャは２０Ｋｂｉｔによりエンコ
ードされ、Ｐピクチャは２Ｋｂｉｔによりエンコードさ
れるので、全体としてのビットレートは大体２２Ｋｂｐ
ｓとなる（わずか１０フレーム毎秒またはそれ以下）。
フレームは白黒またはカラーのものであり得、カラー
は、強度フレーム（Ｙ信号）と１／４解像度の（サブサ
ンプリングされた）カラー組合せフレーム（ＵおよびＶ
信号）とにより与えられる。

【００５６】（１）最初、第０フレームＦ₀を、ウェー
ブレット変換に基づく実施例を用いて、ＭＰＥＧ−１，
２におけるように、Ｉピクチャとしてエンコードする。
フレームの多重レベル分解を計算し；ベースバンド（も
しｋ個のレベルが用いられていればＬＬｋ）を分離し
て、それをＰＣＭまたはＤＰＣＭによりエンコードし
（ＰＣＭは簡単な完全埋込みを与える）；高バンド（Ｈ
Ｈ１，ＨＨ２，．．．，ＨＨｋ；ＨＬ１，ＨＬ
２，．．．，ＨＬｋ；およびＬＨ１，ＬＨ２，．．．，
ＬＨｋ）の３つの組のそれぞれのために、ウェーブレッ
ト係数をゼロツリーエンコードし；完全な埋込みのため
にインタリーブされたＬＬｋのＰＣＭにより走査線の順
序で送信する。他のフレームもまたＩフレームとしてエ
ンコードされ、Ｉフレームの割合は伝送チャネルのビッ
トレートに依存する。もしＦ_NがＩピクチャであるべき
であれば、Ｆ₀と同様にエンコードする。

【００５７】（２）ＰピクチャであるべきフレームＦ_N
においては、フレーム内の運動対象を、再構成されたＦ
_N-1からＦ_Nへの変化の領域を見出すことにより検出す
る。再構成されたＦ_N-1はＦ_N-1に対する近似であり、
それは実際に後述のように送信される。変化の領域は、
運動対象と露出背景とに区分される必要はなく、運動対
象を近似的にのみ記述することに注意すべきである。し
かし、この近似は、より効率的な低コーディングを行う
ためには十分である。もちろん、ある領域が前のフレー
ム内の変化領域外へマップされ従って露出背景であるか
どうかを決定するための逆運動ベクトル，対象を決定す
るためのエッジ検出または対象を背景から区別するため
の対象特性（モデル）の仮定などのメカニズムにより、
運動対象と露出背景とへのこの区分を行う別の方法もあ
ろう。

【００５８】（３）ステップ（２）から得られた変化の
領域のそれぞれの連結された成分のために、内部の穴を
含めその境界輪郭をコーディングする。従って、運動対
象の境界は正確にはコーディングされず、変化の全領域
の境界がコーディングされ、運動対象の境界を近似す
る。境界のコーディングは、境界を近似するスプライン
によるかまたは変化の領域内のブロックを示す２進マス
クにより行われ得る。スプラインは境界のより正確な表
示を与えるが、２進マスクはより少数のビットを用い
る。変化の領域の連結成分は２進画像マスクのラスタ走
査とマスク内のピクセルのグループ化するソーティング
とにより決定され、それらのグループは隣接ピクセルの
ソーティングによりマージされ得ることに注意すべきで
ある。ピクセルの最終グループは、連結された成分（連
結された領域）である。プログラムの例については、バ
ラード（Ｂａｌｌａｒｄ）ら著，「コンピュータビジョ
ン（ＣｏｍｐｕｔｅｒＶｉｓｉｏｎ）」，（プレンテ
ィス・ホール（ＰｒｅｎｔｉｃｅＨａｌｌ）），第１
４９乃至１５２頁を参照されたい。便宜上以下において
は、連結された成分（連結された領域）を（運動）対象
と呼ぶ。

【００５９】（４）前のフレームからの対象の運動予測
により、ビデオシーケンス内の時間的冗長性を除去す
る。特に、現フレームＦ_Nにおける対象内の１６×１６
ブロックを、前の再構成フレームＦ_N-1内の同位置の１
６×１６ブロック、および全ての方向へこのブロックを
１５ピクセルまで平行移動したもの、と突き合わせる。
最良の突き合わせはこのブロックの運動ベクトルを定
め、現フレームＦ_Nに対する近似Ｆ’_Nは、運動ベクト
ルを、前のフレームＦ_N-1の該運動ベクトルに対応する
ブロックと共に用いることにより、前のフレームＦ_N-1
から合成され得る。

【００６０】（５）対象の運動を用いて近似Ｆ’_Nを合
成した後においても、フレーム内には、高速で変化する
領域などのかなりの量の残留情報を含む領域が存在し得
る。すなわち、Ｆ_Nと合成された近似Ｆ’_Nとの間の差
の領域は、ステップ（２）から（３）までと類似した運
動のセグメンテーションの適用を受け、かなりの有効情
報を含む運動故障領域を定める。

【００６１】（６）ステップ（５）から得られた運動故
障領域を、ＤＣＴまたはウェーブレット変換に基づく波
形コーティング技術を用いてエンコードする。ＤＣＴの
場合には、領域を１６×１６マクロブロックに区分し、
マクロブロックの８×８ブロックに対してＤＣＴを適用
し、量子化し、エンコードする（ランレングスコーディ
ングおよび次にハフマンコーディング）。ウェーブレッ
トの場合には、領域外の全てのピクセル値を定数（例え
ば０）にセットし、多重レベル分解を適用し、量子化
し、選択された領域に対応するウェーブレット係数のみ
をエンコードする（ゼロツリーコーディングおよび次に
算術コーディング）。

【００６２】（７）Ｉピクチャのためにエンコードされ
た情報（ＤＣＴデータまたはウェーブレットデータ）お
よびＰピクチャのためのそれ（対象は輪郭，運動ベクト
ルおよび運動故障データを有するそれぞれの対象により
順序づけられている）を組立てる。これらは、ハフマン
コードのテーブルからのコードワードであり得、それは
ダイナミックテーブルからではなく、むしろ実験的に発
生せしめられる。

【００６３】（８）それぞれのＩピクチャデータ，それ
ぞれのＰピクチャ，それぞれの輪郭データ，それぞれの
ベクトルデータおよびそれぞれの運動故障データの最初
の部分に再同期ワードを挿入する。これらの再同期ワー
ドは、ハフマンコードワードのテーブル内には現れず、
従って明確に決定され得る。（９）ステップ（８）から得られたビットストリームを
リード・ソロモンコードとインタリービングとにより，
エンコードする。次に、送信または記憶する。

【００６４】（１０）受信したエンコードされたビット
ストリームをリード・ソロモンとインタリービング解除
とによりデコードする。再同期ワードは、デコーディン
グ後の故障を改善し、またランダムアクセスのためのア
クセスポイントを提供する。さらに、デコーディング
は、インタリービング解除装置の両側の短縮リード・ソ
ロモンデコーダとエラー補正の強化のための第２のデコ
ーダから第１のデコーダへの帰還（デコーダ入力の記憶
されているコピー）とによるものであり得る。

【００６５】（１１）スケーラブルビットストリームを
与える、対象のスケーラビリティ（シーケンス内の対象
の選択的エンコーディング／デコーディング）および品
質のスケーラビリティ（対象の品質の選択的改善）のよ
うな追加の機能性もまたサポートされる。

【００６６】改変実施例は、最高のＬＬバンドの独立したエンコーディン
グおよびＬＨｋ，．．．，ＬＨ１，ＨＬｋ，．．．，Ｈ
Ｌ１，ＨＨｋ，．．．，ＨＨ１の諸バンドのゼロツリー
エンコーディングなどの、１つまたはそれ以上の特徴を
保持しつつ多様に変更され得る。

【００６７】例えば、フレームのサイズ，分解レベル，
スレショルド，量子化レベル，記号などは変更できる。
一般に、重要な領域に基づくアプローチが維持される限
り、ウェーブレットフィルタリングの代わりに、ＱＭＦ
およびジョンソンなどの他のタイプのサブバンドフィル
タリングを用いることもできる。１次元または３次元ま
たはそれ以上の次元を有する画像も、分解と最高レベル
のローパスフィルタされた画像の独立したエンコーディ
ングとにより、同様にしてエンコードされ得る。

【００６８】以上の説明に関して更に以下の項を開示す
る。（１）（ａ）画像をローパスフィルタリングおよびハイ
パスフィルタリングによりｋ個のレベルのサブバンドへ
分解するステップと、（ｂ）最低サブバンドをエンコー
ドするステップと、（ｃ）前記最低サブバンド以外の前
記サブバンドをゼロツリーエンコーディングによりエン
コードするステップと、を含む、画像のエンコード方
法。

【００６９】（２）サブバンドへの分解に続いて、最高
レベルのローパス画像の独立したコーディングと高バン
ドのゼロツリーコーディングとを併せて用いる画像のエ
ンコード方法。

【００７０】（関連出願に対するクロスリファレンス）
本出願の権利者を権利者とする次の同時係属出願は、関
連する内容を開示している。１９９６年１０月２５日付
出願の出願第号。

【図面の簡単な説明】

【図１】実施例のエンコーディングのフローダイヤグラ
ム。

【図２】サブバンド階層分解を示す図。

【図３】経験的結果を示す図。

【図４】経験的結果を示す図。

【図５】経験的結果を示す図。

【図６】実施例の電話システムを示す図。

【図７】実施例の監視システムを示す図。

【図８】実施例のビデオ圧縮のフローダイヤグラム。

【符号の説明】２００監視システム２０２固定カメラ２０８圧縮機２１０遠隔メモリ２２０遠隔デコーダおよびディスプレイ

Claims

【特許請求の範囲】

【請求項１】（ａ）画像をローパスフィルタリングお
よびハイパスフィルタリングによりｋ個のレベルのサブ
バンドへ分解するステップと、（ｂ）最低サブバンドをエンコードするステップと、（ｃ）前記最低サブバンド以外の前記サブバンドをゼロ
ツリーエンコーディングによりエンコードするステップ
と、を含む、画像のエンコード方法。