JPH03501550A - デジタル・ビデオ圧縮システム - Google Patents

デジタル・ビデオ圧縮システム

Info

Publication number
JPH03501550A
JPH03501550A JP63508345A JP50834588A JPH03501550A JP H03501550 A JPH03501550 A JP H03501550A JP 63508345 A JP63508345 A JP 63508345A JP 50834588 A JP50834588 A JP 50834588A JP H03501550 A JPH03501550 A JP H03501550A
Authority
JP
Japan
Prior art keywords
region
data
frame
area
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63508345A
Other languages
English (en)
Inventor
ゴーリン,スチユアート ジエイ
サイモン,アレン ヘンリー
アストル,ブライアン
Original Assignee
インテル コーポレーシヨン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インテル コーポレーシヨン filed Critical インテル コーポレーシヨン
Publication of JPH03501550A publication Critical patent/JPH03501550A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
    • H04N9/8063Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals
    • H04N9/8066Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals with insertion of the PCM audio signals in the vertical blanking interval of the PCM video signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 デジタル・ビデオ圧縮システム この発明は、一般的に言えばビデオ信号の処理に、具体的にはデジタル・ビデオ 信号を表わすに必要なデジタルデータの量を低減して、たとえばデジタル・ビデ オ信号の伝送、記録および再生等に使用しやすくするシステムに関するものであ る。
デジタル・ビデオ信号をコンパクト・ディスク(CD)のような比較的狭帯域メ ディア上に記録し易くするために圧縮する必要のあることは、判っている。高橋 氏他による米国特許第4520401号に開示されたシステムでは、デジタル・ オーディオ・ディスク上に記録するために差動パルスコード変調(DPCM)を 使ってデジタル・ビデオ信号をコート化している。この周知のシステムでは、ビ デオデ−ムのルミナンス(Y)成分とクロミナンス(R−Y、B−Y)成分を、 DPCMで別々に圧縮している。成る回路が、この青成分を、スクリーン上で相 隣接する、特定数の行または列の画素データ群に分割する。同期信号、画像モー ド識別信号および画像情報量識別コードを有するヘッダ信号が供給される。この ヘッダ信号は、分割された画素データ群の各々の初めの部分に付加されて、デジ タル・ルミナンス信号、2種のデジタル色差信号およびヘッダ信号が時間順次的 にマルチプレックスされ記録される信号フォーマットを有するデジタル・ビデオ 出力信号を生成する。
上記の高橋氏他の方式の一実施例では、デジタル・ビデオの静止フレームが1フ レーム当り約4秒の割合で記録され更新される。圧縮されたデータを各群が完全 なカラー情報を含んでし2る線の群に分割すると、疑似の動きが生じ、すなわち 前のフレームで表示されている間に上記の線の群が順次更新されて部分的に動き のある画像が現われる。
この発明は、比較的狭帯域メディアを使用して記録しまたは伝送するに適し、か つ少なくとも普通のビデオ・フレーム率に等しい速度で伸張(圧縮を戻す)でき るような、全運動(フル・モーション)カラー・ビデオ信号を表わす圧縮された デジタル・ビデオ信号を生成する圧縮システムに対する要求に応することに関す るものである。ここに説明する特定の実施例では、コンパクト・ディスク読取り 専用メモリ(CD−ROM)記録メディアに対する毎秒30フレームの全運動カ ラー・デジタル・ビデオ記録で、1時間以上の記録時間を達成できた。
この発明の一つの特徴によれば、デジタル・モーション(動きのある)ビデオ信 号の第1と第2フレームは、相異なる圧縮法を使りて圧縮され、出力信号は各圧 縮法を表わす識別コートを含む形に形成される。
この発明の別の特徴によれば、デジタル・ビデオ信号の各フレームは複数個の領 域を形成するように分割され、コート化される領域の特性に対し最適のコード化 特徴なケえるために幾つかの圧縮技法のうちから選ばれた1つによって、解析さ れコード化される。
この発明のまた別の特徴によれば、デジタル・モーション・ビデオ信号は、フレ ーム当りのバイト数と圧縮された信号のフレーム当りの復号時間の概算値との関 数として制御される圧縮閾値を使用して、圧縮される。
この発明の更にまた別の特徴によれば、ビデオ・フレームが繰返し分割された個 別にコード化されるべき複数の領域が形成され、その分割方向すなわち垂直また は水平方向は、その領域に付属するビクセル・パラメータの分布を比較して決定 される。
この発明の上記のおよび別の特徴は添付図面に示されており、図中同様な素子に は同様な参照符号を付けである。
第1図は、記録メディアとしてコンパクト・ディスク読取り専用メモリ(CD− ROM)を使用して全運動ビデオ、多重チャンネル・デジタル・オーディオおよ び補助(たとえば、相互作用)データの記録と再生を行なう、この発明を実施し たデジタル・ビデオ相互作用システムのブロック図。
第2図は、第1図のシステムの記録部分に使用されるデジタル・ビデオ・エンコ ーダのブロック図、第3図〜第9図は5第2図のエンコーダ中の種々の処理段階 におけるデジタル・ビデオ信号フォーマットを示す図、 第1O図〜第12図は、第2図のエンコーダで”過大サイズ(oversize d)”フレームを処理する2つの方法を示す第13図は、第2図のエンコーダで 使用するためのパッディングとディザリング行なうフォーマット器のブロック図 、 第14図は、第2図のエンコーダで使用される前置圧縮処理器のブロック図、 第15図は、第14図の処理器の一部詳細を示すブロック図、 第16図は、第2図のエンコーダで使用されるデジタル・ビデオ圧縮器で、フレ ーム内およびフレーム相互間の領域特定コート化、領域エリヤによる量子化およ びフレームセグメント化された可変長コード化を行なうもののブロック図、 第17図は、n止ビデオ・フレームと運動ビデオ・シーケンスの第1フレームを 圧縮するために第16図の圧縮器で使用されるフレーム内コーダの動作を示す流 れ図、第18図は、第16図の圧縮器で使用される画像輪郭解析を示す領域図。
!19図は、第16図の圧縮器で使用する分割/フィルを行なう概算塁のブロッ ク図、 第20図〜第23図は、第16図の圧縮器で使用される双線形絶対フィル・コー ド化を示す領域図。
第24図は、境界誤差の測定を示す領域図、第25図は、第2図のエンコーダで 使用されるオーディオ圧縮器のブロック図、 第26図は、カッド−トリ一式領域化を示す図。
第27図は、第16図の圧縮器中の画像の2進トリ一式領域化を示す図、 第28図と第29図は、第27図の領域化された画像に対する分割/フィル・コ ード化図の各−例をそれぞれ示す図。
第30図と第31図は、それぞれ第28図と第29図のコード北国用のトリーコ ードの実例を示す図、第32A図〜第3ZJ図は、最も好ましい領域分割方向を 決定するための輪郭分布の解析を示す領域図、第33A図は、領域中の水平方向 輪郭および垂直方向輪郭の分布を解析することにより第16図の圧縮器において 最も好ましい分割方向を決めるためのコンピュータ装置の流れ図、 第33B図は、第33A図の装置のパラメータを表掲した図、 第34A図と第34B図は、第16図の圧縮器における領域分割の2つの形式を 示す図、 第35A図〜第3SE図は、第16図の圧縮器における重み付けされた中点(メ ディアン)濾波作用を示す図。
第36A図〜第36C図は、第16図のエンコーダで使用する非線形低域通過濾 波作用を示す図、 第37図は、多項式的適合比較による最も好ましい分割方向検出法を示す図、 第38図は、第37図の分割方向法を実行するコンビュー夕装置の流れ図。
第39図は、モーション・ビデオ・シーケンスの第2フレームおよびそれに後続 する全フレームのコード化用に$16図の圧縮器で使用されるフレーム相互間コ ーグの動作を示す流れ図、 第40図は、第39図のフレーム相互間コーグにおける領域の移動を示す図、 第41図と第42図は、それぞれ、第39図のフレーム相互間コーグにおける最 良の領域サーチ方向の選択を示すベクトル図および流れ図、 第43図は、第39図のフレーム相互間コーグにおいて使用される領域の移動お よび関連コード化を示す図。
第44図は、第16図の圧縮器で使用される領域エリヤ依存適応型量子化を示す 表形式の図、 第45図は、第44図のエリヤ依存量子化を行なう第16図の装置の動作を示す 流れ図、 第46図は、第16図の圧縮器で使用するためのストリームセグメント化された 可変長コーグのブロック図、!s47図は、1416図の圧縮器によって供給さ れるデータ・ストリームのフォーマットを示す図。
第48図は、第1図の再生システム8で使用される圧縮デジタル・ビデオ信号デ コーダのブロック図、第49図、第50図および第51図は、第48図の絶対的 な関連ダイアトおよびDPCMコード化された領域に対する。第48図のデコー ダの領域位置メモリ中に記憶されたデータの表掲の一例を示す図、 第52図は、第48図のデコーダで使用されるメモリ構成を示すブロック図、 第53図は、第48図のデコーダによるフレーム相互間コード化領域の相対領域 デコード作用を示す図、第54図は、第53図の相対デコート作用を行なう装置 のブロック図、 第55図は、フレーム内コード化された領域の、t11448図のデコーダにお ける絶対領域デコード作用を示す図、第56図は、第55図のデコート作用を行 なう装置のブロック図、 第57図は、第48図のデコーダでの領域のDPCMデコード作用を示す図。
第58図は、第57図の領域DPCMデコード作用を行なう装置のブロック図、 第59図は、第48図のデコーダにおける脱量子化(デカンタイジング)ピクセ ル・データに対するエリヤ依存適応型量子化値の表掲図、 第60図は、第48図のデコーダにおけるエリヤ依存脱量子化用装置のブロック 図。
第61図と第62図は、第48図のデコーダにおけるダイアト・デコート作用を 示す図。
第63図は、第48図のデコーダて使用するダオアド・デコーダのブロック図で ある。
第1図のデジタル・ビデオ相互作用システムは記憶システム6と再生システム8 より成る。記録システムは、それぞれマルチチャンネル音声信号Sl、カラー・ モーション(動きのある)ビデオ信号S2および補助データ信号S3を供給する 。信号源10.12および14を具えている。エンコーダ16は、信号St、S 2およびS3をコード化し合成してデジタル記録信号S4(以下、ビット・スト リームという)を生成し、この信号S4はCD−ROMレコーダ18によってコ ンパクト・ディスク読取り専用メモリ(CD−ROM)ディスク20に記録され る。補助データ信号S3は、ビデオまたはオーディオ信号に付帯する相互作用デ ータ、あるいはこのオーディオ・データやビデオ・データとは無縁の何か他の形 式のデジタル・データより成るものである。
ビット・ストリームS4の平均データ率は、標準のCD−ROM記録/再生ビッ ト率約1.2メガビット/秒と等しくなるようにコード化パラメータを選ぶこと によって制御される。このパラメータは、後に説明するが、全運動デジタルコー ド化カラー・ビデオ、マルチチャンネル・デジタル・オーディオおよび補助デー タを1時間までCD−ROMディスク20上に記録できるように選ばれる。
CD−ROMディスク・プレーヤの比較的低いチャンネル容量と適合するように 記録信号のデジタル全運動カラー・ビデオ部分をコード化するには、可成り大幅 なデータの低減が必要である。ここに説明する特定の実施例では、このデータ低 減は、たとえばビデオ・フレーム率30FPS(毎秒当りフレームa)に対して 約150:1(7)オーダである0通常のビデオ圧縮技法に付帯する眼に見える 不自然さくアーティファクト)を除いてしかも上記の厳しい要求に合致させるた めに、エンコーダ16はビデオ信号S2をカラー・フレーム・シーケンシャル成 分形に変換して、各成分の各フレームを個別に後述する多数の特別に適合した処 理を受けさせる。それらを簡単に列挙すれば、可変サブ・サンプリング、ここで 領域特定コート化と呼ぶ方法を使っての可変のフレーム相互間およびフレーム内 圧縮、領域依存適応型量子化作用、セグメント化された可変長コード化、逆フジ ーム順再フォーマット化、パディングおよびフレーム・ディザである。
個々の処理の選択、各(処理)によって与えられるデータ低減の配分の選択およ び可変圧縮パラメータ(たとえば、閾値、動作モードおよび特に圧縮作用をいつ 止めるか)は、CD−ROMデジタル・オーディオ・テープ(DAT)その他の 帯域幅が制限されたメディアに記憶させるため全運動カラー・ビデオのコード化 の目的に合致させるための重要な選択事項である。その選択事項は、単にCD− ROMメディアのチャンネル容量のみに依るものではなくて、ビデオフレーム率 、所望の空間解像度、ビデオ画像内容の成る特定された特性、および画像を再生 するために最終的に使用されるデコーダの諸パラメータ等という種々の可変要因 に依存するものである、後述するように、各個々のビデオ・フレームは成分形式 に変換され、また各成分は多数の画素(ビクセル)のブロックの形に分割される 。各領域は、次いで個々の“カスタム”コード化される。このプロセスを以後“ 領域特定”コード化と呼ぶことにする。各領域に対するこのコード化は、一群の コードから選択されて、再生システム8のビデオ・デコーダを可動化してそれに 与えられた全デコード作用を“即時”にすなわちlビデオ・フレーム期間(可変 数)内に完結するという厳格な要求に適合するようにする。
記録システム6の上記した特徴その他の特徴は第2図〜第47図と第61図、第 62図を参照して詳細に説明する。
再生システム8の詳細は第48図〜第63図を参照して後で説明する。
第2図において、エンコーダ16は、信号源1oからのオーディオ信号Sl、信 号源12からのビデオ信号s2および信号源14からの補助データ信号s3をそ れぞれ受入れるための入力端子202 、204および206を持っている。
オーディオ処理の概要を述べれば、信号Slは、チャンネル選択とアナログ−デ ジタル(A/D”)変換を受け、フレームからフレームへの誤趣の伝播を阻止す るための手段で圧縮され、後で行なわれる再生のためにオーディオ/ビデオの同 期が得られるようにビット・ストリームS4の各ビデオ・フレーム内に含まれる オーディオ・データ・ブロックとして記憶される。
詳しく言えば、オーディオ信号Slはチャンネル選択塁とアナログ−デジタル( A/D)変換器ユニット208に印加される。このユニット208はコード化さ れるべきチャンネル数とそのチャンネル・サンプリング率を選択するための、使 用者が操作する制御器(図示せず)を具えている。単音の記録には1つのチャン ネルが、ステレオの場合には2つのチャンネルが、ステレオ/2国語の場合には 4つのチャンネルという具合に選択される。高品質のオーディオ記録に現在使用 されているサンプリング率は31.25KHzで、これは15K)Izのオーデ ィオ帯域幅を保証している。この率は、標準品質の場合にはその半分に、また肉 声級のオーディオ用途では4分の1にすることができる。
デジタル化されたオーディオ信号S5のデータ率は、信号S5のサンプル対サン プルの差をコード化して圧縮されたデジタル・オーディオ信号S6を形成する適 応型差動パルスコード変調(ADPCM)エンコーダ210によって、記録用に 低減される。順次連続するオーディオ・サンプルは屡々高度に相関しているから 、サンプルの差をコード化するに要するビットは少なくて済む、“適応型”とい う語は、そのエンコーダが、コード化された差のビットの重要度を以前にコード 化された差の関数として変化させて広いダイナミック範囲に亙って細かい解像度 を与える形式のものであるという意味である。
エンコーダ210は、通常の構成のものであってよいが、オーディオ/ビデオの 総合コード化という目的から、オーディオ・サンプルを充分な解像度をもって周 期的にコート化するように、それを周期的なベースでバイパスさせ或はリセット させるように構成されることが、非常に望ましい。たとえばエンコーダ21O( 第25図)は256バイトごとに1個リセットされる。ここで、オーディオ信号 は、最終的には1ブロツクのオーディオ・データがビット・ストリームS4中の 各ビデオ・データ・ブロックと共に含まれるブロック形式に編成されることを想 起されたい。オーディオ・データ”ブロック”の編成は信号S6を記録するバッ ファ・ストア212を介して維持される。後で、オーディオおよびビデオデータ が後述するように合成されるとき、フォーマット器250はこの記憶されている 信号S7を周期的にフレーム・パイ・フレームのベースで再生する。現在使用さ れている代表的なオーディオ・ブロックの大きさは、ビデオ・フレーム率が30 F P Sで肉声級のオーディオの場合に130および134バイトである。こ のオーディオ・ブロックの大きさは、サンプリング率、記録されるべきオーディ オ・チャンネルの数、およびフォーマット器250内におけるオーディオ・ディ ザによって決まる。
DPCMエンコーダ250を周期的にリセットまたはバイパスさせる1つの理由 は、CD−ROM伝送系内で生ずることのあるオーディオ誤差がフレームからフ レームへと伝播することを防止するためである。この特徴は、またその後の、ど のフレームでも編集点として選択できるようにシーケンスを編集することを容易 化する。この特徴は、圧縮されたオーディオ信号S6のパイl−・カウント(バ イトカウンタ216により生成された)がパイ1〜制限源218によって設定さ れたバイト限界値を超えたとき、オーディオDPCMエンコーダ211のリセッ ト入力Rにリセット信号を供給する比較器214によって、第25図に示される 形に実現される。
ビデオコード化の概要 第2図においてビデオのコード化を行なう主な要素は、前置圧縮処理器220、 デジタル・圧縮器230および出力信号フォーマット器250でこれらについて は第3図〜第47図を参照して詳細に説明する。概略を言えば、処理器220は ビデオ信号S2を非標準フォーマットに変換して可変量のデータ低減を行なうこ とにより、後続する圧縮を行ない易くし、かつ空間的時間的解像度を制御するた めの可変フレーム率処理に関係のある成る種のシステム特性に寄与する。幾つか の画像は、完全に異なる率で後で表示するために1フレーム率で変換される。
圧縮器230は、大まかに言えば、フレームを特定の“最適”値にコート化する ためにデジタル・データの量を低減する処理方法として4つの形式を採用してい る。
上記の値は、CD−ROMチャンネル容量に関係をもつものであるが、フレーム 率、所要の空間的時間的解像度およびその他誤差伝播や外観に関係のある諸因子 を含む幾つかの可変量の関数として変化する。上記した処理方法の形式は、静止 フレームに対する、および動きのあるビデオ・シーケンスの第1フレームに対す るフレーム内領域特定コード化を含んでいる。動きのあるビデオ・シーケンスの 第2以下のフレームに対してはフレーム相互間領域特定コート化が使用される。
コード化されたフレームは、圧縮器230の中で、この明細書で“エリヤ依存適 応型量子化”および“セグメント化されたストリーム可変長コード化”と呼ぶ2 つの処理によって、更にデータの低減を受ける。これらの処理を各ビデオ・フレ ームに与えて上記した所望の“最適”値に到達する。幾つかのフレームのシーケ ンスは、圧縮閾値を変えて繰返し圧縮されて、最適圧縮値に達する。
時として、極端に過大なサイズを持っていて、肉眼で見える程の不自然さを伴な うことなしに圧縮パラメータを変えることにより所望のバイト・カウントに低減 し得ないような“不可能”フレームに出会うことがある。その様な過大サイズの フレームはフォーマット器250内で特別な処理を受ける。フォーマット器25 0はオーディオ、ビデオ、補助(たとえば、相互作用)およびその他のデータを 組合せて記録用ビット・ストリーム信号S4を作り出す、具体的には、フォーマ ット器250は、最後(最新)のフレームに始まり第1フレームおよび短いフレ ームからの“借り”スペースまで逆向きに解析して。
過大フレームの余分データを保持する。フォーマット器250によって行なわれ る別の機能には、過小サイズのフレームに“パディングデータを付加し、フレー ム当りのデータのバイトの数をディザして、CD−ROMシステムがその最大チ ャンネル容量で動作することを確保しかつ再生期間に動作の絶え間(ポーズ)が 生じないように選ばれた特定平均フレーム率に到達するようにすることがある。
動作の絶え間は、CD−ROMプレーヤの再生時間(シーク・モード・ジーテン シイ)が長くなりかつ予測できないから避けるのである。
ビデオ処理の詳細は、次の5項すなわち“ビデオ前置圧縮処理”、“ビデオ圧縮 処理”、“後段圧縮処理”、“再生システム”および“ビデオ・デコード作用” の項で論議する。
ビデオ前置処理 前置圧縮処理器220は入力端子204(第2図)に結合されていて、標準ビデ オ信号S2を、特定形式の圧縮と後でエンコーダ16で採用されるフォーマット 機能とに特に適した非標準形式に変換する。具体的には、ビデオS2の各フレー ムは“前置圧縮”処理器220で変換されて、1つのルミナンス・サブフレーム と1対の色差信号サブフレームとより成る3つの個別成分を生成する、各色羨サ ブフレームは、元のビデオ・フレームに関してサブサンプルされまたはされてい ないルミナンス・サブフレームに対して成る所定量だけサブ・サンプルされる。
元のビデオ信号はアナログかデジタルであり、成分形式、合成形式またはマルチ プレックスされたアナログ成分(MAC)形式のような他の適当な形式のもので ある。
第3図、第4図および第5図は、信号S2がそのlフレームを第3図に示すよう なNTSC標準合成ビデオ信号であると考えられる場合のビデオ信号S2の1フ レームの前置圧縮処理を示している。第4図は前置圧縮処理の中間段を示すもの で、そこでは合成信号がRGB成分形式にデコードされ、同期およびブランキン グ期間が取除かれ、各RGBフィールドの“有効”ビデオ部分を表わすRGB画 素(ビクセル)アレイを形成するようにデジタル化されている0図示したこのア レイの規模は各RGB成分について水平512ピクセル×垂直240ビクセルで ある。
第5図は、前置圧縮処理の最終段を示し、そこでは第4図のデジタルRGBアレ イが、256 x240ビクセルの大きさの単一のルミナンス信号サブフレーム (Y)とそれぞれ64x 60ピクセルの大きさの2つの色差信号サブフレーム (IとQ)を形成するように変換されている。この3つのサブフレームは後続す る個別“カスタム”圧縮のためにメモリ(後で説明する)中に記憶される。第3 図、第4図および第5図を比べると、デジタルRGB形式(84図)では737 280バイトを必要とする信号S2の1フレーム(第3図)が、サブ・サンプリ ング、変換およびフォーマット処理(第5図)のあとでは69120バイトに低 減されて、30FPSと仮定した率に対して係数的11=1のフレームの実効デ ータ低減かなされることが判る。
第2図には、操作員による制御ユニット222が設けられていて、フレーム率の 関数として第5図のサブフレームのサイズを変化させ、コート化されたフレーム の時間的空間的解像度を変え易くしている。システムのこの特徴は、次いで行な われる信号の圧縮に次の様に関連する。CD−ROM記録システムは、前述のよ うに毎秒的1.2メガビツトのビット率を保つことができる。30FPS(毎秒 当りのフレーム)のビデに対しては、このチャンネル容量はフレーム当り512 5.12バイトのビデオ・バイトカウント(8−ビット/バイト)に相当する。
これによって、ビデオ用に典型的にはフレーム当り約4500バイトを利用する ことができ、残りはオーディオおよび他のデータ用に使用できる。ビデオ圧縮器 (後述する)は、30F P Sという仮定した率に対してフレーム当り691 20から4500バイトへ約15:lという別の割合で、このフォーマット化Y IQサブフレームを圧縮することによって、上記の要求に適合させる。もし再生 フレーム率が2分の1になれば、各フレームをデコードするのに利用できる時間 は2倍(15分の1秒)となり、また各フレームのコード化には9000バイト を利用できる。この増大したデコード時間と画像データの量は品質の改善された 画像を生成するのに種々の方法で利用することができる、たとえば、コード化さ れたフレーム中のビクセル数を増加させ、或は同数のビクセルをより高いフレー ム率(30FPS)で正確にコード化することができる。
第14図は、前述した、可変サブ・サンプリングとフォーマット変換機能を行な う前置圧縮処理器220の特定の装置を示している。処理器220は、合成ビデ オ信号をRGB成分形式に変換するRGBデコーダ1402を持っている。RG B成分は対エイリアシング(2MHz)低域通過フィルタ(1404,1406 ,1408)を介してプログラム可能な図形(グラフィック)ワークステーショ ン1410の入力に印加される。適当なワークステーションは“アデージ300 ロカラー・ラスタ・ディスプレイ・システム(Adage3000 Co1or  Ra5ter Display 5ystes) ”である、第2図の操作員 による制御ユニット222は、フィールド“スキップ・リスト″2ラインおよび ビクセルを、対エイリアス・フィルタ係数およびサンプル率制御データと共に、 ワークステーション1410に供給する端子ユニット222′(第14図)を持 っている。データ低減された、Y、!およびQサンプルのサブフレームが、この ワークステーションで生成され、ディスク記憶器1412に記憶される。
第15図は、ビデオ信号S2を処理して第5図の非標準サブフレーム信号フォー マットを作り出すために使用されるワークステーション1410の5特定プログ ラムされた形態を示すブロック図である。フィルタ1404〜14o8から供給 される対エイリアス濾波済みアナログRGB信号は、各アナログ−デジタル変換 器1502〜1506に印加される。これら変換器は、ワークステーションのタ イミングおよび制御ユニット1530に供給された端子222′によって制御さ れ、有効線期間当り512ビクセルを供給するように選ばれた率で上記の信号を デジタル化する。デジタル化されたRGB信号(第4図)はスイッチ151Oと 1514の2バンクによって、サブ・サンプルされる。スイッチ151Oは、R GB信号の1つおきのフィールドをスキップするようにユニット1530によつ てタイミング制御される。またスイッチ1514は1つおきのビクセルをスキッ プして、生ずるデジタル化されたサブ・サンプルされたRGB信号がそれぞれフ レーム当り2S6X240ビクセルのアレイを構成するようにする。
マトリクス1516はサブ・サンプルされたRGB信号をYIQ形式に変換する 。このIおよびQ色差信号は各々ルミナンス信号Yに対して垂直および水平双方 について4:1でサブ・サンプルされる。これは、水平対エイリアス低域通過フ ィルタ1518 (5001(Hz) 、垂直対エイリアス低域通過フィルタ1 520(60本/画面高さ)、4木の線のうち3本をスキップするスイッチ15 22.および4個のビクセルのうち3個をスキップするスイッチ1522によっ て行なわれる。フォーマット化されたY、工およびQサブフレーム信号(第5図 )は、次に、後で再生と圧縮を行なうためにディスク記憶器(たとえば、ハード ディスク・ドライブ)中の各サブフレーム位置に記憶される。
既に説明したように、濾波およびサブ・サンプリングのパラメータはフレーム率 に依存する変数である。第14図と第15図の特別の実施例ではこのフレーム率 を30F PSと仮定する。上記とフ1/−ム率が違う場合には、操作員が適当 な対エイリアス・フィルタ係数、スキップ・リスト5および変換周波数を、端子 222′からタイミングおよび制御ユニット1350に入力する。しかし、どの 様なフレーム率または解像度の場合でも、どの様な形式(アナログまたはデジタ ル成分、合成またはMAC)であれ元の信号は、第5図に示されるように、ルミ ナンス成分Yとこのルミナンス成分に対して垂直水平の双方向に濾波およびサブ ・サンプルされた1対の色差成分とより成る形式に変換されることが重要である 0色差成分IとQはここに実例として示されたものである。或は2このカラー成 分は、R−YとB−YまたはUとVのような他の形式であってもよい。
第14図の前置圧縮処理器22Gは、YUv線順次出力をYUVUV列並列出力 るMACデコーダなRGBデコーコー402の代りに挿入し、第15図中のRG B/YIQマトリクスを除去し、第5図のルミナンスおよび色差成分の個々の( 別々の)サブフレームに到達するに必要なサブ・サンプリング・パラメータを変 えることによってMACフォーマットのビデオ入力信号を処理するように変形で きる。また別の変形も可能である。たとえば、信号源は、濾波する前にYIQま たはYUV成分形式にデコードすることもできる。サンプリングは、RGBでも YIQについてでも行なうことかできる。
ビデオ圧縮処理 前置圧縮処理後、Y、IおよびQビデオ・サブフレームは、個々に圧縮するため ディスク記憶器14】2から1度に1つづつ再生される。サブフレームのこの順 次再生は、第2図にサブフレーム選択スイッチ224によって概念的に示されて いる。スイッチ224の図示の位置では、運動ビデオ・シーケンスの全Yサブフ レームを圧縮器230に印加し、この圧縮器は完全なサブフレームを圧縮しバッ ファ記憶器232中に記憶させる。次に、スイッチ224は進められてシーケン ス中の全Iサブフ1/−ムに対する圧縮過程が繰返えされる。最後に、シーケン ス中のすべてのQサブフレームに圧縮処理が施されてカラー・フレーム・シーケ ンスの最初の圧縮段階が完了する。或はまた、シーケンス中の次のフレームへ進 む前にこのシーケンス中の1つのフレームにおけるY、IおよびQサブフレーム を選択し圧縮処理をするようにスイ・ンチ224を進めることもできる。
圧縮された信号S9は、第7図に示すように5それぞれがサブフレーム(Y、I 、またはQ)の圧縮されたデータを後続させたパイストリーム・ヘッダ(H)よ り成る。3個の個別圧縮サブフレームを含んでいる。このヘッダは、そのデータ がどのサブフレームに対応するか、サブフレームのサイズ(水平および垂直方向 のビクセル数)、診断用の検査合計、3よびデコーダで使用する種々のテーブル を識別する。信号S9のフォーマットのこれ以上の詳細は第46図と第47図と を参照して後述する。
第7図の圧縮されたデータは以下ビデオ・データ“ストリーム”と呼ぶことにす る。
YIQサブフレームを個別に圧縮して圧縮されたデジタル・ビデオ・“ストリー ム”S9を生成する圧縮器230のこの特性は、圧縮効率を大幅に向上させる。
その一つの理由は、それらのサブフレームが同じ画像を表わしているとしても、 それら各サブフレームはその画像の相異なるカラー・メジャーを表わしているの で相互にドラマチックに異なフている可能性があるからである。たとえば、成る 画像は肌色を含んでいない、他の画像は青・綴糸の色を含んておらず、また別の 画像は全く色を含んでいないこともある。個別サブフレーム圧縮の別の理由は画 像を表わすコードの統計的分布に関係している。
可変長コート化が1つの圧縮ステップとして採用されている。可変長コードは、 コード化されるべきデータの周波数分布または統計に従って選ばれる。Y、Iお よびQコート化されたサブフレームの統計は異なるから各サブフレームに最適化 された個々の可変長コードが使用される。実際に、後で述べるように各サブフレ ームに対しては多数の個別統計的コードがある。
圧縮処理後、この圧縮されたビデオ・ストリーム(S10)はバッファ記憶器2 32から再生されてバイト・カウント・モニタ234とデコート・タイム・モニ タ236とに印加される。モニタ234はデータ・バイトの数を検出し、モニタ 236はビデオ・シーケンスの各個々のフレームに対するデコート時間を検出す る。各フレームにはオーディオ・データと補助データが付加されるので、平均バ イト・カウントは、ビット・ストリームS4中のフレーム当り許容されるバイト の総数よりも少なくなければならない、CD−ROMから30FPSで再生する ためにビデオ信号をコード化する場合に1フレーム当り利用できるバイトの平均 数は5125.12である。これはCD−ROMチャンネル容量をビデオ・フレ ーム率で除して決定される。モニタ234はビデオ・フレーム・シーケンスを通 じて累算された平均バイト・カウントを供給する(或は、モニタ234はフレー ム・パイ・フレームを基準としてバイトをカウントするように構成することもで きる)、このカウントは、信号SlOの平均バイト・カウントをフレーム当り4 500バイト未満に維持するように、圧縮閾値制御ユニット238中の圧縮閾値 をセットするのに使用される。これで、フレーム中にオーディオデータおよび他 のデータを後て付加するための余裕ができる。破線は、現在はエンコーダ16の 装置内で手動で行なわれている閉ループの手順を表わしている。
前述のように、4500バイトまで低減できない過大サイズのビデオ・フレーム は、より早期のフレームからスペースを借りることによってフォーマット期間中 に補償される。このメカニクスについてはビデオ後段圧縮の項で検討する。デコ ード・時間モニタ236は、圧縮されたデジタル・ビデオ信号SIOの各フレー ムを伸張させるに要する時間を測る。この測定は、再生システム8の処理器30 のようなデコーダに信号SIOを印加し、その処理器のデコード時間を測定する ことによって行なうことができる。−例として再生率が30F P Sの場合に は、フレームのデコード時間は30分の1秒を超えてはならない、このモニタが より大きなデコード時間を検出した場合には、閾値制御器238の閾値は、過大 サイズのフレームのデコート時間を低減するように調整される。
別の方法として、デコード時間の連続的な平均値を30分の1秒未満に維持する ように閾値制御器238を調整することもできる。その様な構想によって、許容 デコード時間を超過した場合でも圧縮処理を繰返す必要はない。
別の言い方をすれば、この平均値は個々のフレームがそうでなくてもなお容認で きるものである。続いて説明するように、再生システムは、短いフレーム(すな わち、デコードに要する時間が30分の1秒未満のフレーム)がデコード時間を 借りるという技法を使用することによって、再生率に何等影響を及ぼすことなし に、上記の様な時間的に過大なデコード時間に対処することができる。
過大フレームをコード化するこの代替法は、平均デコード時間が30分の1秒未 満で、再生システムがバッファ記憶器を持っている場合に適用する。再生システ ムが必要とするバッファ記憶の量はフォーマット器250 (w42図)内でモ ニタされ、もしそれが過量であったら、そのデコード時間を更に短縮するように 、閾値制御器を調整する。デコート時間モニタを使用するこの代替構想は、長い デコード時間を要するフレームをより正確にコード化できるので、望ましいもの である。
このデコード時間モニタは、また、ビデオ処理器30の既知のデコード時間特性 をベースにして、エスチメータで構成することもできる。このデコードのプロセ スをよく調べると、それは、それぞれが動作を完了するのに成る最大時間を必要 とするような、成る一定の数のきちんと定義された動作(“A”、“B″等と言 い得る)で構成されていることが判る。エンコーダは正確なビット・ストリーム を受け、これはデコーダで処理されることになる。従って、エンコーダは各フレ ームについて上記のような各動作が何回行なわれるかを正確に決定することがで きる。デコード時間の見積り値Tは次の簡単な積の総和である。
この総和において、A1項は特定のデコーディング作用が行なわれる全回数を表 わし、K4項はその作用の最大デコーディング時間を表わしている。その様な作 用の実例は、相対的、絶対的、DPCMおよびダイアト デコーディングを含ん でいる。更に、各デコーディング作用は、デコードされる領域中のどこにピクセ ルが在るかによって決まる数個の作用より成っている。その様なエスチメータの 使用を容易化するために、デジタル・ビデオ圧縮器はバ・ンファ記憶器232中 の各サブフレームに付帯するAiカウントを記憶する。デコーディング時間を見 積るための式(1)を使用する一例として、総計されるべき槍は、(1)第1の 定数のそれぞれを各フィル・データ倍することによって表わされる領域の数、( 2)各形式の領域に含まれているピクセルを各第2の定数倍した数、および(3 )各形式の領域に含まれているビクセル行を各第3の定数倍した数、である、デ コードされた全領域に共通のデコーディング段階を補償するため上記積の総和に は成る定数項が付加される。
第16図は、デジタル・ビデオ圧縮器230の簡略ブロック図で、この圧縮器は 、スイッチ224からのYIQが選択されたサブフレーム信号S8を受入れる入 力端子1602と制御器238から閾値制御信号Sllを受入れるもう1つの入 力1604とを持っている。第2図のモードスイッチ240はスイッチ240′ として第16図中に略示されている。
モードスイッチ240′が図示の通りアップ位置にあるときは5ビデオ・サブフ レーム信号S8をフレーム内領域特定コーグ1610に印加し、コーグ1610 は領域特定コード信号S12を生成してこれをモードスイッチ240′を介して ニリャ依存性適応型カンタイザ1630に印加する。こうして生じた量子化され た領域コート化法信号S14は、バッファ232(第2図)に記憶させるための 圧縮信号S9を生成する最終圧縮段階としてストリームセグメント化された可変 長コーグ1640に印加される。スイッチ240′の位置を上記と逆にするとビ デオ入力信号S8がフレーム相互間慴域特定コーダ1620に印加され、量子化 するためのフレーム相互間コー1く化法信号S13が選択される。この両コーダ 1610と1620は閾値制御信号Sllを受入れるように結合されている。
動作時、モードスイッチ240′はアップ位置をとって。
フレーム内コーダ1610を使って静止フレームおよびモーション・ビデオ・シ ・−ケンスの第1フレームをコード化するようにする。簡単に言えば、コーグ1 610はこのフレームを同じ様なピクセルより成る多数の小群に分割する。この 小群を“領域”と呼ぶ。各領域に対して、その領域中の全ビクセルの値を表わす ために成るコートが生成される。この技法によって、非常に大幅なデータ低減( 圧縮)が行なわれるが5それは領域がどこにあるか、それがどの程度大きいかお よびその領域のビクセルを表わすのにどの“フィル”値を使用するかを特定する のに必要なコードのパイ1〜数が非常に少ないからである。更に、各領域に対し て使用される特定コード化法は各領域の詳細な特性をベースとして適切に選ばれ る。個々に画像そのものを対象とするのではなく実際には画像中の個々の領域を 対象とする、このコード化構想を用いるこの技法(以下、′領域特定”コード化 という)は、可能な圧縮の量を大幅に増加させる。 (1) 領域などうして見 つけるか、(2)領域をどうしてコード化しまたはフィルするか、(3)良好な フィル値と不良フィル値をどうして識別するか、および(4)不良フィル値に対 してはどうすべきか、については第17図乃至第38図に図示および関連して説 明されている。
スイッチ240′がダウン位置をとったときは、モーション・ビデオ・シーケン スの第2フレームおよびそれに続く全フレームの、フレーム相互間コーグ162 0を使ったコード化が行なわれるゆこの、前とは異なるコード化モードを使用す る理由は、一旦第1フレームがコーグ1610でコード化されると、第2フレー ムおよびそれ以下のフレームはフレームと次のフレームとの領域の差を利用して “相対的”ベースでコード化できるからである。この領域の差による“相対的” コート化の一つの利点は、より小さな数が生成され、より小さな数により短いコ ードを割当てる可変長コード化によって、より少ないビットを使って上記より小 さな数を表わすことができることである。(1)時間的に前のフレームで対応す る領域を探す最良の方向をどうして見つけるか、(2)見つけたらどうしてその 領域をコード化するか、および(3)対応する領域が存在しなかったらどの様に するか、については第39図乃至第43図および第61図と第62図を参照して 説明する。
領域特定コード化法信号S12と313は、量子化器163Gにおいてこの明細 書中で“エリヤ存在性”適応型量子化作用という処理を受けて、更にデータ低減 される。フレームは、ビクセルの領域としてコード化されることを想起されたい 。各領域の大きさは画像全体のディーチルによつて変る。たとえば、高ディーチ ルの部分にはそれぞれ少数のビクセルを持つ多数の小さな領域かあることになる 0反対に、低ディーチルの部分にはより少数の領域しか無いがそれらの領域はそ れぞれ数10個または数100個のピクセルを含んでいる。量子化器1630は 、小さな領域は大きな領域よりもより粗に量子化する(従つて少数のビットしか 要らない)という具合に、領域エリヤ(すなわち、その領域のピクセル数)の関 数として領域データを可変量子化することによってデータの低減を行なう。この プロセス、およびこの量子化を事実上不可視的にする心理的視覚作用については 、第44図および第45図を参照して説明する。
量子化された領域特定コード化法信号S14は可変長ニーダ1640中で付加的 なデータ低減(圧縮)を受ける。要するに、画像を表わすデータは可成り複雑で ある。それは、領域がどの様に分割されかつフィルされているか、領域がどの様 にシフトされているか、を表わすデータ、双線形多項係数の形でフィル値を表わ すパラメータおよびDPCMおよびダイアト・コード化形式のデータを含んでい る、その特徴は各ビデオ・ストリームは多くの形式のデータを含んでいるという ことである。これらの相異なるデータは、各ビデオ・ストリームの個別“セグメ ント”中に生ずるようにフォーマットされる。コーダ1640は、ビデオ・スト リームの各個々のセグメントに対するデータの統計的発生回数を調べて、各セグ メント内で最も発生頻度の高いデータに最も短いコードを割当てる。これはスト リームな構成するY、■およびQサブフレームの各々について互に独立に行なわ れる。好ましい応用例では、この領域特定コートの異なった形式は、零に向って いわばバイアスされていて、小さな数は大きな数よりも発生の頻度が高く、従っ てコーグ1640によって短い可変長コートが与えられる。上述の“ストリーム セグメント化された”可変長コード化の詳細は第46図と第47図を参照して説 明する。
第16図の圧縮器230は、第17図乃至第47図に関して説明するデジタル・ コンピュータをプログラムすることによって構成された。このコンピュータとし てはデジタル・エクイプメント社(Digital Equipment Ca rporation)製のV A X 11/785型が選ばれた。典型的なモ ーション・ビデオ・シーケンスの場合に、フレーム当り数分の圧縮速度を得るこ とができた。圧縮器230の主たる目標は速度ではなくて最終的に表示された画 像の高品質である。この目標は、以下説明するここで“領域特定”コード化と名 付けた方法を使うことによってその大部分は達成される。
領域特定コード化は、2つの作用すなわち(1)画像を数個の領域に分割するこ と(領域化・・・・リジョナリゼーション)と、(2)各領域に対する“最適” フィル・パラメータを選択すること、で構成されている。これら2つの作用は、 第17図を参照して説明されるように同時に行なわれる。
第27図乃至第31図は2道トリ一分解と呼ぶ領域化プロセスの概観を示してい る。この単純化された例では、領域2702は4個のサブ領域(2704,27 06,2708,2710)より成り、各サブ領域内のビクセルは一様なグレイ ・レベル(たとえば、存在し得る256個のグレイ・レベル範囲からのレベル1 41 、112 、90および90)を持っているものとする。このサブ領域に おける上記ビクセル値の分布は非典型的なもので、それは2進トリー領域化がど の様に利用されるか、および得られた分解体がどの様に効率的にコード化できる か、を例示するために採り上げたに過ぎない、より一般的な形としては、この“ フィル”(すなわち、領域のビクセル値を表わすコート)は、線形式A、I+B 、+Cで表わされる0式中、係数Aは水平(X)方向における明るさのスロープ すなわち勾配、Bは垂直(Y)方向の勾配、およびCはその領域全体を通じての 一定のまたは一様な明るさレベル、を表わしている。第27図の例では、フィル の多項式A、+B、+Cにおける係数AとBは何れも零である。
2進トリー分解、一つの領域を半分に分割し次にこうして出来たサブ領域のそれ ぞれを半分に分割するやり方を、得られたサブ領域が効率的にコート化できる状 態になるまで続けることによって、行なわれる。サブ領域をいつ分割すべきか、 垂直か水平のどの方向に分割すべきかを決定する多数の構想については、後で第 17図の論議の際に説明する。第27図の場合にはその様な決定は容易である。
第27図で分割lと記した最初の分割は領域を水平方向に相等しい2半部に分割 することであるゆその上半部2704は単一の値141によって効率よくコード 化され、下半部は更に分解を必要としている0分割2によりこの残りの下半部を 更に垂直方向に2分割する。その右半部(2706)は値112により有効にコ ート化されそれ以上は分割されない、しかし左半部は更に水平方向に分割して2 つのサブ領域2708および2710にされ、それぞれ値90と98でうまくコ ート化することができる。
上記以外の領域化構想も可能である。たとえばカット・トリー分解では、一つの 分割方向をとるのではなく、2つの分割方向をとっている。これによって、第2 6図に示すような領域化が行なわれ、すなわち領域2602は4個の領域260 4〜2608を形成するように分割され、分割によつて出来た領域の1つ(26 08)は更に4個の領域を形成するように分割される。2進トリー領域化は好ま しいモードである。その理由は、通常このモードでは分割によって出来る領域の 数が少なく、従ってビット数もデコート時間もより少なくなることが判ったから である。
第28図と第30図は、第27図の例における、絶対フィル値のコート化と領域 の位置を示している。ここでいう“絶対”とは、コード化される領域の領域デー タからだけ得られるフィル値を意味する。また、“相対的”とは、フレーム相互 の領域の差をベースとした領域フィル値を表わす、第28図のコーディング図2 802の逆トリー状構造は領域2702の順次分割態様を表わしており、各校が 先端で2本の枝となるように別れているので、“2進トリー”と呼ぶ、このトリ ーの頂部の節点(トップノード)は全体の画像を表わしている。またトリーの末 端節点はその領域フィル値でコート化されている。
完全なトリーを説明するためのコード(第30図)は2つの形式のデータ、すな わちフィル値である“値”と分割またはフィル命令である“作用″ (アクショ ン)で構成されている。この“作用”と“値”は同じコード“スペース”を使っ てコート化される。すなわち、それらは各々可変長コート化された非負性数より 成る。しかし。
前後関係または背景、すなわちコート・シーケンス中における作用または値の位 置に基いて作用と値との間の識別を行なうことは、常に可能である。たとえば、 第28図の例でいえば、1つの“フィル”作用に出会えば次の数は必ず“値”で ある、この“値”の次のものはまた必ず別の“作用”であるという具合になる。
更に詳しく説明すると、このトリー説明データは次の規則に従って順番が決めら れる0分割が行なわれている各節点には、“頂部”の節点(水平分割の場合)ま たは“左”の節点(垂直分割の場合)に関係するデータがすべてリストされてお り、それに他の節点に対する全デー夕が続いている。これは本質的に、そのトリ ーの根源である節点(ルートノード)に始まってトリーの全末端節点に達するま で順次トリーの各節点に対して続く繰返し過程である。第28図に示したトリー の例に対しては、上記に従って第30図に示された様なトリー・コードか得られ る。この短いコードは元の画像の形状寸法と共に4全領域の大きさと位置および 画像2702中の全ピクセルの値を特定するに必要な全情報を与える。記号“H ”およびv″は水平および水平方向の分割を表わしている。また記号“F″はフ ィル作用を表わす。
第29図は、第27図の領域に対する2進トリー・データをコード化するための 、上記とは別の好ましいフォーマットを示している。これは、フィル・データが 終端節点の実際の値としてではなく節点の差とコード化されている点で、第28 図の方法とは異なっている。この方法では、実際のフィル値を再生するためにデ コーダ中で計算をすることが必要であるが、コード化された値が数値的に小さい という利点がある。たとえば、第3o図の値141.90、98.112と第3 1図の値−6、−38,18,8と比較されたい、これらの値は可変長コードを 使ってコード化されるから、この方法はコード化効率が高い。それは、この方法 が2値の統計を小さな数に向ってより強く重み付けするからである。
第29図に示す2進トリーを得るコード化過程は次のように行なわれる。最初に 第29図の2進トリーを生成するコード化プロセスか行なわれる。次に、同一分 割点からの末端節点におけるフィル値の対の差をめて平均化する。この差の値を その分岐点に与える。この値は続いてコート化されてトリー説明になる。上記の 平均値もまたその分岐点に与えられるが、その目的はトリーを上方に逆行して働 く他の節点のまたは分岐点の値を決定するためたけである。すなわち、この平均 値は、並列分枝の対応する節点からの絶対値または平均値と平均化されかつ差を められる。この差の値はコート化されるべき値としてその分岐点に与えられ、ま た新しい平均値は、1−リーを上方に階段的に作動させる次の差値および平均値 を決定するのに使用される。差は、左側の節点または分校の値を右側の節点値か ら差引いてめられる。
図示の例では、末端節点値90を末端値98から減算してその差値+8を作り出 し、これを“分割3”と記した分岐点に割出てる。2つの節点値の平均すなわち (90+98)/2−94も、この分岐点に括弧書きの形で与えられる6分岐点 “分割3″におけるこの平均値94は、末端節点値112とその差をめられると 共に平均値を算出する処理が行なわれて、差+18と平均<103>が算出され 5これらは“分割2”と付記した分岐点に与えられる。このプロセスは、最初の 分岐点に達するまてI〜ソリ一体を上方に向って実行される。
頂部節点を値128と比較することによってこのトリー頂部節点において更にコ ード化効率を得ることがてきる。すなわち、頂部節点に対して決められた平均値 から値128を減算する。この例では頂部節点または分岐点における平均値は1 22である。122から128を差引けば値−6が得られる。この値はコード化 されたトリー説明の最初の位置に割振られる。
このトリー説明は、第31図のA″行に示されていて1発生する順番に値−6, それに続いて第1分割点の方向″H”、更に続いて第1の分枝な指定する差値4 統いて左側の分枝をフィルすべき指示、更に続いてその分岐点に与えられた差値 等を含んでいる。このコートは第30図の場合と同じ数の指示を含んでいるが、 より小さな数値の値をもっている。
デコーディングには、最初の2節点の平均値(141と分岐点に“分割2″)を 、値−6と+128の加算により値122として算出する。この値は、RとLを それぞれ左側節点の値および右側節点の値または平均値とするとき、(R+L) /2に等しい、コートによりて伝送された差値−38は(R−L)すなわちR− L = −38に等しい。しかし、(R+L)/2=122である。これらの式 を同時に解くと、左側節点の値しは141に等しく右側分枝の平均値Rは103 に等しいことになる。このプロセスをトリー上で下方に向って継続する0時とし て、上記した平均化を行なうのに奇数を2で除算する必要が生ずることがある。
これは、エンコーダとデコーダが同じ切捨てまたは丸め手法を行なうようにして 対処することができる。
前記した2進トリー・コード化法では負の数をコード化する必要がある。これは 、次のようにして行なう、すなわち、正(またはO)の数Pは正の数22により コード化し、負の数Nは正の数である21N+−1によってコード化する。する と、正の値(2P)はすべて偶数であり負の値21N1−1はすべて奇数である から、正と負の数は区別することができる。この技法によって、固定ビット幅の コートワードの最上位ビット位置に符号ビットを入れる必要が無くなり、小さな 値の場合にこの符号ビットと値ビットとの間の余分なビットを省略することがで きる。このコード化法を使用すると、このトリー・コートは第31図のB”行の コード中の値をとる。
更に効率的なやり方として、“作用”と“偵”を相異なる可変長コードを使って コード化することが有効であることが判った。相異なる作用の数は少数に過ぎず 、一方より発生率の値が多数あるので、その統計は大幅に異なっている。従って 、別々の可変長コードを使用すれば、成る程度余分にコードの節約ができる。
上記の説明は、具体的には定数による絶対フィルを含む画像に適用される。実際 には、絶対、相対的、DPCMおよびダイアトの計4形式のフィルが現在使用さ れている。これらのフィルは、それぞれ固有の別々の作用コードを持っている。
上記した節点値は絶対フィルに適用するだけである。他の3つの形式のフィルに 対するフイル値は、相異なるコード“セグメント”に別々にコード化され、後で 分割/フィル セグメントと組合わされて全体的なビデオ・ビット・ストリーム を形成する。多数のコート・セグメントを使用することについては、後記の“セ グメント化されたストリーム可変長コーディングの項および第46図と第47図 に関する論議の中で説明する。
垂直方向の分割Vと水平方向の分割Hが発生する確率はほぼ同等である。この情 報をコード化するまた別の方法が発見され、それは平均に一層少数のビットを使 用する方法である。大抵の分割はその長辺を分割する(たとえば、第34A図中 の領域3402と3404)傾向にあることが判った。その様な分割を単純分割 と呼びSとコート化される。もしも対象とする領域の辺長が等しく、それを水平 に分割するとすれば、単純分割としてSが付加される。このコート化はデコーダ にとってあいまいなものではない、それは、その領域の辺長は利用可能でありも しそれらが等しければ分割コードSを水平分割と解釈するからである。“単純” 分割でない分割はすべて代替分割と呼ばれるAとしてコード化される(たとえば 、第34B図に示す領域3406および3408) 、単純分割の発生確率はよ り大であるから、単純分割を表わすのにより短いコートを割当てることにより、 可変長エンコーダは平均に少数のビットを使うことができる。このコート化構想 によって、第29図のトリーは第31図の“C″行を介してコート化されること になる。この方法はコートの大きさを減少させるが、単純分割コードおよび代替 分割コード(SとA)から垂直および水平分割作用(VとH)を推論する必要が あるためにデコード時間が長くなる不利がある。
相対的またはダイアト コード化された領域(後述する)を含む画像に対しては 、その領域シフト値(Xo。
X、)も、また、2つのシフト値が後続する別の作用を使って、分割/フィル  トリー説明にコート化される。
後で説明するように“シフト”値は与えられた成るフレームの領域とそれより前 のフレームの対応するフレームとの間の水平(Xo)と垂直(Yo)方向のずれ の大きさである。このシフトは1つの領域のフレーム間での動き(モーション) の大きさである。それらの値は、更にコート化の効率化のために、個別にではな くトリー説明にコート化される。多くの領域が同じX、、Y、値を持つ傾向があ るから、この“シフト”作用は“この節点および節点の子節点のすべてのものに これらのX、、Y。
値を与えること”を意味するものと定義する。都合のよいことに、こうすると、 同じシフトを有する領域のシフト値をただ1回だけでコード化できる。
第17図とこれに関連する第18図乃至第38図は、モーション・ビデオ・シー ケンスの全“静止”フレームと第1フレームとをコード化するフレーム内コーダ 1610の詳細を示している。第17図は、コーグ1610によって行なわれる コート化プロセスにおける各ステップを示す流れ図である。このコーグ161O の“ソフトウェア”構成は現在好ましいものである。しかし1個々の処理機能は この流れ図に示された諸機能を行なう装置の個別素子によって容易に具体化され たことが、諒解されよう、第18図乃至第38図にはその様な“ソフトウェア” 構成の具体的な語例が含まれている。
フレーム内コート化(第17図)の最初のステップはスタート(START)ス テップ(1702)より成り、これは静止フレームまたはモーション・シーケン スの第1フレームに対してモード・スイッチ240′をアップ位置(第16図) におくことで開始される。同時に、スイッチ224(第2図)はYサブフレーム を選択するように置かれる。このYサブフレームは、スイッチ224をIサブフ レームをそして最終的にQサブフレームを選択するように進める前に、すべて圧 縮される。
概観すると、第17図には主たる4つの作用がある。ステップ1703では前置 濾波が行なわれる。ステップ1730と1732および1704によってサブ領 域の積重ねと選択が行なわれる。これは、サブ領域の大きさに関係なくどのサブ 領域にも同じ構想を適用できる、プロセス(後述する)である、ステップ170 6から1716によって行なわれる線形フィル・コード化は、領域が平面(A、 +B、+C)としてコード化するに適当であるかどうか、もし適当であれば、コ ード化のどのディーチルとすべきかを、決定する。 1722と1724によっ て与えられるDPCMコード化は、線形フィルコード化に適当できない領域に対 して使用される。ステップ1720は、コート・サイズとデコート時間を更に減 少させるために、決定されたコート化に対して後段処理を行なう、ステップ17 34と1736によって行なわれる処理は、静止フレームのシーケンスの終了点 またはモーション・シーケンスの第1フレームの終了点のチェックである。
第17図における最初の作用は、ビデオ信号S8の“画像”にフィルタ(濾波処 理) 1703を施すことである。この濾波処理によって不要なディーチルが除 かれて圧縮プロセスの速度が改善され、コートの大きさが減少し、またより大き な領域が生成され易いのでデコート時間が減少する。単純な低域通過フィルタも 画像をぼけさせ易いので、低振幅の雑音を除去し高振幅の情報を維持する非線形 フィルタが好ましい、この目的に使用し得るフィルタとしては多種多様なものが あるが、好ましい形式は荷重メジアン(weighted median)フィ ルタと変形した線形低域通過フィルタとを縦続接続した形のものである。この変 形は第36図を参照して後述する。
第35A図乃至第3SE図に荷重メジアン・フィルタが例示されている。第35 A図は濾波処理されるべきピクセル3502と、それに最も近い位置にある8個 の隣接とクセルを示している。第35B図は、第3SC図に示されたこの1個の ピクセル3506に対する重み値を生成するためにピクセル3502を濾波処理 する重み係数のアレイ3504を示す。
この荷重法は第3SDに示されている。先ず、ビクセル3502とその8個の隣 接ビクセルの値が昇数順(アセンディング・オーダ)にリストされる(3503 )、荷重されないメジアンはli”単位(ユニット)の値を持っているように見 える。それらの値の半分は高く残りの半分は低い。第3SB図からの重み値(3 504)が上記順序にリストされた値(35Q3)の直下にリストされる。それ らは、順序づけされたリストを形成するために6値が繰返される回数を決定する 。この例では、4隅のビクセル(11,9゜1.17)は重み1を有し5リスト 3508に1回リストされる。側辺中央のビクセル(12,5,1G、13)は 重み2を有し、リスト3508に2回リストされる。濾波処理されるべき中心ビ クセル(15)は重み5を有し、リスト3508に5回リストされる0重み付け されたメジアン値(12)は、重み付けされた値の半分は小さく他の半分は大き いようなりスト3508から取られた値である。この値(12)は、第35C図 に示された(3506)領域3503の中心ビクセルの濾波された値である。残 りのビクセルは、重み付はアレイ(3504)を各ビクセルとその隣接8個のビ クセルに適用することによって、同じ様にして決定される。
第3SB図の重みは、リスト3508を適当に短くしておくための例示用に選ば れたものである。平均情景に対する典型的な重みは、第3SE図に示されたとお り、隅の重み付けは2、側辺中央に対する重み付けは4で中心ビクセルに対する 重み付けは13であることが判る。これらの重みを変更して、輪郭(エツジ)の 過渡部を維持しながら、方向性をもった空間的ディーチルを制御された向きに再 方向付けできるようにすることは可能である。たとえば、隅の重みを変更するこ とによって濾波処理された値に対する対角線方向の効果(contributi on)を変えることができる。垂直および水平方向の効果は、上辺の値および下 辺または左辺および右辺の重み値によって、それぞれ決定される。従って1Mみ 付けされたメジアンは。
メジアン・フィルタであるために輪郭が維持されることに加えて、この重み付は 係数によって選択的な方向特性を呈することができる。
第31iA図、濾波処理ステップ1703で使用するに適する変形された低域通 過フィルタを示し、この処理では輪郭の過渡部を維持しつつ重要度の低いディー チルが除去される。このフィルタは、線形トランスバーサル・フィルタ3602 とモディファイヤ3620 (両者とも破線枠で示す)の組合せで、構成されて いる。簡単に言えば、このモディファイヤは輪郭を検出して“ダンピング係数D ”を発生する。この係数は、この低域通過フィルタの入力信号と出力信号とを輪 郭振幅の関数として混合しそれによって信号の大きな過渡的変化は維持しながら 小さな変化を抑制するのに、使用される。フィルタ3602は、入力端子360 8における入力信号を1ビクセル期間および2ビクセル期間だけ遅延させる。ビ クセル遅延素子3604と3606の縦続接続体より成るものである。加算器3 61Oは、入力信号(重みはl/4)、ビクセル遅延信号(重みはl/2)およ び2ビクセル遅延信号(重みはl/4)の荷重総和を作ることによって、低域通 過濾波処理された信号を生成する。モディファイヤ3620は、遅延素子360 4によって生成される未濾波の1ピクセル遅延入力性号から、加算器3610の 低域通過濾波された信号を減算することにより過渡的変化を検出する減算器36 22を持っている。減算器3622の出力は、相補性の制御信号りと1−Dを生 成する非線形検知器3624に印加される。制御信号りと1−りは、濾波処理さ れたビクセル遅延信号と濾波処理されていないビクセル遅延信号とを逓倍する乗 算器3626と3s28をそれぞれ制御する信号である。加算器3630はこの 逓倍された両信号を加算して端子3632に出力信号を発生する。検知器362 4は、減算器3622からアドレスとして印加される差に応じて値pと値!−D とを出力するようにプログラムされたROMのようなもので良い。
第36B図は、減算器3622の出力(差信号)の関数として制御信号D(以下 、ダンピング係数という)と1−Dとを生成する検知器の非線形特性を示してい る。画像の小さなディーチル特徴の小さな差の特性に対しては、係数りは1に近 い、従って1乗算器3625はその出力として加算器361Oの濾波済み信号を 選択する。過渡的変化が大きいとDの値は減少し、一方信号1−Dの値は増加し て、乗算器36z8は出力として濾波されていない信号をより多量に選択するこ とになる。非常に大きな過渡的変化(Dが零に近い値)に対しては、フィルタ3 602は事実上バイパスされ、大きな輪郭の全振幅を忠実に維持する。
これは更に第36C図に示されており1図中3640は中空円で表わされている 入力ビクセルに対するステップ状(過渡的)変化の発生を示している。破線36 42は、在来の低域通過フィルタの応答を示し、このフィルタは図示のようにビ クセルの大きなおよび小さな変化の双方とも平滑化する傾向を持っている。黒丸 は第3SA図の変形フィルタの応答を示している。この過渡的領域に近づくビク セルおよびそこから遠ざかるビクセルに対しては、ダンピング係数りは小さく、 そのため小さなビクセル変動(ディーチル)は濾波除去される。この過渡的領域 ダンピング係数が小さいことによって、フィルタはバイパスされて、急峻な過渡 状態を維持される。
また第17図に戻って、ステップ!704.1730および1732は、次の解 析のために領域の選択とリストとを行なう。
このプロセスは可能性のある2つの効果のうちの1つを持っている。その1つは ステップ1716または1724を介して領域のコート化を行ない、従ってその 領域が他の解析を受けないようにする。或いはまたその1つは、その時の領域を 分割するようにしく1726)、その両半部を更に検査のためにリストに入れる 。各分割によって領域の大きさが減少する。この領域が充分小さくされると、最 小大きさの領域であるかどうかのデストを受ける(1722)、このテストは、 際限のない分割作用を阻止して、すべての領域に究極的なコード化を施すように する。
初めに、領域選択ステップ1704は、画像サブフレーム全体を1つの単−値域 として扱う、この処理を行なフている間に、分割1726−1732が発生する 可能性があり、従9て処理を要する2つのサブ領域が生ずる可能性がある。ボッ クス1730と1732は、2つの領域を、1704によって除去されるために 待機している領域のリスト中に“押し込む”、′押し込む”とは、その領域指標 (regionidenties)すなわち位置が領域リストに記憶されること を意味する0次に領域選択1704を使って、リストの頂部にある領域を後述す るようにしてコート化する。諸領域が処理される順序はそれらがこのリストに配 置された順序によって決まる。水平分@(1732)の場合には下半@値域と上 半部領域とが各々リストに加えられ、先ず最初に上半部領域がコード化される。
垂直分割(1730)の場合には、右半部領域と左半部領域が、その左半部領域 が最初にコード化されるような具合に、リストに加えられる。
領域がどの様に検査されるかのこの順序正しいシーケンスは、ビデオ処理器30 (第1図)が知っていて、この処理器は、各画像を表わすために使用されるコー ドのシーケンスを判断するためのデコーディング期間に、それを使用する。
以下説明するが、ステップ1704−1715によフて線形フィル・コード化が 行なわれる。領域特定コート化は各個々の領域について最適のコード化構想を選 択する能力からその長さを決めることを想起されたい、線形フィル・コート化が 最初に試されるが、それは大きな領域を非常に少数のビットで記述できるからで ある。線形フィル・コード化がもし出来なければ、その領域は分割(1726) されて、その各サブ領域に対して再び線形フィル・コード化が試される。容易に 理解されることであるが、線形フィル技法を使って1つの領域をコート化するに 必要なビットの数は、領域の大きさが大きくなワても増加せず、従ってこの技法 は大きな領域に対する優れたコード化法である。得られたサブ領域が最小大きさ よりも小さくなった(テスト1722)ときのみ、また別のコート化技法が使用 される。
平均2乗誤差基準(M S E = Mean 5quare ErrorMe asure)は線形フィル・コード化を採用できるか否かを決めるのに使用でき る一つの方法である。この基準はその領域全体の平均であるから、領域内には単 調な表面からの変位が非常に大きく視覚的に顕著な部分が局在していることがあ り、それでもそのMSEは許容可能な低さである可能性がある。この欠点を除く ために、線形フィル・コート化(1710)を試みる前にその領域に対して粗さ エスチメータ1706を適用する。もしその領域がこのテスト(1708)に合 格せずかつ最小大きさでなければ(テスト1722) 、その領域は分割され( 1726−1732) 、その結果形成されたサブ領域に同じ処理を施す。
この例における領域の粗さはその領域の輪郭を検出することで決定できる。第1 8図は、隣接するピクセル相互間のグレイレベルにおける大きな変化をベースと する輪郭の単純な定義を示している。第19図は輪郭の検出を行なう装置のブロ ック図である。
第18図には、4行4列のピクセルから成る領域1802が示されている。ルミ ナンス(Y)信号の値がその16個のピクセルに示されている。定義に従って、 隣接ピクセルの値がある閾値(閾値制御器238を介しての入力)を超えるとき にその隣接円ピクセル間に輪郭があることになる。典型的な閾値は、たとえば8 ビウトに量子化されたY信号(すなわち、黒と白ピーク間のスケールが256レ ベルのY信号)の場合25単位である0輪郭の一例閾値として明るさlO単位の レベルを使用すれば、第18図には2個の垂直輪郭(V)と3個の水平輪郭(H )があることが判る。
もし、領域1802が行2と3の間で水平方向に“分割”されると、共に水平輪 郭を含んでいない2個の領域が作られる0行3と4のピクセルは明るさが3から 5の範囲にあるだけで、それらは輪郭閾値に満たないことも注目されたい、この 様に、領域1802を水平に分割すると、水平輪郭を持つていない2個の領域と 、86のピクセル全部のY信号値をかなり良く表わす“フィル”値“4″でコー ド化できる1個の領域(行3と4)が形成される。
しかじ行lと2はなお垂直輪郭Vを持っている。この領域を列2と3の間で垂直 に分割することによって、また2個の領域が生じそれらは共に輪郭を含んでいな い、均一なピクセル値″23”を含んでいるこの4×4領域は1つの値でフィル することができる。ピクセル値1.3.9および12を持っている4X4領域に は水平および垂直輪郭はないが、明らかな“勾配”があるので1つの値で“フィ ル可能”ではない、その様な領域をフィルするには1710を介して単調な表面 フィルが必要になる。
このフィル手順は、最小2乗法を使ってその領域のピクセル値の双線形多孔(A ll +Bll +C)概算式の係数A、B、Cを見出すことによって、ステッ プ171Oで開始される。境界誤差とMSE誤差の測定が行なわれ(1711) 、かつテスト1712と1714が行なわれてそのフィル値の許容性が決められ る。
もしテスト1708.1712または1714の何れかの結果から線形フィルが 許容し得るものでないことが判れば、次のステップは通常その領域を分割(17 26)することである。
しかし、もしその領域の大きさが既に小さいものであれば1722におけるテス トは分割することを阻止する。これは2つの理由からその様にされる。第1は、 線形フィル・コード化のためのコートの大きさは、名目上その領域の面積と無関 係である。しかし、その値域が一旦ある所定の大きさよりも小さくなると、他の コート化法では必要ビット数がより少なくなる。第2に新しい領域をデコードせ ねばならないときにはデコーダ(第48図)には必ず遅延が伴なう、もしも画像 が多数の比較的小さな領域を使って表わされていると、上記の様な遅延は、その 画像をたとえば30F P Sの速度でデコードする条件を充分に妨害するに足 る大きさになる可能性がある。
最小大きさテストで最小大きさの領域であることが表示されると、 1724は その領域をD P CM (DifferentialPulse Code  Modulation ・・・・差動パルスコード変調)フォーマットにコード 化する。このコード化法では2各ピクセルとその左隣りのビクセルとの間の差が 伝送される。しかし、領域内の各行の第1ピクセルに左隣りのビクセルが無いの で、それはそのピクセル自身とその直上のビクセルとの間の差として伝送される 。その領域の第1行のビクセル(その左隣りにも直上にもビクセルが存在しない )は、そのビクセルと中心グレイ値すなわち128との間の差として伝送される 。この様にして得られた差は、非線形カンタイザを通過させることによって、更 にデータを低減することができる。デコーディングのために、非線形量子化レベ ルを記述したテーブルが、圧縮されたビデオ・ビット・ストリームのヘッダ部を 使つてデコーダに伝送される。
多数のDPCM量子化器(カンタイザ)を使用することができる。領域特定コー ト化は個々の領域に対してコード化法を適合させ得るので、上記のやり方は実用 的である。それらのカンタイザ・テーブルはその差のダイナミック域で異なる。
DPCMエンコーダ1724は各領域の統計を検査してどのカンタイザ・テーブ ルかその領域に良く適合するかを決め、それをデコートするにはどのデカンタイ ジング・テーブルを使用すべきかを特定するコートを発生する。
第19図には粗さテストを行なう装置を示されている。
ts23図および第33図には、後で説明するが、分割方向を決定するための装 置が示されている。第19図において領域データはメモリ1902中に記憶され る。減算器1904と1906は領域のビクセルを行相互間でおよび列相互間で 、それぞれ減算する。閾値検知器1908と1910はピクセル相互間の差と閾 値Th(たとえば、10と仮定する)と比較して水平および垂直の輪郭を検出し 、この検出された輪郭はカウンタ1912と1914でカウントされて輪郭メモ リエ916に記憶される。この記憶された輪郭データは零検知器1920に印加 される。検知器1920のHIGH(高)出力は、その領域中に水平または垂直 の輪郭が存在しないことを表わし、その領域をフィルする値(または複数の値) を見出すプロセスが始まる。もし輪郭が存在すれば、メモリ1916中の輪郭デ ータは後述するように分割方向を見出すために分割論理回路(第33A図)に印 加される。
粗さに関して上記とは別の定義をすることも可能である。たとえば、多点(マル チポイン1−)補間法を使って隣接ピクセル間の勾配を推定算出することができ る。もし、この勾配がある閾値より大きくかつ領域全体を通じて一定でなければ 2その表面は粗いとする。
第17図に戻って、テスト1708はその領域に輪郭が存在しないと判断したと しよう、これによって領域内の全ビクセルを1群として表わすフィル偵を見出す プロセスが始まる。これは、′最小2乗″概算法を使って、その領域のピクセル 値の双線形多項概算式(Aオ+B、+C)の係数A、B及びCを発生することに より、ステップ1710で行なわれる。*算で得られたビクセル値はその領域の 全ビクセルについて実際の値と比較して、その概算の近似度または“フィツト“ が決定される。“フィル”値は、′境界誤差”テスト1712と“平均2乗誤差 ”テスト1714の2つのテストを満足する上記多項式中の係数A、BおよびC で構成される。
第20区乃至第24図は、多項フィル値がどの様にして見出されるか、およびフ ィル許容性如何に関する2つのテストがどの様に実行されるか2の詳細を示して いる。第20図は、領域2002内の全ビクセルが同一値(5単位)であるよう な最も基本的な事例を表わ1ノている。水平(“X″)方向に明るさの勾配が無 いから、水平方向の明るさの勾配または“スロープを表わす係数Aは零に等しい 、また、垂直方向にも明るさの勾配は存在しない。徒って、垂直スロープを表わ す係数Bも零である。
残った唯一の係数Cは、一定のすなわち一様な信号レベル、5単位、を表わす係 数である。この単純な事例を表わすコードは、ABSOO5と示されていて、フ レーム相互間の差をベースとする領域コード(以下、相対的コートという)から 実際の信号値に甚く領域コードを区別するために、以下絶対コード化と呼ばれる ものを表わしている。領域2002のデコーディングは領域中のすべてのビクセ ルに値5を与えることから成る。
第21図では2gi域2102はX方向についてピクセル当り1単位の水平方向 の明るさ勾配をもっている。その値は左上隅から始まって4.5.6と表示され ている。従って、フィル多項式A、+13.+(の係数は、A=1.B−O,C =4 (左上部のビクセルを基準レベルとして)である、このコードは、上記よ りABS 104である。
このコードは、左上部のビクセルに値を与え各水平ピクセルにはビクセル当り明 るさ1単位の勾配補正を加えることによって、デコートされる。垂直方向には勾 配が存在しないから22行目以下の行は第1行の複製である。
第22図は5勾配が水平方向にでなく垂直方向にある点以外では上記事例と同様 である。
第23図に示す領域2302は水平と垂直の双方に勾配がある。左上隅のビクセ ルを基準にとると、多項式の定数Cは5に等しく、その明るさはX方向にはピク セル当り1単位ずつ増加し、y方向には一1単位ずつ変化している。従ってこの コードはABSI −15である。デコーディングは、第1のビクセルに値5を 与え、水平方向にはビクセル当り1単位ずつその値を増加させることによって行 なわれる。2行目および3行目は5出発点のピクセル値を垂直勾配値(1列当り −lビクセル)により減少させた後、上記と同様にしてデコードされる。
上記した実例は、多項式A、+B、+C中の勾配値AとBは常に整数であること を示唆している。しかし、実際の画像中に生じる大多数の勾配は整数ではなく、 絶対値が通常1未満である。従ってAとBの値は1/256を単位として特定さ れる。すなわち、下位の8ビツトで勾配の小数部を表わしている2進数で特定さ れる。
第20図乃至第30図における多項式コート化は正確である。すなわち、与えら れた例示用の値に対して、デコーディングして得られたデコート済領域は正確に 元の領域と同じ値を持つことになる。実際にはこの理想的状態がそう度々起こる ものではない、そのために、領域を最終的にデコートした場合に双線形多項式の フィル値が実際のビクセル値に適切に近似した複製を生成するかどうか24図に 示されるように、多項式フィツトの、平均2乗誤差(MSE)および境界誤差テ ストである。
第24図は、多項式フィルが正確なものでなくそのフィツトの許容性がテストさ れるという形の特殊事例を示している。領域2402は、画像中に現われる時の ビクセル値の領域である。アレイ2404は、領域2402のデータの最小2乗 法による解析を使用してその係数を決めたA、+11sy+C形の多項式を使っ て生成される、値の対応セットである。アレイ2404は、一様な水平勾配置と 一様な垂直勾配置を示している。アレイ2406は、実際のビクセル値を発生し た対応ピクセル値との間の誤差に相当する値のセットである。アレイ2406中 の値の2乗の平均値の平方根をとれば、MSEが得られる。この特定例にあって は、MSEはlである。この値を閾値と比較して、そのフィル・データが許容で きるものか排除すべきものか決定する。
境界誤差はこの領域の境界を構成する12個のピクセルの解析をベースとしてい る。境界誤差は、もし隣接する領域間で間違った輪郭が発生しなければ、領域内 部における誤差よりも厳しい許容度を要することが判った。1つの可能な境界テ ストはアレイ2406中の各境界差の値を所定の閾値たとえばlOと比較し、も しどの境界値でもこの閾値を超えるものがあればその係数を不合格としてはねる ことである。
境界テストの好ましい実施例は、値のコヒーレンス(一貫性)を探し出す、境界 誤差は、それらがコヒーレント(一貫性をもっている)とき、すなわち隣接ピク セルが同一符号の誤差を持っているときに、より目立つことが判った。アレイ2 406の頂部、下部および左側に沿って生じた差のような不規則な差は、再生さ れた画像中に間違った輪郭を作る可能性がない、好ましい実施例では、境界エス チメータ1711が同一符号を持っている境界誤差の連続ブロックを識別する。
長さが閾値(閾値制御器238から供給される)、典型的な値は2、より大きな ブロックの一部である境界ピクセルのみについて考察する。たとえば、第24図 のアレイ2406において、右の境界について値+1を有する誤是僅のブロック だけを、かつ発生した境界誤差の量が“1″である場合について考える。その様 なコヒーレント・ピクセルの平均ブロック誤是値を閾値と比較する。もしこの誤 差が閾値な超えればそのフィルは不合格としてはねる。
要約すると、1712と1714のテストはAX+B、+Cで表わされるフィツ トが許容できるかどうかを調べるために行なわれる。 1714におけるテスト は、単調な平面からの平均変位が高過ぎるので、できないかもしれない、換言す れば、このMSEテストは、基本的に、実際のビクセル値に対するコード化され たビクセル値(A、+B。
+C)のフィツトの近似度を測定する。MSE閾値が選択されて閾値制御器23 8に対する入力として使用されるが、その典型的な値は4である。 1712に おけるテストは、もし境界に沿った誤差が、デコードされ表示された場合に隣接 する境界間に肉視できる過渡的変化をもたらすようなものであれば、失敗するか も知れない、境界閾値はまた閾値制御器238に対する入力としても使用され、 その典型的な値は20である。
第17図に戻つて、領域を分割するという決定が一旦行なわれると、その領域は 最良の分割方向を見出すために解析される。もしテスト1728で垂直方向の分 割が必要である旨表示されると、ステップ1730がこの領域を左半部と右半部 の領域に分割する。もし水平分割であれば、分割された円領域の上側のものであ る選ばれた(1704)次の領域でスタートする圧縮プロセスが繰返される0分 割が垂直方向であれば、分割された円領域の左半部を選択して(ステップ170 4)圧縮プロセスが繰返される。この分割と圧縮のプロセスは、分割プロセスに よって生成されるすべての領域がコード化される(ステップ1705)まで、継 続する0次に、再組合せ(後述するがステップ1720)が行なわれ、ルミナン ス(Y)信号サブフレームに対してフレーム内圧縮演算が終了する(1736) 、残りのIおよびQサブフレームに対して圧縮プロセスを繰返すことによって完 全なカラー・フレームがコード化される。もし、余分な静止フレームをコート化 する場合には次のフレームを“最終フレーム”テスト1734の結果としテ選択 しく1735)、プロセスを繰返す。
分割すべき領域の分割方向を見出すこと(第17図の1726)は、(1)輪郭 の分布状態の解析、または(2)多項式フィツト解析、によって行なわれる。そ れらの手順の各々、および分割方向表示を行なう具体的装置は、第32図乃至第 38図を参照して次に説明する。
輪郭分布状態の解析は、領域分割の理由がその領域中に輪郭があること(たとえ ば第17図の粗さテスト1708の失敗)による場合に最も好ましい分割方向を 見出すために行なわれる。第32A図乃至第33J図は輪郭分布状態解析を使っ て分割を行なうべき領域の幾つかの実例を示している、第33A図と第33B図 については後述するが、この図には解析がどの様に実行されるかを示している。
第32A図乃至第32E図は水平分割よりも垂直分割の方が好ましい5つの事例 を示している。W432A図の領域3202はその領域の垂直2等分線上にある 2つの垂直輪郭を持っている。この領域を水平方向に分割することは形成される 各サブ領域がなお輪郭を含むことになるため何の利点もないが、垂直に分割する とそれぞれ輪郭を持っていない2個の領域(l、3と2.4)ができる、第32 B図では、領域3204の右半部には輪郭がないので、垂直分割によって、輪郭 を持っていない1個のサブ領域ができる。第32C図の領域3206の場合にも 同じ様に垂直分割が好ましい、第32D図では、領域3208内に多数の垂直輪 郭がある。ここでは輪郭を持っていない領域を作り出すことはできないが、それ を水平に分割した場合には比べると輪郭が無くなる可能性がより高いので垂直分 割の方が良い。第32E図では、領域3210には明らかな利点を得られない、 数ケ所の水平および垂直輪郭がある。この場合にはアスペクト比の解析を使用す る。具体的には、領域321Oはその高さよりも輻が広く、垂直分割が選ばれて いる。それは、垂直分割の方がより正方形に近いサブ領域ができるからである0 輪郭の解析では明らかな利点のない様な典型的な画像の場合には、平均すること によってより少数の領域が生成されることが判ワた。第32F図乃至第32J図 の領域3212−3220は、領域3202−3210の垂直分割に関連して論 議したことと同様な理由て水平に分割される。
以上の説明から、分割方向の選択に関連を持つ非常に多数のファクタがあること か判る。実際には、分割の決定は前述した語例から把握されるものほど簡単なこ とではない、その理由は実際の画像は5第32A図乃至第32J図の比較的簡単 な例よりも遥かに多くの輪郭分布をもつ領域を作るからである。第33A図の流 れ図と付属の第33B図のテーブルは、典型的なビデオ画像の領域を分割する際 に遭遇する複雑な輪郭分布状態を考慮に入れて分割方向を見出す方法を示してい る。
第33A図において、分割方向の解析は分割対象である領域の4個の象限中の輪 郭を検出するステップ(3304)でスタート(3302)する、第32A図と 第32F[]に示されたように、これらの象限は左上部が1、右上部が2左下部 が3および右下部が4と符号がつけられている。次に(ステップ3306)では 、第33B図のテーブルにリストされたように4つの関数V13、V24、Hl 2. H34が発生する。
関数V13はこの領域左半部(すなわち象限1と3)中の輪郭に関連する多数の 項(第338図の第1欄)の和に等しい。関数V24は領域の右半部(象限2と 4)の多数の輪郭分布項の和で構成されている。関数H12と1−134は、同 様に、領域の上半部と下半部の項の和に関連している。具体的な項については後 述する。
ステップ3308では乗算が行なわれて5ここで垂直ファクタVFおよび水平フ ァクタHFと名付けたものを生成する。垂直ファクタVFは領域の高さくH)X V13XV24の積に等しく、水平ファクタHFの領域の輻(W)×H12X  H34の式に等しい、ファクタHFとVFはステップ3310で比較される。も しVFがHFより小さいと垂直分割が行なわれて(3312)プログラムは終り (3316)、そうでなければこの領域は水平に分割されて(3314)プログ ラムが終了する。
動作時、VFttHFよりも小さくする傾向をもつファクタはどれでも垂直分割 を与える。たとえば、ステップ3308から、もし輪郭解析ファクタV13とV 24がHl2とH34に等しいとき、領域の高さHがその幅よりも小であれば、 垂直分割が支持されることになる。この状態は、第32E図の例に相当し2同図 の場合には輪郭解析によって明らかな利点はないがアスペクト比テストはより正 方形に近いサブ領域を得るように垂直分割が支持されている。
第23B図のファクタ(発生ステップ3306で計算された)は2垂直および水 平輪郭分布状態が領域内で一様でない場合に、重要になる。Vl3(左半部)ま たはV24(右半部)を小さくしようとするファクタは垂直分割を支持する。た とえば、もし象限lの垂直輪郭の数Vlが象限3の垂直輪郭の数v3と等しけれ ば、Vl−V3は零で、垂直分割が支持される。垂直および水平輪郭差フy’) ’;IV 1−V3、Hl−H3、V2−V4、H2−H4等は全象限に含まれ ている。それらの項は第33B図においてはすべて2乗されて、それらに付加重 みを与える1項HOとvOはそれぞれ水平および垂直輪郭の数を表わし2分割に よって消去される(すなわち1輪郭は分割線上に入る)0輪郭の消去もまた重要 であることが判ったので2それらの項も2乗されて分割方向テストにおいてその 重みが増加される。残ったファクタH1,H2、vl、■2等は象限当りの輪郭 の数を表わしている。もし、たとえば左右の半部に多数の水平輪郭があれば水平 分割が支持されよう(たとえば、第321図)、第33B図のテーブルの上記以 外の応用例は自明である。たとえば、各項には図示したものとは異なった重み付 けをすることができる。また、その領域は更に細かくサブ分割して、このテーブ ルに分割方向解析用に付加重を加えることもできる。
以上では、分割の理由は粗さテスト1708からのYES(イエス)出力である としていた。もし分割の理由がMSEテスト(1714)または境界誤差(17 12)を失敗した締形フィルであれば、分割方向を選ぶには別の方法が適切であ る。
第37図は分割方向を決める多項式フィツトの解析を示す、第17図から、双線 形多項式A、+13.+Cの平均2乗誤差(MSE’)テストまたは境界誤差テ ストのどちらも満足できるものでなければ、領域は常に分割されることを想起さ れたい、第37図にSいて、双線形多項式の垂直部分(B、+C)は垂直ルミナ ンス値Yv(すなわち1行の平均ルミナンス値)と比較される。また、水平部分 (A、+C)は水平ルミナンス値YH(すなわち。
列の平均ルミナンス値)と比較される。より良い“フィツト″′ (すなわち低 いMSE)を生成する比較の方向を分割方向として選ぶ。
第38図に、この方法を実行するコンピュータ装置の構成の流れ図が示されてい る。Aヨ+C対YHとB、 +C対Yνの適合度(フィツト)測定はステップ3 8ozとステップ3804で行なわれる。テスト3806は、第37図の例にお けるように垂直の適合度(すなわちMSE)が水平適合度よりも良好であれば、 垂直分割381Oを選択する。そうでなければ、テスト3806が水平分割38 08を選択してプログラムが終る。
分割方向を見出すこの方法の利点は、もしも大半の誤差が領域の2分の1の範囲 内で生じるとすれば、この方法が屡々“フィル可能な”領域を作ることになるか らである。 j@37図の例においては垂直の適合度(フィツト)が良好で水平 方向の大部分の誤差は画像の右側にある。
従って、この場合には垂直分割が適切とされ、また誤差(水平)がほとんど右側 にあるという理由で領域3702の左側を更に分割する必要は無くなるであろう 、 第17図に戻って、すべての領域がコード化され終ると、プロセスはステッ プ1720に続く、再組合せ(re■erge)は1画像の全領域に対して発生 されたエンコーディングを検査し、それに成る後段処理を行なって幾つかのコー トを取除きかつそのデコード時間を改善する。もし、よく似た大きさの2個の隣 接領域が同じDPCM量子化テーブルでコード化されていれば、その分割は行な わなくてもよい、再組合せ(ステップ1720)は、このコーディング・ストリ ームを改変して上記2つの小さな領域を大きな領域で置換する。再併合された2 つの領域によって形成されたこの大きな領域は、その後、隣接する同様な大きさ をもつDPCMコート化済領滅法更に行なわれる再併合動作に寄与することがで きる。
第39図乃至第43図は第16図のフレーム相互間のコーグ1620の構成の詳 細を示す、前述したように、フレーム相互間コート化は、モーション・ビデオ・ シーケンスの第2およびそれに後続するフレームに対して使われるもので、普通 のモーション・ビデオ・シーケンス中のフレーム相互間に存在する相関性または りダンダンシイの利点を利用している。この利点は、もし前のフレームの領域が いま存在するフレーム中のコート化される領域に可成り良く対応していると見得 る場合には、フレーム内コーダ1610で行なわれたような絶対値をコード化す るのではなくて双方の領域の差だけをコート化すれば足りることである。上記し たフレーム相互間コード化の利点は、差さな数であることが多い点である。パン または情景の中での物体の動きによる領域の動き(モーション)があれば、偏位 (オフセット)偵x0およびYoという余分なコート・パラメータが必要になる 。この偏位値x0とYoは、現フレームとそれより前のフレームの間で運動物体 が呈する水平方向および垂直方向の移動の量を表わして、いる。
第40図はこの動き(モーション)の効果を例示している。実線領域4004現 フレーム中のある特定の領域を表わしている。領域4002は、領域4004中 の情報に対応する画像情報を含む前のフレーム内の領域を示す、この対応領域4 082に対して、領域4004は水平方向にXo、垂直方向にYoだけ移動して いる。概観すれば、コーグ1620の1つの仕事は、値域4004と4002間 の差を表わす双線形多項式(A! +B、 十〇)として領域4004 (以下 、“ターゲット”領域Tという)をコード化することである0両領域の位置にお ける上記の差X、、Y、(以下“偏位”という)も、コード化されてデコーダを 可動化し、前の画像を探してそれに上記の差を加算してターゲット画像を構成さ せる。このコード化形式を、以下“相対的”線形フィル・コード化と呼んでコー グ1610の“絶対”線形フィル・コード化と区別する。コーグ1620によっ て与えられる上記以外の機能には、現フレーム中のターゲット画像に対応する前 フレーム中の領域“C″を探すための高速サーチ・ルーチンを提供すること、お よびもし適切な前の領域を見出し得なかったら、この不適コード化に代る別のコ ード化を提供することがある。
第39図は、コーグ1620によって行なわれるフレーム相互間コード化プロセ ス中の各ステップを例示する詳細な流れ図である。この“ソフトウェア”構成は 現在好ましいものである。その個々の処理機能は、この流れ図に示された機能を 行なう個々の装置素子によつて容易に構成できることは理解されよう、フレーム 相互間コート化は、モードスイッチ240’ (第16図参照)をダウン位置に おいてモーション・ビデオ・シーケンスの第2フレームをコード化し始めること によって、開始(スタート3902)する、スイッチ240′は以前にアップ位 置にあってフレーム内コーダ1610を使って第1フレームのコード化をしたこ とを想起されたい、この前のフレームは既にコート化されてバッファ記憶器23 2(第2図)中に記憶され、またコード化しようとしている現フレームと比較す るためにコード化されない形で記憶されている。
フレーム相互間フレーム・コード化は、Y、■およびQサブフレームに別々に施 される。フレーム相互間コート化が開始された後、次のステップ3904はター ゲット(T)と対応する(C)前の領域とを選択する作用を行なう、ターゲット 画像は、前のフレームの中でこのターゲット領域と大きさが正確に同じでかつ最 初は正確に同じ位置(X、Y座標)にある対応儂域を選択することによって、対 応領域の選択を制御する。後述するように、次にフレーム相互間での運動の効果 を補償するためにターゲット領域座標の近くでサーチが行なわれる。
ターゲット領域は、静止フレームの絶対フィルエンコーディング用の領域選択と 同様に選択される。初めに、全画像領域ターゲット領域として選択される。この 領域が充分にコード化できない場合は、その領域はサブ領域に分割され、次いで 、これらのサブ領域がコード化のために検査される。
一旦ターゲット領域が選択されると、その結果か行なわれる処理は、その時の領 域が画像全体であろうと、分割動作によって領域リスト(3904)に置かれた 領域の1つであろうと関係なく同じである。処理される領域がある場合(390 5)は、その領域は、既に動き補正されているか否かが調べられる(3910) 、動き補正済みの場合は、この処理を繰返す必要はなく、処理は直接ステップ3 930へとぶ、後で動き補正の説明中で述べるように、ステップ3928は′T ”及び“C″領域相対的な偏位な記述するコートを発生する。このコートは、あ る与えられた領域と5この領域から後に分割によって取出される全てのサブ領域 とに対して、1度だけ、コードストリーム中に含められる。これによって、コー ド化ピットストリームの大きさを減じることができ、このことは、2進トリー分 解の多くの利点の1つである。
ステップ3910で、動き補正が未だなされていないことがわかった場合は、動 き補正処理3S20が開始される。
簡単に言うと、処理3920は、その時のフレームのターゲット領域″T″に最 もよく整合する、前のフレームの領域′C”をサーチする(捜す)ことを含んで いる。もし何の動きも生していなければ、領域CとTは同じ座標を持つであろう 、一方、動きかあった場合には、領域Cは領域Tに対し、量X0.Y、たけ偏位 、即ち、移動するである。ターゲット領域の対応ビクセル値と移動した“C″領 域対する最良の選択値の間の平均2乗差(MSD)が計算される。このMSD値 は、閾値制御器238(第2図)を通して入力される閾値(TH)と比較される (3922)、比較の結果、移動した領域に対する最良選択値がターゲット領域 に対して許容できるような整合を与えない場合には、ターゲット領域は最小寸法 についてチェックされる(3924)。ターゲット領域が最小寸法よりも大きい 時は、この領域は分割され(3926)、分割された領域について動き補正が実 行される。ターデフ1〜画像にうまく適合する移動領域が見つかった場合(即ち 、テスト3922をパスした場合)、または、ターゲット領域が最小寸法であっ た場合は、x、Y00個値がエンコー1くされて、領域記述コード中に領域偏位 な与える。ステップ3924を通りてステップ3928に達し、テスト3922 が満足されていない場合には、移動領域はターゲット領域を正確に記述していな いことになる。これは、例えば、カメラがパンし、従って、先行ビクセルが存在 しない場合などに生じる。第39図に示す後続ステップは、恐らくは絶対DPC Mによって達成できる最良の領域を表わす。
動き補正についてのより詳細な説明を、第40〜43図を参照して行なう、動き 補正3920の目的は、ターゲット領域に最も近似する領域″C”の偏位を決定 することである。第42図に示す処理は、適合の近さを表わすものを極小にする ような偏位な方向性をもってサーチすることである0通常は、2つの領域間の平 均2乗差(MSD)が適合の近さを表わすものとして用いられる。特定のターゲ ット領域には多数のビクセル値が含まれており、従って、MSDの数値の算出は 非常に時間がかかるであろう、この計算をするのに必要な時間は、適切に選ばれ たビクセルサブセットのみについて平均2乗差を計算するようにすれば、最終的 な結果に大きな影響を及ぼすことなく、大幅に短縮できる。
第42図における1番目のステップは、MSD計算用のビクセルの代表セットを 決めることである(4210)、ランダムに、但し、領域全体に均一に分布され たビクセルを選ぶことが良いことがわかった。サブセットに必要な代表ビクセル の数は、大まかに言って、領域の面積の平方根によって左右される。より正確に は、所要の数は式に丁Tからめられる。ここでKは閾値制御器238を介して入 力されるパラメータで、典型的には約10である。
また、Aは領域の面積である0代表ビクセルが領域全体に均一に分布しているよ うにするために、この領域をに5個の同じ大きさのサブ領域からなり、かつ、こ れらのサブ領域の各々からビクセルがランダムに選択されるものと考える。
次に、“T”及び“C”領域に単純な低域通過濾波処理か施される。このような フィルタ(4204)により5代表ビクセルを使用しても、ランダム効果にあま り影響されなくなる。この濾波動作は動き補正のためたけに行なわれ、濾波され た領域は、その後の領域の処理の前に捨てられる。
サーチの第1段階は、サーチ解像度(resolution)を1ビクセルにセ ットする(4220)によって始まる。ターゲット領域と対応する“C″領域の 間の偏位をより大きな解像度で知りたいにもかかわらず、1ビクセル解像度で始 めることには2つの利点がある。第1は、時間のかかるMSD数値算出の回数を 少なくして大きな移動を行なうことができることである。第2は、MSDの計算 が速くできることである。この第2の利点か得られるのは、ビクセルの小さな偏 位についてのMSDの計算にはビクセル間補間の追加ステップを必要とするため である。
MSD数値の次の試験的算出は出発点から8つの異なる方向に行なわれる(42 30)、これらの可能な8方向が第41図に示されている。MSDが最も大きく 減少する方向がめられる。実際には、最適方向を取出すために8個のMSD数偵 数比算出なう必要はない。アルゴリズムは、出発点の近傍ではMSDはほぼ一次 関数であるとしている。従って、方向りにおいて減少がある場合には、方向Rて は増加し、そのMSDの数値算出は行なわれない、同様に、方向Uにおける減少 があれば、方向りについての数値算出は不要となる。最終的には1つの斜め方向 の数値算出のみが必要となり、初めに、最良の水平及び垂直方向がめられ、次に 、それらの間の斜め方向が検査される。このやり方で、しばしば、はぼ正しい方 向が指示される。さらに、誤った方向が指示された場合には、最終的には、この 処理の別のステップにより、サーチは適切な方向に方向づけされる。
通常、これらのいろいろな方向が検査されると、MSDを他の方向よりも多く減 少させる方向が見つかる。そのような方向が存在する場合には、局部極小値につ いてのテスト(4240)は行なわれず、サーチはステップ4260に進む、こ の点でC”領域が、ステップ4230で最小のMSDを生じた方向に沿ってのみ 検査される。テスト領域は、1ビクセル解像度で1選ばれた方向に、MSDが減 少し続ける限り検査される。このプロセスは第41図に2重矢印で示されている 。それ以上の移動によりてMSDがそれ以上減少しなくなれば、ステップ423 0が繰返されて、新しいサーチの方向が見つけられる。このプロセスはMSDが それ以上減少しなくなるまで継続される。ついで、解像度が8分の1ピクセルに 引上げられ(4240,4250,4270) 、再び、MSDに減少が見られ なくなる迄この高い解像度でサーチプロセスが繰返される。サーチは、X、Y、 の値を次に行なわれるであろうエンコーディング(3928)のために記憶して 、サーチが終る(3922)。
“C″領域おけるピクセル値は、1全ビクセル解像度でしか得られない0例えば 8分の1ピクセル解像度で“C″フレーム中領域をサーチする場合、それは、ビ クセル値が1/8ビクセル間隔解像度で得られる時にのみ意味をなす、これらの ビクセル値は、1/8ピクセル増分で値を生成する補間によって発生される。こ れらの値の生成に使用できるものとして、例えば、1次補間。
2次補間、3次補間等の多くの公知の補間アルゴリズムがある。
第43図は、動き補正と相対コード化のプロセスをさらに説明するもので、達成 される実質的な領域データの削減を示している。この例において、前のフレーム のC領域4304は一様な明るさく5ユニツト)を持っているとする。ターゲッ ト領域4302は同様であるが、−1と+1の垂直及び水平方向の勾配を持って いる。これらの差をめる(4306)と、コード化されるビクセルの値が比較的 低い差画像! 、 4308、が得られる0図示の如く、このコートは、明るさ くC)と勾配(A、B)の変化と領域偏位コートX。Yoとで構成されている。
動き補正がターゲット領域について完了すると、ステップ3930の処理が続け られる。ステップ3930はターゲット領域に施されるべきコード化の形式を決 定する。最初に、ターゲット領域と選択された“C″領域における対応するピク セル値の差の値からなる領域が生成される(第43図参照)、このようにして生 成された領域中の差の値のどれもが閾値よりも小さい場合には、ターゲット領域 は、相対的として分類され、相対的コード化処理に付される。相対的コード化の 利点は、小さなコート値を持った大きな領域が得ることができ、従って、コード ・サイズが小さくなり、デコート時間が短くなるという点である。この場合には 、REL、と示した判断通路に沿ってステップ3930を出る。
第39図に帰って、生成された領域中に閾値より大きな差の値がある場合は、タ ーゲット領域は相対的として分類されず、その一部が相対的コード化によってう まく処理できるものであると考えることができる。従って、ステップ3930は 試験的な分割を実行し、その結果生じた2つのサブ領域を検査する。この試験的 分割には、単純な分割(第35A図)が用いられる。これらのサブ領域のいずれ か一方が閾値要件を満足する場合は、ステップ3930からMIXEDとして示 した判断通路を通って出る。この判断通路は分割ステップ3938に続いており 、2つの2分の1のサイズの領域は別々に処理される。 3938における分割 は同じく単純な分割である。
ステップ3938の分割の前に、最小サイズテスト(3936)がある、 39 38における分割によって領域が最小サイズ以下に減縮されるような場合には、 最小サイズテスト(3936)がターゲット領域を絶対として再分類する。これ により、コートサイズ及びデコーディング時間の両方に関して非効率的な非常に 小さな平面フィル領域の生成が防止される。
試験的分割領域のいずれの半部も、相対的として明確に分類し得るサブ領域を生 じないこともある。その場合には、サブ領域の各々について試験的分割が行なわ れる(3930)、このプロセスは2つの事項の一方が生じるまて統けられる。
明らかに相対的であるサブ領域が検出されると、プロセスは混合判断通路に沿っ てステップ3930を出る。そうでない場合には、試験的分割は、結果として生 じる領域が最小領域サイズテストを不合格となるまで継続される。不合格となる 、即ち、最小サイズよりも大きな試験サブ領域が検出されなくなり、明らかに相 対的でなくなると、その領域は絶対として分類され、プロセスは絶対判断通路に 沿ってステップ3930カ)ら3934に出る。
イクジットが混合通路に沿ったものである場合Cよ、領域はステップ3938に よって分割される。これらのサブ領域は各々、ステップ3930によって再び処 理される。混合出口に沿うイクジットは、相対的であるとして分類できる試験領 域が存在したことにより行なわれるので、3938における分割が最終的にはそ のような領域な生じさせる。
領域の分類が行なわれると、その領域はステップ3932と3934において相 対的及び絶対フラグにより識別されて、その後のフィル処理(ステップ3952 及び3968)で用いられる。
相対的領域は、X、Y、偏位値のコート化(ステップ3928)の後、領域分類 (ステップ3930)の前に、ステップ3929て低域通過濾波される。この点 における濾波により大きな領域が相対的であるとして分類される可能性を増加さ せてしまう不要なディーチルが除去され、それによって5コードサイズとデコー ド時間が減少する。領域が、絶対領域サイズを大きくしてしまうような絶対であ るとの分類がなされた場合には、ターゲット領域も濾波処理される。この点に関 し、付加的に非線形フィルタを用いると有効であることがわかった。目は、コー ド化された差の値と″C″領域におけるピクセル値との和を見るので、差の値の 値域中のディーチルの消失にはそれほど反応しない、従って、濾波量を人間の間 隔系を基礎にして重み付けすることが非常に有効である。目が、差画像の一部に おけるエラーに対し、他の部分におけるエラーに対してよりも、小さい感度を示 す理由は2つあり、これらの2つの理由の両方を利用して、ビクセル単位で濾波 の量を決定する。一番目は、ターゲット領域が明るい差領域の部分は、ターゲッ ト領域が暗い部分よりも強く濾波される。第2は、ターゲット領域が“込入って いる” (即ち、細かい)差慴域の部分は、ターゲット領域が比較的滑らかな部 分よりも強く濾波される。即ち、ターゲット領域がゆるやかに変化する場合は、 差領域におけるエラーは、ターゲット領域が多量のディーチルを持っている場合 よりも、視覚的により明確になる。ある点における込入りの程度は、隣接するビ クセル値の減算処理をして、局部的な勾配をの目安を得ることにより、推定でき る。このことから、第36A図の検出器3624を、明るく、かつ/または込入 った画像に対して減衰係数りが増加するように変更してもよい。
次の処理ステップは、領域を平坦面A、+B、+Cて表現することである。この ステップ(3952)は、ステップ3930で領域が相対的と分類されたか絶対 と分類されたかに応じて、差領域かターゲット領域かのどちらかに施される。こ のプロセスはs17図のステップ1705 ヘ1715について前に述べたと基 本的に同じである。
領域が粗さ閾値テスト3942をパスしない場合は、その領域は最小寸法につい てテストされる(3964)、その領域か最小寸法より大きい場合は、分割が行 なわれ(3966)、新しいターゲット領域か作られて選択される(3904) 、逆に、領域寸法が閾値以下であれば、その領域が絶対と分類されているか相対 的と分類されているかによって、2つの技法の一方が行なわれる。絶対領域に対 しては、領域のDPCMコード化(3970)が実行されるが2これは。
フレーム内エンコーディングで用いられ、そのフレーム内エンコーディングのと ころで説明した技法と実質的に同じである。
相対的領域については、ダイアト符号化と呼ばれる別の技法が用いられる。この 技法は、かなり平坦ではあるが、領域が平坦面として適切にコー1く化されるこ とを妨げるいくつかの例外的なビクセルを持っているような領域に対して有効で ある。ダイアト符号化については第61図を参照して説明する。この図にはター ゲット領域611゜中の8個のビクセルからなる代表領域と、それに関係した、 前のフレームの最もよく適合した対応する領域6120とが示されている。エン コーダは、対をなす値R,Sを対応するビクセルC8とり、にそれぞれ加算する ことにより、ターゲット画像ビクセルA、とB、を生成する。
この一対の値RとSを、ここで、ダイアト(2個1組)と呼ぶ、デコーダはデー タ・ストリームからのコード値を用いて、ダイアト・メモリに供給するためのア ドレス値を発生することにより、これらの一対の値R,Sをダイアト・メモリ中 で見つけ出す。
第62図はダイアト符号化プロセスを示す、R3座標系の斜線上に11個のダイ アト点(黒点)がプロットされている。ダイアト点の座標は閾値制御器238に よって圧縮器230に入力される。ダイアト点はKl〜Kllの符号が付されて おり、一対の差の値R,Sのコード化に用いられるのはタイアト番号(その座標 値ではない)である。
これはRS面内に点(P)として実際のビクセルの差の値をブロクl−L/、最 も近いダイアト点Kをコード値として選択することにより行なうことかできる。
−例として、N4B1tXJにおいて、ビクセルA□と81をコード化すると仮 定する。初めに、前のフィール1くのclがA、から差引かれて、差の値R1得 られる0次に、B、からり、が差引かれて、差の値S、が作られる。説明の便宜 上、 R1=10、S、=13とする0次に、これらの値は第62図の点P(1 0,13)の座標として用いられてR3面内にプロットされる。図示のように、 点P(10,13)に最も近いダイアトは、座1R=14.5=14のダイアト 番号に6である。従って5このダイアI(指定符号に6を伝送することにより領 域611OのAIBI(第61図)をコード化することができる。(K6のテー ブル・ルックアップによって)AIと81とをデコードした時、ビクセルは、そ の元の値よりもいくらか明るくなるだけである。
すなわち、ビクセルAiの真の値はCI+10であり、ビクセルB、の真の偵は D1+13である。ダイアトに6を用いると、デコードされた値はCI+14と DI+7.4で。
これらは、ピクセル対A I B +の真の値に非常に近い。
前述したダイアト選択法を変更することにより、すぐれたダイアト・デコードさ れた画像が得られることがわかった0図示の例では、ダイアトに6はデコードさ れた時、「真」の差が送られた場合よりもいく分か明るいビクセル対A、B、を 形成するものであった。真のビクセルの是よりも小さな差を生じるダイアトを選 ぶと、デコードされた画像の「過剰補正(オーバ・コンベンセーション)」すな わちピーキングを与えるようなダイアト()C6のようなもの)を選択した場合 よりも、目につきにくくなる。従って、前の例において、ビクセル対Pのコード 化用としては、この場合はコード化エラーは明らかにいくらか大きくはなるが、 ダイアトに6よりもに5を選ぶ方がよい、小さい方のダイアトを選択するもう1 つの理由は、それによって、ダイアト周波数分布が小さい値の方にスキニーし、 従って、可変長符号化器1640の使用を可能にするからである。
第62図に示すダイアト領域特定コード化法の別の特徴は、ダイアトKl−に1 1が、ピクセル差RS面の左と右の斜線によって均一に間隔を置かれていないこ とである。即ち、原点に近いダイアトの方が原点に遠いダイアトよりも間隔が狭 くなっている。その結果、小さなピクセル対差(R,S)のコード化に用い得る ダイアトが多くなり、従つて、差A−C及びB−Dが小さくなるに従ってコード 化精度が改善される。この点は、目というものは値の小さなダイアト値のエラー に対してより感度がよいからである。
容易に理解できるように、ダイアト符号化の精度はダイアトに+の数を増すこと により高めることができる。
例えば、図示したような45°の斜線に沿ってではなく。
2木の斜線(例えば、30°と60′″)に沿ってダイアトを決めてもよい、一 般に、複数のダイアト・テーブルが利用でき、その中から、領域データに最もよ く適合するテーブルが選択される。使用される特定のテーブルはコード化された データの一部として表示される。
まとめてみると、ステップ3904は、ステップ3960゜3970または39 80によってコード化する領域を供給する。
その領域がコード化されない場合には、領域3926.3938または3966 で分割され、別々のサブ領域がコード化のために分析される。最終的には、最小 寸法テスト(3924)、(3936)、(3964)が全ての領域がコード化 されるようにする。
全領域がコート化されると、全領域がコード化された状態が検出される(390 8)、ついで、プロセスは再組合゛わせ動作(3990)に移行する。再組合わ せは1画像の全領域について生成されたコード化作用を検討し、可能な場合は、 隣接するダイアト・コート化領域と隣接するDPCMコート化領域を併合する。
このプロセスは第17図のステップ1720について説明した再組合わせ動作と 同様である。
再組合わせ(3990)の後、プロセスはシーケンス中の別のフレームについて チェックする(3908)、別のフレームがない場合には、シーケンス中の全フ レームが圧縮されたことになり、第39図のプロセスはイグジットされる(39 98)、あるいは他にフレームがある場合には1次のフレームが圧縮のために準 備状態とされ(3984)、プロセスが繰返される。
再び第16図にかえると、フレーム内及びフレーム間コード化の次の圧縮プロセ スは、コード化された信号S12とS13をエリヤ依存適応形量子化器1630 へ供給することからなる。前に述べたように、この量子化器はコード化されたデ ータを領域エリヤの関数として量子化する。この量子化器は、A、+B、+Cの 一部フイルの“C″係数みに適用される。係数AとBのエリヤ依存量子化は、こ れらの係数は一般には1より小さいので、必要ないとわかった。大きな領域の平 均の明るさC”は正規には全8ビツトで表わされる。より小さな領域は、より少 ないビット、従って、より短いコード・ワードを用いて次々に量子化される。
第44図は、領域寸法と、領域フィル値を表わすために用いるビット数とをリス トしたテーブルである。32以上のビクセルの領域に対して、8ビツトが用いら れ、256の明るさレベルの細かい解像度が得られる。16〜31ビクセルの範 囲内の領域については、7ビツトによって128レベルの解像度が与えられる。
エリヤが半分になる毎に、1ビツト減少する。lビクセル領域は18明るさレベ ルの粗い解像度を与える3ビツトに量子化される。
前述のことから、各1ピクセル領域につき5ビツト。
各2ビクセル領域につき4ビツト ・・・・が節約される。
エリヤ依存適応形量子化は、全ての領域フィル値に全解像度値(8ビツトバイト )を割当てた場合に比して、更にデータの削減を可能にする。さらに、可変量子 化を用いると、目につきやすい大きな領域が細かく量子化されて全体として高解 像度を持った表示を呈させるので、可変量子化は視覚的な点で可であることがわ かった。小さな、粗く量子化された領域は、いわば、大きな高解像度領域の存在 により心理視覚的にマスクされる。
第45図は第44図のエリヤ依存量子化をフローチャート化したものである。こ のプロセスは、領域データメモリから1つの領域について高さと幅を取出しく4 502)、領域エリヤを計算する450にとで開始される。領域エリヤ(450 6)はエリヤテスト4508及び4512〜4518によってテストされ、領域 “エリヤ”が32ビクセルから減少するに従ってビット数を順次減少させるため に、対応する量子化器4502〜4528が選択される。
第16図にかえって、最後に説明されるべき圧縮器230の素子は「ストリーム ・セグメント化された」可変長コーグ1640として示されるものである。ここ で用いる用語「ストリーム・セグメント化された」は、各ビデオフレームに対し て複数の可変長コードを用いることに関係している。最低18の別々の可変長コ ートが、ここで説明する例における各車−の圧縮されたデジタルビデオフレーム について生成される。
知られているように、可変長コートは、より頻繁に起きる事象に対して、より短 いコードを振出てることにより、データの減縮を行なうことを思いだされたい、 別々に圧縮されたY、I及び9画像を効果的にコート化できる単一可変長コード はないことがわかった。これは、Y、I及びQサブフレームの各々の統計が異な るためである。さらに、サブフレームの別々のデータ要素を効果的にコード化で きる単一の可変長コートはないことがわかった。従って、各サブフレームの各セ グメントに対して異なる可変長コードが用いられる。
全体として、6個の異なる可変長コートか、単一サブフレームからなる明らかに 異なるデータを記述する際に右動であることかわかった。これにより、各主要デ ータカテゴリの統計(即ち、生起頻度)が各ビデオフレームスドリームについて 計算される。サブフレームは3つ(Y、1.Q)あるので、最低で18の統計的 デコーディング「テーブル」が全てのビデオストリームに含められる。
第47図は、lビデオストリームの圧縮されたサブフレームのデータ・フォーマ ットの詳細を示す、同じフォーマットが圧縮されたビデオストリームのY、I及 びQ部分に用いられる。
「ヘッダ」セグメントは、前に述べたように、サブフレームのデコーディングで 使用される、サブフレーム形式(YかIかQか)、そのサイズ(即ち、解像度) 、検査合計5及び2つのテーブル(DPCM及びダイアト)を含んでいる。ヘッ ダの後には、データの残りのセグメントのデコーディングに使用される特定の可 変長コードを記述するコートテーブルが続く、効率化のために、これらのテーブ ルは5それ自身、暗黙コードテーブル(即ち、コーグとデコーダにより了解され たコードテーブル)を用いてコード化されている0次の部分には、「ビデオ圧縮 処理」という項目で述べたように、「処置」およびr値」を含む2進トリー記述 が含まれている。その後に、全ての相対的双線形(パイリニア)フィルに対する 係数を含んだ「相対的データ」部が続く、「絶対データ1部は、C係数はトリー 記述に含まれているので、絶対双線形フィルについてのA、B係数のみを含んで いる0次の部分はDPCM領域の全てに対するDPCMデータ(lビクセルにつ き1つの偵)を含んでおり、最後の部分はダイアト領域の全てに対する「ダイア ト」データ(2ビクセルにつき1つの値)を含んでいる。最後の4セグメントの 各々におけるデータの配列は暗黙的(インブリジット)で、領域データは、2進 トリーのデコーディングにより領域が生成される順序に基いて配列されており、 ビクセルに基く値(DCPM及びダイアト)は通常のラスク走査順(一番上の線 から一番下の線へ、各線内で左から右へ)に配列される。
第46図は「ストリームセグメント化された」可変長コーグ1640のブロック 図である。量子化器1630からの領域コード化され量子化されたビデオ信号S 14は、図示のように、メモリ1642に記憶される0選択スイッチ1644が 。
可変長コーグ1650に加えられるダイアトフィルデータ、DPCMフィルデー タ、ABSOLUTE (絶対的)フィルデータ、RELATIVE (相対的 )フィルデータ、TREE (トソー)記述データ及びストリームHEADER (ヘッダ)データ(データ源1646)を選択する。′X−ダ1650は、より 高い頻度で現われるデータコートワードに対して最も短いコードを割出てる種々 の形式のデータをコード化し5可変長コード化されたデータを記憶器1654に 記憶させる。マルチプレクサ・スイッチ1644は、第47図に示す順序で記憶 されているデータを選択して、バッファ記憶器232に供給するために、圧縮さ れたデジタルビデオ出力信号S9を形成する。
さらに詳しく述べると、可変長コーグ1650は他のデータ形式とは関係なく各 データ形式を検査して、各データ形式における。サブフレーム全体にわたるデー タの統計をめる0例えば、データの各コードワードの相対的発生頻度が、データ セット中のコードワードの、例えば値の、範囲と共に確かめられる。この情報を 用いて、複数の可変長コードセットの中で、それぞれのデータ形式を最も効率的 に可変長コード化するものが選択される。この複数のコードセットが素子165 2に記憶される。1つのコードセットが選択されると、コーグ1650がスイッ チ1644を介して記憶器1652から選択されたコートセットを引出して、対 応するデータ形式のコード化に進む。
さらに、その特定の可変長コードセットが可変長コード化され、データストリー ムに加えられて、データが更に減じられる。しかし、この場合、可変長コード化 は所定の(暗黙の)可変長コードセットを用いて行なわれる。この点は、第46 図において、スイッチ1644によって行なわれ、このスイッチは適切な位置に ある時、記憶器l552の出力を可変長コーグ1650に結合する。
例示すると、可変長コード化は2バス・プロセスで、コーグ1650は最初に、 データ形式の各々についての可変長コードセットとコード統計とを発生する。第 2のバスでは、記憶器1642中のそれぞれのデータ形式と統計記憶器1652 のコードセットとが可変長コード化される。
ストリーム・セグメント化により、圧縮されたビデオデータに対するデコーディ ング時間の短縮に関して大きな利点が得られる。これは、ストリーム・セグメン ト化によって、互いに異なるコードフォーマットの互いに異なる統計にうまく対 処するためにデコーディング中に可変長コーグ(後述する)が再プログラムされ るべき回数が減じられるためである。すなわち、全てのDPCMデータを一緒に グループ化することにより、可変長デコーダは、DPCMm域の全てをデコード するために1度プログラムされるたけてよい、同じ効果が、第47図のトリーデ ータ及び他の可変長コード化データと同様、他のコードフォーマット(相対的、 絶対及びダイアト)についても得られる。
後段圧縮処理 画像のシーケンスが圧縮されると、全運動ビデオ再生の準備として、フオーマタ がさらに処理を行なう。この処理は第13図に示されている。概略的に言うと、 圧縮されたビデオデータSIOは、圧縮されたオーディオデータS7及び他の全 ての補助データS3と組合わされ、CD−ROM18へ記録するための準備がな される。
CD−ROMは、高記憶容量(100メガバイト以上)と比較的低いデータ率( CD−ROMに対して、1.23メガビット/秒)を有するクラスの装置の代表 として示されている。他の磁気的あるいは光学的記憶媒体も適している。
第8図と第9図はオーディオデータS7がビデオデータ310と後述する他のデ ータとどのようにして間挿されるかを示す、第8図は論理的なフレームを示す、 (「論理的な」という形容詞を用いたのは、論理的フレームは1例えば、24F  P S再生において、第2のものの1/30と異なつていることを示すためで ある。)一般に、論理的フレームは、単一の画像が表示される時間中に必要とさ れる全てのデータのセットである。第8図は、1つの画像を作るに充分なビデオ データと1画像が表示されている間に生成されるべき充分なオーディオデータと を有する論理的フレームを示す、論理的フレームのサイズは、入力装置からの持 続データ率(CD−ROMの場合、1.2288メガビット/秒)と1画像再生 率、通常は33.3666ミリ秒毎に1つ、とによって決まる。従うて、30F  P S再生に対しては、論理的フレームサイズは平均で5125.12バイト とならねばならない。
第13図はこの平均率をどのようにして得るかを示している。これは3段階プロ セスである。第1段階では、データがいくつかのデータ源から取られ、間挿デー タストリームとしてディスク1350に書込まれる。第2と第3の段階では、こ のストリームが読出され、ディザスイッチ1390を通して処理され、再びディ スクに記録される。概観すると、第1段階てデータか収集され、間挿されたオー ディオ及びビデオデータを含む単一のデータ′のストリームS4を生成するのに 必要な処理のほとんどが行なわれる。第2と第3の段階は残り全ての問題、特に 重要なことは、過大サイズフレームの可能性について取扱う。
第1段階では、制御ユニット1310がオーディオディザ器1360に命令して 、スイッチ1320が結合される毎にオーディオデータのある特定量を通過させ るようにする。オーディオディザ器1360は次の問題を扱う、オーディオ再生 システム32は、ある特定の充分に規定された率でビットを消費する。肉声縁の 音声に対しては、この率は31.25キロビット/秒に設定される。CD−RO Mプレーヤ22からの最高可能データ率を持続するためには、S16中のオーデ ィオデータ率はこれに正確に整合しなければならない、81Bからデータ率が低 すぎると、音声処理器32、データ待ちで、一時停止してしまう、また、率が高 すぎると、オーディオデータが、再生待ちで、ホストコンピュータに蓄積されて しまう、オーディオディザ器1360は、第8図におけるデジタルオーディオデ ータ・ブロックの平均サイズが、次の関係式によって与えられる適正なサイズと なるようにする。
S・(D+1)/D−T=B ここで、Bはlフレーム当りのオーディオバイトの数、Sはオーディオデータ率 、DはADPCMのリセット(例えば、ADPCMコーダはコー6サンプル毎に 1度リセットされる)間のオーディオADPCMサンプルの数、Tはビデオフレ ーム率の周期(ミリ秒)である、 30FPSのフレーム率、31.25キロビ ット/秒のデータ率、256のリセット周波数及び33.36ミリ秒のフレーム 周期に対しては、Bの平均値は130.847バイト/フレームに等しい。
オーディオディザ器1360は、各論理的フレームに対して、130バイトまた は134バイトのいずれか一方を通過させる。(ブロックのサイズは、ホストコ ンピュータ28におけるデータの移動の効率を上げるために、4の倍数に丸めら れる。)この決定を行なうために、ディザ器360は、それまで何個のバイトを 転送したかの移動平均を保持する。移動平均が130.847より小さい時は、 オーディオディザ器1360は134バイトを通過させる。移動平均が130. 847より大きい時は、オーディオディザ器は130バイトを通過させる。この 特定値130.847は制御素子1310から送られ、所要の再生率と再生オー ディオビット率の関数である。
スイッチ1370は補助データの性質に応じて、制御素子1310により制御さ れる。モーションビデオが再生される時は、何らかの補助データが利用し得るよ うになフている必要があり、そのデータは段階1で処理される。補助データの一 例は、ホストコンピュータ28に対して、予め選ばれた時間にオーディオボリュ ームをフェードさせるようにする埋込まれた命令である。他の補助データはスイ ッチ1330を通過させられて、第2段階で信号ストリーム中に組込まれる。こ のような他の補助データは、オーディオまたはビデオ信号に対して臨界的なタイ ミング関係を持っている必要はなく、従って、ピットストリーム中の適当な位置 、例えば、正規の数より少ない数のバイトを含むコート化ビデオフレームの中に 含むることかできる。この補助データは、モーションビデオ・シーケンスの再生 の副次的効果として、ホストコンピュータ28にロードされるようにできる。
段階1で、連続する論理フレームに対して、スイッチ1320がビデオデータ3 10、オーディオディザ1360の出力及びスイッチ1370の出力へ次々と切 換えられる。スイッチ1320は、論理的フレーム(第8図)における個々のデ ータ部分の長さと位置(ポインタ)とを記述するヘッダデータ源1361の出力 も選択する0段階1では、論理的フレームには「フィラー」 (即ち、パディン グ)はないことに注意されたい、また、圧縮ビデオは互いに異なるサイズを持っ ている場合があるために、オーディオディザ作用のために、また、補助データの 量が論理的フレーム毎に変わる可能性があるために、論理的フレームの長さは互 いに異なる可能性がある。シーケンスの全論理的フレームに対するデータはディ スク記憶器に書込まれて、段階1が終る。
段階1が完了すると、制御素子131Oが段階2を開始させる。この段階では、 段階1で集められたデータがデイスフ記憶器1350から逆に読まれ、スイッチ 1390が、シーケンスの個々のフレームに対する付加的な補助データへのパデ ィングを挿入するループ1351を介して再記録される。このプロセスは「逆方 向フレームシーケンス再フォ−マツト化」として前に述べられている。即ち、段 階2において、システム、例えば、コンピュータは初めに。
最後のフレーム、次に最後から2番目のフレーム・・・・を処理する0段階2の 目的は、論理的フレームの平均サイズが第9図(30FPSビデオに対するもの )に示すように、5125.12となるようにパディングデータを生成すること がある。
最初に最も単純なケース、即ち、過大サイズのフレームがない場合を考えてみる 。この場合、制御ユニットは、このユニットが見出したオーディオデータ、ビデ オデータ及び補助データの長さを加え、かつ論理的フレームのサイズを5124 バイトまたは5128バイトに増加させるために、充分な0値のパディングバイ トを挿入するだけである。ディザスイッチ13goに対する制御論理は、オーデ ィオディザ器1360の制御論理と同様に働く、この制御論理は、それまでに生 成された論理的フレームのサイズの移動平均を維持し、5124または5128 の中、 5125.12の平均値を維持するほうを選択する。この平均値に対す る必要サイズは、1秒当りの画像数で表わした、記録媒体のデータ率と所望の再 生率とに基いて、制御器1310によって設定される。
過大サイズのフレームがない場合は、パディング挿入は段階lで実行することが 出来るはずであるが、それを段階2で行なう理由は、過大サイズフレームの処理 をより良くするためである。第10図、第11図及び第12図は、過大サイズフ レームの処理の基本原理を示す、第1O図は、段階lの終りにおいて論理てフレ ームのシーケンスが持つであろうサイズを示す、フレーム3は明らかに大き過ぎ て、5125.12バイトに適合しない。
第11図はこの問題に対する1つの可能な解答を示す。
過大サイズのフレームが検出されると、フオーマタが閾値制御器238に信号を 送って、過大サイズフレームを防止するに充分に小さくなるようにフレームをよ り強く再圧縮することを要求する。第11図には、そのような再圧縮の結果が示 されている6図を簡単にするために、5125、12の代りに5000の論理的 フレームサイズが示されている。
一般に、過大サイズのフレームは、シーケンス全体がデコードされ、フオーマタ に送られた後まで検出できない、その理由は、論理的フレームの全体のサイズは ビデオ圧縮器30に直接利用されない情報に左右されるからである0例えば、そ れは補助データの大きなブロックの存在によって生じる。
第12図に示され、第13図に実施例が示されているアプローチは、シーケンス の再圧縮を必要としないので、より良い解決法である。そのような付加的な圧縮 が行なわれると、画質が感知し得るほど低下することになるが、第12図のアプ ローチはこれを防止する。各フレームに対する圧縮されたデータは、1秒の1/ 30の間隔で到着しなければならないが、ある点(後述する)までは、圧縮デー タが早めに到着しても問題とならない、従って、フレーム3に対するデータは、 正式にはフレーム2に対するスペースを使うことができる。
大まかに言うと2次のような方法をとる。各フレームが最後のものから読まれ、 検査される。それが、フレームに対するその時のディザ済サイズに適合すれば、 そのフレームをそのサイズにするに丁度充分なパディングが加えられる(スイッ チ1390) 、適合しない時は、ファイルに入れられ、時間的に前のフレーム からスペースを借用してローディングが早めに開始されるようにする0次に、そ の時間的に前のフレームが検査される。そのフレームからスペースが借用されて いるが、そのフレームはその正規のフレーム割当てに適合する可能性がある。こ の状況が第12図に示されており、フレーム2と3の双方共がこれら2つのフレ ームに対するスペース内にはまっている。しかし、一般的に言って、この時間的 に前のフレームは、それ自体が過大サイズでなかった場合でも、適合しないであ ろう、その場合には、そのフレームはファイルに入れられ、処理されたばかりの フレームの前にロードされる。この場合は、全てのバイトが必要とされるために 、パディングは発生されない、これを続けることにより、2つの車の中の一方か 起きる。即ち、それが始まると考えられていた所に適合するフレームが見つかる か、または、プロセスがシーケンスの1番目のフレームに到達するかである。
前者の場合には、そのデータが1フレームに・つき1つの安定した率で入力装置 から読み出すことのできるフレームのサブシーケンスがある。これらのフレーム のいくつかは早目にホスト28のメモリにローディングが開始されるが、フレー ムも遅れて到着することはない。
後者の場合は、明らかに、安定した30F P Sを維持するように1番目のフ レームを開始させることは不可能である。この問題は第3の段階によって解決さ れる。第2の段階の処理の結果として、フオーマタはファイル用に何個の余分な バイトが生成されたかを知る。第3段階では、フォーマタは第2段階によって生 成されたファイルを読み、S4ビツトストリームを発生する。この段階で、フォ ーマタはパディングを捜し出してそれを削除する。この動作は、段階2で見つけ られた過剰バイトに等しい量のパディングが削除されるまで続く、その結果、実 時間で再生てきるファイルが出来る。起こりそうにないけれども、段階3で充分 な量のパディングが見い出せない場合は、制御器131Qが、シーケンスをもつ と少ないコードに圧縮する必要かあることを閾値制御器238に知らせる。
制御器131Oは段階2と3の間に、2つの重要な統計な計算する。第1は、再 生開始前に、ある量のCD−ROMデータを事前ロートする必要がある場合があ る。制御器1310は段階3でこれを、各フレームが到着すべき時間との対比で 実際に到着する時間を見ることによって計算する。第2に、シーケンスの途中の サブシーケンスが段階2でブロック化されると、いくつかのフレームが非常に早 く生起する。制御器1310は各フレームがいつ到着し、従って、これらの早い フレームに対してどれだけの一時記憶が必要かを正確に告げることができる。こ れら2つの重要な統計は、再生に先立って、ホストコンピュータのメモリの割当 てを制御するために、再生システムに送られる。ホストメモリが充分でない場合 は、制御器1310は圧縮がさらに必要であることを閾値制御器に知らせる。
上述の説明ではスイッチ1330については述べなかった。パディングが挿入さ れる時、基本的には、これによってS4ビツトストリーム中に使用されないスペ ースが導入されることになる。この使用されないスペースは、新しいフレームが 所要の時間に到着するようにするためにそこにある必要がある。ホストコンピュ ータが何をしているかに応じて、あるモーションビデオの再生の副次効果として ロードされ得る補助データがある場合がある。そのようなデータがある場合は、 制御器1310は、当量のパディングの代りにこの補助データを用いるようにス イッチ13フ0と1330に指示する。
再生システム 第1図の再生システム8は、ディスク20を再生して、CD−ROM制御器24 にバッファされ、ホストコンピュータ28のハス26に供給される再生されたオ ーディオ/ビデオピットストリーム信号S15を供給するCD−ROMプレーヤ 22を備えている。ピットストリームS15の「フレームヘッダ」データは、圧 縮されたオーディオデータ(S7)、圧縮されたビデオデータ(S 10)及び 補助データのピットストリーム中の位置を示す、コンピュータ28はフレームヘ ッダ識別データに応答して、ピットストリームS15のオーディオ部分(S 1 6)とビデオ部分(S17)とをバス26を介してそれぞれビデオ(30)及び オーディオ(32)処理器に送るようにする。補助データ(S 18)がある場 合は、ホストコンピュータの主メモリに記憶されて、例えば、システムの対話形 応用に用いられる0例えば、補助データは、特定の静フレームあるいはモーショ ンビデオシーケンスのディスク20上での位置のアドレス情報を含む、静止フレ ームのいくつかのシーケンスの1つを選択するように指示されると、ユーザは入 /出力装置38によって自分の選択を入力し、これに応答してホストコンピュー タがCD−ROM制御器24によってプレーヤ22に適当なシーク指令を送る。
音声処理器32はピットストリームS15のオーディオ部分をバッファしデコー ドして、lまたはそれ以上のアナログ音声信号S19をスピーカユニット34に 継続的に供給する。処理されたビデオ信号320は、30フレ一ム/秒で1例え ば、2:l飛越し走査RGB成分の形で表示器36に供給され、フルモーション カラービデオが表示される。ユーザによる、システム全体の対話(制御)は入/ 出カニニット38(例えば、キーボード、モニタ、ジョイスティック、マウス等 )によって行なうことができる。
ビデオデコーディング 第48図に詳細に示すビデオ処理器30は、端子4802における圧縮されたデ ジタルビデオ信号S17の各フレームをデコードして、フルモーションカラービ デオ信号521(RGB)を表示ユニット36(第1図)に対して飛越し形式で 60フィールド/秒の率で供給する。処理器30は、処理器の各素子に結合され たタイミング及び制御バス4812によって、メモリの読み出し/書込み動作や デコーダの選択動作(スイッチ制御)などの機部を制御するためのタイミング信 号の全てを発生するタイミング及び制御ユニット4810を備えている0図を簡 単にするために、バス4812は、概略的に矢印のみで示しである。タイミング 及び制御に関するヘッダ情報(例えば、フレーム率。
フレームサイズ、データポインタ等)が入力端子4802に結合されたヘッダ検 出器4814を介してユニット481Oに供給される。ユニット481Oによつ て制御されるマルチプレクススイッチ(MUX)4816が圧縮されたY、I及 びQデータ(S 20)を信号S17から分離して、圧縮された形で、ビデオラ ンダムアクセスメモリ(RAM)4820(点線で示す)の位置4822に記憶 させる。スイッチ4816は。
また、信号S17から統計的コードテーブルデータS22を分離して、それを可 変長デコーダ4830に供給する。デコーダ4830は統計データをデコードし て、圧縮データS20がビデオRA M 4820の位置4822から再生され る時に可変長デコーダ4830によって用いられるように、これをRAM 48 32に記憶させる。
前述したように、圧縮されたY、I及びQデータをロードした後、lフレームに 対するデコーディングプロセスが開始される。1フレームのデコーディングには 、同じプロセスが3回、各サブフレーム(Y、I及びQ)に対して1回ずつ、実 行される0次の説明は1つのサブクレームのデコーディングに対するものである 。
1つのサブフレームの伸張における1番目のステップは2進トリー記述の「構文 解析(parse) Jである。即ち、分割及びフィルを用いてトリーを記述す るトリーデータが、@域位置、サイズ及びフィル形式からなる明示リストに変換 される。これは、トリーデコーダ4842に供給することにより達成され、トリ デコーダ4842はトリーを横断して、トリーの各端子ノートにおいて、領域リ ストに適当するデータを出力する。このリストはビデオRA M 4820の領 域位置テーブル4824に記憶される。
領域テーブルの一般的なフォーマットが第49図に示されている。各セルについ て、その形式(相対的か、絶対か、DPCMかあるいはダイアトか)が、その左 上方の座標(X、Y)及びそのサイズ(H,W)と共にリストされる。セルが相 対的セルまたはダイアトセルの場合、この場合は領域シフト補間器4858が使 用されるが、偏位値(X、、Y、)も記憶される。これらの値が、その時の画像 中の領域と前の画像中の対応領域との間に相対的な偏位を特定する。セルが絶対 である場合は、絶対フィル値(これは、フィルi項式A、+B、+C中の値Cに 相当する)も記憶される。
第50図は画像の一例を示し、これに対応する、トリーデコーダから出力される 領域テーブルが第51図に示されている。この画像は、可能な各形式の2つの領 域から成っている。2進トリーの横断の順序のゆえに、必ずしもある特定の形式 のセルの全てが領域テーブル中に一緒にグループ化されるとは限らないことに注 意されたい。
いくつかの形式のセル(例えばダイアト)はビクセル対で動作するので、全ての セルが偶数に等しい寸法(HとW)を持つことが望ましい0分割毎に寸法が2分 割される単純な2進トリー分割を行なうと、元の画像の寸法が2の累乗でない限 り、すぐに奇数寸法の領域になってしまう、これではあまりにも限定されてしま うので、改良された分割法が用いられる。この方法では、分割されるべき寸法り が2つの値2 1nt(D/4)とD−2Tnt(D/4)を生成する。ここて 、 Int(D/4)は商D/′4の整数部である。これは依然として、はぼ中 央部で分割するが、元の画像の寸法が偶数であれば2全てのセルの寸法か偶数と なるようにする。この限定は3つのサブフレームの全てに同じようにあてはまり 、また、IサブフレームとQサブフレームは係数4でサブサンプルされるので、 全体としての画像の寸法は8の倍数でなければならない。
再び第48図にかえると、ビデオRA M 4820は、2つのビットマツプ、 デコードされているその時のフレームのビクセルを記憶するためのもの(マツプ 4826)と、前にデコードされ、表示ユニット36(第1図)に表示できるよ うになっているフレームのビクセルを記憶するためのもの(マツプ4828)を 有している。ビットマツプ4826を作るために、位置4822の圧縮されたフ ィルデータと位置4824の領域位置データとが、スイッチ4850を通して、 フィルデータの形式5即ち、DPCM、絶対、ダイアトあるいは相対的、に応じ て、4つのデコーダ4852.4854.4855、4856の中の選択された 1つに供給される0位置4822のフィルデータは最初ユニット4830で可変 長デコードされて、デコーダ選択スイッチ4850に(スイッチ4840を介し て)加えられる。スイッチ4850の制御は値域フィル形式検出器4851によ り行なわれ、これによって、DPCMフィルデータはデコード4852に、絶対 フィルデータはデコーダ4854に、ダイアトフィルデータはデコーダ4855 に、相対的フィルデータははデコーダ4856に向けられる。
絶対デコーダと相対的デコーダ(4854,58SIi)は、エリア検出器48 53によって供給される領域「エリア」 (即ち、領域中のビクセルの数)を表 わすデータを受取る。
後述するように、このデータは、32ピクセルより少ない領域に対して領域サイ ズに基いて量子化したフィルデータを元にもどす(dequantize)I! !に用いられる。ビットマツプ4828はダイアトデコーダ4855と相対的デ コーダ4856からアドレスデータを受取りで、その前のフレームの領域ビクセ ルデータを領域シフト補間器4858を介してデコーダ4855と4856に供 給する。ビットマツプ4826が生成されている時、ビットマツプ4828 は ユニット36上に表示できる状態となっている。これは、複数の入/出力ボート とバッファとを持つビデオRAMを選択することによって行なうことができる。
あるいは、図示のように、ビットマツプ4828の内容が表示のための別の表示 バッファ4829に転送されるようにしてもよい。
■データとQデータはYピクセルに対して垂直及び水平に4:lでサブサンプル されるので、■及びQピクセルアレイ(各々、64X 60)を補間して、Yア レイ(256X24[+)のサイズに戻すために、補間器486oが設けられて いる。Y、I及びQデータは、最初、フレームリピータ4862に供給される。
このフレームリピータは(30FPS再生ではン、ビットマツプ4829を2回 読出し、その結果得られた60Hzフイールド率のYIQ信号をインタレースす る。即ち、2−2−2−2繰返しシーケンスでインタレースして、フレーム率( 30Hz)を2倍にする。24FPSのビデオを60フィールド/秒で表示する 時は、リピータ4862はデコードされたフレームを2−3−2−3繰返しシー ケンスを用いて繰返させる。ルミナンス信号Yと補間されたI信号Q信号とは、 デジタル・アナログ(D/A)変換器及びマトリクスユニット4804に供給さ れ、ユニット4804は表示ユニット36に対するRGBアナログ出力信号S2 Gを形成する。
第53図は、相対的デコーディングのプロセスを示す。
その時のフレーム5302中の各ビクセルP (x、y)の値は、前のフレーム 5304中の対応するビクセルP’ (x、y)に多項関数A、+B、+Cの値 を加えることによりめる。座標Xとyは領域の左上の角に対して測定される。前 のフレーム中の領域5304の位置は、1/8ビクセル単位て表わした領域53 02に対する領域5304の空間偏位を表わす偏位値x0とYoによって決まる 。
第54図は相対的デコ・−ト4856の詳細ブロック図である。領域位置テーブ ル4824からのX、Y、H%W、X。
及びYoの各個はラッチ5402にラッチされる。座標X、Yがアドレスカウン タユニット5404に加えられて、このアドレスカウンタ5404をビットマツ プ4826中のデコードされるべき領域の左上方隅に初期化する。高さと幅の値 H,Wが水平及び垂直方向のカウンタの限界を特定して、アドレスカウンタは領 域5302中の各ビクセルのアドレスを次々に通ってステップする。
X、、Y、値は部分ビクセル精度で表わされた領域偏位を表わしている。これら の値の整数部はアドレス偏位加算器540Sを通過し、アドレスカウンタ54o 4からのアドレスに加算される。その結果得られるアドレスはビットマツプ48 28に供給されて、前のフレームの領域53o4中のビクセルをアドレスする。
X、、Y0値の小数部は領域シフト補間器4858に加えられて、ビットマツプ 4828における実際のビクセル相互間の中間位置に補間された値を生成する。
相対的デコーダ4856の次の段階は、相対的フィル多項値A、 十B、+(を シフトされた領域のデータに加算し、新しい領域5302をビットマツプ482 εに記憶することである。係数A、B及びCはビットストリームから読出され、 デカンタイザ(IequanNzer) 5472に加えられて。
前に述べたエリアに基く値の量子化を解く、このデヵンタイゼーションの後、係 数はフィル論理ユニット5470に供給される。このユニットはこれら3つの係 数とアドレスカウンタ5404からのXとyの値とを取って、フィル多項式の3 つの項を出力する。Xとyの値はフィル値の項をめるために論理ユニット547 0で用いられる領域座標である。これら3つの得られた項は、加算器5460. 5462及び5464を用いて、前の領域データと加算され、ビットマツプ48 26に記憶される。係数ΔAとΔBは小数であり、従って、第54図の加算器に よって出力されるフィル値も同じく小数であることに注意されたい、この値をビ ットマツプ4826に書込む前に、この値は切捨て処理されて整数にされる。
第55図は絶対領域のデコーディングを示す、この場合は、考慮されねばならな い前の領域はない、各ビクセルP (x、y)の値は、Xとyとを領域の左上の 角に対して測った座標として、多項式A、l+B、+Cの値である。Cの値はト リー記述でコード化されているので領域位置テーブルに記憶されているが、Aと Bの値はピットストリームの「絶対フィル」セグメントに含まれている。
第56図は絶対デコーダ4854のブロック図である。これは相対的デコーダ4 856と類似するが、前のビットマツプも領域補間器も用いない、A、B及びC の値は必要に応じてデカンタイザ5672によってデカンタイズされ、フィル論 理ユニット5606によって処理されてフィル多項式の各項が生成される。これ らの項は加算器によって加算されて、その結果は、切捨てによって整数とされた 後、ビットマツプ4826に書込まれる。アドレスカウンタ5604がこのプロ セスを制御してX、Y、H,Wによって規定される矩形の領域内のすべての位置 におけるビクセル値が生成される。
第57図はDPCMデコーディングのプロセスを示す。
領域5702中のビクセル値(P′)は差の値りをそのビクセルの直ぐ左側のビ クセルの値(P)に加えることにより得られる。領域の左端にある、従って、そ の左側には領域ビクセルがないビクセル(例えば1図中のQ’)は、その上側の ビクセル(Q)に値りを加えることによりデコードされる。その上にも左にもビ クセルがない領域の左上隅のビクセルは定数128にDを加えることによってデ コートされる。D値は全てピットストリームのDPCMセグメントに含まれてい ることに注意されたい。
第58図はDPCMデコーダのブロック図である。テーブル4824からのX、 Y、H及びWの値はラッチ58ozに記憶され、アドレス制御器5804によっ て用いられて、構築中の領域5702中のすべてのビクセルについてのビクセル アドレスが生成される。制御器5804は、ビットマツプ482[iからの読出 しのためのビクセルアドレスを発生して、左の値りと加算すべきビクセルPを供 給する。可変長デコーダ4830 (第48図)からのDPCMデータは、必要 とあれば、差の偵りを生成するDPCMデカンタイザ5808に加えられる。こ れらの値は、加算器5805を用いてビットマツプ4826から読出されたビク セル値(あるいは、望城の最初のビクセルの場合は、128)に加算され、ビッ トマツプ4826の領域5702に書込まれる新しいビクセル値を生成する。
第61図はダイアト領域をデコードするプロセスを示している。その時のフレー ム6110中のビクセルの値は対をなす値(R,S”)を前のフレーム6120 の対応する領域中の対をなす値(C,D)に加算して、その時のフレーム中の対 をなすビクセル(A、B)を作る。相対的フィル領域の場合と同様、前のフレー ムの領域6120の位置は、領域6110に対する領域6120の空間的偏位を 部分ビクセル単位で表わす偏位値x0とYoとのよってめられる。
第63図はダイアトデコーダ4855の詳細ブロック図である。領域位置テーブ ル4824からX、Y、H,W、Xo及びYoの値はラッチ6330にラッチさ れる。座標X、Yはアドレスカウンタユニット6332に供給されて、これをデ コードされる領域の左上角に初期化するH値とW値はアドレスカウンタによって 水平及び垂直方向にカウントされるビクセルの数を決める。
xoとYoの値はアドレス偏位加算器6334に供給されて、ビットマツプ48 28に対する整数の偏位アドレスと補間器4858に対する小数の偏位アドレス とが生成される。
ターゲット領域に対するビクセル値を生成するために、シフトされた領域のデー タC,Dがビットマツプ4828から読出され、領域シフト補間器4858を通 して処理され、加算器6350と6352とを用いてダイアト値R,Sに加算さ れる。その結果得られた値A、Bはビットマツプ48z6に書込まれる。
ダイアト値は、まず、デコーダ4830を用いて、ピットストリームからの値を 可変長デコートし、それをテーブルアドレス発生器631Oに加えて、ダイアド メモリ6320中のダイアトを指定して生成される0例えば可変長デコーディン グ後の値が3の時は、ダイアトメモリからダイアト対No、 3が読出される。
第59図は32ビクセルより小さい領域についての量子化債をリストしたテーブ ルである。lビクセル領域は、明るさの8レベルを表わす3ビツトの解像度に量 子化されたことに注意されたい、エリヤ(面積)が2倍になると、1ビツト増し た精度が用いられ、最高は8ビツト/ビクセルの全ビデオ解像度である。こうす ることにより、小さな領域な表わすに必要なビット数を少なくできる。このデー タのデコーディング、即ち、「デカンタイジング(dequantizing)  Jは、フィル値が計算される時、ビットに退出な2進の重みを与えるために、 左ヘシフトされねばならない。
第60図は$59図の左シフト「デカンタイザ」動作を具体化するためのブロッ ク図である。領域位置テーブル4824からの領域の高さくH)と輻(W)のデ ータがラッチ6002と6004にラッチされ、エリヤ検出器4853 (点線 て示す)の乗算器6006により乗算される0乗算器はエリヤルックアップテー ブル6008に対してアドレスコートを供給して、エヤの関数としてシフト値( 第59図)を得る。
これらの値はとットシフタ6010に供給される。左寄せされるべき量子化され た可変長フィルデータはビットシフタ5010のデータ入力に加えられ、ビット シフタ601oはテーブル6008により供給されるシフト値に従ってデータを 左寄せする。
デコード時間モニタ236の説明で、デコート時間は前の画像から借りてくるこ とができるので、時々は長いデコード画像があっても許容できるということを示 した。
この考え方を、ビデオRA M 4820の詳細を示す第52図の文脈において 更に論じる。このメモリは、その時デコードされているフレームが記憶されるバ ッファ4826.前にデコードされたフレームを記憶するバッファ4828、グ ラフィックスバッファ5202、パイブラインバッファ5204及び表示バッフ ァ4829を含む多数の表示バッファを含んでいる。前に述べたように、デコー ディングプロセスはビットマツプ4828に記憶されている前の画像からのデー タを用いて、次の画像、即ち、ビットマツプ4826に記憶さて、バッファ52 02に含まれているフレームは表示バッファ4828に含まれているフレームの 直前にデコードされ、表示バッファ4829に含まれているフレームはビットマ ツプ5204に含まれているフレームの前にデコードされている(以下、同様) 、即ち、バッファ4829から表示されている画像は、必ずしも2デコードプロ セスで用いられている画像とは限らず、実際は、数フレーム時間以前にデコード されたものがある。
複数の表示バッファを用いる利点は、グラフィックスが見られる前に、表示器上 にそれを描くためのホストソフトウェアを用いることが出来るという点である。
このような変更は、デコードプロセスの中なので、ビットマツプ4826上では 出来ない、ビットマツプ4828のビクセルはデコーディング中に使用され、ま た、ビットマツプ4828はグラフィックスビクセルによって破壊されないので 、グラフィックスはピッ1−マツプ4828中に描くことができない、また、グ ラフィックスはバッファ4829に描かれてはならない、なぜなら、そのような 描画プロセスは表示器36上で観察できるからである。これをバッファ5202 で行なっても、これらの問題は生じない。
複数の表示バッファを用いる別の理由は、これによりデコード時間の借用が可能 になるためである。ビデオRAMにいくつかの余分のバッファを用いることによ り1つのバッファが表示ρために選択される時間をデコーディングプロセスと独 立、即ち、非同期的にすることができる0画像のバイブラインが空にならない限 り、フレームリピータ4862は5表示画像中に目に見えるような休止や空白を 生じることなく動作できる。この原理は第13図のディザ作用ボックスと同様で ある。リピータ4862は2画像の表示の率の移動平均を維持し、その時の画像 を保持するか、あるいは5次の画像に進み、移動平均を所望の再生速度に近い値 に維持する。この点は、可変速度再生において特に有効である0例えば、ユーザ が、30F PSで記録された資料の、ある特定のフレームまたは−続きのフレ ームの詳細を見るために、再生フレーム率を低下させるか、あるいは停止させた いこともあろう。30FPSで記録されたビデオを一連の静止フレームとして見 たい場合はCD−ROMプレーヤを一時停止させ、バッファパイプラインの内容 を一度に1フレームずつ選択的に表示することになろう。CD−ROMは表示パ イプラインが空にならないようにするために、スタードース1〜ツブモードで動 作させることになろう。
フォーマタ250(第2図)は、表示バッファのパイプラインか空になってしま わないようにするように構成されている。フォーマタはデコート時間モニタ23 6によって生成される値に基いて、再生中、表示バッファパイプラインのふるま いをシミュレートし、バイブラインの枯渇を防止する最小コード化サイズをめる ことができる。この値が表示バッファ用としてホスト上で利用できるメモリより 大きい場合には、制御器131Oを用いて閾値制御器238に、より高い閾値を 用いて圧縮を繰返してデコード時間を短くすべきことを知らせる。
ここに記述したシステムの例では、圧縮された信号用の伝送媒体としてCD−R OMを用いたが、そうする代りに、例えば、デジタル磁気ディスクあるいはデジ タル磁気テープなどの他の伝送媒体を用いることもできる。
また、フルサイズ(例えば、12インチ)の光学ディスクや容量蓄積形のディス クも伝送用としで用いることもできる。圧縮された信号の伝送は、例えば、衛星 システムとかケーブル伝送システムなどの他の手段によっても行なうことができ る。さらに、絶対領域及び相対的領域に対する線形のフィルデータは、両方共、 式A、+B、+Cの係数A、B及びCによって表わされる。絶対フィルデータの 係数は実際のビクセル値に関係づけられているが、相対的フィルデータはターゲ ット領域中のビクセルと前のフレームの対応する領域中のビクセルとの間の差の 値に関係づけられている。
請求項において、フィルデータの階層的決定は、画像データを第1のコード形式 によって記述できるような領域に画像データのアレイを順次分割することによっ て、また、そのようなコート化が出来ないアl/イの領域で、予め定められた最 小サイズのものについては、そのような領域中の画像データを別のコード形式で 記述することとして、定義されている。
FI6.2 <4500 tぐイト FIG、 15 Yj Q !、itスイー″+ 224°゛ら・1.力 同l、21桃2;ショ ケ’+n)s、fi刊ドジタル、ビヂズ席31と2 FIG、16 列 FIG、 /θ 951八フイ1ンA1βJす乙から 攻Sト必(狭域ビク乞ル不虹 デコードコホ、tこも哀。
FIo、24 FI6.25 !iノを−(史y’(qh )−リ−・ コードイヒi:”ia、 so nc ; yi FI6.33B ゛炸珀ダ分餐1 FIG、 34B ビク℃ルY樗/IPAJ4t”T乞ル フィIし7!÷ メジアン2座2スコ本 1c’7eル叶府グ’y悼r4 FIG、350 FIG、 36A t、iフイクト FIG、 43 オロ刺19vフィルコード :A+B+C+λ2)+ ”f。
仔り ! I、 −1,O,Xo、 ’f。
FIG、 47 FIG、 52 FIG、 54 P(壽ヴ)冨Aχ+ By+ C j”7&5j Fl(i5B FIG、 59 プーツ1し7L//27−)ブ(コーどj)”RioSiAiRCi + RL BrD、j+ SjFIG、63 国際調査報告 mum埼−ム紳−C拳し齢N−pcτ/υS 88103コ29国際調査報告  US 8803329 ThII−貰−I111P1112m b−マーm−1嘲川誇−−絢−4wsm −1情を一噛一―I申−舗m−−wm−−rq−九η吋謝1−晒部0爾−−伽i i−誠P廁−CWmEDPr*、峠24I041紳Tka Ew*ptha p H1lll OIIiw−噛Mmay −一一紳−嚇1m−1四−pm1w−− dW幀帥銅1

Claims (1)

  1. 【特許請求の範囲】 (1)デジタルモーションビデオ信号のフレームからなるシーケンスの第1のフ レームを所定の圧縮手順に従って圧縮するステップと、 上記シーケンスの第2のフレームと少なくとも1つの他のフレームとを別の圧縮 手順に従って圧縮するステップと、 上記圧縮されたフレームから出力信号を形成し、各フレームに用いられた各圧縮 手順を示す識別コードを含ませるステップと、 を含む、デジタルモーションビデオ信号をコード化する方法。 (2)デジタルモーションビデオ信号を可変閾値を有する圧縮器で圧縮するステ ップと、 1フレーム当りのバイトの数をモニタするステップと、 1フレーム当りのデコーディング時間を概算するステップと、 上記1フレーム当りのバイトの数と上記概算された1フレーム当りのデコーディ ング時間とに従って上記圧縮閾値を調整して処理された出力信号を供給するステ ップと、 を含む、デジタルモーションビデオ信号を圧縮する方法。 (3)上記デコーディング時間を概算するステップが、Aiをある特定のデコー ディング処置が実行される合計回数を表わし、Kiがその処置に関連する最大デ コーディング時間を表わすものである時、 ▲数式、化学式、表等があります▼ で表わされる積の和Tを生成するステップを含んでいる、請求項(2)に記載の 方法。 (4)上記デコーディング時間を概算するステップが各フレームに対するデコー ディング時間を概算するものである、請求項(2)に記載の方法。 (5)上記デコーディング時間を概算するステップが複数の順次コード化された フレームにわたる移動概算を求めるものである、請求項(2)に記載の方法。 (6)ビデオデータのフレームを供給する手段と、上記フレームを供給する手段 に結合されており、絶対フィルデータとDPCMフィルデータと対応する領域記 述パラメータとを含むフィルデータを階層的に決定する手段を含む手段と、 フレームデータ、領域の量に対応する情報及びデータのフレームを記述するため に生成されたフィルデータの形式を記述するデータを含むヘッダデータを生成す る手段と、 全フレーム基準でフィルデータの形式とフレーム全体に対する領域記述パラメー タとの各々を独立して検査して、データの各形式に対する最適な可変長コードセ ットを可変長コードセットのテーブルから求め、各形式のフィルデータと領域ヘ ッダデータを、各データの形式について求められた最適な可変長コードに従って コード化する手段と、 を含む、ビデオデータのフレームを圧縮するための装置。 (7)上記階層的にフィルデータを決定する手段を含む手段が、さらに、上記デ ータのフレームをサブサンプルして、上記データのフレームよりも少ないピクセ ル値を有する縮小されたデータのフレームを生成し、かつ、この縮小されたデー タのフレームを上記階層的にフィルデータを決定する手段に供給する手段を含む ものである、請求項(6)に記載の装置。 (8)上記階層的にフィルデータを決定する手段が相対的フィルデータ及び対応 する領域記述パラメータも生成するものである、請求項(6)に記載の装置。 (9)運動する画像を表わすビデオデータの一連のフレームを圧縮する方法であ って、 ビデオデータのフレームを領域に分割し、それぞれの領域の位置とサイズを記述 する領域パラメータを生成するステップと、 各領域中のピクセル値を、その前に生起したフレームからの同じサイズの領域中 に対応するピクセル値と比較して、それぞれのピクセルの差を生成するステップ と、それぞれの領域に対するピクセルの差を記述する相対的フィルデータを求め るステップと、 相対的フィルデータを求めることが出来ない各領域についてダイアドフィルデー タを求めるステップと、相対的フィルデータもダイアドフィルデータも求めるこ とが出来ない各領域についてDPCMフィルデータを求めるステップと、 上記相対的フィルデータ、上記ダイアドフィルデータ、上記DPCMフィルデー タ及び対応する領域パラメータとを可変長コード化するステップと、を含む、運 動する画像を表わすビデオデータの一連のフレームを圧縮する方法。 (10)上記フレームが領域に分割され、各領域が相対的フィルデータを決定す るために検査され、所定の許容度で相対的フィルデータを求めることができない 場合は、各領域を次々とサブ領域に分割し、各サブ領域を検査して相対的フィル データを求め、上記サブ領域が所定の最小サイズのサブ領域に分割された後に相 対的フィルデータを求めることができない場合、上記所定の最小サイズのサブ領 域についてダイアドフィルデータまたはDPCMフィルデータを求めるようにさ れている、請求項(9)に記載の方法。 (11)領域記述パラメータとフィルデータとのデコーディング時間を概算し、 この概算デコーディング時間を所定の値と比較するステップと、 上記概算デコーディング時間が上記所定の値よりも大吉い場合、上記フィルデー タを生成するために設定された許容度を変えて請求項(10)に記載の諸ステッ プを繰返すステップと、 を更に含む、請求項(9)に記載の方法。 (12)上記デコーディング時間を概算するステップが、Aiをある特定のデコ ーディング処置が実行される合計回数を表わし、Kiがその処置に関連する最大 デコーディング時間を表わすものである時、 ▲数式、化学式、表等があります▼ で表わされる積の和Tを生成するステップを含んでいる、請求項(11)に記載 の方法。 (13)上記積の和を発生するステップが、(a)それぞれの形式のフィルデー タによって記述される領域の数にそれぞれの第1の定数を乗じた積と、(b)各 形式の領域に含まれるピクセルの数にそれぞれの第2の定数を乗じた積と、(c )それそれの形式の領域に含まれるピクセルの行の数にそれそれの第3の定数を 乗じた積との和を形成し、この積の和を所定の値と比較することを含み、領域の 形式がそれぞれの領域中のピクセルを記述するために用いられるフィルデータの 形式である、請求項(12)に記載の方法。 (14)上記デコーディング時間を概算するステップが複数の順次コード化され たフレームにわたる移動概算を求めるものである、請求項(11)に記載の方法 。 (15)(A)ピクセル値の行と列からなるアレイを領域に分割し、上記アレイ 中のそれぞれの領域のサイズと位置を記述する領域パラメータを生成するステッ プと、(B)それぞれの領域を記述する絶対フィルデータを求めるステップと、 (C)絶対フィルデータを求めることができない領域のそれぞれを記述するDP CMフィルデータを求めるステップと、 (D)上記絶対フィルデータ、上記DPCMフィルデータ及び対応する領域記述 パラメータを可変長コード化するステップと、 (E)上記可変長コード化された絶対フィルデータ、DPCMフィルデータ及び 対応する領域記述パラメータから伸張時間を概算するステップと、 (F)上記概算値が所定の値より小さい時、上記可変長コード化されたフィルデ ータと対応する領域パラメータとを供給し、上記概算値が上記所定値よりも大き い場合は、上記絶対フィルデータを求める時に異なる許容度を用いてステップ( A)〜(F)を縁返すステップと、を含む、ピクセル値の行と列からなるアレイ によって表わされるビデオデータのフレームを圧縮する方法。 (16)上記伸張時間の概算値を求めるステップが、Aiをある特定のデコーデ ィング処置が実行される合計回数を表わし、Kiがその処置に関連する最大デコ ーディング時間を表わすものである時、 ▲数式、化学式、表等があります▼ で表わされる積の和Tを生成するステップを含んでいる、請求項(15)に記載 の方法。 (17)上記積の和を発生するステップが、(a)それぞれの形式のフィルデー タによって記述される領域の数にそれぞれの第1の定数を乗じた積と、(b)各 形式の領域に含まれるピクセルの数にそれぞれの第2の定数を乗じた積と、(c )それぞれの形式の領域に含まれるピクセルの行の数にそれぞれの第3の定数を 乗じた積との和を形成し、この積の和を所定の値と比較することを含み、領域の 形式がそれぞれの領域中のピクセルを記述するために用いられるフィルデータの 形式である、請求項(16)に記載の方法。 (18)ビデオデータのフレームまたは一連の関連したフレームを圧縮する方法 であって、 (A)N、M、R及びSを整数とし、RがNより小さく、SがMより小さいもの として、N行M列の値を含むビデオデータのフレームをR行S列の値のビデオデ ータの縮小フレームに再サンプルするステップと、(B)上記縮小フレームをピ クセル値からなる領域に分割し、フレーム中のそれぞれの領域の位置とサイズを 記述する領域パラメータを生成するステップと、静止フレームについて、 (C)それそれの領域を記述する絶対フィルデータを求めるステップと、 (D)絶対フィルデータを求めることができない領域についてDPCMフィルデ ータを求めるステップと、一連の関連したフレーム中のフレームについて、(E )それぞれの領域を記述する相対的フィルデータを求めるステップと、 (F)相対的フィルデータを求めることができないそれぞれの領域を記述する絶 対フィルデータを求めるステップと、 (G)相対的フィルデータも絶対フィルデータも求めることが出来ないそれそれ の領域についてDPCMフィルデータを求めるステップと、 静フレームと一連の関連したフレーム中のフレームの両方について、 (H)領域パラメータ、絶対フィルデータ、相対的フィルデータ及びDPCMフ ィルデータを可変長コードでコード化するステップと、 (I)可変長コード化されたデータのそれぞれのフレームのデコーディング時間 を概算するステップと、(J)上記概算デコーディング時間が所定の値よりも小 さい場合は、上記可変長コード化されたデータを圧縮されたビデオ出力データと して供給し、上記概算デコーディング時間が上記所定値よりも大きい場合は、絶 対フィルデータと相対的フィルデータを求める時に異なる許容度を適用してステ ップ(B)〜(J)を繰返すステップと、 を含む、ビデオデータのフレームまたは一連の関連したフレームを圧縮する方法 。 (19)上記縮小フレームを分割するステップが、縮小フレームを表わすデータ のアレイを2分割して領域を生成し、各領域をさらに2分割し、各分割処理の後 、フィルデータを生成することが出来るか否かを決定するためにそれぞれの領域 を検査し、フィルデータを生成することが出来る場合はその領域の分割を終了さ せ、また、所定の最小サイズの領域への分割後の領域についてフィルデータを生 成することが出来ない場合、最小サイズの上記領域のピクセル値をDPCMコー ド化することを含むものである、請求項(18)に記載の方法。 (20)上記デコーディング時間を概算するステップが、Aiをある特定のデコ ーディング処置が実行される合計回数を表わし、Kiがその処置に関連する最大 デコーディング時間を表わすものである時、 ▲数式、化学式、表等があります▼ で表わされる積の和Tを生成するステップを含んでいる、請求項(18)に記載 の方法。 (21)上記積の和を発生するステップが、(a)それそれの形式のフィルデー タによって記述される領域の数にそれぞれの第1の定数を乗じた積と、(b)各 形式の領域に含まれるピクセルの数にそれぞれの第2の定数を乗じた積と、(c )それぞれの形式の領域に含まれるピクセルの行の数にそれぞれの第3の定数を 乗じた積との和を形成し、この種の和を閾値と比較することを含むものである、 請求項(20)に記載の方法。 (22)上記デコーディング時間を概算するステップが各フレームに対するデコ ーディング時間を概算するものである、請求項(18)に記載の方法。 (23)上記デコーディング時間を概算するステップが複数の順次コード化され たフレームにわたる移動概算を求めるものである、請求項(18)に記載の方法 。 (24)ピクセル値サンプルの行と列のアレイによって表わされるビデオ信号の フレームまたは一連のフレームを圧縮する方法であって、 (A)上記アレイを領域に分割するステップと、(B)各領域について、A、B 及びCを係数とし、x及びyをそれぞれ上記行と列に沿う相対的な座標軸として 、上記領域中の各ピクセル値を記述するためのAx+By+Cの形の双線形多項 式に対する上記係数を発生するステップと、 (C)それぞれの領域中の各ピクセルについて、上記双線形多項式を用いて、そ れそれのピクセル値を生成するステップと、 (D)上記双線形多項式を用いて生成されたピクセル値を上記領域中の対応する 実際のピクセル値と比較して、それぞれの誤差値を求めるステップと、(E)上 記領域上の誤差値の総合誤差値を求め、この総合誤差値を第1の閾値と比較する ステップと、(F)上記誤差値の中の上記領域の周辺部分に位置するピクセル値 に対応するものを比較する際に境界値チェックをして、上記誤差値の上記対応す るものが所定の条件を満足するか否かを決定するステップと、(G)上記総合誤 差値が上記第1の閾値より小さくかつ上記領域の周辺部分に位置するピクセル値 に対応する上記誤差値が上記所定の条件を満足するという条件の下に、上記アレ イ内のヒ記領域のサイズと位置と上記係数との表示を含むコードを発生し、また 、上記所定の条件が満足されない場合は、上記領域をより小さな領域に分割して 、ステップ(B)〜(G)を実行するステップと、を含む、ビデオ信号のフレー ムまたは一連のフレームを圧縮する方法。 (25)上記総合誤差値を求めるステップが上記領域上の誤差値の平均2乗誤差 を発生することを含むものである、請求項(24)に記載の方法。 (26)上記係数を発生するステップが上記領域中のピクセル値について最小2 乗適合度(Ieast square fit)を実行することを含むものであ る、請求項(24)に記載の方法。 (27)各々がピクセル値サンプルの行と列のアレイによって表わされるビデオ 信号の一連のフレームを圧縮する方法であって、 (A)ピクセル値のフレームを領域に分割するステップと、 (B)上記領域中のピクセル値を前に生起したフレームの同じサイズの領域中の 対応するピクセル値と比較して、対応するピクセルの差の値の領域を形成するス テップと、 (C)A、B及びCを係数とし、x及びyをそれぞれ上記行と列に沿う相対的座 標軸として、上記領域中の各ピクセル差値を記述するためのAx+By+Cの形 の双線形多項式に対する上記係数を発生するステップと、(D)上記双線形多項 式を用いてそれそれのピクセル差値を生成するステップと、 (E)上記双線形多項式を用いて生成されたピクセル差値を上記領域中の対応す るピクセル差値と比較して、誤差値を生成するステップと、 (F)上記領域上の上記誤差値について総合誤差値を形成し、この総合誤差値を 第1の閾値と比較するステップと、 (G)上記誤差値の中で上記領域の周辺部分に位置するピクセルに対応するもの について境界チェックをして、上記誤差値の上記対応するものが所定の条件を満 足しているか否かを決定するステップと、(H)上記総合誤差値が上記第1の閾 値より小さくかつ上記誤差値の中で上記領域の周辺部分に位置するピクセルに対 応するものが上記所定の条件を満足している場合は、上記アレイ内の上記領域の サイズと位置を表わしかつ上記係数を含むコードを発生し、上記条件が満足され ない場合は、上記領域に対しステップ(A)〜(H)を実行するステップと、 を含む、ビデオ信号の一連のフレームを圧縮する方法。 (28)さらに、上記ステップ(A)〜(H)を縁返し実行した後で、上記条件 が満足されない場合、上記前に生起したフレーム中の移動領域を求め、上記領域 とこの移動領域とを用いてステップ(A)〜(H)を実行するステップを含む、 請求項(27)に記載の方法。 (29)上記総合誤差値を形成するステップが上記誤差値の平均2乗誤差を生成 することを含むものである、請求項(27)に記載の方法。 (30)上記係数を生成するステップが上記ピクセル差値について最小2乗適合 度を実行することを含むものである、請求項(27)に記載の方法。 (31)コード化されるべきデジタルビデオ信号のフレームを供給する信号源と 、 上記フレームを領域変換によってコード化して、異なる面積のピクセル領域を表 わす複数の領域コードを供給する圧縮器手段と、 上記領域コードを量子化するための量子化手段と、上記圧縮器手段に結合されて いて、上記面積の所定の関数として上記量子化手段を制御する面積決定手段と、 を含んでなるデジタルビデオエンコーダ。 (32)上記量子化手段が領域コードサンプルを異なるビット数を持つサンプル に量子化するものでありて、小さな領域に対応する領域コードサンプルがより大 きな領域に対応する領域コードよりも少ないビット数を持つサンプルに量子化さ れるように構成されている。請求項(31)に記載のデジタルビデオエンコーダ 。 (33)量子化のための手段が上記領域コードのビットを切捨てる手段を含むも のである、請求項(32)に記載のデジタルビデオエンコーダ。 (34)ビデオデータのフレームについて、絶対値フィルデータ、DPCMフィ ルデータ及び対応する領域記述パラメータを含むフィルデータを階層的に求める ステップと、 フレーム基準で、各形式のフィルデータと、領域記述パラメータとを独立して検 査して、それそれの形式のデータをコード化するためのそれぞれの最適可変長コ ードセットを求めるステップと、 それぞれの形式のフィルデータと領域記述パラメータとを上記求められた最適可 変長コードセットに従って可変長コード化するステップと、 を含む、ビデオデータのフレームを圧縮する方法。 (35)ビデオデータのフレームを供給する手段と、上記フレームを供給する手 段に結合された手段を含み、相対的フィルデータ、DPCMフィルデータ、ダイ アドフィルデータ及び対応する領域記述パラメータを含むフィルデータを階層的 に求める手段と、全フレーム基準で、フィルデータの形式の各々と、フレーム全 体についての領域記述パラメータとを独立して検査し、可変長コードセットのテ ーブルから、各形式のデータに対するそれぞれの最適可変長コードセットを求め 、それぞれの形式のフィルデータと領域データとを、それそれの形式のデータに ついて求められた最適可変長コードに従ってコード化する手段と、 を含んでなる、ビデオデータのフレームを圧縮するための装置。 (36)行と列に配列されたピクセル値のアレイによって表わされるビデオデー タのフレームを圧縮する方法であって、各アレイが順次領域に分割されるように 構成されており、この分割が、上記アレイ及び領域を上記行の間及び上記列の間 で垂直方向または水平方向に、その中のピクセル値が所定の許容度で領域特定コ ードによって記述できるような領域が見つかるまで、実質的に2等分し、分割の 一方の側に、相対的な差を呈する大多数のピクセルを分離させるような方向に上 記領域を分割することによって行なわれ、上記領域が分割される方向、即ち、水 平方向か垂直方向か、はそれぞれの領域中のピクセル値を検査して上記領域内の 相対的ピクセル差の分布を確かめることによって決められるものである、ビデオ データのフレームを圧縮する方法。 (27)上記相対的ピクセル差の分布を確かめるステップが、 ある領域中の各ピクセル値を、それに直接隣接するピクセル値から引算して、そ れぞれの差を生成するステップと、 これらの差を閾値と比較するステップと、隣接する行中のピクセル値の差で上記 閾値を超えるものの数を計数して、第1の数を生成するステップと、隣接する列 中のピクセル値の差で上記閾値を超えるものの数を計数して、第2の数を生成す るステップと、上記第1の数を上記第2の数と比較するステップと、を含み、 上記第1の数が上記第2の数を超える場合は水平方向に、上記第2の数が上記第 1の数を超える場合は垂直方向に上記領域が分割されるように構成されている、 請求項(36)に記載の方法。 (38)上記相対的ピクセル差の分布を確かめるステップが、 分割されるべき領域中の輪郭を検出するステップと、分割されるべき領域の各象 限における輪郭の分布を求めるステップと、 上記各象限中の輪郭分布を比較するステップと、上記比較に基いて、大きい方の 輪郭分布をもった2つの象限が分割の一方の側に閉込められるような分割の方向 を求めるステップと、 を含むものである、請求項(36)に記載の方法。 (39)さらに、象限輪郭分布が大きい方の輪郭分布を持つ象限の分割の一方の 側への閉込めを不可能とする場合には、上記分割されるべき領域を予め定められ た推奨される高さ/幅アスペクト比を持つサブ領域に分割するような分割方向を 求めるステップを含んでいる、請求項(38)に記載の方法。 (40)行と列に配列されたピクセル値のアレイであって、各アレイが順次領域 に分割されるようにされたアレイによって表わされるビデオデータのフレームを 圧縮する方法であって、上記分割が、上記アレイおよび領域を上記行の間及び列 の間で水平方向または垂直方向のいずれかに、その中のピクセル値が領域特定コ ードによって所定の許容度で記述できるような領域が見つかるまで、分割するこ とによって行なわれ、領域が分割される方向、即ち、水平方向または垂直方向が 、(A)それそれの領域に対する領域特定コードを生成し、 (B)上記領域特定コードを用いて上記領域に対するピクセル値を生成し、 (C)上記生成されたピクセル値と対応する領域のピクセル値との間の誤差を表 わす値を求め、(D)上記誤差から総合垂直方向誤差値を求め、(E)上記誤差 から総合水平方向誤差値を求め、(F)上記垂直方向総合誤差値と上記水平方向 誤差値とを比較して、領域をこの比較結果に基いて水平方向または垂直方向に分 割する、 ことによって決定される、ビデオデータのフレームを圧縮する方法。
JP63508345A 1987-10-05 1988-09-29 デジタル・ビデオ圧縮システム Pending JPH03501550A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/104,457 US4868653A (en) 1987-10-05 1987-10-05 Adaptive digital video compression system
US104,457 1987-10-05

Publications (1)

Publication Number Publication Date
JPH03501550A true JPH03501550A (ja) 1991-04-04

Family

ID=22300582

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63508345A Pending JPH03501550A (ja) 1987-10-05 1988-09-29 デジタル・ビデオ圧縮システム

Country Status (7)

Country Link
US (1) US4868653A (ja)
EP (1) EP0393065A1 (ja)
JP (1) JPH03501550A (ja)
KR (1) KR890702379A (ja)
AU (1) AU637286B2 (ja)
CA (1) CA1333090C (ja)
WO (1) WO1989003159A2 (ja)

Families Citing this family (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5122873A (en) * 1987-10-05 1992-06-16 Intel Corporation Method and apparatus for selectively encoding and decoding a digital motion video signal at multiple resolution levels
US5164839A (en) * 1988-12-27 1992-11-17 Explore Technology, Inc. Method for handling audio/video source information
JPH0322259A (ja) * 1989-03-22 1991-01-30 Seiko Epson Corp 小型データ表示・再生装置
JP2797404B2 (ja) * 1989-04-20 1998-09-17 ソニー株式会社 動画像データの記録方式
JP2689632B2 (ja) * 1989-08-15 1997-12-10 ソニー株式会社 画像信号の伝送装置および伝送方法
EP0715469B1 (en) * 1989-10-14 2001-09-12 Sony Corporation Video signal coding/decoding method and apparatus
JP2712656B2 (ja) * 1989-10-25 1998-02-16 日本電気ホームエレクトロニクス株式会社 Cd―rom記録方法
SG52321A1 (en) * 1990-03-05 1998-09-28 Mitsubishi Electric Corp Variable length coding method
US5134476A (en) * 1990-03-30 1992-07-28 At&T Bell Laboratories Video signal encoding with bit rate control
US5781196A (en) * 1990-10-19 1998-07-14 Eidos Plc Of The Boat House Video compression by extracting pixel changes exceeding thresholds
US6002720A (en) * 1991-01-07 1999-12-14 H. Lee Browne, D/B/A Greenwich Information Technologies Llc Audio and video transmission and receiving system
US5253275A (en) 1991-01-07 1993-10-12 H. Lee Browne Audio and video transmission and receiving system
US5132992A (en) * 1991-01-07 1992-07-21 Paul Yurt Audio and video transmission and receiving system
TW223690B (ja) * 1991-02-13 1994-05-11 Ampex
US5262964A (en) * 1991-04-10 1993-11-16 International Business Machines Corporation Method and apparatus for variable playback speed of multimedia data interchange within a data processing system
US5182642A (en) * 1991-04-19 1993-01-26 General Dynamics Lands Systems Inc. Apparatus and method for the compression and transmission of multiformat data
JP2664817B2 (ja) * 1991-05-31 1997-10-22 インターナショナル・ビジネス・マシーンズ・コーポレイション フレーム列画像圧縮方法及びシステム並びにフレーム再構成方法及びシステム
US5265180A (en) * 1991-06-13 1993-11-23 Intel Corporation Method of encoding a sequence of images of a digital motion video signal
US5291486A (en) * 1991-08-19 1994-03-01 Sony Corporation Data multiplexing apparatus and multiplexed data demultiplexing apparatus
US5274718A (en) * 1991-09-30 1993-12-28 At&T Bell Laboratories Image representation using tree-like structures
US5185655A (en) * 1991-10-02 1993-02-09 Tandy Corporation Method and apparatus for encoding full color video data signals and protocol for encoding same
US5434623A (en) * 1991-12-20 1995-07-18 Ampex Corporation Method and apparatus for image data compression using combined luminance/chrominance coding
WO1993015453A1 (en) * 1992-01-23 1993-08-05 Supermac Technology Personal computer apparatus for digital video and audio manipulation
US5686961A (en) * 1992-01-27 1997-11-11 Harris Corporation Automatic video image data reduction and prioritization system and method
US5339108A (en) * 1992-04-09 1994-08-16 Ampex Corporation Ordering and formatting coded image data and reconstructing partial images from the data
US5337085A (en) * 1992-04-10 1994-08-09 Comsat Corporation Coding technique for high definition television signals
US5511151A (en) * 1992-06-10 1996-04-23 Canon Information Systems, Inc. Method and apparatus for unwinding image data
US5440677A (en) * 1992-07-01 1995-08-08 Time Warner Interactive Group Inc. Method and apparatus for processing audio and graphic images to create an interleaved file suitable for use as a CD-ROM product
US5502576A (en) * 1992-08-24 1996-03-26 Ramsay International Corporation Method and apparatus for the transmission, storage, and retrieval of documents in an electronic domain
JPH06149990A (ja) * 1992-11-02 1994-05-31 Fujitsu Ltd 画像圧縮方法及び画像処理装置
US5581669A (en) * 1992-12-18 1996-12-03 Microsoft Corporation System and method for peripheral data transfer
US6301390B1 (en) * 1993-03-31 2001-10-09 Canon Kabushiki Kaisha Encoding image data in blocks read out in a predetermined order
US5467413A (en) * 1993-05-20 1995-11-14 Radius Inc. Method and apparatus for vector quantization for real-time playback on low cost personal computers
DE69423072T2 (de) * 1993-06-08 2000-07-06 Sony Corp., Tokio/Tokyo Kodierer und verfahren zur kodierung
US5525984A (en) * 1993-08-06 1996-06-11 Adc Telecommunications, Inc. Optimization of weighted signal-to-noise ratio for a digital video encoder
US5535137A (en) * 1994-02-14 1996-07-09 Sony Corporation Of Japan Random access audio/video processor with compressed video resampling to allow higher bandwidth throughput
KR960013055A (ko) * 1994-09-27 1996-04-20 김광호 조건부 퀴드트리 분할방식의 화상압축방법 및 장치
US6020926A (en) * 1994-12-30 2000-02-01 Intel Corporation Motion estimation block matching speedup
US5729294A (en) * 1995-04-05 1998-03-17 International Business Machines Corporation Motion video compression system with novel adaptive quantization
US5831872A (en) * 1995-06-27 1998-11-03 Motorola, Inc. Method and system for compressing a video signal using dynamic frame recovery
JP3323877B2 (ja) * 1995-12-25 2002-09-09 シャープ株式会社 音声発生制御装置
US5675382A (en) * 1996-04-08 1997-10-07 Connectix Corporation Spatial compression and decompression for video
US6101276A (en) * 1996-06-21 2000-08-08 Compaq Computer Corporation Method and apparatus for performing two pass quality video compression through pipelining and buffer management
US5995724A (en) * 1996-11-01 1999-11-30 Mikkelsen; Carl Image process system and process using personalization techniques
US6269190B1 (en) * 1996-09-24 2001-07-31 Electronics For Imaging, Inc. Computer system for processing images using a virtual frame buffer
US6480541B1 (en) 1996-11-27 2002-11-12 Realnetworks, Inc. Method and apparatus for providing scalable pre-compressed digital video with reduced quantization based artifacts
US6453074B1 (en) * 1997-03-31 2002-09-17 Canon Kabushiki Kaisha System for image decimation including selective filtering
US6040861A (en) * 1997-10-10 2000-03-21 International Business Machines Corporation Adaptive real-time encoding of video sequence employing image statistics
US7301944B1 (en) 1997-10-24 2007-11-27 Tranz-Send Broadcasting Network, Inc. Media file distribution with adaptive transmission protocols
US6529635B1 (en) 1997-12-15 2003-03-04 Intel Corporation Shape-based image compression/decompression using pattern matching
EP0936813A1 (en) * 1998-02-16 1999-08-18 CANAL+ Société Anonyme Processing of digital picture data in a decoder
KR100354531B1 (ko) * 1998-05-06 2005-12-21 삼성전자 주식회사 실시간 복호화를 위한 무손실 부호화 및 복호화 시스템
US6356665B1 (en) 1998-12-09 2002-03-12 Sharp Laboratories Of America, Inc. Quad-tree embedded image compression and decompression method and apparatus
US6330366B1 (en) * 1998-12-21 2001-12-11 Intel Corporation Method and apparatus for buffer management in video processing
US6807298B1 (en) * 1999-03-12 2004-10-19 Electronics And Telecommunications Research Institute Method for generating a block-based image histogram
GB0007784D0 (en) * 2000-03-30 2000-05-17 Sony Uk Ltd Data compression
US7224837B2 (en) * 2000-10-11 2007-05-29 Screenpeaks Ltd. Digital video broadcasting
JP2003046944A (ja) * 2001-08-02 2003-02-14 Sony Corp 信号処理装置および方法、記録装置および方法、再生装置および方法、記録再生装置および方法、ビデオカメラ、ならびに、映像モニタ装置
US6910533B2 (en) * 2002-04-02 2005-06-28 Schlumberger Technology Corporation Mechanism that assists tractoring on uniform and non-uniform surfaces
CN1647544A (zh) * 2002-04-12 2005-07-27 皇家飞利浦电子股份有限公司 用于编码和解码的方法和设备
US7415162B2 (en) 2003-05-27 2008-08-19 Zaxel Systems, Inc. Method and apparatus for lossless data transformation with preprocessing by adaptive compression, multidimensional prediction, multi-symbol decoding enhancement enhancements
US7428341B2 (en) 2003-05-27 2008-09-23 Zaxel Systems, Inc. Method and apparatus for lossless data transformation with preprocessing by adaptive compression, multidimensional prediction, multi-symbol decoding enhancement enhancements
US20060285590A1 (en) * 2005-06-21 2006-12-21 Docomo Communications Laboratories Usa, Inc. Nonlinear, prediction filter for hybrid video compression
FR2897741B1 (fr) * 2006-02-17 2008-11-07 Canon Kk Procede et dispositif de generation de donnees representatives d'un degre d'importance de blocs de donnees et procede et dispositif de transmission d'une sequence video encodee
US7751638B1 (en) * 2006-09-15 2010-07-06 Altera Corporation Adaptive quantizer
US7813564B2 (en) * 2007-03-30 2010-10-12 Eastman Kodak Company Method for controlling the amount of compressed data
US20120189052A1 (en) * 2011-01-24 2012-07-26 Qualcomm Incorporated Signaling quantization parameter changes for coded units in high efficiency video coding (hevc)
US9614724B2 (en) 2014-04-21 2017-04-04 Microsoft Technology Licensing, Llc Session-based device configuration
US9639742B2 (en) 2014-04-28 2017-05-02 Microsoft Technology Licensing, Llc Creation of representative content based on facial analysis
US9773156B2 (en) 2014-04-29 2017-09-26 Microsoft Technology Licensing, Llc Grouping and ranking images based on facial recognition data
US10111099B2 (en) 2014-05-12 2018-10-23 Microsoft Technology Licensing, Llc Distributing content in managed wireless distribution networks
US9384335B2 (en) 2014-05-12 2016-07-05 Microsoft Technology Licensing, Llc Content delivery prioritization in managed wireless distribution networks
US9430667B2 (en) 2014-05-12 2016-08-30 Microsoft Technology Licensing, Llc Managed wireless distribution network
US9384334B2 (en) 2014-05-12 2016-07-05 Microsoft Technology Licensing, Llc Content discovery in managed wireless distribution networks
US9874914B2 (en) 2014-05-19 2018-01-23 Microsoft Technology Licensing, Llc Power management contracts for accessory devices
US10037202B2 (en) 2014-06-03 2018-07-31 Microsoft Technology Licensing, Llc Techniques to isolating a portion of an online computing service
US9367490B2 (en) 2014-06-13 2016-06-14 Microsoft Technology Licensing, Llc Reversible connector for accessory devices
US9460493B2 (en) * 2014-06-14 2016-10-04 Microsoft Technology Licensing, Llc Automatic video quality enhancement with temporal smoothing and user override
US9373179B2 (en) 2014-06-23 2016-06-21 Microsoft Technology Licensing, Llc Saliency-preserving distinctive low-footprint photograph aging effect
US10453221B2 (en) 2017-04-10 2019-10-22 Intel Corporation Region based processing
CN117044207A (zh) * 2021-02-20 2023-11-10 抖音视界有限公司 图像/视频编解码中的边界填充尺寸

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5792976A (en) * 1980-12-02 1982-06-09 Toshiba Corp Hierarchy encoding system

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2706080C2 (de) * 1977-02-12 1986-10-23 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren zur adaptiven Quantisierung von Transformationskoeffizienten eines Bildes und Anordnung zum Durchführen des Verfahrens
US4179709A (en) * 1978-01-10 1979-12-18 Bell & Howell Company Video information bandwidth compression
US4205341A (en) * 1978-01-24 1980-05-27 Nippon Telegraph And Telephone Public Corporation Picture signal coding apparatus
US4319267A (en) * 1979-02-16 1982-03-09 Nippon Telegraph And Telephone Public Corporation Picture coding and/or decoding equipment
US4261018A (en) * 1979-06-18 1981-04-07 Bell Telephone Laboratories, Incorporated Progressive image transmission
US4371895A (en) * 1980-01-18 1983-02-01 Nippon Electric Co., Ltd. Coded video signal transmitting and receiving system
US4496944A (en) * 1980-02-29 1985-01-29 Calma Company Graphics display system and method including associative addressing
US4491836A (en) * 1980-02-29 1985-01-01 Calma Company Graphics display system and method including two-dimensional cache
US4492956A (en) * 1980-02-29 1985-01-08 Calma Company Graphics display system and method including preclipping circuit
JPS56136093A (en) * 1980-03-26 1981-10-23 Fuji Photo Film Co Ltd Adaptive quantizer
US4369463A (en) * 1981-06-04 1983-01-18 International Business Machines Corporation Gray scale image data compression with code words a function of image history
US4541012A (en) * 1982-01-04 1985-09-10 Compression Labs, Inc. Video bandwidth reduction system employing interframe block differencing and transform domain coding
US4520401A (en) * 1982-04-16 1985-05-28 Victor Company Of Japan, Ltd. Digital video signal recording system and reproducing apparatus
US4603347A (en) * 1982-05-06 1986-07-29 Nippon Telegraph & Telephone Public Corporation Intraframe coding and decoding equipment for video signals of different quality
JPS5992688A (ja) * 1982-11-19 1984-05-28 Fuji Photo Film Co Ltd 適応形画像圧縮方式
US4518994A (en) * 1982-12-20 1985-05-21 Rca Corporation Communication system compandor
US4563671A (en) * 1983-05-18 1986-01-07 At&T Bell Laboratories Coding technique
JPS6029068A (ja) * 1983-06-16 1985-02-14 Nec Corp 伝送誤り検出方式
US4578704A (en) * 1983-06-20 1986-03-25 At&T Bell Laboratories Image coding technique
US4559563A (en) * 1983-10-11 1985-12-17 Xerox Corporation Adaptive prediction for binary encoded documents containing a mixture of text, line drawings and halftones
JPH06101841B2 (ja) * 1984-01-11 1994-12-12 日本電気株式会社 動画像信号の符号化方法およびその装置
CA1277416C (en) * 1984-08-13 1990-12-04 Akihiro Furukawa Inter-frame predictive coding apparatus for video signal
DE3437182A1 (de) * 1984-10-10 1986-04-10 Telefunken Fernseh Und Rundfunk Gmbh, 3000 Hannover Verfahren zur aufzeichnung und/oder wiedergabe digital kodierter signale
JPH0620303B2 (ja) * 1984-11-08 1994-03-16 日本電信電話株式会社 フレ−ム間符号化方式におけるリフレッシュ処理方式
GB8502924D0 (en) * 1985-02-05 1985-03-06 British Telecomm Image encoding
US4661849A (en) * 1985-06-03 1987-04-28 Pictel Corporation Method and apparatus for providing motion estimation signals for communicating image sequences
US4706260A (en) * 1986-11-07 1987-11-10 Rca Corporation DPCM system with rate-of-fill control of buffer occupancy
US4729020A (en) * 1987-06-01 1988-03-01 Delta Information Systems System for formatting digital signals to be transmitted

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5792976A (en) * 1980-12-02 1982-06-09 Toshiba Corp Hierarchy encoding system

Also Published As

Publication number Publication date
AU1813792A (en) 1992-08-06
WO1989003159A2 (en) 1989-04-06
AU637286B2 (en) 1993-05-20
EP0393065A1 (en) 1990-10-24
KR890702379A (ko) 1989-12-23
WO1989003159A3 (en) 1989-06-01
CA1333090C (en) 1994-11-15
US4868653A (en) 1989-09-19

Similar Documents

Publication Publication Date Title
JPH03501550A (ja) デジタル・ビデオ圧縮システム
KR0185165B1 (ko) 디지털 비디오 전송 시스템
US5225904A (en) Adaptive digital video compression system
US5079630A (en) Adaptive video compression system
JPH03501551A (ja) デジタルビデオ伸張システム
US5122873A (en) Method and apparatus for selectively encoding and decoding a digital motion video signal at multiple resolution levels
KR100252594B1 (ko) 다중 발생 데이타압축/압축해제 처리용 양자화계수 결정 장치 및방법
JPH05234260A (ja) ディジタルvtr
US5329360A (en) Multiplexing and demultiplexing image data
JPH0583674A (ja) データのシヤフリングおよびデシヤフリングを行う方法および装置
JPH05507601A (ja) ビデオ信号記憶装置
US5684896A (en) Data compression
CA2133459A1 (en) Method and apparatus for compressing and decompressing a sequence of digital video images using sync frames
US5987183A (en) Image activity data compression and decompression method and apparatus
JPH0746139A (ja) 信号処理装置及びその応用
KR20030086330A (ko) 화상 처리 장치, 화상 처리 방법, 화상 처리 프로그램 및기록 매체
EP0946062B1 (en) Data compression
US20050010626A1 (en) Selectable quantization in an encoder
US5825970A (en) Quantization number selecting apparatus for DVCR and method therefor
AU625594B2 (en) Digital video decompression system
AU622880B2 (en) Digital video transmission system
JP3334255B2 (ja) 高能率符号化装置
JP3186509B2 (ja) 画像情報圧縮方法、画像情報記録方法、画像情報圧縮装置、画像情報記録装置、画像情報伸長装置、画像情報再生装置
JP2992992B2 (ja) 画像符号化装置
JPH0795530A (ja) 画像圧縮記録再生装置