JP2000510302A - 可変ビットレート符号器 - Google Patents

可変ビットレート符号器

Info

Publication number
JP2000510302A
JP2000510302A JP09540581A JP54058197A JP2000510302A JP 2000510302 A JP2000510302 A JP 2000510302A JP 09540581 A JP09540581 A JP 09540581A JP 54058197 A JP54058197 A JP 54058197A JP 2000510302 A JP2000510302 A JP 2000510302A
Authority
JP
Japan
Prior art keywords
bit rate
buffer
image
time
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP09540581A
Other languages
English (en)
Other versions
JP4547048B2 (ja
Inventor
アレクサンドル,パトリス
ノブル,リュドヴィック
ペロン,クロード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vantiva SA
Original Assignee
Thomson Multimedia SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Multimedia SA filed Critical Thomson Multimedia SA
Publication of JP2000510302A publication Critical patent/JP2000510302A/ja
Application granted granted Critical
Publication of JP4547048B2 publication Critical patent/JP4547048B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 本発明は、特に、可変ビットレートに従ってデータを伝送するためのビデオシーケンスのディジタルデータ符号化方法に関する。本発明の方法は、時点nの画像に対するビットレート制御は、時点n+τに対する伝送チャネルに関して予測されたビットレートに従って行われ、τは符号器バッファへの画像記憶の時点と、符号器バッファからの画像出力の時点との間の一定時間であることを特徴とする。

Description

【発明の詳細な説明】 可変ビットレート符号器 本発明は、オーディオ、ビデオ又は補助ディジタルデータの符号化に関する。 本発明は、特に、可変ビットレート伝送及びオーディオ及びビデオディジタル データの圧縮を利用する記憶用システムに関する。本発明はMPEG2標準と互 換性がある。 ビデオ圧縮システムの役割は、できるだけ低い伝送ビットレートに対し最良の 画質を得ることである。この符号化の品質は、特に、動き評価器及びアルゴリズ ムを調節する符号器の選定に関係する。これは、採用された最適性基準に直接的 に依存する。 動き評価に関して、基準画像内をサーチする性能は重要な特性である。調節に 関して、主要な目的は符号化された画像の安定な品質を維持することである。符 号化を出力ビットレートに調整するため利用される“パッディング”係数は(一 般的に、データストリームに“0”を挿入することは、ビットレート設定値の保 存を可能にさせる)、最適符号化のため最小限に抑える必要がある。 各画像を符号化するコストは可変である。画像の複雑さの変動に起因するフロ ーの変動を補正すること、並びに、出力としてデータレート設定値に対応したデ ータフローを送信することは調節ループの役割である。この調節は、一般的に、 バッファメモリの使用状態レベルに依存する量子化間隔に作用する。符号器の出 力側のバッファメモリは、調節ループの応答時間に起因し、バッファの容量が関 係するビットレートの変動を吸収することが可能である。 ビデオソースの符号器の出力側のデータフローは変化してもよい。実際上、チ ャネルの利用可能な“大域的”ビットレートを種々のビデオソースの間で動的に 分散させること、即ち、各ビデオソースか ら符号化されるべき画像の複雑さの変化の関数として分散させることは、例えば 、数個のビデオソースを単一チャネルを介して伝送する場合に利点がある。この 処理は、例えば、伝送されたプログラムのタイプの関数としてビットレートをビ デオソースに割り当てる従来の処理に対し、伝送された画像の大域的な品質を改 良することが可能である。 図1にはこのような処理を使用する伝送の組が示されている。この中には、幾 つかの符号化されたビデオソースを固定した大域的ビットレートの単一伝送チャ ネルを介しで伝送することが含まれる。このビットレートは、容量、例えば、ト ランスポンダのチャネルの容量に対応する。ビデオソース13iの符号化回路は 、チャネルを介して電送されるべきデータストリームを供給する出力を備えたマ ルチプレクサ11の入力に結合される。また、ビデオソースの符号化回路は、ビ デオソースの複雑さに関係したデータをビットレートアロケータ12に送信し、 このビットレートアロケータ12によって各ソースに割り当てられたビットレー トを受信するインタフェース回路14に接続される。ビットレートを各ソース1 3iに割り当てる役目を担うビットレートアロケータは、多重化回路又はマルチ プレクサ11を制御する。情報は、ビットレートアロケータ12及びインタフェ ース回路14に接続された高速バスを用いて交換される。管理回路15は伝送の 組を管理するためこのバスに連結される。 多重化は、例えば、GOP速度で行われる。GOPは、ビットレートアロケー タによって同一チャネルを介して伝送された各ビデオソースに割り当てられたビ ットレートの関数として定義される画像グループである。このビットレートは、 所定の量子化間隔に対し生成された情報の量を考慮するビデオソースの複雑さの 係数に依存する。この係数は各ビデオソースの各GOP毎に測定される。この係 数は、例えば、量子化間隔が一定であるとき、GOPを符号化するため使用され るビット数に対応し、或いは、量子化ステップが可 変であるとき、量子化間隔によって乗算されたビット数に対応するビットの標準 化されたカウントに対応する。フローはGOPの間隔に亘って一定であるので、 対応したソースの出力バッファはGOPの間隔に亘るビットレートのスパイクを 吸収しなければならない。 上記の如く各ソースのビットレートに依存する統計的多重化と組み合わされた 可変ビットレート符号器の利用は公知であり、トランスポンダチャネルの容量を 最適化する手段である。これらの調節処理の欠点も公知である。メモリが使い尽 くされるか、或いは、飽和することなく、対応したビデオソースのビットレート 変動を吸収することができるように、主として復号器側のバッファメモリのサイ ズを大きくする必要がある。復号器のバッファは、オーバーフロー(データの損 失)、或いは、枯渇を生じるべきではない。このため、復号器のコストが増大す る。一方、必要なメモリ容量は、一般的にMPEG2標準に匹敵しない。 ビットレート、即ち、画像レベルの瞬時的変動は、一般的に、符号器レベル又 は復号器レベルのどちらの場合でもより多量のバッファメモリ容量を要求し、こ れらのメモリ容量の関数として制限されるべきである。 本発明の目的は上記の欠点を軽減することである。 本発明の主題は、ディジタルデータを圧縮し、符号化されるべきデータに対す る量子化間隔に作用する調節ループを用いて符号器の出力側でビットレートを調 節し、復号器のバッファに可変ビットレートでチャネルを介して送信するため上 記符号器によって出力されたデータをバッファに格納し、上記符号器のバッファ への画像の格納の時点と上記復号器のバッファからの上記画像の出力の時点との 間に一定時間τを保証するように上記データにタグを付け、ビデオ画像シーケン スのディジタルデータを符号化する処理において、 時点nでの画像に関するビットレート調節は時点n+τに対する伝送チャネル に関するビットレート予測の関数として実行され、 調節は上記符号器のバッファの最初のアドレスと最後のアドレスとによって定 められる仮想バッファの限界内で行われ、 上記仮想バッファの最初のアドレス又はオフセットは、上記符号器のバッファ の出力の伝送ビットレートの変動の時間τだけ前から始まり、時間τによって乗 算されたビットレート変動に対応した値に依存して、上記符号器のバッファの上 記最初のアドレスに関して変化することを特徴とする。 また、本発明の主題は、各ビデオソース毎に所定の伝送チャネルを介して可変 ビットレートでデータを送信するため上記データを符号化する、数個のビデオソ ースからデータを伝送する処理において、 各ソース毎に、チャネル利用可能ビットレート及び上記ビデオソースの組から の前の画像の複雑さの測定量に依存して、上記チャネルを介した上記ソースの実 際のビットレートよりもτだけ前の時点にビットレート割付を行うことを特徴と する。 本発明の特徴及び利点は、以下の例示的な説明及び添付図面の参照によって明 瞭にされる。図面中、 図1は従来技術による公知の伝送の組を示し、 図2はMPEG2標準に従って符号化及び復号化する装置を表し、 図3は、符号器側及び復号器側のバッファメモリの使用状況を、ビットレート の関数として概略的に表す図であり、 図4は、仮想バッファのサイズ及び位置の変化の一例を時間の関数として表現 する図であり、 図5は、符号器の物理バッファ中の仮想バッファのサイズ及び位置を、ビット レートの関数として表現する図であり、 図6は、符号器の物理バッファ中の仮想バッファのサイズをビットレートの関 数として表現する図であり、 図7は、パラメータαの変化をビットレートの関数として表現する図であり、 図8は、本発明に従って符号化する装置を表す図であり、 図9は、本発明に従って調節を行う装置を表す図であり、 図10は、本発明による調節処理のフローチャートである。 本発明の利点は、復号器のバッファメモリのサイズの削減に関する。このメモ リは、MPEG2標準と互換性を維持すると共に、非常に広い範囲内でビットレ ートの瞬時的な変動を許容する。この処理は、各画像毎にビットレートの変化に 反応する能力を有し、同時に、復号器がビデオバッファのサイズ制限に従うこと を保証する。この能力は、ビットレート変化の最大ステップ、即ち、MP@ML MPEG2フォーマット(MPEG2 メインプロファイル メインレベル1 )の1.5−15Mbit/sのブラケットに関して全く制限を生じさせない点 で非常に価値がある。 本発明によれば、チャネルの利用可能ビットレートは最適化され、即ち、各ビ デオソースの情報の複雑さの関数として時間及び値に関して最適化された方法で 割り当てられる。 一般的にMPEG2と称されるビデオ圧縮の原理は、国際勧告(ISO/IEC 13818 H.262)の課題である。MPEG2圧縮器の機能的アーキテクチャは公知であり 、MPEG2標準に記載されているが、以下に簡単に引用する。 符号器のビデオ入力は、4:2:2フォーマットのディジタル的に符号化され た画像を受信する。空間符号化(イントラ画像又は“イントラ”符号化)の場合 、画像、或いは、より詳細に言うと画像を構築するブロックは、DCT変換を直 接的に受け、次に、量子化され(画像I)、量子化された値はメモリ又はバッフ ァに記憶される前に可変長符号化(VLC)がなされる。可変長符号化は、符号 器の出力側でビットレートの“平滑化”を行い、調節ループは量子化間隔をビッ トレート設定値に拘束することが可能である。逆量子化と、引き続く逆DCT変 換は、動き評価の際に補助として役立つ再生された画像をメモリに格納するよう な形で行われる。 インター画像又は“インター”符号化は、画像間のプロックの移動を符号化す ることによって時間的冗長性を利用する。以下の2種類の時間符号化が存在する 。 予測符号化は、同一タイプ又は動き評価中に先行する(順方向)イントラタイ プの画像だけに依存する(画像P)。 双方向符号化は、符号化されるべき画像の両側に接する画像I及び/又はPに 依存する(画像B)。 コサイン変換は、時間符号化の場合に画像間の差だけに適用される。このよう に量子化され、画像を構築するブロックの動きを表すベクトルを伴う誤差は、復 号器側で再生を可能にさせる。 画像Iと、次の画像Iに先行する後続の画像P及びBとにより構成されるセッ トは、GOP(グループ・オブ・ピクチャ)と称される。 本発明の主題であるビットレート調節の原理の説明は、MPEG2標準に記載 されているようなVBVモデルを要求する。 VBVモデル、又は、ビデオバッファリング検証器(Video Buffering Verifie r)は、符号器の出力に配線された仮定的な復号器として定義され、ビットレート の変動に関する制約をモデル化することができる。復号器は復号化されるべき画 像をバッファから瞬時に取り出すことが仮定される。このモデルは符号器を調節 するアルゴリズム内に構築され、符号器は復号器のバッファからの上記画像の出 力の時点の値を厳密に知ることが不可欠である。MPEG2標準に準拠して、図 2に記載された処理を用いて復号化の時点を決定する役割を担うのは符号器自体 である。 符号器21は以下の要素を含む。 符号化モジュール211は、符号器の入力である入力側にディジタルビデオデ ータを受信する。 −出力バッファ212は、入力側に符号化モジュールから発生した符号化された データを受信する。 −バッファ212の出力に接続された入力を有する挿入回路213は、クロック 基準をバッファから発生するデータに挿入し、このように構成されたデータフラ ックス又はビットストリームを伝送チャネル22、ケーブル、無線又は衛星リン クを介して伝送する。 −内部クロック回路214は、符号化モジュール211から、符号器への画像の 到達の時点に対応した同期信号を受信し、DTS(MPEG2標準に準拠した符 号化時間スタンプ(Decoding Time Stamp))“符号化時点(decoding instant)” を符号化モジュールに送信し、挿入回路にPCRクロック値を供給する。 チャネルを介して伝送されたデータは復号器23の入力に到達する。復号器は 以下の要素を含む。 −逆多重化回路231は、PCRクロック基準を取り出し、復号器の入力でもあ る入力側でチャネルを介して伝送されたデータを受信する。 −復号器のバッファ232は、逆多重化回路から発生したデータを受信する。 −バッファの出力に接続された入力を有する復号化モジュール233は、符号化 動作の逆の復号化動作を実行し、復号化されたビデオデータを復号器23の出力 でもある出力側に供給する。 −内部クロック回路234は、PCR(プログラムクロック基準)基準を受信す るため逆多重化回路に接続され、DTS復号化時点を読み出し、読み出された信 号を送信するためバッファに接続される。 このように、粗く100ms毎に、符号器の内部クロック(PCR)は、(標 準に定義された)トランスポートレイヤのレベルでMPEG2ビットストリーム 中で送信される。復号器は、内部クロック回路234に在る位相ロックドループ 即ちPLLを用いて固有の時間基準を得るためこのPCR値を捕捉する。かくし て、符号器及び復号器は共通基準クロックをもつ。 符号器の入力に画像が出現する毎に、PCRクロックはサンプリ ングされ、通過の時間によって補償される。得られた情報である復号化時点タグ (DTS=復号化タイムスタンプ)は、この画像と関連したMPEG2ビットス トリームに挿入され、プログラムされた復号化時点と対応する。 復号器は、画像毎に符号器が復号化をプログラムしたDTS時点を格納する調 節バッファに画像を受信する。かくして、復号器で再生されたPCRクロックが バッファの出力に在る画像のDTS値に達したとき、クロック回路は復号化を初 期化し、画像に対応したビットストリームの内容は読み出された信号を用いて復 号器のバッファから取り出される。 VBV_sizeが復号器のバッファのサイズを表し、VBVfullnes sが所定の時点でのこのバッファの使用状況のレベルを表すとき、復号器は、バ ッファが完全に使用されているとき(VBV_size=VBV_fullne ss)にバッファから第1の符号化された画像を取り出す必要がある場合を想定 すると、復号器は、出力を許可状態にする前に、 に一致する時間だけ待機する必要があり、式中、 τはバッファ中の移動の時間(端から端までの遅延)を表し、 レートは符号器の出力ビットレート(伝送ビットレート)を表す。 これは、実際上、画像が符号器のバッファ内に留まる時間である。 図3には完全な符号化/復号化回路が簡単に示されている。 以下の表記が使用される。 D1(t)=時点tで符号化回路から出るビットレート(符号器バッファの入 力) D2(t)=時点tで復号化回路に入るビットレート(復号器のバッファの出 力) B1(t)=時点tでの符号器のバッファの占有状況 B2(t)=時点tでの復号器のバッファの占有状況 Dc(t)=時点tでのチャネルビットレート 入力側にビデオデータを受信する符号化回路31は、バッファ占有状況である データの量B1(t)だけ使用されている容器によって表されたバッファメモリ 32に連結される。このバッファは、伝送チャネル33と呼ばれる物理リンクで ある無線又は衛星によって復号器のバッファ34の入力に連結される。各バッフ ァ34は使用状況B2(t)を有する。バッファ34の出力は復号化回路35専 用の入力に接続される。 τ1は画像がバッファ32に留まる滞留時間であり、τ2は画像がバッファ3 4に留まる滞留時間であり、τは、画像が符号器のバッファに入力する時点と、 画像が復号器のバッファから出力する時点との間に経過する時間を表す場合を考 える。 一定の全体的処理時間(圧縮+格納+伝送+格納+伸張)を保証するため、各 画像は一定時間τの間に符号器側及び復号器側のバッファリング若しくは記憶段 を通過する必要があり、符号化時間及び復号化時間そのものは一定であり、符号 化入力及び復号化出力でのビットレートは同一であり、 τ=τ1+τ2=一定 として表される。 この一定時間τを保証するため、図2を参照するに、ビットストリームに挿入 された復号化時点タグDTSは、符号器の入力への画像の到着に対応したPCR クロックに対するサンプリング値に、符号器及び復号器のバッファ内の移動時間 τ(移動時間τは端から端までの遅延とも称される)に等しい正のオフセットを 与える。 τは、完全な画像の転送時間であり、時点tにおける符号器のバッファの入力 のビットレートは、時点t+τにおける復号器のバッファの出力でのビットレー トに一致し、 D1(t)=D2(t+τ) である。時点t0における初期条件は、以下の通りである。 B1(t0)=B2(t0)=0 時点t0+τの復号器のバッファ状態は、 である。何れの時点でも、符号器のバッファ状態は、 に一致する。同様に、時点t+τでの復号器のバッファ状態は以下の通り表され る。 したがって、 のようになる。 上記の関係は、符号器のバッファに関して行われる測定に基づいて復号器のバ ッファの挙動を表現する。 チャネルを介するビットレートが一定であるとき、バッファ状態は相補的であ り、 B2(t0+τ)=復号器バッファの初期状態 のとき、 B2(t+τ)=B2(t0+τ)−B1(t) と表される。 この結果は二つのバッファ間を通るデータ項目の移動時間に一致する遅れを伴 う、符号器のバッファと復号器のバッファの間の通信用の容器の直観的な原理を 表現する。 MPEG II メインプロファイル・メインレベル(MP@ML)ビデオ符 号化の場合、二つのバッファの容量を加算することによって得られる定数は1. 835Mbitに制限される。 チャネルを介するビットレートが可変であるとき、復号器のバッファの状態は 、容量: が既知であるという条件に限り明示的に知ることができる。 B1(t)+B2(t+τ)に一致する容量は、以下に定義する如く、符号化 バッファに設けられた仮想バッファのオフセットを表す。 図4は、時間の関数としてバッファの累積占有状況、即ち、符号器及び復号器 のバッファに累積された情報の量の一例を表す図であり、各バッファの使用状況 の変化を推定することが可能である。 横軸は時間を表し、縦軸は累積占有状況又はバッファに累積され た情報の量を表す。 曲線41は、符号器バッファに対応し、バッファ書き込みアドレス又は書き込 みポインタにたとえることができ、各垂直線は、バッファによって記憶され、画 像のインター符号化又はイントラ符号化のため必要とされる情報の量を表現する (長い方の線はイントラ符号化用である)。 曲線42は、復号器バッファ及び復号器バッファ読み出しポインタに対応し、 バッファから出る累積情報の量を表現する。上記の関係を用いることにより、2 番目の曲線は、値τだけ1番目の曲線の横軸に沿って平行移動する。 曲線43は符号器のバッファを出る累積情報の量と、復号器のバッファに入る 情報の量とを表す。これらの曲線は重ね合わされ、チャネル内の移動時間は説明 を簡単にするため零であると仮定されるので、チャネルを介して伝送される情報 の量を表す。実際上、曲線43は、復号器のバッファの書き込みポインタに重ね 合わされた符号器のバッファの読み出しポインタを表す。この曲線の勾配は、符 号器のバッファの出力並びに復号器のバッファの入力におけるビットレート、即 ち、チャネルビットレートDc(t)である。 曲線44は符号器バッファの実際のサイズを記述し、曲線45は復号器バッフ ァのサイズを表す。これは、曲線44の場合に符号器のバッファのサイズを法と する正ベクトルで、曲線45の場合に復号器のバッファのサイズを法とする負ベ クトルで、曲線43を縦軸方向に平行移動したものである。最後に、曲線46及 び47は、位置及びサイズを定義することにより符号器に仮想バッファをモデル 化するため機能する。 この仮想バッファは符号器のバッファ中の“有効”調節ゾーンを表し、VBV モデルの符号器のバッファに画像を構成する。 符号器の物理バッファにおける配置は、全てのビットレートで各画像毎に一定 の移動時間を生成するような方法で計算される。 所定の時点tで調節ゾーン内の最大アドレスはパラメータVBV of fsetによっ て定義される。これは、縦軸に沿って読み取られた曲線43と曲線46の間の偏 差に対応する。 このパラメータVBV_offsetが分かることによって、任意の時点で、 VBVモデルに依存して、符号器がバッファ占有状況制約に適当かどうかを検証 することが可能である。調整アルゴリズムの適切な動作のためには、このパラメ ータを知ることが不可欠である。 符号器の物理バッファ仮想バッファの配置は以下の通り獲得される。 以下の関係: がある。この関係は、画像レベルで“離散化”することによって のように表現することができる。この離散型の式において、 −nは時点tの画像を表し、 −Dc(k)は画像kの符号化中に、符号器の出力側で画像のビットレート(1 画像当たりのビット数)を表し、 −τは間隔τに対応した画像数に関して表現されている。 かくして、先行の画像に対し、 が得られる。この関係から、バッファ占有状況係数の変化を以下の通り推定する 。 但し、 ΔB1(n)=ΔD1(n)−Dc(n)−εDc(n) であることに注意する必要がある。 仮想バッファの占有状況係数を更新する以下の式 ΔB2(n+τ)=Dc(n+τ)−ΔD1(n)+εDc(n) が得られる。式中、ΔD1(n)は時点nに画像を符号化するコストに対応し、 Dc(n+τ)は時点n+τに符号器の出力で予測されるビットレートである。 上式の第3項は、符号器の出力で予測されるビットレートと、実際に測定された 値Dc(n)との間の時点nに測定された誤差である。 したがって、時点nに酉像を符号化するコストは、時点n+τに符号器の出力 で予測されるビットレートに依存する。この基本的な原理に従って、任意の時点 で以下の式を適用することによりVBVモデルに対するバッファ占有状況情報が 得られる。 VBV_fullness(n)= VBV_fullness(n−1)+Dc(n+τ) −Last_picture_cost+εDc(n) 上記条件に従って、設定値は画像(n)の符号化の直前に受信され、外部設備 (ビットレートアロケータ)から発生する。 このビットレートアロケータは、時間τだけ後の時点のチャネルビットレート を予測するため、例えば、GOPの期間に亘って前の画像の複雑さを受信し、可 能であれば、同じチャネルを介して伝送されることを要求するビデオソースの複 雑さを考慮する。 Bpp(n)が画像期間(n+τ)に符号器の出力で予測されるチャネルビッ トレートの設定値を表す場合、以下の式によって画像レベルでVBVモデルの更 新を定義することができる。 VBV_fullness(n)= VBV_fullness(n−1)+Bpp(n) −Last_picture_cost+εBpp(n−t) 但し、 εBpp(n−τ)=Bpp(n−τ)−Dc(n) は、画像(n−τ)の符号化の前に受信された設定値と、画像nの符号化の間に 符号器の出力に現れる実際のビットレートとの間の誤差を表す。 この関係は、可変ビットレート符号器の動作の主要な条件を仮定することを促 す。 調節アルゴリズムによって受信されたビットレート情報キューは、符号器の出 力での実際の適用よりも符号器及び復号器のバッファ内の移動時間に一致する一 定時間だけ先行する必要がある。 復号器のバッファ状態のモデル化は、時点tに符号器に与えられた画像の符号 化の時点で範囲[t,t+τ]に亘るチャネルビットレートを先験的に知ること である。 かくして、この仮想バッファの位置を制御することにより、符号器は、復号器 側で起こり得る可能性のある行き過ぎを予測し得る。図4に関して、仮想バッフ ァによる復号器のバッファの再生は、ビットレート変更中の予測機構を含む。 高ビットレートに対し、符号器を調節するため有効なゾーンは、曲線43及び 44によって示された物理バッファの“頂”部にあり、低ビットレートに達した とき、バッファの底部に切り替わる。 このスイッチは間隔τによるチャネルのビットレートの変更を予測する。 二つのバッファを通過する時間は一定である。これは、最小許容可能ビットレ ートの動作に対するバッファの通過時間を考慮することにより選択される。ここ では、 τ>VBV_size/bitrate_min を選択する。 この値は、高ビットレートに対し小さい遅延の拘束(詳細のスケジュールに拘 束される可能性がある)に従うことが望まれる場合、不利になる。しかし、有効 な調節ゾーンは時間τを短縮するため低ビットレートに制限してもよい。 最後に、注意する必要がある。符号器のバッファのサイズは、最大ビットレー トの最小ビットレートに対する比に一致する割合で、復号器のバッファのサイズ よりも大きい。所定の画像のフォーマットに対し、この比は4を超えることが無 く、(MP@MLの1.835Mbitの有効最大サイズに対し)8Mbitの 符号器側のバッファサイズを予測することができる。 図5は、復号器の物理バッファ中の仮想バッファを示す図である。同図には、 仮想バッファの配置の仕方、及び、現在のビットレートの関数としてあるべきサ イズが表されている。 ビットレートは、Mbit/s単位で減少方向の横軸に沿ってプロットされ、 仮想バッファの“位置”はMbit単位で縦軸方向にプロットされる。 最大ビットレートに対し、飽和ゾーンにおいて、仮想バッファのサイズは復号 器のバッファのサイズに一致し、本例の場合には、例えば、1.835Mbit である。 Evbs=VBV_size 仮想バッファは復号器のバッファの頂部にある。 線形ゾーンにおいて、即ち、本例の場合の9Mbit/sと1.5Mbit/ sの最小ビットレートの間で、バッファのサイズは直線的に減少し、 Evbs=KR α(n)=一定 に一致する。 画像レベルで離散化を続けた場合、画像nの符号化の時点で、復号器の物理バ ッファのサイズ(物理バッファサイズ)はEpbs(n)と称され、復号器の仮 想バッファのサイズ(仮想バッファサイズ)はEvbs(n)と称される。 仮想バッファは、伝送ビットレートが極大であるとき、イントラ符号化画像で 完全に埋められるように寸法が決められる。 復号器の仮想バッファのサイズは最大で復号器のバッファのサイズ、即ち、V BV sizeであり、伝送ビットレートが低下すると、値K.R(n)まで減 少する。ここで、Kは、GOPの構造及び伝送ビットレートに依存して0.1乃 至0,2の値を有する時定数であり、R(n)は画像nに対する伝送ビットレー トである。 Evbs[n]=min(VBV size,K.R[n]) (a) 簡単のため、仮想バッファのサイズは、所定のビットレートで符号器のバッフ ァのサイズに達するまで、ビットレートの線形関数として定義され、次に、バッ ファのサイズは飽和レベルで一定に保たれる。本例を採用する場合、 Epbs=7.2Mbit K=0.2s Rmax=15Mbit/s Rmin=1.5Mbit/s τ=480ms である。Evbsは、1.835Mbitから最小値に対する300kbitま で変化する。 仮想バッファのオフセットは最大ビットレートに対し7.2Mbitであり、 最小ビットレートに対し420kbit(α(n)×Rmin)である。 図6は、ビットレートの関数として、パラメータKの種々の値に対し、仮想バ ッファのサイズの変化の一例を示す図である。 横軸はMbit/s単位でビットレートを表し、縦軸はMbit単位で仮想バ ッファのサイズを表す。曲線61は0.2に一致するKの値に対応し、破線の曲 線62は0.12に一致するKの値に対応する。MPEG2標準に準拠して、復 号器のバッファのサイズは1.832Mbitに一致するように選択され、ビッ トレートの変動は1.5乃至15Mbit/sである。 曲線61は、1.5乃至9Mbit/sの線形ゾーンと、9乃至15Mbit /sの飽和ゾーンとからなる二つのゾーンに分割される。 τが大域的バッファ化間隔、即ち、画像を復号器のバッファに書き込む時点と 、同じ画像を復号器のバッファから読み出す時点との間に経過する時間であるな らば、この時間は、上記のようにバッファの通過時間と類似し、α(n)がτの 値が一定であることを保証するよう計算された間隔であるならば、以下の関係 が得られる。 τ.R(n)=α(n).R(n)+Evbsは、既に定義された通り仮想バ ッファのオフセットを表す。 符号器のバッファ内の仮想バッファの配置の計算は、所定の仮想バッファのサ イズに対し関係式(a)に従い、ビットレート及び固定転送時間に対し関係式( b)に従うように、パラメータα(n)を連続的に計算及び更新することである 。 換言すれば、仮想バッファのサイズ及び位置は、一定転送時間を保証するよう に連続的に適合される。 Kの値が選択された後、αの値がそこから推定される。 図7はαの変化(縦軸方向)をビットレート(横軸方向)の関数として表示す る。 α(n)の値は、τの一定値を保証するような形でビットレートに連続的に適 合する必要がある。 1.5Mbit/sと9Mbit/sとの間にあり、線形ゾーンに対応する血 線の第1の部分71に対し、αの値は一定であり、 に一致する。 飽和ゾーンに対応する曲線72の第2の部分72に対し、αは、αminからαm ax 、即ち、 まで変化する。 Kの最小値は、 に一致する。 選択されたKの値は、一般的に飽和ゾーンが無い場合に対応する最小値よりも 大きく、典型的な値は0.2である。このため、α(n)の値は連続的に再調節 する必要があり、一定ではない。 以下、図8に示された本発明による符号器の説明を行う。 前処理回路81は符号化されるべきデータを受信する。前処理回路は、その出 力を経由して符号化回路82の入力に接続される。符号化回路82の出力はバッ ファ83の入力に接続され、バッファ83の出力には、復号器に送信されるべき 2値ストリームが得られる。バッファの出力は、レギュレータ84の入力にも接 続される。レギュレータは、もう一方の入力で、符号化回路から発生したデータ を受信する。符号化回路の出力はレギュレータの入力に接続される。局部管理機 器86は、ビットレートアロケータ85と、前処理回路81と、レギュレータ8 4とに接続される。 前処理回路81は、4:2:2フォーマットでディジタルソースに収容された 有効ビデオ信号を受信し、有効ビデオ信号を除波し、成形し、詳しく言うと、受 信された画像を、各画像毎に選択された符号化のタイプに従って再順序付けする 。ビデオ符号化回路82は受信された信号を圧縮し、“基本ストリーム(element ary stream)”と称されるMPEG2フォーマットをもつ2値列にフォーマット する。この信号は、2値ストリーム又は“ビットストリーム”の形式で復号器に 伝送されるように出力バッファ83を通過する。レギュレータは、2値ストリー ムを構成しバッファによって伝送された符号化データから、符号器の出力側で実 際のビットレートを測定する。符号化回路82は、レギュレータが符号化コスト 及び量子化間隔を計算し、符号化回路に返せるように符号化データをレギュレー タに送信する。局部管理機器86は、レギュレータ84の複雑さの係数を受信し 、ビットレートアロケータ85に送信し、ビットレートアロケータは、他のビデ オソースからもこの情報キューを受信し、上記種々のビデオソースの多重化を制 御することにより各ビデオソースに応じてビットレートを割り付ける。そこで、 局部管理機器86は外部とのインタフェースを備え、特に、ビットレートアロケ ータから、符号器の出力での適用よりも位相進みのあるビットレート情報キュー を受信する。また、局部管理機器86は、前処理 回路81が画像を再構成できるように、特に、レギュレータ84から発生したG OP構造を送信するため前処理回路81に接続される。 レギュレータは符号化回路のデータ圧縮の量子化間隔を検査する。このレギュ レータは、仮想バッファと称される符号器の物理バッファ内の復号器のバッファ のVBVモデル、並びに、ビデオ復号器のバッファが飽和或いは枯渇しないこと を保証するように符号器の出力側でビットレートを測定する機器に組み込まれる 。 バッファの状態の関数として量子化間隔に作用するビットレートレギュレータ は、二つの機能的なサブブロックに分割され得る。 画像レベルだけで調節を行う画像調節サブブロックは、符号化されるべき画像 毎に、次に符号化されるべき画像に対し保証されることが望まれるデータの量に 対応する“目標ビット”設定値を受信する。この項目は、GOPレベルで調節を 行う別のGOP調節サブブロックによって、符号器のコンフィギュレーションパ ラメータ及びVBVモデルの状態の関数として決定される。 画像の最初のブロックを符号化する初期量子化間隔から始めて、画像調節アル ゴリズムは、量子化間隔のためプログラムされた“目標ビット”にできる限り接 近するように量子化間隔を動的に調節する。この調節は、スティフネス(収束の 速さ)を同じ名前のパラメータによって制御することができるフィードバック系 によって行われる。 画像の最後に、画像調節サブブロックは、画像を符号化する実際のコストをG OP調節サブブロックに送信する。GOP調節サブブロックは、このコストと、 送信された“目標ビット”との間の誤差を計算する。誤差は、後続の画像に対す る“目標ビット”を計算するアルゴリズムにフィードバックされる。画像調節サ ブブロックは、直前の画像を符号化するため使用された平均量子化間隔を送信す る。これは、以下に説明するように、直前に符号化された画像の後続の複雑さを 計算するため役立つ。 画像調節アルゴリズムによって“目標ビット”を計算する原理は、以下の通り である。 Ti、Tp(n)及びTb(m)は、夫々、所定のGOPに対するイントラ画 像、予測画像からの画像n及び双方向画像からの画像mを符号化する目標コスト (ターゲット)であると仮定する。 TI=タイプIの来るべき画像に対する目標ビット TP=タイプPの来るべき画像に対する目標ビット TB=タイプBの来るべき画像に対する目標ビット QI=タイプIの画像に対する平均量子化間隔 QP=タイプPの画像に対する平均量子化間隔 QB=タイプBの画像に対する平均量子化間隔 NP=GOP内のタイプPの画像の数 NB=GOP内のタイプBの画像の数 N個の画像のGOPは、イントラ画像と、NP個の予測画像と、NB個の双方 向画像により構成され、 N=1+NB+NP と表される。したがって、GOPによる調節の原理は、必然的に以下の関係式: に従う。 GOP内の画像タイプ毎の符号化コストの安定性を仮定すると、インター画像 調節に対し以下の基本的な式が得られる。 式(1)は利用可能ビットレートをGOPを構成する画像の集合全体に配分す る原理を表現する。しかし、この利用可能ビットレートは、先に符号化されたG OPの画像の集合全体で測定された偏差(目標ビット−実際の符号化のコスト) の合計に対応する誤差εずつ減少若しくは増加する。 式(2)は、異なるタイプの画像の間で安定な品質が保たれるように、異なる タイプの画像間の平均量子化間隔の規則を確立することが可能である。比例定数 の経験的な値は以下の通りである。 ZI=1.0 ZP=1.35 ZB=1.1 式(3)の系は、類似したタイプの最後の画像を符号化するコスト倍された平 均量子化間隔の積として画像複雑さに対する計算を与える。複雑さの安定性につ いての重要な過程によって、来るべき画像を符号化するため使用された目標ビッ トに基づいてこの同一の複雑さを表現することが可能である。換言すれば、次の GOPの画像 複雑さが先行の画像で測定された複雑さに一致することが仮定される。 この複雑さの予測は、各画像タイプに対する目標ビット及び初期量子化間隔の 先験的な計算を得ることが可能である。 式(5)の系は、殆どの場合に、制約を調節する復号器に従って値を生成する ことが可能である。しかし、一つのGOPから別のGOPに伝搬する誤差は、先 験的に制限されることはなく、出力ビットレートは選択された実装のモードに本 質的なある種の変動を受ける。 このため、GOP調節サブブロックはVBVモデルに組み込まれる。この復号 器の挙動の簡単化されたモデルは、前述の仮定を使用する。この仮定は以下の通 りである。 ・符号化及び復号化時間は零である。 ・符号化後に画像は符号器のバッファに直ちに導入される。 ・復号化用の画像の回収は復号器側で直ちに行われる。 したがって、各符号化画像毎に、調節アルゴリズムは、以下の関係式 VBV_fullness(n)= VBV_fullness(n)+Bpp(n) −Last_picture_cost+εBpp(n−τ) を適用することによりVBVモデルのバッファの占有状況の状態を更新する。 上記の通り、この関係式は、最後に符号化された画像の等価性が取り下げられ たときに、Bppビットが復号器のバッファに入力されることを表す。付加的な 誤差εBppは、符号器の出力側で測定された測定ビットレートと予測ビットレ ートの間の偏差を表す。 但し、Dc(t)は時点tにおける符号器出力ビットレートである。 VBVモデルの最初の使用は、パッディング動作(ビットストリーム中で画像 の最後に追加された零バイト)に関係する。これは、復号器のバッファが現在の 画像中若しくは来るべき画像の送信中に飽和しないことを保証するため不可欠で ある。この動作は、モデルから生ずるバッファ占有状況が次の画像期間中に復号 器のバッファの入力側で予測されるデータの量の値Bppよりも少ない復号器の バッファの最大サイズを決して超えないことを検証する。即ち、 If(VBV_fullness(n)>VBV_size −Bpp(n+1))then Last_pict_cost(n)= Last_pict_cost(n) +VBV_fullness(n) −(VBV_size−Bpp(n+1)) VBV_fullness(n)= VBV_size−Bpp(n+1) VBV_sizeは復号器の有効サイズを表す(メインプロファイル メイン レベルのMPEG2に対し1.835Mbit)。次に、画像のコストに適用さ れたオフセットに対応するパッディング データの量が導かれる。 パッディングの他に、VBVモデルのバッファの占有状態の正確な知識が、符 号化されるべき次の画像の目標ビットの予防的な再調節を可能にする。この再調 節のステップは、バッファ侵害を予測するため不可欠である。以下の二つの特殊 なケースが起こり得る。 −VBVモデルのバッファの観察された状態は枯渇の状態に非常に接近する。こ の場合、次の目標ビットの値は、危険性が増すと共に大きくなる量ずつ減少され る。 −VBVモデルのバッファの観察された状態は飽和の状態に非常に接近する。こ の場合、次の目標ビットの値は、危険性が増すと共に大きくなる量ずつ増加され る。 VBVモデルのバッファの状態の初期化は、復号器のバッファが完全に使用さ れていることを想定して行われる。この状態を保証するため、データが符号器及 び復号器のバッファを通過する移動遅延(端から端までの遅延)の概念が、上記 の如くの符号器と復号器の間の同期の原理と共に考慮される。 このアルゴリズムの動作の原理は、GOP調節サブブロックによって画像のテ ンポで行われる、画像調節サブブロックに回送される“目標ビット”及び“初期 量子化間隔”パラメータの計算によって表される。 図9は、GOP調節サブブロックと、サブブロック調節アルゴリズムによって 実行される種々の計算の概略図である。 前計算モジュール91は、先に符号化された画像nから発生し、画像調節サブ ブロックによって伝達された“符号化コスト”CC(n)及び“平均量子化間隔 ”Q(n)の情報キューを受信し、また、予測コスト(目標ビットT(n))と 実際のコストCC(n)との間の誤差E(n)を第3の入力で受信する。第4の 入力で、前計算モジュールは、次の画像n+1を符号化する時点に対応し、ビッ トレートアロケータによって発生された設定値である予測ビッ トレートBpp(n+1)に関する情報キューを受信する。このアロケータは、 上記の通り、チャネルビットレート設定値が有効になる時点よりもτだけ前の時 点にこのビットレートをレギュレータに送信する。したがって、アロケータは、 後続の画像に対するビットレート情報キューBpp(n+1)を供給する。モジ ュール91は、制御モジュール92の第1及び第2の入力に、画像n+1に対す る目標ビットT(n+1)情報及び画像n+1に対する初期量子化間隔Q_in it(n+1)を送信する。 アロケータから得られるビットレート情報キューは、1画像期間遅延回路93 にも送信される。この回路からの出力は制御モジュール92の第3の入力に送信 される。また、遅延回路93からの出力は、期間τの遅延回路94の入力に送信 される。この回路の出力は、第1の減算器95の第1の入力+に接続され、第1 の減算器95の第2の入力にはビットレート測定回路96によって符号器の出力 側で測定されたビットレート情報キューが供給される。この減算器の出力は制御 モジュール92の第4の入力に接続される。制御モジュールは、仮想バッファの パラメータを再調節し、GOP調節サブブロックの出力でもある制御モジュール の出力に、後続の画像n+1に対する初期目標ビット及び量子化間隔情報を送信 する。これらの2個の情報キューは、次の画像を符号化するため画像調節サブブ ロックに伝達される。 制御モジュールの目的は、バッファ侵害の危険性を後見的に検証することであ る。このため、制御モジュールは入力側に、ビットレートの設定値と実際値の間 の誤差に対応する差Bpp(n−τ)−Dc(n)と、次の画像に対するパラメ ータT(n+1)及びQ_init(n+1)と、現在符号化されている画像に 対するパラメータBpp(n)とを受信する。この情報によって、制御モジュー ルは仮想バッファの使用状況係数の変動を計算できる。 できるだけ補正された次の画像の目標ビットの値T(n+1)は、 第2の減算器98の+側入力を駆動する出力を有する1画像期間遅延回路97に フィードバックされる。第2の減算器の−側入力は、現在の画像を符号化するコ ストCC(n)を受信し、出力は前計算モジュール91の第3の入力に接続され る。 以下、図10に記載されたフローチャートを参照して、前計算モジュール及び 制御モジュールによって実行される種々の計算の説明を行う。 第1のステップ101は、タスクを起動する割込待機ループである。画像割込 は、直前に符号化された画像nに関する画像調節から得られた情報が利用可能で あることをアルゴリズムに通知する。続いて、ステップ102は、以下の情報を 読み取る。 −画像nに対する符号化コストCC(n) −画像nに対する平均量子化間隔Q(n) −画像n+1に対する画像関連ビットレート設定値Bpp(n+1) −画像n+1のタイプ(I,P又はB) −画像nに対する符号器の出力側のビットレートDc(n) 次のステップ103は、各画像タイプ毎に“目標ビット”を計算する。前の画 像の符号化の結果(符号化コスト及び平均量子化間隔)は、画像nの複雑さを計 算するため使用される1。 符号化から生じた“目標ビット”に対する誤差E(n)は、各画像nに対し計 算され、GOPの最後で値εとして記憶するためGOPに亘り累積される。E( n)は次のGOPの最初の画像で初期化される。 X(n)=CC(n)×Q(n) E(n)=E(n−1)+T(n)−CC(n) 新しい“目標ビット”は各画像タイプ毎に画像n+1に対し計算される。 したがって、これらの“目標ビット”は、前のGOPの累積誤差を考慮する。 この誤差は、いわば、目標ビットの計算のため後続のGOPの画像全体に再配分 される。 次のステップ104は、仮想バッファの侵害の危険性の後見的な検査を実行し 、それに応じて“目標ビット”を再調節し、次に符号化されるべき画像に対する 初期量子化間隔を計算する。 かくして、ステップ104は、VBV fullness状態を計算すること によりVBVモデルの更新を行う。このバッファ状態によって、復号器のバッフ ァの飽和を防止するため、先ず第一にパッディングを挿入することが可能である 。第二に、“目標ビット”は再調節され(再調節処理は本特許発明の課題ではな い)、次に符号化されるべき画像に対する初期量子化間隔が計算される。 Ec(n)=Bpp(n−τ)−Dc(n) VBV_fullness(n)= VBV_fullness(n)+Bpp(n) −[CC(n)+B(n)]−Ec(n) 式中、CC(n)+B(n)は、画像nと同時に符号器のバッファに取り入れられたビッ ト数に対応するパッディング量B(n)(例えば、0)が加えられた画像CC( n)のコストを表す。 VBV_fullness(n)> VBV_size−Bpp(n+1) であるならば、パッディング量B(n)は、 B(n)=VBV_fullness(n) −(VBV_size−Bpp(n+1)) となるように変更される。 バッファの使用状況係数の変動は、 VBV_fullness(n)=VBV_size−B(n) のように表される。 初期量子化間隔は、 QIinit=XI/TI QPinit=XP/TP QBinit=XB/TB のように計算される。 ステップ104は初期ステップ101に循環的に戻る。 仮想バッファ及びVBV_offsetの考え方は、時点nの符号器の出力側 のビットレートの測定量が時点n−τからの値Bppと比較されることに暗黙的 に関係していることに注意する必要がある。仮想バッファのオフセットは、上記 の2項目間の不一致を状態VBV_fullnessの計算にフィードバックす ることによって調節される。この簡単なフィードバックループが仮想バッファの 位置の制御を保証する。 ディジタルテレビに関するアプリケーションである番組の束の伝送、即ち、例 えば、衛星伝送における幾つかのビデオソースの同時的な伝送、又は、ビデオソ ースによるトランスポンダチャネルの共用は、統計的な多重化を利用する。ビデ オデータは、このチャネルを介したパック式伝送のため圧縮され、多重化される 。 アプリケーションは、マルチパス符号化を使用するDVD記録にも関係する。 第1のパスは、フィルム全体に対する画像の複雑さを決定することができる。第 2のパスは、所定の平均ビットレートから始めて、この複雑さの関数としてビッ トレートを各画像に割り当 てることができる。かくして、画像の品質は同じデータ量に対し一定である。
【手続補正書】特許法第184条の8第1項 【提出日】平成10年7月17日(1998.7.17) 【補正内容】 請求の範囲 1. ビデオ画像シーケンスのディジタルデータを圧縮し、符号化されるべきデ ータに対する量子化間隔に作用する調節ループを用いて符号器の出力側でビット レートを調節し、可変ビットレートのチャネルを介して復号器のバッファに伝送 するため上記符号器によって出力されたデータをバッファに格納し、上記符号器 のバッファに画像を格納する時点と、上記復号器のバッファから画像を出力する 時点との間隔を一定時間τに保つため上記データにタグを付ける、ビデオ画像シ ーケンスのディジタルデータの符号化方法において、 時点nにおける上記画像に関するビットレート調節は時点n+τに対する伝送 チャネルに関するビットレート予測の関数として行われ、 上記調節は、上記符号器のバッファの使用状況レベルが仮想バッファを定義す る二つの限界の間に収まるように行われ、 時点nの画像の符号化のため計算される上記仮想バッファの上限又はオフセッ トは、時点n+τに予測されたチャネル伝送ビットレートの関数であることを特 徴とする符号化方法。 2. 上記仮想バッファのサイズは、少なくとも上記ビットレートの変化の範囲 に亘って、上記チャネル伝送ビットレートに比例するように計算され、 旧ビットレートに対応するサイズから新ビットレートに対応するサイズまでの 変化は、上記伝送ビットレートの変化よりも時間τだけ前から連続的に行われる ことを特徴とする請求項1記載の符号化方法。

Claims (1)

  1. 【特許請求の範囲】 1. ビデオ画像シーケンスのディジタルデータを圧縮し、符号化されるべきデ ータに対する量子化間隔に作用する調節ループを用いて符号器の出力側でビット レートを調節し、可変ビットレートのチャネルを介して復号器のバッファに伝送 するため、上記符号器によって出力されたデータをバッファに格納し、上記符号 器のバッファに画像を格納する時点と、上記復号器のバッファから画像を出力す る時点との間隔を一定時間τに保つため上記データにタグを付ける、ビデオ画像 シーケンスのディジタルデータの符号化方法において、 時点nにおける上記画像に関するビットレート調節は時点n+τに対する伝送 チャネルに関するビットレート予測の関数として行われ、 上記調節は、上記符号器のバッファの先頭アドレスと末尾アドレスとによって 定義された仮想バッファの限界内で行われ、 上記仮想バッファの先頭アドレス又はオフセットは、上記復号器の上記バッフ ァの出力側の伝送ビットレートの変化よりも時間τだけ前から始まり、この時間 τによって乗算された上記ビットレートの変化に対応する値に依存して、上記符 号器の上記先頭アドレスに関して変化することを特徴とする符号化方法。 2. 上記仮想バッファのサイズは、少なくとも上記ビットレートの変化の範囲 に亘って、上記符号器からの出力ビットレートに比例するように計算され、 旧ビットレートに対応するサイズから新ビットレートに対応するサイズまでの 変化は、上記伝送ビットレートの変化よりも時間τだけ前から連続的に行われる ことを特徴とする請求項1記載の符号化方法。 3. 時点n+τに対し予測された上記伝送ビットレートは、GOP(グループ ・オブ・ピクチャ)の間隔に亘って当該画像に先行する画像の平均複雑さの関数 として計算されることを特徴とする請求項1又は2記載の符号化方法。 4. 上記仮想バッファのモデル化は、時間τだけ後に上記バッファの出力側に 割り当てられるビットレートに対応する上記バッファの入力側のビットレートを 与えるように各画像を符号化することにより行われることを特徴とする請求項1 記載の符号化方法。 5. 上記仮想バッファのモデルは、上記出力ビットレートと時間τだけ前に割 り当てられたビットレート割り当てとの間の誤差を組み込むことにより後から更 新されることを特徴とする請求項4記載の符号化方法。 6. 上記仮想バッファの最大サイズは上記復号器のバッファの最大サイズであ ることを特徴とする請求項1記載の符号化方法。 7. 上記符号器の出力側の上記ビットレートの変化の範囲の上限及び下限は、 上記仮想バッファが配置された物理バッファの先頭境界及び末尾境界に対応する ことを特徴とする請求項1記載の符号化方法。 8. 画像n+1に関する調節は、符号化に関する目標ビット又は目標ビットの 数、及び、初期量子化間隔に基づいて行われ、 上記目標ビットは画像期間n+τに関して上記符号器の出力側で予測されたチ ャネルビットレートに対する設定値から計算されることを特徴とする請求項1記 載の符号化方法。 9. 上記目標ビットの値を計算するため、イントラ、予測又は双方向の画像符 号化のタイプ、及び、所定の比例定数の値が考慮されることを特徴とする請求項 8記載の符号化方法。 10. 時点nにGOP(グループ・オブ・ピクチャ)に属する画像の符号化は 、この画像に対し計算された目標ビットと、この画像を符号化するコストとの間 の誤差を組み込むことによって行われ、 上記誤差は先行のGOPのレベルで累積されることを特徴とする請求項8記載 の符号化方法。 11. 各ビデオソース毎に所定の伝送チャネルを介して可変ビットレートでデ ータを伝送するため、請求項1に記載された符号化方法に従って上記データを符 号化する、幾つかのビデオソースからのデータの伝送方法において、 各ビデオソース毎に、チャネルを介した上記ビデオソースの実際のビットレー トよりも時間τだけ前に、チャネル利用可能ビットレートと、上記ビデオソース の組からの先行した画像の複雑さの測定量とに依存してビットレート割付を行う ことを特徴とする伝送方法。
JP54058197A 1996-05-09 1997-05-07 可変ビットレート符号器における符号化方法及び伝送方法 Expired - Fee Related JP4547048B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR9605766A FR2748623B1 (fr) 1996-05-09 1996-05-09 Encodeur a debit variable
FR96/05766 1996-05-09
PCT/FR1997/000820 WO1997043859A1 (fr) 1996-05-09 1997-05-07 Encodeur a debit variable

Publications (2)

Publication Number Publication Date
JP2000510302A true JP2000510302A (ja) 2000-08-08
JP4547048B2 JP4547048B2 (ja) 2010-09-22

Family

ID=9491964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP54058197A Expired - Fee Related JP4547048B2 (ja) 1996-05-09 1997-05-07 可変ビットレート符号器における符号化方法及び伝送方法

Country Status (10)

Country Link
US (1) US6212233B1 (ja)
EP (1) EP0897640B1 (ja)
JP (1) JP4547048B2 (ja)
CN (1) CN1117479C (ja)
DE (1) DE69718163T2 (ja)
FR (1) FR2748623B1 (ja)
ID (1) ID16888A (ja)
MY (1) MY119323A (ja)
WO (1) WO1997043859A1 (ja)
ZA (1) ZA974043B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001510619A (ja) * 1997-11-29 2001-07-31 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオの記録方法及び装置、記録担体、及び再生装置

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6278735B1 (en) 1998-03-19 2001-08-21 International Business Machines Corporation Real-time single pass variable bit rate control strategy and encoder
JP2002506605A (ja) * 1998-04-30 2002-02-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ データ圧縮
FR2790899B1 (fr) * 1999-03-09 2001-04-20 Thomson Broadcast Systems Dispositif et procede de regulation de debit dans un systeme de multiplexage statistique de flux d'images codees selon le codage mpeg 2
KR100357689B1 (ko) * 2000-11-13 2002-10-19 삼성전자 주식회사 일관된 화질을 가지는 실시간 가변 비트율 엠펙 비디오전송 시스템
US7333419B2 (en) * 2000-11-30 2008-02-19 Sasken Communication Technologies, Inc. Method to improve performance and reduce complexity of turbo decoder
US6845129B2 (en) * 2001-01-31 2005-01-18 Lucent Technologies Inc. Controlling a video-buffer-verifier buffer using an MPEG-like encoder
JP4111259B2 (ja) * 2001-09-25 2008-07-02 株式会社リコー 符号化装置、符号化方法、ソフトウェアプログラム、テーブルデータ並びに記録媒体
AU2002357828A1 (en) * 2001-12-14 2003-06-30 The Texas A And M University System System for actively controlling distributed applications
US7581019B1 (en) * 2002-06-05 2009-08-25 Israel Amir Active client buffer management method, system, and apparatus
US7418037B1 (en) * 2002-07-15 2008-08-26 Apple Inc. Method of performing rate control for a compression system
TWI249356B (en) * 2002-11-06 2006-02-11 Nokia Corp Picture buffering for prediction references and display
US7940843B1 (en) * 2002-12-16 2011-05-10 Apple Inc. Method of implementing improved rate control for a multimedia compression and encoding system
US7804897B1 (en) 2002-12-16 2010-09-28 Apple Inc. Method for implementing an improved quantizer in a multimedia compression and encoding system
US8977250B2 (en) * 2004-08-27 2015-03-10 The Invention Science Fund I, Llc Context-aware filter for participants in persistent communication
US8521828B2 (en) 2004-07-30 2013-08-27 The Invention Science Fund I, Llc Themes indicative of participants in persistent communication
US9779750B2 (en) * 2004-07-30 2017-10-03 Invention Science Fund I, Llc Cue-aware privacy filter for participants in persistent communications
US9704502B2 (en) * 2004-07-30 2017-07-11 Invention Science Fund I, Llc Cue-aware privacy filter for participants in persistent communications
JP4438059B2 (ja) * 2004-08-24 2010-03-24 キヤノン株式会社 画像再生装置及びその制御方法
US8200149B1 (en) 2005-07-29 2012-06-12 The Directv Group, Inc. Combining transponder bandwidths for source and forward error correction encoding efficiency
US9525978B2 (en) 2005-07-29 2016-12-20 The Directv Group, Inc. Method and apparatus for transmitting high bandwidth signals with low bandwidth transponders
JP2008193444A (ja) * 2007-02-06 2008-08-21 Hitachi Ltd 情報処理装置
US7936790B2 (en) * 2007-08-30 2011-05-03 Silicon Image, Inc. Synchronizing related data streams in interconnection networks
EP2273796A3 (en) 2009-06-09 2011-12-21 Thomson Licensing Method and device for coding
US8976857B2 (en) * 2011-09-23 2015-03-10 Microsoft Technology Licensing, Llc Quality-based video compression
CN111988556B (zh) * 2020-08-28 2022-04-26 深圳市融讯视通科技有限公司 动态音视频编码传输方法、系统、装置及存储介质
JP2022094508A (ja) * 2020-12-15 2022-06-27 富士通株式会社 演算処理装置、演算処理方法および演算処理プログラム
CN113286145B (zh) * 2021-04-26 2022-07-22 维沃移动通信有限公司 视频编码方法、装置和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06253277A (ja) * 1991-05-23 1994-09-09 American Teleph & Telegr Co <Att> 可変ビット・レート・チャネルに対するバッファを制御する方法および装置
WO1995026111A2 (en) * 1994-03-17 1995-09-28 Philips Electronics N.V. An encoder buffer having an effective size which varies automatically with the channel bit-rate
JPH07284109A (ja) * 1994-03-02 1995-10-27 Philips Electron Nv 一連の画像を表わすディジタル信号を符号化する方法および装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03129987A (ja) * 1989-10-14 1991-06-03 Sony Corp 映像信号符号化装置及び映像信号符号化方法
US5038209A (en) * 1990-09-27 1991-08-06 At&T Bell Laboratories Adaptive buffer/quantizer control for transform video coders
US5231484A (en) * 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
JPH05167998A (ja) * 1991-12-16 1993-07-02 Nippon Telegr & Teleph Corp <Ntt> 画像の符号化制御処理方法
EP0595268B1 (en) * 1992-10-28 2001-03-21 Victor Company Of Japan, Limited Variable transfer rate control coding apparatus and method
US5654760A (en) * 1994-03-30 1997-08-05 Sony Corporation Selection of quantization step size in accordance with predicted quantization noise
JP3050047B2 (ja) * 1994-06-24 2000-06-05 日本ビクター株式会社 動画像符号化装置及び動画像符号化方法
CA2157066C (en) * 1994-10-21 1999-09-21 Nelson Botsford Iii Method for controlling a compressed data buffer
EP0753235B1 (en) * 1994-12-28 2000-07-12 Koninklijke Philips Electronics N.V. Buffer management in variable bit-rate compression systems

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06253277A (ja) * 1991-05-23 1994-09-09 American Teleph & Telegr Co <Att> 可変ビット・レート・チャネルに対するバッファを制御する方法および装置
JPH07284109A (ja) * 1994-03-02 1995-10-27 Philips Electron Nv 一連の画像を表わすディジタル信号を符号化する方法および装置
WO1995026111A2 (en) * 1994-03-17 1995-09-28 Philips Electronics N.V. An encoder buffer having an effective size which varies automatically with the channel bit-rate

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001510619A (ja) * 1997-11-29 2001-07-31 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオの記録方法及び装置、記録担体、及び再生装置
JP2009289398A (ja) * 1997-11-29 2009-12-10 Koninkl Philips Electronics Nv オーディオの記録方法及び装置、記録担体、及び再生装置

Also Published As

Publication number Publication date
CN1117479C (zh) 2003-08-06
FR2748623A1 (fr) 1997-11-14
EP0897640A1 (fr) 1999-02-24
US6212233B1 (en) 2001-04-03
CN1217851A (zh) 1999-05-26
FR2748623B1 (fr) 1998-11-27
DE69718163T2 (de) 2003-10-02
DE69718163D1 (de) 2003-02-06
EP0897640B1 (fr) 2003-01-02
ID16888A (id) 1997-11-20
WO1997043859A1 (fr) 1997-11-20
JP4547048B2 (ja) 2010-09-22
MY119323A (en) 2005-05-31
ZA974043B (en) 1998-01-14

Similar Documents

Publication Publication Date Title
JP2000510302A (ja) 可変ビットレート符号器
US6157674A (en) Audio and video data transmitting apparatus, system, and method thereof
US5793425A (en) Method and apparatus for dynamically controlling encoding parameters of multiple encoders in a multiplexed system
US5566208A (en) Encoder buffer having an effective size which varies automatically with the channel bit-rate
EP0691066B1 (en) A transcoder
US5606369A (en) Buffering for digital video signal encoders using joint bit-rate control
US6526097B1 (en) Frame-level rate control for plug-in video codecs
US6628712B1 (en) Seamless switching of MPEG video streams
US6697567B1 (en) Dynamic image encoding apparatus
KR20050086731A (ko) 비디오 전송 방법
GB2337392A (en) Encoder and encoding method
WO1994024822A1 (fr) Procede et appareil de codage d&#39;image, et support d&#39;enregistrement d&#39;image
JP2003517743A (ja) 圧縮デジタルビデオ信号および圧縮されていないデジタルビデオ信号の統計的な多重化のための動的ビット配分
KR19990042668A (ko) 다중 비디오 전송을 위한 비디오 부호화 장치 및 방법
JPH09510070A (ja) 可変ビットレート圧縮システムのバッファ管理
JP2002314996A (ja) ビデオ・データの品質を制御するための方法および装置
JP4619479B2 (ja) 統計的多重化システム
KR100314329B1 (ko) 일정비트율엔코더를이용하는멀티플렉서
WO1999030505A1 (fr) Codeur et procede de codage
US20100272170A1 (en) Image encoding apparatus, image encoding method and medium on which image encoding program is recorded
JP3614448B2 (ja) 画像信号符号化多重方法及びその装置
KR100531028B1 (ko) 비디오이미지시퀸스의데이터를코딩하는방법
KR20060062539A (ko) 전송 패킷의 길이를 고려한 비디오 부호화 율제어 방법 및그를 이용한 비디오 부호화 장치
Hoang et al. Multiplexing VBR video sequences onto a CBR channel with lexicographic optimization
KR0119904B1 (ko) 블록영상소스 부호화 코덱장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090217

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090518

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090817

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091006

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100105

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100406

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100615

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100705

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees