JP4782332B2

JP4782332B2 - 音声符号器における目標ビットレートを維持する方法および装置

Info

Publication number: JP4782332B2
Application number: JP2001511665A
Authority: JP
Inventors: マンジュナス、シャラス; デジャコ、アンドリュー・ピー
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 1999-07-19
Filing date: 2000-07-19
Publication date: 2011-09-28
Anticipated expiration: 2020-07-19
Also published as: EP1214705A1; HK1045397A1; AU6112000A; KR100754591B1; WO2001006490A1; BR0012538A; ATE288122T1; HK1045397B; DE60017763T2; DE60017763D1; EP1214705B1; CN1161749C; US6330532B1; CN1361912A; JP2003505723A; KR20020013963A; ES2240121T3

Description

【０００１】
発明の背景
I．発明の分野
本発明は全般的に音声処理の分野に係り、なお特に音声符号器の目標ビットレートを維持する方法および装置に関する。
II．背景
デジタル技術による音声の伝送は、特に長距離かつデジタル無線電話応用において広く普及してきた。これは次に、再構成された音声の知覚された質を維持してチャンネルにより送られることができる情報の最小量を決定することに興味を起こした。音声が簡単にサンプリングおよびデジタル化により送信されるなら、１秒につき６４キロバイト（ｋｂｐｓ）のようなデータレートが通常のアナログ電話の音声の質を達成するために必要とされる。しかし、適当な符号化、送信および受信機での再合成により結果として生じる音声分析の使用を通して、データレートの重大な低下が成される。
【０００２】
音声圧縮装置が遠距離通信の多くの分野で使用を見出す。例示的分野は無線通信である。無線通信の分野は、例えばコードレス電話、ページング、無線ローカルループ、セルラーおよびＰＣＳ電話システムのような無線電話、移動インターネットプロトコル（ＩＰ）電話、および衛星通信システムを含む多くの応用を有する。特に重要な応用は移動加入者のための無線通信である。
【０００３】
種々の空中インタフェースは、例えば、周波数分割多重接続(ＦＤＭＡ)、時分割多重接続(ＴＤＭＡ)、および符号分割多重接続(ＣＤＭＡ)を含む無線通信システムのために開発された。それらと関連して、例えば、高度な移動電話サービス（ＡＭＰＳ）、移動通信のグローバルシステム(ＧＳＭ)、および国際規格９５（ＩＳ−９５）を含む様々な国内的および国際的な規格が確立された。例示的無線電話通信システムは符号分割多重接続(ＣＤＭＡ)システムである。ＩＳ−９５規格とその派生物、ＩＳ−９５Ａ、ＡＮＳＩＪ-ＳＴＤ-００８、ＩＳ−９５Ｂ、提案された第三世代規格ＩＳ−９５ＣおよびＩＳ−２０００等(ＩＳ−９５としてここにまとめて引用される)は、米国電気通信工業会(ＴＩＡ)およびセルラーまたはＰＣＳ電話通信システムのためにＣＤＭＡ空中インターフェイスの使用を指定する他のよく知られた規格団体によって公表されている。ＩＳ−９５規格の使用に従って実質的に構成された例示的無線通信システムは、本発明の譲受人に譲渡され、ここに引用文献として完全に組み込まれた米国特許Ｎｏ．５,１０３,４５９およびＮｏ．４,９０１,３０７に記述される。
【０００４】
人間の音声発生のモデルに関連するパラメタを引出すことによって音声圧縮技術を採用する装置は音声符号器と呼ばれる。音声符号器は入来音声信号を時間のブロック、即ち分析フレームに分割する。音声符号器は通常エンコーダとデコーダを備える。エンコーダはある関連パラメタを引出すために入来音声フレームを分析して、次に２進の表現、即ち、ビットの集団または２進データパケットにパラメタを量子化する。データパケットは受信器とデコーダへの通信チャネル上に送信される。デコーダはデータパケットを処理し、パラメタを作り出すためにそれらを不量子化して、不量子化されたパラメタを使用する音声フレームを再合成する。
【０００５】
音声符号器の機能は音声の固有なすべての自然な冗長を取り除くことによって低ビットレート信号にデジタル化された音声信号を圧縮することである。デジタル圧縮は、一組のパラメタで入力音声フレームを表して、一組のビットでパラメタを表すために量子化を採用することによって達成される。入力音声フレームが多くのビットＮ_ｉを有し、音声符号器によって生成されるデータパケットが多くのビットＮ_ｏを有するなら、音声符号器によって達成される圧縮係数はＣ_ｒ＝Ｎ_ｉ／Ｎ_ｏである。目標圧縮係数を達成しながら復号音声の高い音声品質を保有することが挑戦である。音声符号器の性能は(１) 音声モデル、または上で説明した分析と合成の過程の組み合わせがどれくらいよく働くか、そして(２) パラメタ量子化過程が１フレームあたりのＮ_ｏビットの目標ビットレートでどれくらいよく実行されるかに依存する。かくして音声モデルの目標は各フレームについて小さい組みのパラメタで音声信号の本質、目標音声品質を獲得することである。
【０００６】
音声符号器の設計において最も重要なことは、おそらく音声信号を記述する(ベクトルを含んでいる) パラメタの良い組を検索することである。良い組のパラメタは知覚的に正確な音声信号の再構成のために低いシステム帯域幅を必要とする。ピッチ、信号パワー、スペクトル包絡線(即ち、ホルマント)、振幅、およびフェーズスペクトルは音声コード化パラメタの例である。
【０００７】
音声符号器は時間領域符号器として実行されるかもしれず、それは一度に音声の小さいセグメント(通常５ミリセカンド(ｍｓ)のサブフレーム)をコード化するために高い時間−解像度処理を採用することによって時間領域音声波形を獲得することを試みる。各サブフレームについて、コードブックスペースからの高精度見本が技術で知られている様々な検索アルゴリズムの手段によって見い出される。代わりに、音声符号器は周波数として実行されるかもしれず、それは一組のパラメタ(分析)で入力音声フレームの短期的な音声スペクトルを獲得することを試み、スペクトルパラメタから音声波形を再構成するために対応する合成過程を採用する。パラメタ量子化器は、Ａ.Ｇｅｒｓｈｏ＆Ｒ.Ｍ.Ｇｒａｙ著「ベクトル量子化および信号圧縮(１９９２)」で説明さてた公知の量子化技術に従ってコードベクトルの記憶された表現でそれらを表すことによってパラメタを保存する。
【０００８】
周知の時間領域音声符号器は、Ｌ.Ｂ.ＲａｂｉｎｅｒとＲ.Ｗ.Ｓｃｈａｆｅｒ著の「音声信号のデジタル処理３９６-４５３(１９７８)」に記述された「符号励起線形予測(ＣＥＬＰ) 符号器」であり、それは引用文献としてここに完全に組み込まれる。ＣＥＬＰ符号器では、音声信号の短期間相関関係、または冗長が線形予測(ＬＰ)分析によって取り除かれ、それは短期的なホルマントフィルタの係数を見つける。短期的な予測フィルタを入来音声フレームに適用するとＬＰ残余信号は発生し、それは長期予測フィルタパラメタとその後の確率的なコードブックでさらにモデル化されかつ量子化される。したがって、ＣＥＬＰコード化は時間領域音声波形をコード化するタスクをＬＰの短期的フィルタ係数にコード化することおよびＬＰ残余にコード化することの別々のタスクに分割する。時間領域コード化は固定レート(即ち、各フレームに同じ数のヒット、Ｎ_ｏを使用する)または可変レート(異なった型のフレーム内容に対し異なるビットレートが使用される)で実行することができる。可変レート符号器は、コーデックパラメタを目標品質を得るために適切なレベルにコード化するために必要とされるビットの量だけを使用するように試みる。例示的可変レートＣＥＬＰ符号器は米国特許Ｎｏ.５,４１４,７９６に記述され、それは本発明の譲受人に譲渡され引用文献としてここに組みこまれる。
【０００９】
ＣＥＬＰ符号器のような時間領域符号器は、時間領域音声波形の精度を保存するためにフレームにつき大きい数のビットＮ_ｏを通常当てにする。そのような符号器は、比較的大きいフレーム(例えば、８ｋｂｐｓ以上)につきＮ_ｏビットの数を提供された優れた音声品質を通常引渡す。しかしながら、低ビットレート(４ｋｂｐｓ以下)で、時間領域符号器は有効なビットの有限な数による高品質かつロバスト（ｒｏｂｕｓｔ）性能を保有しない。低ビットレートでは、限られたコードブックスペースは、より高いレートの商業応用であまりに首尾よく配備された通常の時間領域符号器の波形に合致している能力を切り取る。したがって、時間がたつにつれての改良にもかかわらず、低ビットレートで作動する多くのＣＥＬＰコード化システムは雑音として通常特徴付けられる知覚的に重要なひずみに悩まされる。
【００１０】
低ビットレート(即ち、２.４〜４ｋｂｐｓ以下の範囲)で媒体で作動する高品質な音声符号器を開発する研究関心と強い商業的必要性のうねりが現に存在する。応用領域は無線電話、衛星通信、インターネット電話、様々なマルチメディアおよび音声ストリーミング応用、ボイスメール、および他の音声記憶システムを含んでいる。原動力は高い容量の必要性とパケット損失状況の下でのロバスト性能の要請である。様々な最近の音声コード化標準化の努力は低率音声コード化アルゴリズムの研究開発を推進する別の直接な原動力である。低レート音声符号器が許容できる応用帯域幅あたりの、より多くのチャンネル、またはユーザを創造して、適当なチャンネルコード化の付加的な層と結びつけられた低レート音声符号器は符号器仕様の総合的なビットバジェット（ｂｕｄｇｅｔ）に適合でき、チャンネルエラー状態の下でロバスト性能を引渡すことができる。
【００１１】
低ビットレートで効率的に音声をコード化する１つの有効な技術はマルチモードコード化である。例示的マルチモードコード化の技術は１９９８年１２月２１日に出願され、本発明の譲受人に譲渡され、引用文献としてここに完全に組みこまれる「可変レート音声コード化」と題する米国出願シリーズＮｏ.０９／２１７,３４１で説明される。従来のマルチモード符号器は異なった型の入力音声フレームに異なったモード、またはコード化−デコード化アルゴリズムを適用する。各モード、またはコード化−デコード化過程が、例えば、有声の音声、無声の音声、遷移音声(例えば、有声と無声の間)、および最も効率的な方法でバックグラウンドノイズ（不音声）のようなある型の音声セグメントを最適に表すためにカストマイズされる。外部の、オープンループモード決定メカニズムは入力音声フレームを試験し、フレームに適用するようにモードに関して決定する。オープンループモード決定は入力フレームから多数のパラメタを引出し、ある時点のかつスペクトル特性に関してパラメタを評価し、評価に基づいているモード決定により通常実行される。かくしてモード決定は、あらかじめ出力音声の正確な状態を知らないで、即ち、音声品質または他の性能基準に関して出力音声が入力音声にどれくらい近いかでなされる。
【００１２】
２.４ｋｂｐｓ程度のレートで作動するコード化システムは一般に事実上パラメトリックである。即ち、そのようなコード化システムは、規則的な間隔で音声信号のピッチ期間とスペクトル包絡線(または、ホルマント)を記述するパラメタを伝達することよって作動する。これらのいわゆるパラメトリック符号器の説明に役立つのはＬＰボコーダシステムである。
【００１３】
ＬＰボコーダはピッチ期間あたり単一パルスで有声な音声信号をモデル化する。この基本的な技術は、数ある中でスペクトル包絡線に関する伝送情報を含むように増大するかもしれない。ＬＰボコーダは一般に妥当な性能を提供するが、それらは騒音として通常特徴付けられる知覚的な重要なひずみを導入するかもしれない。
【００１４】
近年、波形符号器とパラメトリック符号器の両方のハイブリッドである符号器が現れた。これらのいわゆるハイブリッド符号器の説明に役立つのは、原型波形補間(ＰＷＩ)音声コード化システムである。また、ＰＷＩコード化システムは原型ピッチ期間(ＰＰＰ)音声符号器として知られているかもしれない。ＰＷＩコード化システムはコード化の有声な音声のための効率的な方法を提供する。ＰＷＩの基本概念は固定間隔で、代表的なピッチサイクル(原型波形)を抽出し、その記述を伝達し、原型波形の間で補間することによって音声信号を再構成することである。ＰＷＩ方法はＬＰ残余信号または音声信号のいずれかを作動させるかもしれない。例示的ＰＷＩまたはＰＰＰ音声符号器は、１９９８年１２月２１日に出願され、本発明の譲受人に譲渡され、引用文献としてここに完全に組みこまれた「周期的な音声コード化」と題する米国出願シリーズＮｏ.０９／２１７,４９４で説明される。他のＰＷＩまたはＰＰＰ音声符号器が米国特許Ｎｏ.５,８８４,２５３、およびＷ.ＢａｓｔｉａａｎＫｌｅｉｊｎとＷｏｌｆｇａｎｇＧｒａｎｚｏｗ著「１デジタル信号処理で音声コード化における波形補間の方法」２１５-２３０(１９９１)で説明される。
【００１５】
従来の低ビットレート、可変レート音声符号器は低いコード化レートからより高いコード化レートにいつ切り換わるかを決定するためにフレームエネルギーに基づくオープンループコード化モード決定を採用する。これは、音声符号器が異なったクラスの音声の存在を利用して、異なったレートでそれらをコード化することを許可する。しかしながら、オープンループの分類によって決められるレートでのコード化は特定のフレームへの不十分または平凡な品質をもたらすかもしれない。従って、オープンループ決定の効率を高めることは有利であるだろう。与えられたフレームについてコード化レートを変える(即ち、必要なら増加する)ために品質の推定を使用するのは望ましいだろう。しかしながら、フレームについてコード化レートを増加させることは、音声符号器のための平均コード化レートを変化する(増加する)だろう。したがって、オープンループ分類によって決められるそれらからフレームごとの基準のコード化レートにおいて偏差を許容している間、一定平均ビットレートを維持する音声符号器を提供することはさらに有利であるだろう。音声符号器のために特定の目標平均レートにするのがさらに望ましいであろう。音声符号器のために目標の総合的なビットレートを維持するのはさらに有利であるだろう。したがって、最適な音声品質を与えるために閉ループ決定過程でコード化モード決定を改良し、目標コード化ビットレートを維持する音声符号器の必要性がある。
【００１６】
発明の概要
本発明は目標コード化ビットレートを維持しながら最適の音声品質を与えるように閉ループ決定過程でコード化モード決定を改良する音声符号器に向けられる。従って、発明の１つの態様として複数のフレームを可変コード化レートで符号化するように構成された音声符号器において、音声符号器の目標平均ビットレートを維持する方法は、予め選択されたコード化レートでフレームをコード化するステップを有利に含んでおり、それはコード化されたフレームの事前に定義された数について平均ビットレートを実行し、差の値を得るため事前に定義された目標平均ビットレートから実行平均ビットレートを引き算し、商の値を得るために予め選択されたコード化レートにより差の値を割算し、商の値がゼロ未満であるならば、第１の累算値を生成するため音声符号器性能閾値の可能な発生計数を生成するために現在の性能閾値よりも小さい音声符号器性能閾値の第１の事前に定義された数の可能な発生計数を累算し、音声符号器性能閾値の事前に定義された数の発生計数は第１の累算された値が商の値の絶対値よりも大きいように選択され、商の値がゼロ未満であるならば、新しい性能閾値を得るために現在の性能閾値から音声符号器性能閾値発生計数値あたりの減少分と音声符号器性能閾値の第１の事前に定義された数の発生計数の積を引算し、商の値がゼロ以上であるならば、第２の累算された値を生成するため現在の性能閾値よりも大きい音声符号器性能閾値の第２の事前に定義された数の可能な発生計数を累算し、音声符号器性能閾値の事前に定義された数の発生計数は第２の累算された値が商の値よりも大きいように選択され、商の値がゼロ以上であるなら、新しい性能閾値を得るために現在の性能閾値に音声符号器性能閾値発生計数値あたりの増加分と音声符号器性能閾値の第２の事前に定義された数の発生計数の積を加算することを含む。
【００１７】
発明の別の態様において、符号器は予め選択されたコード化レートでフレームをコード化する手段と、事前に定義された数のコード化されたフレームについて実行平均ビットレートを計算する手段と、差の値を得るために事前に定義された目標平均ビットレートから実行平均ビットレートを引き算する手段と、商の値を得るために予め選択されたコード化レートにより差の値を割算する手段と、音声符号器性能閾値の事前に定義された数の発生計数は第１の累算された値が商の値の絶対値よりも大きいように選択され、第１の累算値を生成するため現在の性能閾値より小さい音声符号器性能閾値の第１の事前に定義された数の可能な発生計数を累算する手段と、商の値がゼロ未満であるならば、新しい性能閾値を得るために現在の性能閾値から音声符号器性能閾値発生計数値あたりの減少分と音声符号器性能閾値の第１の事前に定義された数の発生計数の積を引算する手段と、音声符号器性能閾値の事前に定義された数の発生計数は第２の累算された値が商の値よりも大きいように選択され、第２の累算された値を生成するため現在の性能閾値よりも大きい音声符号器性能閾値の第２の事前に定義された数の可能な発生計数を累算する手段と、商の値がゼロ以上であるなら、新しい性能閾値を得るために現在の性能閾値に音声符号器性能閾値発生計数値あたりの増加分と音声符号器性能閾値の第２の事前に定義された数の発生計数の積を加算する手段とを有利に含む。
【００１８】
発明の別の態様において、音声符号器は複数のフレームを分析するように構成された分析モジュールと、分析モジュールに結合されかつ分析モジュールにより発生されたフレームパラメタをコード化するように構成された量子化モジュールとを含み、量子化モジュールはさらに予め選択されたコード化レートでフレームをコード化し、コード化されたフレームの事前に定義された数について実行平均ビットレートを計算し、差の値を得るため事前に定義された目標平均ビットレートから実行平均ビットレートを引き算し、商の値を得るため予め選択されたコード化レートにより差の値を割算し、音声符号器性能閾値の事前に定義された数の発生計数は第１の累算された値が商の値の絶対値よりも大きいように選択され、第１の累算値を生成するため現在の性能閾値より小さい音声符号器性能閾値の第１の事前に定義された数の可能な発生計数を累算し、商の値がゼロ未満であるならば、新しい性能閾値を得るために現在の性能閾値から音声符号器性能閾値発生計数値あたりの減少分と音声符号器性能閾値の第１の事前に定義された数の発生計数の積を引算し、音声符号器性能閾値の事前に定義された数の発生計数は第２の累算された値が商の値よりも大きいように選択され、第２の累算された値を生成するため現在の性能閾値よりも大きい音声符号器性能閾値の第２の事前に定義された数の可能な発生計数を累算し、商の値がゼロ以上であるなら、新しい性能閾値を得るために現在の性能閾値に音声符号器性能閾値発生計数値あたりの増加分と音声符号器性能閾値の第２の事前に定義された数の発生計数の積を加算するように構成される。
【００１９】
好ましい実施例の詳細な記述
以下に記述される例示的実施例はＣＤＭＡ空中インタフェースを採用するために構成された無線電話通信システムにある。それにもかかわらず、技術に熟練した者に理解されるように、本発明の特徴を具体化するサブサンプリング方法と装置は技術に熟練した者に知られた広範囲の技術を使う様々な通信システムのいずれにも属する。
【００２０】
図１に示されるように、ＣＤＭＡ無線電信システムは複数の移動加入者ユニット１０、複数の基地局１２、基地局制御器(ＢＳＣ)１４、および移動交換センター(ＭＳＣ)１６を含んでいる。ＭＳＣ１６は通常の公衆電話交換ネットワーク(ＰＳＴＮ)１８とインターフェイスするように構成される。またＭＳＣ１６はＢＳＣ１４にインターフェイスするように構成される。ＢＳＣ１４は迂回中継線を通して基地局１２と結合される。迂回中継線は例えばＥ１／Ｔ１、ＡＴＭ、ＩＰ、ＰＰＰ、フレームリレー、ＨＤＳＬ、ＡＤＳＬ、またはｘＤＳＬを含むいくつかの知られているインタフェースの何れかを支持するように構成されてもよい。２以上ＢＳＣ１４がシステムにあるかもしれないことが理解される。それぞれの基地局１２は少なくとも１つのセクター(示されない)に都合よく含まれ、各セクターが無指向性アンテナまたは基地局１２から放射状に遠くの特定の方向に位置付けられたアンテナを備えている。代わりに、各セクターは多様性受信のための２個のアンテナを含んでもよい。それぞれの基地局１２は、複数の周波数割当てを支持するように都合よく設計されるかもしれない。セクターの交線と周波数割当てはＣＤＭＡチャンネルと呼ばれるかもしれない。また、基地局１２は基地局トランシーバーサブシステム(ＢＴＳ)１２として知られているかもしれない。代わりに、「基地局」は、ＢＳＣ１４と１つ以上のＢＴＳ１２に集合的に引用するために産業上使用されるかもしれない。また、ＢＴＳ１２は表示された「セルサイト」１２であるかもしれない。代わりに、与えられたＢＴＳ１２の個々のセクターはセルサイトと呼ばれるかもしれない。移動加入者ユニット１０は典型的にセルラーまたはＰＣＳ電話１０である。システムはＩＳ-９５規格に従って使用のために都合よく構成される。
【００２１】
携帯電話システムの典型的な操作の間、基地局１２は移動ユニット１０の組から逆方向リンク信号の組を受ける。移動ユニット１０は電話コールまたは他の通信を伝導している。与えられた基地局１２によって受信される各逆方向リンク信号はその基地局１２内で処理される。結果として起こるデータはＢＳＣ１４に転送される。ＢＳＣ１４は基地局１２間でソフトハンドオフの結集を含むコールリソース配分と移動性管理機能性を提供する。また、ＢＳＣ１４は受信されたデータをＭＳＣ１６に発送し、ＭＳＣ１６はＰＳＴＮ１８とインタフェイスのために付加的なルーティングサービスに提供する。同様に、ＰＳＴＮ１８はＭＳＣ１６とインターフェイスし、ＭＳＣ１６はＢＳＣ１４とインタフェイスし、ＢＳＣ１４は順方向リンク信号の組を移動ユニット１０の組に順次伝送するために基地局１２を制御する。
【００２２】
図２において、第１のエンコーダ１００がデジタル化された音声サンプルｓ（ｎ）を受け、第１のデコーダ１０４へ伝送媒体１０２、即ち通信チャネル１０２で伝送のためにサンプルｓ（ｎ）をコード化する。デコーダ１０４はコード化された音声サンプルを復号して出力音声信号s_{ＳＹＮＴＨ}(n)を合成する。逆方向への伝送のために、第２のエンコーダ１０６がデジタル化された音声サンプルｓ（ｎ）をコード化し、それは通信チャネル１０８で伝送される。第２のデコーダ１１０はコード化された音声サンプルを受信して復号し、合成出力音声信号s_{ＳＹＮＴＨ}(n)を発生させる。
【００２３】
音声サンプルｓ（ｎ）は、例えば、パルス符号変調(ＰＣＭ)、圧縮μ-法、またはＡ-法を含む技術で知られている様々な方法のいずれかに従ってデジタル化されかつ量子化された音声信号を表す。技術で知られているように、音声サンプルｓ（ｎ）は入力データのフレーム内に組織化され、各フレームがデジタル化された音声サンプルｓ（ｎ）の予め決定された数を含む。例示的実施例では、８ｋＨｚのサンプリングレートは１６０個のサンプルを含むそれぞれ２０ｍｓフレームで採用される。以下で説明される実施例では、データ伝送のレートはフレームからフレーム基準で１３.２ｋｂｐｓ(完全なレート)から６.２ｋｂｐｓ(半分のレート)、２.６ｋｂｐｓ(４分の１のレート)、１ｋｂｐｓ(８分の１のレート)へ都合よく変えられるかもしれない。低いビットレートが比較的少ない音声情報を含むフレームに選択的に使われるかもしれないので、データ伝送レートの変更は有利である。技術に熟練した者に理解されるように、他のサンプリングレート、フレームサイズ、およびデータ伝送レートが使用されてもよい。
【００２４】
第１のエンコーダ１００と第２のデコーダ１１０は第１の音声符号器または音声コーデックを一緒に含む。音声符号器は例えば、加入者ユニット、図１を参照して上述されたＢＴＳ、またはＢＳＣを含む送信音声信号のための任意の通信装置で使用することができる。同様に、第２のエンコーダ１０６と第１のデコーダ１０４は第２の音声符号器を一緒に含む。技能に熟練した者に理解されるように、音声符号器はディジタル信号プロセッサ(ＤＰＳ)、特定用途向け集積回路(ＡＳＩＣ)、ディスクリートゲート論理、ファームウェア、または任意の通常のプログラマブルソフトウェアモジュールとマイクロプロセッサで実行されてもよい。ソフトウェアモジュールはＲＡＭメモリ、フラッシュメモリ、レジスタ、または技術で知られているいかなる他の形式の書き込み可能な記憶媒体に存在することができる。代わりに、任意の通常のプロセッサ、コントローラ、または状態マシンもマイクロプロセッサのために代用することができる。特に音声コード化のために設計された例示的ＡＳＩＣは本発明の譲受人に譲渡され、引用文献としてここに完全に組みこまれた米国特許Ｎｏ.５,７２７,１２３と、１９９８年７月２８日に出願され、本発明の譲受人に譲渡されて、引用文献としてここに完全に組みこまれた「ボコーダＡＳＩＣ」と題する米国特許Ｎｏ.５，７８４，５３２で説明される。
【００２５】
図３において、音声符号器で使用されるエンコーダ２００はモード決定モジュール２０２、ピッチ推定モジュール２０４、ＬＰ分析モジュール２０６、ＬＰ分析フィルタ２０８、ＬＰ量子化モジュール２１０、および残余量子化モジュール２１２を含んでいる。入力音声フレームｓ（ｎ）はモード決定モジュール２０２、ピッチ推定モジュール２０４、ＬＰ分析モジュール２０６、およびＬＰ分析フィルタ２０８に供給される。モード決定モジュール２０２はモードインデックスＩ_Ｍおよび周期性に基づくモードＭ、それぞれの入力音声フレームｓ（ｎ）の他の特徴の中のエネルギー、信号対ノイズ比（ＳＮＲ）、またはゼロ交叉レートを生成する。周期性に従って音声フレームを分類する様々な方法は米国特許Ｎｏ.５,９１１,１２８に記述され、それは本発明の譲受人に譲渡され引用文献としてここに完全に組みこまれる。また、そのような方法は電気通信工業会の工業暫定規格ＴＩＡ／ＥＩＡＩＳ-１２７とＴＩＡ／ＥＩＡＩＳ-７３３に組み入れられる。例示的モード決定案は前述の米国出願シリーズＮｏ.０９／２１７,３４１のも記述されている。
【００２６】

【００２７】

【００２８】
図３のエンコーダ２００および図４のデコーダ３００の様々なモジュールの作動と実施は技術において知られており、前述の米国特許Ｎｏ.５,４１４,７９６、およびＬ.Ｂ.Ｒａｂｉｎｅｒ、およびＲ.Ｗ.Ｓｃｈａｆｅｒ著「音声信号のデジタル処理」３９６-４５３(１９７８)に記述される。
【００２９】
図５のフローチャートで示されたように、一実施例による音声符号器は伝送のための処理音声サンプルの一組のステップに従う。ステップ４００では、音声符号器は連続したフレームにおける音声信号のデジタルサンプルを受信する。与えられたフレームを受け取ると、音声符号器はステップ４０２に進む。ステップ４０２において、音声符号器はフレームのエネルギーを検出する。エネルギーはフレームの音声活力の尺度である。音声検出は、デジタル化された音声サンプルの振幅の２乗を合計し、閾値に対して結果のエネルギーを比較することによって実行される。一実施例では、閾値はバックグラウンド雑音の変化しているレベルに基づいて適合される。例示的可変閾値音声活力検出器は前述の米国特許Ｎｏ．５,４１４,７９６に記述される。いくらかの無声の音声音がバックグラウンド雑音として誤ってコード化される極めて低エネルギーサンプルであり得る。これが起こるのを防ぐために、前述の米国特許Ｎｏ.５,４１４,７９６で説明されるように低エネルギーサンプルのスペクトル傾斜がバックグラウンド雑音からの無声の音声を区別するのに使用されてもよい。
【００３０】
フレームのエネルギーを検出した後に、音声符号器はステップ４０４に進む。ステップ４０４では、音声符号器は検出されたフレームエネルギーが音声情報を含むとしてフレームを分類するために十分であるかどうか決定する。検出されたフレームエネルギーが事前に定義された閾値を下回るならば、音声符号器はステップ４０６に進む。ステップ４０６において、音声符号器はバックグラウンド雑音(即ち、不音声または沈黙)としてフレームをコード化する。一実施例では、バックグラウンド雑音フレームは１／８レート、即ち１ｋｂｐｓでコード化される。ステップ４０４において検出されたフレームエネルギーが事前に定義された閾値レベルと合致するか超えるならば、フレームは音声として分類され、音声符号器はステップ４０８に進む。
【００３１】
ステップ４０８において、音声符号器はフレームが無声の音声であるか否かを決定する、即ち、音声符号器はフレームの周期性を試験する。周期性決断の種々の知られている方法は、例えば、ゼロ交叉の使用および正規化された自動相関関数(ＮＡＣＦ)の使用を含む。特に、周期性を検出するためにゼロ交叉とＮＡＣＦを使用することは前述の米国特許Ｎｏ．５,９１１,１２８のおよび米国特許出願シリーズＮｏ．０９／２１７,３４１で説明される。さらに、無声の音声から有声な音声を区別するために使用される上記の方法は、電気通信工業会の暫定規格ＴＩＡ／ＥＩＡＩＳ-１２７とＴＩＡ／ＥＩＡＩＳ-７３３に組み入れられている。フレームがステップ４０８において無声の音声であると決定されるなら、音声符号器はステップ４１０へ進む。ステップ４１０では、音声符号器は無声の音声としてフレームをコード化する。一実施例では、無声の音声フレームは４分の１のレート、即ち２.６ｋｂｐｓでコード化される。ステップ４０８においてフレームが無声の音声であることを決定しないならば、音声符号器はステップ４１２に進む。
【００３２】
ステップ４１２では、音声符号器は、例えば、前述の米国特許Ｎｏ．５,９１１,１２８に記述されたように技術で知られた周期性検出方法を使用して、フレームが遷移音声であるかどうかを決定する。フレームが遷移音声であると決定されるなら、音声符号器はステップ４１４に進む。ステップ４１４において、フレームは遷移音声(即ち、無声の音声から有声の音声までの遷移)としてコード化される。一実施例において、遷移音声フレームは多重補間コード化方法によって符号化され、それは１９９９年５月７日に出願され、本発明の譲受人に譲渡され、ここに引用文献として完全に組み込まれた「遷移音声フレームの多重補間コード化」と題する米国特許出願シリーズＮｏ．０９／３０７,２９４に記述される。別の実施例では、遷移音声フレームは完全なレート、即ち１３.２ｋｂｐｓでコード化される。
【００３３】
ステップ４１２で音声符号器はフレームが遷移音声でないと決定するならば、音声符号器はステップ４１６に進む。ステップ４１６では、音声符号器は有声な音声としてフレームをコード化する。一実施例では、有声な音声フレームは半分レート、即ち６.２ｋｂｐｓでコード化されるかもしれない。また、完全なレート、即ち１３.２ｋｂｐｓ(または、８ｋＣＥＬＰ符号器の場合、完全なレート、８ｋｂｐｓ)で有声な音声フレームをコード化することも可能である。しかしながら、技術に熟練した者は、有声フレームの安定状態の特質を利用することにより貴重な帯域幅を節約するために半分のレートで有声なフレームをコード化することが符号器に許容されることを認識するであろう。さらに、有声な音声を符号化するのに使用されるレートにかかわらず、有声な音声は過去のフレームからの情報を使用することで有利にコード化され、したがって、予測的にコード化されるべきであると言われている。
【００３４】
熟練した者は、音声信号または対応するＬＰ残余のいずれかが図５に示されたステップに従うことにより符号化されるかもしれないことを認識するであろう。雑音の波形特性、無声、遷移、および有声な音声は図６Ａのグラフで時間の関数として見ることができる。雑音の波形特性、無声、遷移、および有声なＬＰ残余を図６Ｂのグラフで時間の関数として見ることができる。
【００３５】
図７に示されたように、一実施例では、原型ピッチ期間(ＰＰＰ)音声符号器５００は逆数フィルタ５０２、原型抽出器５０４、原型量子化器５０６、原型不量子化器５０８、補間／合成モジュール５１０、およびＬＰＣ合成モジュール５１２を含んでいる。音声符号器５００はＤＰＳの一部として都合よく実行されるかもしれず、例えば、ＰＣＳまたは携帯電話システムにおける加入者ユニットまたは基地局に、または衛星システムにおける加入者ユニットまたはゲートウェイに存在するかもしれない。
【００３６】
音声符号器５００において、デジタル化された音声信号ｓ（ｎ）、ここにｎはフレーム番号である、は逆数ＬＰフィルタ５０２に供給される。特定の実施例において、フレームの長さは２０ｍｓである。逆数フィルタＡ(ｚ)の伝達関数は以下の方程式によって計算される:
【数１】
Ａ(ｚ)＝１−a_１ｚ^−１−ａ_２ｚ^−２−…−ａ_ｐｚ^―ｐ
ここに係数a_１は知られている方法により選ばれた事前に定義た値を有するフィルタタップであり、前述の米国特許Ｎｏ．５,４１４,７９６および米国出願シリーズＮｏ．０９／２１７,４９４に記述されており、両方とも以前に引用文献としてここに完全に組み込まれる。数pは逆数ＬＰフィルタ５０２が予測目的のために使用する前のサンプルの数を示す。特定の実施例では、pは１０に設定される。
【００３７】
逆数フィルタ５０２はＬＰ残余信号ｒ(ｎ)を原型抽出器５０４に供給する。原型抽出器５０４は現在のフレームから原型を抽出する。原型は、デコーダでＬＰ残余信号を再構成するためフレーム内に同様に位置付けられた前のフレームから原型を用いる補間／合成モジュール５１０によって直線的に補間される現在のフレームの一部である。
【００３８】
原型抽出器５０４は原型を原型量子化器５０６に供給し、それは技術で知られている様々な量子化技術のいずれかに従って原型を量子化するかもしれない。調査表(示されない)から得られるかもしれない量子化された値は、チャンネルの上を伝送するため遅れと他のコードブックパラメタを含むパケット内に組み立てられる。パケットは送信器(示されない)に提供され、受信器(また、示されない)へチャンネル上で伝送される。逆数ＬＰフィルタ５０２、原型抽出器５０４、および原型量子化器５０６は現在のフレームのＰＰＰ分析を実行したと言われる。
【００３９】
受信器はパケットを受信し、パケットを原型不量子化器５０８に供給する。種々の知られている技術のいずれかに従って、原型不量子化器５０８がパケットを不量子化する。原型不量子化器５０８は不量子化された原型を補間／合成モジュール５１０に供給する。補間／合成モジュール５１０は、現在のフレームのためＬＰ残余信号を再構成するためにフレーム内に同様に位置付けられた前のフレームからの原型で原型を補間する。補間とフレーム合成は、米国特許Ｎｏ．５,８８４,２５３と前述の米国特許出願シリーズＮｏ．０９／２１７,４９４に記述される知られている方法によって有利に達成される。
【００４０】

【００４１】
一実施例において図７のＰＰＰ音声符号器５００のような音声符号器は、音声符号器のために目標平均ビットレートを維持している間、閉ループコード化性能基準をそれぞれのコード化されたフレームに適用する。音声符号器はＰＰＰ音声符号器、またはフレーム基準あたりコード化レートを増加させることによって音声品質を改良することができるいかなる他のタイプの低ビットレート音声符号器であってもよい。
【００４２】
音声フレーム(一実施例では、フレームは２０ｍｓの音声のセグメントを含む)のオープンループの分類の後に、音声フレームは予め選択されたレートＲｐを使用してコード化される。閉ループ性能試験はそれから実行される。エンコーダ性能基準は予め選択されたレートＲｐを使用して全部または部分的なコード化の後に得られる。関連技術としてよく知られている例示的性能基準は、例えば、信号対雑音比(ＳＮＲ)、ＰＰＰ音声符号器のようなコード化案におけるＳＮＲ予測、予測誤差量子化ＳＮＲ、位相量子化ＳＮＲ、振幅量子化ＳＮＲ、知覚ＳＮＲ、および定常性の基準としての現在および過去のフレーム間の正規化された相互相関を含む。性能基準ＰＮＭが閾値ＰＮＭ₋ＴＨを下回るならば、コード化レートはコード化案がより良い品質を与えるために期待される値に変えられる。通常、これはコード化レートの変化が増加であることを意味する。可変レート音声符号器の品質を維持する例示的閉ループ分類案は１９９８年１１月１３日に出願され、本発明の譲受人に譲渡されて、引用文献としてここに完全に組みこまれる「閉ループ可変レートマルチモード予測音声符号器」と題する米国出願シリーズＮｏ．０９／１９１,６４３で説明される。
【００４３】
また、性能基準ＰＮＭは閾値ＰＮＭ₋ＴＨの現在の値に関して閾値のヒストグラムを更新するのに有利に使用される。ヒストグラムは以下の方法で音声符号器のための平均ビットレートの全体的な制御を実行するために使用される。音声符号器はＷフレームの窓を超える実行平均ビットレートを計算し、Ｗフレームの後に実行平均ビットレートをゼロにリセットし、次のＷフレームのために実行平均ビットレートを再計算する。Ｗ-フレーム期間の終わりに、平均ビットレートは目標平均ビットレートＡＶＲから引き算され、差が最初の予め選択されたコード化レート値Ｒｐにより割算される。
【００４４】
割算ＡＶＲ／Ｒｐの商ＮＲが正であるならば、第１のＢＲビンのためのヒストグラム値、またはＰＮＭ_ＴＨ(即ち、閾値より高いコード化レートに関連づけられる第１のＢＲビン)の右のヒストグラムバー幅が累算される。累算された値がＮＲよりも大きいようにＢＲの値が有利に選ばれる。それから閾値ＰＮＭ_ＴＨは積ＤＴＨ_ＨＩ*ＢＲと等しい量だけ増加され、ここにＤＴＨ_ＨＩがビン毎の増加分の量である。ＤＹＨ_ＨＩが最初に適当な値に初期化されることが注意されるべきである。そのような適当な値の１つは(ＭＡＸ₋ＴＨ−ＰＮＭ_ＴＨ)／ＨＢである(パラメタは以下で定義される)。
【００４５】
商ＮＲが負であるならば、ＰＮＭ_ＴＨの左の第１のＢＬビンのためのヒストグラム値が累算される。ＢＬの値は累算された値が-ＮＲよりも大きいように有利に選ばれる。それから、閾値ＰＮＭ_ＴＨは積ＤＴＨ_ＬＯ*ＢＬと等しい量だけ減少され、ここにＤＴＨ_ＬＯはビン毎の減少分の量である。ＤＴＨ_ＬＯが適当な値に最初に初期化されることが注意されるべきである。そのような適当な値の１つは(ＰＮＭ_ＴＨ−ＭＩＮ_ＴＨ)／ＨＢである(パラメタは以下に定義される)。
【００４６】
性能閾値ＰＮＭ_TＨは、最大および最小の値または推定値が知られているなら、それぞれ最大および最小値ＭＡＸ_ＴＨおよびＭＩＮ_ＴＨに制限されることができる。都合よいことに、望まれているならばビン当りの減少分ＤＴＨ_ＬＯおよびビン当りの増加分ＤＴＨ_ＨＩはそれぞれ商の量(ＰＮＭ_ＴＨ-ＭＩＮ_ＴＨ)／ＨＢおよび(ＭＡＸ_ＴＨ-ＰＮＭ_ＴＨ)／ＨＢに更新され、ここにＨＢはヒストグラムにおけるビンの数の半分に等しい。音声符号器がＷ-フレーム窓に関して、目標平均ビットレートＡＶＲに接近した平均ビットレートを維持して終わるとき、ヒストグラムの２ＨＢビンのすべてのためのヒストグラム値は都合よくゼロにリセットされる。
【００４７】
一実施例では、ヒストグラム値の更新は予め選択されたレートＲｐを使用してコード化する間に起る。これは以下の方法で達成される。まず第１にビンが更新される。閾値ＰＮＭ_ＴＨの左のそれぞれのＨＢビンが閾値ＰＮＭ_ＴＨ(閾値ＰＮＭ_ＴＨはヒストグラムの中心に配置される)の左のi番目のビンのために差ＰＮＭ_ＴＨ-ＤＴＨ_ＬＯ*iの値と等しく設定される。閾値ＰＮＭ_ＴＨの右のそれぞれのＨＢビンは閾値ＰＮＭ_ＴＨの右のi番目のビンために合計ＰＮＭ_ＴＨ+ＤＴＨ_ＨＩ*iの値と等しく設定される。第２に、現在の性能基準値であるＰＮＭを含むビンのヒストグラム値は１だけ増加される。
【００４８】
図７のＰＰＰ音声符号器５００のような音声符号器の一実施例において、音声符号器目標平均ビットレートを維持している間、各符号化されたフレームに閉ループコード化性能基準ＰＮＭを適用するために、図８のフローチャートによって示されたアルゴリズムステップを実行する。音声符号器はＰＰＰ音声符号器、またはフレーム基準あたりコード化レートを増加させることによって音声品質を改良することができる任意の他の型の低ビットレート音声符号器であってもよい。
【００４９】
現在の音声フレームはフレームの内容のオープンループ分類に基づくレートＲｐでコード化される。そして、閉ループ試験は、音声コード化性能基準ＰＮＭが性能閾値ＰＮＭ_ＴＨを下回るならば、コード化レートが増加されるようにフレームに適用される。次に閾値ＰＮＭ__ＴＨが目標平均ビットレートＡＶＲに、またはそれに接近して音声符号器の実行平均ビットレートを保つように以下の方法ステップに従って調整される。
【００５０】
ステップ６００において、音声符号器は長さＷフレームの窓のために実行平均ビットレートを計算する。そして音声符号器はステップ６０２に進む。ステップ６０２では、音声符号器は商ＮＲ＝(ＡＶＲ−実行平均ビットレート)／Ｒｐを計算する。そして音声符号器はステップ６０４に進む。ステップ６０４では音声符号器は、ＮＲがゼロ以上であるかどうか決定する。ＮＲがゼロ以上であるなら、音声符号器はステップ６０６へ進む。他方ＮＲがゼロ以上でないならば、音声符号器はステップ６０８に進む。
【００５１】
ステップ６０６では、音声符号器は累算された値がＮＲよりも大きくなるようにＢＲを選択してＰＮＭ_ＴＨ(ヒストグラムの中心にある) の右へ第１のＢＲヒストグラムビン値を累算する。そして音声符号器はステップ６１０に進む。ステップ６１０では、音声符号器はＰＮＭ__ＴＨをＰＮＭ_ＴＨとＤＴＨ_ＨＩ*ＢＲの合計に等しく設定する、ここにＤＴＨ_ＨＩはヒストグラムビンあたりの増加分の量と等しい。そして音声符号器はステップ６１２に進む。
【００５２】
ステップ６０８では、音声符号器は、累算された値が-ＮＲよりも大きくなるようにＢＬを選択して、第１のＢＬヒストグラムビン値をＰＮＭ_ＴＨの左に累算する。そして音声符号器はステップ６１４に進む。ステップ６１４において、音声符号器はＰＮＭ_ＴＨをＰＮＭ_ＴＨとＤＴＨ_ＬＯ*ＢＲとの間の差に等しく設定する、ここにＤＴＨ_ＬＯはヒストグラムビンあたりの減少量と等しい。そして音声符号器はステップ６１２に進む。
【００５３】
ＰＮＭ_ＴＨをそれぞれ最大および最小値、ＭＡＸ_ＴＨおよびＭＩＮ_ＴＨにさせるステップは、望まれるならば、前のステップ６１２で実行されてもよい。さらに、それぞれ商の量(ＰＮＭ_ＴＨ-ＭＩＮ_ＴＨ) ／ＨＢおよび(ＭＡＸ_ＴＨ-ＰＮＭ_ＴＨ)／ＨＢにビンＤＴＨ_ＬＯあたりの減少とビンＤＴＨ_ＨＩあたりの増加を更新するステップは、望まれるならば、前のステップ６１２で実行されてもよい、ここにＨＢはヒストグラムにおける半分のビンの数と等しい。また、ＤＴＨ_ＨＩおよびＤＴＨ_ＬＯはそれぞれ(ＭＡＸ_ＴＨ-ＰＮＭ_ＴＨ)／ＨＢおよび(ＰＮＭ_ＴＨ-ＭＩＮ_ＴＨ)／ＨＢのような適当な値に最初に初期化されることが注意されるべきである。
【００５４】
ステップ６１２では、音声符号器は２ＨＢヒストグラムビンのすべてについてヒストグラム値をゼロにリセットする。そして音声符号器は次のＷフレームの実行平均ビットレートを計算するためステップ６００に戻る。
【００５５】
一実施例において音声符号器は、各ＷフレームのためにレートＲｐで音声フレームのコード化の間にヒストグラムビンの値を更新するため、図９のフローチャートで示されたアルゴリズムステップを実行する。ステップ７００において、音声符号器は閾値ＰＮＭ_ＴＨの左のi番目のビンのためにすべてのヒストグラムビンを差ＰＮＭ_ＴＨ-ＤＴＨ_ＬＯ*iの値に等しいＰＮＭ_ＴＨの左に設定する。そして音声符号器はステップ７０２に進む。ステップ７０２において、音声符号器は閾値ＰＮＭ_ＴＨの右のi番目のビンのためにすべてのヒストグラムビンを合計ＰＮＭ_ＴＨ＋ＤＴＨ_ＨＩ*iの値と等しいＰＮＭ_ＴＨの右へ設定する。そして音声符号器はステップ７０４に進む。ステップ７０４において、音声符号器は現在の性能基準であるＰＮＭを含むヒストグラムビンの値を１だけ増加させる。
【００５６】
かくして音声符号器の目標ビットレートを維持するための新規な方法および装置が記述された。技術に熟練した者に理解されるように、ここに開示された実施例と関連して記述された種々の説明に役立つ論理的なブロックとアルゴリズムステップがディジタル信号プロセッサ(ＤＰＳ)、特定用途向け集積回路(ＡＳＩＣ)、ディスクリートゲート論理、例えばレジスタおよびＦＩＦＯのようなディスクリートハードウエア部品、一組のファームウェア命令を実行するプロセッサまたは任意の通常のプログラマブルソフトウェアモジュールとプロセッサで実施または実行されてもよい。プロセッサは好ましくはマイクロプロセッサでよいが、プロセッサは代わりに、任意の通常のプロセッサ、コントローラ、マイクロコントローラ、または状態マシンであってもよい。ソフトウェアモジュールはＲＡＭメモリ、フラッシュメモリ、レジスタ、または技術で知られているいかなる他の形式の書き込み可能な記憶媒体に存在することができる。熟練した者は、上述の中に参照されたデータ、指示、命令、情報、信号、ビット、符号、およびチップが電圧、電流、電磁波、磁場または、粒子、光学分野または粒子、あるいはその組み合わせにより有利に表されることを認識するであろう。
【００５７】
かくして本発明の好ましい実施例が示されかつ説明された。しかしながら、多くの変更が発明の精神または範囲から逸脱することなくここに記述された実施例に成されるかもしれないことは、技術に普通に熟練した者に明らかである。それ故、本発明は以下の請求項に従う以外に制限されるべきではない。
【図面の簡単な説明】
【図１】無線電話システムのブロックダイアグラムである。
【図２】音声符号器によって各端末で終端される通信チャネルのブロックダイアグラムである。
【図３】エンコーダのブロックダイアグラムである。
【図４】デコーダのブロックダイアグラムである。
【図５】音声コード化決定過程を例証するフローチャートである。
【図６Ａ】音声信号振幅対時間のグラフである。
【図６Ｂ】線形予測(ＬＰ)残余振幅対時間のグラフである。
【図７】原型ピッチ期間(ＰＰＰ)音声符号器のブロックダイアグラムである。
【図８】音声符号器のための目標平均ビットレートを維持しながら閉ループコード化性能基準を各コードフレームに適用するため、図７の音声符号器のような音声符号器によって実行されるアルゴリズムステップを例証するフローチャートである。
【図９】音声フレームのコード化の間ヒストグラムビンの値を更新するため音声符号器によって実行されるアルゴリズムステップを例証するフローチャートである。
【符号の説明】
５０２…逆数フィルタ５０４…原型抽出器５０６…原型量子化器５０８…原型不量子化器５１０…補間合成モジュール５１２…ＬＰＣ合成モジュール

Claims

複数のフレームを可変コード化レートでコード化するように構成されている音声符号器において、音声符号器の目標平均ビットレートを維持する方法であって、前記方法は、
予め選択されたコード化レートでフレームをコード化するステップと、
事前に定義された数のコード化されたフレームについて実行平均ビットレートを計算するステップと、
差の値を得るために、事前に定義された目標平均ビットレートから前記実行平均ビットレートを引算するステップと、
商の値を得るために、前記予め選択されたコード化レートによって前記差の値を割算するステップと、
前記商の値がゼロ未満であるならば、第１の累算値を生成するために、現在の性能閾値より小さい音声符号器性能閾値の第１の事前に定義された数の起こり得る発生計数を累算するステップであって、音声符号器性能閾値の前記事前に定義された数の発生計数は、前記第１の累算された値が前記商の値の絶対値より大きいように選択されるステップと、
前記商の値がゼロ未満であるならば、新しい性能閾値を得るために、前記現在の性能閾値から音声符号器性能閾値発生計数値あたりの減少分と音声符号器性能閾値の前記第１の事前に定義された数の発生計数との積を引算するステップと、
前記商の値がゼロ以上であるならば、第２の累算された値を生成するために、前記現在の性能閾値より大きい音声符号器性能閾値の第２の事前に定義された数の起こり得る発生計数を累算するステップであって、音声符号器性能閾値の事前に前記定義された数の発生計数は、前記第２の累算された値が前記商の値より大きいように選択されるステップと、
前記商の値がゼロ以上であるならば、新しい性能閾値を得るために、前記現在の性能閾値に、音声符号器性能閾値発生計数値あたりの増加分と音声符号器性能閾値の前記第２の事前に定義された数の発生計数の積を加算するステップと、
前記音声符号器のコード化性能を前記新しい性能閾値と比較し、前記フレームのための音声符号器のコード化性能が前記新しい性能閾値を下回るならば、前記フレームのためのコード化レートを調整するステップと
を含む方法。
前記調整ステップが、前記フレームの前記コード化レートを増加することを含む請求項１の方法。
前記コード化ステップの間に、
前記現在の性能閾値より小さい音声符号器性能閾値の各々の発生計数のために、音声符号器性能閾値発生計数値あたりの減少分と、音声符号器性能閾値の発生計数および現在の性能閾値の間の音声符号器性能閾値の発生計数の数に１をプラスした数との積を前記現在の性能閾値から引算し、および音声符号器性能閾値の前記発生計数を前記引算の結果に等しいように設定するステップと、
前記現在の性能閾値より大きい音声符号器性能閾値の各々の発生計数のために、音声符号器性能閾値発生計数値あたりの増加分と、音声符号器性能閾値の発生計数および現在の性能閾値の間の音声符号器性能閾値の発生計数の数に１をプラスした数との積を前記現在の性能閾値に加算し、および音声符号器性能閾値の前記発生計数を前記加算の結果に等しいように設定するステップと、
前記現在の音声符号器のコード化性能に対応する音声符号器性能閾値の前記発生計数を１だけ増加するステップと
をさらに含む請求項１の方法。
前記フレームのオープンループ分類から前記予め選択されたコード化レートを得るステップをさらに含む請求項１の方法。
前記現在の性能閾値を最大値にさせるステップをさらに含む請求項１の方法。
前記現在の性能閾値を最小値にさせるステップをさらに含む請求項１の方法。
前記音声符号器性能閾値発生計数値あたりの減少分および前記音声符号器性能閾値発生計数値あたりの増加分に初期値を割り当てるステップをさらに含む請求項１の方法。
前記加算ステップまたは前記減算ステップの何れかを実行した後、音声符号器性能閾値の発生計数のすべてをゼロにリセットするステップをさらに含む請求項１の方法。
前記フレームが、音声フレームである請求項１の方法。
前記フレームが、線形予測残余フレームである請求項１の方法。
前記音声符号器が、無線通信システムの加入者ユニットにある請求項１の方法。
予め選択されたコード化レートでフレームをコード化する手段と、
事前に定義された数のコード化されたフレームについて実行平均ビットレートを計算する手段と、
差の値を得るために、事前に定義された目標平均ビットレートから前記実行平均ビットレートを引算する手段と、
商の値を得るために、予め選択されたコード化レートによって前記差の値を割算する手段と、
第１の累算値を生成するために、現在の性能閾値より小さい音声符号器性能閾値の第１の事前に定義された数の起こり得る発生計数を累算する手段であって、音声符号器性能閾値の前記事前に定義された数の発生計数は、前記第１の累算された値が前記商の値の絶対値より大きいように選択される手段と、
前記商の値がゼロ未満であるならば、新しい性能閾値を得るために、前記現在の性能閾値から音声符号器性能閾値発生計数値あたりの減少分と音声符号器性能閾値の第１の事前に定義された数の発生計数との積を引算する手段と、
第２の累算された値を生成するために、現在の性能閾値より大きい音声符号器性能閾値の第２の事前に定義された数の起こり得る発生計数を累算する手段であって、音声符号器性能閾値の前記事前に定義された数の発生計数は、前記第２の累算された値が前記商の値より大きいように選択される手段と、
前記商の値がゼロ以上であるならば、新しい性能閾値を得るために、前記現在の性能閾値に音声符号器性能閾値発生計数値あたりの増加分と音声符号器性能閾値の第２の事前に定義された数の発生計数との積を加算する手段と
前記音声符号器のコード化性能を前記新しい性能閾値と比較し、前記フレームのための音声符号器のコード化性能が前記新しい性能閾値を下回るならば、前記フレームのためのコード化レートを調整する手段と
を含む音声符号器。
前記調整する手段が、前記フレームの前記コード化レートを増加する手段を含む請求項１２の音声符号器。
前記フレームのコード化の間に、前記現在の性能閾値より小さい音声符号器性能閾値の各々の発生計数のために、音声符号器性能閾値発生計数値あたりの減少分と、音声符号器性能閾値の発生計数および現在の性能閾値の間の音声符号器性能閾値の発生計数の数に１をプラスした数との積を現在の性能閾値から引算し、および音声符号器性能閾値の発生計数を引算の結果に等しいように設定する手段と、
フレームのコード化の間に、現在の性能閾値より大きい音声符号器性能閾値の各々の発生計数のために、音声符号器性能閾値発生計数値あたりの増加分と、音声符号器性能閾値の発生計数および現在の性能閾値の間の音声符号器性能閾値の発生計数の数に１をプラスした数との積を現在の性能閾値に加算し、および音声符号器性能閾値の発生計数を加算の結果に等しいように設定する手段と、
現在の音声符号器のコード化性能に対応する音声符号器性能閾値の発生計数を１だけ増加する手段と
をさらに含む請求項１２の音声符号器。
フレームのオープンループ分類から予め選択されたコード化レートを得る手段をさらに含む請求項１２の音声符号器。
現在の性能閾値を最大値にさせる手段をさらに含む請求項１２の音声符号器。
現在の性能閾値を最小値にさせる手段をさらに含む請求項１２の音声符号器。
音声符号器性能閾値発生計数値あたりの減少分および音声符号器性能閾値発生計数値あたりの増加分に初期値を割り当てる手段をさらに含む請求項１２の音声符号器。
現在の性能閾値が、調整された後、音声符号器性能閾値の発生計数のすべてをゼロにリセットする手段をさらに含む請求項１２の音声符号器。
前記フレームが、音声フレームである請求項１２の音声符号器。
前記フレームが、線形予測残余フレームである請求項１２の音声符号器。
前記音声符号器が、無線通信システムの加入者ユニットにある請求項１２の音声符号器。
複数のフレームを分析するように構成されている分析モジュールと、
前記分析モジュールに結合され、かつ、前記分析モジュールによって生成されるフレームパラメータをコード化するように構成されている量子化モジュールと
を含む音声符号器であって、
前記量子化モジュールは、さらに
予め選択されたコード化レートでフレームをコード化することと、
コード化されたフレームの事前に定義された数について実行平均ビットレートを計算することと、
差の値を得るために、事前に定義された目標平均ビットレートから実行平均ビットレートを引算することと、
商の値を得るために、予め選択されたコード化レートによって差の値を割算することと、
第１の累算値を生成するために、現在の性能閾値より小さい音声符号器性能閾値の第１の事前に定義された数の起こり得る発生計数を累算することであって、音声符号器性能閾値の事前に定義された数の発生計数は第１の累算された値が商の値の絶対値より大きいように選択されることと、
商の値がゼロ未満であるならば、新しい性能閾値を得るために、現在の性能閾値から音声符号器性能閾値発生計数値あたりの減少分と音声符号器性能閾値の第１の事前に定義された数の発生計数との積を引算することと、
第２の累算された値を生成するため現在の性能閾値より大きい音声符号器性能閾値の第２の事前に定義された数の起こり得る発生計数を累算することであって、音声符号器性能閾値の事前に定義された数の発生計数は第２の累算された値が商の値より大きいように選択されることと、
商の値がゼロ以上であるなら、新しい性能閾値を得るために現在の性能閾値に音声符号器性能閾値発生計数値あたりの増加分と音声符号器性能閾値の第２の事前に定義された数の発生計数との積を加算することと、
前記音声符号器のコード化性能を前記新しい性能閾値と比較し、前記フレームのための音声符号器のコード化性能が前記新しい性能閾値を下回るならば、前記フレームのためのコード化レートを調整することと
を行うように構成されている音声符号器。
前記コード化レートが、増加されることによって調整される請求項２３の音声符号器。
前記量子化モジュールがさらに、
フレームのコード化の間に、現在の性能閾値より小さい音声符号器性能閾値の各々の発生計数のために、音声符号器性能閾値発生計数値あたりの減少分と、音声符号器性能閾値の発生計数および現在の性能閾値の間の音声符号器性能閾値の発生計数の数に１をプラスした数との積を現在の性能閾値から引算し、および音声符号器性能閾値の発生計数を前記引算の結果に等しいように設定することと、
フレームのコード化の間に、現在の性能閾値より大きい音声符号器性能閾値の各々の発生計数のために、音声符号器性能閾値発生計数値あたりの増加分と、音声符号器性能閾値の発生計数および現在の性能閾値の間の音声符号器性能閾値の発生計数の数に１をプラスした数との積を現在の性能閾値に加算し、および音声符号器性能閾値の発生計数を加算の結果に等しいように設定することと、
現在の音声符号器のコード化性能に対応する音声符号器性能閾値の発生計数を１だけ増加することと
を行うように構成されている請求項２３の音声符号器。
量子化モジュールがさらに、フレームのオープンループ分類から予め選択されたコード化レートを得るように構成されている請求項２３の音声符号器。
量子化モジュールがさらに、現在の性能閾値を最大値にさせるように構成されている請求項２３の音声符号器。
量子化モジュールがさらに、現在の性能閾値を最小値にさせるように構成されている請求項２３の音声符号器。
量子化モジュールがさらに、音声符号器性能閾値発生計数値あたりの減少分および音声符号器性能閾値発生計数値あたりの増加分に初期値を割り当てるように構成されている請求項２３の音声符号器。
量子化モジュールがさらに、現在の性能閾値が調整された後、音声符号器性能閾値の発生計数のすべてをゼロにリセットするように構成されている請求項２３の音声符号器。
前記フレームが、音声フレームである請求項２３の音声符号器。
前記フレームが、線形予測残余フレームである請求項２３の音声符号器。
前記音声符号器が、無線通信システムの加入者ユニットにある請求項２３の音声符号器。