JPH11249699A

JPH11249699A - 音声パラメータの合同量子化

Info

Publication number: JPH11249699A
Application number: JP10344083A
Authority: JP
Inventors: John Clark Hardwick; ジョン・クラーク・ハードウィック
Original assignee: Digital Voice Systems Inc
Current assignee: Digital Voice Systems Inc
Priority date: 1997-12-04
Filing date: 1998-12-03
Publication date: 1999-09-17
Anticipated expiration: 2018-12-03
Also published as: EP0927988A3; US6199037B1; EP0927988A2; EP0927988B1; DE69815650T2; DE69815650D1; CA2254567C; CA2254567A1; JP4101957B2

Abstract

(57)【要約】【課題】背景ノイズ及びチャネルエラーに影響されな
い低データ伝送速度、高品質の音声コーダを提供する。【解決手段】音声信号を、デジタル化してデジタル音
声サンプル列とし、次いでサブフレーム列に分割する。
各サブフレームについてモデルパラメータセットを推定
し、モデルパラメータは、サブフレームの有声化情報を
表す有声化メトリクスのセットを含む。サブフレーム列
から２つ以上のサブフレームを１つのフレームに対応さ
せ、フレーム内のサブフレームからの有声化メトリクス
を合同で量子化する。この合同量子化は、先行フレーム
からの量子化された有声化情報から有声化予測情報を形
成し、残余パラメータを有声化情報と有声化予測情報と
の差として演算し、フレーム内の両サブフレームからの
残余パラメータを結合し、結合された残余パラメータを
量子化してビットフレーム内に含まれる符号化された有
声化情報ビットセットとする。基本周波数情報について
も同様に符号化する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声の符号化と復
号化に関する。

【０００２】

【従来の技術】音声の符号化及び復号化は多大なアプリ
ケーションを有し、広範な研究が行われてきた。概し
て、音声圧縮と称される音声コーティングタイプは、音
声の品質または了解度を事実上低減することなしに、音
声信号表示に必要なデータ伝送速度を低減しようと努め
ている。音声圧縮技術は、音声コーダによって実行する
ことができる。

【０００３】音声コーダは通常、エンコーダとデコーダ
を含むものとされている。エンコーダは、マイクロフォ
ンで生成されたアナログ信号をアナログ・デジタル変換
器を使用して変換することにより生成可能であるような
デジタル表示音声から、圧縮されたビットストリームを
生成する。デコーダは、圧縮されたビットストリーム
を、デジタル・アナログ変換器及びスピーカを通じた再
生に適する音声のデジタル表現に変換する。実際のアプ
リケーションでは、エンコーダとデコーダは物理的に分
離され、両者間をビットストリームが通信チャネルを使
用して伝送されることが多い。

【０００４】音声コーダの主要パラメータはコーダが達
成する圧縮の程度であり、これは、エンコーダによって
生成されるビットストリームのビット伝送速度で測られ
る。エンコーダのビット伝送速度は、概して、希望する
忠実度（即ち、音声品質）と使用する音声コーダタイプ
との関数である。様々なタイプの音声コーダが、高速
（毎秒８ｋｂを越えるもの）、中速（毎秒３−８ｋｂ）
及び低速（毎秒３ｋｂ未満）で作動するように設計され
ている。最近は、広範な移動通信アプリケーション（セ
ルラ電話、衛星電話、陸上移動無線、機内電話等）に関
連して、中速及び低速の音声コーダが注目されている。
こうしたアプリケーションは典型的には、高品質の音
声、及び音響ノイズ、チャネルノイズ（ビットエラー
等）に起因する人工物に対する強靭さを必要としてい
る。

【０００５】ボコーダは、移動通信に対する高度な適用
可能性が実証されている音声コーダの一種である。ボコ
ーダは、短い時間間隔の励起に対するシステムの応答と
して音声をモデル化する。ボコーダシステムの例として
は、線形予測ボコーダ、準同形ボコーダ、チャネルボコ
ーダ、正弦変換コーダ（「ＳＴＣ」）、多帯域励起
（「ＭＢＥ」）ボコーダ、改良型多帯域励起（「ＩＭＢ
Ｅ（登録商標）」）ボコーダ等がある。こうしたボコー
ダでは、音声が、各々モデルパラメータのセットによっ
て特徴づけられた複数の短いセグメント（典型的には、
１０−４０ｍｓ）に分割される。こうしたパラメータは
典型的には、セグメントのピッチ、有声化状態、スペク
トル包絡線等、各音声セグメントの基本的なエレメント
を表現している。ボコーダは、こうした各パラメータに
関して、多くの周知の表現のうちの１つを使用すること
ができる。例えば、ピッチは、ピッチ周期、基本周波数
または長期予測遅延として表現が可能である。同様に、
有声化状態は、１つまたは複数の有声化メトリクス、有
声化確率測定値または周期的エネルギーと確率的エネル
ギーの比によって表示が可能である。スペクトル包絡線
は、全極フィルタレスポンスによって表現されることが
多いが、スペクトル振幅のセットまたはその他のスペク
トル測定値によって表示することもできる。

【０００６】

【発明が解決しようとする課題】ほんの少数のパラメー
タを使用して音声セグメントを表現できることから、ボ
コーダのようなモデルを基礎とする音声コーダは、典型
的には、中速乃至低速のデータ伝送速度で作動可能であ
る。しかしながら、モデルベースのシステムの品質は、
基礎となるモデルの精度に依存する。従って、こうした
音声コーダが高性能音声を達成しようとするならば、高
忠実度のモデルを使用しなければならない。

【０００７】高性能音声を提供し、中低速のビット伝送
速度で良好に作動することが実証されている音声モデル
の１つに、グリフィン（Ｇｒｉｆｆｉｎ）とリム（Ｌｉ
ｍ）によって開発された多帯域励起（ＭＢＥ）音声モデ
ルがある。このモデルは、より自然に響く音声の生成を
可能にするフレキシブルな有声化構造を使用しており、
音響的な背景ノイズの存在に対してより強靭となってい
る。この特性によって、ＭＢＥ音声モデルは、多くの商
業的な移動通信アプリケーションに使用されている。

【０００８】ＭＢＥ音声モデルは、基本周波数、バイナ
リ有声化／無声化（Ｖ／ＵＶ）メトリクスまたは決定セ
ット及びスペクトル振幅のセットを使用して音声セグメ
ントを表現する。ＭＢＥモデルは、セグメント毎の従来
式の単一Ｖ／ＵＶ決定を、各決定が特定の周波数帯域内
の有声化状態を表示する決定セットに標準化する。有声
化モデルに於けるこの自在性の付加により、ＭＢＥモデ
ルは、多少の摩擦音等の混合された有声音に対してより
順応したものとなっている。この自在性の付加はまた、
音響的背景ノイズによって悪化した音声のより正確な表
現を可能にしている。広範な試験は、この一般化によっ
て声の品質及び了解度が向上することを実証している。

【０００９】ＭＢＥベースの音声コーダのエンコーダ
は、各音声セグメントについてモデルパラメータセット
を推定する。ＭＢＥモデルパラメータには、基本周波数
（ピッチ周期の逆数）、有声化状態を特徴づけるＶ／Ｕ
Ｖメトリクスまたは決定セット及びスペクトル包絡線を
特徴づけるスペクトル振幅のセットが含まれる。各セグ
メントについてＭＢＥモデルパラメータを推定した後、
エンコーダは、同パラメータを量子化してビットフレー
ムを生成する。エンコーダは選択的に、こうしたビット
をエラー修正／検出コードで保護した上で、最終的なビ
ットストリームを対応するデコーダへ向けてインタリー
ブし、伝送することができる。

【００１０】デコーダは、受信したビットストリームを
元の個々のフレームに変換する。この変換の一部とし
て、デコーダは、逆インタリーブ及びエラー制御復号化
を実行してビットエラーを修正または検出することがで
きる。デコーダは次に、ビットフレームを使用してＭＢ
Ｅモデルパラメータを再構成する。デコーダは、これを
使用して、知覚的にオリジナル音声に類似した音声信号
を合成する。デコーダは、有声化された要素と無声化さ
れた要素を別個に合成し、次に有声化要素と無声化要素
とを加えて最終的な音声信号を生成することができる。

【００１１】ＭＢＥベースのシステムでは、エンコーダ
は、スペクトル振幅を使用して、推測された基本周波数
の各高調波に於けるスペクトル包絡線を表示する。エン
コーダは次に、各高調波周波数のスペクトル振幅を推定
する。各高調波は、対応する高調波を含む周波数帯域が
有声化または無声化の何れであると言明されているかに
よって、有声化されているか無声化されているかが指定
される。高調波周波数が有声化されていると指定されて
いるときは、エンコーダは、高調波周波数が無声化され
ていると指定されている場合に使用される振幅推定量と
は異なる振幅推定量を使用することができる。デコーダ
では、有声化された高調波と無声化された高調波とが識
別され、有声化要素と無声化要素とが異なる手順を使用
して別々に合成される。無声化要素は、白色ノイズ信号
を濾過するために、重複加重法を使用して合成が可能で
ある。当該方法によって使用されるフィルタは、有声化
されていると指定された全ての周波数帯域をゼロに設定
し、それ以外は、無声化されていると指定された領域の
スペクトル振幅に整合させる。有声化要素は、同調され
た発振器バンクを使用して合成される。有声化されてい
ると指定された各高調波に対して、発振器１つが割り当
てられている。瞬時の振幅、周波数及び位相が補間され
て、隣接セグメントに於ける対応パラメータとの整合が
行われる。

【００１２】ＭＢＥベースの音声コーダには、ＩＭＢＥ
（登録商標）音声コーダ及びＡＭＢＥ（登録商標）音声
コーダが含まれる。ＡＭＢＥ（登録商標）音声コーダ
は、初期のＭＢＥベース技術を改良して開発されたもの
であり、励起パラメータ（基本周波数及び有声化決定）
のより粗である推定方法を含んでいる。この方法は、実
際の音声に於いて発見される変化及びノイズをより良く
追跡する能力がある。ＡＭＢＥ（登録商標）音声コーダ
は、典型的には１６チャネルを含むフィルタバンクと非
線形性を使用して、励起パラメータの高信頼的推定を可
能にする元となるチャネル出力セットを生成する。チャ
ネル出力は、結合、処理されて基本周波数が推定され
る。その後、数個（例、８つ）の有声化帯域の各々に於
けるチャネルが処理され、各有声化帯域の有声化決定
（またはその他の有声化メトリクス）が推定される。

【００１３】ＡＭＢＥ（登録商標）はまた、有声化決定
とは別にスペクトル振幅も推定することができる。これ
を行うために、音声コーダは、ウィンドウ内に表示され
た各音声サブフレームの高速フーリエ変換（ＦＦＴ）を
演算し、推定された基本周波数の倍数である周波数領域
に於けるエネルギーを平均する。この方法にはさらに、
推定されたスペクトル振幅から、ＦＦＴサンプリンググ
リッドによって導入された人工物を除去する補正を含め
ることができる。

【００１４】ＡＭＢＥ（登録商標）音声コーダはまた、
有声化された音声の合成に使用される位相情報を、当該
位相情報をエンコーダからデコーダへ明確に伝送するこ
となく再生する位相合成要素を包含することができる。
ＩＭＢＥ（登録商標）音声コーダの場合と同じく、有声
化決定を基礎とするランダム位相合成の適用が可能であ
る。代替として、デコーダは、再生されたスペクトル振
幅に平滑核を印加して、ランダムに生成された位相情報
よりも知覚的にオリジナル音声のそれに近い可能性のあ
る位相情報を生成することができる。

【００１５】上述の技術は、例えば、フラナガン（Ｆｌ
ａｎａｇａｎ）著「音声の解析、合成及び認識」Ｓｐｒ
ｉｎｇｅｒ−Ｖｅｒｌａｇ、１９７２年、３７８−３８
６頁（周波数を基礎とした音声解析−合成システムにつ
いて記述している）、ジャヤン（Ｊａｙａｎｔ）他著
「波形のデジタルコーディング」Ｐｒｅｎｔｉｃｅ−Ｈ
ａｌｌ、１９８４年（音声のコード化について概説して
いる）、米国特許第４，８８５，７９０号（正弦処理方
法について記述している）、米国特許第５，０５４，０
７２号（正弦処理方法について記述している）、アルメ
イダ（Ａｌｍｅｉｄａ）他著「有声化音声の非定常モデ
リング」ＩＥＥＥＴＡＳＳＰ、ＡＳＳＰ−３１巻第
３号、１９８３年６月、６６４−６７７頁（調波モデリ
ングと関連コーダについて記述している）、アルメイダ
（Ａｌｍｅｉｄａ）他著「可変周波数の合成：改良型高
調波コーディング法」ＩＥＥＥ会報ＩＣＡＳＳＰ８
４、２７．５．１−２７．５．４頁（多項有声化合成法
について記述している）、クォーティエリ（Ｑｕａｔｉ
ｅｒｉ）他著「正弦表示を基礎とする音声変換」ＩＥＥ
ＥＴＡＳＳＰ、ＡＳＳＰ３４巻第６号、１９８６年
１２月、１４４９−１９８６頁（正弦表示に基づく解析
−合成技術について記述している）、マッカレイ（Ｍｃ
Ａｕｌａｙ）他著「音声の正弦表示を基礎とする中速コ
ーティング」会報ＩＣＡＳＳＰ８５、９４５−９４８
頁、Ｔａｍｐａ、ＦＬ、１９８５年３月２６−２９日
（正弦変換音声コーダについて記述している）、グリフ
ィン（Ｇｒｉｆｆｉｎ）著「マルチバンド励起ボコー
ダ」Ｐｈ．Ｄ．Ｔｈｅｓｉｓ、Ｍ．Ｉ．Ｔ、１９８７年
（ＭＢＥ音声モデルと毎秒８０００バイトのＭＢＥ音声
コーダについて記述している）、ハードウィック（Ｈａ
ｒｄｗｉｃｋ）著「４．８ｋｂｐｓマルチバンド励起音
声コーダ」ＳＭ．Ｔｈｅｓｉｓ、Ｍ．Ｉ．Ｔ、１９８８
年５月（毎秒４８００バイトのＭＢＥ音声コーダについ
て記述している）、通信産業連盟（ＴＩＡ）「ＡＰＣＯ
プロジェクト２５ボコーダ解説」１．３版、１９９３年
７月１５日、ＩＳ１０２ＢＡＢＡ（ＡＰＣＯプロジェク
ト２５スタンダードの毎秒７．２キロバイトのＩＭＢＥ
（登録商標）音声コーダについて記述している）、米国
特許第５，０８１，６８１号（ＩＭＢＥ（登録商標）ラ
ンダム位相合成について記述している）、米国特許第
５，２４７，５７９号（ＭＢＥを基礎とする音声コーダ
のチャネルエラー軽減方法とフォーマット強化方法につ
いて記述している）、米国特許第５，２２６，０８４号
（欧州特許出願第９２９０２７７２．０号）（ＭＢＥを
基礎とする音声コーダの量子化及びエラー軽減方法につ
いて記述している）、米国特許第５，５１７，５１１号
（欧州特許出願第９４９０２４７３．１号）（ＭＢＥを
基礎とする音声コーダのビット優先順位決定方法とＦＥ
Ｃエラー制御方法について記述している）等に記述され
ている。

【００１６】

【課題を解決するための手段】本発明は、例えば、無線
通信チャネルを低いデータ伝送速度で伝送されるビット
ストリームから高品質の音声を生成するための無線通信
システムに於いて使用する音声コーダを特徴としてい
る。本音声コーダは、低いデータ伝送速度、高品質音声
及び背景ノイズ及びチャネルエラーに対する強靭さを結
合させたものである。本音声コーダは、２つ以上の連続
するサブフレームから推定された有声化メトリクスを合
同で量子化する多重サブフレーム有声化メトリクス量子
化器によって高性能を達成している。この量子化器は、
先行システムよりも少ないビット数を使用して有声化メ
トリクスの量子化を行ない、先行システムと比肩しうる
忠実度を達成する。本音声コーダは、ＡＭＢＥ（登録商
標）音声コーダとして実行することができる。ＡＭＢＥ
（登録商標）音声コーダは、「励起パラメータの推定」
と題する１９９８年２月３日発行の米国特許第５，７１
５，３６５号（欧州特許出願第９５３０２２９０．２
号）、「マルチバンド励起音声コーダのスペクトル表
示」と題する１９９８年５月１９日発行の米国特許第
５，７５４，９７４号及び「再生位相情報を使用する音
声合成」と題する１９９７年１２月３１日発行の米国特
許第５，７０１，３９０号に於いて概説されている。

【００１７】ある態様に於いては、概して、音声が符号
化されてビットフレームとなる。音声信号は、デジタル
化されてデジタル音声サンプル列となる。デジタル音声
サンプル群に関して、有声化メトリクスパラメータセッ
トが推定される。当該セットは、多数の有声化メトリク
スパラメータを含んでいる。有声化メトリクスパラメー
タは次に、合同で量子化されてエンコーダ有声化メトリ
クスビットセットが生成される。その後、エンコーダ有
声化メトリクスビットはビットフレームに包含される。

【００１８】実行に際しては、以下のような１つまたは
複数の特徴を包含することができる。デジタル音声サン
プルは、各々が多数のデジタル音声サンプルを含むサブ
フレーム列に分割することができる。この列内のサブフ
レームは、１フレームに対応するものとして指定が可能
である。デジタル音声サンプル群は、フレームのサブフ
レームに対応することが可能である。多数の有声化メト
リクスパラメータの合同量子化は、多数のサブフレーム
の各々に関して少なくとも１つの有声化メトリクスパラ
メータを合同で量子化すること、または単一のサブフレ
ームに関して多数の有声化メトリクスパラメータを合同
で量子化すること、を包含可能である。

【００１９】合同量子化は、有声化メトリクス残余パラ
メータを、有声化エラーベクトルと有声化エネルギーベ
クトルとの変換比として演算することを包含可能であ
る。サブフレームからの残余有声化メトリクスパラメー
タは結合が可能であり、結合された残余パラメータは量
子化が可能である。

【００２０】フレームのサブフレームからの残余パラメ
ータは、残余パラメータに対して線形変換を実行するこ
とにより結合が可能であり、次に結合される各サブフレ
ームの変換残余係数が生成される。結合された残余パラ
メータは、ベクトル量子化器を使用して量子化が可能で
ある。

【００２１】ビットフレームは、少なくとも幾つかのエ
ンコーダ有声化メトリクスビットを保護する残余エラー
制御ビットを包含可能である。有声化メトリクスパラメ
ータは、ＭＢＥベースの音声モデルについて推定された
有声化状態を表現することができる。

【００２２】有声化メトリクスパラメータ以外の音声モ
デルパラメータを合同で量子化することにより、追加的
なエンコーダビットを生成することができる。この追加
的エンコーダビットは、ビットフレーム内に包含するこ
とができる。追加音声モデルパラメータには、スペクト
ル振幅及び基本周波数を表すパラメータが含まれる。

【００２３】その他の一般的な態様に於いては、１フレ
ームの複数のサブフレームの複数の基本周波数パラメー
タが合同で量子化され、エンコーダ基本周波数ビットセ
ットが生成される。これは、ビットフレーム内に包含さ
れる。合同量子化は、残余基本周波数パラメータを基本
周波数パラメータの変換平均と各基本周波数パラメータ
との差として演算することを包含可能である。サブフレ
ームからの残余基本周波数パラメータは結合が可能であ
り、結合された残余パラメータは量子化が可能である。

【００２４】残余基本周波数パラメータは、残余パラメ
ータに対して線形変換を実行することにより結合が可能
であり、各サブフレームの変換残余係数が生成される。
結合された残余パラメータは、ベクトル量子化器を使用
して量子化が可能である。ビットフレームは、少なくと
も幾つかのエンコーダ基本周波数ビットを保護する残余
エラー制御ビットを包含可能である。基本周波数パラメ
ータは、ＭＢＥベースの音声モデルについて推定された
基本周波数の対数を表示することができる。

【００２５】有声化メトリクスパラメータ以外の音声モ
デルパラメータを量子化することにより、追加的なエン
コーダビットを生成することができる。この追加的エン
コーダビットは、ビットフレーム内に包含することがで
きる。

【００２６】他の一般的な態様に於いては、１フレーム
の１サブフレームの１つの基本周波数パラメータが量子
化され、量子化された基本周波数パラメータを使用して
当該フレームの他のサブフレームの１つの基本周波数パ
ラメータが補間される。次いで、量子化された基本周波
数パラメータと補間された基本周波数パラメータが結合
され、エンコーダ基本周波数ビットセットが生成され
る。

【００２７】さらに他の一般的な態様に於いては、上述
の通りに符号化されているビットフレームから音声が復
号される。デコーダ有声化メトリクスビットがビットフ
レームから抽出され、音声フレームの複数のサブフレー
ムに関する有声化メトリクスパラメータの合同再構成に
使用される。サブフレームの再構成された有声化メトリ
クスパラメータの幾つかまたは全てを含む音声モデルパ
ラメータを使用して、音声フレーム内の各サブフレーム
についてデジタル音声サンプルが合成される。

【００２８】実行に際しては、以下のような１つまたは
複数の特徴を包含することができる。合同再構成は、デ
コーダ有声化メトリクスビットを逆量子化してフレーム
の結合された残余パラメータセットを再構成することを
包含可能である。結合された残余パラメータからは、各
サブフレームの残余パラメータを別々に演算することが
できる。有声化メトリクスビットから、有声化メトリク
スパラメータを形成することができる。

【００２９】各サブフレーム別の残余パラメータは、フ
レームの結合残余パラメータからフレームの有声化メト
リクス残余パラメータを分離することによって演算する
ことができる。フレームの有声化メトリクス残余パラメ
ータについて逆変換を実行し、各サブフレーム別の残余
パラメータを生成することができる。有声化メトリクス
デコーダパラメータについて逆ベクトル量子化変換を実
行することにより、変換された残余パラメータから別々
の有声化メトリクス残余パラメータを演算することがで
きる。

【００３０】ビットフレームは、有声化メトリクスパラ
メータ以外の音声モデルパラメータを表示する追加的な
デコーダビットを包含可能である。音声モデルパラメー
タには、スペクトル振幅、基本周波数またはスペクトル
振幅、基本周波数双方を表示するパラメータが含まれ
る。

【００３１】再構成される有声化メトリクスパラメータ
は、多帯域励起（ＭＢＥ）音声モデルに於いて使用可能
な有声化メトリクスを表すことができる。ビットフレー
ムは、少なくとも幾つかのデコーダ有声化メトリクスビ
ットを保護する冗長エラー制御ビットを包含可能であ
る。逆ベクトル量子化を１つまたは複数のベクトルに適
用して、フレームの結合残余パラメータセットを再構成
することができる。

【００３２】その他の態様に於いては、上述の通りに符
号化されているビットフレームから音声が復号される。
デコーダ基本周波数ビットがビットフレームから抽出さ
れる。デコーダ基本周波数ビットを使用して、音声フレ
ームの複数のサブフレームに関する基本周波数パラメー
タが合同で再構成される。サブフレームの再構成された
基本周波数パラメータを含む音声モデルパラメータを使
用して、音声フレーム内の各サブフレームについてデジ
タル音声サンプルが合成される。

【００３３】実行に際しては、以下のような特徴を包含
することができる。合同再構成は、デコーダ基本周波数
ビットを逆量子化してフレームの結合された残余パラメ
ータセットを再構成することを包含可能である。結合さ
れた残余パラメータからは、各サブフレームの残余パラ
メータを別々に演算することができる。フレームの平均
基本周波数残余パラメータの対数を演算可能であり、ま
た各サブフレームの基本周波数微分残余パラメータの対
数を演算可能である。別々の微分残余パラメータを平均
基本周波数残余パラメータの対数に加算して、フレーム
内の各サブフレームに関する再構成された基本周波数パ
ラメータを形成することができる。

【００３４】上述の技術は、コンピュータのハードウェ
アまたはソフトウェア、或いは両者を結合したものに於
いて実行することができる。しかしながら、本技術は、
任意の特定のハードウェアまたはソフトウェアに限定さ
れない。本技術は、音声の符号化または復号化に使用可
能なあらゆる演算または処理環境に於いて適用の場を見
い出すことができる。本技術は、デジタル信号処理チッ
プによって実行され、例えば当該チップに付属する記憶
装置等に保存可能なソフトウェアとして実行することが
できる。本技術はまた、各々がプロセッサ、プロセッサ
による読み取りが可能な保存媒体（揮発性及び不揮発性
メモリ及び／或いは格納要素を含む）及び２つ以上の出
力装置を含む複数のプログラマブルコンピュータ上で実
行されるコンピュータプログラムに於いて実行が可能で
ある。入力装置を使用して入力されたデータにプログラ
ムコードが印加され、上述の機能が実行されて出力情報
が生成される。出力情報は、１つまたは複数の出力装置
に印加される。

【００３５】各プログラムは、高レベルの手順または目
的指向性プログラミング言語に於いて実行され、コンピ
ュータシステムと通信することができる。本プログラム
はまた、希望があればアッセンブラ言語または機械語に
於いて実行可能である。何れの場合も、言語は、コンパ
イラ言語または翻訳言語であることも可能である。

【００３６】こうした各コンピュータプログラムは、汎
用または専用プログラマブルコンピュータによる読み取
りが可能な記憶媒体または装置（ＣＤ−ＲＯＭ、ハード
ディスクまたは磁気ディスケット等）に格納することが
可能であり、コンピュータは、記憶媒体または装置がコ
ンピュータによって読み取られると本明細書に記述され
た手順を実行するように構成され、作動する。本システ
ムはまた、記憶媒体の形態に起因してコンピュータが特
定または予定の方法で作動するような、コンピュータプ
ログラムに付随して形成された、コンピュータによる読
み取りが可能な記憶媒体として実行可能であると考える
ことができる。

【００３７】その他の特徴及び優位点は、図面を含む以
下の説明及び特許請求の範囲から明らかとなるであろ
う。

【００３８】

【発明の実施の形態】ある実施例を、セルラ電話または
衛星電話、移動無線、エアホン及びボイスページャ等の
無線通信に、またセキュアテレフォニー及び音声マルチ
プレクサ等の有線通信に、また留守番電話及び口述録音
機等に於ける音声のデジタル保存に適用可能な新規ＡＭ
ＢＥ（登録商標）音声コーダ、またはボコーダ、の文脈
に於いて説明する。図１を参照すると、ＡＭＢＥ（登録
商標）エンコーダが、サンプル抽出された入力音声を処
理し、５−３０ミリ秒毎にサブフレームパラメータセッ
トを生成するＡＭＢＥ（登録商標）解析器１２０を使用
して入力音声１１０の第１回目の解析を行って出力ビッ
トストリームを生成する。２つの連続するサブフレー
ム、１３０及び１４０からのサブフレームパラメータ
は、フレームパラメータ量子化器１５０に供給される。
パラメータは次にフレームパラメータ量子化器１５０に
よって量子化され、量子化された出力ビットフレームが
形成される。フレームパラメータ量子化器１５０の出力
は、オプションである前方向エラー訂正（ＦＥＣ）エン
コーダ１６０へと供給される。エンコーダによって生成
されたビットストリーム１７０は、チャネルを通って伝
送されるか、記録媒体に保存が可能である。ＦＥＣエン
コーダ１６０によって提供されたエラーコーティング
は、伝送チャネルまたは記録媒体によって導入されるほ
とんどのエラーを修正することができる。伝送または記
憶媒体にエラーがない場合は、ＦＥＣエンコーダ１６０
は、さらなる冗長性を付加することなく、フレームパラ
メータ量子化器１５０によって生成されたビットをエン
コーダ出力１７０へと通過させることができる。

【００３９】図２は、フレームパラメータ量子化器１５
０のより詳細なブロック図である。２つの連続するサブ
フレームの基本周波数パラメータが、基本周波数量子化
器２１０によって合同で量子化されている。両サブフレ
ームの有声化メトリクスは、有声化量子化器２２０によ
って処理される。両サブフレームのスペクトル振幅は、
振幅量子化器２３０によって処理される。量子化された
ビットは、結合器２４０内で結合され、フレームパラメ
ータ量子化器の出力２５０が形成される。

【００４０】図３は、基本周波数量子化器の１実施例を
示している。基本周波数量子化器２１０によって受信さ
れた２つの基本周波数パラメータは、ｆｕｎｄ１及びｆ
ｕｎｄ２として示されている。量子化器２１０は、ログ
プロセッサ３０５及び３０６を使用して、両基本周波数
パラメータの対数（典型的には底は２）を生成する。ロ
グプロセッサ３０５（ｌｏｇ₂（ｆｕｎｄ１））及び３
０６（ｌｏｇ₂（ｆｕｎｄ２））の出力は、平均化器３
１０によって平均され、０．５（ｌｏｇ₂（ｆｕｎｄ
１）＋ｌｏｇ₂（ｆｕｎｄ２））として表示可能な出力
が生成される。平均化器３１０の出力は、４ビットスカ
ラー量子化器３２０によって量子化される。但し、ビッ
ト数の変動は、容易に調整される。本質的に、スカラー
量子化器３２０は、平均化器３１０の高精度出力、これ
は例えば、１６または３２ビット長である可能性があ
る、を、１６の量子化レベルの内の１つに関連して４ビ
ット出力に写す。特別な量子化レベルを表すこの４ビッ
ト数字は、可能性のある１６の量子化レベルの各々を平
均化器の出力と比較し、最も近いものを量子化器出力と
して選択することにより決定することができる。オプシ
ョンとして、スカラー量子化器がユニホームスカラー量
子化器であれば、この４ビット出力は、平均化器の出力
プラス偏差を予定のステップサイズΔで除し、ビット数
によって決定された許容可能領域内の最も近い整数に丸
めることにより決定することができる。

【００４１】ユニホーム４ビットスカラー量子化器で使
用される典型的な公式は、以下の通りである。

【数１】

【００４２】スカラー量子化器によって演算された出
力、ビット数、は、結合器３５０を通過し、基本周波数
量子化器の出力３６０の４つの最重要ビットが形成され
る。量子化器３２０の４つの出力ビットはまた、４ビッ
ト逆スカラー量子化器３３０にも入力される。４ビット
逆スカラー量子化器３３０は、この４ビットを、平均化
器３１０の出力に類似してやはり高精度値であるその元
の関連量子化器レベルへと変換する。この変換は、４つ
の出力ビットに対する各可能性が単一の量子化レベルに
関連しているテーブルルックアップを通じて実行が可能
である。オプションとして、逆スカラー量子化器がユニ
ホームスカラー量子化器であれば、この変換は以下のよ
うに、４つのビット数に予定のステップサイズΔを乗
じ、偏差を加算して出力量子化ｑｌを演算することによ
り達成が可能である。

【００４３】

【数２】ここで、Δは、量子化器３２０で使用されたものと同じ
である。減算ブロック３３５及び３３６は、ｌｏｇ
₂（ｆｕｎｄ１）及びｌｏｇ₂（ｆｕｎｄ２）から逆量子
化器３３０の出力を減算し、６ビットベクトル量子化器
３４０に入力される２要素差分ベクトルを生成する。

【００４４】６ビットベクトル量子化器３４０への２つ
の入力は、二次元の差分ベクトル：（ｚ０，ｚ１）とし
て処理される。両成分ｚ０、ｚ１は、１つのフレームに
含まれる２つのサブフレームからの差分要素（即ち、０
番目のサブフレームの後に１番目のサブフレームが続
く）を表している。この二次元ベクトルは、付録Ａの
「基本周波数ＶＱコードブック（６ビット）」のような
表に於ける二次元ベクトル（ｘ０（ｉ），ｘ１（ｉ））
と比較される。この比較は、典型的には以下のように計
算される距離測度、ｅ（ｉ）、に基づいて行われる。

【００４５】

【数３】ｅ（ｉ）＝ｗ０*［ｘ０（ｉ）−ｚ０］²＋ｗ１
*［ｘ１（ｉ）−ｚ１］² ここで、ｉ＝０，１，．．．，６３。但し、ｗ０及びｗ１は、有声化エネルギーの多いサブフ
レームからの要素に対してはエラー貢献度を低減し、有
声化エネルギーの少ないサブフレームからの要素に対し
てはエラー貢献度を増大させる重み値である。好適な重
みは、以下のように演算される。

【００４６】

【数４】但しＣ＝定数であり、好適な値は０．２５である。変数
ｖｅｎｅｒ_i（０）及びｖｅｎｅｒ_i（１）は、ｉ番目の
周波数帯域の各々０番目と１番目のサブフレームの有声
化エネルギー項を表し、変数ｖｅｒｒ_i（０）及びｖｅ
ｒｒ_i（１）は、ｉ番目の周波数帯域の各々０番目と１
番目のサブフレームの有声化エラー項を表している。ｅ
（ｉ）を最小にするベクトルの指数ｉは、ベクトル量子
化器３４０の６ビット出力を生成するために表から選択
される。

【００４７】ベクトル量子化器は、任意の二次元ベクト
ルに対して提供する量子化パターン数を低減することに
より、基本周波数の符号化に必要なビット数を低減させ
る。経験的データは、任意の話者に関して、基本周波数
はサブフレーム毎に極度に変化しないことを示してお
り、従って、表２，表３によって提供されている量子化
パターンは、ｘ０（ｎ）及びｘ１（ｎ）の小値へとより
密に集束される。基本周波数の小さい変動に高密度の量
子化レベルが存在することから、ベクトル量子化器は、
サブフレーム間の基本周波数のこうした小さな変化をよ
り正確に写すことができる。従って、ベクトル量子化器
は、音声品質を極度に低下させることなく、基本周波数
の符号化に必要なビット数を低減させる。

【００４８】６ビットベクトル量子化器３４０の出力
は、結合器３５０によって４ビットスカラー量子化器３
２０の出力と結合される。スカラー量子化器３２０から
の４ビットは、基本周波数量子化器２１０の出力３６０
に於ける最重要ビットを形成し、ベクトル量子化器３４
０からの６ビットは、出力３６０の重要度の低いビット
を形成する。

【００４９】図４は、合同基本周波数量子化器の第２の
実施例を示している。ここでもやはり、基本周波数量子
化器２１０によって受信される２つの基本周波数パラメ
ータがｆｕｎｄ１及びｆｕｎｄ２として示されている。
量子化器２１０は、ログプロセッサ４０５及び４０６を
使用して、両基本周波数パラメータの対数（典型的には
底は２）を生成する。第２サブフレームに関するログプ
ロセッサ４０５の出力ｌｏｇ₂（ｆｕｎｄ１）は、Ｎ＝
４乃至８ビット（一般的には、Ｎ＝６）を使用してスカ
ラー量子化４２０される。典型的には、ユニホームスカ
ラー量子化器が以下の公式を使用して適用される。

【００５０】

【数５】量子化レベル表で構成される非ユニホームスカラー量子
化器もまた、適用が可能である。出力であるビット数
は、結合器４５０へと移行し、基本周波数量子化器の出
力４６０のＮ個の最重要ビットを形成する。出力ビット
はまた、逆スカラー量子化器４３０へと送られる。逆ス
カラー量子化器４３０は、ｌｏｇ₂（ｆｕｎｄ１）に対
応し、入力されたビットから以下の公式に従って再構成
された量子化レベルを出力する。

【００５１】

【数６】現行フレームの再構成された量子化レベルｑｌ（０）
は、１フレーム遅延要素４１０に入力される。１フレー
ム遅延要素４１０は、先行フレームからの類似値（即
ち、先行フレームの第２サブフレームに対応する量子化
レベル）を出力する。現行及びｑｌ（−１）として明示
された遅延量子化レベルは、共に２ビットまたは類似の
補間器に入力される。２ビット補間器は、表１に示され
た補間規則から、可能性のある４つの出力のうちでｌｏ
ｇ₂（ｆｕｎｄ２）に最も近いものを選択する。但し、
ｑｌ（０）＝ｑｌ（−１）である場合は、量子化の精度
を向上させるために他とは異なる規則が使用される。

【００５２】

【表１】ｌｏｇ₂（ｆｕｎｄ２）に最も近い結果を生じさせる補
間規則の２ビット指数ｉは、補間器４４０から出力さ
れ、結合器４５０に入力されて基本周波数量子化器４６
０の出力の２つのＬＳＢを形成する。

【００５３】図５を参照すると、有声化メトリクス量子
化器２２０は、連続するサブフレームについて有声化メ
トリクスの合同量子化を実行する。有声化メトリクス
は、ｎ番目のサブフレームのｋ番目の周波数帯域に於け
るエネルギーを表す有声化エネルギー５１０、ｖｅｎｅ
ｒ_k（ｎ）、と、ｎ番目のサブフレームのｋ番目の周波
数帯域に於ける非高調波周波数でのエネルギーを表す有
声化エラー項５２０、ｖｅｒｒ_k（ｎ）、との関数とし
て表示することができる。変数ｎの値は、先行フレーム
の最終サブフレームは−１、現行フレームの２つのサブ
フレームは０及び１、次のフレームの最初のサブフレー
ム（遅延を考慮した上で利用可能であるとき）は２であ
る。変数ｋは、８つの離散的周波数帯域に対応する０か
ら７までの値を有している。

【００５４】平滑器５３０は、現行フレームに於ける２
つのサブフレームの各々について有声化メトリクスに平
滑化操作を適用し、出力値ε_k（０）及びε_k（１）を生
成する。ε_k（０）の値は、以下のようにして計算され
る。

【数７】また、ε_k（１）の値は、次の２つの方法のうちの何れ
かによって計算される。１つの追加的な遅延サブフレー
ムをボイスエンコーダに加えることにより予めｖｅｎｅ
ｒ_k（２）及びｖｅｒｒ_k（２）が演算されているとき
は、ε_k（１）は以下のようにして計算される。

【００５５】

【数８】ｖｅｎｅｒ_k（２）及びｖｅｒｒ_k（２）が予め演算され
ていないときは、ε_k（１）の値は以下のようにして計
算される。

【００５６】

【数９】Ｔは有声化限界値であって基準値０．２を有し、βは定
数であって基準値０．６７を有する。

【００５７】平滑器５３０からの両サブフレームの出力
値ε_kは、非線形変換器５４０に入力され、以下のよう
にして出力値ｌｖ_kが生成される。

【数１０】ここで、ｋ＝０，１，．．．、但し、γの基準値は０．
５であり、オプションとして、ρ（ｎ）は単純化して定
数値である０．５に等しく設定し、ｄ₀（ｎ）とｄ
₁（ｎ）の計算の必要性をなくすることができる。

【００５８】現行フレームに関する非線形変換器の出力
である、ｋ＝０，１．．．７、ｎ＝０，１のときの１６
個の要素ｌｖ_k（ｎ）は、有声化ベクトルを形成する。
このベクトルは、次いで、対応する有声化エネルギー項
５５０、ｖｅｎｅｒ_k（０）、と共にベクトル量子化器
５５０に入力される。典型的には、２つの方法のうちの
１つがベクトル量子化器５６０によって適用されるが、
多くの変形方法も使用が可能である。

【００５９】第１の方法では、ベクトル量子化器が、単
一ステップに於いて１６要素有声化ベクトル全体を量子
化する。このベクトル量子化器は、その入力された有声
化ベクトルを処理し、これを表４，表５に於ける「１６
要素有声化メトリクスＶＱコードブック（６ビット）」
のような関連するコードブック表の中のあらゆる可能な
量子化ベクトルｘ_j（ｉ）、ｊ＝０，１，．．．，１
５、と比較する。ベクトル量子化器によって比較される
可能性のある量子化ベクトルの数は、典型的には２^Nで
ある。ここで、Ｎは当該ベクトル量子化器によって出力
されるビット数である（典型的には、Ｎ＝６）。この比
較は、加重平方距離、ｅ（ｉ）、を基礎としており、Ｎ
ビットベクトル量子化器のｅ（ｉ）は、以下のようにし
て計算される。

【００６０】

【数１１】ベクトル量子化器５６０の出力は、コードブック表にあ
るｅ（ｉ）を最小にすることが発見されている量子化ベ
クトルのＮビット指数、ｉ、であり、ベクトル量子化の
この出力が、各フレームの有声化量子化器２２０の出力
を形成する。

【００６１】第２の方法では、ベクトル量子化器が有声
化ベクトルを複数のサブベクトルに分割し、その各々が
個々にベクトル量子化される。量子化に先だって大きい
ベクトルを複数のサブベクトルに分割することにより、
ベクトル量子化器の複雑さとメモリ要件が低減される。
多くの異なる分割を適用すれば、サブベクトルの数及び
長さに多くの変形を生み出すことができる（例、８＋
８、５＋５＋６、４＋４＋４＋４、．．．）。可能性の
ある１つの変形は、有声化ベクトルを、２つの８要素サ
ブベクトル、ｌｖ_k（０）、ｋ＝０，１．．．７、及び
ｌｖ_k（１）、ｋ＝０，１．．．７、に分割することで
ある。これは、有声化ベクトルを、第１サブフレームの
ための１つのサブベクトルと、第２サブフレームのため
の他のサブベクトルとに有効に分割する。各サブベクト
ルは個々にベクトル量子化され、以下のように、Ｎビッ
トベクトル量子化器のｅ_n（ｉ）が最小にされる。

【００６２】

【数１２】ここで、ｉ＝０，１，．．．，２^N−１、但し、ｎ＝
０，１である。各２^N量子化ベクトル、ｘ_j（ｉ）、但し
ｉ＝０，１，．．．，２^N−１、は、８要素長（即ち、
ｊ＝０，１，．．．，７）である。有声化ベクトルをサ
ブフレームによって等しく分割することの１つの優位点
は、フレーム内の２つのサブフレーム間では概して統計
値に変化がないことから、両サブベクトルのベクトル量
子化に同一のコードブック表を使用できることにある。
表６には、４ビットコードブックの例「８要素有声化メ
トリクス分割ＶＱコードブック（４ビット）」が示され
ている。有声化量子化器２２０の出力でもあるベクトル
量子化器５６０の出力は、個々のベクトル量子化器から
出力されるビット数を結合して生成される。個々のベク
トル量子化器は、２つの８要素サブベクトルのベクトル
量子化に各々Ｎビットが使用されるとして、分割段階で
２Ｎビットを出力する。

【００６３】新たな基本量子化器及び有声化量子化器
は、スペクトル振幅を量子化する様々な方法によって結
合が可能である。図６が示すように、振幅量子化器２３
０は、ＡＭＢＥ（登録商標）解析器から２つの連続する
サブフレームの振幅パラメータ６０１ａ及び６０１ｂを
受信する。パラメータ６０１ａは、奇数番号のサブフレ
ーム（即ち、フレームの最終サブフレーム）のスペクト
ル振幅を表し、指数１が与えられている。奇数付番され
たサブフレームの振幅パラメータ数は、Ｌ₁で示されて
いる。パラメータ６０１ｂは、偶数番号のサブフレーム
（即ち、フレームの最初のサブフレーム）のスペクトル
振幅を表し、指数０が与えられている。偶数付番された
サブフレームの振幅パラメータ数は、Ｌ₀で示されてい
る。

【００６４】パラメータ６０１ａは、対数圧伸器６０２
ａを通過する。対数圧伸器６０２ａは、パラメータ６０
１ａに含まれる各Ｌ₁振幅に対して２を底とする対数演
算を実行し、Ｌ₁要素から成るベクトルである信号６０
３ａを生成する。

【数１３】ｙ［ｉ］＝ｌｏｇ₂（ｘ［ｉ］）ここで、ｉ＝１，２，．．．，Ｌ₁、但し、ｘ［ｉ］は
パラメータ６０１ａを表し、ｙ［ｉ］は、信号６０３ａ
を表している。圧伸器６０２ｂは、パラメータ６０１ｂ
に含まれる各Ｌ₀振幅に対して２を底とする対数演算を
実行し、Ｌ₀要素から成るベクトルである信号６０３ｂ
を生成する。

【００６５】

【数１４】ｙ［ｉ］＝ｌｏｇ₂（ｘ［ｉ］）ここで、ｉ＝１，２，．．．，Ｌ₀、但し、ｘ［ｉ］は
パラメータ６０１ｂを表し、ｙ［ｉ］は、信号６０３ｂ
を表している。平均値計算機６０４ａ及び６０４ｂは、
対数圧伸器６０２ａ及び６０２ｂによって生成された信
号６０３ａ及び６０３ｂを受信し、各サブフレームの平
均値６０５ａ及び６０５ｂを算出する。この平均値、ま
たはゲイン値、は当該サブフレームの平均音声レベルを
表しており、両サブフレームのスペクトル振幅の対数の
平均を演算してサブフレーム内の調波数に依存するオフ
セットを加えることにより決定される。

【００６６】信号６０３ａの場合、平均値は以下のよう
に計算される。

【数１５】但し、出力ｙ₁は、各フレームの最終サブフレームに対
応する平均信号６０５ａを表している。信号６０３ｂの
場合、平均値は以下のように計算される。

【００６７】

【数１６】但し、出力ｙ₀は、各フレームの第１サブフレームに対
応する平均信号６０５ｂを表している。

【００６８】平均信号６０５ａ及び６０５ｂは、平均ベ
クトル量子化器６０６によって量子化される。平均ベク
トル量子化器６０６は、典型的には８ビットを使用し、
演算された平均ベクトル（ｙ₀，ｙ₁）を、表７〜表１２
に示す「平均ベクトルＶＱコードブック（８ビット）」
のようなコードブック表に記載された各候補ベクトルと
比較する。この比較は、候補コードブックベクトル（ｘ
０（ｉ），ｘ１（ｉ））の典型的には以下のように計算
される距離測度、ｅ（ｉ）、に基づいて行われる。

【数１７】ｅ（ｉ）＝［ｘ０（ｉ）−ｙ₀］²＋
［ｘ１（ｉ）−ｙ₁］² ここで、ｉ＝０，１，．．．，２５５。ｅ（ｉ）を最小にする候補ベクトルの８ビット指数ｉ
が、平均ベクトル量子化器６０８ｂの出力を形成する。
平均ベクトル量子化器の出力は、次いで結合器６０９に
送られ、振幅量子化器の出力の一部を形成する。この平
均ベクトル量子化器に適用される他のハイブリッドベク
トル／スカラー方法が、１９９７年３月１４日に提出さ
れた「スペクトルパラメータの多重サブフレーム量子
化」と題する米国特許出願第０８／８１８，１３０号に
記述されている。

【００６９】再度図６を参照すると、信号６０３ａ及び
６０３ｂは、ブロックＤＣＴ量子化器６０７に入力され
る。但し、このブロックＤＣＴ量子化器６０７には、他
の形式の量子化器も使用可能である。ブロックＤＣＴ量
子化器の変形は、一般に採用されている。第１の変形例
では、２つのサブフレーム信号６０３ａ及び６０３ｂが
順番に量子化される（先に最初のフレーム、次いで最終
フレーム）が、第２の変形例では、信号６０３ａ及び６
０３ｂが合同で量子化される。第１変形例の優位点は、
予測の基礎を先行フレームの最終サブフレームではなく
先行サブフレーム（即ち、最初のサブフレーム）とし得
ることから、最終サブフレームの予測がより有効である
ことにある。さらに、第１変形例は典型的に第２変形例
ほど複雑でなく、必要な係数記憶も少ない。第２変形例
の優位点は、合同量子化に２つのサブフレーム間の冗長
性をより良く活用する傾向があり、量子化歪みが低下
し、音声品質が向上することにある。

【００７０】ブロックＤＣＴ量子化器６０７の例は、米
国特許第５，２２６，０８４号（欧州特許出願第９２９
０２７７２．０号）に記述されている。この例では、先
行サブフレームに基づいて予測信号を演算し、次いでこ
の予測信号をスケーリング及び減算して差分信号を生成
することにより、信号６０３ａ及び６０３ｂが順次量子
化される。各サブフレームの差分信号は、次いで少数の
ブロック、典型的には１サブフレーム当たり６または８
ブロック、に分割され、各ブロック毎に離散的余弦変換
（ＤＣＴ）が演算される。各サブフレーム毎に、各ブロ
ックからの第１ＤＣＴ係数がＰＲＢＡベクトルの形成に
使用され、各ブロックの残りのＤＣＴ係数が、可変長の
ＨＯＣベクトルを形成する。ＰＲＢＡベクトル及びＨＯ
Ｃベクトルは、次いで、ベクトルまたはスカラー量子化
の何れかを使用して量子化される。出力ビットは、ブロ
ックＤＣＴ量子化器の出力６０８ａを形成する。

【００７１】ブロックＤＣＴ量子化器６０７のその他の
例は、１９９７年３月１４日に提出された「スペクトル
パラメータの多重サブフレーム量子化」と題する米国特
許出願第０８／８１８，１３０号に開示されている。こ
の例では、ブロックＤＣＴ量子化器が、両サブフレーム
からのスペクトルパラメータを合同で量子化する。ま
ず、各サブフレームの予測信号が、先行フレームの最終
サブフレームを基礎として演算される。この予測信号
は、縮小され（典型的な縮尺係数は０．６５または０．
８）、両信号６０３ａ、６０３ｂから減算される。結果
として得られた差分信号は、次いで複数のブロック（１
サブフレームにつき４ブロック）に分割され、各ブロッ
クがＤＣＴで処理される。各ブロックからの最初から２
つのＤＣＴ係数をさらなる２×２変換セット及び８点Ｄ
ＣＴへ送ることにより、各サブフレームの８要素ＰＲＢ
Ａベクトルが形成される。各ブロックの残りのＤＣＴ係
数は、サブフレーム毎に４ＨＯＣベクトルセットを形成
する。次に、現行フレームの２つのサブフレームからの
対応するＰＲＢＡベクトル及びＨＯＣベクトル間で、和
／差演算が実行される。結果的に得られた和／差成分は
ベクトル量子化され、ベクトル量子化器の結合された出
力はブロックＤＣＴ量子化器６０８ａの出力を形成す
る。

【００７２】さらなる例では、米国特許出願第０８／８
１８，１３０号に開示された合同サブフレーム方法は、
先行フレームの最終サブフレームからでなく、先行サブ
フレームから各サブフレームの予測信号を演算し、２つ
のサブフレームからのＰＲＢＡ及びＨＯＣベクトルの結
合に使用される和／差演算を省くことによって、連続サ
ブフレーム量子化器に転換可能である。ＰＲＢＡ及びＨ
ＯＣベクトルは、次いでベクトル量子化され、結果とし
て得られた両サブフレームのビット数が結合されてスペ
クトル量子化器８ａの出力を形成する。この方法は、よ
り効率的なブロック分割及びＤＣＴ演算と結合された、
より有効な予測戦略の使用を可能にする。しかしなが
ら、この場合は、合同量子化によって追加される効率か
ら利益は得られない。

【００７３】スペクトル量子化器６０８ａからの出力ビ
ットは、結合器６０９に於いて６０６から出力される量
子化されたゲインビット６０８ｂと結合され、その結
果、振幅量子化器の出力６１０が形成される。出力６１
０はまた、図２の振幅量子化器２３０の出力をも形成す
る。

【００７４】実施例についてもまた、ＡＭＢＥ（登録商
標）音声デコーダの文脈に於いて記述することができ
る。図７が示すように、デジタル化され符号化された音
声は、ＦＥＣデコーダ７１０によって処理が可能であ
る。フレームパラメータ逆量子化器７２０は、次いで、
本質的には上述の量子化工程の逆を行って、フレームパ
ラメータデータをサブフレームパラメータ７３０及び７
４０に変換する。サブフレームパラメータ７３０及び７
４０は、次いでＡＭＢＥ（登録商標）音声デコーダ７５
０に送られ、音声出力７６０に変換される。

【００７５】図８は、フレームパラメータ逆量子化器の
詳細図である。デバイダ８１０は、着信する符号化され
た音声信号を、基本周波数逆量子化器８２０と、有声化
逆量子化器８３０と、多重サブフレーム振幅逆量子化器
８４０とに分割する。こうした逆量子化器は、サブフレ
ームパラメータ８５０及び８６０を生成する。

【００７６】図９は、図３に示した量子化器を補足する
基本周波数逆量子化器８２０の一例を示している。基本
周波数量子化ビットはデバイダ９１０に供給され、デバ
イダ９１０は、同ビットを４ビット逆一様スカラー量子
化器９２０と、６ビット逆ベクトル量子化器９３０とに
供給する。スカラー量子化器の出力９４０は、加算器９
６０及び９６５を使用して、逆ベクトル量子化器の出力
９５０及び９５５と結合される。結果的な信号は、次い
で逆圧伸器９７０及び９７５を通り、サブフレーム基本
周波数パラメータｆｕｎｄ１及びｆｕｎｄ２を形成す
る。先に編入した参考文献に記述されているような、或
いは上述の量子化技術を補足するような他の逆量子化技
術の使用は可能である。他の実施例は、特許請求の範囲
の権利範囲内に存在する。

【表２】

【表３】

【表４】

【表５】

【表６】

【表７】

【表８】

【表９】

【表１０】

【表１１】

【表１２】

【図面の簡単な説明】

【図１】ＡＭＢＥ（登録商標）ボコーダシステムのブ
ロック図である。

【図２】合同パラメータ量子化器のブロック図であ
る。

【図３】基本周波数量子化器のブロック図である。

【図４】代替の基本周波数量子化器のブロック図であ
る。

【図５】有声化メトリクス量子化器のブロック図であ
る。

【図６】多重サブフレームスペクトル振幅量子化器の
ブロック図である。

【図７】ＡＭＢＥ（登録商標）デコーダシステムのブ
ロック図である。

【図８】合同パラメータ逆量子化器のブロック図であ
る。

【図９】基本周波数逆量子化器のブロック図である。

【符号の説明】

１１０…音声入力、１２０…ＡＭＢＥサブフレーム解
析器、１３０…サブフレーム１パラメータ、１４０
…サブフレーム２パラメータ、１５０…フレームパラ
メータ電子化器、１６０…ＦＥＣエンコーダ、２１
０…基本周波数量子化器、２２０…有声化電子化器、
２３０…多重サブフレーム振幅量子化器。

Claims

【特許請求の範囲】

【請求項１】音声を符号化してビットフレームにする
方法であって、音声信号をデジタル化してデジタル音声サンプル列にす
ることと、一群のデジタル音声サンプルに関して、多数の有声化メ
トリクスパラメータを含む有声化メトリクスパラメータ
セットを推定することと、有声化メトリクスパラメータを合同で量子化して、エン
コーダ有声化メトリクスビットセットを生成すること
と、ビットフレームにエンコーダ有声化メトリクスビットを
包含すること、を含む方法。
【請求項２】デジタル音声サンプルを、各サブフレー
ムが多数のデジタル音声サンプルを含むサブフレーム列
に分割することと、サブフレーム列からのサブフレームを１つのフレームに
対応するものとして指定すること、をさらに含み、デジタル音声サンプル群が上記フレームに対応するサブ
フレームに対応している請求項１記載の方法。
【請求項３】多数の有声化メトリクスパラメータの合
同量子化が、各多重サブフレームの少なくとも１つの有
声化メトリクスパラメータの合同量子化を含む請求項２
記載の方法。
【請求項４】多数の有声化メトリクスパラメータの合
同量子化が、単一サブフレームの多数の有声化メトリク
スパラメータの合同量子化を含む請求項２記載の方法。
【請求項５】合同量子化が、有声化メトリクス残余パラメータを、音声エラーベクト
ルと音声エネルギーベクトルとの変換比として演算する
ことと、有声化メトリクス残余パラメータを結合することと、結合された残余パラメータを量子化すること、を含む請
求項１記載の方法。
【請求項６】上記残余パラメータの結合が、残余パラ
メータに対して線形変換を実行し各サブフレームの変換
残余係数セットを生成することを含む請求項５記載の方
法。
【請求項７】結合された残余パラメータの量子化が、
少なくとも１つのベクトル量子化器を使用することを含
む請求項５記載の方法。
【請求項８】ビットフレームが、少なくともエンコー
ダ有声化メトリクスビットの幾つかを保護する冗長エラ
ー制御ビットを含む請求項１記載の方法。
【請求項９】有声化メトリクスパラメータが、多帯域
励起（ＭＢＥ）音声モデルのために推定された有声化状
態を表す請求項１記載の方法。
【請求項１０】有声化メトリクスパラメータ以外の追
加的な音声モデルパラメータを量子化することによって
追加エンコーダビットを生成することと、追加エンコー
ダビットをフレームビット内に包含すること、をさらに
含む請求項１記載の方法。
【請求項１１】追加音声モデルパラメータが、スペク
トル振幅を表すパラメータを含む請求項１０記載の方
法。
【請求項１２】追加音声モデルパラメータが、基本周
波数を表すパラメータを含む請求項１０記載の方法。
【請求項１３】追加音声モデルパラメータが、スペク
トル振幅を表すパラメータを含む請求項１２記載の方
法。
【請求項１４】音声を符号化してビットフレームにす
る方法であって、音声信号をデジタル化してデジタル音声サンプル列にす
ることと、デジタル音声サンプルを、各サブフレームが多数のデジ
タル音声サンプルを含むサブフレーム列に分割すること
と、各サブフレームの基本周波数パラメータを推定すること
と、サブフレーム列からのサブフレームをフレームに対応す
るものとして指定することと、フレームのサブフレームから基本周波数パラメータを合
同的に量子化してエンコーダ基本周波数ビットセットを
生成することと、エンコーダ基本周波数ビットをビットフレーム内に包含
すること、を含む方法。
【請求項１５】合同量子化が、基本周波数残余パラメータを基本周波数パラメータの変
換された平均値と各基本周波数パラメータとの差として
演算することと、フレームのサブフレームから残余基本周波数パラメータ
を結合することと、結合された残余パラメータを量子化すること、を含む請
求項１４記載の方法。
【請求項１６】フレームのサブフレームからの残余パ
ラメータの結合が、残余パラメータに対して線形変換を
実行し、各サブフレームの変換残余係数セットを生成す
ることを含む請求項１５記載の方法。
【請求項１７】基本周波数パラメータが、多帯域励起
（ＭＢＥ）音声モデルのために推定された基本周波数の
対数を表す請求項１４記載の方法。
【請求項１８】基本周波数パラメータ以外の追加的な
音声モデルパラメータの量子化によって追加エンコーダ
ビットを生成することと、追加エンコーダビットをビッ
トフレーム内に包含すること、をさらに含む請求項１４
記載の方法。
【請求項１９】追加音声モデルパラメータが、スペク
トル振幅を表すパラメータを含む請求項１８記載の方
法。
【請求項２０】音声を符号化してビットフレームにす
る方法であって、音声信号をデジタル化してデジタル音声サンプル列にす
ることと、デジタル音声サンプルを、各サブフレームが多数のデジ
タル音声サンプルを含むサブフレーム列に分割すること
と、各サブフレームの基本周波数パラメータを推定すること
と、サブフレーム列からのサブフレームをフレームに対応す
るものとして指定することと、フレームの１サブフレームからの基本周波数パラメータ
を量子化することと、フレームの１サブフレームからの量子化された基本周波
数パラメータを使用してフレームの他のサブフレームの
基本周波数パラメータを補間することと、量子化された基本周波数パラメータと補間された基本周
波数パラメータを結合させてエンコーダ基本周波数ビッ
トセットを生成することと、エンコーダ基本周波数ビットをビットフレーム内に包含
すること、を含む方法。
【請求項２１】音声を符号化してビットフレームにす
る音声エンコーダであって、音声信号をデジタル化してデジタル音声サンプル列にす
るための手段と、一群のデジタル音声サンプルに関して、多数の有声化メ
トリクスパラメータを含む有声化メトリクスパラメータ
セットを推定するための手段と、有声化メトリクスパラメータを合同で量子化してエンコ
ーダ有声化メトリクスビットセットを生成するための手
段と、エンコーダ有声化メトリクスビットを含むビットフレー
ムを形成するための手段と、を備えたエンコーダ。
【請求項２２】デジタル音声サンプルを、各サブフレ
ームが多数のデジタル音声サンプルを含むサブフレーム
列に分割するための手段と、サブフレーム列からサブフレームを１つのフレームに対
応するものとして指定するための手段と、をさらに備
え、デジタル音声サンプル群がフレームに対応するサブフレ
ームに一致する請求項２１記載の音声エンコーダ。
【請求項２３】多数の有声化メトリクスパラメータを
合同で量子化するための手段が、各多重サブフレームの
少なくとも１つの有声化メトリクスパラメータを合同で
量子化する請求項２２記載の音声エンコーダ。
【請求項２４】多数の有声化メトリクスパラメータを
合同で量子化するための手段が、単一サブフレームの多
数の有声化メトリクスパラメータを合同で量子化する請
求項２２記載の音声エンコーダ。
【請求項２５】音声信号をデジタル化してデジタル音
声サンプル列にすることと、一群のデジタル音声サンプ
ルに関して、多数の有声化メトリクスパラメータを含む
有声化メトリクスパラメータセットを推定することと、
有声化メトリクスパラメータを合同で量子化して、エン
コーダ有声化メトリクスビットセットを生成すること
と、ビットフレームにエンコーダ有声化メトリクスビッ
トを包含すること、によって符号化されているビットフ
レームから音声を復号する方法であって、ビットフレームからデコーダ有声化メトリクスビットを
抽出することと、デコーダ有声化メトリクスビットを使用して有声化メト
リクスパラメータを合同で再構成することと、再構成された有声化メトリクスパラメータの幾つかまた
は全てを包含する音声モデルパラメータを使用してデジ
タル音声サンプルを合成すること、を含む方法。
【請求項２６】合同再構成が、デコーダ有声化メトリクスビットを逆量子化してフレー
ムの結合された残余パラメータセットを再構成すること
と、結合された残余パラメータから各サブフレームの個別残
余パラメータを演算することと、有声化メトリクスビットから有声化メトリク
スパラメータを形成すること、を含む請求項２５記載の
音声復号方法。
【請求項２７】各サブフレームの個別残余パラメータ
の演算が、フレームの結合された残余パラメータから、フレームの
有声化メトリクス残余パラメータを分離することと、フレームの有声化メトリクス残余パラメータに対して逆
変換を実行し、フレームの各サブフレームの個別残余パ
ラメータを生成すること、を含む請求項２６記載の方
法。
【請求項２８】音声信号をデジタル化してデジタル音
声サンプル列にすることと、一群のデジタル音声サンプ
ルに関して、多数の有声化メトリクスパラメータを含む
有声化メトリクスパラメータセットを推定することと、
有声化メトリクスパラメータを合同で量子化して、エン
コーダ有声化メトリクスビットセットを生成すること
と、ビットフレームにエンコーダ有声化メトリクスビッ
トを包含すること、によって符号化されているビットフ
レームから音声を復号するためのデコーダであって、ビットフレームからデコーダ有声化メトリクスビットを
抽出するための手段と、デコーダ有声化メトリクスビットを使用して有声化メト
リクスパラメータを合同で再構成するための手段と、再構成された有声化メトリクスパラメータの幾つかまた
は全てを包含する音声モデルパラメータを使用してデジ
タル音声サンプルを合成するための手段と、を備えたデ
コーダ。
【請求項２９】プロセッサ読み取り可能な媒体上のソ
フトウェアであって、一群のデジタル音声サンプルに関して多数の有声化メト
リクスパラメータを含む有声化メトリクスパラメータセ
ットを推定する作業と、有声化メトリクスパラメータを合同で量子化してエンコ
ーダ有声化メトリクスビットセットを生成する作業と、エンコーダ有声化メトリクスビットを含むビットフレー
ムを形成する作業とをプロセッサに実行させるための指
示を含むソフトウェア。
【請求項３０】プロセッサ読み取り可能な媒体が、プ
ロセッサを含むデジタル信号処理チップに付随するメモ
リを備えた請求項２９記載のソフトウェア。
【請求項３１】通信システムであって、音声信号をデジタル化してデジタル音声サンプル列に
し、一群のデジタル音声サンプルに関して多数の有声化メト
リクスパラメータを含む有声化メトリクスパラメータセ
ットを推定し、有声化メトリクスパラメータを合同で量子化してエンコ
ーダ有声化メトリクスビットセットを生成し、エンコーダ有声化メトリクスビットを含むビットフレー
ムを形成し、ビットフレームを送信するように構築された送信機と、ビットフレームを受信、処理して音声信号を生成するよ
うに構築された受信機と、を備えた通信システム。