JPH04502675A

JPH04502675A - 改良されたロングターム予測器を有するデジタル音声コーダ

Info

Publication number: JPH04502675A
Application number: JP2509641A
Authority: JP
Inventors: ジャーソン・イラ　アラン; ジャシウク・マーク　エイ
Original assignee: モトローラ・インコーポレーテッド
Priority date: 1989-09-01
Filing date: 1990-06-25
Publication date: 1992-05-14
Anticipated expiration: 2017-03-25
Also published as: EP0450064B1; MX167644B; CA2037899A1; CA2037899C; CN1050633A; DE69033510T2; WO1991003790A1; DK0450064T3; EP0450064A4; SG47028A1; AU634795B2; ATE191987T1; DE69033510D1; EP0450064A1; AU5952590A; DE69033510T3; ES2145737T3; DK0450064T4; EP0450064B2; ES2145737T5

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】改良されたロングターム予測器を有するデジタル音声フード発明の背景この発明は、１９８８年６月２８日に出願され今は放棄されている、米国出願番号第０７／２１２，４５５号の一部継続出願である、１９８９年９月１日に出願されかつ今は放棄されている、米国出願番号第０７／４０２．２０６号の継続出願である。

コード励起リニア予測（ｃｏｄｅ−ｅｘｃ　ｉ　ｔ　ｅｄｌｉｎｅａｒ　ｐｒｅｄｉｃｔｉｏｎ：ＣＥＬＰ）は低いビットレート、すなわち、４．８〜９．６キロビツト／秒（Ｋｂｐｓ）における高品質の合成音声を生成できる可能性を有する音声コーディング技術である。このクラスの音声符号化は、またベクトル励起リニア予測または推計符号化（ｓｔｏｃｈａｓｔｉｃ　ｃｏｄｉｎｇ）として知られているが、数多くの音声通信および音声合成の用途に最もよく用いられる。

ＣＥＬＰは音声品質、データレート、大きさおよびコストが重要な要素であるデジタル音声暗号化およびデジタル無線電話通信システムに特に適用可能であることが分っている。

［符号励起（ｃｏｄｅ−ｅｘｃ　ｉ　ｔ　ｅｄ）Ｊまたはベクトル励起（ｖｅｃｔｏｒ−ｅｘｃｉｔｅｄ）Ｊという用語は音声フードのための励起シーケンスがベクトル量子化されている、すなわち単一のコード語（ｃｏｄｅｗｏｒｄ）が励起サンプルのシーケンス、ベクトルを表すのに用いられるという事実からきている。このようにして、毎サンプルにつき１ビツトより小さなデータレートが励起シーケンスを符号化するために可能となる。記憶された励起符号ベクトルは一般に独立のランダムなホワイトガウスシーケンスからなる。フードブックからの１つのコードベクトルはＮ個の励起サンプルの各ブロックを表すのに用いられる。

各々の記憶されたコードベクトルはコード語、すなわちコードベクトルメモリのロケーションのアドレスによって表される。受信機において音声フレームを再構成するために通信チャネルを介して音声シンセサイザに引き続き送られるのはこのコード語である。エム・アール・シュローダおよびビー・ニス・アタルによる、「コード励起リニア予測（ＣＥＬＰ）、非常に低いビットレートにおける高品質音声」、音響に関するＩ　ＥＥＥ国際会議紀要、音声および信号処理（ＩＣＡＳＳＰ）、第３巻、ＰＰ、９３７−４０．１９８５年３月、をＣＥＬＰのより詳細な説明のために参照。

ＣＥＬＰ音声コーダにおいては、コードブックからの励起コードベクトルは入力音声信号の特性を作る２個の時間変動リニアフィルタに印加される。第１のフィルタはそのフィードバックループにロングターム予測器を含み、これは有声音（ｖｏｊｃｅｄ　５ｐｅｅｃｈ）のピッチの周期性を導入するために使用される、長い遅延、すなわち、２〜１５ミリセカンドを有している。第２のフィルタはそのフィードバックループにショートターム予測器を含み、これはスペクトル的なエンベロープまたはフォーマット構造を導入するために使用される、短い遅延、すなわち、２ミリセカンドより短い遅延、を有している。音声の各フレームに対して、音声コーグはそれぞれの個々のコードベクトルをフィルタに印加して再構成された音声信号を発生し、元の入力音声信号を該再構成された信号と比較してエラー信号を発生する。このエラー信号は次に人間の聴覚に基づく応答を有する重み付はフィルタを通すことにより重み付けされる。最適の励起信号は現在のフレームに対して最小のエネルギを有する重み付はエラー信号を生成するコードベクトルを選択することにより決定される。最適のコードベクトルに対するコード語は次に通信チャネルによって送信される。

ＣＥＬＰ音声合成器においては、チャネルから受信されたコード語は励起ベクトルのコードブックをアドレスするために使用される。単一のコードベクトルは次にゲインファクタによって乗算され、ロングタームおよびショートタームフィルタによってろ波され再構成された音声ベクトルを得る。ゲインファクタおよび予測器パラメータはまた該チャネルから得られる。より良好な品質の合成信号は合成器によって使用される実際のパラメータが解析段において使用され、従って量子化誤差を最小化することにより発生できることが分っている。従って、より高い品質の音声を生成するためにＣＥＬＰ音声解析段においてこれらの合成パラメータを使用することはアナリシス・パイ・シンセシス音声コーディングと称されている。

ショートターム予測器は次の式に従って、直前の出力サンプル５（ｎ−ｉ）のリニアな組み合わせにより現在の出力サンプルｓ　（ｎ）を予測しようと試みる。

ｓ　（ｎ）　＝ａ　ｓ　（ｎ−１）　＋ａ２ｓ　（ｎ−２）＋・・・＋α　ｓ　（ｎ−ｐ）　＋ｅ　（ｎ）この式で、ｐはショートターム予測器の次数（ｏｒｄｅｒ）であり、ｅ　（ｎ）は予測残差（ｐｒｅｄｉｃｔ、１ｏｎｒｅｓｉｄｕａｌ）、すなわち、ｐ個の先のサンプルの重み付けされた和によって表すことのできないｓ　（ｎ）の部分、である。予測器の次数ｐは典型的には、８キロヘルツ（ＫＨｚ）のサンプリングレートを仮定すると、８〜１２の範囲にわたっている。この式における重みＣ１，Ｃ２゜α　は予測器係数と呼ばれている。ショートターム予測器係数は伝統的なリニア予測コーディング（Ｌ　Ｐ　Ｇ）技術を用いて音声信号から決定される。ショートタームフィルタの出力応答は２変換表現で次のように表される。

Ａ　（ｚ）　−−−一−−−−−−−−−−−−−−−ショートタームフィルタパラメータのその他の説明に関しては、「低ビツトレートにおける音声の予測的コーディング」と題する、Ｉ　ＥＥＥ紀要、通信、Ｃ０Ｍ−３０、ｐｐ、６００ −１４．１９８２年４月、ビー・ニス・アタルによる論文を参照。

これに対し、ロングタームフィルタはずっと長い期間にわたり延在する先行サンプルから次の出力サンプルを予測しなければならない。予測器において単一の過去のサンプルのみが使用されれば、予測器は単一タップ予測器である。

典型的には、１〜３タツプが使用される。単一タップ、ロングターム予測器を導入したロングタームフィルタのための出力応答はＺ変換表示で次のように与えられる。

Ｂ　（ｚ）　＝−−−−−−−−−−−−−−−−１−βｚ−Ｌこの出力応答はフィルタの遅延またはラグＬおよびフィルタ係数βのみの関数であることに注意を要する。有声音に対しては、ラグＬは典型的には音声のピッチ期間、あるいはその倍数である。８ＫＨｚのサンプリングレートにおいては、ラグＬの適切な範囲は１６と１４３の間であり、これは５００Ｈｚから５６Ｈｚの間のピッチレンジに対応する。

ロングターム予測器のラグＬおよびロングターム予測器の係数βは開ループまたは閉ループ構成のいずれかから決定できる。開ループ構成を用いると、ラグＬおよび係数βは入力信号（またはその残差）から直接計算される。閉ループ構成では、ラグＬ１および係数βはロングタームフィルタの過去の出力を表す符号化データおよび入力音声信号からフレームレートで計算される。符号化データを使用する場合における、ロングターム予測器のラグ決定は合成器において存在する実際のロングタームフィルタの状態に基づいている。従って、閉ループ構成が開ループ方法よりもより良好な性能を与えるが、それはピッチフィルタそれ自体がエラー信号の最適化に貢献するからである。さらに、単一タップの予測器は閉ループ構成で非常に良好に作動する。

閉ループ構成を使用すると、ロングタームフィルタの出力応答ｂ　（ｎ）はロングタームフィルタからの過去の出力サンプルのみから、かつ次の式による現在の入力音声サンプルｓ　（ｎ）から決定される。

ｂ　（ｎ）　＝ｓ　（ｎ）＋βｂ（ｎ−Ｌ）この技術はフレーム長Ｎより大きなピッチラグしに対し、すなわち、ＬＡＮの場合に、直接的であるが、それは項ｂ（ｎ−Ｌ）は常にすべてのサンプル番号ｎ、Ｏ≦ｎ≦Ｎ−１に対し過去のサンプルを表すからである。さらに、Ｌ〉Ｎの場合、励起ゲインファクタγおよびロングターム予測器係数βはラグＬおよびコード語ｉの与えられた値に対し同時に最適化することができる。この組み合わされた最適化技術は音声品質の注目すべき改善をもたらすことが発見されている。

しかしながら、もしロングターム予測器のフレーム長Ｎより小さなラグＬを収容しなければならない場合には、閉ループ手法は不都合である。この問題は高いピッチの女性の声の場合に容易に起こり得る。たとえば２５０Ｈｚのピッチ周波数に対応する女性の音声は４ミリセカンド（ｍｓｅｃ）に等しいロングターム予測器ラグＬを必要とする。

８ＫＨｚのサンプリングレートにおける２５０Ｈｚのピッチは３２サンプルのロングターム予測器のラグＬに対応する。しかしながら、４ミリセカンドより小さなフレーム長Ｎを用いることは望ましくなく、これはＣＥＬＰ励起ベクトルはより長いフレーム長が用いられる場合により効率的に符号化できるからである。従って、８ＫＨｚのサンプリングレートにおける７、５ミリセカンドのフレーム長時間を用いると、フレーム長Ｎは６０サンプルに等しくなるであろう。これはフレームの次の６０サンプルを予測するために３２の過去のサンプルのみが利用できることを意味する。従って、もしロングターム予測器のラグＬがフレーム長Ｎより小さければ、必要とされるＮサンプルの内のＬの過去のサンプルのみが規定される。

フレーム長Ｎより小さなピッチラグＬの問題に対処するため従来技術においていくつかの別の手法がとられている。

ロングターム予測器のラグＬおよび係数βを組み合わせて最適化する試みにおいて、第１の手法はなんらの励起信号も存在しないと仮定して方程式を直接解くよう試みることである。この手法は「規則的なパルス励起−音声の有効かつ効率的な多重パルス符号化」、クルーン他、音響、音声および信号処理に関するＩ　ＥＥＥ紀要、ＡＳＳＰ−３４巻、第５号、１９８６年１０月、ｐｐ、１０５４−１０６３の論文に説明されている。しかしながら、この手法に従うと、単一のパラメータβにおける非線形方程式を解かなければならない。βにおける２次方程式または３次方程式の解を解かなければならない。βにおける２次方程式または３次方程式の解は計算機的に実際的でない。その上、利得ファクタγと係数βとを一緒にして最適化することはこの手法では依然として不可能である。

ロングターム予測器遅延りをフレーム長Ｎより大きいものと限定することによる、第２の解法は、シングハルおよびアタルにより提案された論文「低いビットレートにおける多重パルスＬＰＧコーダの性能の改善Ｊ１音響、音声、および信号処理に関するＩ　ＥＥＥ国際会議の紀要、第１巻、１９８４年３月１９−２１日、ｐｐ、１．３．　１−１．３゜４において提案されている。ピッチラグしに対するこの人工的な制約はしばしばピッチ情報を正確に表さない。従って、この手法を用いると音声品質が高いピッチの音声に対し劣化する。

第３の解法はフレーム長Ｎの大きさを低減することである。より短いフレーム長により、ロングターム予測器のラグＬは常に過去のサンプルから決定することができる。しかしながら、この手法は厳しいビットレートのペナルティを被る。より短いフレーム長では、より大きな数のロングターム予測器パラメータおよび励起ベクトルを符号化しなければならず、かつ従ってチャネルのビットレートは余分のコーディングを収容するためにより大きくなければならない。

第２の問題は高いピッチの話者に対して存在する。コーグにおいて使用されるサンプリングレートは単一タップのピッチ予測器の性能に対し上限を設ける。たとえば、もしピッチ周波数が実際には４８５Ｈｚであれば、最も近いラグ値は１６でありこれは５００Ｈｚに対応する。これは音声品質を劣化させる基本ピッチ周波数に対し１５Ｈｚのエラーを生ずる結果となる。このエラーは該ピッチ周波数の高調波に対し増倍されさらに劣化を引き起こす。

従って、ロングターム予測器のラグＬを決定するための改良された方法を提供する必要性が存在する。最適の解法は高いピッチの音声のコーディングに対し計算機的な複雑性および音声品質の双方に向けられなければならない。

発明の概要従って、本発明の一般的な目的は、低いビットレートにおいて高い品質の音声を生成する改良されたデジタル音声コーディング技術を提供することにある。

本発明のより特定的な目的は、閉ループ手法を用いたロングターム予測器のパラメータを決定するための方法を提供することにある。

本発明の他の目的は、ロングターム予測器のラグパラメータＬが非整数である場合にロングターム予測器の出力応答を決定するための改良された方法を提供することにある。

本発明のさらに他の目的は、最適の励起コードベクトルのためのコードブックサーチの間に利得ファクタγおよびロングターム予測器係数βの組み合わされた最適化を許容する改良されたＣＥＬＰ音声コーダを提供することにある。

本発明の新規な見地によれば、パラメータＬの分解能（ｒｅｓｏｌｕｔｉｏｎ）はＬが整数でない値をとることを許容することにより増大される。これはロングターム予測器の状態の補間されたサンプルを提供するために補間フィルタを使用することにより達成される。閉ループ構成においては、ロングターム予測器の状態の将来のサンプルは補間フィルタにとって利用できない。この問題はロングターム予測器の状態を補間フィルタによる使用のために将来にわたってピッチ同期的に延長することにより回避される。

次のフレームに対する実際の励起サンプルが利用できるようになると、ロングターム予測器の状態が（ピッチ同期的に延長されたサンプルに基づくものに置き代わる）実際の励起サンプルを反映するために更新される。たとえば、補間は各々の存在するサンプルの間の１つのサンプルを補間するために使用でき従ってＬの分解能をサンプルの半分に倍加する。３または４のような、より高い補間ファクタもまた選択でき、これはＬの分解能を１つのサンプルの３分の１または４分の１に増加するであろう。

図面の簡単な説明新規であると信じられる本発明の特徴は特に添付の請求の範囲に記載されている。本発明は、そのさらに他の目的および利点とともに、添付の図面を取り入れて以下の説明を参照することにより最もよく理解でき、そのいくつかの図面においては同様の参照数字は同様の要素を表わし、かつ各図面において、第１図は、本発明とともに使用するためのロングタームフィルタの位置を示す、コード励起リニア予測音声コーグの一般的なブロック図であり、第２Ａ図は、第１図のロングタームフィルタの１実施例を示す詳細なブロック図であり、フィルタのラグＬが整数である場合のロングターム予測器の応答を示しており、第２Ｂ図は、第２Ａ図におけるロングターム予測器の動作を説明するために用いることができるシフトレジスタを示す概略図であり、第２Ｃ図は、第１図のロングタームフィルタの他の実施例を示す詳細なブロック図であり、フィルタのラグＬが整数である場合のロングターム予測器の応答を示しており、第３図は、第２Ａ図のロングタームフィルタにより達成される動作を説明する詳細なフローチャートであり、第４図は、本発明に従って使用するための音声合成器の一般的なブロック図であり、第５図は、第１図のロングタームフィルタの詳細なブロック図であり、本発明に従いサブサンプルの分解能のロングターム予測器応答を示しており、第６Ａ図および第６Ｂ図は、第５図のロングタームフィルタにより行われる動作を説明する詳細なフローチャートであり、そして第７図は、第４図における音声合成器のショートタームフィルタおよびＤ／Ａコンバータを相互結合するためのピッチポストフィルタを示す詳細なブロック図である。

好ましい実施例の詳細な説明次に第１図を参照すると、本発明に係わるロングタームフィルタを利用するコード励起リニア予測音声コーグ１００の一般的なブロック図が示されている。分析されるべき音響入力信号はマイクロホン１０２において音声コーグ１００に印加される。典型的には音声信号である、入力信号は次にフィルタ１０４に印加される。フィルタ１０４は一般的にはバンドパスフィルタ特性を示す。しかしながら、もし音声の帯域幅がすでに適切であれば、フィルタ１０４は直接的なワイヤ接続であってもよい。

フィルタ１０４からのアナログ音声信号は次に−続きのＮパルスのサンプルに変換され、かつ各パルスサンプルの振幅は次に、技術上知られているように、アナログ−デジタル（Ａ／Ｄ）コンバータ１０８においてデジタル符号により表される。サンプリングレートはサンプルクロックＳＣにより決定され、これは好ましい実施例においては８゜０ｋＨｚのレートを呈する。サンプルクロックＳＣはクロック１１２によってフレームクロックＦＣとともに発生される。

Ａ／Ｄ　１０８のデジタル出力は、入力音声ベクトル５（ｎ）として表されるが、次に係数アナライザ１１０に印加される。この入力音声ベクトルｓ　（ｎ）は別々のフレーム、すなわち、その長さがフレームクロックＦＣによって決定される、時間のブロック、において反復的に得られる。

好ましい実施例においては、入力音声ベクトルｓ　（ｎ）、０≦ｎ≦Ｎ−１、はＮ＝６０サンプルを含む７．５ミリセカンドのフレームを表し、この場合者サンプルはデジタルコードの１２〜１６ビツトによって表される。この実施例においては、音声の各ブロックに際し、−組のリニア予測コーディング（Ｌ　Ｐ　Ｇ）パラメータがオープンループ構成の係数アナライザー１０によって生成される。

ショトターム予測器パラメータα０、ロングターム予測器係数β、公称ロングターム予測器うグパラメータＬ１重み付はフィルタパラメータＷＦＰ、および励起利得ファクタγ（後に説明する最善の励起コード語Ｉとともに）はマルチプレクサ１５０に印加されかつ音声合成器による使用のためチャネルによって送られる。この実施例のためにこれらのパラメータを発生する代表的な方法については、ビー・ニス・アタルによる、１９８２年４月、ｐｐ、６００−１４、Ｃ０Ｍ−３０巻、Ｉ　ＥＥＥ通信紀要、［低いビットレートにおける音声の予測コーディング」と題する論文を参照。入力音声ベクトルｓ　（ｎ）はまた減算器１３０にも印加され、その機能は後に説明する。

コードブックＲＯＭＩ２０は一組のＭ個の励起ベクトルｕ、（ｎ）を含み、ここで１≦ｉ≦Ｍであり、各々Ｎ個のサンプルから成り、この場合０≦ｎ≦Ｎ−１である。コードブツクＲＯＭ１２０は好ましくはここに参照のため導入される、米国特許第４，８１７．１５７号に述べられたようにして実施される。コードブックＲＯＭ１２０は一組の励起コード語ｉの内の特定の１つに応じてこれらの擬似ランダム励起ベクトルを発生する。Ｍ個の励起ベクトルの各々は−続きのランダムなホワイトガウスサンプルから成るが、他の形式の励起ベクトルも本発明とともに使用することができる。もし励起信号が６０サンプルの各々に対しサンプルごとに０．　２ビツトのレートで符号化されたならば、可能な励起ベクトルに対応する４０９６のコード語ｉがある。

各々の個々の励起ベクトルｕ、（ｎ）に対し、再構成された音声ベクトルｓ’　、（ｎ）が入力音声ベクトルｓ　（ｎ）に対する比較のために発生される。利得ブロック１２２には、フレームに対する内容である、励起利得ファクタγにより励起ベクトルｕ、（ｎ）を尺度変更（ｓｃａｌｅ）する。励起利得ファクタγは係数アナライザー１０によってあらかじめ計算されかつ第１図に示されるようにすべての励起ベクトルを解析するために使用され、あるいは最善の励起コード語ｒのサーチと組み合わせて最適化されかっコードブックサーチコントローラー４０により発生される。

尺度変更された励起信号γｕ−（ｎ）は次に再構成された音声ベクトルｓ’　、（ｎ）を発生するためにロングタームフィルター２４およびショートタームフィルタ１２６によりろ波される。フィルター２４は音声の周期性を導入するためにロングターム予測器パラメータβおよびＬを利用し、かつフィルタ１２６は上に述べたように、スペクトル的なエンベロープを導入するためにショートターム予測器パラメータα１を利用する。ロングタームフィルター２４は以下の図面において詳細に説明する。ブロック１２４および１２６は実際にはそれぞれのフィードバック経路にロングターム予測器およびショートターム予測器を含む再帰（ｒｅｃｕｒｓｉｖｅ）フィルタである。

ｉ番目の励起コードベクトルに対する再構成された音声ベクトルｓ’　−（ｎ）は入力音声ベクトルｓ　（ｎ）の同じブロックとこれら２つの信号を減算器１３０において減算することにより比較される。差分ベクトルｅ、（ｎ）は音声の元のおよび再構成されたブロックの間の差を表す。差分ベクトルは係数アナライザー１０によって発生される重み付はフィルタのパラメータＷＴＰを利用して、重み付はフィルター３２により知覚的に重み付けされる。代表的な重み付はフィルタの伝達関数に対する先の参照物を参照されたい。知覚的な重み付けはエラーが知覚的に人間の耳にとってより重要な周波数を強調し、かつ他の周波数を減衰させる。

エネルギ計算機１３４は重み付は差分ベクトルｅ／　。

（ｎ）のエネルギを計算し、かつこのエラー信号Ｅ、をコードブックサーチコントローラー４０に印加する。該サーチコントローラは現在の励起ベクトルｕ、（ｎ）に対するｉ番目のエラー信号を先のエラー信号に対して比較し最小のエラーを生成する励起ベクトルを決定する。最小のエラーを有するｉ番目の励起ベクトルのコードは次にチャネルによって最善の励起コードＩとして出力される。あるいは、サーチコントローラー４０は、あらかじめ規定されたエラーしきい値に合致するような、何等かの所定の基準を有するエラー信号を提供する特定のコード語を決定することができる。

第１図は、コード励起リニア予測音声コーグに対する本発明の１実施例を示す。

この実施例においては、ロングタームフィルタのパラメータＬおよびβは係数アナライザー１０によってオープンループ構成で決定される。あるいは、ロングタームフィルタのパラメータは先に述べたシングハルおよびアタルの参照文献に述べられているように閉ループ構成で決定することができる。一般に、音声コーグの性能は閉ループ構成で決定されるロングタームフィルタのパラメータを使用することにより改善される。本発明に係わるロングターム予測器の新規な構造はフレーム長Ｎより小さなラグＬに対するこれらのパラメータの閉ループ決定の使用に大いに便宜を与える。

第２Ａ図は、第１図のロングタームフィルター２４の１実施例を示し、この場合しは整数に限定されている。第１図は尺度変更された励起ベクトルγｕ−（ｎ）が利得プロツク１２２からロングタームフィルター２４へ入力されるものとして示されているが、第２Ａ図においては説明の目的で代表的な入力音声ベクトルｓ　（ｎ）が使用されている。

従って、入力音声ベクトルｓ　（ｎ）のＮ個のサンプルのフレームが加算器２１０に印加される。加算器２１０の出力はロングタームフィルター２４のための出力ベクトルｂ（ｎ）を生成する。出力ベクトルｂ　（ｎ）はロングターム予測器の遅延ブロック２３０にフィードバックされる。公称ロングターム予測器ラグパラメータＬもまた遅延ブロック２３０に入力される。ロングターム予測器遅延ブロックは出力ベクトルｑ　（ｎ）をロングターム予測器の乗算器ブロック２２０に提供し、これはロングターム予測器の係数βによりロングターム予測器の応答を尺度変更する。尺度変更された出力βｑ　（ｎ）は次に再帰フィルタのフィードバックループを完成させるために加算器２１０に印加される。

ロングタームフィルター２４の出力応答Ｈ（ｚ）はＺ変換表示で次のように定義される。

この場合、ｎはＮ個のサンプルを含むフレームのサンプル数を表し、０≦ｎ≦Ｎ −１であり、βはフィルタ係数を表し、Ｌはロングターム予測器の公称ラグまたは遅延を表かまたは等しい最も近い整数を表す。ロングターム予測器の遅延　１（ｎ、＋Ｌ）　／ＬＪ　Ｌはサンプル数ｎの関数として変化する。従って、本発明によれば、実際のロングターム予測器の遅延はｋＬになり、この場合りは基本的なまたは公称のロングターム予測器のラグであり、かっｋはサンプル数ｎの関数として組み（１，２，３，４，、、ｉから選択された整数である。従って、ロングタームフィルタの出力応答ｂ　（ｎ）は公称ロングターム予測器のラグパラメータＬおよびフレームの始めに存在するフィルタ状態ＦＳの関数である。このステートメントはピッチラグＬがフレーム長Ｎより小さい問題の場合に対してさえ、Ｌのすべての値に対して当−Ｃはまる。

ロングターム予測器の遅延ブロック２３０の機能は将来のサンプルを予測するために現在の入力サンプルを記憶するこ、とである。第２Ｂ図は、シフトレジスタの単純化した図であり、これは第２Ａ図のロングターム予測器遅延ブロック２３０の動作を理解する上で有用であろう。ｎ＝１（エル）のようなサンプル数１　（エル）に対し、現在の出力サンプルｂ　（ｎ）がシフトレジスタの入力に印加され、これは第２Ｂ図の右側に示されている。次のサンプルｎ＝１＋１に対しては、先のサンプルｂ　（ｎ）は左にシフトレジスタの中にシフトされる。このサンプルは今や最初の過去のサンプルｂ（ｎ−１）となる。次のサンプルｎ＝１＋２に対しては、ｂ　（ｎ）の他のサンプルがレジスタ中にシ多　フトされ、かつ元のサンプルが再び左にシフトされて第２の過去のサンプルｂ（ｎ−２）になる。Ｌ個のサンプルがシフトされた後、元のサンプルはＬの回数圧にシフトされており従ってそれはｂ　（ｎ−Ｌ）として表すことができる。

上に述べたように、ラグＬは典型的には有声音のピッチ期間またはその倍数であろう。もしラグＬが少なくともフ；　レーム長Ｎと同じぐらい長ければ、十分な数の過去のサンプルが音声の次のフレームを予測するためにシフト入力されかつ記憶されている。Ｌ＝Ｎかつｎ＝Ｎ−１の極端な場合でも、ｂ（ｎ−Ｌ）はｂ（ −１）であり、これは真に過去のサンプルである。従って、サンプルｂ（ｎ−Ｌ）は出力サンプルｑ　（ｎ）としてシフトレジスタから出力されるであろう。

しかしながら、もしロングターム予測器のラグパラメータＬがフレーム長Ｎより短ければ、不十分な数のサンプルが次のフレームの開始までにシフトレジスタ中にシフト入力される。２５０Ｈｚのピッチ期間の上の例を用いると、ピッチラグＬは３２に等しくなる。従って、Ｌ＝３２かっＮ＝６０の場合、かつに＝Ｎ−１＝５９の場合、ｂ（ｎ−Ｌ）は通常ｂ（２７）となり、これは６０サンプルのフルームの始めに関して将来のサンプルを表す。言い換えれば、完全なロングターム予測器応答を提供するためには不十分な過去のサンプルが格納されていることになる。予測器パラメータの閉ループ解析が達成できるようにフレームの始めにおいて完全なロングターム予測器の応答が必要である。

その場合本発明によれば、同じ記憶されたサンプルｂ（ｎ−Ｌ）、Ｏ≦ｎ≦Ｌ１が繰り返されそれによりロングターム予測器の出力応答は常に現在のフレームの開始に先立ちロングターム予測器の遅延ブロックに入力されたサンプルの関数である。第２Ｂ図に関しては、ロングターム予測器の遅延ブロック２３０の構造を変更することを示す、他のｋＬサンプルの記憶のためにシフトレジスタが延長されている。従って、該シフトレジスタが新しいサンプルｂ　（ｎ）で満たされるから、ｋはｂ（ｎ−ｋＬ）がフレームの開始に先立ちシフトレジスタ中に存在するサンプルを表すように選択されなければならない。Ｌ＝３２およびＮ＝６０の先の例を用いると、出力サンプルｑ（３２）はサンプルｑ（０）の繰り返しであり、これはｂ　（０−Ｌ）　＝ｂ　（３２−２Ｌ）またはｂ（−３２）である。

従って、ロングターム予測器遅延ブロック２３０の出力応答ｑ　（ｎ）は、ｑ　（ｎ）　＝ｂ　（ｎ−ｋＬ）に対応し、ここで０≦ｎ≦Ｎ−１であり、ｋは（ｎ　−ｋ　Ｌ）が負になるように選択された最も小さな整数である。より特定的にはもしｓ　（ｎ）のＮサンプルのフレームがロングターム予測器フィルタ１２４に入力されると、各サンプル番号ｎはｊ≦ｎ≦Ｎ＋ｊ−１であり、ここでｊはＮサンプルのフレームの最初のサンプルに対するインデックスである。従って、変数には（ｎ−ｋＬ）が常にｊより小さくなるように変化する。このことはロングターム予測器が出力応答を予測するために該フレームの開始に先立ち利用できるサンプルのみを利用することを保証する。

第２Ａ図のロングタームフィルタ１２４の動作を第３図のフローチャートに従って説明する。ステップ３５０においてスタートすると、サンプル番号ｎはステップ３５１において０に初期化される。公称ロングターム予測器ラグパラメータＬおよびロングターム予測器係数βはステップ３５２において係数アナライザ１１０から入力される。ステップ３５３において、サンプル数または番号ｎがテストされ全フレームが出力されたかを見る。もしｎ＝Ｎであれば、動作はステップ３６１において終了する。もしすべてのサンプルがまだ計算されておらなければ、ステップ３５４において信号サンプルｓ　（ｎ）が入力される。ステップ３５５において、ロングターム予測器遅延ブロック２３０の出力応答が次の式に従って計算される。

いかまたは等しい最も近い整数を表す。たとえば、もしｎ＝５６かつＬ＝３２であれば、　巨＋Ｌ）／ＬＪＬ）は１（５６＋３２／３２Ｊ　Ｌとなり、これは　Ｌ（２，７５）」Ｌまたは２Ｌとなる。ステップ３５６において、ロングタームフィルタの出力応答ｂ　（ｎ）は次の式に従って計算される。

ｂ　（ｎ）　＝βｑ　（ｎ）　＋ｓ　（ｎ）これは乗算器２２０および加算器２１０の機能を表す。

ステップ３５７において、ｂ（ｎ−２）およびｂ（ｎ−ＬＭＡＸ）の間のすべてのレジスタのロケーションに対して、シフトレジスタのサンプルが左に１ポジシヨンシフトされ、ここでＬ　は割り当て可能な最大のロングターム予測ＡＸ器ラグを表す。好ましい実施例においては、Ｌ　はＩＡＸ４３に等しい。ステップ３５８において、出力サンプルｂ（ｎ）がシフトレジスタの最初のロケーションｂ（ｎ−１）に入力される。ステップ３５９はろ渡されたサンプルｂ（ｎ）を出力する。サンプル数ｎは次にステップ３６０において増分され、かつ次にステップ３５３においてテストされる。すべてのＮサンプルが計算されたとき、処理はステップ３６１において終了する。

第２Ｃ図は本発明を導入したロングタームフィルタの別の実施例である。フィルタ１２４′は第２Ａ図の再帰（ｒｅｃｕｒｓｉｖｅ）フィルタ構成のフィードフォワード反転板である。入力ベクトルｓ　（ｎ）は減算器２４０およびロングターム予測器遅延ブロック２６０の双方に印加される。遅延されたベクトルｑ　（ｎ）は乗算器２５０に出力され、該乗算器２５０はロングターム予測器係数βによって該ベクトルを尺度変更する。デジタルフィルタ１２４′の出力応答Ｈ（ｚ）は２変換表示で次のように与えられる。

この式において、ｎはＮのサンプルを含むフレームのサンプル番号を表し、０≦ ｎ≦Ｎ−１であり、βはロングタームフィルタの係数を表し、Ｌはロングターム予測器の公（ｎ＋Ｌ）／’Ｌより小さいかまたはこれに等しい最も近い整数を表す。フィルタ１２４′の出力信号ｂ　（ｎ）はまた入力信号ｓ　（ｎ）に関し次のように規定できる。

この場合、０≦ｎ≦Ｎ−１である。当業者に理解できるように、ロングターム予測器の構造は再びロングターム予測器のラグＬがフレーム長Ｎより小さい場合に該ロングターム予測器の同じ記憶されたサンプルを繰り返し出力するように変更されている。

次に第５図を参照すると、第１図のロングタームフィルタ１２４の好ましい実施例が示されており、これはラグパラメータＬに対するサブサンプルの分解能を許容する。入力音声ベクトルｓ　（ｎ）のＮサンプルのフレームが加算器５１０に印加される。加算器５１０の出力はロングタームフィルタ１２４に対する出力ベクトルｂ　（ｎ）を生成する。

出力ベクトルｂ　（ｎ）はロングターム予測器の遅延されたベクトル発生器ブロック５３０にフィードバックされる。

公称ロングターム予測器ラグパラメータＬもまた遅延ベクトル発生器ブロック５３０に入力される。ロングターム予測器ラグパラメータＬは非整数有理数の値を取り得る。好ましい実施例はＬが２分の１の倍数である値を取ることを許容する。本発明のサブサンプル分解能ロングターム予測器の別の構成は３分の１または４分の１あるいは任意の他の有理分数の倍数である値を許容することができる。

好ましい実施例においては、遅延ベクトル発生器５３０はｂ　（ｎ）の過去のサンプルを保持するメモリを含む。さらに、ｂ　（ｎ）の補間されたサンプルもまた遅延ベクトル発生器５３０で計算されかつそのメモリ内に格納される。

好ましい実施例においては、遅延ベクトル発生器５３０に含まれるロングターム予測器の状態（ｓ　ｔ　ａ　ｔ　ｅ）はｂ（ｎ）の各々の記憶されたサンプルに対し２つのサンプルを有している。１つのサンプルはｂ　（ｎ）に対するものでありかつ他のサンプルは２つの連続するｂ　（ｎ）のサンプルの間の補間されたサンプルを表す。このようにして、ｂ（ｎ）のサンプルは整数の遅延またはハーフサンプルの遅延の倍数に対応する遅延ベクトル発生器５３０から得ることができる。この補間は、１９８３年に、プレンティス・ホール・ルーピン・ドナリーにより出版された、アール・クロチーアおよびエル・ラビナーによる「多重レート・デジタル信号処理」に述べられている補間有限インパルス応答フィルタを用いて行われる。ベクトル遅延発生器５３０の動作は第６Ａ図および第６Ｂ図のフローチャートに関連してさらに詳細に説明される。

遅延ベクトル発生器５３０はロングターム乗算器ブロック５２０に出力ベクトルｑ　（ｎ）を提供し、該ロングターム乗算器ブロック５２０はロングターム予測器係数βによりロングターム予測器応答を尺度変更する。尺度変更された出力β ｑ　（ｎ）は次に加算器５１０に印加され第５図における再帰フィルタ１２４のフィードバックループを完成する。

第６Ａ図および第６Ｂ図を参照すると、第５図のロングタームフィルタにより行われる動作を詳細に説明するための詳細フローチャートが示されている。本発明の好ましい実施例によれば、ロングターム予測器メモリの分解能はＮポイントのシーケンスｂ　（ｎ）を、２Ｎポイントのベクトルｅｘ　（ｉ）にマツピングすることにより拡張される。ｅｘ　（ｉ）の負のインデックスされたサンプルはロングタームフィルタ出力ｂ（ｎ）、励起、または拡張分解能ロングタームヒストリの拡張された分解能の過去の値を含む。該マツピング処理はそれが印加される各時間ごとに、ロングターム予測器メモリの一時的な分解能を倍加する。ここでは簡単化のために単一段のマツピングが説明されているが、付加的な段も本発明の他の実施例においては実施することができる。

第６Ａ図におけるステップ６０２のスタートに入ると、フローチャートはステップ６０４に進み、そこでＬ１βおよびｓ　（ｎ）が入力される。ステップ６０８において、ベクトルｑ　（ｎ）が次の式に従って構成される。

この式において　ｉ（ｎ＋Ｌ）／ＬＪは（ｎ＋Ｌ）／Ｌより小さいかまたは等しい最も近い整数を表し、かつＬはロングターム予測器ラグである。有声音に対しては、ロングターム予測器ラグＬはピッチ期間またはピッチ期間の倍数である。

Ｌは整数または好ましい実施例においてはその少数部分が０．　５である実数である。Ｌの少数部分が０．５である場合、Ｌはサンプルの半分の実効分解能を有する。

ステップ６１０において、ロングタームフィルタのベクトルｂ　（ｎ）は次の式によって計算される。

ｂ　（ｎ）　＝βＱ　（ｎ）　＋ｓ　（ｎ）但し、０≦ｎ≦Ｎ−１ステップ６１２において、ロングタームフィルタのベクトルｂ　（ｎ）が出力される。ステップ６１４において、拡張された分解能の状態ｅｘ（ｎ）が更新されｑ　（ｎ）の補間値が発生されかつ遅延ベクトル発生器５３０のメモリ内に格納される。ステップ６１４は第６Ｂ図により詳細に示されている。次に、ステップ６１６において処理は完了しかつ停止する。

第６ＢＩＩのステップ６２２におけるスタートに入ると、フローチャートはステップ６２４に進み、そこでこのサブフレームにおいて計算されるべきｅｘ　（ｉ）におけるサンプルが０に合わせられ、すなわちｉ　＝−Ｍ、　−Ｍ＋２．　、　。

、、２Ｎ−１に対しｅｘ　（ｉ）＝０とされ、ここでＭは２Ｍ＋１次のフィルタのために奇数に選択される。たとえば、フィルタの次数が３９であれば、Ｍは１９である。もちろんＭは単純化のために奇数であるとして選択されているが、Ｍはまた偶数でもよい。ステップ６２６において、ｉ＝０゜２、、、、．２（Ｎ− １）に対するｅｘ　（ｉ）の１つおきのサンプルが次の式に従いｂ　（ｎ）のサンプルで初期化される。

ｅｘ　（２ｉ）　＝ｂ　（ｆ）但し、ｉ＝０．１．、、、、Ｎ−１゜従って、ｊ＝０．　２．　、　、　、　、　２　（Ｎ−１）に対するｅｘ　（ｉ）はその偶数の指数に対しマツピングされた現在のサブフレームに対する出力ベクトルｂ　（ｎ）を保持し、一方ｉ＝１．　３．　、　、　、　、　２　（Ｎ− １）　＋１に対するｅｘｄ（ｉ）の奇数の指数は０で初期化されている。

ステップ６２８において、０に初期化されたｅｘ　（ｉ）の補間されたサンプルがそのようなＦＩＲフィルタの次数が上に述べたように２Ｍ＋１であると仮定して、対称、ゼロ位相シフトフィルタを使用し、ＦＩＲ補間により再構成される。

ＦＩＲフィルタの係数はａ　（Ｄであり、ここでｊ＝−Ｍ、−Ｍ＋２．、、、、Ｍ−１，Ｍおよびａ　（Ｄ＝ａ（−ｊ）である。ＦＩＲフィルタのタップに向けられた偶数サンプルのみがサンプル再構成において使用されるが、それは奇数サンプルは０にセットされているからである。その結果、２Ｍ＋１サンプルの代わりにＭ＋１サンプルが実際に重み付けられかつ各々の再構成されたサンプルのために加算される。ＦＩＲ補間は次の式に従って行われる。

（Ｍ＋］）ｅｔ（ｉ）＝　２Σ”２ｊ−１［ｅｘ（ｉ−２ｉ＋Ｉ）＋ｅｘ（ｉ＋２ｉ−１）　］ｊ・１但し、ｉ＝−Ｍ、　−１１＋２．　、　、　、　、２　（Ｎ−１）　−Ｍ−２，２（Ｎ〜１）−Ｍ再構成されるべき最初のサンプルはｅｘ（−Ｍ）であり、期待するようにｅｘ（１）ではないことに注意を要する。

これは、指数−Ｍ、　−Ｍ＋２．　、　、　、　、−１における補間されたサンプルは現在のフレームにおける励起の評価を用いて先のフレームにおいて再構成されたからであり、それは実際の励起サンプルはその時規定されていなかったからである。現在のフレームにおいてこれらのサンプルは知られており（我々はｂ　（ｎ）を有している）、かつ従ってｉ＝−Ｍ、−Ｍ＋、、、、、−１に対するｅｘ（ｉ）のサンプルは今や再び再構成され、フィルタのタップは実際のかつ評価されていない値ｂ　（ｎ）に向けられている。

上の式においてｉの最大の値は２　（Ｎ−１）−Ｍである。

これは、ｉ　＝２Ｎ−Ｍ、２Ｎ−Ｍ＋２．　、　、　、　、　２　（Ｎ　−１）＋１に対し、ｅｘ　（ｉ）の（Ｍ＋１）／２の奇数サンプルが依然として再構成されるべきであることを意味する。

しかしながら、指数（ｉｎｄｅｘ）ｉのこれらの値に対し、補間フィルタのより上のタップはまだ規定されていない励起の将来のサンプルを指示している。これらの指数に対するｅｘ　（ｉ）の値を計算するためには、１＝２Ｎ、２Ｎ＋２．、、、．２Ｎ＋Ｍに対するｅｘ　（ｉ）　（７）将来の状態カステップ６３０において評価することにより拡張される。

ｅｘ　（ｉ）＝λｅｘ（ｉ−２Ｌ）但し、１＝２Ｎ、２Ｎ＋２．、、、．２Ｎ＋Ｍ−１この機構において使用されるべき２Ｌの最小値は２Ｍ＋１である。この束縛は次のように規定することにより解放できる。

ｅｘ　（ｉ）＝λｅｘ　（Ｆ　（ｉ−２Ｌ）　）但し、１＝２Ｎ、２Ｎ＋２．、、、．２Ｎ＋Ｍ−１この場合、奇数に等しい１−２Ｌに対し、Ｆ　（ｉ−２Ｌ）は次式で与えられる。

また、偶数に等しい１−２Ｌに対するＦ（ｉ−２Ｌ）は次式により与えられる。

パラメータλ、すなわちヒストリ拡張スケールファクタは、ピッチ予測器係数である、βに等しくセットすることができ、あるいは１にセットされる。

励起ヒストリがこのように拡張されると、ステップ６３２において、現行の拡張されたレゾリュージョンのサブフレームの最後の（Ｍ＋１）／２のゼロサンプルは次式を用いて計算される。

（Ｍ＋１）ｅｘ（ｉ）＝　２Σ　’２ｉ−１［ｅｘ（ｉ−２ｉ＋１）＋ｅｘ（ｉ＋２ｉ−１）　］ｉ＝１但し、ｉ・２Ｎ−Ｍ、　２Ｎ−Ｍ＋２．　、　、　、　、２　（Ｎ−１）　＋１これらのサンプルは、１＝２Ｎ、２Ｎ＋２．、、、．２Ｎ＋Ｍ−１に対するｅｘ　（ｆ）のための実際の励起サンプルが一旦利用可能になると、次のサブフレームで再計算されるであろう。

従って、ｎ＝０．Ｎ−１に対し、ｂ　（ｎ）がベクトルｅｘ　（ｉ）にマツピングされ、ここでｉ＝ｏ、２．、、、。

２　（Ｎ−１）である。失われたゼロ化サンプルはＦＩＲ補間フィルタを用いて再構成されている。ＦＩＲ補間は失われたサンプルにのみ適用されることに注意を要する。これはｅｘ　（ｉ）の偶数の指数に格納されている、知られたサンプルに何等のひずみも無用に導入されないことを保証する。失われたサンプルのみを処理する付加的な利点は補間に関連する計算が半分になることである。

ステップ６３４において、最後にロングターム予測器ヒストリが２Ｎポイントにより拡張されたレゾリュージョン励起ベクトルｅｘ　（ｉ）の内容をシフトダウンすることにより更新される。

ｅｘ　（ｉ）＝ｅｘ　（ｉ＋２Ｎ）但し、ｉ＝２Ｍａｘ　Ｌ、−１ここで、ＭａｘＬは用いられる最大のロングターム予測器遅延である。次に、ステップ６３６において、処理は完了しかつ停止する。

次に第４図を参照すると、音声合成器（ｓｐｅｅｃｈｓｙｎｔｈｅｓｉｚｏｒ）のブロック図が本発明のロングタームフィルタを用いて図示されている。シンセサイザ４００はデマルチプレクサ４５０を介し、チャネルから受信したショートターム予測器パラメータα１、ロングターム予測器パラメータβおよびＬ１励起利得ファクタγおよびコード語■を得る。コード語ＩはコードブックＲＯＭ４２０に印加され励起ベクトルのコードブックをアドレスする。

コードブックＲＯＭ４２０は好ましくは、ここに参照のため導入される、米国特許第４，８１７，１５７号に述べられているようにして実施される。単一の励起ベクトルｕ■（ｎ）が次にブロック４２２において利得ファクタγにより乗算され、ロングターム予測器フィルタ４２４およびショートターム予測器フィルタ４２６によりろ波され再構成された音声ベクトルｓ’　１（ｎ）を得る。再構成された音声のフレームを表す、このベクトルは次にアナログ−デジタル（Ａ／Ｄ）コンバータ４０８に印加され再構成されたアナログ信号を生成し、これは次にフィルタ４０４によりエイリアシングを低減するために低域ろ波され、かつスピーカ４０２のような出力変換器に印加される。従って、このＣＥＬＰシンセサイザは第１図のＣＥＬＰアナライザと同じコードブック、利得ブロック、ロングタームフィルタ、およびショートタームフィルタを用いる。

第７図は、第４図における音声シンセサイザのショートタームフィルタ４２６およびＤ／Ａコンバータ４０８を相互結合するためのピッチポストフィルタの詳細なブロック図である。ピッチポストフィルタは音声品質をフィルタ４２４および４２６により導入されるノイズを除去することにより増大する。Ｎサンプルの再構成された音声ベクトルｓ’　１　（ｎ）のフレームが加算器７１０に印加される。加算器７１０の出力はピッチポストフィルタのための出力ベクトルｓ”（ｎ）を生成する。出力ベクトルｓ″　（ｎ）はピッチポストフィルタの遅延サンプル発生器ブロック６３０にフィードバックされる。公称（ｎｏｍｉｎａｌ）ロングターム予測器ラグパラメータＬもまた遅延サンプル発生器ブロック７３０に入力される。Ｌは本発明に対しては非整数値をとることができる。もしＬが非整数であれば、補間ＦＩＲフィルタが使用され必要とされる分数的サンプル遅延を発生する。遅延サンプル発生器７３０は出力ベクトルｑ　（ｎ）を乗算器ブロック７２０に提供し、該乗算器ブロック７２０はピッチポストフィルタ応答をロングターム予測器係数βの関数である係数Ｒによって尺度変更する。

尺度変更された出力Ｒｑ　（ｎ）は次に加算器７１０に印加され第７図のピッチポストフィルタのフィードバックループを、完成する。

本発明に係わるロングターム予測器応答を利用する際に、励起利得ファクタγおよびロングターム予測器係数βは閉ループ構成におけるＬのすべての値に対し同時に最適化することができる。この結合された最適化技術はＬ＜Ｎの値に対しては今までは実際的ではなかったが、それは結合最適化方程式が単一パラメータβ において非線形となるからであった。本発明はロングターム予測器の構造を変更しリニアな結合最適化方程式を許容する。さらに、本発明はロングターム予測器ラグが１サンプルより良好な分解能を持つことを許容し、それによりその性能を増強する。

さらに、フードブックサーチ手順がさらに単純化されるが、それはロングタームフィルタのゼロ状態応答がフレーム長より小さなラグに対しゼロになるからである。この付加的な特徴は当業者がロングタームフィルタの効果をフードブックサーチ手順から除去することを許容する。従って、実際の実施上の利点および低いビットレートを維持しながらすべてのピッチレートに対しより高い品質の音声を提供できるＣＥＬＰ音声コーダコーされた。

本発明の特定の実施例が示されかつ説明されたが、その広い見地における本発明から離れることなくさらに別の変更および改良を行うことができる。例えば、任意の形式の音声コーディング（例えば、ＲＥＬＰ、マルチパルス、ＲＰＥ、ＬＰＧ、その他）をここに述べたサブサンプル分解能ロングターム予測器ろ波技術とともに用いることができる。さらに、サブサンプル分解能のロングターム予測器構造の付加的な等画構成を上に述べたものと同じ計算を行うように構成することができる。

ＦＩＧ、６Ｂ閑瞭膿査報告１ｍｓ□ＩＡ″″−“’ｐＣｗ１０ｃＱｎ／（ＩＭ２５

Claims

【特許請求の範囲】

１．再生のために音声シンセサイザに通信するための音声のエンコード方法であって、前記音声はＮが１より大きな整数であるとし、各々Ｎ個のサンプルを有する音声ベクトルのフレームを具備し、前記方法は、メモリ手段に各々複数のサンプルを有する複数の励起ベクトルを格納する段階であって、前記励起ベクトルの第１の部分は各々Ｎ個より少ないサンプルを有しかつ前記励起ベクトルの第２の部分は各々Ｎ個のサンプルを有し、かつ各々の励起ベクトルは異なるデジタルコード語および１より大きくかつ所定の最大数より小さな整数である異なる遅延パラメータに関連するもの、前記励起ベクトルを現在の音声ベクトルでサーチし前記現在の音声ベクトルに最もよく整合する励起ベクトルのコード語および遅延パラメータを決定する段階であって、該決定は、前記メモリ手段から前記励起ベクトルのサンプルを読み取る段階、前記第１の部分における前記励起ベクトルのサンプルを反復しそれにより前記第１の部分の各励起ベクトルがＮ個のサンプルを有するようにする段階、各々の励起ベクトルに対応する少なくとも１つの補間励起ベクトルを発生する段階であって、前記補間励起ベクトルのサンプルは対応する励起ベクトルのサンプルから補間され、該補間された励起ベクトルは前記対応する励起ベクトルと同じコード語および前記対応する励起ベクトルの遅延パラメータに関連する非整数有理数である遅延パラメータを有するもの、前記励起ベクトルおよび前記補間された励起ベクトルのサンプルを前記現在の音声ベクトルと比較しそれらの間の差を決定する段階、そして前記励起ベクトルまたは補間励起ベクトルであって前記現在の音声ベクトルからの差が最小のもののコード語および遅延パラメータを選択する段階、によって行われるもの、および前記音声シンセサイザによる前記現在の音声ベクトルの再生のために前記メモリ手段における前記決定された励起ベクトルのロケーションを識別するために前記決定されたコード語および遅延パラメータを通信する段階、を具備する音声シンセサイザに通信するための音声のエンコード方法。
２．少なくとも１つの補間励起ベクトルを発生する前記段階は対応するベクトルの２つの連続するサンプルを平均化して前記補間された励起ベクトルの対応するサンプルを発生する段階を含む請求の範囲第８項に記載の方法。
３．再生のために音声シンセサイザに通信ずるために音声をエンコードする装置であって、前記音声は、Ｎが１より大きな整数であるとしてＮ個のサンプルを各々有する音声ベクトルのフレームを備え、前記装置は、各々複数のサンプルを有する複数の励起ベクトルを記憶するための手段であって、前記励起ベクトルの第１の部分は各々Ｎ個より少ないサンプルを有しかつ前記励起ベクトルの第２の部分は各々Ｎ個のサンプルを有し、かつ各励起ベクトルは異なるデジタルコード語および１より大きくかつ所定の最大数より小さな整数である異なる遅延パラメータと関連しているもの、前記励起ベクトルを現在の音声ベクトルによってサーチし前記現在の音声ベクトルに最もよく整合する励起ベクトルのコード語および遅延パラメータを決定するための手段であって、前記決定は、前記記憶手段からの前記励起ベクトルのサンプルを読み取り、前記第１の部分における前記励起ベクトルのサンプルを反復して前記第１の部分の各励起ベクトルがＮ個のサンプルを有するようにし、各励起ベクトルに対応する少なくとも１つの補間励起ベクトルを発生し、この場合該補間励起ベクトルのサンプルは対応する励起ベクトルのサンプルから補間され、前記補間励起ベクトルは対応する励起ベクトルと同じコード語および前記対応する励起ベクトルの遅延パラメータに関連する非整数有理数である遅延パラメータを有するようにし、前記励起ベクトルおよび前記補間された励起ベクトルのサンプルを前記現在の音声ベクトルのサンプルと比較しそれらの間の差を決定し、かつ前記励起ベクトルまたは補間された励起ベクトルであって前記現在の音声ベクトルからの差が最も少ないもののコード語および遅延パラメータを選択する、ことにより行われるもの、および前記音声シンセサイザによる前記現在の音声ベクトルの再生のために前記記憶手段における前記決定された励起ベクトルのロケーションを識別するために前記決定されたコード語および遅延パラメータを通信するための手段、を具備する音声シンセサイザに通信するために音声をエンコードする装置。
４．前記サーチ手段は補間された励起ベクトルの各サンプルを対応するベクトルの２つの連続する対応するサンプルを平均することにより発生する請求の範囲第１０項に記載の装置。