JPH05232995A

JPH05232995A - 一般化された合成による分析音声符号化方法と装置

Info

Publication number: JPH05232995A
Application number: JP4284808A
Authority: JP
Inventors: Willem Bastiaan Kleijn; バスティアンクレイジンウィレム
Original assignee: American Telephone and Telegraph Co Inc
Current assignee: AT&T Corp
Priority date: 1991-10-25
Filing date: 1992-10-23
Publication date: 1993-09-10
Anticipated expiration: 2020-06-22
Also published as: EP0539103A2; JP3662597B2; DE69225293T2; ES2115646T3; DE69225293D1; EP0539103A3; EP0539103B1

Abstract

(57)【要約】【目的】本件発明は音声符号化における帯域を削減す
るための一般化された合成による分析方法を提供するこ
とを目的とする。【構成】本件発明の分析方法は、原信号に基づいて試
行原信号が発生し、該試行原信号が符号化されそれを表
現するパラメータを生じ、これらのパラメータから該試
行原信号の推定値が合成され、該合成された推定値と該
試行原信号の間の誤差を判定し、該原信号の符号化され
た表現をその誤差が誤差評価プロセスを満足した該試行
原信号のパラメータと決定する段階からなる。

Description

【発明の詳細な説明】

【０００１】

【技術分野】本発明は一般に音声符号化システム、特に
合成による分析音声符号化システムの帯域要求の減少に
関する。

【０００２】

【背景技術】音声符号化システムは、チャネルあるいは
ネットワークを通してひとつあるいはそれ以上のシステ
ム受信機に通信するために音声信号の符号語による表現
を提供する。各システム受信機は受信された符号語から
音声信号を再構成する。与えられた時間の中でシステム
によって通信される符号語情報の量がシステムの帯域幅
を規定し、システム受信機によって再生される音声の品
質に影響を与える。

【０００３】音声符号化システムの設計者は、できるだ
け小さい帯域幅を利用して高品質の音声再生能力を求め
る。しかし高品質音声の要求と低帯域幅の要求とは相反
するものであり、従って設計過程でのかね合いが必要で
ある。しかし、本音声符号化手法は許容できる音声品質
を減少したチャネル帯域幅で提供するように開発された
ものである。その中には、合成による分析音声符号化手
法が含まれている。

【０００４】合成による分析音声符号化手法では、音声
信号は波形一致手続によって符号化される。候補となる
音声信号は、ひとつあるいはそれ以上のパラメータから
合成されて符号化されるべき元の音声信号と比較され
る。パラメータを変化させて異る合成された候補音声信
号が判定される。最も良く一致する候補音声信号のパラ
メータを元の音声信号を表わすために使用する。

【０００５】多くの合成による分析符号器、例えば符号
励振線形予測（ＣＥＬＰ）符号器は音声信号の長期相関
をモデル化するために長期予測器（ＬＴＰ）を使用する
（ここで“音声信号”という用語は実際の音声あるいは
合成による分析符号器のいずれかの励振信号を意味す
る。）。一般的に、相関によって過去の音声信号を現在
の音声信号の近似として使うことができる。ＬＰＴによ
っていくつかの過去の音声信号（これはすでに符号化さ
れている）を現在の（元の）音声信号と比較できる。こ
のような比較によって、ＬＴＰは過去の信号の中のいず
れが、元の信号に最も良く一致するかを判定する。過去
の音声信号は遅延によって識別できるが、これはどの位
の過去にその信号があったかを示すものである。ＬＴＰ
を用いた符号器は、最も整合する過去の音声信号のスケ
ーリングしたもの（すなわち最適近似）を現在の音声信
号から引算信号（これは残留分あるいは励振と呼ばれ
る）を減少した長期相関と共に生ずる。この信号は次に
典型的には固定統計的コードブック（ＦＳＣＢ）で符号
化される。ＦＳＣＢインデクスとＬＴＰ遅延は、他の情
報と共にＣＥＬＰ復号器に送信され、これは元の音声信
号の指定値をこれらのパラメータから回復する。

【０００６】音声の長期相関をモデル化することによっ
て、復号器における再生された音声の品質を向上するこ
とができる。しかしこの改善は帯域の大幅な増大なしに
は達成されない。例えば、音声の長期相関をモデル化す
るために、従来のＣＥＬＰ符号器は５ミリ秒あるいは
７．５ミリ秒（これをサブフレームと呼ぶ）ごとに８ビ
ットの遅延情報を伝送する。このような時間変化をする
遅延パラメータは、例えば帯域で１kb／s から２kb／s
を増大することになる。ＬＴＰ遅延の変化は、時間的に
予測できないかもしれないから（すなわち、ＬＴＰ遅延
の値のシーケンスは統計的性質を持つから）、遅延パラ
メータの符号化によって追加の帯域の要求を削減するこ
とは困難かもしれない。

【０００７】ＬＴＰを保った合成による分析符号器が余
分の帯域を必要とすることを減少する方法のひとつは、
ＬＴＰ遅延値をより低頻度で伝送し内挿によって中間の
ＬＴＰ遅延を決定することである。しかし、内挿を行な
えば音声信号の個々のサブフレームでＬＴＰによって部
分最適の遅延値が使用されることになる。例えば、もし
遅延が部分最適であれば、ＬＴＰは過去の音声信号を現
在の音声信号に部分最適に写像することになる。この結
果として、残留励振信号は他の場合に比べて大きくな
る。この場合ＦＳＣＢは、波形を整えるというその通常
の機能を実行するのではなく、その部分最適の時間シフ
トの効果を修正するように動作しなければならない。こ
のような修正が行なわれなければ、耳に聴える大幅な歪
みが生ずることになる。

【０００８】

【発明の要約】本発明は合成による分析音声符号化シス
テムにおける帯域要求を減少する方法と装置を提供す
る。本発明は符号化されるべき実際の原信号（original
signal)に基づいて、多数の試行原信号（trial origin
al signal)を提供する。これらの試行原信号は実際の原
信号に似た聴取特性を持つように制約され、符号化に際
して実際の原信号の代りにあるいはその補助として使用
される。原信号、従って試行原信号は実際の音声信号の
形をとっても良いし、合成による分析符号器に存在する
励振信号の形をとっても良い。本発明によって元の音声
信号の変化を許して符号化誤差とビット周波数とを削減
することにより、一般化された合成による分析符号化を
可能にする。本発明は他の応用と共に、セル状の、ある
いは通常の電話ネットワークのような音声情報通信用の
ネットワークに適用できる。

【０００９】本発明の一実施例においては、試行原信号
は符号化プロセスと合成プロセスで使用され、再構成さ
れた原信号を生ずる。試行原信号と再構成された信号と
の間の誤差信号が形成される。最小の誤差を生ずると判
定された試行原信号は、符号化と受信機への通信のため
の符号化の基礎として使用される。この方法で誤差を小
さくすることによって、所望のシステム帯域を減少する
ように符号化プロセスが変更される。

【００１０】ＣＥＬＰ符号器用の本発明の他に図示する
実施例においては、実際の原信号に対してタイムワープ
のコードブックを応用することによって、ひとつあるい
はそれ以上の試行原信号が与えられる。ＣＥＬＰ符号器
のＬＴＰ手続においては、試行原信号は適応コードブッ
クによって提供される過去の音声信号の候補と比較され
る。候補に最も近い試行原信号が識別される。ＬＴＰプ
ロセスの一部として、候補は識別された試行原信号から
引算されて、残余を形成する。次にこの残余が固定統計
的コードブックを適用して符号化される。ＬＴＰ手続に
おいて多数の試行原信号を使用する結果として、本発明
の一実施例は過去の信号の現在の信号への写像を改善
し、その結果として残留誤差を小さくする。このように
して残留誤差を小さくすることによってＬＴＰ遅延情報
の伝送頻度を低くすることができ、再構成された音声の
劣化なしに、あるいはわずかの劣化で遅延内挿ができる
ようになる。

【００１１】本発明の他の実施例では、時間シフト手法
によって多数の試行原信号を提供する。

【００１２】

【詳細な記述】序論図１は本発明の一実施例を図示したものである。符号化
されるべき原信号ｓ(i) は試行原信号発生器１０に与え
られる。

【００１３】

【外１】

【００１４】符号化過程における誤差を減少するように
原信号を変化することを認めることによって、本発明は
従来の合成による分析符号器を一般化することになる。
従って符号器／合成器１５は従来のＣＥＬＰのような任
意の従来の合成による分析符号器でよい。

【００１５】従来のＣＥＬＰ図２は従来の合成による分析ＣＥＬＰ符号器を図示す
る。標本化された音声信号ｓ(i) （ｉはサンプルの添
字）が現在の音声セグメントについて最適化されたＮ次
の短期線形予測フィルタ（ＳＴＰ）２０に与えられる。
信号ｘ(i) はＳＴＰによるフィルタの後の励振である。

【００１６】

【数１】ここでパラメータａ_nは線形予測分析器１０によって与
えられる。Ｎは通常１０サンプル程度であるから（８kH
z のサンプリング周波数の場合）、励振信号ｘ(i) は原
信号ｓ(i) の長期周期性を保存している。ＬＴＰ３０は
この冗長性を除くために設けられる。

【００１７】ｘ(i) の値はブロックごとに決定される。
各ブロックはサブフレームと呼ばれる。線形予測係数ａ
_nは分析器１０によってフレーム毎に決定される。フレ
ームは固定長を持ち、これは一段にサブフレーム長の整
数倍で、通常２０−３０ミリ秒の長さを持つ。ａ_nのサ
ブフレームの値は通常は内挿によって決定される。

【００１８】ＬＴＰは次のように使用する利得λ(i) と
遅延ｄ(i) を決定する。

【００１９】

【数２】

【００２０】

【外２】

【００２１】音声の各サブフレームのデータ表現、すな
わちＬＴＰパラメータλ(i) とｄ(i) およびＦＳＣＢイ
ンデクスはフレームに等しいサブフレームの数だけ集め
られる（典型的には２，４あるいは６）。係数ａ_nと共
に、このデータのフレームはＣＥＬＰ復号器に通知さ
れ、ここでこれを利用して音声の再構成が行なわれる。

【００２２】

【外３】

【００２３】

【外４】このコードブックからベクトルを選択するために、知覚
に関連した誤差条件を使っても良い。これは人間の聴覚
に存在するスペクトルマスクを利用して行なうことがで
きる。このようにして、原音声信号と再構成された音声
信号の差を使う代りに、この誤差条件は知覚で重み付け
られた差を使うことになる。

【００２４】信号の知覚重み付けは音声に存在するフォ
ーマットにデ・エンファシスを与えることになる。この
例では、フォーマットはスペクトルのデ・エンファシス
を極を内側に移動して実現するような全極フィルタとし
て記述できる。これは予測係数ａ₁,ａ₂,・・・,ａ_Nを持つ
フィルタを係数γａ₁,γ²ａ₂,・・・,γ^Nａ_Nを持つフィ
ルタに置き換えることに対応するが、ここでγは知覚重
み付け係数である。（通常０．８程度の値をとる。）

【００２５】知覚重み付けされた領域におけるサンプル
された誤差信号ｇ(i) は

【００２６】

【数３】である。合成による分析符号器の誤差条件はサブフレー
ムごとに形成される。Ｌサンプル長のサブフレームでは
一般に使用される条件は

【００２７】

【数４】

【００２８】

【外５】

【００２９】

【外６】

【００３０】時間領域においては、係数γによるスペク
トルのデ・エンファシスによって全極フィルタのインパ
ルス応答が速く減衰するようになる。実際的には、８kH
z のサンプリング周波数の場合γ＝０．８ではインパル
ス応答は２０サンプル先には意味のあるエネルギーは持
たなくなる。

【００３１】このように急速に減衰させることによっ
て、全極フィルタのインパルス応答１／（１−γａ₁z^-1
・・・ γ^Na _Nz ^-N) は有限インパルス応答フィルタで近
似できることになる。このフィルタのインパルス応答を
ｈ₀,h₁, ・・・, h_R-1で表わすことにしよう。これによっ
て知覚重み付けした音声に対する誤差条件の操作をベク
トル表示することができることになる。符号器はサブフ
レームごとに動作するから、サブフレームの長さに合せ
てベクトルをそのサンプルＬで定義するのが便利であ
る。例えば、励振信号については

【００３２】

【数５】となる。さらにスペクトル重み付けマトリクスＨは、次
のように定義される。

【００３３】

【外７】もし行列ＨがＬ×Ｌの矩形に区切られたとすると、式
（８）は式（４）を近似することになり、これは元々の
ＣＥＬＰに使われているような一般の共分散条件に近づ
く。

【００３４】ＣＥＬＰ符号化の図示の実施例図３は本発明の一実施例をＣＥＬＰ符号化に適用する場
合を図示する。サンプルされた音声信号ｓ(i) が符号化
のために与えられる。信号ｓ(i) は線形予測係数ａ_nを
生ずる線形予測分析器１００に与えられる。信号ｓ(i)
はまたＳＴＰ１２０に与えられ、これは式（１）に示す
プロセスに従って動作する。信号ｓ(i)は遅延推定器１
４０にも与えられる。

【００３５】遅延推定器１４０はｓ(i) の最近の履歴
（例えば過去の２０と１６０の間のサンプル）を探索
し、符号化されるべき現在の音声のサブフレームｓ(i)
に最も良く整合する連続した過去のサンプルの集合（サ
ブフレーム長に等しい長さの）を決定する。遅延推定器
１４０は現在のサブフレームとｉ−１６０＜ｉ＜ｉ−２
０の過去のサンプルｓ(i) の値の連続した集合との相関
手続きを通してその判定を行なうかもしれない。相関技
法の例としてはＣＥＬＰ符号器に用いられる通常のオー
プンループＬＴＰによって使用される手法を使っても良
い（ここでオープンループという用語は再生された過去
の音声信号ではなく、原信号を使用するＬＴＰ遅延推定
プロセスについて述べている。又、再生された音声信号
を使う遅延推定プロセスはクローズドループと呼
ぶ。）。遅延推定器１４０は上述した手続きによってフ
レームに１回遅延推定値を決定する。遅延推定器１４０
はフレーム境界で決められた遅延値の内挿によって各サ
ンプルフレームの遅延の値Ｍを計算する。

【００３６】

【外８】

【００３７】

【外９】

【００３８】上述したように、ＬＴＰプロセスは符号化
された音声の長期相関を小さくするために、現在の音声
信号と最も良く整合する過去の音声信号を識別するよう
に動作する。図３の実施例において、多数の試行原信号
がＬＴＰプロセスに与えられる。このような多数の試行
原信号はタイムワープ機能１３０によって与えられる。

【００３９】図４に示すタイムワープ関数１３０は原信
号に適用するためのタイムワープ（ＴＷＣＢ）用のコー
ドブック１３３を与え多数の試行原信号を生ずる。原理
的にはタイムワープ関数１３０のコードブック１３３は
任意のタイムワープ

【００４０】

【数６】を含み、これは原信号の知覚品質を変化することはな
い。

【００４１】

【数７】ここでｔ_jとτ_jは原領域とワープ領域におけるサブフ
レームｊの開始を含む。

【００４２】ワーププロセスの安定性を増大するため
に、主要なピッチパルスがサブフレームの右方の境界の
近くに入ることが望ましい。これはこのようなサブフレ
ームの境界を、周知の手法を使用してこのようなパルス
のちょうど右方に入るように定義することによって実現
される。符号化されるべき音声信号のピッチパルスが境
界点にあると仮定すれば、ワーピング関数が次式を満足
するようにすることが望ましい。

【００４３】

【数８】もしピッチパルスがサブフレーム境界のいくらか前にあ
れば、ζ(t) はその終りの値をサブフレーム境界の近傍
に保つようにするべきである。もし式（１０）が満足さ
れないときには振動的なワープとなる。タイムワープの
コードブックを実現するために次のようなタイムワープ
関数のファミリーを使用しても良い。

【００４４】

【数９】ここでＡ，Ｂ，Ｃ，σ_Bおよびσ_Cは定数である。ｔが
増大するにつれてタイムワープ関数はＡに収束する。ｔ
_jではワーピング関数の値はＡ＋Ｂである。Ｃの値は式
（１０）を正確に満足するのに使用される。連続タイム
ワープのコードブックは１）Ａの値を選択する（典型的
には０．９５と１．０５の間）、２）σ_Bとσ_Cの値を
選択する（典型的には２．５ｍ秒）、３）ｔ_jの境界条
件を満足するようＢを使用する（ここでζ（ｔ_j）＝Ａ
＋Ｂ）、４）式（１０）の境界条件を満足するようＣを
選択する、ことによって発生される。ワーピイングコー
ドブックに関する情報は伝送されないことに注意してい
ただきたい。その大きさは計算上の要求によってだけ決
められる。

【００４５】

【外１０】

【００４６】

【数１０】式（１２）は式（８）に似ているが、式（８）とは異
り、式（１２）は正規化されており、従って最小平方誤
差プロセスは形の差にだけ感度を持つようになってい
る。

【００４７】

【外１１】

【００４８】

【外１２】

【００４９】

【外１３】

【００５０】

【外１４】

【００５１】従来の音声符号器と同様に、ＬＴＰ遅延、
スケールファクタ値λおよびＭ、ＦＳＣＢインデクスお
よび線形予測係数ａ_nは回線を通して復号器に与えられ
て、従来のＣＥＬＰ受信機によって再構成される。しか
し、本発明の図示の実施例によって実現される誤差の低
下のために（符号化プロセスにおける）、ＬＴＰ遅延情
報はサブフレームに１回でなく、フレームに１回送信す
ればよいことになる。Ｍのサブフレーム値は送信機の遅
延推定器１４０によって行なわれると同様の方法で、遅
延値を内挿することによって受信機で提供される。

【００５２】ＬＴＰ遅延情報Ｍをサブフレームごとでは
なく、フレームごとに送信することによって、遅延に関
連した帯域要求は大幅に小さくなる。

【００５３】連続遅延輪郭を持つＬＴＰ従来のＬＴＰでは、遅延は各サブフレームで一定で、サ
ブフレームの境界で不連続的に変化する。この不連続的
な振舞はステップ遅延輪郭と呼ばれる。ステップ遅延輪
郭を持つ場合には、サブフレーム間の遅延の不連続な変
化は過去の励振の現在に対するＬＴＰ写像の不連続性に
対応する。このような不連続性は内挿によって変更で
き、円滑に変化するピッチサイクル波形を持つ信号の再
生を妨げないようにする。上述した実施例では、遅延値
の内挿が要求されるから、内挿を便利にするために連続
的遅延輪郭を有するＬＴＰを与えることが有利であるこ
とが言える。この再構成されたＬＴＰは、不連続性のな
い遅延輪郭を与えるから、これは連続遅延輪郭のＬＴＰ
と呼ばれる。

【００５４】適応的コードブックを提供する連続遅延輪
郭の遅延値を与えるプロセスは上述した遅延推定器にと
って代る。ＬＴＰの連続遅延輪郭を与えるために現在の
サブフレームの可能な輪郭の最良の集合が選択される。
各々の輪郭は先のサブフレームｄ（ｔ_j）の遅延輪郭の
終りの値で開始する。現在の実施例においては、集合の
各々の遅延輪郭はサブフレーム内で線形であるように選
択される。従って現在のＮサンプルのサブフレームｊで
は（サンプリング間隔Ｔの間をおいている）、ｔ_j＜ｔ
＜ｔ_j+1の間にあるが、瞬時遅延ｄ(t) は次の形をと
る。

【００５５】

【数１１】ここでαは一定である。ｄ(t) を与えられると、過去の
音声信号（ＬＴＰ利得でスケーリングしていない）のＬ
ＴＰによる現在への写像は、

【００５６】

【数１２】

【００５７】

【外１５】

【００５８】過去の信号の時間スケールしたものを得る
ための連続遅延輪郭と共にＬＴＰを使用するときには、
遅延輪郭の勾配を１より小さくｄ(t) ＜１としておくこ
とが望ましい。もしこの条件が乱されると、写像された
波形の時間反転が生ずるかもしれない。また、連続遅延
輪郭ではピッチダブリングを正確に記述できない。ピッ
チダブリングをモデル化するためには、遅延輪郭は不連
続でなければならない。再び式（１４）の遅延輪郭を考
える。各々のピッチ周期は通常エネルギーのひとつの大
きな中心（ピッチパルス）に支配されるから、遅延輪郭
にはピッチサイクル毎にひとつの自由度が存在すること
が望ましい。従って、図示の連続遅延輪郭ＬＴＰは、ほ
ぼ１ピッチサイクルの適応的長さを持つサブフレームを
与える。この適応的長さはピッチパルスの直後に置かれ
るサブフレーム境界を与えるのに使用される。このよう
にすることによって、振動的な遅延輪郭が生ずることを
防止する。ＬＴＰパラメータは固定時間間隔で送信され
るから、サブフレームの大きさはビット周波数に影響す
ることはない。図示の実施例においては、ピッチパルス
すなわち遅延フレーム境界を位置決めする周知の手法が
適正できる。これらの手法は適応コードブックプロセス
１５０の一部として応用される。

【００５９】タイムシフトを伴うＣＥＬＰ符号化の実施
例上述したタイムワーピングの実施例に加えて、本発明の
タイムシフトの実施例を用いることもできる。図示の例
としては、タイムシフトの実施例は図５に示される。こ
れは図３と類似しているが、タイムワープ関数１３０が
タイムシフト関数２００に置き換えられている。

【００６０】タイムワープ関数１３０と同様に、タイム
シフト関数２００は符号化されるべき原信号と聴覚的に
類似した多数の試行原信号を与える。タイムワープ関数
１３０と同様に、タイムシフト関数２００はどの試行原
信号が識別された過去の音声信号と最も近い形を持つか
を判定する。しかしタイムワープ関数１３０とは異り、
タイムシフト関数は原音声信号、望ましいことには励振
信号をθ _min＜θ＜θ_maxの範囲にある時間θだけ時間
的にずらし、過去の音声信号と比較したときに最小誤差
を生ずるような原信号の位置を決定するように動作する
（典型的には｜θ_min｜＝｜θ_max｜＝２．５サンプル
で、アップサンプリングが行なわれるときに達成され
る。）。原音声信号のシフトをθだけ右に（すなわち時
間的に遅らせる）移動することは前のサブフレームの長
さθの最後の区間を繰返し、これによって原音声サブフ
レームの左のエッジにパッドすることによって実行され
る。原音声信号をθだけ左にシフトする動作は単にサブ
フレームの左縁からθに等しい長さの信号を除く（すな
わち省略する）ここによって実行される。

【００６１】サブフレームの大きさはピッチ周期の関数
としておく必要はないことに注意していただきたい。し
かし、サブフレームの大きさを常にピッチ周期より小さ
くしておくことが望ましい。こうすれば、各ピッチパル
スの位置を独立に決定することができる。２．５ミリ秒
の大きさのサブフレームも使用できる。ＬＴＰパラメー
タは固定時間間隔で送信されるから、サブフレームの大
きさがビット周波数に影響することはない。サブフレー
ムがピッチパルスの間に入ることを防止するために、シ
フトの変更は適切に制約しておく必要がある（２．５ミ
リ秒のサブフレームに対して０．２５ミリ秒程度）。こ
の代りに周囲のサブフレームよりエネルギーが大幅に小
さいサブフレームについては遅延を一定に保つことがで
きる。

【００６２】タイムシフト関数２００の例を図６に図示
する。関数２００は上述したタイムワープ関数１３０に
似ているか、パッド／省略プロセス２３２がワーピング
プロセス１３２と関連するコードブック１３３の代りに
設けられている。関数２００によって実行されるシフト
手続きは、

【００６３】

【数１３】である。ここで、ｔ_jは原信号の現在のフレームｊの開
始である。閉ループあてはめ手続きが式（１２）に似た
誤り条件を最小化するθ _min＜θ＜θ_maxの値を探索す
る。

【００６４】

【数１４】この手続きはプロセス２３４（これは式（１７）に従っ
てε′を決定する）と誤り評価器１３５（これはε′
_minを決定する）によって実行される。

【００６５】サブフレームｊの最適値θはε′_minに対
応するそのθであり、θ_jと表記される。サブフレーム
長Ｌ_subframe については原音声のサブフレームｊ＋１
の開始は次式で決定される。

【００６６】

【数１５】再構成された信号については時刻τ_j+1は単に次式とな
る。

【００６７】

【数１６】上述した図示の実施例のように、本発明のこの実施例は
スケーリングと遅延情報、線形予測係数および通常のＣ
ＥＬＰ受信機の固定統計的コードブックインデクスを与
える。この場合にも、本発明による符号化誤差の低下の
ために、遅延情報は各サブフレームではなく、各フレー
ムに送信される。受信機は遅延情報を内挿し、受信機の
遅延推定器１４０で行なわれたように個々のサブフレー
ムについて遅延値を決定する。

【００６８】階段遅延輪郭の場合の内挿は次のように実
行される。ｔ_Aとｔ_Bで原信号についての現在の内挿期
間のはじめと終りを表わす。さらにインテックスｊ_Aで
現在の内挿期間の第１のＬＴＰサブフレームを、ｊ_Bで
次の内挿期間の第１のＬＴＰサブフレームを表わす。ま
ず現在の内挿間隔ｄ_Bの終りで、遅延の開ループ推定値
は、例えば、過去の音声信号と現在の音声信号の相互相
関プロセスによって得られる（実際、この目的のための
ｔ_Bに使用する値は推定値である。なぜならその最終的
な値は内挿の終りで得られる。）。先の内挿期間の終り
での遅延をｄ_Aで表現する。このときには、サブフレー
ムｊの遅延は単に

【００６９】

【数１７】で与えられる。励振に対するＬＴＰのスケーリングして
いない寄与分は次式で与えられる。

【００７０】

【数１８】ここでτ_jは再構成された信号についてのサブフレーム
ｊのはじめである。

【００７１】遅延ピッチの２倍化と半分化合成による分析符号器では連続したピッチサイクルが類
似していると遅延の２倍化、半分化といった現象が生じ
やすい。しかし、本発明に関しては、遅延の２倍化と半
分化は次のようにして対処される。第１ステップとして
今の内挿期間の終端におけるオープンループ遅延推定値
が先の内挿間隔の最終の遅延に比較される。これが先の
内挿期間の終端の値の倍数もしくは約数に近いときに
は、遅延の倍数化あるいは約数化が生じたと考えられ
る。次下には遅延の２倍化と半分化について述べるが、
これ以外の倍数化についても同様に扱うことができる。

【００７２】遅延の２倍化について述べれば、終端値の
遅延のオープンループ推定値をｄ₂(τ_B）とする。ここ
で添字２は２ピッチサイクルに対応する遅延を表わす。
ｄ₁(τ_A）で１ピッチサイクルに対応する遅延を表わ
す。一般に、２倍化された遅延と標準の遅延の間には次
の関係がある。

【００７３】

【数１９】式（２２）はＬＴＰによる２回のシーケンシャル写像を
示している。ピッチ周期が一定でなければ、遅延を単に
２倍しても正しい写像は得られない。次に現在の内挿期
間でｄ₁(τ）がリニアである場合を考える。

【００７４】

【数２０】式（２２）と（２３）を組合わせて

【００７５】

【数２１】式（２４）は制限された範囲内で、ｄ₂(τ）がリニアで
あることを示している。しかし、一般にτ_A＜τ＜τ_A
＋ｄ₁(τ) の範囲ではｄ₂(τ) はリニアではない。遅延
の２倍化のためには次のような手続が使える。はじめに
ｄ₁(τ_A）とｄ₂(τ_B）が知られている。式（２４）で
τ＝τ_Bを使ってβが求められる。

【００７６】

【数２２】次に内挿期間内のｄ₁(τ）とｄ₂(τ) が知られる。標準
の遅延ｄ₁(τ）は全内挿期間の中で式（２３）を満足す
る。ｄ₂(τ) については式（２２）は全内挿期間内で有
効であるが、式（２４）は制限された部分だけで有効で
あることに注意していただきたい。

【００７７】内挿期間に対する実際のＬＴＰ励振の寄与
分が、、標準の遅延から２倍化遅延に対する平滑化され
た変化によってこれで得られたことになる。

【００７８】

【数２３】ここでΨ（τ）は示された内挿期間で０から１に増大さ
れた平坦な関数があり、これは現在の内挿期間を線形化
するものである。この手続は内挿期間が２倍化された遅
延より本質的に大きいことを仮定している。

【００７９】遅延の半分化については同一の手続が逆方
向に利用される。境界条件ｄ₂(τ_A）とｄ₁(τ_A) を仮
定する。τ_A＜τ＜τ_Bについて式（２２）が使えるよ
うになるには、ｄ₁(τ_A）はτ_A−ｄ₁(τ_A）＜τ＜τ
_Aの範囲で定義されなければならない。適切な定義によ
って音声の品質が保たれる。２倍化遅延は先の内挿期間
では線形であるから、この範囲でｄ₁(τ）の適切な定義
を得るために式（２４）を使うことができる。線形の遅
延輪郭の場合、ｄ₂(τ）は次式を満足する。

【００８０】

【数２４】ここで′は前の内挿期間の値を参照すること（τ_B′＝
τ_Aであることに注意）を示し、η′は定義である。こ
れを式（２４）と比較すれば、前の内挿期間の最後の部
分のｄ₁(τ）は

【００８１】

【数２５】である。式（２８）はまた現在の内挿期間の境界値ｄ
₁(τ_A）を与える。この値とｄ₁(τ_B）から、式（２
３）のβの値を求めることができる。再び式（２２）は
現在の内挿期間のｄ₂(τ）を計算するのに使用できる。
ｄ₂(τ）からｄ₁(τ）への変化は再び式（２２）によっ
て行なわれる。しかしこの場合はΨ（τ）は内挿期間内
で１から０に減少する。

【図面の簡単な説明】

【図１】本発明の一実施例の図である。

【図２】従来のＣＥＬＰ符号器の図である。

【図３】本発明の一実施例の図である。

【図４】図３に示した実施例の時間ワープ関数の図であ
る。

【図５】時間シフトに関連する本発明の実施例の図であ
る。

【図６】図５に示した実施例の時間シフト関数の図であ
る。

【符号の説明】

１０複数の試行信号を発生する手段１５パラメータを発生する手段１７誤差を判定する手段

Claims

【特許請求の範囲】

【請求項１】原信号を符号化する方法において、該方
法は、原信号に基づいて複数の試行原信号を発生し、試行原信号を符号化してそれを表わすひとつあるいはそ
れ以上のパラメータを発生し、ひとつあるいはそれ以上のパラメータから試行原信号の
推定値を発生し、試行原信号と試行原信号の合成された推定値の間の誤差
を判定し、誤差評価プロセスを満足した誤差を持つ試行原信号のひ
とつあるいはそれ以上のパラメータを原信号の符号化表
現として選択する段階からなることを特徴とする原信号
を符号化する方法。
【請求項２】請求項１に記載の方法において、複数の
試行原信号を発生する段階は、原信号にひとつあるいは
それ以上のタイムワープを適用する段階からなることを
特徴とする原信号を符号化する方法。
【請求項３】請求項１に記載の方法において、複数の
試行原信号を発生する段階は、原信号のひとつあるいは
それ以上の時間シフトを実行する段階からなることを特
徴とする原信号を符号化する方法。
【請求項４】請求項１に記載の方法において、試行原
信号を符号化する段階は合成による分析符号化を実行す
る段階からなることを特徴とする原信号を符号化する方
法。
【請求項５】請求項４に記載の方法において、合成に
よる分析符号化を実行する段階はコード励振線形予測符
号化を実行する段階からなることを特徴とする原信号を
符号化する方法。
【請求項６】請求項１に記載の方法において、誤差を
判定する該段階はフィルタされた試行原信号とフィルタ
されたその合成信号の間の差のサンプルの自乗和を判定
する段階からなることを特徴とする原信号を符号化する
方法。
【請求項７】請求項６に記載の方法において、誤差評
価プロセスはサンプルの複数の自乗和からサンプルの自
乗和の最小値を判定する段階からなることを特徴とする
原信号を符号化する方法。
【請求項８】請求項１に記載の方法において、誤差を
判定する該段階は知覚的に重み付けされた試行原信号と
知覚的に重み付けられたその合成された推定値の間の差
サンプルの自乗和を判定する段階からなることを特徴と
する原信号を符号化する方法。
【請求項９】請求項８に記載の方法において、該誤差
評価プロセスはサンプルの複数の自乗和の中からサンプ
ルの最小の自乗和を判定する段階からなることを特徴と
する原信号を符号化する方法。
【請求項１０】請求項１に記載の方法において、原信
号の符号化された表現を選択する該段階はそれに伴う誤
差が最小である試行原信号を判定する段階からなること
を特徴とする原信号を符号化する方法。
【請求項１１】原信号を符号化する装置において、該
装置は、原信号に基づいて複数の試行原信号を発生する
手段と；該発生手段に結合され、試行原信号を符号化し
てそれを表現するひとつあるいはそれ以上のパラメータ
を発生する手段と、該符号化手段に結合され、ひとつあるいはそれ以上のパ
ラメータから試行原信号の推定値を合成する手段と；該
符号化手段と該発生手段とに結合され、試行原信号と試
行原信号の合成された推定値との間の誤差を判定する手
段と、原信号の符号化された表現として、その誤差が誤り評価
プロセスを満足した試行原信号のひとつあるいはそれ以
上のパラメータを選択する手段と、からなることを特徴とする原信号を符号化する装置。
【請求項１２】請求項１１に記載の装置において、複
数の試行原信号を発生する手段は原信号に対してひとつ
あるいはそれ以上のタイムワープを適用する手段を含む
ことを特徴とする原信号を符号化する装置。
【請求項１３】請求項１１に記載の装置において、複
数の試行原信号を発生する手段はタイムワープのコード
ブックからなることを特徴とする原信号を符号化する装
置。
【請求項１４】請求項１１に記載の装置において、複
数の試行原信号を発生する装置は原信号のひとつあるい
はそれ以上の時間シフトを行なう手段からなることを特
徴とする原信号を符号化する装置。
【請求項１５】請求項１１に記載の装置において、試
行原信号を符号化する手段は合成による分析符号化を実
行する手段からなることを特徴とする原信号を符号化す
る装置。
【請求項１６】請求項１５に記載の装置において、合
成による分析符号化を実行する手段は符号励振線形予測
符号器からなることを特徴とする原信号を符号化する装
置。
【請求項１７】請求項１１に記載の装置において、試
行原信号の推定値を合成する手段は固定統計的コードブ
ックからなることを特徴とする原信号を符号化する装
置。
【請求項１８】請求項１７に記載の装置において、試
行原信号の推定値を合成する手段はさらに適応コードブ
ックからなることを特徴とする原信号を符号化する装
置。
【請求項１９】請求項１１に記載の装置において、誤
差を判定する該手段は、試行原信号とその合成された推
定値との差のサンプルの自乗和を判定する手段からなる
ことを特徴とする原信号を符号化する装置。
【請求項２０】請求項１９に記載の装置において、該
誤差評価プロセスは該サンプルの複数の自乗和の中から
サンプルの自乗和が最小であるものを判定することを特
徴とする原信号を符号化する装置。
【請求項２１】請求項１９に記載の装置において、原
信号とその合成された推定値との差は知覚により重み付
けられることを特徴とする原信号を符号化する装置。
【請求項２２】請求項１１に記載の装置において、原
信号の符号化された表現を選択する手段はそれに関連す
る誤差が最小である試行原信号を判定する手段からなる
ことを特徴とする原信号を符号化する装置。
【請求項２３】原信号を通信するネットワークにおい
て、該ネットワークは、通信回線、通信回線に接続され、原信号の符号化された表現を送信
する送信機であって、原信号に基付いて複数の試行原信号を発生する手段と、該発生手段に結合され、試行原信号を符号化してそれを
表現するひとつあるいはそれ以上のパラメータを生ずる
符号化手段と、該符号化手段に結合され、該ひとつあるいはそれ以上の
パラメータから試行原信号の推定値を合成する手段と、該符号化手段と該発生手段とに接続され、該試行原信号
と試行原信号の合成された推定値との間の誤差を決定す
る手段と、誤差評価プロセスを満足する関連する誤差を有する試行
原信号のひとつあるいはそれ以上のパラメータを原信号
の符号化された表現として選択する手段とからなる送信
機、及び通信回線に接続され、送信機から受信した原信
号の符号化された表現を復号するための受信機からなる
ことを特徴とする原信号を通信するネットワーク。