JPH04270397A

JPH04270397A - 音声符号化方式

Info

Publication number: JPH04270397A
Application number: JP3103261A
Authority: JP
Inventors: Keiichi Funaki; 舟木　慶一; Kazunori Ozawa; 一範小澤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1991-02-26
Filing date: 1991-02-26
Publication date: 1992-09-25
Anticipated expiration: 2016-03-19
Also published as: JP3146511B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、音声信号を低いビット
レート、特に８〜４ｋｂ／ｓ程度で高品質に符号化する
ための音声符号化方式に関する。

【０００２】

【従来の技術】音声信号を８〜４ｋｂ／ｓ程度の低いビ
ットレートで符号化する方式としては、例えば、Ｍ．Ｓ
ｃｈｒｏｅｄｅｒ　　ａｎｄ　　Ｂ．Ｓ．Ａｔａｌ氏に
よる“Ｃｏｄｅ−ｅｘｃｉｔｅｄ　　ｌｉｎｅａｒ　　
ｐｒｅｄｉｃｔｉｏｎ：Ｈｉｇｈ　　ｑｕａｌｉｔｙ　
　ｓｐｅｅｃｈ　　ａｔ　　ｌｏｗ　　ｂｉｔ　　ｒａ
ｔｅｓ”と題した論文（Ｐｒｏｃ．ＩＣＡＳＳＰ，ｐｐ
．９３７−９４０，１９８５年）（文献１）等に記載さ
れているＣＥＬＰ（Ｃｏｄｅ　　Ｅｘｃｉｔｅｄ　　Ｌ
ＰＣ　　Ｃｏｄｉｎｇ）が知られている。この方法では
、送信側ではフレーム毎（例えば２０ｍｓ）に音声信号
から音声信号のスペクトル特性を表すスペクトルパラメ
ータを抽出し、フレームをさらに小区間のサブフレーム
に分割し、サブフレーム毎に過去の音源信号から長区間
相関（ピッチ相関）を表すピッチパラメータを抽出し、
ピッチパラメータによりサブフレームの音声信号を長期
予測する。長期予測して求められた残差信号に対して、
予め用意された種類の雑音信号からなるコードブックか
ら選択した信号により合成した信号と、残差信号と誤差
電力を最小化するように一種類の雑音信号を選択すると
共に、最適なゲインを計算する。そして選択された雑音
信号の種類を表すインデクスとゲイン、ならびに、スペ
クトルパラメータとピッチパラメータを伝送する。受信
側の説明は省略する。

【０００３】また、長期予測の方法としては、例えば、
Ｗ．Ｋｌｅｉｊｎ“Ａｎｅｆｆｉｃｉｅｎｔ　　ｓｔｏ
ｃｈａｓｔｉｃａｌｌｙ　　ｅｘｃｉｔｅｄ　　ｌｉｎ
ｅａｒｐｒｅｄｉｃｔｉｖｅ　　ｃｏｄｉｎｇ　　ａｌ
ｇｏｒｉｔｈｍ　　ｆｏｒ　　ｈｉｇｈｑｕａｌｉｔｙ
　　ｌｏｗ　　ｂｉｔ　　ｒａｔｅ　　ｔｒａｎｓｍｉ
ｓｓｉｏｎｏｆ　　ｓｐｅｅｃｈ”と題した論文（Ｓｐ
ｅｅｃｈ　　Ｃｏｍｍｕｎｉｃａｔｉｏｎ，７，ｐｐ．
３０５−３１６，１９８８年）（文献２）等に記載のよ
うに、過去の音源を１サンプルずつずらして、重み付け
２乗誤差を最小にする過去の音源のずらし値（整数遅延
）とずらした音源に対応する音源のゲインを求める方法
が知られている。しかしながら、適応コードブックだけ
では音声の周期性を完全に記述できないために、ＣＥＬ
Ｐ系の符号化方式の場合、再生信号に雑音感が残ってし
まう。この問題点を解決するために、合成フィルタの入
力となる、適応コードブックと音源コードブックの和に
適応コードブックの遅延で規定される適応コムフィルタ
を掛ける手法が知られている。具体的な方法は例えば、
Ｓ．Ｗａｎｇ氏らによる“Ｉｍｐｒｏｖｅｄ　　ｅｘｃ
ｉｔａｔｉｏｎ　　ｆｏｒ　　ｐｈｏｎｅｔｉｃａｌｌ
ｙ−ｓｅｇｍｅｎｔｅｄ　　ＶＸＣ　　ｓｐｅｅｃｈ　
　ｃｏｄｉｎｇ　　ｂｅｌｏｗ　　４ｋｂ／ｓ”と題し
た論文（Ｐｒｏｃ．Ｇｌｏｂｅｃｏｍ，ｐｐ．９４６−
９５０，１９９０年）（文献３）等を参照できる。この
手法により、遅延が音声信号のピッチ周期と一致し正し
くもとまったときは、雑音感が減少し、音質が向上する
。

【０００４】

【発明が解決しようとする課題】しかし、適応コムフィ
ルタリングは、遅延が正しくもとまらないと、かえって
音質は劣化してしまうという問題点があった。

【０００５】本発明の目的は、上述した問題点を解決し
、なめらな遅延と高調波成分が付加された適応コードブ
ックの音源により、８〜４ｋｂ／ｓにおいて音質の良好
な音声符号化方式を提供することにある。

【０００６】

【課題を解決するための手段】第１の発明における音声
符号化方式は、音声信号を蓄積する手段と、音声信号の
有声性判定を行う手段と、音声信号をサブフレームに分
割する手段と、音声信号を分析する手段と、音声信号に
対して聴覚上の重み付けを加える手段と、有声と判定さ
れたフレームのみ適応コードブックの出力にその遅延で
規定されるコムフィルタリングを行う手段と、コムフィ
ルタの出力を用いて最適な遅延を決定する手段と、重み
付け信号から最適遅延に相当する適応コードブックの出
力を減算する手段と、音源コードブックから最適な音源
を抽出する手段とを有することを特徴とする。

【０００７】第２の発明における音声符号化方式は、音
声信号を蓄積する手段と、音声信号の有声性判定を行う
手段と、音声信号をサブフレームに分割する手段と、音
声信号を分析する手段と、音声信号に対して聴覚上の重
み付けを加える手段と、有声と判定されたフレームのみ
適応コードブックの出力にその遅延で規定されるコムフ
ィルタリングを行う手段と、コムフィルタの出力を用い
て最適な遅延を決定する手段と、最適な遅延に相当する
コムフィルタの出力を重み付け信号から減算する手段と
、音源コードブックから最適音源を抽出する手段とを有
することを特徴とする。

【０００８】

【作用】第１の発明においては、評価尺度を従来の重み
付け２乗距離ではなく、適応コードブックの出力にその
遅延で規定されるコムフィルタをかけ、高調波成分の強
調を行い、コムフィルタの出力と重み付け信号の２乗距
離を評価尺度にし、これを最小化する遅延を最適な遅延
として決定する。コムフィルタを掛けることにより調波
成分を強調するだけでなく、雑音成分を抑圧することに
なるため、より正確な遅延を推定できる。

【０００９】第２の発明においては、評価尺度にコムフ
ィルタを加えることにより、より正確な遅延を推定でき
るとともに、適応コードブックの出力として、コムフィ
ルタの出力を用いることにより、ＣＥＬＰ系の符号化方
式の問題点であった雑音感を低減することができる。

【００１０】

【実施例】図１は第１の発明の実施例であり、図２は第
２の発明の実施例である。

【００１１】最初に各モジュールの動作説明をする。

【００１２】バッファ装置１０５は、音声信号を記憶し
ておく装置である。

【００１３】有声判定器１１０は、そのフレームの音声
が有声か否かの判定を行う装置である。

【００１４】サブフレーム分割器１２０は、バッファに
蓄積された音声信号をいくつかのサブフレームに分割す
る装置である。

【００１５】ＬＰＣ分析器２００は、フレーム毎に音声
のスペクトルパラメータであるＬＰＣ係数を抽出する装
置である。

【００１６】以上のバッファ装置１０５，音声判定器１
１０，サブフレーム分割器１２０，ＬＰＣ分析器２００
は既存のものを用いる。

【００１７】ＬＰＣ係数量子化器２１０は、ＬＰＣ係数
を量子化する装置であり、いかなる方法を用いても構わ
ない。

【００１８】重み付けフィルタ１３０は、サブフレーム
に分割された音声信号に対して周知の聴感重み付けを行
う。

【００１９】影響信号減算器１４０は、重み付けされた
合成フィルタを初期状態を１サブフレーム前の重み付け
合成信号の最後の状態とし零励振することにより計算さ
れた影響信号を重み付けされた信号より減算する。

【００２０】適応コードブック器１５０は、過去の音源
を遅延させた音源を生成する。遅延は整数でも小数でも
よいが、小数の方が音質がより良好となる。小数の場合
、過去の音源をポリフェーズフィルタリングにより小数
化する。ポリフェーズフィルタリングの詳細は、例えば
、Ｐ．Ｋｒｏｏｎ“Ｐｉｔｃｈ　　ｐｒｅｄｉｃｔｏｒ
ｓ　　ｗｉｔｈ　　ｈｉｇｈ　　ｔｅｍｐｏｒａｌ　　
ｒｅｓｏｌｕｔｉｏｎ”と題した論文（Ｐｒｏｃ．ＩＣ
ＡＳＳＰ，ｐｐ．６６１−６６４，１９９０年）（文献
４）等を参照できる。

【００２１】コムフィルタ１６０は、適応コードブック
器１５０で生成された過去の音源の遅延音源をその遅延
に応じたコムフィルタリングを行う。コムフィルタの形
としては、ＩＩＲ型，ＦＩＲ型いずれでも構わない。具
体的な方法は前記文献３等を参照できる。

【００２２】重み付けフィルタ１７０は、分析により得
られたＬＰＣ係数を周知の聴感重み付けしたフィルタ係
数による合成を行う。

【００２３】遅延決定器１８０は、コムフィルタリング
された過去の遅延ありの音源と重み付け信号を２乗距離
が最小になる遅延を決定する回路である。

【００２４】音源コードブック探索器１９０で音源コー
ドブックの探索を行う。この場合、音源コードブックは
雑音コードブックでもＬＢＧ法等のＶＱアルゴリズムに
より学習された学習コードブックでも何でも構わない。前者は前記文献１を参照できる。また、後者は特願平２
−４２９５５号明細書（文献５）や、特願平２−４２９
５６号明細書（文献６）等を参照できる。２２０はマル
チプレクサである。

【００２５】まず、図１の実施例の動作を説明する。

【００２６】信号線１００から音声信号を入力しバッフ
ァ１０５で音声信号を記憶しておき、記憶された信号を
用いて有声判定器１１０で母音の判別を行う。ＬＰＣ分
析器２００でＬＰＣ分析し、スペクトルパラメータであ
るＬＰＣ係数を算出する。算出されたＬＰＣ係数はＬＰ
Ｃ係数量子化器２１０で量子化されマルチプレクサに送
られるとともに、再度ＬＰＣ係数に復号化され以下の処
理に用いられる。記憶された音声信号をサブフレーム分
割器１２０で分割し、各サブフレーム毎の信号に対して
、以下の処理を行う。まず、重み付けフィルタ１３０で
音声信号に聴感重み付けを施し、影響信号減算器１４０
では影響信号を算出し、重み付け信号から差し引く。適応コードブック器１５０で過去の音源を遅延させた音
源信号を生成し、有声判定器１１０で有声と判定された
フレームでは、コムフィルタ１６０でその遅延値に応じ
たコムフィルタリングを行う。有声でないと判定された
場合、コムフィルタリングは行わない。次に、コムフィ
ルタ１６０の出力を入力とし、重み付け合成を行う。重
み付け合成信号と重み付け信号の２乗距離が最小になる
遅延を遅延決定器１８０で決定する。最適な遅延が決定
された後、最適な遅延に対応する適応コードブックの出
力を入力とし、重み付け合成を行い、重み付け信号から
適応コードブックによる重み付け合成信号を減算する。減算された信号に対して、音源コードブック探索器１９
０で音源コードブックの探索を行う。マルチプレクサ２
２０は、ＬＰＣ係数量子化器２１０，適応コードブック
遅延決定器１８０，音源コードブック探索器１９０の出
力符号系列を組み合わせて出力する。これらの処理を各
サブフレーム毎に行う。

【００２７】次に、図２の実施例の動作を説明する。

【００２８】第１の発明では、コムフィルタ１６０の出
力は遅延の決定のみに用いられていたが、第２の発明で
は、コムフィルタ１６０の出力を適応コードブックの出
力として用いるところのみが異なっている。ここでは、
その点のみを説明する。遅延決定器１８０で遅延の決定
がされた後、コムフィルタ１６０の出力を適応コードブ
ックの出力として用い、合成フィルタ１７０でそれを入
力として重み付け合成を行った後、重み付け信号から減
算し、音源コードブック探索器１９０で音源コードブッ
クを探索する。

【００２９】以上で本発明による実施例の説明を終える
。

【００３０】本実施例の構成以外にも種々の変形が可能
である。

【００３１】適応コードブックの遅延の計算では、演算
量を低減するために、入力の重み付け信号等を用いて相
関演算により遅延の候補を複数種類求め、各候補に対し
て、近傍数サンプルの範囲で最適な小数遅延を決定する
構成をとることもできる。

【００３２】また、適応コードブック，音源コードブッ
クをサブフレームでは一意に決定せずに、誤差電力の小
さい順に複数種類の候補を求め、これをフレーム全体で
累積し、フレーム全体での累積誤差電力を最小化する適
応コードブック，音源コードブックの組合せを選択する
ようにしてもよい。

【００３３】

【発明の効果】以上述べたように、本発明によれば、音
声の有声区間で適応コードブックに適応コムフィルタを
使用することにより、スムーズな遅延を得ることができ
ると共に適応コードブックの遅延が誤ったときでも雑音
感の少ない良好な再生音声が得られるという大きな効果
がある。

【図面の簡単な説明】

【図１】第１の本発明の実施例を示す構成図である。

【図２】第２の発明の実施例を示す構成図である。

【符号の説明】

１００　　音声入力ポート１０５　　バッファ装置１１０　　有声判定器１２０　　サブフレーム分割器１３０　　重み付けフィルタ１４０　　影響信号減算器１５０　　適応コードブック器１６０　　コムフィルタ１７０　　重み付け合成フィルタ１８０　　遅延決定器１９０　　音源コードブック探索器２００　　ＬＰＣ分析器２１０　　ＬＰＣ係数量子化器２２０　　マルチプレクサ

Claims

【特許請求の範囲】

【請求項１】音声信号を蓄積する手段と、音声信号の有
声性判定を行う手段と、音声信号をサブフレームに分割
する手段と、音声信号を分析する手段と、音声信号に対
して聴覚上の重み付けを加える手段と、有声と判定され
たフレームのみ適応コードブックの出力にその遅延で規
定されるコムフィルタリングを行う手段と、コムフィル
タの出力を用いて最適な遅延を決定する手段と、重み付
け信号から最適遅延に相当する適応コードブックの出力
を減算する手段と、音源コードブックから最適な音源を
抽出する手段とを有することを特徴とする音声符号化方
式。
【請求項２】音声信号を蓄積する手段と、音声信号の有
声性判定を行う手段と、音声信号をサブフレームに分割
する手段と、音声信号を分析する手段と、音声信号に対
して聴覚上の重み付けを加える手段と、有声と判定され
たフレームのみ適応コードブックの出力にその遅延で規
定されるコムフィルタリングを行う手段と、コムフィル
タの出力を用いて最適な遅延を決定する手段と、最適な
遅延に相当するコムフィルタの出力を重み付け信号から
減算する手段と、音源コードブックから最適音源を抽出
する手段とを有することを特徴とする音声符号化方式。