JPH09185396A

JPH09185396A - 音声符号化装置

Info

Publication number: JPH09185396A
Application number: JP7352199A
Authority: JP
Inventors: 秀享 ▲高▼橋; Hideyuki Takahashi
Original assignee: Olympus Optical Co Ltd
Current assignee: Olympus Corp
Priority date: 1995-12-28
Filing date: 1995-12-28
Publication date: 1997-07-15

Abstract

(57)【要約】【課題】雑音環境下においても音声信号を良好に符号化
して高音質の音声信号を得ることができる音声符号化装
置を提供する。【解決手段】あらかじめ定められたフレーム間隔に分割
されたフレーム単位の入力信号が音声信号か非音声信号
かを判別する音声判別器１１と、過去の音源信号に遅延
を与えて作成した信号をあらかじめ複数記憶している適
応コードブック１と、サブフレーム間隔の雑音信号波形
を複数記憶している確率コードブック４と、入力信号の
ピッチ周期性を分析するピッチ周期性分析器１０と、音
声判別器１１の判別結果およびピッチ周期性分析器１０
の分析結果に応じて、確率コードブック４と適応コード
ブック１の両方もしくは一方のゲインの値を増減させる
ゲイン調整器１５とを具備する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は音声符号化装置に関す
る。

【０００２】

【従来の技術】音声信号を能率よく圧縮するために広く
用いられている手段として、音声信号を、スペクトル包
絡を表す線形予測パラメータと、線形予測残差信号に対
応する音源パラメータとを用いて符号化する方式があ
る。このような線形予測の手段を用いた音声符号化方式
は、少ない伝送容量で比較的高品質な合成音声が得られ
ることから、最近のハードウェア技術の進歩と相まっ
て、さまざまな応用方式がさかんに研究、開発されてい
る。その中でも良い音質が得られる方式として、過去の
音源信号を繰り返して得られる適応コードブックを用い
るＣＥＬＰ(Code Excited Linear Predictive Coding)
方式がよく知られている。ＣＥＬＰ方式については例え
ば、kleijin 等による“Improved speech quality and
efficientvector quantization in SELP ”(ICASP' 88
s4.4,pp.155-158,1988) と題した論文に記載されてい
る。

【０００３】図６は、適応コードブックを備えた従来の
コード駆動線形予測方式の音声符号化装置のブロック図
である。同図において、適応コードブック５１は乗算器
５２を介して加算器５３の第１入力端子に接続されてい
る。確率コードブック５４は乗算器５５とスイッチ５６
とを介して加算器５３の第２入力端子に接続されてい
る。

【０００４】加算器５３の出力端子は遅延回路５７を介
して適応コードブック５１に接続されるとともに、合成
フィルタ５８の第１入力端子に接続されている。

【０００５】また、ディジタル音声信号が入力される入
力端子６６に接続されたバッファメモリ５９は、ＬＰＣ
分析器６０を介して合成フィルタ５８の第２入力端子に
接続されるとともに、サブフレーム分割器６１を介して
減算器６２の第１入力端子に接続されている。この減算
器６２の第２入力端子は合成フィルタ５８の出力端子に
接続され、出力端子は聴感重み付けフィルタ６３を介し
て誤差評価器６４に接続されている。誤差評価器６４は
適応コードブック５１と、確率コードブック５４と、乗
算器５２、５５とに接続されている。

【０００６】さらに、ＬＰＣ分析器６０と、誤差評価器
６４とはマルチプレクサ６５に接続されている。

【０００７】上記した構成において、入力端子６６か
ら、例えば８ｋＨｚでサンプリングされた原音声信号を
入力し、予め定められたフレーム間隔（例えば２０ｍ
ｓ、すなわち１６０サンプル）の音声信号をバッファメ
モリ５９に格納する。バッファメモリ５９は、フレーム
単位で原音声信号をＬＰＣ分析器６０に送出する。ＬＰ
Ｃ分析器６０は、原音声信号に対して線形予測（ＬＰ
Ｃ）分析を行い、スペクトル特性を表す線形予測パラメ
ータαを抽出し、合成フィルタ５８およびマルチプレク
サ６５に送出する。サブフレーム分割器６１は、フレー
ムの原音声信号を予め定められたサブフレーム間隔（例
えば５ｍｓ、すなわち４０サンプル）に分割する。すな
わち、フレームの原音声信号から、第１サブフレームか
ら第４サブフレームまでのサブフレーム信号が作成され
る。

【０００８】また、適応コードブック５１の遅延Ｌとゲ
インβは、以下の処理によって決定される。

【０００９】まず、遅延回路５７で、先行サブフレーム
における合成フィルタ５８の入力信号すなわち駆動音源
信号に、ピッチ周期に相当する遅延を与えて適応コード
ベクトルとして作成する。例えば、想定するピッチ周期
を４０〜１６７サンプルとすると、４０〜１６７サンプ
ル遅れの１２８種類の信号が適応コードベクトルとして
作成され、適応コードブック５１に格納される。このと
きスイッチ５６は開いた状態となっている。したがっ
て、適応コードブック５１からの各適応コードベクトル
は乗算器５２で可変のゲイン値が乗じられたのち、加算
器５３を通過してそのまま合成フィルタ５８に入力され
る。合成フィルタ５８は線形予測パラメータαを用いて
合成処理を行い、合成ベクトルを減算器６２に送出す
る。減算器６２は原音声ベクトルと合成ベクトルとの減
算を行い、得られた誤差ベクトルを聴感重み付けフィル
タ６３に送出する。聴感重み付けフィルタ６３は誤差ベ
クトルに対して聴感特性を考慮した重み付け処理を行
い、誤差評価器６４に送出する。誤差評価器６４は誤差
ベクトルの２乗平均を計算し、その２乗平均値が最小と
なる最適な適応コードベクトルを検索して、その遅延Ｌ
とゲインβをマルチプレクサ６５に送出する。このよう
にして、適応コードブック５１の遅延Ｌとゲインβが決
定される。

【００１０】次に、確率コードブック５４のインデック
スｉとゲインγは、以下の処理によって決定される。

【００１１】確率コードブック５４には、サブフレーム
長に対応する次元数（すなわち４０次元）の確率的信号
ベクトルが例えば５１２種類、予め格納されており、各
々にインデックスが付与されている。このときスイッチ
５６は閉じた状態となっている。

【００１２】まず、前記処理によって決定された最適な
適応コードベクトルに対して乗算器５２で最適ゲインβ
を乗じたのち、加算器５３に送出する。

【００１３】次に、確率コードブック５４からの各確率
コードベクトルに対して乗算器５５で可変のゲイン値を
乗じたのち、加算器５３に入力する。加算器５３は前記
最適ゲインβを乗じた最適な適応コードベクトルと各確
率コードベクトルとの加算を行い、加算結果を合成フィ
ルタ５８に入力する。この後の処理は前記した適応コー
ドブック５１のパラメータ（遅延Ｌとゲインβ）の決定
処理と同様に行われる。

【００１４】すなわち、合成フィルタ５８は線形予測パ
ラメータαを用いて合成処理を行い、合成ベクトルを減
算器６２に送出する。減算器６２は原音声ベクトルと合
成ベクトルとの減算を行い、得られた誤差ベクトルを聴
感重み付けフィルタ６３に送出する。聴感重み付けフィ
ルタ６３は誤差ベクトルに対して聴感特性を考慮した重
み付け処理を行い、誤差評価器６４に送出する。誤差評
価器６４は誤差ベクトルの２乗平均を計算し、その２乗
平均値が最小となる確率コードベクトルを検索して、そ
のインデックスｉとゲインγをマルチプレクサ６５に送
出する。このようにして、確率コードブック５４のイン
デックスｉとゲインγが決定される。

【００１５】マルチプレクサ６５は、量子化された線形
予測パラメータαと、適応コードブック５１の遅延Ｌ及
びゲインβと、確率コードブック５４のインデックスｉ
及びゲインγの各々をマルチプレクスする。

【００１６】また、このような音声符号化装置において
は、上述したように有声音に対するピッチ周期性は過去
の音源信号に遅延を与えて作り出される。しかし、過去
の音源信号はもともと雑音系列から作られているため、
有声音の音源に相当するパルス系列を作り出すのが困難
となる。この影響により特に有声音において再生音声に
高周波ノイズが多く含まれて、音質が劣化してしまう。
この問題を解決するために種々の提案がなされている
が、その一例が、“DETAILS TO ASSIST INIMPLEMENTATI
ON OF FEDERAL STANDARD 1016 CELP ”(NATIONAL COMM
UNICATIONSSYSTEM, TECHNICAL INFOMATION BULLETIN 92
-1,PP.10-11,1992)に詳細に記載されている。

【００１７】図７は、図６に示すコード駆動線形予測方
式の音声符号化装置に対応する復号化器のブロック図で
ある。同図において、適応コードブック７０は乗算器７
１を介して加算器７２の第１入力端子に接続されてい
る。確率コードブック７３は乗算器７４とスイッチ７５
とを介して加算器７２の第２入力端子に接続されてい
る。加算器７２の出力端子は遅延回路７６を介して適応
コードブック７０に接続されるとともに、出力端子７９
を有する合成フィルタ７７の第１入力端子に接続されて
いる。

【００１８】また、デマルチプレクサ７８は、適応コー
ドブック７０と、確率コードブック７３と、乗算器７
１、７４と、合成フィルタ７７の第２入力端子とに接続
されている。

【００１９】なお、ここでは合成フィルタ７７の構成は
前記した図６に示す合成フィルタ５８の構成と同一であ
るとする。

【００２０】上記した構成において、デマルチプレクサ
７８は受信した信号を線形予測パラメータαと、適応コ
ードブック７０の遅延Ｌ及びゲインβと、確率コードブ
ック７３のインデックスｉ及びゲインγとに分解して、
分解された線形予測パラメータαを合成フィルタ７７
に、遅延Ｌとゲインβを各々適応コードブック７０と乗
算器７１に、インデックスｉとゲインγを各々確率コー
ドブック７３と乗算器７４に出力する。

【００２１】デマルチプレクサ７８から出力された適応
コードブック７０の遅延Ｌに基づいて適応コードブック
７０の適応コードベクトルを選択する。ここで適応コー
ドブック７０は符号化装置における適応コードブック５
１の内容と同じ内容を有する。すなわち、適応コードブ
ック７０には、遅延回路７６を介して過去の駆動音源信
号が入力される。乗算器７１は受信したゲインβに基づ
いて入力された適応コードベクトルを増幅し、加算器７
２に送出する。

【００２２】次に、デマルチプレクサ７８から出力され
た確率コードブック７３のインデックスｉに基づいて確
率コードブック７３の確率コードベクトルを選択する。
ここで確率コードブック７３は符号化装置における確率
コードブック５４の内容と同じ内容を有する。乗算器７
４は受信したゲインγに基づいて入力された確率コード
ベクトルを増幅し、加算器７２に送出する。

【００２３】加算器７２は増幅された確率コードベクト
ルと増幅された適応コードベクトルとを加算して合成フ
ィルタ７７および遅延回路７６に送出する。合成フィル
タ７７は受信した線形予測パラメータαを係数として合
成処理を行い、合成音声信号を出力端子７９から出力す
る。

【００２４】

【発明が解決しようとする課題】しかしながら、上述し
たような線形予測分析を用いる音声符号化装置は、比較
的低いビットレートで高品質な符号化性能を得ることが
できるが、本装置を非音声信号すなわち背景雑音が不可
避的に存在する環境下で、例えば、移動体電話や音声録
音装置として使用する場合は、音声信号に背景雑音が混
入して符号化した信号の音質が大きく劣化してしまうと
いう問題があった。

【００２５】本発明の音声符号化装置はこのような課題
に着目してなされたものであり、その目的とするところ
は、雑音環境下においても音声信号を良好に符号化して
高音質の音声信号を得ることができる音声符号化装置を
提供することにある。

【００２６】

【課題を解決するための手段】上記の目的を達成するた
めに、第１の発明に係る音声符号化装置は、あらかじめ
定められたフレーム間隔に分割されたフレーム単位の入
力信号が音声信号か非音声信号かを判別する音声判別手
段と、上記入力信号を分析し、そのスペクトルパラメー
タを出力する線形予測分析手段と、上記入力信号のフレ
ーム間隔をさらに所定のサブフレーム間隔に分割するサ
ブフレーム分割手段と、過去の音源信号に遅延を与えて
作成した信号をあらかじめ複数記憶している適応コード
ブックと、上記サブフレーム間隔の雑音信号波形を複数
記憶している確率コードブックと、上記確率コードブッ
クと上記適応コードブックの両方もしくは一方から出力
される信号に基づき駆動音源信号を生成する駆動音源信
号生成手段と、上記スペクトルパラメータをもとに、上
記確率コードブックと上記適応コードブックから出力さ
れる信号を駆動音源信号として音声を合成する合成フィ
ルタと、入力信号に対する合成信号の歪みを最小とする
適応コードブックの遅延、確率コードブックのインデッ
クス、およびそれぞれのゲインに対応する符号を出力す
る誤差最小化手段と、入力信号のピッチ周期性を分析す
るピッチ周期性分析手段と、上記音声判別手段の判別結
果および上記ピッチ周期性分析手段の分析結果に応じ
て、上記確率コードブックと上記適応コードブックの両
方もしくは一方のゲインを増減させるゲイン調整手段と
を具備する。

【００２７】また、第２の発明に係る音声符号化装置
は、第１の発明に係る音声符号化装置において、上記駆
動音源信号生成手段は、上記音声判別手段が入力信号を
音声信号と判別したときには、上記確率コードブックと
上記適応コードブックから出力される信号から駆動音源
信号を生成し、上記音声判別手段が入力信号を非音声信
号と判別したときには、上記確率コードブックのみから
出力される信号から駆動音源信号を生成する。

【００２８】また、第３の発明に係る音声符号化装置
は、第１の発明に係る音声符号化装置において、上記ゲ
イン調整手段は、上記音声判別手段が入力信号を非音声
信号と判別したときには、音声信号と判別したときに対
して所定の割合で確率コードブックと適応コードブック
の両方または一方のゲインを減衰させる。

【００２９】また、第４の発明に係る音声符号化装置
は、第１または第２の発明に係る音声符号化装置におい
て、上記音声判別手段は、フレーム毎に入力信号のエネ
ルギーの大きさによって音声／非音声を判別するもので
あって、符号化開始時のフレームエネルギーに応じて判
別閾値を決定する閾値決定手段を具備し、現在のフレー
ムエネルギーと符号化開始時のフレームエネルギーとの
差が、上記閾値決定手段により決定された判別閾値より
大きければ音声、小さければ非音声とする。

【００３０】すなわち、第１の発明に係る音声符号化装
置は、あらかじめ定められたフレーム間隔に分割された
フレーム単位の入力信号が音声信号か非音声信号かを音
声判別手段によって判別するとともに、線形予測分析手
段によって上記入力信号を分析してそのスペクトルパラ
メータを出力し、さらには上記入力信号のフレーム間隔
をサブフレーム分割手段によって所定のサブフレーム間
隔に分割する。また、過去の音源信号に遅延を与えて作
成した信号をあらかじめ複数記憶している適応コードブ
ックと、上記サブフレーム間隔の雑音信号波形を複数記
憶している確率コードブックの両方もしくは一方から出
力される信号に基づいて、駆動音源信号生成手段によっ
て駆動音源信号を生成する。そして、上記スペクトルパ
ラメータをもとに、合成フィルタによって上記確率コー
ドブックと上記適応コードブックから出力される信号を
駆動音源信号として音声を合成するとともに、誤差最小
化手段によって、入力信号に対する合成信号の歪みを最
小とする適応コードブックの遅延、確率コードブックの
インデックス、およびそれぞれのゲインに対応する符号
を出力する。そして、ピッチ周期性分析手段によって入
力信号のピッチ周期性を分析し、上記音声判別手段の判
別結果および上記ピッチ周期性分析手段の分析結果に応
じて、上記確率コードブックと上記適応コードブックの
両方もしくは一方のゲインをゲイン調整手段によって増
減させるようにする。

【００３１】また、第２の発明に係る音声符号化装置
は、第１の発明に係る音声符号化装置において、上記音
声判別手段が入力信号を音声信号と判別したときには、
上記駆動音源信号生成手段によって、上記確率コードブ
ックと適応コードブックから出力される信号から駆動音
源信号を生成し、上記音声判別手段が入力信号を非音声
信号と判別したときには、上記確率コードブックのみか
ら出力される信号から駆動音源信号を生成するようにす
る。

【００３２】また、第３の発明に係る音声符号化装置
は、第１の発明に係る音声符号化装置において、上記音
声判別手段が入力信号を非音声信号と判別したときに
は、上記ゲイン調整手段によって、音声信号と判別した
ときに対して所定の割合で確率コードブックと適応コー
ドブックの両方または一方のゲインを減衰させるように
する。

【００３３】また、第４の発明に係る音声符号化装置
は、第１、第２、または第３の発明に係る音声符号化装
置において、上記音声判別手段を用いて、フレーム毎に
入力信号のエネルギーの大きさによって音声／非音声を
判別するとともに、閾値決定手段によって、符号化開始
時のフレームエネルギーに応じて判別閾値を決定する。
そして、現在のフレームエネルギーと符号化開始時のフ
レームエネルギーとの差が、上記閾値決定手段により決
定された判別閾値より大きければ音声、小さければ非音
声とする。

【００３４】

【発明の実施の形態】以下、図面を参照して本発明の一
実施形態を詳細に説明する。

【００３５】図１は本発明が適用される音声符号化装置
の構成を示すブロック図である。

【００３６】同図において、適応コードブック１は乗算
器２とスイッチ１９とを介して、駆動音源信号生成手段
としての加算器３の第１入力端子に接続され、確率コー
ドブック４は乗算器５とスイッチ６とを介して加算器３
の第２入力端子に接続されている。加算器３の出力端子
は合成フィルタ８を介して減算器１２の第１入力端子に
接続されるとともに、遅延回路７を介して適応コードブ
ック１に接続されている。

【００３７】また、入力端子１９に接続されたバッファ
メモリ９は、線形予測分析手段としてのＬＰＣ分析器１
６を介して合成フィルタ８に接続されるとともに、サブ
フレーム分割手段としてのサブフレーム分割器１７を介
して減算器１２に、音声判別手段としての音声判別器１
１を介してゲイン調整器１５に、さらに、ピッチ周期性
分析手段としてのピッチ周期性分析器１０を介して、ゲ
イン調整手段としてのゲイン調整器１５に接続されてい
る。このゲイン調節器１５は乗算器５に接続されてい
る。減算器１２の出力端子は聴感重み付けフィルタ１３
を介して誤差最小化手段としての誤差評価器１４の入力
端子に接続されている。この誤差評価器１４の出力端子
は適応コードブック１と、確率コードブック４と、乗算
器２、５に接続されている。

【００３８】さらに、マルチプレクサ１８は音声判別器
１１とＬＰＣ分析器１６と誤差評価器１４とに接続され
ている。

【００３９】図２は、図１に示す音声判別手段としての
音声判別器１１の構成を示すものである。同図におい
て、フレームエネルギー分析回路１２０は加算器１２１
の第１入力端子に接続されている。また、初期フレーム
エネルギー分析回路１２２は閾値決定手段としての閾値
決定回路１２４と、加算器１２１の第２入力端子に接続
されている。加算器１２１の出力端子と閾値決定回路１
２４とは判別回路１２３に接続されている。

【００４０】上記した構成において、入力端子９から、
例えば８ｋＨｚでサンプリングされた原音声信号を入力
し、あらかじめ定められたフレーム間隔（例えば２０ｍ
ｓ、すなわち１６０サンプル）の音声信号をバッファメ
モリ９に格納する。バッファメモリ９は、入力信号をフ
レーム単位でＬＰＣ分析器１６、サブフレーム分割器１
７、音声判別器１１、およびピッチ周期性分析器１０に
送出する。ＬＰＣ分析器１６は、入力信号に対して線形
予測（ＬＰＣ）分析を行い、スペクトル特性を表す線形
予測パラメータαを抽出し、合成フィルタ８およびマル
チプレクサ１８に送出する。サブフレーム分割器１７
は、フレームの入力信号をあらかじめ定められたサブフ
レーム間隔（例えば５ｍｓ、すなわち４０サンプル）に
分割する。ここでは、フレームの入力信号から、第１サ
ブフレームから第４サブフレームまでのサブフレーム信
号が作成される。

【００４１】音声判別器１１は、フレームの入力信号が
音声か非音声かを、以下の方法で判別する。すなわち、
図２に示す構成において、フレームエネルギー分析回路
１２０は入力されたフレーム入力信号のフレームエネル
ギーＥ_f［ｄＢ］を以下の式により算出する。

【００４２】

【数１】ただし、ｓ（ｎ）はサンプルｎにおける入力信号、Ｎは
フレーム長を示す。

【００４３】また、初期フレームエネルギー分析回路１
２２は符号化開始時のフレームエネルギーＥ_b［ｄＢ］
を上式により同様に算出する。

【００４４】閾値決定回路１２４は、例えば図３に示す
ような背景雑音エネルギー［ｄＢ］と閾値［ｄＢ］との
関係を基に、背景雑音エネルギーの大きさに応じて閾値
を決定して判別回路１２３に送出する。また、加算器１
２１ではフレームエネルギーＥ_f［ｄＢ］から初期フレ
ームエネルギーＥ_b［ｄＢ］を減算し、その減算結果を
判別回路１２３に送出する。そして、判別回路１２３は
入力された減算結果と閾値を比較し、減算結果が閾値よ
り大きければフレーム入力信号は音声信号であると判別
し、そうでなければ非音声信号である判別する。

【００４５】図１に戻って、音声判別器１１において入
力信号が音声信号であると判別されるとスイッチ１９は
閉じられる。また、入力信号が非音声信号であると判別
されるとスイッチ１９は開かれる。このような制御動作
により、音声区間では適応コードブック１１と確率コー
ドブック４から出力される信号から駆動音源信号が生成
され、非音声区間では確率コードブック４のみから駆動
音源信号が生成される。これは、非音声区間においては
適応コードブック１は単にもう一つの確率コードブック
としてしか機能しなくなるため、音質の向上にはほとん
ど寄与しないためである。音声区間においては、適応コ
ードブック１の遅延Ｌとゲインβは、前記した従来例と
同様に決定される。また、確率コードブック４のインデ
ックスｉとゲインγも、前記した従来例と同様に決定さ
れる。

【００４６】ピッチ周期性分析器１０は、フレーム入力
信号のピッチ周期性を分析する。本実施形態では、例え
ば選択された適応コードベクトルをβ倍した信号（ピッ
チ予測信号）と、入力信号との相互相関を計算する。す
なわち、この相互相関の値が高ければより周期性の高
い、有声音であるといえ、反対に相互相関の値が低けれ
ば、無声音または非音声であるといえる。

【００４７】相互相関を計算するにあたって、ここでは
下式で示される入力信号とピッチ予測信号との一般化相
互相関Ｒを用いる。

【００４８】

【数２】ただし、ｓ（ｎ）は前記したようにサンプルｎにおける
入力信号であり、ｐ（ｎ）はサンプルｎにおけるピッチ
予測信号である。

【００４９】ゲイン調整器１５はピッチ周期性分析器１
０の分析結果としての一般化相互相関Ｒの値と、音声判
別器１１の判別結果ｖ／ｕｖ（ｖはｖｏｉｃｅ（音声）
を意味し、ｕｖはｕｎｖｏｉｃｅ（非音声）を意味す
る）に応じて、確率コードブック４と、適応コードブッ
ク１の両方もしくは一方のゲインを増減させる。本実施
形態では、非音声信号であると判別されたときは、図４
に示すような一般化相互相関Ｒ［ｄＢ］と確率コードブ
ックのゲインの倍率との関係に基づいて、音声信号であ
ると判別されたときに対する所定の割合で音声確率コー
ドブック４のゲインγを減衰させるようにする。

【００５０】このような処理により、音声区間では通常
のピッチ強調処理が行われ、非音声区間では図４に示す
ように確率コードブック４のゲインγが減衰されるの
で、背景雑音を抑制することができる。

【００５１】マルチプレクサ１８は、量子化された線形
予測パラメータαと、適応コードブック１の遅延Ｌ及び
ゲインβと、確率コードブック４のインデックスｉ及び
ゲインγと、音声判別情報ｖ／ｕｖの各々をマルチプレ
クスして伝送する。

【００５２】続いて、上記した音声符号化装置に対応す
る音声復号化装置の復号化動作を図面を参照して詳細に
説明する。

【００５３】図５は、図１の音声符号化装置に対応する
音声復号化装置のブロック図である。同図において、適
応コードブック３０は、乗算器３１とスイッチ３２を介
して加算器３３の第１入力端子に接続されている。確率
コードブック３６は、乗算器３７とスイッチ３８とを介
して加算器３３の第２入力端子に接続されている。加算
器３３の出力端子は遅延回路４０を介して適応コードブ
ック３０に接続されるとともに、出力端子３９を有する
合成フィルタ３４の第１入力端子に接続されている。

【００５４】また、デマルチプレクサ３５は、適応コー
ドブック３０と、確率コードブック３６と、乗算器３
１、３７と、合成フィルタ３４の第２入力端子とに接続
されている。

【００５５】上記した構成において、デマルチプレクサ
３５は受信した信号を線形予測パラメータαと、適応コ
ードブック３０の遅延Ｌ及びゲインβと、確率コードブ
ック３６のインデックスｉ及びゲインγと、音声判別情
報ｖ／ｕｖとに分解して、分解された線形予測パラメー
タαを合成フィルタ３４に、遅延Ｌとゲインβを各々適
応コードブック３０と乗算器３１に、インデックスｉと
ゲインγを各々確率コードブック３６と乗算器３７に、
音声判別情報ｖ／ｕｖをスイッチ３２に出力する。

【００５６】そして、デマルチプレクサ３５から出力さ
れた音声判別情報ｖ／ｕｖに基づいてスイッチ３２の開
閉動作を制御する。すなわち、音声判別情報ｖ／ｕｖが
音声信号であることを示していればスイッチ３２を閉じ
て適応コードブック３０からの情報を使用する。一方、
音声判別情報ｖ／ｕｖが非音声信号であることを示して
いればスイッチ３２を開いて適応コードブック３０を未
使用とする。

【００５７】また、デマルチプレクサ３５から出力され
た適応コードブック３０の遅延Ｌに基づいて適応コード
ブック３０の適応コードベクトルを選択する。ここで適
応コードブック３０は図１に示す音声符号化装置におけ
る適応コードブック１の内容と同じ内容を有する。すな
わち、適応コードブック３０には、遅延回路４０を介し
て過去の駆動音源信号が入力される。乗算器３１は受信
したゲインβにより、入力された適応コードベクトルを
増幅し、加算器３３に送出する。

【００５８】デマルチプレクサ３５から出力された確率
コードブック３６のインデックスｉに基づいて確率コー
ドブック３６の確率コードベクトルを選択する。ここで
確率コードブック３６は図１に示す音声符号化装置にお
ける確率コードブック４の内容と同じ内容を有する。乗
算器３７は受信したゲインγにより、入力された確率コ
ードベクトルを増幅し、加算器３３に送出する。

【００５９】加算器３３は増幅された適応コードベクト
ルと、増幅された確率コードベクトルとを加算して合成
フィルタ３４および遅延回路４０に送出する。合成フィ
ルタ３４は受信した線形予測パラメータαを係数として
合成処理を行い、合成音声信号を出力する。

【００６０】上記したように本実施形態では、音声区間
と非音声区間との間でピッチ強調処理におけるゲイン調
整の割合を切り替えている。すなわち、入力信号が音声
信号であると判別されたときには通常のピッチ強調処理
を行なうが、非音声信号であると判別されたときには確
率コードブックのゲインを減衰させている。したがっ
て、雑音環境下においても音声信号を良好に符号化して
高音質の音声信号を得ることができる。また、音声判別
器１１内の閾値決定回路１２４によって符号化開始時の
フレームエネルギーに応じて判別閾値を決定するので、
背景雑音の大きさに適応して閾値が決定されることにな
り、より精度よく音声／非音声の判別ができる。

【００６１】

【発明の効果】請求項１、２、３に記載の発明によれ
ば、雑音環境下においても音声信号を良好に符号化して
高音質の音声信号を得ることができる効果を奏する。

【００６２】また、請求項４記載の発明によれば、請求
項１記載の発明の効果に加えて、より精度よく音声／非
音声の判別ができる効果を奏する。

【図面の簡単な説明】

【図１】本発明が適用される音声符号化装置の構成を示
すブロック図である。

【図２】図１に示す音声判別器の構成を示す図である。

【図３】背景雑音エネルギーと閾値との関係を示す図で
ある。

【図４】一般化相互相関と確率コードブックのゲインの
倍率との関係を示す図である。

【図５】図１に示す音声符号化装置に対応する音声復号
化装置の構成を示す図である。

【図６】従来の音声符号化装置のブロック図である。

【図７】図６に示す音声符号化装置に対応する音声復号
化装置の構成を示す図である。

【符号の説明】

１…適応コードブック、２、５…乗算器、３…加算器、
４…確率コードブック、６、１９…スイッチ、７…遅延
回路、８…合成フィルタ、９…バッファメモリ、１０…
ピッチ周期性分析器、１１…音声判別器、１２…減算
器、１３…聴感重み付けフィルタ、１４…誤差評価器、
１５…ゲイン調整器、１６…ＬＰＣ分析器、１７…サブ
フレーム分割器、１８…マルチプレクサ。

Claims

【特許請求の範囲】

【請求項１】あらかじめ定められたフレーム間隔に分
割されたフレーム単位の入力信号が音声信号か非音声信
号かを判別する音声判別手段と、上記入力信号を分析し、そのスペクトルパラメータを出
力する線形予測分析手段と、上記入力信号のフレーム間隔をさらに所定のサブフレー
ム間隔に分割するサブフレーム分割手段と、過去の音源信号に遅延を与えて作成した信号をあらかじ
め複数記憶している適応コードブックと、上記サブフレーム間隔の雑音信号波形を複数記憶してい
る確率コードブックと、上記確率コードブックと上記適応コードブックの両方も
しくは一方から出力される信号に基づき駆動音源信号を
生成する駆動音源信号生成手段と、上記スペクトルパラメータをもとに、上記確率コードブ
ックと上記適応コードブックから出力される信号を駆動
音源信号として音声を合成する合成フィルタと、入力信号に対する合成信号の歪みを最小とする適応コー
ドブックの遅延、確率コードブックのインデックス、お
よびそれぞれのゲインに対応する符号を出力する誤差最
小化手段と、入力信号のピッチ周期性を分析するピッチ周期性分析手
段と、上記音声判別手段の判別結果および上記ピッチ周期性分
析手段の分析結果に応じて、上記確率コードブックと上
記適応コードブックの両方もしくは一方のゲインを増減
させるゲイン調整手段と、を具備したことを特徴とする音声符号化装置。
【請求項２】上記駆動音源信号生成手段は、上記音声
判別手段が入力信号を音声信号と判別したときには、上
記確率コードブックと上記適応コードブックから出力さ
れる信号から駆動音源信号を生成し、上記音声判別手段
が入力信号を非音声信号と判別したときには、上記確率
コードブックのみから出力される信号から駆動音源信号
を生成することを特徴とする請求項１記載の音声符号化
装置。
【請求項３】上記ゲイン調整手段は、上記音声判別手
段が入力信号を非音声信号と判別したときには、音声信
号と判別したときに対して所定の割合で確率コードブッ
クと適応コードブックの両方または一方のゲインを減衰
させることを特徴とする請求項１記載の音声符号化装
置。
【請求項４】上記音声判別手段は、フレーム毎に入力
信号のエネルギーの大きさによって音声／非音声を判別
するものであって、符号化開始時のフレームエネルギー
に応じて判別閾値を決定する閾値決定手段を具備し、現
在のフレームエネルギーと符号化開始時のフレームエネ
ルギーとの差が、上記閾値決定手段により決定された判
別閾値より大きければ音声、小さければ非音声とするこ
とを特徴とする請求項１、２または３記載の音声符号化
装置。