JP2000200097A - 音声符号化装置、音声復号化装置及び音声符号化復号化装置 - Google Patents
音声符号化装置、音声復号化装置及び音声符号化復号化装置Info
- Publication number
- JP2000200097A JP2000200097A JP11001747A JP174799A JP2000200097A JP 2000200097 A JP2000200097 A JP 2000200097A JP 11001747 A JP11001747 A JP 11001747A JP 174799 A JP174799 A JP 174799A JP 2000200097 A JP2000200097 A JP 2000200097A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- vector
- codebook
- noise
- pitch position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【課題】 入力音声のピッチ位置でのピーク性の度合い
に応じて雑音符号帳を切り替え効率的な符号化を行う。 【課題手段】 適応符号帳11,17に記憶された時系
列ベクトルのピッチ位置とそのピーク性の度合いを求め
るピッチ位置抽出手段30,37、ピッチ位置における
ピーク性の度合いが大きい場合の雑音音源ベクトルを記
憶する第1の雑音符号帳33,40、ピッチ位置におけ
るピーク性の度合いが小さい場合の雑音音源ベクトルを
記憶する第2の雑音符号帳34,41、抽出されたピッ
チ位置におけるピーク性の度合いが閾値より大きい場合
はピッチ位置抽出手段により求められるピッチ位置を基
準とした第1の雑音符号帳の雑音音源ベクトルのピッチ
同期化を行い、上記ピーク性の度合いが閾値より小さい
場合は第2の雑音符号帳の雑音音源ベクトルをそのまま
出力する適応ピッチ同期化手段31,38を備える。
に応じて雑音符号帳を切り替え効率的な符号化を行う。 【課題手段】 適応符号帳11,17に記憶された時系
列ベクトルのピッチ位置とそのピーク性の度合いを求め
るピッチ位置抽出手段30,37、ピッチ位置における
ピーク性の度合いが大きい場合の雑音音源ベクトルを記
憶する第1の雑音符号帳33,40、ピッチ位置におけ
るピーク性の度合いが小さい場合の雑音音源ベクトルを
記憶する第2の雑音符号帳34,41、抽出されたピッ
チ位置におけるピーク性の度合いが閾値より大きい場合
はピッチ位置抽出手段により求められるピッチ位置を基
準とした第1の雑音符号帳の雑音音源ベクトルのピッチ
同期化を行い、上記ピーク性の度合いが閾値より小さい
場合は第2の雑音符号帳の雑音音源ベクトルをそのまま
出力する適応ピッチ同期化手段31,38を備える。
Description
【0001】
【発明の属する技術分野】この発明は、音声信号をディ
ジタル信号に圧縮符号化復号化する技術に関し、特に品
質の良い音声を再生するための音声符号化装置、音声復
号化装置及び音声符号化復号化装置に関する。
ジタル信号に圧縮符号化復号化する技術に関し、特に品
質の良い音声を再生するための音声符号化装置、音声復
号化装置及び音声符号化復号化装置に関する。
【0002】
【従来の技術】通信用の高能率音声符号化方法として
は、符号励振線形予測符号化(code-excited linear pr
ediction coding:CELP)が代表的である。この技
術については、m.r.shroeder and b.s.atal著“code-ex
cited linear prediction celp):high-quality speec
h at 8kbps”(icassp'85、pp.937-940、19
85)に述べられている。
は、符号励振線形予測符号化(code-excited linear pr
ediction coding:CELP)が代表的である。この技
術については、m.r.shroeder and b.s.atal著“code-ex
cited linear prediction celp):high-quality speec
h at 8kbps”(icassp'85、pp.937-940、19
85)に述べられている。
【0003】また、CELP系音声符号化復号化装置の
再生音声品質を向上するため、雑音符号帳内の符号ベク
トルをピッチ位置に同期化させて音源を生成する方法を
導入した音声符号化復号化装置として、特開平6−20
2699号公報がある。
再生音声品質を向上するため、雑音符号帳内の符号ベク
トルをピッチ位置に同期化させて音源を生成する方法を
導入した音声符号化復号化装置として、特開平6−20
2699号公報がある。
【0004】図8はこの従来の音声符号化復号化装置の
全体構成の一例を示す構成図である。図8において、1
は符号化部、2は復号化部、3は多重化手段、4は分離
手段、5は入力音声、6は符号、7は出力音声である。
符号化部1は、次の8〜14、20、21により構成さ
れている。8は入力音声5を分析し音声のスペクトル情
報である線形予測パラメータを分析抽出する線形予測パ
ラメータ分析手段、9はその線形予測パラメータを符号
化すると共に符号化した線形予測パラメータを合成フィ
ルタ10の係数として設定するための線形予測パラメー
タ符号化手段、10は合成フィルタ、11は過去の駆動
音源ベクトルが記憶してなる適応符号帳、12は雑音符
号帳、13はゲイン符号化手段、14は距離計算手段、
20はピッチ位置抽出手段、21はピッチ同期化手段で
ある。
全体構成の一例を示す構成図である。図8において、1
は符号化部、2は復号化部、3は多重化手段、4は分離
手段、5は入力音声、6は符号、7は出力音声である。
符号化部1は、次の8〜14、20、21により構成さ
れている。8は入力音声5を分析し音声のスペクトル情
報である線形予測パラメータを分析抽出する線形予測パ
ラメータ分析手段、9はその線形予測パラメータを符号
化すると共に符号化した線形予測パラメータを合成フィ
ルタ10の係数として設定するための線形予測パラメー
タ符号化手段、10は合成フィルタ、11は過去の駆動
音源ベクトルが記憶してなる適応符号帳、12は雑音符
号帳、13はゲイン符号化手段、14は距離計算手段、
20はピッチ位置抽出手段、21はピッチ同期化手段で
ある。
【0005】また、復号化部2は、次の15〜19、2
2、23により構成されている。15は線形予測パラメ
ータ復号化手段、16は合成フィルタ、17は適応符号
帳、18は雑音符号帳、19はゲイン復号化手段、22
はピッチ位置抽出手段、23はピッチ同期化手段であ
る。
2、23により構成されている。15は線形予測パラメ
ータ復号化手段、16は合成フィルタ、17は適応符号
帳、18は雑音符号帳、19はゲイン復号化手段、22
はピッチ位置抽出手段、23はピッチ同期化手段であ
る。
【0006】以下、従来の雑音符号帳12内の符号ベク
トルをピッチ位置に同期化させるCELP系音声符号化
復号化装置の動作を説明する。CELP系音声符号化で
は、5〜50ms程度を1フレームとして、そのフレー
ムの音声をスペクトル情報と音源情報に分けて符号化す
る。さらに、音源情報はフレームを分割してできるサブ
フレームの単位で符号化される。
トルをピッチ位置に同期化させるCELP系音声符号化
復号化装置の動作を説明する。CELP系音声符号化で
は、5〜50ms程度を1フレームとして、そのフレー
ムの音声をスペクトル情報と音源情報に分けて符号化す
る。さらに、音源情報はフレームを分割してできるサブ
フレームの単位で符号化される。
【0007】まず、符号化部1において、線形予測パラ
メータ分析手段8は、入力音声5を分析し、音声のスペ
クトル情報である線形予測パラメータを抽出する。線形
予測パラメータ符号化手段9は、その線形予測パラメー
タを符号化し、符号化した線形予測パラメータを合成フ
ィルタ10の係数として設定する。
メータ分析手段8は、入力音声5を分析し、音声のスペ
クトル情報である線形予測パラメータを抽出する。線形
予測パラメータ符号化手段9は、その線形予測パラメー
タを符号化し、符号化した線形予測パラメータを合成フ
ィルタ10の係数として設定する。
【0008】次に、音源情報の符号化について説明す
る。適応符号帳11には、過去の駆動音源ベクトルが記
憶されており、適応符号(ピッチ周期に対応)に対応し
て過去の駆動音源ベクトルをピッチ周期単位で繰り返し
た時系列ベクトルを出力する。ピッチ位置抽出手段20
は、この時系列ベクトルと線形予測パラメータ符号化手
段9から出力される線形予測パラメータを用いて合成音
声ベクトルAiを合成する。
る。適応符号帳11には、過去の駆動音源ベクトルが記
憶されており、適応符号(ピッチ周期に対応)に対応し
て過去の駆動音源ベクトルをピッチ周期単位で繰り返し
た時系列ベクトルを出力する。ピッチ位置抽出手段20
は、この時系列ベクトルと線形予測パラメータ符号化手
段9から出力される線形予測パラメータを用いて合成音
声ベクトルAiを合成する。
【0009】次に、ピッチ位置抽出手段20は、ピッチ
周期間隔のパルス列を作成し、これを音源として線形予
測パラメータ符号化手段9から出力される線形予測パラ
メータを用いて合成音声ベクトルBiを生成し、前記合
成ベクトルAiとの歪みが最小となるパルス列を探索す
る。そして、このときのパルス位置をピッチ位置として
抽出する。
周期間隔のパルス列を作成し、これを音源として線形予
測パラメータ符号化手段9から出力される線形予測パラ
メータを用いて合成音声ベクトルBiを生成し、前記合
成ベクトルAiとの歪みが最小となるパルス列を探索す
る。そして、このときのパルス位置をピッチ位置として
抽出する。
【0010】雑音符号帳12には、例えばランダム雑音
から生成した複数の時系列ベクトルが記憶されており、
雑音符号に対応した時系列ベクトルを出力する。各符号
ベクトルにはピッチ同期位置が設定されており、ピッチ
同期化手段21は、前記ピッチ位置抽出手段20で抽出
されたピッチ位置にピッチ同期位置が合うように、符号
ベクトルを切り出し、周期的に繰り返した時系列ベクト
ルを生成する。
から生成した複数の時系列ベクトルが記憶されており、
雑音符号に対応した時系列ベクトルを出力する。各符号
ベクトルにはピッチ同期位置が設定されており、ピッチ
同期化手段21は、前記ピッチ位置抽出手段20で抽出
されたピッチ位置にピッチ同期位置が合うように、符号
ベクトルを切り出し、周期的に繰り返した時系列ベクト
ルを生成する。
【0011】適応符号帳11、ピッチ同期化手段21か
らの各時系列ベクトルはゲイン符号化手段13から与え
られるそれぞれのゲインに応じて重み付けして加算さ
れ、その加算結果を駆動音源ベクトルとして合成フィル
タ10へ供給され符号化音声を得る。距離計算手段14
は符号化音声と入力音声5との距離を求め、距離が最小
となる適応符号、雑音符号、ゲインを探索する。以上符
号化が終了した後、線形予測パラメータの符号、入力音
声と符号化音声との歪みを最小にする適応符号、雑音符
号、ゲインの符号を符号化結果として出力する。
らの各時系列ベクトルはゲイン符号化手段13から与え
られるそれぞれのゲインに応じて重み付けして加算さ
れ、その加算結果を駆動音源ベクトルとして合成フィル
タ10へ供給され符号化音声を得る。距離計算手段14
は符号化音声と入力音声5との距離を求め、距離が最小
となる適応符号、雑音符号、ゲインを探索する。以上符
号化が終了した後、線形予測パラメータの符号、入力音
声と符号化音声との歪みを最小にする適応符号、雑音符
号、ゲインの符号を符号化結果として出力する。
【0012】次に、復号化について説明する。復号化部
2において、線形予測パラメータ復号化手段15は、線
形予測パラメータの符号から線形予測パラメータを復号
化し、合成フィルタ16の係数として設定する。次に、
適応符号帳17は、適応符号に対応して、過去の駆動音
源ベクトルを周期的に繰り返した時系列ベクトルを出力
する。ピッチ位置抽出手段22は、適応符号帳17から
出力される周期的に繰り返した時系列ベクトルと、線形
予測パラメータ符号化手段15から出力される線形予測
パラメータとを用い、ピッチ位置抽出手段20と同様の
方法でピッチ位置を抽出する。
2において、線形予測パラメータ復号化手段15は、線
形予測パラメータの符号から線形予測パラメータを復号
化し、合成フィルタ16の係数として設定する。次に、
適応符号帳17は、適応符号に対応して、過去の駆動音
源ベクトルを周期的に繰り返した時系列ベクトルを出力
する。ピッチ位置抽出手段22は、適応符号帳17から
出力される周期的に繰り返した時系列ベクトルと、線形
予測パラメータ符号化手段15から出力される線形予測
パラメータとを用い、ピッチ位置抽出手段20と同様の
方法でピッチ位置を抽出する。
【0013】また、雑音符号帳18は、雑音符号に対応
した符号ベクトルを出力する。符号ベクトルには、符号
化部1の雑音符号帳12と同じピッチ同期位置が設定さ
れており、ピッチ同期化手段23は、前記ピッチ位置抽
出手段22で抽出されたピッチ位置にピッチ同期位置が
合うように、符号ベクトルを切り出し、周期的に繰り返
した時系列ベクトルを生成する。これらの時系列ベクト
ルは、ゲイン復号化手段19でゲインの符号から復号化
したそれぞれのゲインに応じて重み付けして加算され、
その加算結果を駆動音源ベクトルとして合成フィルタ1
6へ供給され出力音声7が得られる
した符号ベクトルを出力する。符号ベクトルには、符号
化部1の雑音符号帳12と同じピッチ同期位置が設定さ
れており、ピッチ同期化手段23は、前記ピッチ位置抽
出手段22で抽出されたピッチ位置にピッチ同期位置が
合うように、符号ベクトルを切り出し、周期的に繰り返
した時系列ベクトルを生成する。これらの時系列ベクト
ルは、ゲイン復号化手段19でゲインの符号から復号化
したそれぞれのゲインに応じて重み付けして加算され、
その加算結果を駆動音源ベクトルとして合成フィルタ1
6へ供給され出力音声7が得られる
【0014】このように構成することにより、雑音符号
帳12からの符号ベクトルをピッチに同期させることで
再生音声のピッチ周期性を向上し、特に音声の有声部に
おける再生音声の品質を向上することができる。また、
符号ベクトルを周期化する際のピッチ位置は適応符号帳
からの時系列ベクトルから適応的に求めているので、伝
送情報量を増加させること無く、高品質な再生音声の生
成が可能である。
帳12からの符号ベクトルをピッチに同期させることで
再生音声のピッチ周期性を向上し、特に音声の有声部に
おける再生音声の品質を向上することができる。また、
符号ベクトルを周期化する際のピッチ位置は適応符号帳
からの時系列ベクトルから適応的に求めているので、伝
送情報量を増加させること無く、高品質な再生音声の生
成が可能である。
【0015】また、上記従来の雑音符号帳12内の符号
ベクトルのピッチ位置同期を行うCELP音声符号化復
号化装置において、適応符号帳と固定符号帳を切り替え
て使用する場合の処理を示した方式として、特開平10
−177399号公報に示すものがある。
ベクトルのピッチ位置同期を行うCELP音声符号化復
号化装置において、適応符号帳と固定符号帳を切り替え
て使用する場合の処理を示した方式として、特開平10
−177399号公報に示すものがある。
【0016】図9はこの従来の音声符号化復号化装置の
全体構成を示すブロック図である。図9において、1は
符号化部、2は復号化部、3は多重化手段、4は分離手
段、5は入力音声、6は符号、7は出力音声である。
全体構成を示すブロック図である。図9において、1は
符号化部、2は復号化部、3は多重化手段、4は分離手
段、5は入力音声、6は符号、7は出力音声である。
【0017】符号化部1は、次の8〜14、21、およ
び24〜26により構成されている。8は線形予測パラ
メータ分析手段、9は線形予測パラメータ符号化手段、
10は合成フィルタ、11は適応符号帳、12は雑音符
号帳、13はゲイン符号化手段、14は距離計算手段、
21はピッチ同期化手段、24は適応符号帳と切り替え
て用いる固定符号帳、25は固定符号帳と合わせて用い
る第2の雑音符号帳、26はピッチ位置抽出手段であ
る。
び24〜26により構成されている。8は線形予測パラ
メータ分析手段、9は線形予測パラメータ符号化手段、
10は合成フィルタ、11は適応符号帳、12は雑音符
号帳、13はゲイン符号化手段、14は距離計算手段、
21はピッチ同期化手段、24は適応符号帳と切り替え
て用いる固定符号帳、25は固定符号帳と合わせて用い
る第2の雑音符号帳、26はピッチ位置抽出手段であ
る。
【0018】また、復号化部2は、次の15〜19、2
3、および27〜29により構成されている。15は線
形予測パラメータ復号化手段、16は合成フィルタ、1
7は適応符号帳、18は雑音符号帳、19はゲイン復号
化手段、23はピッチ同期化手段、27は適応符号帳と
切り替えて用いる固定符号帳、28は固定符号帳と合わ
せて用いる第2の雑音符号帳、29はピッチ位置抽出手
段である。
3、および27〜29により構成されている。15は線
形予測パラメータ復号化手段、16は合成フィルタ、1
7は適応符号帳、18は雑音符号帳、19はゲイン復号
化手段、23はピッチ同期化手段、27は適応符号帳と
切り替えて用いる固定符号帳、28は固定符号帳と合わ
せて用いる第2の雑音符号帳、29はピッチ位置抽出手
段である。
【0019】以下、動作を説明する。まず、符号化部1
において、線形予測パラメータ分析手段8は、入力音声
5を分析し、音声のスペクトル情報である線形予測パラ
メータを抽出する。線形予測パラメータ符号化手段9
は、その線形予測パラメータを符号化し、符号化した線
形予測パラメータを合成フィルタ10の係数として設定
する。
において、線形予測パラメータ分析手段8は、入力音声
5を分析し、音声のスペクトル情報である線形予測パラ
メータを抽出する。線形予測パラメータ符号化手段9
は、その線形予測パラメータを符号化し、符号化した線
形予測パラメータを合成フィルタ10の係数として設定
する。
【0020】次に、音源情報の符号化について説明す
る。音源情報を符号化して駆動音源ベクトルを生成する
には、適応符号帳11と雑音符号帳12とを用いる場合
と、固定符号帳24と第2の雑音符号帳25とを用いる
場合の2通りの方法をとり、例えば符号化音声の入力音
声との距離がより小さくなる駆動音源ベクトルを生成す
る方法を選択するとして、これら2通りの方法を切り替
えて用いる。まず、固定符号帳24と第2の雑音符号帳
25とを用いる場合について説明し、次に、適応符号帳
11と雑音符号帳12とを用いる場合について説明す
る。
る。音源情報を符号化して駆動音源ベクトルを生成する
には、適応符号帳11と雑音符号帳12とを用いる場合
と、固定符号帳24と第2の雑音符号帳25とを用いる
場合の2通りの方法をとり、例えば符号化音声の入力音
声との距離がより小さくなる駆動音源ベクトルを生成す
る方法を選択するとして、これら2通りの方法を切り替
えて用いる。まず、固定符号帳24と第2の雑音符号帳
25とを用いる場合について説明し、次に、適応符号帳
11と雑音符号帳12とを用いる場合について説明す
る。
【0021】固定符号帳24には、例えばランダム雑音
から生成した複数の時系列ベクトルが記憶されており、
適応符号に対応した時系列ベクトルを出力する。第2の
雑音符号帳25には、例えばランダム雑音から生成した
複数の時系列ベクトルが記憶されており、雑音符号に対
応した時系列ベクトルを出力する。固定符号帳24、第
2の雑音符号帳25からの各時系列ベクトルは、ゲイン
符号化部13から与えられるそれぞれのゲインに応じて
重み付けして加算され、その加算結果を駆動音源ベクト
ルとして合成フィルタ10へ供給され符号化音声を得
る。距離計算手段14は、符号化音声と入力音声5との
距離を求め、距離が最小となる適応符号、雑音符号、ゲ
インを探索する。
から生成した複数の時系列ベクトルが記憶されており、
適応符号に対応した時系列ベクトルを出力する。第2の
雑音符号帳25には、例えばランダム雑音から生成した
複数の時系列ベクトルが記憶されており、雑音符号に対
応した時系列ベクトルを出力する。固定符号帳24、第
2の雑音符号帳25からの各時系列ベクトルは、ゲイン
符号化部13から与えられるそれぞれのゲインに応じて
重み付けして加算され、その加算結果を駆動音源ベクト
ルとして合成フィルタ10へ供給され符号化音声を得
る。距離計算手段14は、符号化音声と入力音声5との
距離を求め、距離が最小となる適応符号、雑音符号、ゲ
インを探索する。
【0022】次に、適応符号帳11と雑音符号帳12と
を用いる場合について説明する。適応符号帳11には、
過去の駆動音源ベクトルが記憶されており、適応符号に
対応して過去の駆動音源ベクトルを周期的に繰り返した
時系列ベクトルを出力する。ピッチ位置抽出手段26
は、前フレームにおいて固定符号帳24が選択されてい
る場合は、前フレームにおいて固定符号帳24から出力
された時系列ベクトルから、例えば時系列ベクトルの終
端部分で、現フレームで探索する適応符号に対応した周
期長の範囲において最大振幅をとる点を基準として、前
記適応符号に対応した周期で得られる点をピッチ位置と
して抽出する。また、前フレームにおいて適応符号帳1
1が選択されている場合は、前フレームで求めたピッチ
位置を基準として、現フレームで探索する適応符号に対
応した周期で繰り返した点をピッチ位置として抽出す
る。
を用いる場合について説明する。適応符号帳11には、
過去の駆動音源ベクトルが記憶されており、適応符号に
対応して過去の駆動音源ベクトルを周期的に繰り返した
時系列ベクトルを出力する。ピッチ位置抽出手段26
は、前フレームにおいて固定符号帳24が選択されてい
る場合は、前フレームにおいて固定符号帳24から出力
された時系列ベクトルから、例えば時系列ベクトルの終
端部分で、現フレームで探索する適応符号に対応した周
期長の範囲において最大振幅をとる点を基準として、前
記適応符号に対応した周期で得られる点をピッチ位置と
して抽出する。また、前フレームにおいて適応符号帳1
1が選択されている場合は、前フレームで求めたピッチ
位置を基準として、現フレームで探索する適応符号に対
応した周期で繰り返した点をピッチ位置として抽出す
る。
【0023】図10に本従来例において現フレームで探
索する適応符号に対応した周期をLとしたときのピッチ
位置抽出処理の例を示す。図10(a)は、前フレーム
において固定符号帳24が選択されている場合、図10
(b)は前フレームにおいて適応符号帳11が選択され
ている場合の例である。
索する適応符号に対応した周期をLとしたときのピッチ
位置抽出処理の例を示す。図10(a)は、前フレーム
において固定符号帳24が選択されている場合、図10
(b)は前フレームにおいて適応符号帳11が選択され
ている場合の例である。
【0024】雑音符号帳12には、例えばランダム雑音
から生成した複数の符号ベクトルが記憶されており、雑
音符号に対応した符号ベクトルを出力する。各符号ベク
トルにはピッチ同期位置が設定されており、ピッチ同期
化手段21は、前記ピッチ位置抽出手段26で抽出され
たピッチ位置にピッチ同期位置が合うように、符号ベク
トルを切り出し、周期的に繰り返した時系列ベクトルを
生成する。
から生成した複数の符号ベクトルが記憶されており、雑
音符号に対応した符号ベクトルを出力する。各符号ベク
トルにはピッチ同期位置が設定されており、ピッチ同期
化手段21は、前記ピッチ位置抽出手段26で抽出され
たピッチ位置にピッチ同期位置が合うように、符号ベク
トルを切り出し、周期的に繰り返した時系列ベクトルを
生成する。
【0025】適応符号帳11とピッチ同期化手段21か
らの各時系列ベクトルは、ゲイン符号化部13から与え
られるそれぞれのゲインに応じて重み付けして加算さ
れ、その加算結果を駆動音源ベクトルとして合成フィル
タ10へ供給され符号化音声を得る。距離計算手段14
は、符号化音声と入力音声5との距離を求め、距離が最
小となる適応符号、雑音符号、ゲインを探索する。
らの各時系列ベクトルは、ゲイン符号化部13から与え
られるそれぞれのゲインに応じて重み付けして加算さ
れ、その加算結果を駆動音源ベクトルとして合成フィル
タ10へ供給され符号化音声を得る。距離計算手段14
は、符号化音声と入力音声5との距離を求め、距離が最
小となる適応符号、雑音符号、ゲインを探索する。
【0026】そして、適応符号帳11と雑音符号帳12
とを用いる場合と、固定符号帳24と第2の雑音符号帳
25とを用いる場合とで、それぞれで選択された適応符
号、雑音符号、ゲインを用いて生成される符号化音声と
入力音声との距離を比較し、距離が小さくなる方の適応
符号、雑音符号、ゲインが選択される。以上の符号化が
終了した後、線形予測パラメータの符号、入力音声と符
号化音声との歪みを最小にする適応符号、雑音符号、ゲ
インの符号を符号化結果として出力する。
とを用いる場合と、固定符号帳24と第2の雑音符号帳
25とを用いる場合とで、それぞれで選択された適応符
号、雑音符号、ゲインを用いて生成される符号化音声と
入力音声との距離を比較し、距離が小さくなる方の適応
符号、雑音符号、ゲインが選択される。以上の符号化が
終了した後、線形予測パラメータの符号、入力音声と符
号化音声との歪みを最小にする適応符号、雑音符号、ゲ
インの符号を符号化結果として出力する。
【0027】続いて、復号化部2の動作について説明す
る。復号化部2において、線形予測パラメータ復号化手
段15は、線形予測パラメータの符号から線形予測パラ
メータを復号化し、合成フィルタ16の係数として設定
する。
る。復号化部2において、線形予測パラメータ復号化手
段15は、線形予測パラメータの符号から線形予測パラ
メータを復号化し、合成フィルタ16の係数として設定
する。
【0028】次に、音源情報の復号化について説明す
る。音源情報を復号化して駆動音源ベクトルを生成する
には、適応符号帳17と雑音符号帳18とを用いる場合
と、固定符号帳27と第2の雑音符号帳28とを用いる
場合の2通りの方法をとり、適応符号に対応して、符号
化する際に用いられた方法を選択するとして、これら2
通りの方法を切り替えて用いる。ここでは、まず、固定
符号帳27と第2の雑音符号帳28とを用いる場合につ
いて説明し、次に、適応符号帳17と雑音符号帳18と
を用いる場合について説明する。
る。音源情報を復号化して駆動音源ベクトルを生成する
には、適応符号帳17と雑音符号帳18とを用いる場合
と、固定符号帳27と第2の雑音符号帳28とを用いる
場合の2通りの方法をとり、適応符号に対応して、符号
化する際に用いられた方法を選択するとして、これら2
通りの方法を切り替えて用いる。ここでは、まず、固定
符号帳27と第2の雑音符号帳28とを用いる場合につ
いて説明し、次に、適応符号帳17と雑音符号帳18と
を用いる場合について説明する。
【0029】固定符号帳27と第2の雑音符号帳28と
を用いる場合に、固定符号帳27は、適応符号に対応し
た時系列ベクトルを出力し、また、第2の雑音符号帳2
8は、雑音符号に対応した時系列ベクトルを出力する。
を用いる場合に、固定符号帳27は、適応符号に対応し
た時系列ベクトルを出力し、また、第2の雑音符号帳2
8は、雑音符号に対応した時系列ベクトルを出力する。
【0030】次に、適応符号帳17と雑音符号帳18と
を用いる場合について説明する。適応符号帳17は、適
応符号に対応して、過去の駆動音源ベクトルを周期的に
繰り返した時系列ベクトルを出力する。ピッチ位置抽出
手段29は、前フレームで固定符号帳が選択されている
場合は、前フレームにおいて固定符号帳27から出力さ
れた時系列ベクトルから、また、前フレームにおいて適
応符号帳が選択されている場合は、前フレームで求めた
ピッチ位置から、符号化部1のピッチ位置抽出手段26
と同様の方法でピッチ位置を抽出する。
を用いる場合について説明する。適応符号帳17は、適
応符号に対応して、過去の駆動音源ベクトルを周期的に
繰り返した時系列ベクトルを出力する。ピッチ位置抽出
手段29は、前フレームで固定符号帳が選択されている
場合は、前フレームにおいて固定符号帳27から出力さ
れた時系列ベクトルから、また、前フレームにおいて適
応符号帳が選択されている場合は、前フレームで求めた
ピッチ位置から、符号化部1のピッチ位置抽出手段26
と同様の方法でピッチ位置を抽出する。
【0031】また、雑音符号帳18は、雑音符号に対応
した符号ベクトルを出力する。符号ベクトルにはピッチ
同期位置が設定されており、ピッチ同期化手段23は、
前記ピッチ位置抽出手段29で抽出されたピッチ位置に
ピッチ同期位置が合うように、符号ベクトルを切り出
し、周期的に繰り返した時系列ベクトルを生成する。
した符号ベクトルを出力する。符号ベクトルにはピッチ
同期位置が設定されており、ピッチ同期化手段23は、
前記ピッチ位置抽出手段29で抽出されたピッチ位置に
ピッチ同期位置が合うように、符号ベクトルを切り出
し、周期的に繰り返した時系列ベクトルを生成する。
【0032】固定符号帳27と第2の雑音符号帳28か
らの時系列ベクトル、あるいは、適応符号帳17とピッ
チ同期化手段23からの時系列ベクトルは、ゲイン復号
化手段19でゲインの符号から復号化したそれぞれのゲ
インに応じて重み付けして加算され、その加算結果を駆
動音源ベクトルとして合成フィルタ16へ供給され出力
音声7が得られる。
らの時系列ベクトル、あるいは、適応符号帳17とピッ
チ同期化手段23からの時系列ベクトルは、ゲイン復号
化手段19でゲインの符号から復号化したそれぞれのゲ
インに応じて重み付けして加算され、その加算結果を駆
動音源ベクトルとして合成フィルタ16へ供給され出力
音声7が得られる。
【0033】
【発明が解決しようとする課題】ところで、上述した図
8に示す構成を持つ従来例による音声符号化復号化装置
では、ピッチ位置抽出手段において、適応符号帳による
合成ベクトルAiとピッチ周期間隔のパルスによる合成
ベクトルBiとの歪みを用いてピッチ位置の抽出を行
い、合成ベクトルAiのピッチ位置でのピーク性の度合
い(入力音声のピッチ位置でのピーク性の度合いに相
当)にかかわらずこの歪みが最小となった位置をピッチ
位置として雑音符号帳内の符号ベクトルのピッチ同期化
を行うようになされている。
8に示す構成を持つ従来例による音声符号化復号化装置
では、ピッチ位置抽出手段において、適応符号帳による
合成ベクトルAiとピッチ周期間隔のパルスによる合成
ベクトルBiとの歪みを用いてピッチ位置の抽出を行
い、合成ベクトルAiのピッチ位置でのピーク性の度合
い(入力音声のピッチ位置でのピーク性の度合いに相
当)にかかわらずこの歪みが最小となった位置をピッチ
位置として雑音符号帳内の符号ベクトルのピッチ同期化
を行うようになされている。
【0034】このため、雑音符号帳の中に、ピーク性の
ある符号ベクトルとピーク性の無い符号ベクトルの双方
を持たなければならない。図11にM個のピーク性ある
符号ベクトルとN−M個のピーク性の無い符号ベクトル
で構成される合計N個の符号ベクトルを持つ雑音符号帳
の例を示す。図11のように、ピーク性の高いものと低
いもの二種類でN個のベクトルを構成する雑音符号帳
は、どちらか一種類だけでN個のベクトルを構成する場
合に比べ、各種類におけるベクトル数が少なくなり、音
源情報の符号化の効率が劣化する課題があった。
ある符号ベクトルとピーク性の無い符号ベクトルの双方
を持たなければならない。図11にM個のピーク性ある
符号ベクトルとN−M個のピーク性の無い符号ベクトル
で構成される合計N個の符号ベクトルを持つ雑音符号帳
の例を示す。図11のように、ピーク性の高いものと低
いもの二種類でN個のベクトルを構成する雑音符号帳
は、どちらか一種類だけでN個のベクトルを構成する場
合に比べ、各種類におけるベクトル数が少なくなり、音
源情報の符号化の効率が劣化する課題があった。
【0035】また、上述した図9に示す構成をもつ従来
例にように、適応符号帳と固定符号帳を切り替えて使う
音声符号化復号化装置の場合に、固定符号帳が選択され
たサブフレームでは、抽出したピッチ位置を使って雑音
符号帳内の符号ベクトルをピッチ同期化することはしな
いので、図12に示すように入力音声がピッチ位置でピ
ーク性を持ち、選択された固定符号帳内の時系列ベクト
ルがピッチ位置においてピーク性を持つ場合でも、雑音
符号帳内のピーク性のある符号ベクトルをピッチ位置に
同期化させることができず、音源情報を効率的に符号化
することができない課題があった。
例にように、適応符号帳と固定符号帳を切り替えて使う
音声符号化復号化装置の場合に、固定符号帳が選択され
たサブフレームでは、抽出したピッチ位置を使って雑音
符号帳内の符号ベクトルをピッチ同期化することはしな
いので、図12に示すように入力音声がピッチ位置でピ
ーク性を持ち、選択された固定符号帳内の時系列ベクト
ルがピッチ位置においてピーク性を持つ場合でも、雑音
符号帳内のピーク性のある符号ベクトルをピッチ位置に
同期化させることができず、音源情報を効率的に符号化
することができない課題があった。
【0036】この発明は、かかる課題を解決するために
なされたものであり、その目的は、入力音声のピッチ位
置でのピーク性の度合いに応じて雑音符号帳を切り替え
効率的な符号化を行うことができる音声符号化装置と、
その復号化を行う音声復号化装置及び音声符号化復号化
装置を得ることである。
なされたものであり、その目的は、入力音声のピッチ位
置でのピーク性の度合いに応じて雑音符号帳を切り替え
効率的な符号化を行うことができる音声符号化装置と、
その復号化を行う音声復号化装置及び音声符号化復号化
装置を得ることである。
【0037】
【課題を解決するための手段】この発明に係る音声符号
化装置は、適応音源ベクトルから求めたピッチ位置を基
準に雑音音源ベクトルをピッチ同期化するピッチ位置同
期型CELP音声符号化装置において、適応音源ベクト
ルとして過去の駆動音源ベクトルが記憶されていて、適
応符号に対応した過去の駆動音源ベクトルを周期的に繰
り返した時系列ベクトルを出力する適応符号帳と、上記
適応符号帳から出力される時系列ベクトルのピッチ位置
とそのピーク性の度合いを求めるピッチ位置抽出手段
と、ピッチ位置におけるピーク性の度合いが比較的大き
い場合の雑音音源ベクトルを記憶してなる第1の雑音符
号帳と、ピッチ位置におけるピーク性の度合いが比較的
小さい場合の雑音音源ベクトルを記憶してなる第2の雑
音符号帳と、上記ピッチ位置抽出手段で抽出されたピッ
チ位置におけるピーク性の度合いが予め設定された閾値
より大きい場合は上記ピッチ位置抽出手段により求めら
れるピッチ位置を基準とした上記第1の雑音符号帳の雑
音音源ベクトルのピッチ同期化を行い、上記ピーク性の
度合いが上記閾値より小さい場合は上記第2の雑音符号
帳の雑音音源ベクトルを上記ピッチ位置を必ずしも基準
とせずにピッチ周期化する適応ピッチ同期化手段とを備
えたことを特徴とするものである。
化装置は、適応音源ベクトルから求めたピッチ位置を基
準に雑音音源ベクトルをピッチ同期化するピッチ位置同
期型CELP音声符号化装置において、適応音源ベクト
ルとして過去の駆動音源ベクトルが記憶されていて、適
応符号に対応した過去の駆動音源ベクトルを周期的に繰
り返した時系列ベクトルを出力する適応符号帳と、上記
適応符号帳から出力される時系列ベクトルのピッチ位置
とそのピーク性の度合いを求めるピッチ位置抽出手段
と、ピッチ位置におけるピーク性の度合いが比較的大き
い場合の雑音音源ベクトルを記憶してなる第1の雑音符
号帳と、ピッチ位置におけるピーク性の度合いが比較的
小さい場合の雑音音源ベクトルを記憶してなる第2の雑
音符号帳と、上記ピッチ位置抽出手段で抽出されたピッ
チ位置におけるピーク性の度合いが予め設定された閾値
より大きい場合は上記ピッチ位置抽出手段により求めら
れるピッチ位置を基準とした上記第1の雑音符号帳の雑
音音源ベクトルのピッチ同期化を行い、上記ピーク性の
度合いが上記閾値より小さい場合は上記第2の雑音符号
帳の雑音音源ベクトルを上記ピッチ位置を必ずしも基準
とせずにピッチ周期化する適応ピッチ同期化手段とを備
えたことを特徴とするものである。
【0038】また、入力音声を分析して音声のスペクト
ル情報である線形予測パラメータを抽出する線形予測パ
ラメータ分析手段と、上記線形予測パラメータを符号化
して符号化した線形予測パラメータをフィルタ係数とし
て設定する線形予測パラメータ符号化手段とをさらに備
え、上記ピッチ位置抽出手段は、上記適応符号帳からの
時系列ベクトルと上記線形予測パラメータ符号化手段か
らの線形予測パラメータとから第1の合成ベクトルを生
成すると共に、上記適応符号帳からの時系列ベクトルの
ピッチ周期間隔のパルス列を作成してこれを音源として
上記線形予測パラメータ符号化手段からの線形予測パラ
メータを用いて第2の合成ベクトルを生成し、上記第1
の合成ベクトルと第2の合成ベクトルとの歪みが最小と
なるパルス列を探索して歪みが最小となるパルス位置を
ピッチ位置とし、その時の歪み量をピーク性の度合いと
することを特徴とするものである。
ル情報である線形予測パラメータを抽出する線形予測パ
ラメータ分析手段と、上記線形予測パラメータを符号化
して符号化した線形予測パラメータをフィルタ係数とし
て設定する線形予測パラメータ符号化手段とをさらに備
え、上記ピッチ位置抽出手段は、上記適応符号帳からの
時系列ベクトルと上記線形予測パラメータ符号化手段か
らの線形予測パラメータとから第1の合成ベクトルを生
成すると共に、上記適応符号帳からの時系列ベクトルの
ピッチ周期間隔のパルス列を作成してこれを音源として
上記線形予測パラメータ符号化手段からの線形予測パラ
メータを用いて第2の合成ベクトルを生成し、上記第1
の合成ベクトルと第2の合成ベクトルとの歪みが最小と
なるパルス列を探索して歪みが最小となるパルス位置を
ピッチ位置とし、その時の歪み量をピーク性の度合いと
することを特徴とするものである。
【0039】また、ランダム雑音から生成した複数の時
系列ベクトルが記憶されていて、適応符号に対応した時
系列ベクトルを出力する固定符号帳と、ピッチ位置にお
けるピーク性の度合いが比較的大きい場合の雑音音源ベ
クトルを記憶してなる第3の雑音符号帳と、ピッチ位置
におけるピーク性の度合いが比較的小さい場合の雑音音
源ベクトルを記憶してなる第4の雑音符号帳と、上記ピ
ッチ位置抽出手段で抽出されたピッチ位置におけるピー
ク性の度合いが予め設定された閾値より大きい場合は上
記ピッチ位置抽出手段により求められるピッチ位置を基
準とした上記第3の雑音符号帳の雑音音源ベクトルのピ
ッチ同期化を行うか、あるいは上記第3の雑音符号帳の
雑音音源ベクトルをそのまま出力し、上記ピーク性の度
合いが上記閾値より小さい場合はピッチ同期化を行わず
に上記第4の雑音符号帳の雑音音源ベクトルを出力する
他の適応ピッチ同期化手段とをさらに備え、上記ピッチ
位置抽出手段は、上記適応符号帳が選択されない場合
は、代わりに選択された上記固定符号帳から出力される
時系列ベクトルのピッチ位置とそのピーク性の度合いを
求めるものである。
系列ベクトルが記憶されていて、適応符号に対応した時
系列ベクトルを出力する固定符号帳と、ピッチ位置にお
けるピーク性の度合いが比較的大きい場合の雑音音源ベ
クトルを記憶してなる第3の雑音符号帳と、ピッチ位置
におけるピーク性の度合いが比較的小さい場合の雑音音
源ベクトルを記憶してなる第4の雑音符号帳と、上記ピ
ッチ位置抽出手段で抽出されたピッチ位置におけるピー
ク性の度合いが予め設定された閾値より大きい場合は上
記ピッチ位置抽出手段により求められるピッチ位置を基
準とした上記第3の雑音符号帳の雑音音源ベクトルのピ
ッチ同期化を行うか、あるいは上記第3の雑音符号帳の
雑音音源ベクトルをそのまま出力し、上記ピーク性の度
合いが上記閾値より小さい場合はピッチ同期化を行わず
に上記第4の雑音符号帳の雑音音源ベクトルを出力する
他の適応ピッチ同期化手段とをさらに備え、上記ピッチ
位置抽出手段は、上記適応符号帳が選択されない場合
は、代わりに選択された上記固定符号帳から出力される
時系列ベクトルのピッチ位置とそのピーク性の度合いを
求めるものである。
【0040】また、上記ピッチ位置抽出手段は、上記固
定符号帳からの時系列ベクトルと上記線形予測パラメー
タ符号化手段からの線形予測パラメータとから第3の合
成ベクトルを生成すると共に、単一のパルスを作成して
これを音源として上記線形予測パラメータ符号化手段か
らの線形予測パラメータを用いて第4の合成ベクトルを
生成し、上記第3の合成ベクトルと第4の合成ベクトル
との歪みが最小となるパルス列を探索して歪みが最小と
なるパルス位置をピッチ位置とし、その時の歪み量をピ
ーク性の度合いとするものである。
定符号帳からの時系列ベクトルと上記線形予測パラメー
タ符号化手段からの線形予測パラメータとから第3の合
成ベクトルを生成すると共に、単一のパルスを作成して
これを音源として上記線形予測パラメータ符号化手段か
らの線形予測パラメータを用いて第4の合成ベクトルを
生成し、上記第3の合成ベクトルと第4の合成ベクトル
との歪みが最小となるパルス列を探索して歪みが最小と
なるパルス位置をピッチ位置とし、その時の歪み量をピ
ーク性の度合いとするものである。
【0041】また、この発明に係る音声復号化装置は、
適応音源ベクトルから求めたピッチ位置を基準に雑音音
源ベクトルをピッチ同期化するピッチ位置同期型CEL
P音声復号化装置において、適応音源ベクトルとして過
去の駆動音源ベクトルが記憶されていて、適応符号に対
応した過去の駆動音源ベクトルを周期的に繰り返した時
系列ベクトルを出力する適応符号帳と、上記適応符号帳
から出力される時系列ベクトルのピッチ位置とそのピー
ク性の度合いを求めるピッチ位置抽出手段と、ピッチ位
置におけるピーク性の度合いが比較的大きい場合の雑音
音源ベクトルを記憶してなる第1の雑音符号帳と、ピッ
チ位置におけるピーク性の度合いが比較的小さい場合の
雑音音源ベクトルを記憶してなる第2の雑音符号帳と、
上記ピッチ位置抽出手段で抽出されたピッチ位置におけ
るピーク性の度合いが予め設定された閾値より大きい場
合は上記ピッチ位置抽出手段により求められるピッチ位
置を基準とした上記第1の雑音符号帳の雑音音源ベクト
ルのピッチ同期化を行い、上記ピーク性の度合いが上記
閾値より小さい場合は上記第2の雑音符号帳の雑音音源
ベクトルを上記ピッチ位置を必ずしも基準とせずにピッ
チ周期化する適応ピッチ同期化手段とを備えたことを特
徴とするものである。
適応音源ベクトルから求めたピッチ位置を基準に雑音音
源ベクトルをピッチ同期化するピッチ位置同期型CEL
P音声復号化装置において、適応音源ベクトルとして過
去の駆動音源ベクトルが記憶されていて、適応符号に対
応した過去の駆動音源ベクトルを周期的に繰り返した時
系列ベクトルを出力する適応符号帳と、上記適応符号帳
から出力される時系列ベクトルのピッチ位置とそのピー
ク性の度合いを求めるピッチ位置抽出手段と、ピッチ位
置におけるピーク性の度合いが比較的大きい場合の雑音
音源ベクトルを記憶してなる第1の雑音符号帳と、ピッ
チ位置におけるピーク性の度合いが比較的小さい場合の
雑音音源ベクトルを記憶してなる第2の雑音符号帳と、
上記ピッチ位置抽出手段で抽出されたピッチ位置におけ
るピーク性の度合いが予め設定された閾値より大きい場
合は上記ピッチ位置抽出手段により求められるピッチ位
置を基準とした上記第1の雑音符号帳の雑音音源ベクト
ルのピッチ同期化を行い、上記ピーク性の度合いが上記
閾値より小さい場合は上記第2の雑音符号帳の雑音音源
ベクトルを上記ピッチ位置を必ずしも基準とせずにピッ
チ周期化する適応ピッチ同期化手段とを備えたことを特
徴とするものである。
【0042】また、入力音声を分析して音声のスペクト
ル情報である線形予測パラメータを抽出する線形予測パ
ラメータ分析手段と、上記線形予測パラメータを符号化
して符号化した線形予測パラメータをフィルタ係数とし
て設定する線形予測パラメータ符号化手段とをさらに備
え、上記ピッチ位置抽出手段は、上記適応符号帳からの
時系列ベクトルと上記線形予測パラメータ符号化手段か
らの線形予測パラメータとから第1の合成ベクトルを生
成すると共に、上記適応符号帳からの時系列ベクトルの
ピッチ周期間隔のパルス列を作成してこれを音源として
上記線形予測パラメータ符号化手段からの線形予測パラ
メータを用いて第2の合成ベクトルを生成し、上記第1
の合成ベクトルと第2の合成ベクトルとの歪みが最小と
なるパルス列を探索して歪みが最小となるパルス位置を
ピッチ位置とし、その時の歪み量をピーク性の度合いと
するものである。
ル情報である線形予測パラメータを抽出する線形予測パ
ラメータ分析手段と、上記線形予測パラメータを符号化
して符号化した線形予測パラメータをフィルタ係数とし
て設定する線形予測パラメータ符号化手段とをさらに備
え、上記ピッチ位置抽出手段は、上記適応符号帳からの
時系列ベクトルと上記線形予測パラメータ符号化手段か
らの線形予測パラメータとから第1の合成ベクトルを生
成すると共に、上記適応符号帳からの時系列ベクトルの
ピッチ周期間隔のパルス列を作成してこれを音源として
上記線形予測パラメータ符号化手段からの線形予測パラ
メータを用いて第2の合成ベクトルを生成し、上記第1
の合成ベクトルと第2の合成ベクトルとの歪みが最小と
なるパルス列を探索して歪みが最小となるパルス位置を
ピッチ位置とし、その時の歪み量をピーク性の度合いと
するものである。
【0043】また、ランダム雑音から生成した複数の時
系列ベクトルが記憶されていて、適応符号に対応した時
系列ベクトルを出力する固定符号帳と、ピッチ位置にお
けるピーク性の度合いが比較的大きい場合の雑音音源ベ
クトルを記憶してなる第3の雑音符号帳と、ピッチ位置
におけるピーク性の度合いが比較的小さい場合の雑音音
源ベクトルを記憶してなる第4の雑音符号帳と、上記ピ
ッチ位置抽出手段で抽出されたピッチ位置におけるピー
ク性の度合いが予め設定された閾値より大きい場合は上
記ピッチ位置抽出手段により求められるピッチ位置を基
準とした上記第3の雑音符号帳の雑音音源ベクトルのピ
ッチ同期化を行うか、あるいは上記第3の雑音符号帳の
雑音音源ベクトルをそのまま出力し、上記ピーク性の度
合いが上記閾値より小さい場合はピッチ同期化を行わず
に上記第4の雑音符号帳の雑音音源ベクトルを出力する
他の適応ピッチ同期化手段とをさらに備え、上記ピッチ
位置抽出手段は、上記適応符号帳が選択されない場合
は、代わりに選択された上記固定符号帳から出力される
時系列ベクトルのピッチ位置とそのピーク性の度合いを
求めるものである。
系列ベクトルが記憶されていて、適応符号に対応した時
系列ベクトルを出力する固定符号帳と、ピッチ位置にお
けるピーク性の度合いが比較的大きい場合の雑音音源ベ
クトルを記憶してなる第3の雑音符号帳と、ピッチ位置
におけるピーク性の度合いが比較的小さい場合の雑音音
源ベクトルを記憶してなる第4の雑音符号帳と、上記ピ
ッチ位置抽出手段で抽出されたピッチ位置におけるピー
ク性の度合いが予め設定された閾値より大きい場合は上
記ピッチ位置抽出手段により求められるピッチ位置を基
準とした上記第3の雑音符号帳の雑音音源ベクトルのピ
ッチ同期化を行うか、あるいは上記第3の雑音符号帳の
雑音音源ベクトルをそのまま出力し、上記ピーク性の度
合いが上記閾値より小さい場合はピッチ同期化を行わず
に上記第4の雑音符号帳の雑音音源ベクトルを出力する
他の適応ピッチ同期化手段とをさらに備え、上記ピッチ
位置抽出手段は、上記適応符号帳が選択されない場合
は、代わりに選択された上記固定符号帳から出力される
時系列ベクトルのピッチ位置とそのピーク性の度合いを
求めるものである。
【0044】また、上記ピッチ位置抽出手段は、上記固
定符号帳からの時系列ベクトルと上記線形予測パラメー
タ符号化手段からの線形予測パラメータとから第3の合
成ベクトルを生成すると共に、単一のパルスを作成して
これを音源として上記線形予測パラメータ符号化手段か
らの線形予測パラメータを用いて第4の合成ベクトルを
生成し、上記第3の合成ベクトルと第4の合成ベクトル
との歪みが最小となるパルス列を探索して歪みが最小と
なるパルス位置をピッチ位置とし、その時の歪み量をピ
ーク性の度合いとするものである。
定符号帳からの時系列ベクトルと上記線形予測パラメー
タ符号化手段からの線形予測パラメータとから第3の合
成ベクトルを生成すると共に、単一のパルスを作成して
これを音源として上記線形予測パラメータ符号化手段か
らの線形予測パラメータを用いて第4の合成ベクトルを
生成し、上記第3の合成ベクトルと第4の合成ベクトル
との歪みが最小となるパルス列を探索して歪みが最小と
なるパルス位置をピッチ位置とし、その時の歪み量をピ
ーク性の度合いとするものである。
【0045】また、この発明に係る音声符号化復号化装
置は、適応音源ベクトルから求めたピッチ位置を基準に
雑音音源ベクトルをピッチ同期化するピッチ位置同期型
CELP音声符号化装置と、この装置から出力される符
号化データに基づいて生成した適応音源ベクトルから求
めたピッチ位置を基準に雑音音源ベクトルをピッチ同期
化するピッチ位置同期型CELP音声符号化装置とで構
成される音声符号化復号化装置において、上記音声符号
化装置と上記音声復号化装置の両者に、適応音源ベクト
ルとして過去の駆動音源ベクトルが記憶されていて、適
応符号に対応した過去の駆動音源ベクトルを周期的に繰
り返した時系列ベクトルを出力する適応符号帳と、上記
適応符号帳から出力される時系列ベクトルのピッチ位置
とそのピーク性の度合いを求めるピッチ位置抽出手段
と、ピッチ位置におけるピーク性の度合いが比較的大き
い場合の雑音音源ベクトルを記憶してなる第1の雑音符
号帳と、ピッチ位置におけるピーク性の度合いが比較的
小さい場合の雑音音源ベクトルを記憶してなる第2の雑
音符号帳と、上記ピッチ位置抽出手段で抽出されたピッ
チ位置におけるピーク性の度合いが予め設定された閾値
より大きい場合は上記ピッチ位置抽出手段により求めら
れるピッチ位置を基準とした上記第1の雑音符号帳の雑
音音源ベクトルのピッチ同期化を行い、上記ピーク性の
度合いが上記閾値より小さい場合は上記第2の雑音符号
帳の雑音音源ベクトルを上記ピッチ位置を必ずしも基準
とせずにピッチ周期化する適応ピッチ同期化手段とをそ
れぞれ備えたことを特徴とするものである。
置は、適応音源ベクトルから求めたピッチ位置を基準に
雑音音源ベクトルをピッチ同期化するピッチ位置同期型
CELP音声符号化装置と、この装置から出力される符
号化データに基づいて生成した適応音源ベクトルから求
めたピッチ位置を基準に雑音音源ベクトルをピッチ同期
化するピッチ位置同期型CELP音声符号化装置とで構
成される音声符号化復号化装置において、上記音声符号
化装置と上記音声復号化装置の両者に、適応音源ベクト
ルとして過去の駆動音源ベクトルが記憶されていて、適
応符号に対応した過去の駆動音源ベクトルを周期的に繰
り返した時系列ベクトルを出力する適応符号帳と、上記
適応符号帳から出力される時系列ベクトルのピッチ位置
とそのピーク性の度合いを求めるピッチ位置抽出手段
と、ピッチ位置におけるピーク性の度合いが比較的大き
い場合の雑音音源ベクトルを記憶してなる第1の雑音符
号帳と、ピッチ位置におけるピーク性の度合いが比較的
小さい場合の雑音音源ベクトルを記憶してなる第2の雑
音符号帳と、上記ピッチ位置抽出手段で抽出されたピッ
チ位置におけるピーク性の度合いが予め設定された閾値
より大きい場合は上記ピッチ位置抽出手段により求めら
れるピッチ位置を基準とした上記第1の雑音符号帳の雑
音音源ベクトルのピッチ同期化を行い、上記ピーク性の
度合いが上記閾値より小さい場合は上記第2の雑音符号
帳の雑音音源ベクトルを上記ピッチ位置を必ずしも基準
とせずにピッチ周期化する適応ピッチ同期化手段とをそ
れぞれ備えたことを特徴とするものである。
【0046】また、上記音声符号化装置と上記音声復号
化装置の両者に、入力音声を分析して音声のスペクトル
情報である線形予測パラメータを抽出する線形予測パラ
メータ分析手段と、上記線形予測パラメータを符号化し
て符号化した線形予測パラメータをフィルタ係数として
設定する線形予測パラメータ符号化手段とをさらにそれ
ぞれ備え、上記音声符号化装置と上記音声復号化装置の
各ピッチ位置抽出手段は、上記適応符号帳からの時系列
ベクトルと上記線形予測パラメータ符号化手段からの線
形予測パラメータとから第1の合成ベクトルを生成する
と共に、上記適応符号帳からの時系列ベクトルのピッチ
周期間隔のパルス列を作成してこれを音源として上記線
形予測パラメータ符号化手段からの線形予測パラメータ
を用いて第2の合成ベクトルを生成し、上記第1の合成
ベクトルと第2の合成ベクトルとの歪みが最小となるパ
ルス列を探索して歪みが最小となるパルス位置をピッチ
位置とし、その時の歪み量をピーク性の度合いとするも
のである。
化装置の両者に、入力音声を分析して音声のスペクトル
情報である線形予測パラメータを抽出する線形予測パラ
メータ分析手段と、上記線形予測パラメータを符号化し
て符号化した線形予測パラメータをフィルタ係数として
設定する線形予測パラメータ符号化手段とをさらにそれ
ぞれ備え、上記音声符号化装置と上記音声復号化装置の
各ピッチ位置抽出手段は、上記適応符号帳からの時系列
ベクトルと上記線形予測パラメータ符号化手段からの線
形予測パラメータとから第1の合成ベクトルを生成する
と共に、上記適応符号帳からの時系列ベクトルのピッチ
周期間隔のパルス列を作成してこれを音源として上記線
形予測パラメータ符号化手段からの線形予測パラメータ
を用いて第2の合成ベクトルを生成し、上記第1の合成
ベクトルと第2の合成ベクトルとの歪みが最小となるパ
ルス列を探索して歪みが最小となるパルス位置をピッチ
位置とし、その時の歪み量をピーク性の度合いとするも
のである。
【0047】また、上記音声符号化装置と上記音声復号
化装置の両者に、ランダム雑音から生成した複数の時系
列ベクトルが記憶されていて、適応符号に対応した時系
列ベクトルを出力する固定符号帳と、ピッチ位置におけ
るピーク性の度合いが比較的大きい場合の雑音音源ベク
トルを記憶してなる第3の雑音符号帳と、ピッチ位置に
おけるピーク性の度合いが比較的小さい場合の雑音音源
ベクトルを記憶してなる第4の雑音符号帳と、上記ピッ
チ位置抽出手段で抽出されたピッチ位置におけるピーク
性の度合いが予め設定された閾値より大きい場合は上記
ピッチ位置抽出手段により求められるピッチ位置を基準
とした上記第3の雑音符号帳の雑音音源ベクトルのピッ
チ同期化を行うか、あるいは上記第3の雑音符号帳の雑
音音源ベクトルをそのまま出力し、上記ピーク性の度合
いが上記閾値より小さい場合はピッチ同期化を行わずに
上記第4の雑音符号帳の雑音音源ベクトルを出力する他
の適応ピッチ同期化手段とをさらにそれぞれ備え、上記
ピッチ位置抽出手段は、上記適応符号帳が選択されない
場合は、代わりに選択された上記固定符号帳から出力さ
れる時系列ベクトルのピッチ位置とそのピーク性の度合
いを求めるものである。
化装置の両者に、ランダム雑音から生成した複数の時系
列ベクトルが記憶されていて、適応符号に対応した時系
列ベクトルを出力する固定符号帳と、ピッチ位置におけ
るピーク性の度合いが比較的大きい場合の雑音音源ベク
トルを記憶してなる第3の雑音符号帳と、ピッチ位置に
おけるピーク性の度合いが比較的小さい場合の雑音音源
ベクトルを記憶してなる第4の雑音符号帳と、上記ピッ
チ位置抽出手段で抽出されたピッチ位置におけるピーク
性の度合いが予め設定された閾値より大きい場合は上記
ピッチ位置抽出手段により求められるピッチ位置を基準
とした上記第3の雑音符号帳の雑音音源ベクトルのピッ
チ同期化を行うか、あるいは上記第3の雑音符号帳の雑
音音源ベクトルをそのまま出力し、上記ピーク性の度合
いが上記閾値より小さい場合はピッチ同期化を行わずに
上記第4の雑音符号帳の雑音音源ベクトルを出力する他
の適応ピッチ同期化手段とをさらにそれぞれ備え、上記
ピッチ位置抽出手段は、上記適応符号帳が選択されない
場合は、代わりに選択された上記固定符号帳から出力さ
れる時系列ベクトルのピッチ位置とそのピーク性の度合
いを求めるものである。
【0048】さらに、上記ピッチ位置抽出手段は、上記
固定符号帳からの時系列ベクトルと上記線形予測パラメ
ータ符号化手段からの線形予測パラメータとから第3の
合成ベクトルを生成すると共に、単一のパルスを作成し
てこれを音源として上記線形予測パラメータ符号化手段
からの線形予測パラメータを用いて第4の合成ベクトル
を生成し、上記第3の合成ベクトルと第4の合成ベクト
ルとの歪みが最小となるパルス列を探索して歪みが最小
となるパルス位置をピッチ位置とし、その時の歪み量を
ピーク性の度合いとするものである。
固定符号帳からの時系列ベクトルと上記線形予測パラメ
ータ符号化手段からの線形予測パラメータとから第3の
合成ベクトルを生成すると共に、単一のパルスを作成し
てこれを音源として上記線形予測パラメータ符号化手段
からの線形予測パラメータを用いて第4の合成ベクトル
を生成し、上記第3の合成ベクトルと第4の合成ベクト
ルとの歪みが最小となるパルス列を探索して歪みが最小
となるパルス位置をピッチ位置とし、その時の歪み量を
ピーク性の度合いとするものである。
【0049】
【発明の実施の形態】実施の形態1.図1はこの実施の
形態1に係る音声符号化復号化装置の全体構成を示すブ
ロック図である。図1において、1は符号化部、2は復
号化部、3は多重化手段、4は分離手段、5は入力音
声、6は符号、7は出力音声である。
形態1に係る音声符号化復号化装置の全体構成を示すブ
ロック図である。図1において、1は符号化部、2は復
号化部、3は多重化手段、4は分離手段、5は入力音
声、6は符号、7は出力音声である。
【0050】符号化部1は、次の8〜11、13、1
4、24及び30〜36により構成されている。8は線
形予測パラメータ分析手段、9は線形予測パラメータ符
号化手段、10は合成フィルタ、11は適応符号帳、1
3はゲイン符号化手段、14は距離計算手段、24は適
応符号帳11と切り替えて用いる固定符号帳、30はピ
ッチ位置抽出手段、31、32は適応ピッチ同期化手
段、33、34は適応符号帳11と合わせて用いる雑音
符号帳セットとなる第1と第2の雑音符号帳、35、3
6は固定符号帳24と合わせて用いる雑音符号帳セット
となる第3と第4の雑音符号帳である。
4、24及び30〜36により構成されている。8は線
形予測パラメータ分析手段、9は線形予測パラメータ符
号化手段、10は合成フィルタ、11は適応符号帳、1
3はゲイン符号化手段、14は距離計算手段、24は適
応符号帳11と切り替えて用いる固定符号帳、30はピ
ッチ位置抽出手段、31、32は適応ピッチ同期化手
段、33、34は適応符号帳11と合わせて用いる雑音
符号帳セットとなる第1と第2の雑音符号帳、35、3
6は固定符号帳24と合わせて用いる雑音符号帳セット
となる第3と第4の雑音符号帳である。
【0051】また、復号化部2は、次の15〜17、2
7及び37〜43により構成されている。15は線形予
測パラメータ復号化手段、16は合成フィルタ、17は
適応符号帳、19はゲイン復号化手段、27は適応符号
帳17と切り替えて用いる固定符号帳、37はピッチ位
置抽出手段、38、39は適応ピッチ同期化手段、4
0、41は適応符号帳17と合わせて用いる雑音符号帳
セットとなる第1と第2の雑音符号帳、42、43は固
定符号帳27と合わせて用いる雑音符号帳セットとなる
第3と第4の雑音符号帳である。
7及び37〜43により構成されている。15は線形予
測パラメータ復号化手段、16は合成フィルタ、17は
適応符号帳、19はゲイン復号化手段、27は適応符号
帳17と切り替えて用いる固定符号帳、37はピッチ位
置抽出手段、38、39は適応ピッチ同期化手段、4
0、41は適応符号帳17と合わせて用いる雑音符号帳
セットとなる第1と第2の雑音符号帳、42、43は固
定符号帳27と合わせて用いる雑音符号帳セットとなる
第3と第4の雑音符号帳である。
【0052】以下、動作を説明する。まず、符号化部1
において、線形予測パラメータ分析手段8は、入力音声
5を分析し、音声のスペクトル情報である線形予測パラ
メータを抽出する。線形予測パラメータ符号化手段9
は、その線形予測パラメータを符号化し、符号化した線
形予測パラメータを合成フィルタ10の係数として設定
する。
において、線形予測パラメータ分析手段8は、入力音声
5を分析し、音声のスペクトル情報である線形予測パラ
メータを抽出する。線形予測パラメータ符号化手段9
は、その線形予測パラメータを符号化し、符号化した線
形予測パラメータを合成フィルタ10の係数として設定
する。
【0053】次に、音源情報の符号化について説明す
る。音源情報を符号化して駆動音源ベクトルを生成する
には、適応符号帳11と雑音符号帳セットとなる第1の
雑音符号帳33と第2の雑音符号帳34を用いる場合
と、固定符号帳24と雑音符号帳セットとなる第3の雑
音符号帳35と第4の雑音符号帳36とを用いる場合の
2通りの方法をとり、例えば符号化音声の入力音声との
距離がより小さくなる駆動音源ベクトルを生成する方法
を選択するとして、これら2通りの方法を切り替えて用
いる。
る。音源情報を符号化して駆動音源ベクトルを生成する
には、適応符号帳11と雑音符号帳セットとなる第1の
雑音符号帳33と第2の雑音符号帳34を用いる場合
と、固定符号帳24と雑音符号帳セットとなる第3の雑
音符号帳35と第4の雑音符号帳36とを用いる場合の
2通りの方法をとり、例えば符号化音声の入力音声との
距離がより小さくなる駆動音源ベクトルを生成する方法
を選択するとして、これら2通りの方法を切り替えて用
いる。
【0054】ここでは、まず、適応符号帳11と雑音符
号帳セットである雑音符号帳33と雑音符号帳34とを
用いる場合について説明し、次に、固定符号帳24と雑
音符号帳セットである雑音符号帳35と雑音符号帳36
とを用いる場合について説明する。
号帳セットである雑音符号帳33と雑音符号帳34とを
用いる場合について説明し、次に、固定符号帳24と雑
音符号帳セットである雑音符号帳35と雑音符号帳36
とを用いる場合について説明する。
【0055】適応符号帳11には、過去の駆動音源ベク
トルが記憶されており、適応符号に対応して過去の駆動
音源ベクトルを周期的に繰り返した時系列ベクトルを出
力する。ピッチ位置抽出手段30は、適応音源符号帳1
1から出力されるピッチ周期的に繰り返した時系列ベク
トルから、例えば時系列ベクトルの最大振幅をとるピッ
チ周期的な点をピッチ位置として抽出し、また、例えば
その最大振幅値をこの時系列ベクトルの全サンプル値を
合計した値で割った値をピーク性の度合いとして求め、
ピッチ位置とピーク性の度合いを適応ピッチ同期化手段
31に出力する。
トルが記憶されており、適応符号に対応して過去の駆動
音源ベクトルを周期的に繰り返した時系列ベクトルを出
力する。ピッチ位置抽出手段30は、適応音源符号帳1
1から出力されるピッチ周期的に繰り返した時系列ベク
トルから、例えば時系列ベクトルの最大振幅をとるピッ
チ周期的な点をピッチ位置として抽出し、また、例えば
その最大振幅値をこの時系列ベクトルの全サンプル値を
合計した値で割った値をピーク性の度合いとして求め、
ピッチ位置とピーク性の度合いを適応ピッチ同期化手段
31に出力する。
【0056】雑音符号帳33には、例えばランダム雑音
から生成した複数の符号ベクトルが記憶されており、雑
音符号に対応した符号ベクトルを出力する。各符号ベク
トルにはピッチ同期位置が設定されており、その位置で
比較的高いピーク性を持っている。また、雑音符号帳3
4には、例えばランダム雑音から生成した複数の時系列
ベクトルが記憶されており、各時系列ベクトルにはピッ
チ同期位置が設定されておらず、特定の位置で高いピー
ク性は持たない。図2(a)にピーク性のある符号ベク
トルN個によって構成された雑音符号帳33の例、図2
(b)にピーク性の無い時系列ベクトルN個によって構
成された雑音符号帳34の例を示す。
から生成した複数の符号ベクトルが記憶されており、雑
音符号に対応した符号ベクトルを出力する。各符号ベク
トルにはピッチ同期位置が設定されており、その位置で
比較的高いピーク性を持っている。また、雑音符号帳3
4には、例えばランダム雑音から生成した複数の時系列
ベクトルが記憶されており、各時系列ベクトルにはピッ
チ同期位置が設定されておらず、特定の位置で高いピー
ク性は持たない。図2(a)にピーク性のある符号ベク
トルN個によって構成された雑音符号帳33の例、図2
(b)にピーク性の無い時系列ベクトルN個によって構
成された雑音符号帳34の例を示す。
【0057】適応ピッチ同期化手段31は、ピッチ位置
抽出手段30で抽出されたピッチ位置におけるピーク性
の度合いが、例えばあらかじめ設定された閾値より大き
い場合はピーク性が高いと判定し、ピッチ位置抽出手段
30で抽出されたピッチ位置にピッチ同期位置が合うよ
うに、雑音符号帳33の符号ベクトルを切り出し、ピッ
チ周期単位で繰り返して時系列ベクトルを生成する(ピ
ッチ周期化する)。また、ピッチ位置抽出手段30で抽
出されたピーク性の度合いが、例えばあらかじめ設定さ
れた閾値より小さい場合はピーク性が低いと判定し、雑
音符号帳34の符号ベクトルをピッチ周期長で切り出
し、例えばサブフレームの起点を基準にピッチ周期単位
で繰り返して時系列ベクトルを生成する(ピッチ周期化
する)。図3(a)に適応音源ベクトルのピーク性が高
い場合におけるピッチ位置抽出手段31で行うピッチ位
置抽出、図3(b)にそのときの適応ピッチ同期化手段
31で行う雑音符号帳33の符号ベクトルのピッチ同期
化を示す。
抽出手段30で抽出されたピッチ位置におけるピーク性
の度合いが、例えばあらかじめ設定された閾値より大き
い場合はピーク性が高いと判定し、ピッチ位置抽出手段
30で抽出されたピッチ位置にピッチ同期位置が合うよ
うに、雑音符号帳33の符号ベクトルを切り出し、ピッ
チ周期単位で繰り返して時系列ベクトルを生成する(ピ
ッチ周期化する)。また、ピッチ位置抽出手段30で抽
出されたピーク性の度合いが、例えばあらかじめ設定さ
れた閾値より小さい場合はピーク性が低いと判定し、雑
音符号帳34の符号ベクトルをピッチ周期長で切り出
し、例えばサブフレームの起点を基準にピッチ周期単位
で繰り返して時系列ベクトルを生成する(ピッチ周期化
する)。図3(a)に適応音源ベクトルのピーク性が高
い場合におけるピッチ位置抽出手段31で行うピッチ位
置抽出、図3(b)にそのときの適応ピッチ同期化手段
31で行う雑音符号帳33の符号ベクトルのピッチ同期
化を示す。
【0058】適応符号帳11と雑音符号帳33及び雑音
符号帳34から生成された各時系列ベクトルは、ゲイン
符号化部13から与えられるそれぞれのゲインに応じて
重み付けして加算され、その加算結果を駆動音源ベクト
ルとして合成フィルタ10へ供給され符号化音声を得
る。距離計算手段14は、符号化音声と入力音声5との
距離を求め、距離が最小となる適応符号、雑音符号、ゲ
インを探索する。
符号帳34から生成された各時系列ベクトルは、ゲイン
符号化部13から与えられるそれぞれのゲインに応じて
重み付けして加算され、その加算結果を駆動音源ベクト
ルとして合成フィルタ10へ供給され符号化音声を得
る。距離計算手段14は、符号化音声と入力音声5との
距離を求め、距離が最小となる適応符号、雑音符号、ゲ
インを探索する。
【0059】次に、固定符号帳24と雑音符号帳セット
となる第3の雑音符号帳35と第4の雑音符号帳36と
を用いる場合について説明する。固定符号帳24には、
例えばランダム雑音から生成した複数の時系列ベクトル
が記憶されており、適応符号に対応した時系列ベクトル
を出力する。ピッチ位置抽出手段30は、固定符号帳2
4から出力された時系列ベクトルから、例えば最大振幅
(絶対値)をとる点をピッチ位置として抽出し、また例
えばその最大振幅値をこの時系列ベクトルの全サンプル
値(絶対値)を合計した値で割った値をピーク性の度合
いとして求め、ピッチ位置とピーク性の度合いを適応ピ
ッチ同期化手段32に出力する。
となる第3の雑音符号帳35と第4の雑音符号帳36と
を用いる場合について説明する。固定符号帳24には、
例えばランダム雑音から生成した複数の時系列ベクトル
が記憶されており、適応符号に対応した時系列ベクトル
を出力する。ピッチ位置抽出手段30は、固定符号帳2
4から出力された時系列ベクトルから、例えば最大振幅
(絶対値)をとる点をピッチ位置として抽出し、また例
えばその最大振幅値をこの時系列ベクトルの全サンプル
値(絶対値)を合計した値で割った値をピーク性の度合
いとして求め、ピッチ位置とピーク性の度合いを適応ピ
ッチ同期化手段32に出力する。
【0060】雑音符号帳35には、例えばランダム雑音
から生成した複数の符号ベクトルが記憶されており、雑
音符号に対応した符号ベクトルを出力する。各符号ベク
トルにはピッチ同期位置が設定されており、その位置で
比較的高いピーク性を持っている。また、雑音符号帳3
6には、例えばランダム雑音から生成した複数の時系列
ベクトルが記憶されており、各時系列ベクトルにはピッ
チ同期位置は設定されておらず、特定の位置で高いピー
ク性は持たない。適応ピッチ同期化手段32は、ピッチ
位置抽出手段30で抽出されたピーク性の度合いが、例
えばあらかじめ設定された閾値より大きい場合はピーク
性が高いと判定し、ピッチ位置抽出手段30で抽出され
たピッチ位置にピッチ同期位置が合うように、雑音符号
帳35の符号ベクトルを切り出して配置し、時系列ベク
トルを生成する。また、ピッチ位置抽出手段30で抽出
されたピーク性の度合いが、例えばあらかじめ設定され
た閾値より小さい場合はピーク性が低いと判定し、雑音
符号帳36の時系列ベクトルをそのまま出力する。図4
(a)に固定音源ベクトルのピーク性が高い場合におけ
るピッチ位置抽出手段30で行うピッチ位置抽出、図4
(b)にそのときの適応ピッチ同期化手段32で行う雑
音符号帳35の符号ベクトルのピッチ同期化を示す。
から生成した複数の符号ベクトルが記憶されており、雑
音符号に対応した符号ベクトルを出力する。各符号ベク
トルにはピッチ同期位置が設定されており、その位置で
比較的高いピーク性を持っている。また、雑音符号帳3
6には、例えばランダム雑音から生成した複数の時系列
ベクトルが記憶されており、各時系列ベクトルにはピッ
チ同期位置は設定されておらず、特定の位置で高いピー
ク性は持たない。適応ピッチ同期化手段32は、ピッチ
位置抽出手段30で抽出されたピーク性の度合いが、例
えばあらかじめ設定された閾値より大きい場合はピーク
性が高いと判定し、ピッチ位置抽出手段30で抽出され
たピッチ位置にピッチ同期位置が合うように、雑音符号
帳35の符号ベクトルを切り出して配置し、時系列ベク
トルを生成する。また、ピッチ位置抽出手段30で抽出
されたピーク性の度合いが、例えばあらかじめ設定され
た閾値より小さい場合はピーク性が低いと判定し、雑音
符号帳36の時系列ベクトルをそのまま出力する。図4
(a)に固定音源ベクトルのピーク性が高い場合におけ
るピッチ位置抽出手段30で行うピッチ位置抽出、図4
(b)にそのときの適応ピッチ同期化手段32で行う雑
音符号帳35の符号ベクトルのピッチ同期化を示す。
【0061】固定符号帳24と雑音符号帳35及び雑音
符号帳36から生成された各時系列ベクトルは、ゲイン
符号化部13から与えられるそれぞれのゲインに応じて
重み付けして加算され、その加算結果を駆動音源ベクト
ルとして合成フィルタ10へ供給され符号化音声を得
る。距離計算手段14は、符号化音声と入力音声5との
距離を求め、距離が最小となる適応符号、雑音符号、ゲ
インを探索する。
符号帳36から生成された各時系列ベクトルは、ゲイン
符号化部13から与えられるそれぞれのゲインに応じて
重み付けして加算され、その加算結果を駆動音源ベクト
ルとして合成フィルタ10へ供給され符号化音声を得
る。距離計算手段14は、符号化音声と入力音声5との
距離を求め、距離が最小となる適応符号、雑音符号、ゲ
インを探索する。
【0062】そして、適応符号帳11と雑音符号帳セッ
トである雑音符号帳33及び雑音符号帳34とを用いる
場合と、固定符号帳24と雑音符号帳セットである雑音
符号帳35及び雑音符号帳36とを用いる場合とで、そ
れぞれで選択された適応符号、雑音符号、ゲインを用い
て生成される符号化音声と入力音声との距離を比較し、
距離が小さくなる方の適応符号、雑音符号、ゲインが選
択される。以上の符号化が終了した後、線形予測パラメ
ータの符号、入力音声と符号化音声との歪みを最小にす
る適応符号、雑音符号、ゲインの符号を符号化結果とし
て出力する。
トである雑音符号帳33及び雑音符号帳34とを用いる
場合と、固定符号帳24と雑音符号帳セットである雑音
符号帳35及び雑音符号帳36とを用いる場合とで、そ
れぞれで選択された適応符号、雑音符号、ゲインを用い
て生成される符号化音声と入力音声との距離を比較し、
距離が小さくなる方の適応符号、雑音符号、ゲインが選
択される。以上の符号化が終了した後、線形予測パラメ
ータの符号、入力音声と符号化音声との歪みを最小にす
る適応符号、雑音符号、ゲインの符号を符号化結果とし
て出力する。
【0063】続いて、復号化部2について説明する。復
号化部2において、線形予測パラメータ復号化手段15
は、線形予測パラメータの符号から線形予測パラメータ
を復号化し、合成フィルタ16の係数として設定する。
号化部2において、線形予測パラメータ復号化手段15
は、線形予測パラメータの符号から線形予測パラメータ
を復号化し、合成フィルタ16の係数として設定する。
【0064】次に、音源情報の復号化について説明す
る。音源情報を復号化して駆動音源ベクトルを生成する
には、適応符号帳17と雑音符号帳セットである雑音符
号帳40及び雑音符号帳41を用いる場合と、固定符号
帳27と雑音符号帳セットである雑音符号帳42及び雑
音符号帳43とを用いる場合の2通りの方法をとり、適
応符号に対応して、符号化する際に用いられた方法を選
択するとして、これら2通りの方法を切り替えて用い
る。
る。音源情報を復号化して駆動音源ベクトルを生成する
には、適応符号帳17と雑音符号帳セットである雑音符
号帳40及び雑音符号帳41を用いる場合と、固定符号
帳27と雑音符号帳セットである雑音符号帳42及び雑
音符号帳43とを用いる場合の2通りの方法をとり、適
応符号に対応して、符号化する際に用いられた方法を選
択するとして、これら2通りの方法を切り替えて用い
る。
【0065】ここでは、まず、適応符号帳17と雑音符
号帳セットである雑音符号帳40及び雑音符号帳41と
を用いる場合について説明し、次に、固定符号帳27と
雑音符号帳セットである雑音符号帳42と雑音符号帳4
3とを用いる場合について説明する。
号帳セットである雑音符号帳40及び雑音符号帳41と
を用いる場合について説明し、次に、固定符号帳27と
雑音符号帳セットである雑音符号帳42と雑音符号帳4
3とを用いる場合について説明する。
【0066】適応符号帳17は、適応符号に対応して、
過去の駆動音源ベクトルを周期的に繰り返した時系列ベ
クトルを出力する。ピッチ位置抽出手段37は、適応音
源符号帳17から出力されるピッチ周期的に繰り返した
時系列ベクトルから、例えば時系列ベクトルの最大振幅
(絶対値)をとるピッチ周期的な点をピッチ位置として
抽出し、また、例えばその最大振幅値をこの時系列ベク
トルの全サンプル値(絶対値)を合計した値で割った値
をピーク性の度合いとして求め、ピッチ位置とピーク性
の度合いを適応ピッチ同期化手段38に出力する。
過去の駆動音源ベクトルを周期的に繰り返した時系列ベ
クトルを出力する。ピッチ位置抽出手段37は、適応音
源符号帳17から出力されるピッチ周期的に繰り返した
時系列ベクトルから、例えば時系列ベクトルの最大振幅
(絶対値)をとるピッチ周期的な点をピッチ位置として
抽出し、また、例えばその最大振幅値をこの時系列ベク
トルの全サンプル値(絶対値)を合計した値で割った値
をピーク性の度合いとして求め、ピッチ位置とピーク性
の度合いを適応ピッチ同期化手段38に出力する。
【0067】雑音符号帳40には、符号化部1の雑音符
号帳33と同じ複数の符号ベクトルが記憶されており、
雑音符号帳41には、符号化部1の雑音符号帳34と同
じ複数の時系列ベクトルが記憶されている。適応ピッチ
同期化手段38は、ピッチ位置抽出手段37で抽出され
たピーク性の度合いが、例えばあらかじめ設定された閾
値より大きい場合はピーク性が高いと判定し、ピッチ位
置抽出手段37で抽出されたピッチ位置にピッチ同期位
置が合うように、雑音符号帳40の符号ベクトルを切り
出し、ピッチ周期単位で繰り返して時系列ベクトルを生
成する。また、ピッチ位置抽出手段38で抽出されたピ
ーク性の度合いが、例えばあらかじめ設定された閾値よ
り小さい場合はピーク性が低いと判定し、雑音符号帳4
1の符号ベクトルをピッチ周期長で切り出し、例えばサ
ブフレームの起点を基準にピッチ周期単位で繰り返して
時系列ベクトルを生成する。
号帳33と同じ複数の符号ベクトルが記憶されており、
雑音符号帳41には、符号化部1の雑音符号帳34と同
じ複数の時系列ベクトルが記憶されている。適応ピッチ
同期化手段38は、ピッチ位置抽出手段37で抽出され
たピーク性の度合いが、例えばあらかじめ設定された閾
値より大きい場合はピーク性が高いと判定し、ピッチ位
置抽出手段37で抽出されたピッチ位置にピッチ同期位
置が合うように、雑音符号帳40の符号ベクトルを切り
出し、ピッチ周期単位で繰り返して時系列ベクトルを生
成する。また、ピッチ位置抽出手段38で抽出されたピ
ーク性の度合いが、例えばあらかじめ設定された閾値よ
り小さい場合はピーク性が低いと判定し、雑音符号帳4
1の符号ベクトルをピッチ周期長で切り出し、例えばサ
ブフレームの起点を基準にピッチ周期単位で繰り返して
時系列ベクトルを生成する。
【0068】次に、固定符号帳27と雑音符号帳セット
である雑音符号帳42と雑音符号帳43とを用いる場合
について説明する。固定符号帳27は、適応符号に対応
した時系列ベクトルを出力する。ピッチ位置抽出手段3
7は、固定符号帳27から出力された時系列ベクトルか
ら、例えば最大振幅(絶対値)をとる点をピッチ位置と
して抽出し、また、例えばその最大振幅値をこの時系列
ベクトルの全サンプル値を合計した値で割った値をピー
ク性の度合いとして求め、ピッチ位置とピーク性の度合
いを適応ピッチ同期化手段39に出力する。
である雑音符号帳42と雑音符号帳43とを用いる場合
について説明する。固定符号帳27は、適応符号に対応
した時系列ベクトルを出力する。ピッチ位置抽出手段3
7は、固定符号帳27から出力された時系列ベクトルか
ら、例えば最大振幅(絶対値)をとる点をピッチ位置と
して抽出し、また、例えばその最大振幅値をこの時系列
ベクトルの全サンプル値を合計した値で割った値をピー
ク性の度合いとして求め、ピッチ位置とピーク性の度合
いを適応ピッチ同期化手段39に出力する。
【0069】雑音符号帳42には、符号化部1の雑音符
号帳35と同じ複数の符号ベクトルが記憶されており、
雑音符号帳43には、符号化部1の雑音符号帳36と同
じ複数の時系列ベクトルが記憶されている。適応ピッチ
同期化手段39は、ピッチ位置抽出手段37で抽出され
たピーク性の度合いが、例えばあらかじめ設定された閾
値より大きい場合はピーク性が高いと判定し、ピッチ位
置抽出手段37で抽出されたピッチ位置にピッチ同期位
置が合うように、雑音符号帳42の符号ベクトルを切り
出して配置し、時系列ベクトルを生成する。また、ピッ
チ位置抽出手段37で抽出されたピーク性の度合いが、
例えばあらかじめ設定された閾値より小さい場合はピー
ク性が低いと判定し、雑音符号帳43の時系列ベクトル
をそのまま出力る。
号帳35と同じ複数の符号ベクトルが記憶されており、
雑音符号帳43には、符号化部1の雑音符号帳36と同
じ複数の時系列ベクトルが記憶されている。適応ピッチ
同期化手段39は、ピッチ位置抽出手段37で抽出され
たピーク性の度合いが、例えばあらかじめ設定された閾
値より大きい場合はピーク性が高いと判定し、ピッチ位
置抽出手段37で抽出されたピッチ位置にピッチ同期位
置が合うように、雑音符号帳42の符号ベクトルを切り
出して配置し、時系列ベクトルを生成する。また、ピッ
チ位置抽出手段37で抽出されたピーク性の度合いが、
例えばあらかじめ設定された閾値より小さい場合はピー
ク性が低いと判定し、雑音符号帳43の時系列ベクトル
をそのまま出力る。
【0070】適応符号帳17と適応ピッチ同期化手段3
8からの時系列ベクトル、あるいは固定符号帳27と適
応ピッチ同期化手段39からの時系列ベクトルは、ゲイ
ン復号化手段19でゲインの符号から復号化したそれぞ
れのゲインに応じて重み付けして加算され、その加算結
果を駆動音源ベクトルとして合成フィルタ16へ供給さ
れ出力音声7が得られる。以上がこの実施の形態1の動
作である。
8からの時系列ベクトル、あるいは固定符号帳27と適
応ピッチ同期化手段39からの時系列ベクトルは、ゲイ
ン復号化手段19でゲインの符号から復号化したそれぞ
れのゲインに応じて重み付けして加算され、その加算結
果を駆動音源ベクトルとして合成フィルタ16へ供給さ
れ出力音声7が得られる。以上がこの実施の形態1の動
作である。
【0071】従って、この実施の形態1によれば、適応
符号帳から出力される時系列ベクトルの最大振幅値ある
いは固定符号帳から出力される時系列ベクトルの最大振
幅値によってピッチ位置におけるピーク性の度合いを判
定し、ピーク性の高い場合はピーク性のある雑音符号
帳、ピーク性の低い場合はピーク性の無い雑音符号帳を
選択できるようにしたので、効率的な音源情報の符号化
を行うことができ、品質の良い合成音声を合成できる。
符号帳から出力される時系列ベクトルの最大振幅値ある
いは固定符号帳から出力される時系列ベクトルの最大振
幅値によってピッチ位置におけるピーク性の度合いを判
定し、ピーク性の高い場合はピーク性のある雑音符号
帳、ピーク性の低い場合はピーク性の無い雑音符号帳を
選択できるようにしたので、効率的な音源情報の符号化
を行うことができ、品質の良い合成音声を合成できる。
【0072】また、この実施の形態1によれば、固定符
号帳が選択されたサブフレームにおいても、ピッチ位置
において固定符号帳から出力される時系列ベクトルの最
大振幅値が大きい場合は雑音符号帳内の符号ベクトルの
ピッチ同期化を行うようにしたので、固定符号帳が選択
されたサブフレームにおいて入力音声がピーク性を持つ
場合でも、雑音符号帳内の符号ベクトルをピッチ同期化
して音源情報を効率的に符号化することができ、品質の
良い合成音声を合成できる。
号帳が選択されたサブフレームにおいても、ピッチ位置
において固定符号帳から出力される時系列ベクトルの最
大振幅値が大きい場合は雑音符号帳内の符号ベクトルの
ピッチ同期化を行うようにしたので、固定符号帳が選択
されたサブフレームにおいて入力音声がピーク性を持つ
場合でも、雑音符号帳内の符号ベクトルをピッチ同期化
して音源情報を効率的に符号化することができ、品質の
良い合成音声を合成できる。
【0073】実施の形態2.次に、図5は実施の形態2
に係る音声符号化復号化装置の全体構成を示すブロック
図である。図5において、1は符号化部、2は復号化
部、3は多重化手段、4は分離手段、5は入力音声、6
は符号、7は出力音声である。
に係る音声符号化復号化装置の全体構成を示すブロック
図である。図5において、1は符号化部、2は復号化
部、3は多重化手段、4は分離手段、5は入力音声、6
は符号、7は出力音声である。
【0074】符号化部1は、次の8〜11、13、1
4、24及び30〜36により構成されている。8は線
形予測パラメータ分析手段、9は線形予測パラメータ符
号化手段、10は合成フィルタ、11は適応符号帳、1
3はゲイン符号化手段、14は距離計算手段、24は適
応符号帳11と切り替えて用いる固定符号帳、31、3
2は適応ピッチ同期化手段、33、34は適応符号帳1
1と合わせて用いる雑音符号帳セットである第1と第2
の雑音符号帳、35、36は固定符号帳24と合わせて
用いる雑音符号帳セットである第3と第4の雑音符号
帳、44はピッチ位置抽出手段である。
4、24及び30〜36により構成されている。8は線
形予測パラメータ分析手段、9は線形予測パラメータ符
号化手段、10は合成フィルタ、11は適応符号帳、1
3はゲイン符号化手段、14は距離計算手段、24は適
応符号帳11と切り替えて用いる固定符号帳、31、3
2は適応ピッチ同期化手段、33、34は適応符号帳1
1と合わせて用いる雑音符号帳セットである第1と第2
の雑音符号帳、35、36は固定符号帳24と合わせて
用いる雑音符号帳セットである第3と第4の雑音符号
帳、44はピッチ位置抽出手段である。
【0075】また、復号化部2は、次の15〜17、2
7及び37〜43により構成されている。15は線形予
測パラメータ復号化手段、16は合成フィルタ、17は
適応符号帳、19はゲイン復号化手段、27は適応符号
帳17と切り替えて用いる固定符号帳、38、39は適
応ピッチ同期化手段である。40、41は適応符号帳1
7と合わせて用いる雑音符号帳セットである第1と第2
の雑音符号帳、42、43は固定符号帳27と合わせて
用いる雑音符号帳セットである第3と第4の雑音符号
帳、45はピッチ位置抽出手段である。
7及び37〜43により構成されている。15は線形予
測パラメータ復号化手段、16は合成フィルタ、17は
適応符号帳、19はゲイン復号化手段、27は適応符号
帳17と切り替えて用いる固定符号帳、38、39は適
応ピッチ同期化手段である。40、41は適応符号帳1
7と合わせて用いる雑音符号帳セットである第1と第2
の雑音符号帳、42、43は固定符号帳27と合わせて
用いる雑音符号帳セットである第3と第4の雑音符号
帳、45はピッチ位置抽出手段である。
【0076】以下、動作を説明する。図5において、図
1と同一部分は同一符号を付してその説明は省略し、符
号化部1において、主にピッチ位置抽出手段44につい
て動作を説明する。まず、適応符号帳11と雑音符号帳
セットである雑音符号帳33と雑音符号帳34とを用い
る場合について説明する。ピッチ位置抽出手段44は、
適応符号帳11から出力されたこの時系列ベクトルと線
形予測パラメータ符号化手段9から出力される線形予測
パラメータを用いて合成ベクトルAiを合成する。この
合成ベクトルAiは、適応符号帳11のみから合成され
る合成音声と理解でき、概ね入力音声に近い形状を持っ
ている。
1と同一部分は同一符号を付してその説明は省略し、符
号化部1において、主にピッチ位置抽出手段44につい
て動作を説明する。まず、適応符号帳11と雑音符号帳
セットである雑音符号帳33と雑音符号帳34とを用い
る場合について説明する。ピッチ位置抽出手段44は、
適応符号帳11から出力されたこの時系列ベクトルと線
形予測パラメータ符号化手段9から出力される線形予測
パラメータを用いて合成ベクトルAiを合成する。この
合成ベクトルAiは、適応符号帳11のみから合成され
る合成音声と理解でき、概ね入力音声に近い形状を持っ
ている。
【0077】次に、ピッチ位置抽出手段44は、適応符
号帳11から出力された時系列ベクトルのピッチ周期間
隔のパルス列を作成し、これを音源として線形予測パラ
メータ符号化手段9から出力される線形予測パラメータ
を用いて合成ベクトルBiを生成し、前記合成Aiとの
歪み(誤差)をパルス位置を移動しながら求め、その歪
みが最小となるパルス列を探索する。そして、このとき
のパルス位置をピッチ位置として抽出し、歪み量と共に
適応ピッチ同期化手段31に出力する。図6に適応符号
帳11が選択された時のピッチ位置抽出手段44による
ピッチ位置抽出処理の流れ(ピッチ周期Lの場合)を示
す。
号帳11から出力された時系列ベクトルのピッチ周期間
隔のパルス列を作成し、これを音源として線形予測パラ
メータ符号化手段9から出力される線形予測パラメータ
を用いて合成ベクトルBiを生成し、前記合成Aiとの
歪み(誤差)をパルス位置を移動しながら求め、その歪
みが最小となるパルス列を探索する。そして、このとき
のパルス位置をピッチ位置として抽出し、歪み量と共に
適応ピッチ同期化手段31に出力する。図6に適応符号
帳11が選択された時のピッチ位置抽出手段44による
ピッチ位置抽出処理の流れ(ピッチ周期Lの場合)を示
す。
【0078】適応ピッチ同期化手段31は、ピッチ位置
抽出手段44で抽出された歪み量が、例えばあらかじめ
設定された閾値より小さい場合はピーク性が高いと判定
し、図3(b)に示したものと同じ方法でピッチ位置抽
出手段44で抽出されたピッチ位置にピッチ同期位置が
合うように、雑音符号帳33の符号ベクトルを切り出
し、ピッチ周期単位で繰り返して時系列ベクトルを生成
する。また、ピッチ位置抽出手段44で抽出された歪み
量が、例えばあらかじめ設定された閾値より大きい場合
はピーク性が低いと判定し、雑音符号帳34の符号ベク
トルをピッチ周期長で切り出し、例えばサブフレームの
起点を基準にピッチ同期単位で繰り返して時系列ベクト
ルを生成する。
抽出手段44で抽出された歪み量が、例えばあらかじめ
設定された閾値より小さい場合はピーク性が高いと判定
し、図3(b)に示したものと同じ方法でピッチ位置抽
出手段44で抽出されたピッチ位置にピッチ同期位置が
合うように、雑音符号帳33の符号ベクトルを切り出
し、ピッチ周期単位で繰り返して時系列ベクトルを生成
する。また、ピッチ位置抽出手段44で抽出された歪み
量が、例えばあらかじめ設定された閾値より大きい場合
はピーク性が低いと判定し、雑音符号帳34の符号ベク
トルをピッチ周期長で切り出し、例えばサブフレームの
起点を基準にピッチ同期単位で繰り返して時系列ベクト
ルを生成する。
【0079】次に、固定符号帳24と雑音符号帳セット
である雑音符号帳35と雑音符号帳36とを用いる場合
について説明する。ピッチ位置抽出手段44は、固定符
号帳24から出力された時系列ベクトルと線形予測パラ
メータ符号化手段9から出力される線形予測パラメータ
を用いて合成ベクトルAiを合成する。この合成ベクト
ルAiは、固定符号帳24のみから合成される合成音声
と理解でき、概ね入力音声に近い形状を持っている。
である雑音符号帳35と雑音符号帳36とを用いる場合
について説明する。ピッチ位置抽出手段44は、固定符
号帳24から出力された時系列ベクトルと線形予測パラ
メータ符号化手段9から出力される線形予測パラメータ
を用いて合成ベクトルAiを合成する。この合成ベクト
ルAiは、固定符号帳24のみから合成される合成音声
と理解でき、概ね入力音声に近い形状を持っている。
【0080】次に、ピッチ位置抽出手段44は、単一の
パルスを作成し、これを音源として線形予測パラメータ
符号化手段9から出力される線形予測パラメータを用い
て合成ベクトルBiを生成し、前記合成ベクトルAiと
の歪みが最小となるパルスを探索する。そして、このと
きのパルス位置をピッチ位置として抽出し、歪み量と共
に適応ピッチ同期化手段32に出力する。図7に固定符
号帳24が選択された時のピッチ位置抽出手段44によ
るピッチ位置抽出処理の流れを示す。
パルスを作成し、これを音源として線形予測パラメータ
符号化手段9から出力される線形予測パラメータを用い
て合成ベクトルBiを生成し、前記合成ベクトルAiと
の歪みが最小となるパルスを探索する。そして、このと
きのパルス位置をピッチ位置として抽出し、歪み量と共
に適応ピッチ同期化手段32に出力する。図7に固定符
号帳24が選択された時のピッチ位置抽出手段44によ
るピッチ位置抽出処理の流れを示す。
【0081】適応ピッチ同期化手段32は、ピッチ位置
抽出手段44で抽出された歪み量が、例えばあらかじめ
設定された閾値より小さい場合はピーク性が高いと判定
し、図4(b)に示したものと同じ方法でピッチ位置抽
出手段44で抽出されたピッチ位置にピッチ同期位置が
合うように、雑音符号帳35の符号ベクトルを切り出し
て配置し、時系列ベクトルを生成する。また、ピッチ位
置抽出手段44で抽出された歪み量が、例えばあらかじ
め設定された閾値より大きい場合はピーク性が低いと判
定し、雑音符号帳36の時系列ベクトルをそのまま出力
する。
抽出手段44で抽出された歪み量が、例えばあらかじめ
設定された閾値より小さい場合はピーク性が高いと判定
し、図4(b)に示したものと同じ方法でピッチ位置抽
出手段44で抽出されたピッチ位置にピッチ同期位置が
合うように、雑音符号帳35の符号ベクトルを切り出し
て配置し、時系列ベクトルを生成する。また、ピッチ位
置抽出手段44で抽出された歪み量が、例えばあらかじ
め設定された閾値より大きい場合はピーク性が低いと判
定し、雑音符号帳36の時系列ベクトルをそのまま出力
する。
【0082】次に、復号化部2において、主にピッチ位
置抽出手段45について動作を説明する。まず、適応符
号帳17と雑音符号帳セットである雑音符号帳40と雑
音符号帳41とを用いる場合について説明する。ピッチ
位置抽出手段45は、適応符号帳17から出力されたこ
の時系列ベクトルと線形予測パラメータ復号化手段15
から出力される線形予測パラメータを用いて合成ベクト
ルAiを合成する。次に、ピッチ位置抽出手段45は、
ピッチ周期間隔のパルス列を作成し、これを音源として
線形予測パラメータ復号化手段15から出力される線形
予測パラメータを用いて合成ベクトルBiを生成し、A
iとの歪みが最小となるパルス列を探索する。そして、
このときのパルス位置をピッチ位置として抽出し、歪み
量と共に適応ピッチ同期化手段38に出力する。
置抽出手段45について動作を説明する。まず、適応符
号帳17と雑音符号帳セットである雑音符号帳40と雑
音符号帳41とを用いる場合について説明する。ピッチ
位置抽出手段45は、適応符号帳17から出力されたこ
の時系列ベクトルと線形予測パラメータ復号化手段15
から出力される線形予測パラメータを用いて合成ベクト
ルAiを合成する。次に、ピッチ位置抽出手段45は、
ピッチ周期間隔のパルス列を作成し、これを音源として
線形予測パラメータ復号化手段15から出力される線形
予測パラメータを用いて合成ベクトルBiを生成し、A
iとの歪みが最小となるパルス列を探索する。そして、
このときのパルス位置をピッチ位置として抽出し、歪み
量と共に適応ピッチ同期化手段38に出力する。
【0083】適応ピッチ同期化手段38は、ピッチ位置
抽出手段45で抽出された歪み量が、例えばあらかじめ
設定された閾値より小さい場合はピーク性が高いと判定
し、ピッチ位置抽出手段45で抽出されたピッチ位置に
ピッチ同期位置が合うように、雑音符号帳40の符号ベ
クトルを切り出し、ピッチ周期単位で繰り返して時系列
ベクトルを生成する。また、ピッチ位置抽出手段45で
抽出された歪み量が、例えばあらかじめ設定された閾値
より大きい場合はピーク性が低いと判定し、雑音符号帳
41の符号ベクトルをピッチ周期長で切り出し、例えば
サブフレームの起点を基準にピッチ周期単位で繰り返し
て時系列ベクトルを生成する。
抽出手段45で抽出された歪み量が、例えばあらかじめ
設定された閾値より小さい場合はピーク性が高いと判定
し、ピッチ位置抽出手段45で抽出されたピッチ位置に
ピッチ同期位置が合うように、雑音符号帳40の符号ベ
クトルを切り出し、ピッチ周期単位で繰り返して時系列
ベクトルを生成する。また、ピッチ位置抽出手段45で
抽出された歪み量が、例えばあらかじめ設定された閾値
より大きい場合はピーク性が低いと判定し、雑音符号帳
41の符号ベクトルをピッチ周期長で切り出し、例えば
サブフレームの起点を基準にピッチ周期単位で繰り返し
て時系列ベクトルを生成する。
【0084】次に、固定符号帳27と雑音符号帳セット
である雑音符号帳42と雑音符号帳43とを用いる場合
について説明する。ピッチ位置抽出手段45は、固定符
号帳27から出力された時系列ベクトルと線形予測パラ
メータ復号化手段15から出力される線形予測パラメー
タを用いて合成ベクトルAiを合成する。次に、ピッチ
位置抽出手段45は、単一のパルスを作成し、これを音
源として線形予測パラメータ復号化手段15から出力さ
れる線形予測パラメータを用いて合成ベクトルBiを生
成し、前記合成ベクトルAiとの歪みが最小となるパル
スを探索する。そして、このときのパルス位置をピッチ
位置として抽出し、歪み量と共に適応ピッチ同期化手段
39に出力する。
である雑音符号帳42と雑音符号帳43とを用いる場合
について説明する。ピッチ位置抽出手段45は、固定符
号帳27から出力された時系列ベクトルと線形予測パラ
メータ復号化手段15から出力される線形予測パラメー
タを用いて合成ベクトルAiを合成する。次に、ピッチ
位置抽出手段45は、単一のパルスを作成し、これを音
源として線形予測パラメータ復号化手段15から出力さ
れる線形予測パラメータを用いて合成ベクトルBiを生
成し、前記合成ベクトルAiとの歪みが最小となるパル
スを探索する。そして、このときのパルス位置をピッチ
位置として抽出し、歪み量と共に適応ピッチ同期化手段
39に出力する。
【0085】適応ピッチ同期化手段39は、ピッチ位置
抽出手段45で抽出された歪み量が、例えばあらかじめ
設定された閾値より小さい場合はピーク性が高いと判定
し、ピッチ位置抽出手段45で抽出されたピッチ位置に
ピッチ同期位置が合うように、雑音符号帳42の符号ベ
クトルを切り出して配置し、時系列ベクトルを生成す
る。また、ピッチ位置抽出手段45で抽出された歪み量
が、例えばあらかじめ設定された閾値より大きい場合は
ピーク性が低いと判定し、雑音符号帳43の時系列ベク
トルをそのまま出力する。
抽出手段45で抽出された歪み量が、例えばあらかじめ
設定された閾値より小さい場合はピーク性が高いと判定
し、ピッチ位置抽出手段45で抽出されたピッチ位置に
ピッチ同期位置が合うように、雑音符号帳42の符号ベ
クトルを切り出して配置し、時系列ベクトルを生成す
る。また、ピッチ位置抽出手段45で抽出された歪み量
が、例えばあらかじめ設定された閾値より大きい場合は
ピーク性が低いと判定し、雑音符号帳43の時系列ベク
トルをそのまま出力する。
【0086】従って、この実施の形態2によれば、適応
符号帳あるいは固定符号帳から出力される時系列ベクト
ルと線形予測パラメータによって、入力音声に近い形状
を持つ合成ベクトルAiを合成し、パルスから合成する
合成ベクトルBiと合成ベクトルAiとの歪みが最小に
なるときのパルス位置をピッチ位置として抽出し、また
そのときの歪み量によってピッチ位置でのピーク性の高
低を判定する。このため、入力音声に近い形状を持つ合
成ベクトルAiを基準に合成ベクトルの領域でピッチ位
置やピーク性の度合いを求めることができ、精度の良い
ピッチ位置とピーク性の度合いが得られる。このため、
効率的に音源情報が符号化できるので、品質の良い合成
音声を合成できる。
符号帳あるいは固定符号帳から出力される時系列ベクト
ルと線形予測パラメータによって、入力音声に近い形状
を持つ合成ベクトルAiを合成し、パルスから合成する
合成ベクトルBiと合成ベクトルAiとの歪みが最小に
なるときのパルス位置をピッチ位置として抽出し、また
そのときの歪み量によってピッチ位置でのピーク性の高
低を判定する。このため、入力音声に近い形状を持つ合
成ベクトルAiを基準に合成ベクトルの領域でピッチ位
置やピーク性の度合いを求めることができ、精度の良い
ピッチ位置とピーク性の度合いが得られる。このため、
効率的に音源情報が符号化できるので、品質の良い合成
音声を合成できる。
【0087】実施の形態3.上述した実施の形態1にお
いて、ピッチ位置抽出手段30、37は、適応符号帳あ
るいは固定符号帳内の時系列ベクトルの最大振幅点(絶
対値)を探索してピッチ位置とし、最大振幅値を時系列
ベクトルの全サンプル値(絶対値)で割った値をピーク
性の度合いとしたが、ある点を中心として連続する数点
の振幅値(絶対値)の合計を求め、この合計値が最大と
なる場所の中心点をピッチ位置とし、この合計値を時系
列ベクトルの全サンプル値(絶対値)で割った値をピー
ク性の度合いとしても良い。
いて、ピッチ位置抽出手段30、37は、適応符号帳あ
るいは固定符号帳内の時系列ベクトルの最大振幅点(絶
対値)を探索してピッチ位置とし、最大振幅値を時系列
ベクトルの全サンプル値(絶対値)で割った値をピーク
性の度合いとしたが、ある点を中心として連続する数点
の振幅値(絶対値)の合計を求め、この合計値が最大と
なる場所の中心点をピッチ位置とし、この合計値を時系
列ベクトルの全サンプル値(絶対値)で割った値をピー
ク性の度合いとしても良い。
【0088】この実施形態3によれば、複数のサンプル
の振幅値を用いてピッチ位置とピーク性の度合いを求め
るので、精度の高いピッチ位置抽出とピーク性の度合い
が得られる。このため、効率的に音源情報が符号化でき
るので、品質の良い合成音声を合成できる。
の振幅値を用いてピッチ位置とピーク性の度合いを求め
るので、精度の高いピッチ位置抽出とピーク性の度合い
が得られる。このため、効率的に音源情報が符号化でき
るので、品質の良い合成音声を合成できる。
【0089】実施の形態4.上述した実施の形態1,2
において、適応ピッチ同期化手段32,39はピーク性
の度合いが高いと判定された場合、ピッチ位置にピッチ
同期位置が合うように、雑音符号帳35,42の符号ベ
クトルを切り出して配置し、時系列ベクトルを生成した
が、雑音符号帳35,42の符号ベクトルをそのまま出
力してもよい。
において、適応ピッチ同期化手段32,39はピーク性
の度合いが高いと判定された場合、ピッチ位置にピッチ
同期位置が合うように、雑音符号帳35,42の符号ベ
クトルを切り出して配置し、時系列ベクトルを生成した
が、雑音符号帳35,42の符号ベクトルをそのまま出
力してもよい。
【0090】この実施の形態4によれば、固定符号帳が
選択されたサブフレームにおいて、入力音声の波形が複
数のピークを持つ場合、雑音符号帳内の符号ベクトルを
1つのピッチ位置に固定してピッチ同期化することがな
いので、音源情報を効率的に符号化することができる。
選択されたサブフレームにおいて、入力音声の波形が複
数のピークを持つ場合、雑音符号帳内の符号ベクトルを
1つのピッチ位置に固定してピッチ同期化することがな
いので、音源情報を効率的に符号化することができる。
【0091】
【発明の効果】以上詳述したように、この発明に係る音
声符号化装置と音声復号化装置及び音声符号化復号化装
置によれば、適応符号帳が選択されたサブフレームにお
いて、適応符号帳から出力される時系列ベクトルのピッ
チ位置におけるピーク性の度合いを判定し、ピーク性の
度合いに対応する雑音符号帳を選択できるようにしたの
で、効率的な音源情報の符号化を行うことができ、品質
の良い合成音声を合成できる。
声符号化装置と音声復号化装置及び音声符号化復号化装
置によれば、適応符号帳が選択されたサブフレームにお
いて、適応符号帳から出力される時系列ベクトルのピッ
チ位置におけるピーク性の度合いを判定し、ピーク性の
度合いに対応する雑音符号帳を選択できるようにしたの
で、効率的な音源情報の符号化を行うことができ、品質
の良い合成音声を合成できる。
【0092】また、適応符号帳が選択されたサブフレー
ムでは、適応符号帳から出力される時系列ベクトルと線
形予測パラメータによって、入力音声に近い形状を持つ
合成ベクトルAiを合成し、ピッチ周期間隔のパルスか
ら合成する合成ベクトルBiと合成ベクトルAiとの歪
みが最小になるときのパルス位置をピッチ位置として抽
出し、またそのときの歪み量によってピッチ位置でのピ
ーク性の度合いを判定するので、入力音声に近い形状を
持つ合成ベクトルAiを基準に合成ベクトルの領域でピ
ッチ位置やピーク性の度合いを求めることができ、精度
の良いピッチ位置とピーク性の強度が得られる。このた
め音源情報が効率的に符号化でき、品質の良い合成音声
を合成できる。
ムでは、適応符号帳から出力される時系列ベクトルと線
形予測パラメータによって、入力音声に近い形状を持つ
合成ベクトルAiを合成し、ピッチ周期間隔のパルスか
ら合成する合成ベクトルBiと合成ベクトルAiとの歪
みが最小になるときのパルス位置をピッチ位置として抽
出し、またそのときの歪み量によってピッチ位置でのピ
ーク性の度合いを判定するので、入力音声に近い形状を
持つ合成ベクトルAiを基準に合成ベクトルの領域でピ
ッチ位置やピーク性の度合いを求めることができ、精度
の良いピッチ位置とピーク性の強度が得られる。このた
め音源情報が効率的に符号化でき、品質の良い合成音声
を合成できる。
【0093】また、固定符号帳が選択されたサブフレー
ムにおいて、固定符号帳から出力される時系列ベクトル
のピッチ位置におけるピーク性の度合いを判定し、ピー
ク性の度合いに対応する雑音符号帳を選択できるように
したので、効率的な音源情報の符号化を行うことがで
き、品質のよい合成音声を合成できる。
ムにおいて、固定符号帳から出力される時系列ベクトル
のピッチ位置におけるピーク性の度合いを判定し、ピー
ク性の度合いに対応する雑音符号帳を選択できるように
したので、効率的な音源情報の符号化を行うことがで
き、品質のよい合成音声を合成できる。
【0094】また、固定符号帳が選択されたサブフレー
ムにおいて、固定符号帳から出力される時系列ベクトル
からピッチ位置とピーク性の度合いを抽出し、ピーク性
の度合いが強い場合には、ピーク性のある雑音符号帳を
選択し、符号ベクトルをピッチ同期化して効率的に符号
化するようにしたので、固定符号帳が選択されたサブフ
レームにおいても入力音声がピーク性を持つ場合は雑音
音源ベクトルをピッチ同期化し、音源情報を効率的に符
号化でき、品質の良い合成音声を合成できる。
ムにおいて、固定符号帳から出力される時系列ベクトル
からピッチ位置とピーク性の度合いを抽出し、ピーク性
の度合いが強い場合には、ピーク性のある雑音符号帳を
選択し、符号ベクトルをピッチ同期化して効率的に符号
化するようにしたので、固定符号帳が選択されたサブフ
レームにおいても入力音声がピーク性を持つ場合は雑音
音源ベクトルをピッチ同期化し、音源情報を効率的に符
号化でき、品質の良い合成音声を合成できる。
【0095】また、固定符号帳が選択されたサブフレー
ムにおいて、固定符号帳から出力される時系列ベクトル
と線形予測パラメータによって、入力音声に近い形状を
持つ合成ベクトルAiを合成し、単一パルスから合成す
る合成ベクトルBiと合成ベクトルAiとの歪みが最小
になるときのパルス位置をピッチ位置として抽出し、ま
た、そのときの歪み量によってピッチ位置でのピーク性
の度合いを判定するので、入力音声に近い形状を持つ合
成ベクトルAiを基準に合成ベクトルの領域でピッチ位
置やピーク性の高低度合いを求めることができ、精度の
良いピッチ位置とピーク性の強度が得られる。このため
音源情報を効率的に符号化でき、品質の良い合成音声を
合成できる。
ムにおいて、固定符号帳から出力される時系列ベクトル
と線形予測パラメータによって、入力音声に近い形状を
持つ合成ベクトルAiを合成し、単一パルスから合成す
る合成ベクトルBiと合成ベクトルAiとの歪みが最小
になるときのパルス位置をピッチ位置として抽出し、ま
た、そのときの歪み量によってピッチ位置でのピーク性
の度合いを判定するので、入力音声に近い形状を持つ合
成ベクトルAiを基準に合成ベクトルの領域でピッチ位
置やピーク性の高低度合いを求めることができ、精度の
良いピッチ位置とピーク性の強度が得られる。このため
音源情報を効率的に符号化でき、品質の良い合成音声を
合成できる。
【図1】 この発明の実施の形態1である音声符号化復
号化装置の全体構成を示すブロック図である。
号化装置の全体構成を示すブロック図である。
【図2】 この発明の実施の形態1である音声符号化復
号化装置の雑音符号帳の一例を示す説明図である。
号化装置の雑音符号帳の一例を示す説明図である。
【図3】 この発明の実施の形態1である音声符号化復
号化装置の適応符号帳が選択された場合のピッチ位置抽
出とピッチ同期化の動作の一例を示す説明図である。
号化装置の適応符号帳が選択された場合のピッチ位置抽
出とピッチ同期化の動作の一例を示す説明図である。
【図4】 この発明の実施の形態1である音声符号化復
号化装置の固定符号帳が選択された場合のピッチ位置抽
出とピッチ同期化の動作の一例を示す説明図である。
号化装置の固定符号帳が選択された場合のピッチ位置抽
出とピッチ同期化の動作の一例を示す説明図である。
【図5】 この発明の実施の形態2である音声符号化復
号化装置の全体構成を示すブロック図である。
号化装置の全体構成を示すブロック図である。
【図6】 この発明の実施の形態2である音声符号化復
号化装置の適応符号帳が選択された場合のピッチ位置抽
出の動作の一例を示す説明図である。
号化装置の適応符号帳が選択された場合のピッチ位置抽
出の動作の一例を示す説明図である。
【図7】 この発明の実施の形態2である音声符号化復
号化装置の適応符号帳が選択された場合のピッチ位置抽
出の動作の一例を示す説明図である。
号化装置の適応符号帳が選択された場合のピッチ位置抽
出の動作の一例を示す説明図である。
【図8】 従来のピッチ同期化を行うCELP系音声符
号化復号化装置の一例の全体構成を示すブロック図であ
る。
号化復号化装置の一例の全体構成を示すブロック図であ
る。
【図9】 従来のピッチ同期化を行うCELP系音声符
号化復号化装置(適応符号帳と固定符号帳の切り替え処
理付き)の一例の全体構成を示すブロック図である。
号化復号化装置(適応符号帳と固定符号帳の切り替え処
理付き)の一例の全体構成を示すブロック図である。
【図10】 従来のピッチ同期化を行うCELP系音声
符号化復号化装置(適応符号帳と固定符号帳の切り替え
処理付き)のピッチ位置抽出とピッチ同期化の動作の一
例を示す説明図である。
符号化復号化装置(適応符号帳と固定符号帳の切り替え
処理付き)のピッチ位置抽出とピッチ同期化の動作の一
例を示す説明図である。
【図11】 従来のピッチ同期化を行うCELP系音声
符号化復号化装置(適応符号帳と固定符号帳の切り替え
処理付き)の雑音符号帳の一例を示す説明図である。
符号化復号化装置(適応符号帳と固定符号帳の切り替え
処理付き)の雑音符号帳の一例を示す説明図である。
【図12】 従来のピッチ同期化を行うCELP系音声
符号化復号化装置(適応符号帳と固定符号帳の切り替え
処理付き)の固定符号帳が選択された場合の動作の一例
を示す説明図である。
符号化復号化装置(適応符号帳と固定符号帳の切り替え
処理付き)の固定符号帳が選択された場合の動作の一例
を示す説明図である。
1 符号化部、2 復号化部、3 多重化手段、4 分
離手段、5 入力音声、6 符号、7 出力音声、8
線形予測パラメータ分析手段、9 線形予測パラメータ
符号化手段、10、16 合成フィルタ、11、17
適応符号帳、12、18 雑音符号帳、13 ゲイン符
号化手段、14 距離計算手段、15 線形予測パラメ
ータ復号化手段、19 ゲイン復号化手段、20、22
ピッチ位置抽出手段、21、23 ピッチ同期化手
段、24、27 固定符号帳、25、28 第2の雑音
符号帳、26、29、30、37、44、45 ピッチ
位置抽出手段、31、32、38、39 適応ピッチ同
期化手段、33、34,35,36,40、41、4
2、43 雑音符号帳。
離手段、5 入力音声、6 符号、7 出力音声、8
線形予測パラメータ分析手段、9 線形予測パラメータ
符号化手段、10、16 合成フィルタ、11、17
適応符号帳、12、18 雑音符号帳、13 ゲイン符
号化手段、14 距離計算手段、15 線形予測パラメ
ータ復号化手段、19 ゲイン復号化手段、20、22
ピッチ位置抽出手段、21、23 ピッチ同期化手
段、24、27 固定符号帳、25、28 第2の雑音
符号帳、26、29、30、37、44、45 ピッチ
位置抽出手段、31、32、38、39 適応ピッチ同
期化手段、33、34,35,36,40、41、4
2、43 雑音符号帳。
Claims (12)
- 【請求項1】 適応音源ベクトルから求めたピッチ位置
を基準に雑音音源ベクトルをピッチ同期化するピッチ位
置同期型CELP音声符号化装置において、 適応音源ベクトルとして過去の駆動音源ベクトルが記憶
されていて、適応符号に対応した過去の駆動音源ベクト
ルを周期的に繰り返した時系列ベクトルを出力する適応
符号帳と、 上記適応符号帳から出力される時系列ベクトルのピッチ
位置とそのピーク性の度合いを求めるピッチ位置抽出手
段と、 ピッチ位置におけるピーク性の度合いが比較的大きい場
合の雑音音源ベクトルを記憶してなる第1の雑音符号帳
と、 ピッチ位置におけるピーク性の度合いが比較的小さい場
合の雑音音源ベクトルを記憶してなる第2の雑音符号帳
と、 上記ピッチ位置抽出手段で抽出されたピッチ位置におけ
るピーク性の度合いが予め設定された閾値より大きい場
合は上記ピッチ位置抽出手段により求められるピッチ位
置を基準とした上記第1の雑音符号帳の雑音音源ベクト
ルのピッチ同期化を行い、上記ピーク性の度合いが上記
閾値より小さい場合は上記第2の雑音符号帳の雑音音源
ベクトルを上記ピッチ位置を必ずしも基準とせずにピッ
チ周期化する適応ピッチ同期化手段とを備えたことを特
徴とする音声符号化装置。 - 【請求項2】 請求項1に記載の音声符号化装置におい
て、 入力音声を分析して音声のスペクトル情報である線形予
測パラメータを抽出する線形予測パラメータ分析手段
と、 上記線形予測パラメータを符号化して符号化した線形予
測パラメータをフィルタ係数として設定する線形予測パ
ラメータ符号化手段とをさらに備え、 上記ピッチ位置抽出手段は、上記適応符号帳からの時系
列ベクトルと上記線形予測パラメータ符号化手段からの
線形予測パラメータとから第1の合成ベクトルを生成す
ると共に、上記適応符号帳からの時系列ベクトルのピッ
チ周期間隔のパルス列を作成してこれを音源として上記
線形予測パラメータ符号化手段からの線形予測パラメー
タを用いて第2の合成ベクトルを生成し、上記第1の合
成ベクトルと第2の合成ベクトルとの歪みが最小となる
パルス列を探索して歪みが最小となるパルス位置をピッ
チ位置とし、その時の歪み量をピーク性の度合いとする
ことを特徴とする音声符号化装置。 - 【請求項3】 請求項1または2に記載の音声符号化装
置において、 ランダム雑音から生成した複数の時系列ベクトルが記憶
されていて、適応符号に対応した時系列ベクトルを出力
する固定符号帳と、 ピッチ位置におけるピーク性の度合いが比較的大きい場
合の雑音音源ベクトルを記憶してなる第3の雑音符号帳
と、 ピッチ位置におけるピーク性の度合いが比較的小さい場
合の雑音音源ベクトルを記憶してなる第4の雑音符号帳
と、 上記ピッチ位置抽出手段で抽出されたピッチ位置におけ
るピーク性の度合いが予め設定された閾値より大きい場
合は上記ピッチ位置抽出手段により求められるピッチ位
置を基準とした上記第3の雑音符号帳の雑音音源ベクト
ルのピッチ同期化を行うか、あるいは上記第3の雑音符
号帳の雑音音源ベクトルをそのまま出力し、上記ピーク
性の度合いが上記閾値より小さい場合はピッチ同期化を
行わずに上記第4の雑音符号帳の雑音音源ベクトルを出
力する他の適応ピッチ同期化手段とをさらに備え、 上記ピッチ位置抽出手段は、上記適応符号帳が選択され
ない場合は、代わりに選択された上記固定符号帳から出
力される時系列ベクトルのピッチ位置とそのピーク性の
度合いを求めることを特徴とする音声符号化装置。 - 【請求項4】 請求項3に記載の音声符号化装置におい
て、 上記ピッチ位置抽出手段は、上記固定符号帳からの時系
列ベクトルと上記線形予測パラメータ符号化手段からの
線形予測パラメータとから第3の合成ベクトルを生成す
ると共に、単一のパルスを作成してこれを音源として上
記線形予測パラメータ符号化手段からの線形予測パラメ
ータを用いて第4の合成ベクトルを生成し、上記第3の
合成ベクトルと第4の合成ベクトルとの歪みが最小とな
るパルス列を探索して歪みが最小となるパルス位置をピ
ッチ位置とし、その時の歪み量をピーク性の度合いとす
ることを特徴とする音声符号化装置。 - 【請求項5】 適応音源ベクトルから求めたピッチ位置
を基準に雑音音源ベクトルをピッチ同期化するピッチ位
置同期型CELP音声復号化装置において、 適応音源ベクトルとして過去の駆動音源ベクトルが記憶
されていて、適応符号に対応した過去の駆動音源ベクト
ルを周期的に繰り返した時系列ベクトルを出力する適応
符号帳と、 上記適応符号帳から出力される時系列ベクトルのピッチ
位置とそのピーク性の度合いを求めるピッチ位置抽出手
段と、 ピッチ位置におけるピーク性の度合いが比較的大きい場
合の雑音音源ベクトルを記憶してなる第1の雑音符号帳
と、 ピッチ位置におけるピーク性の度合いが比較的小さい場
合の雑音音源ベクトルを記憶してなる第2の雑音符号帳
と、 上記ピッチ位置抽出手段で抽出されたピッチ位置におけ
るピーク性の度合いが予め設定された閾値より大きい場
合は上記ピッチ位置抽出手段により求められるピッチ位
置を基準とした上記第1の雑音符号帳の雑音音源ベクト
ルのピッチ同期化を行い、上記ピーク性の度合いが上記
閾値より小さい場合は上記第2の雑音符号帳の雑音音源
ベクトルを上記ピッチ位置を必ずしも基準とせずにピッ
チ周期化する適応ピッチ同期化手段とを備えたことを特
徴とする音声復号化装置。 - 【請求項6】 請求項5に記載の音声復号化装置におい
て、 入力音声を分析して音声のスペクトル情報である線形予
測パラメータを抽出する線形予測パラメータ分析手段
と、 上記線形予測パラメータを符号化して符号化した線形予
測パラメータをフィルタ係数として設定する線形予測パ
ラメータ符号化手段とをさらに備え、 上記ピッチ位置抽出手段は、上記適応符号帳からの時系
列ベクトルと上記線形予測パラメータ符号化手段からの
線形予測パラメータとから第1の合成ベクトルを生成す
ると共に、上記適応符号帳からの時系列ベクトルのピッ
チ周期間隔のパルス列を作成してこれを音源として上記
線形予測パラメータ符号化手段からの線形予測パラメー
タを用いて第2の合成ベクトルを生成し、上記第1の合
成ベクトルと第2の合成ベクトルとの歪みが最小となる
パルス列を探索して歪みが最小となるパルス位置をピッ
チ位置とし、その時の歪み量をピーク性の度合いとする
ことを特徴とする音声復号化装置。 - 【請求項7】 請求項5または6に記載の音声復号化装
置において、 ランダム雑音から生成した複数の時系列ベクトルが記憶
されていて、適応符号に対応した時系列ベクトルを出力
する固定符号帳と、 ピッチ位置におけるピーク性の度合いが比較的大きい場
合の雑音音源ベクトルを記憶してなる第3の雑音符号帳
と、 ピッチ位置におけるピーク性の度合いが比較的小さい場
合の雑音音源ベクトルを記憶してなる第4の雑音符号帳
と、 上記ピッチ位置抽出手段で抽出されたピッチ位置におけ
るピーク性の度合いが予め設定された閾値より大きい場
合は上記ピッチ位置抽出手段により求められるピッチ位
置を基準とした上記第3の雑音符号帳の雑音音源ベクト
ルのピッチ同期化を行うか、あるいは上記第3の雑音符
号帳の雑音音源ベクトルをそのまま出力し、上記ピーク
性の度合いが上記閾値より小さい場合はピッチ同期化を
行わずに上記第4の雑音符号帳の雑音音源ベクトルを出
力する他の適応ピッチ同期化手段とをさらに備え、 上記ピッチ位置抽出手段は、上記適応符号帳が選択され
ない場合は、代わりに選択された上記固定符号帳から出
力される時系列ベクトルのピッチ位置とそのピーク性の
度合いを求めることを特徴とする音声復号化装置。 - 【請求項8】 請求項7に記載の音声復号化装置におい
て、 上記ピッチ位置抽出手段は、上記固定符号帳からの時系
列ベクトルと上記線形予測パラメータ符号化手段からの
線形予測パラメータとから第3の合成ベクトルを生成す
ると共に、単一のパルスを作成してこれを音源として上
記線形予測パラメータ符号化手段からの線形予測パラメ
ータを用いて第4の合成ベクトルを生成し、上記第3の
合成ベクトルと第4の合成ベクトルとの歪みが最小とな
るパルス列を探索して歪みが最小となるパルス位置をピ
ッチ位置とし、その時の歪み量をピーク性の度合いとす
ることを特徴とする音声復号化装置。 - 【請求項9】 適応音源ベクトルから求めたピッチ位置
を基準に雑音音源ベクトルをピッチ同期化するピッチ位
置同期型CELP音声符号化装置と、この装置から出力
される符号化データに基づいて生成した適応音源ベクト
ルから求めたピッチ位置を基準に雑音音源ベクトルをピ
ッチ同期化するピッチ位置同期型CELP音声符号化装
置とで構成される音声符号化復号化装置において、 上記音声符号化装置と上記音声復号化装置の両者に、 適応音源ベクトルとして過去の駆動音源ベクトルが記憶
されていて、適応符号に対応した過去の駆動音源ベクト
ルを周期的に繰り返した時系列ベクトルを出力する適応
符号帳と、 上記適応符号帳から出力される時系列ベクトルのピッチ
位置とそのピーク性の度合いを求めるピッチ位置抽出手
段と、 ピッチ位置におけるピーク性の度合いが比較的大きい場
合の雑音音源ベクトルを記憶してなる第1の雑音符号帳
と、 ピッチ位置におけるピーク性の度合いが比較的小さい場
合の雑音音源ベクトルを記憶してなる第2の雑音符号帳
と、 上記ピッチ位置抽出手段で抽出されたピッチ位置におけ
るピーク性の度合いが予め設定された閾値より大きい場
合は上記ピッチ位置抽出手段により求められるピッチ位
置を基準とした上記第1の雑音符号帳の雑音音源ベクト
ルのピッチ同期化を行い、上記ピーク性の度合いが上記
閾値より小さい場合は上記第2の雑音符号帳の雑音音源
ベクトルを上記ピッチ位置を必ずしも基準とせずにピッ
チ周期化する適応ピッチ同期化手段とをそれぞれ備えた
ことを特徴とする音声符号化復号化装置。 - 【請求項10】 請求項9に記載の音声符号化復号化装
置において、 上記音声符号化装置と上記音声復号化装置の両者に、 入力音声を分析して音声のスペクトル情報である線形予
測パラメータを抽出する線形予測パラメータ分析手段
と、 上記線形予測パラメータを符号化して符号化した線形予
測パラメータをフィルタ係数として設定する線形予測パ
ラメータ符号化手段とをさらにそれぞれ備え、 上記音声符号化装置と上記音声復号化装置の各ピッチ位
置抽出手段は、上記適応符号帳からの時系列ベクトルと
上記線形予測パラメータ符号化手段からの線形予測パラ
メータとから第1の合成ベクトルを生成すると共に、上
記適応符号帳からの時系列ベクトルのピッチ周期間隔の
パルス列を作成してこれを音源として上記線形予測パラ
メータ符号化手段からの線形予測パラメータを用いて第
2の合成ベクトルを生成し、上記第1の合成ベクトルと
第2の合成ベクトルとの歪みが最小となるパルス列を探
索して歪みが最小となるパルス位置をピッチ位置とし、
その時の歪み量をピーク性の度合いとすることを特徴と
する音声符号化復号化装置。 - 【請求項11】 請求項9または10に記載の音声符号
化復号化装置において、上記音声符号化装置と上記音声
復号化装置の両者に、 ランダム雑音から生成した複数の時系列ベクトルが記憶
されていて、適応符号に対応した時系列ベクトルを出力
する固定符号帳と、 ピッチ位置におけるピーク性の度合いが比較的大きい場
合の雑音音源ベクトルを記憶してなる第3の雑音符号帳
と、 ピッチ位置におけるピーク性の度合いが比較的小さい場
合の雑音音源ベクトルを記憶してなる第4の雑音符号帳
と、 上記ピッチ位置抽出手段で抽出されたピッチ位置におけ
るピーク性の度合いが予め設定された閾値より大きい場
合は上記ピッチ位置抽出手段により求められるピッチ位
置を基準とした上記第3の雑音符号帳の雑音音源ベクト
ルのピッチ同期化を行うか、あるいは上記第3の雑音符
号帳の雑音音源ベクトルをそのまま出力し、上記ピーク
性の度合いが上記閾値より小さい場合はピッチ同期化を
行わずに上記第4の雑音符号帳の雑音音源ベクトルを出
力する他の適応ピッチ同期化手段とをさらにそれぞれ備
え、 上記ピッチ位置抽出手段は、上記適応符号帳が選択され
ない場合は、代わりに選択された上記固定符号帳から出
力される時系列ベクトルのピッチ位置とそのピーク性の
度合いを求めることを特徴とする音声符号化復号化装
置。 - 【請求項12】 請求項11に記載の音声符号化復号化
装置において、 上記ピッチ位置抽出手段は、上記固定符号帳からの時系
列ベクトルと上記線形予測パラメータ符号化手段からの
線形予測パラメータとから第3の合成ベクトルを生成す
ると共に、単一のパルスを作成してこれを音源として上
記線形予測パラメータ符号化手段からの線形予測パラメ
ータを用いて第4の合成ベクトルを生成し、上記第3の
合成ベクトルと第4の合成ベクトルとの歪みが最小とな
るパルス列を探索して歪みが最小となるパルス位置をピ
ッチ位置とし、その時の歪み量をピーク性の度合いとす
ることを特徴とする音声符号化復号化装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11001747A JP2000200097A (ja) | 1999-01-07 | 1999-01-07 | 音声符号化装置、音声復号化装置及び音声符号化復号化装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11001747A JP2000200097A (ja) | 1999-01-07 | 1999-01-07 | 音声符号化装置、音声復号化装置及び音声符号化復号化装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2000200097A true JP2000200097A (ja) | 2000-07-18 |
Family
ID=11510172
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11001747A Pending JP2000200097A (ja) | 1999-01-07 | 1999-01-07 | 音声符号化装置、音声復号化装置及び音声符号化復号化装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2000200097A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3404024B2 (ja) | 2001-02-27 | 2003-05-06 | 三菱電機株式会社 | 音声符号化方法および音声符号化装置 |
-
1999
- 1999-01-07 JP JP11001747A patent/JP2000200097A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3404024B2 (ja) | 2001-02-27 | 2003-05-06 | 三菱電機株式会社 | 音声符号化方法および音声符号化装置 |
| US7130796B2 (en) | 2001-02-27 | 2006-10-31 | Mitsubishi Denki Kabushiki Kaisha | Voice encoding method and apparatus of selecting an excitation mode from a plurality of excitation modes and encoding an input speech using the excitation mode selected |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7788105B2 (en) | Method and apparatus for coding or decoding wideband speech | |
| WO2003010752A1 (fr) | Appareil d'elargissement de la largeur de bande vocale et procede d'elargissement de la largeur de bande vocale | |
| JP3582589B2 (ja) | 音声符号化装置及び音声復号化装置 | |
| US5864797A (en) | Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors | |
| US6768978B2 (en) | Speech coding/decoding method and apparatus | |
| JP3137176B2 (ja) | 音声符号化装置 | |
| JPH10282997A (ja) | 音声符号化装置及び復号装置 | |
| JP2001075600A (ja) | 音声符号化装置および音声復号化装置 | |
| JP3531780B2 (ja) | 音声符号化方法および復号化方法 | |
| JP2538450B2 (ja) | 音声の励振信号符号化・復号化方法 | |
| JP4578145B2 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
| JP3583945B2 (ja) | 音声符号化方法 | |
| JP2000200097A (ja) | 音声符号化装置、音声復号化装置及び音声符号化復号化装置 | |
| JPS6238500A (ja) | 高能率音声符号化方式とその装置 | |
| JP3232701B2 (ja) | 音声符号化方法 | |
| JPH0258100A (ja) | 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置 | |
| JP3144284B2 (ja) | 音声符号化装置 | |
| JP3515216B2 (ja) | 音声符号化装置 | |
| JP3296411B2 (ja) | 音声符号化方法および復号化方法 | |
| JP2002073097A (ja) | Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法 | |
| JP2001147700A (ja) | 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体 | |
| JP3410931B2 (ja) | 音声符号化方法及び装置 | |
| JPH06202699A (ja) | 音声符号化装置及び音声復号化装置及び音声符号化復号化方法 | |
| JP3232728B2 (ja) | 音声符号化方法 | |
| JP3166697B2 (ja) | 音声符号化・復号装置及びシステム |