JPH11249697A - ピッチ位置抽出方法及びピッチ位置抽出装置 - Google Patents
ピッチ位置抽出方法及びピッチ位置抽出装置Info
- Publication number
- JPH11249697A JPH11249697A JP10046765A JP4676598A JPH11249697A JP H11249697 A JPH11249697 A JP H11249697A JP 10046765 A JP10046765 A JP 10046765A JP 4676598 A JP4676598 A JP 4676598A JP H11249697 A JPH11249697 A JP H11249697A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- pitch position
- pulse
- distance
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【課題】 音声符号化復号化方法に適用した際、伝送誤
りによる品質劣化の少ない音声を再生可能とするピッチ
位置抽出法を提供する。 【解決手段】 フレーム単位に同期パルスを音源として
生成した合成音声と音声信号との距離、あるいは音源信
号と同期パルスとの距離を評価することによりピッチ周
期間隔で並ぶ該音源信号或は音源信号における特徴位置
を抽出する際、周期パルスの極性を制限するようにし
た。
りによる品質劣化の少ない音声を再生可能とするピッチ
位置抽出法を提供する。 【解決手段】 フレーム単位に同期パルスを音源として
生成した合成音声と音声信号との距離、あるいは音源信
号と同期パルスとの距離を評価することによりピッチ周
期間隔で並ぶ該音源信号或は音源信号における特徴位置
を抽出する際、周期パルスの極性を制限するようにし
た。
Description
【0001】
【発明の属する技術分野】この発明は音声信号や音響信
号のピッチ周期毎の特徴点を抽出するピッチ位置抽出方
法及びピッチ位置抽出装置に関し、特に通信に用いる音
声符号化復号化方法に適用するピッチ位置抽出方法及び
ピッチ位置抽出装置に関する。
号のピッチ周期毎の特徴点を抽出するピッチ位置抽出方
法及びピッチ位置抽出装置に関し、特に通信に用いる音
声符号化復号化方法に適用するピッチ位置抽出方法及び
ピッチ位置抽出装置に関する。
【0002】
【従来の技術】従来のピッチ位置抽出方法を用いた音声
符号化復号化方法として、特開平6─202699号公
報に開示されたものがある。図5は、この従来のピッチ
位置抽出方法を用いたCELP系音声符号化復号化方法
の全体構成の一例を示すもので、図中1は符号化部、2
は復号化部、3は多重化手段、4は分離手段である。符
号化部1は線形予測パラメータ分析手段5、線形予測パ
ラメータ符号化手段6、合成フィルタ7、適応符号帳
8、ピッチ位置抽出手段9、雑音符号帳10、ピッチ同
期化手段11、ゲイン符号化手段12、距離計算手段1
3より構成されている。また、復号化部2は線形予測パ
ラメータ復号化手段14、合成フィルタ15、適応符号
帳16、ピッチ位置復号化手段17、雑音符号帳18、
ピッチ同期化手段19、ゲイン復号化手段20より構成
されている。
符号化復号化方法として、特開平6─202699号公
報に開示されたものがある。図5は、この従来のピッチ
位置抽出方法を用いたCELP系音声符号化復号化方法
の全体構成の一例を示すもので、図中1は符号化部、2
は復号化部、3は多重化手段、4は分離手段である。符
号化部1は線形予測パラメータ分析手段5、線形予測パ
ラメータ符号化手段6、合成フィルタ7、適応符号帳
8、ピッチ位置抽出手段9、雑音符号帳10、ピッチ同
期化手段11、ゲイン符号化手段12、距離計算手段1
3より構成されている。また、復号化部2は線形予測パ
ラメータ復号化手段14、合成フィルタ15、適応符号
帳16、ピッチ位置復号化手段17、雑音符号帳18、
ピッチ同期化手段19、ゲイン復号化手段20より構成
されている。
【0003】CELP系音声符号化では、5〜50ms程度
を1フレームとして、そのフレームの音声をスペクトル
情報と音源情報に分て符号化する。以下、図5に示す構
成によるCELP系音声符号化復号化方法の動作につい
て説明する。まず符号化部1において、線形予測パラメ
ータ分析手段5は入力音声S1を分析し、音声のスペク
トル情報である線形予測パラメータを抽出する。線形予
測パラメータ符号化手段6はその線形予測パラメータを
符号化し、符号化した線形予測パラメータを合成フィル
タ7の係数として設定する。
を1フレームとして、そのフレームの音声をスペクトル
情報と音源情報に分て符号化する。以下、図5に示す構
成によるCELP系音声符号化復号化方法の動作につい
て説明する。まず符号化部1において、線形予測パラメ
ータ分析手段5は入力音声S1を分析し、音声のスペク
トル情報である線形予測パラメータを抽出する。線形予
測パラメータ符号化手段6はその線形予測パラメータを
符号化し、符号化した線形予測パラメータを合成フィル
タ7の係数として設定する。
【0004】次に音源情報の符号化について説明する。
適応符号帳8には、過去の駆動音源ベクトルが記憶され
ており、適応符号に対応して過去の駆動音源ベクトルを
周期的に繰り返した時系列ベクトルを出力する。ピッチ
位置抽出手段9は、適応符号に対応した周期のパルス列
を作成し、これを音源として線形予測パラメータ分析手
段5から入力される線形予測パラメータを用いて合成音
声を生成したときに、入力音声S1との距離が最小とな
るパルス列を探索する。そして、そのパルス位置をピッ
チ位置としてピッチ同期化手段11に出力する。
適応符号帳8には、過去の駆動音源ベクトルが記憶され
ており、適応符号に対応して過去の駆動音源ベクトルを
周期的に繰り返した時系列ベクトルを出力する。ピッチ
位置抽出手段9は、適応符号に対応した周期のパルス列
を作成し、これを音源として線形予測パラメータ分析手
段5から入力される線形予測パラメータを用いて合成音
声を生成したときに、入力音声S1との距離が最小とな
るパルス列を探索する。そして、そのパルス位置をピッ
チ位置としてピッチ同期化手段11に出力する。
【0005】図6は、ピッチ位置抽出手段9の内部構成
の一例を示し、図中101は周期パルス生成手段、10
2は最適ゲイン計算手段、103は合成フィルタ、10
4は距離計算手段である。このような構成によるピッチ
位置抽出方法の動作を説明する。周期パルス生成手段1
01は、適応符号S4に対応した周期のパルス列の先頭
のパルス位置をフレームの先頭の位置から、1サンプル
毎ずらした時系列ベクトルを順次生成する(図7)。周
期パルス生成手段101から出力された時系列ベクトル
は最適ゲイン計算手段102から与えられるゲインに応
じて重み付けされ、合成フィルタ103へ供給される。
合成フィルタ103は線形予測パラメータS5に応じた
係数を用いて上記重み付けされた時系列ベクトルの合成
音声を得る。距離計算手段104は合成音声と入力音声
S1との距離を求め、最適ゲイン計算手段は距離が最小
となるゲインを算出し、出力する。以上の処理を周期パ
ルス生成手段101で生成した全ての時系列ベクトルに
対して行った後、入力音声と合成音声との距離を最小と
する時系列ベクトルを探索し、そのパルス列の先頭パル
ス位置をピッチ位置S6として出力する。
の一例を示し、図中101は周期パルス生成手段、10
2は最適ゲイン計算手段、103は合成フィルタ、10
4は距離計算手段である。このような構成によるピッチ
位置抽出方法の動作を説明する。周期パルス生成手段1
01は、適応符号S4に対応した周期のパルス列の先頭
のパルス位置をフレームの先頭の位置から、1サンプル
毎ずらした時系列ベクトルを順次生成する(図7)。周
期パルス生成手段101から出力された時系列ベクトル
は最適ゲイン計算手段102から与えられるゲインに応
じて重み付けされ、合成フィルタ103へ供給される。
合成フィルタ103は線形予測パラメータS5に応じた
係数を用いて上記重み付けされた時系列ベクトルの合成
音声を得る。距離計算手段104は合成音声と入力音声
S1との距離を求め、最適ゲイン計算手段は距離が最小
となるゲインを算出し、出力する。以上の処理を周期パ
ルス生成手段101で生成した全ての時系列ベクトルに
対して行った後、入力音声と合成音声との距離を最小と
する時系列ベクトルを探索し、そのパルス列の先頭パル
ス位置をピッチ位置S6として出力する。
【0006】雑音符号帳10には、例えばランダム雑音
から生成した複数の時系列ベクトルが記憶されており、
雑音符号に対応した符号ベクトルを出力する。各符号ベ
クトルにはピッチ同期位置が設定されており、ピッチ同
期化手段11は、前記ピッチ位置抽出手段9で抽出され
たピッチ位置にピッチ同期位置が合うように、符号ベク
トルを切り出しピッチ周期長にし、これを周期的に繰り
返した時系列ベクトルを生成する。適応符号帳8、ピッ
チ同期化手段11からの各時系列ベクトルはゲイン符号
化手段12から与えられるそれぞれのゲインに応じて重
み付けして加算され、その加算結果を駆動音源ベクトル
として合成フィルタ7へ供給し符号化音声を得る。距離
計算手段13は符号化音声と入力音声S1との距離を求
め、距離が最小となる適応符号、雑音符号、ゲインを探
索する。この符号化が終了した後、線形予測パラメータ
の符号、入力音声と符号化音声との歪みを最小にする適
応符号、雑音符号、ゲインの符号およびピッチ位置の符
号を符号化結果として出力する。
から生成した複数の時系列ベクトルが記憶されており、
雑音符号に対応した符号ベクトルを出力する。各符号ベ
クトルにはピッチ同期位置が設定されており、ピッチ同
期化手段11は、前記ピッチ位置抽出手段9で抽出され
たピッチ位置にピッチ同期位置が合うように、符号ベク
トルを切り出しピッチ周期長にし、これを周期的に繰り
返した時系列ベクトルを生成する。適応符号帳8、ピッ
チ同期化手段11からの各時系列ベクトルはゲイン符号
化手段12から与えられるそれぞれのゲインに応じて重
み付けして加算され、その加算結果を駆動音源ベクトル
として合成フィルタ7へ供給し符号化音声を得る。距離
計算手段13は符号化音声と入力音声S1との距離を求
め、距離が最小となる適応符号、雑音符号、ゲインを探
索する。この符号化が終了した後、線形予測パラメータ
の符号、入力音声と符号化音声との歪みを最小にする適
応符号、雑音符号、ゲインの符号およびピッチ位置の符
号を符号化結果として出力する。
【0007】一方復号化部2において、線形予測パラメ
ータ復号化手段14は線形予測パラメータの符号から線
形予測パラメータを復号化し、合成フィルタ15の係数
として設定する。次に、適応符号帳16は、適応符号に
対応して、過去の駆動音源ベクトルを周期的に繰り返し
た時系列ベクトルを出力する。ピッチ位置復号化手段1
7はピッチ位置の符号から復号化したピッチ位置をピッ
チ同期化手段19に出力する。雑音符号帳18は雑音符
号に対応した符号ベクトルを出力する。ピッチ同期化手
段19は、雑音符号帳18から入力される符号ベクトル
とピッチ位置復号化手段17から入力されるピッチ位置
から、符号化部1のピッチ同期化手段11と同様の方法
で時系列ベクトルを生成する。適応符号帳16、ピッチ
同期化手段19からの各時系列ベクトルは、ゲイン復号
化手段20でゲインの符号から復号化したそれぞれのゲ
インに応じて重み付けして加算され、その加算結果が駆
動音源ベクトルとして合成フィルタ15へ供給され出力
音声S3が得られる。
ータ復号化手段14は線形予測パラメータの符号から線
形予測パラメータを復号化し、合成フィルタ15の係数
として設定する。次に、適応符号帳16は、適応符号に
対応して、過去の駆動音源ベクトルを周期的に繰り返し
た時系列ベクトルを出力する。ピッチ位置復号化手段1
7はピッチ位置の符号から復号化したピッチ位置をピッ
チ同期化手段19に出力する。雑音符号帳18は雑音符
号に対応した符号ベクトルを出力する。ピッチ同期化手
段19は、雑音符号帳18から入力される符号ベクトル
とピッチ位置復号化手段17から入力されるピッチ位置
から、符号化部1のピッチ同期化手段11と同様の方法
で時系列ベクトルを生成する。適応符号帳16、ピッチ
同期化手段19からの各時系列ベクトルは、ゲイン復号
化手段20でゲインの符号から復号化したそれぞれのゲ
インに応じて重み付けして加算され、その加算結果が駆
動音源ベクトルとして合成フィルタ15へ供給され出力
音声S3が得られる。
【0008】また前記特開平6─202699号公報に
は、ピッチ位置の符号の伝送が不要である従来のピッチ
位置抽出方法を用いた音声符号化復号化方法も開示され
ている。図5との対応部分に同一符号を付けた図8は、
この従来の音声符号化復号化方法の構成を示し、図中2
1、22はピッチ位置抽出手段である。このような構成
による符号化復号化方法の動作を説明する。まず符号化
部1において、ピッチ位置抽出手段20は、適応符号帳
8から出力される周期的に繰り返した時系列ベクトルか
ら、例えば時系列ベクトルの最大振幅をとる周期的な点
をピッチ位置として抽出する。これは即ち、適応符号に
対応した周期のパルス列を作成したときに、適応符号帳
からの時系列ベクトルとの距離が最小となるパルス列を
探索することに等しい。
は、ピッチ位置の符号の伝送が不要である従来のピッチ
位置抽出方法を用いた音声符号化復号化方法も開示され
ている。図5との対応部分に同一符号を付けた図8は、
この従来の音声符号化復号化方法の構成を示し、図中2
1、22はピッチ位置抽出手段である。このような構成
による符号化復号化方法の動作を説明する。まず符号化
部1において、ピッチ位置抽出手段20は、適応符号帳
8から出力される周期的に繰り返した時系列ベクトルか
ら、例えば時系列ベクトルの最大振幅をとる周期的な点
をピッチ位置として抽出する。これは即ち、適応符号に
対応した周期のパルス列を作成したときに、適応符号帳
からの時系列ベクトルとの距離が最小となるパルス列を
探索することに等しい。
【0009】雑音符号帳10には、例えばランダム雑音
から生成した複数の時系列ベクトルが記憶されており、
雑音符号に対応した符号ベクトルを出力する。各符号ベ
クトルにはピッチ同期位置が設定されており、ピッチ同
期化手段11は、前記ピッチ位置抽出手段21で抽出さ
れたピッチ位置にピッチ同期位置が合うように、符号ベ
クトルを切り出しピッチ周期長にし、これを周期的に繰
り返した時系列ベクトルを生成する。そして、適応符号
帳8、ピッチ同期化手段11からの各時系列ベクトルを
用いて符号化音声が生成され、この符号化音声と入力音
声S1との距離が最小となる適応符号、雑音符号、ゲイ
ンが選択され、符号化される。
から生成した複数の時系列ベクトルが記憶されており、
雑音符号に対応した符号ベクトルを出力する。各符号ベ
クトルにはピッチ同期位置が設定されており、ピッチ同
期化手段11は、前記ピッチ位置抽出手段21で抽出さ
れたピッチ位置にピッチ同期位置が合うように、符号ベ
クトルを切り出しピッチ周期長にし、これを周期的に繰
り返した時系列ベクトルを生成する。そして、適応符号
帳8、ピッチ同期化手段11からの各時系列ベクトルを
用いて符号化音声が生成され、この符号化音声と入力音
声S1との距離が最小となる適応符号、雑音符号、ゲイ
ンが選択され、符号化される。
【0010】次に復号化部2において、ピッチ位置抽出
手段22は適応符号帳16から出力される周期的に繰り
返した時系列ベクトルから、符号化部1のピッチ位置抽
出手段21と同様の方法でピッチ位置を抽出する。雑音
符号帳18は雑音符号に対応した符号ベクトルを出力す
る。ピッチ同期化手段19は、雑音符号帳18から入力
される符号ベクトルとピッチ位置抽出手段22から入力
されるピッチ位置から、符号化部1のピッチ同期化手段
11と同様の方法で時系列ベクトルを生成する。そし
て、適応符号帳16、ピッチ同期化手段19からの各時
系列ベクトルを用いて出力音声S3を得る。このように
構成することにより、符号ベクトルを周期化する際のピ
ッチ位置は適応符号帳からの時系列ベクトルから適応的
に求めるので、ピッチ位置の符号の伝送が不要であり、
伝送情報量を削減することができる。
手段22は適応符号帳16から出力される周期的に繰り
返した時系列ベクトルから、符号化部1のピッチ位置抽
出手段21と同様の方法でピッチ位置を抽出する。雑音
符号帳18は雑音符号に対応した符号ベクトルを出力す
る。ピッチ同期化手段19は、雑音符号帳18から入力
される符号ベクトルとピッチ位置抽出手段22から入力
されるピッチ位置から、符号化部1のピッチ同期化手段
11と同様の方法で時系列ベクトルを生成する。そし
て、適応符号帳16、ピッチ同期化手段19からの各時
系列ベクトルを用いて出力音声S3を得る。このように
構成することにより、符号ベクトルを周期化する際のピ
ッチ位置は適応符号帳からの時系列ベクトルから適応的
に求めるので、ピッチ位置の符号の伝送が不要であり、
伝送情報量を削減することができる。
【0011】
【発明が解決しようとする課題】上記従来のピッチ位置
抽出方法では、フレーム単位に、音声信号と周期パルス
を音源として生成した合成音声との距離、あるいは、音
源信号と周期パルスとの距離が最小となるパルス列を探
索し、そのパルス位置をピッチ位置として抽出してい
る。このとき、フレーム内で距離を最小にする周期パル
スの極性は、該フレーム区間の音声信号あるいは音源信
号の形状によって決まるので、定常な有声部であって
も、抽出されるピッチ位置はフレーム間で見た場合には
必ずしも周期的になるとは限らなかった。例えば図9に
示すように、フレーム(A)、(C)での周期パルスの
極性が正、フレーム(B)では負となっている場合、フ
レーム(A)、(B)間およびフレーム(B)、(C)
間では、パルスが周期的にはならない。
抽出方法では、フレーム単位に、音声信号と周期パルス
を音源として生成した合成音声との距離、あるいは、音
源信号と周期パルスとの距離が最小となるパルス列を探
索し、そのパルス位置をピッチ位置として抽出してい
る。このとき、フレーム内で距離を最小にする周期パル
スの極性は、該フレーム区間の音声信号あるいは音源信
号の形状によって決まるので、定常な有声部であって
も、抽出されるピッチ位置はフレーム間で見た場合には
必ずしも周期的になるとは限らなかった。例えば図9に
示すように、フレーム(A)、(C)での周期パルスの
極性が正、フレーム(B)では負となっている場合、フ
レーム(A)、(B)間およびフレーム(B)、(C)
間では、パルスが周期的にはならない。
【0012】このため、従来のピッチ位置抽出方法を用
いた音声符号化復号化方法では、入力音声から抽出、伝
送されるピッチ位置はフレーム間で相関がなく、符号伝
送時にピッチ位置の符号に誤りが発生した場合、復号化
側で誤りがあることを検出してもピッチ位置の推定がで
きず、ピッチ位置の符号以外の符号が全て正しく伝送さ
れていても適当な再生音声が生成できず、再生音声の劣
化が大きいという問題があった。
いた音声符号化復号化方法では、入力音声から抽出、伝
送されるピッチ位置はフレーム間で相関がなく、符号伝
送時にピッチ位置の符号に誤りが発生した場合、復号化
側で誤りがあることを検出してもピッチ位置の推定がで
きず、ピッチ位置の符号以外の符号が全て正しく伝送さ
れていても適当な再生音声が生成できず、再生音声の劣
化が大きいという問題があった。
【0013】また、上記従来のピッチ位置抽出方法で
は、聴感上差異は感じられない複数の音声信号あるいは
音源信号に対してピッチ位置抽出を行った場合、ピッチ
位置抽出の評価に用いる距離のわずかな差によって、極
性が正/負のどちらの周期パルス列が選択されるかが異
なり、抽出されるピッチ位置が大きく異なる場合があっ
た。図10に聴感上差異がない音声(A)、(B)に対
して抽出されるピッチ位置のずれの例を示す。
は、聴感上差異は感じられない複数の音声信号あるいは
音源信号に対してピッチ位置抽出を行った場合、ピッチ
位置抽出の評価に用いる距離のわずかな差によって、極
性が正/負のどちらの周期パルス列が選択されるかが異
なり、抽出されるピッチ位置が大きく異なる場合があっ
た。図10に聴感上差異がない音声(A)、(B)に対
して抽出されるピッチ位置のずれの例を示す。
【0014】このため、ピッチ位置の伝送が不要である
従来のピッチ位置抽出法を用いた音声符号化復号化方法
では、伝送誤りが発生し駆動音源ベクトルが誤りの影響
を受けた場合、この駆動音源ベクトルから生成される適
応符号帳からの時系列ベクトルも誤りの影響を受けたも
のになり、このとき誤りの影響が少なくても抽出される
ピッチ位置が本来の正しいものから大きく異なることが
ある。
従来のピッチ位置抽出法を用いた音声符号化復号化方法
では、伝送誤りが発生し駆動音源ベクトルが誤りの影響
を受けた場合、この駆動音源ベクトルから生成される適
応符号帳からの時系列ベクトルも誤りの影響を受けたも
のになり、このとき誤りの影響が少なくても抽出される
ピッチ位置が本来の正しいものから大きく異なることが
ある。
【0015】ここで、一度伝送誤りの影響によりピッチ
位置が大きく誤ると、その後は正しい符号が伝送されて
も、ピッチ同期化処理により生成される時系列ベクトル
も正しいものと大きく異なるため、駆動音源ベクトルが
正しく生成できなくなる。これがまたピッチ位置が正し
く求まらない原因となるという悪循環が起こるため、伝
送誤りの影響の時間的波及が大きく、伝送誤りが発生し
た場合の再生音声の劣化が大きいという問題があった。
位置が大きく誤ると、その後は正しい符号が伝送されて
も、ピッチ同期化処理により生成される時系列ベクトル
も正しいものと大きく異なるため、駆動音源ベクトルが
正しく生成できなくなる。これがまたピッチ位置が正し
く求まらない原因となるという悪循環が起こるため、伝
送誤りの影響の時間的波及が大きく、伝送誤りが発生し
た場合の再生音声の劣化が大きいという問題があった。
【0016】この発明はかかる課題を解決するためにな
されたものであり、音声符号化復号化方法に適用した
際、伝送誤りによる品質劣化の少ない音声を再生可能と
するピッチ位置抽出法を提供するものである。
されたものであり、音声符号化復号化方法に適用した
際、伝送誤りによる品質劣化の少ない音声を再生可能と
するピッチ位置抽出法を提供するものである。
【0017】
【課題を解決するための手段】上述の課題を解決するた
めにこの発明のピッチ位置抽出方法は、フレーム単位
に、音声信号と周期パルスを音源として生成した合成音
声との距離、あるいは、音源信号と周期パルスとの距離
を評価することにより、該音声信号あるいは音源信号に
おけるピッチ周期間隔で並ぶ特徴位置を抽出するピッチ
位置抽出方法において、上記周期パルスの極性を制限す
るようにした。
めにこの発明のピッチ位置抽出方法は、フレーム単位
に、音声信号と周期パルスを音源として生成した合成音
声との距離、あるいは、音源信号と周期パルスとの距離
を評価することにより、該音声信号あるいは音源信号に
おけるピッチ周期間隔で並ぶ特徴位置を抽出するピッチ
位置抽出方法において、上記周期パルスの極性を制限す
るようにした。
【0018】またこの発明のピッチ位置抽出装置は、入
力音声のピッチ周期に対応した周期のパルス列の先頭の
パルス位置をフレームの先頭位置から、1サンプル毎ず
らした時系列ベクトルを順次生成する周期パルス生成手
段と、周期パルス生成手段から出力された時系列ベクト
ルを最適ゲイン計算手段から与えられるゲインに応じて
重み付けされ、上記入力音声から得られた線形予測パラ
メータに応じた係数を用いて上記重み付けされた時系列
ベクトルの合成音声を得る合成フィルタと、この合成音
声と上記入力音声との距離を求め、距離を最小とする時
系列ベクトルを探索し、そのパルス列の先頭パルス位置
をピッチ位置として出力する距離計算手段と、上記合成
音声を生成するため重み付けされた時系列ベクトルにお
ける周期パルスの極性を制限するパルス極性制限手段と
を備えた。
力音声のピッチ周期に対応した周期のパルス列の先頭の
パルス位置をフレームの先頭位置から、1サンプル毎ず
らした時系列ベクトルを順次生成する周期パルス生成手
段と、周期パルス生成手段から出力された時系列ベクト
ルを最適ゲイン計算手段から与えられるゲインに応じて
重み付けされ、上記入力音声から得られた線形予測パラ
メータに応じた係数を用いて上記重み付けされた時系列
ベクトルの合成音声を得る合成フィルタと、この合成音
声と上記入力音声との距離を求め、距離を最小とする時
系列ベクトルを探索し、そのパルス列の先頭パルス位置
をピッチ位置として出力する距離計算手段と、上記合成
音声を生成するため重み付けされた時系列ベクトルにお
ける周期パルスの極性を制限するパルス極性制限手段と
を備えた。
【0019】
【発明の実施の形態】以下図面を参照しながら、この発
明の実施の形態について説明する。
明の実施の形態について説明する。
【0020】実施の形態1.図6との対応部分に同一符
号を付けて示す図1は、この発明によるピッチ位置抽出
方法の実施の形態1を行うピッチ位置抽出手段9の内部
構成を示し、105はパルス極性制限手段である。
号を付けて示す図1は、この発明によるピッチ位置抽出
方法の実施の形態1を行うピッチ位置抽出手段9の内部
構成を示し、105はパルス極性制限手段である。
【0021】以下、動作を説明する。周期パルス生成手
段101は、適応符号S4に対応した周期のパルス列の
先頭のパルス位置をフレームの先頭の位置から、1サン
プル毎ずらした時系列ベクトルを順次生成する。周期パ
ルス生成手段101から出力された時系列ベクトルはパ
ルス極性制限手段105から与えられるゲインに応じて
重み付けされ、合成フィルタ103へ供給される。合成
フィルタ103は線形予測パラメータS5に応じた係数
を用いて上記重み付けされた時系列ベクトルの合成音声
を得る。距離計算手段104は合成音声と入力音声S1
との距離を求め、最適ゲイン計算手段は距離が最小とな
るゲインを算出し、出力する。パルス極性制限手段10
5は、例えば最適ゲイン計算手段102から入力された
ゲインの符号が正の場合はそのゲインの値を、また負の
場合は零をゲインとして出力するとして、合成音声を生
成するための重み付けされた時系列ベクトルにおける周
期パルスの極性を制限する。以上の処理を周期パルス生
成手段101で生成した全ての時系列ベクトルに対して
行った後、入力音声と合成音声との距離を最小とする時
系列ベクトルを探索し、そのパルス列の先頭パルス位置
をピッチ位置S6として出力する。
段101は、適応符号S4に対応した周期のパルス列の
先頭のパルス位置をフレームの先頭の位置から、1サン
プル毎ずらした時系列ベクトルを順次生成する。周期パ
ルス生成手段101から出力された時系列ベクトルはパ
ルス極性制限手段105から与えられるゲインに応じて
重み付けされ、合成フィルタ103へ供給される。合成
フィルタ103は線形予測パラメータS5に応じた係数
を用いて上記重み付けされた時系列ベクトルの合成音声
を得る。距離計算手段104は合成音声と入力音声S1
との距離を求め、最適ゲイン計算手段は距離が最小とな
るゲインを算出し、出力する。パルス極性制限手段10
5は、例えば最適ゲイン計算手段102から入力された
ゲインの符号が正の場合はそのゲインの値を、また負の
場合は零をゲインとして出力するとして、合成音声を生
成するための重み付けされた時系列ベクトルにおける周
期パルスの極性を制限する。以上の処理を周期パルス生
成手段101で生成した全ての時系列ベクトルに対して
行った後、入力音声と合成音声との距離を最小とする時
系列ベクトルを探索し、そのパルス列の先頭パルス位置
をピッチ位置S6として出力する。
【0022】図9と対比して示す図2は、この発明によ
るピッチ位置抽出方法の実施の形態1の動作の説明に供
する略線図であり、例えばピッチ位置抽出処理において
評価に用いるピッチ周期パルスの極性を正に制限したも
のである。図9と対比して図2ではフレーム(B)にお
ける周期パルスの極性が正となっており、フレーム
(A)、(B)間およびフレーム(B)、(C)間でも
パルスが周期的になっている。
るピッチ位置抽出方法の実施の形態1の動作の説明に供
する略線図であり、例えばピッチ位置抽出処理において
評価に用いるピッチ周期パルスの極性を正に制限したも
のである。図9と対比して図2ではフレーム(B)にお
ける周期パルスの極性が正となっており、フレーム
(A)、(B)間およびフレーム(B)、(C)間でも
パルスが周期的になっている。
【0023】この実施の形態1のピッチ位置抽出方法を
図5に示す音声符号化復号化方法に適用した場合、入力
音声から抽出、伝送されるピッチ位置は、フレーム間で
もピッチ周期性をもつので、符号伝送時にピッチ位置の
符号に誤りが発生した場合、復号化側で誤りがあること
を検出すれば、前フレームのピッチ位置、ピッチ周期か
ら現フレームのピッチ位置を推定することができる(図
3)。
図5に示す音声符号化復号化方法に適用した場合、入力
音声から抽出、伝送されるピッチ位置は、フレーム間で
もピッチ周期性をもつので、符号伝送時にピッチ位置の
符号に誤りが発生した場合、復号化側で誤りがあること
を検出すれば、前フレームのピッチ位置、ピッチ周期か
ら現フレームのピッチ位置を推定することができる(図
3)。
【0024】この実施の形態1によれば、ピッチ位置抽
出処理において評価に用いるピッチ周期パルスの極性を
制限することにより、抽出されるピッチ位置がフレーム
間でも周期性をもつので、音声符号化復号化方法に適用
した場合、ピッチ位置の符号に伝送誤りが発生し、正し
いピッチ位置を復号できなくても、前フレームのピッチ
位置の情報、ピッチ周期から伝送誤りが発生したフレー
ムのピッチ位置を推定することが可能であり、伝送誤り
による再生音声の劣化を回避し、伝送誤りによる品質劣
化の少ない音声を再生可能とすることができる。
出処理において評価に用いるピッチ周期パルスの極性を
制限することにより、抽出されるピッチ位置がフレーム
間でも周期性をもつので、音声符号化復号化方法に適用
した場合、ピッチ位置の符号に伝送誤りが発生し、正し
いピッチ位置を復号できなくても、前フレームのピッチ
位置の情報、ピッチ周期から伝送誤りが発生したフレー
ムのピッチ位置を推定することが可能であり、伝送誤り
による再生音声の劣化を回避し、伝送誤りによる品質劣
化の少ない音声を再生可能とすることができる。
【0025】実施の形態2.実施の形態1と同様に、例
えばピッチ位置抽出処理において評価に用いるピッチ周
期パルスの極性を正に制限した場合の、動作の説明に供
する略線図を図10と対比して図4に示す。図10と対
比して図4では入力音声(B)に対する周期パルスの極
性が正となっており、近似した音声信号(A)、(B)
に対して抽出されるピッチ位置のずれが小さくなる。
えばピッチ位置抽出処理において評価に用いるピッチ周
期パルスの極性を正に制限した場合の、動作の説明に供
する略線図を図10と対比して図4に示す。図10と対
比して図4では入力音声(B)に対する周期パルスの極
性が正となっており、近似した音声信号(A)、(B)
に対して抽出されるピッチ位置のずれが小さくなる。
【0026】この実施の形態2のピッチ位置抽出方法を
図8に示すピッチ位置の伝送が不要である音声符号化復
号化方法に適用した場合、伝送誤りが発生し駆動音源ベ
クトルが誤りの影響を受けた場合でも、誤りの影響が少
なければピッチ位置は本来の正しいものの近傍に求ま
る。
図8に示すピッチ位置の伝送が不要である音声符号化復
号化方法に適用した場合、伝送誤りが発生し駆動音源ベ
クトルが誤りの影響を受けた場合でも、誤りの影響が少
なければピッチ位置は本来の正しいものの近傍に求ま
る。
【0027】この実施の形態2によれば、ピッチ位置抽
出処理において評価に用いるピッチ周期パルスの極性を
制限することにより、聴感上差異は感じられない複数の
音声信号あるいは音源信号に対してピッチ位置抽出を行
った場合、抽出されるピッチ位置はほぼ同じ位置に求ま
るので、ピッチ位置の伝送が不要な音声符号化復号化方
法に適用した場合、伝送誤りが発生し駆動音源ベクトル
が誤りの影響を受けた場合でも、誤りの影響が少なけれ
ばピッチ位置は本来の正しいものの近傍に求まり、ピッ
チ同期化処理により生成される時系列ベクトルも正しい
ものと差異が小さいものが生成されるため、伝送誤りに
よる生成音声の劣化を回避し、伝送誤りによる品質劣化
の少ない音声を再生可能とすることができる。
出処理において評価に用いるピッチ周期パルスの極性を
制限することにより、聴感上差異は感じられない複数の
音声信号あるいは音源信号に対してピッチ位置抽出を行
った場合、抽出されるピッチ位置はほぼ同じ位置に求ま
るので、ピッチ位置の伝送が不要な音声符号化復号化方
法に適用した場合、伝送誤りが発生し駆動音源ベクトル
が誤りの影響を受けた場合でも、誤りの影響が少なけれ
ばピッチ位置は本来の正しいものの近傍に求まり、ピッ
チ同期化処理により生成される時系列ベクトルも正しい
ものと差異が小さいものが生成されるため、伝送誤りに
よる生成音声の劣化を回避し、伝送誤りによる品質劣化
の少ない音声を再生可能とすることができる。
【0028】実施の形態3.上述の実施の形態1及び実
施の形態2でさらに、周期パルスの極性を常に正に制限
するなど固定にはせず、連続する有声音区間内では常に
同一の極性とするが、無声音または無音区間で区分され
る各有声音区間毎では異なる極性であっても良い。この
実施の形態3によれば、ピッチ位置抽出に用いる周期パ
ルスの極性を正または負のどちらでも取ることができる
ので、各有声音区間毎に音声の様態により適した極性を
選択することが可能となり、常に一方の極性に制限する
のに比較しより品質の高い音声を再生可能とすることが
できる。
施の形態2でさらに、周期パルスの極性を常に正に制限
するなど固定にはせず、連続する有声音区間内では常に
同一の極性とするが、無声音または無音区間で区分され
る各有声音区間毎では異なる極性であっても良い。この
実施の形態3によれば、ピッチ位置抽出に用いる周期パ
ルスの極性を正または負のどちらでも取ることができる
ので、各有声音区間毎に音声の様態により適した極性を
選択することが可能となり、常に一方の極性に制限する
のに比較しより品質の高い音声を再生可能とすることが
できる。
【0029】実施の形態4.上述の実施の形態1から実
施の形態3では、音声信号と周期パルスを音源として生
成した合成音声との距離を評価するピッチ位置抽出方法
において周期パルスの極性を制限するとしているが、こ
れに代え、音源信号と周期パルスとの距離を評価するピ
ッチ位置抽出方法において周期パルスの極性を制限する
としても同様の効果が得られる。
施の形態3では、音声信号と周期パルスを音源として生
成した合成音声との距離を評価するピッチ位置抽出方法
において周期パルスの極性を制限するとしているが、こ
れに代え、音源信号と周期パルスとの距離を評価するピ
ッチ位置抽出方法において周期パルスの極性を制限する
としても同様の効果が得られる。
【0030】
【発明の効果】以上詳述したように、この発明によれ
ば、フレーム単位に、音声信号と周期パルスを音源とし
て生成した合成音声との距離、あるいは、音源信号と周
期パルスとの距離を評価することにより、該音声信号あ
るいは音源信号におけるピッチ周期間隔で並ぶ特徴位置
を抽出するピッチ位置抽出方法及びピッチ位置抽出装置
において、上記周期パルスの極性を制限するようにした
ので、音声符号化復号化方法に適用した場合、ピッチ位
置の符号に伝送誤りが発生してもピッチ位置を推定する
ことが可能であり、伝送誤りによる再生音声の劣化を回
避し、伝送誤りによる品質劣化の少ない音声を再生可能
とすることができる。また、ピッチ位置の伝送が不要で
ある音声符号化復号化方法に適用した場合、伝送誤りが
発生し駆動音源ベクトルが誤りの影響を受けた場合で
も、誤りの影響が少なければピッチ位置は本来の正しい
ものの近傍に求まり、ピッチ同期化処理により生成され
る時系列ベクトルも正しいものと差異が小さいものが生
成でき、伝送誤りによる再生音声の劣化を回避し、伝送
誤りによる品質劣化の少ない音声を再生可能とすること
ができる。
ば、フレーム単位に、音声信号と周期パルスを音源とし
て生成した合成音声との距離、あるいは、音源信号と周
期パルスとの距離を評価することにより、該音声信号あ
るいは音源信号におけるピッチ周期間隔で並ぶ特徴位置
を抽出するピッチ位置抽出方法及びピッチ位置抽出装置
において、上記周期パルスの極性を制限するようにした
ので、音声符号化復号化方法に適用した場合、ピッチ位
置の符号に伝送誤りが発生してもピッチ位置を推定する
ことが可能であり、伝送誤りによる再生音声の劣化を回
避し、伝送誤りによる品質劣化の少ない音声を再生可能
とすることができる。また、ピッチ位置の伝送が不要で
ある音声符号化復号化方法に適用した場合、伝送誤りが
発生し駆動音源ベクトルが誤りの影響を受けた場合で
も、誤りの影響が少なければピッチ位置は本来の正しい
ものの近傍に求まり、ピッチ同期化処理により生成され
る時系列ベクトルも正しいものと差異が小さいものが生
成でき、伝送誤りによる再生音声の劣化を回避し、伝送
誤りによる品質劣化の少ない音声を再生可能とすること
ができる。
【図1】 この発明によるピッチ位置抽出装置の実施の
形態1の内部構成を示すブロック図である。
形態1の内部構成を示すブロック図である。
【図2】 この発明によるピッチ位置抽出装置の実施の
形態1の動作の説明に供する略線図である。
形態1の動作の説明に供する略線図である。
【図3】 この発明によるピッチ位置抽出装置の実施の
形態1を適用した音声符号化復号化方法の伝送誤り時の
ピッチ位置推定処理の動作の説明に供する略線図であ
る。
形態1を適用した音声符号化復号化方法の伝送誤り時の
ピッチ位置推定処理の動作の説明に供する略線図であ
る。
【図4】 この発明によるピッチ位置抽出方法の実施の
形態2の動作の説明に供する略線図である。
形態2の動作の説明に供する略線図である。
【図5】 従来のピッチ位置抽出方法を用いた音声符号
化復号化装置の全体構成を示すブロック図である。
化復号化装置の全体構成を示すブロック図である。
【図6】 従来のピッチ位置抽出装置の内部構成を示す
ブロック図である。
ブロック図である。
【図7】 従来の周期パルス生成手段の動作の説明に供
する略線図である。
する略線図である。
【図8】 ピッチ位置の符号の伝送が不要な従来のピッ
チ位置抽出装置を用いた音声符号化復号化方法の全体構
成を示すブロック図である。
チ位置抽出装置を用いた音声符号化復号化方法の全体構
成を示すブロック図である。
【図9】 従来のピッチ位置抽出方法の動作の説明に供
する略線図である。
する略線図である。
【図10】 従来のピッチ位置抽出方法の動作の説明に
供する略線図である。
供する略線図である。
1:符号化部、 2:復号化部、 3:多重化手段、
4:分離手段、5:線形予測パラメータ分析手段、
6:線形予測パラメータ符号化手段、7、15:合成フ
ィルタ、 8、16:適応符号帳、9:ピッチ
位置抽出手段、 10、18:雑音符号帳、1
1、19:ピッチ同期化手段、 12:ゲイン符号
化手段、13:距離計算手段、 14:線形
予測パラメータ復号化手段、17:ピッチ位置復号化手
段、 20:ゲイン復号化手段、21、22:ピッチ
位置抽出手段、 101:周期パルス生成手段、10
2:最適ゲイン計算手段、 103:合成フィル
タ、104:距離計算手段、 105:パル
ス極性制限手段。
4:分離手段、5:線形予測パラメータ分析手段、
6:線形予測パラメータ符号化手段、7、15:合成フ
ィルタ、 8、16:適応符号帳、9:ピッチ
位置抽出手段、 10、18:雑音符号帳、1
1、19:ピッチ同期化手段、 12:ゲイン符号
化手段、13:距離計算手段、 14:線形
予測パラメータ復号化手段、17:ピッチ位置復号化手
段、 20:ゲイン復号化手段、21、22:ピッチ
位置抽出手段、 101:周期パルス生成手段、10
2:最適ゲイン計算手段、 103:合成フィル
タ、104:距離計算手段、 105:パル
ス極性制限手段。
Claims (2)
- 【請求項1】 フレーム単位に、音声信号と周期パルス
を音源として生成した合成音声との距離、または、音源
信号と周期パルスとの距離を評価することにより、該音
声信号または音源信号におけるピッチ周期間隔で並ぶ特
徴位置を抽出するピッチ位置抽出方法において、上記周
期パルスの極性を制限することを特徴とするピッチ位置
抽出方法。 - 【請求項2】 入力音声のピッチ周期に対応した周期の
パルス列の先頭のパルス位置をフレームの先頭位置か
ら、1サンプル毎ずらした時系列ベクトルを順次生成す
る周期パルス生成手段と、周期パルス生成手段から出力
された時系列ベクトルを最適ゲイン計算手段から与えら
れるゲインに応じて重み付けされ、上記入力音声から得
られた線形予測パラメータに応じた係数を用いて上記重
み付けされた時系列ベクトルの合成音声を得る合成フィ
ルタと、この合成音声と上記入力音声との距離を求め、
距離を最小とする時系列ベクトルを探索し、そのパルス
列の先頭パルス位置をピッチ位置として出力する距離計
算手段と、上記合成音声を生成するため重み付けされた
時系列ベクトルにおける周期パルスの極性を制限するパ
ルス極性制限手段とを備えたことを特徴とするピッチ位
置抽出装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10046765A JPH11249697A (ja) | 1998-02-27 | 1998-02-27 | ピッチ位置抽出方法及びピッチ位置抽出装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10046765A JPH11249697A (ja) | 1998-02-27 | 1998-02-27 | ピッチ位置抽出方法及びピッチ位置抽出装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH11249697A true JPH11249697A (ja) | 1999-09-17 |
Family
ID=12756439
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10046765A Pending JPH11249697A (ja) | 1998-02-27 | 1998-02-27 | ピッチ位置抽出方法及びピッチ位置抽出装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH11249697A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009163276A (ja) * | 2009-04-24 | 2009-07-23 | Panasonic Corp | 音声符号化装置、音声復号化装置、及びこれらの方法 |
-
1998
- 1998-02-27 JP JP10046765A patent/JPH11249697A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009163276A (ja) * | 2009-04-24 | 2009-07-23 | Panasonic Corp | 音声符号化装置、音声復号化装置、及びこれらの方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2746033B2 (ja) | 音声復号化装置 | |
| US7222069B2 (en) | Voice code conversion apparatus | |
| JP2003044098A (ja) | 音声帯域拡張装置及び音声帯域拡張方法 | |
| JP3628268B2 (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
| KR100561018B1 (ko) | 음성 부호화 장치와 방법, 및 음성 복호화 장치와 방법 | |
| JP2616549B2 (ja) | 音声復号装置 | |
| JPH07129195A (ja) | 音声復号化装置 | |
| JP4550176B2 (ja) | 音声符号化方法 | |
| JP3531780B2 (ja) | 音声符号化方法および復号化方法 | |
| WO2000000963A1 (en) | Voice coder | |
| JPH11249697A (ja) | ピッチ位置抽出方法及びピッチ位置抽出装置 | |
| JPS6238500A (ja) | 高能率音声符号化方式とその装置 | |
| JPS61148500A (ja) | 音声信号符号化方法とその装置 | |
| JP2956068B2 (ja) | 音声符号化復号化方式 | |
| JPH0258100A (ja) | 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置 | |
| JP3364827B2 (ja) | 音声符号化方法、音声復号化方法及び音声符号化復号化方法並びにそれ等の装置 | |
| JP3798433B2 (ja) | ピッチサイクル波形を平滑化する方法及び装置 | |
| JP2900431B2 (ja) | 音声信号符号化装置 | |
| JP2001142499A (ja) | 音声符号化装置ならびに音声復号化装置 | |
| JP3515215B2 (ja) | 音声符号化装置 | |
| JP3824706B2 (ja) | 音声符号化/復号化装置 | |
| JP3471542B2 (ja) | 音声符号化装置 | |
| JPH043878B2 (ja) | ||
| JP2003029799A (ja) | 音声復号化方法 | |
| JP2004061558A (ja) | 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20040621 |