JPH0477799A - ピッチ信号の特徴量抽出方法 - Google Patents
ピッチ信号の特徴量抽出方法Info
- Publication number
- JPH0477799A JPH0477799A JP19142390A JP19142390A JPH0477799A JP H0477799 A JPH0477799 A JP H0477799A JP 19142390 A JP19142390 A JP 19142390A JP 19142390 A JP19142390 A JP 19142390A JP H0477799 A JPH0477799 A JP H0477799A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- signal
- frequency
- analysis
- predictive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000004458 analytical method Methods 0.000 claims abstract description 53
- 238000001914 filtration Methods 0.000 claims abstract description 10
- 238000000605 extraction Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 abstract description 14
- 238000001228 spectrum Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 4
- 238000005314 correlation function Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000005311 autocorrelation function Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 239000002966 varnish Substances 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、音声認識や機械の故障検出等に用いられるも
ので、音声や機械の振動音等といった音響信号のピッチ
成分(基本周波数成分〉が持つ特徴量を抽出するピッチ
信号の特徴量抽出方法に関するものである。
ので、音声や機械の振動音等といった音響信号のピッチ
成分(基本周波数成分〉が持つ特徴量を抽出するピッチ
信号の特徴量抽出方法に関するものである。
(従来の技術)
従来、このような分野の技術としては、次のような文献
等に記載されるものがあった。
等に記載されるものがあった。
文献1:古井著「ディジタル音声処理」初版(1985
−9−25>東海大学出版 会、P、69−72 文献2:中溝著「信号解析をシステム同定」初版(19
88−3−25>コロナ社、 P、193−207 従来、音響信号におけるピッチ信号の特徴量を抽出する
場合、音声や機械の振動音等といっな音音信号を模擬的
に発生させ、それを解析する手法が採られている。−例
として、第2図に模擬音響信号の模擬発生過程を示し、
その各過程での波形図を第3図(a)〜(d)に示す。
−9−25>東海大学出版 会、P、69−72 文献2:中溝著「信号解析をシステム同定」初版(19
88−3−25>コロナ社、 P、193−207 従来、音響信号におけるピッチ信号の特徴量を抽出する
場合、音声や機械の振動音等といっな音音信号を模擬的
に発生させ、それを解析する手法が採られている。−例
として、第2図に模擬音響信号の模擬発生過程を示し、
その各過程での波形図を第3図(a)〜(d)に示す。
第2図において、ピッチ信号発生部1では、第3図(a
)に示すように、繰り遅し波形であるピッチ信号S1を
発生し、周波数包絡線フィルタ2へ送る。ピッチ信号S
1のスペクトル構造は、零周波数を原点として基本周波
数の整数倍の位置にのみエネルギーを有する線スペクト
ル構造を持つ。
)に示すように、繰り遅し波形であるピッチ信号S1を
発生し、周波数包絡線フィルタ2へ送る。ピッチ信号S
1のスペクトル構造は、零周波数を原点として基本周波
数の整数倍の位置にのみエネルギーを有する線スペクト
ル構造を持つ。
音声の場合、ピッチ信号S1は声帯波に相当する。
周波数包絡線フィルタ2では、ピッチ信号S1で励振す
ることにより、jfF:擬音音信号S2を発生する。音
声では、声帯に相当する部分である。この周波数包絡線
フィルタ2では、例えば極の位置を(角度、半径)−(
1/3π、0.98>(−1/3π、0.98>、(2
/3π、0.98)、(−2/3π、0.98)とした
とき、第3図(b)で示す周波数特性を持つ。このとき
発生する模擬音響信号S2は第3図(c)のようになり
、その周波数スペクトルが第3図(d)に示されている
。
ることにより、jfF:擬音音信号S2を発生する。音
声では、声帯に相当する部分である。この周波数包絡線
フィルタ2では、例えば極の位置を(角度、半径)−(
1/3π、0.98>(−1/3π、0.98>、(2
/3π、0.98)、(−2/3π、0.98)とした
とき、第3図(b)で示す周波数特性を持つ。このとき
発生する模擬音響信号S2は第3図(c)のようになり
、その周波数スペクトルが第3図(d)に示されている
。
従来のピッチ信号の特徴量抽出方法では、前記文献1に
記載されているように、模擬音響信号S2の成分からピ
ッチ信号S1を取り出すために、まず、下記に示す線形
予測法等によって、周波数包絡線成分を抽出し、これを
逆フィルタリングして除去する。
記載されているように、模擬音響信号S2の成分からピ
ッチ信号S1を取り出すために、まず、下記に示す線形
予測法等によって、周波数包絡線成分を抽出し、これを
逆フィルタリングして除去する。
そして、抽出されたピッチ信号から、相関法を用いて周
期を算出することにより、該ピッチ信号の特徴量を抽出
している。これは、予測誤差信号はピッチ信号の基本周
期の整数倍に大きい相関値を示す性質を利用するもので
ある。
期を算出することにより、該ピッチ信号の特徴量を抽出
している。これは、予測誤差信号はピッチ信号の基本周
期の整数倍に大きい相関値を示す性質を利用するもので
ある。
ここで、線形予測法について説明する。
いま、p個の過去値データ(xt−1、t−2・・・、
x )から時刻tにおける値Xtを予測す−p る線形予測式を、次式のように表す。
x )から時刻tにおける値Xtを予測す−p る線形予測式を、次式のように表す。
X−t= −再aiXt−i
=1
・・・・・・(1)
つまり、予測値天はp個の過去値(分析次数)の線形結
合として記述されるものとする。このとき、予測誤差e
、は、 である。
合として記述されるものとする。このとき、予測誤差e
、は、 である。
ここで、
J =E (e t )
・・・・・・(3)
を考える。Jをahで微分して零とおくと、J
8 k
=0
から
を得る。(X、)は定常時系列であるから、を最小にす
るように予測係数a、を決定する場合Rk−E (X
t X t−k ) RH−t =E (Xt−1Xt4 )は自己相関関数
である。したがって(4)式はRkす1iRk−1−0 ;に二1.2.・・・、p ・・・・(5〉 となる。これは最小2乗法における正規方程式である。
るように予測係数a、を決定する場合Rk−E (X
t X t−k ) RH−t =E (Xt−1Xt4 )は自己相関関数
である。したがって(4)式はRkす1iRk−1−0 ;に二1.2.・・・、p ・・・・(5〉 となる。これは最小2乗法における正規方程式である。
もし相関関数Rk (k=0.1.・・・、p)が既知
であれば、(5)式を解いて予測係数a。
であれば、(5)式を解いて予測係数a。
が定まり、時刻tにおける値Xtを予測することができ
る。これが線形予測法の原理である。
る。これが線形予測法の原理である。
(発明が解法しようとする課題〉
しかしながら、従来の方法では、相関法を用いているの
で、ピッチ信号S1が1つの基本周期を持つ場合につい
てのみ有効であり、複数の基本周期を持つ場合には分析
精度が低い。その上、ピッチ周波数を求めるには、相関
値が大であるか否かの判定を行う必要があるが、複数の
基本周期を持つ場合、雑音の影響等により、“大゛であ
る判断の基準となる閾値を適応的に決定することが困難
である。従って、精度の良い特徴量抽出が行えなかった
。
で、ピッチ信号S1が1つの基本周期を持つ場合につい
てのみ有効であり、複数の基本周期を持つ場合には分析
精度が低い。その上、ピッチ周波数を求めるには、相関
値が大であるか否かの判定を行う必要があるが、複数の
基本周期を持つ場合、雑音の影響等により、“大゛であ
る判断の基準となる閾値を適応的に決定することが困難
である。従って、精度の良い特徴量抽出が行えなかった
。
本発明は前記従来技術が持っていた課にとして、ピッチ
信号が複数の基本周期を持つ場合に、精度の良い特徴量
抽出か行えないという点について解法したピッチ信号の
特@凰抽出方法を提供するものである。
信号が複数の基本周期を持つ場合に、精度の良い特徴量
抽出か行えないという点について解法したピッチ信号の
特@凰抽出方法を提供するものである。
(課題を解法するための手段)
本発明は前記課題を解法するために、音声や機械振動音
等といった音響信号におけるピッチ信号の特徴凰抽出方
法において、前記音響信号を、籠大エントロピー法等の
線形予測分析法により求められた予測係数により逆フィ
ルタリングし、その逆フィルタリングの予測誤差信号を
さらに線形予測分析法により分析し、得られた最適次数
における予測係数から、連立法等の1元高次方程式の解
法により算出した極の角度が、前記音響信号における基
本周期の整数倍であることを見いだすことにより、ピッ
チ周期を求めるようにしている。
等といった音響信号におけるピッチ信号の特徴凰抽出方
法において、前記音響信号を、籠大エントロピー法等の
線形予測分析法により求められた予測係数により逆フィ
ルタリングし、その逆フィルタリングの予測誤差信号を
さらに線形予測分析法により分析し、得られた最適次数
における予測係数から、連立法等の1元高次方程式の解
法により算出した極の角度が、前記音響信号における基
本周期の整数倍であることを見いだすことにより、ピッ
チ周期を求めるようにしている。
(作用)
本発明によれば、以上のようにピッチ信号の特徴量抽出
方法を構成したので、複数の周期のインパルスが合成さ
れたピッチ信号に対し、線形予測分析により、周波数包
絡線成分が抽出される。そして、逆フィルタリングを行
い、得らhた予測誤差信号がさらに線形予測分析され、
その予測係数からピッチ周波数が正確に算出される。従
って、前記課題を解法できるのである。
方法を構成したので、複数の周期のインパルスが合成さ
れたピッチ信号に対し、線形予測分析により、周波数包
絡線成分が抽出される。そして、逆フィルタリングを行
い、得らhた予測誤差信号がさらに線形予測分析され、
その予測係数からピッチ周波数が正確に算出される。従
って、前記課題を解法できるのである。
(実施例)
第1図は、本発明の実施例を示すもので、ピッチ信号の
特徴量抽出方法を用いた特徴藍抽出装置の機能ブロック
図である。
特徴量抽出方法を用いた特徴藍抽出装置の機能ブロック
図である。
この特徴量抽出装置は、音響信号Sinの周波数包絡線
成分を推定して予測係数310a及び予測誤差信号51
0bを出力する第1段線形予測分析部10を有している
。この第1段線形予測分析部10は、例えば最大エント
ロピー法(以下、MEMという)を用いて分析するもの
で、その出力側には、包絡線成分分析部11及び第2段
線形予測分析部12が接続されている。
成分を推定して予測係数310a及び予測誤差信号51
0bを出力する第1段線形予測分析部10を有している
。この第1段線形予測分析部10は、例えば最大エント
ロピー法(以下、MEMという)を用いて分析するもの
で、その出力側には、包絡線成分分析部11及び第2段
線形予測分析部12が接続されている。
包絡線成分分析部11は、予測係数5108から周波数
包絡線スペクトルを算出する機能を有している。第2段
線形予測分析部12は、例えばMEMを用いて予測誤差
信号510bを分析し、情報エントロピー512a及び
予測係数512bを出力する機能を有し、その出力側に
は、最適次数判定部13及びピッチ周波数算出部14が
接続されている。
包絡線スペクトルを算出する機能を有している。第2段
線形予測分析部12は、例えばMEMを用いて予測誤差
信号510bを分析し、情報エントロピー512a及び
予測係数512bを出力する機能を有し、その出力側に
は、最適次数判定部13及びピッチ周波数算出部14が
接続されている。
最適次数判定部13は、エントロピー512aに基づき
、最適次数5L4a、514bを算出してそれを第1段
及び第2段線形予測分析部1012へ与える機能を有し
ている。ピッチ周波数算出部14は、1元高次方程式、
例えば連立法を用いて、予測係数5L2bからピッチ周
波数を推定する機能を有している。
、最適次数5L4a、514bを算出してそれを第1段
及び第2段線形予測分析部1012へ与える機能を有し
ている。ピッチ周波数算出部14は、1元高次方程式、
例えば連立法を用いて、予測係数5L2bからピッチ周
波数を推定する機能を有している。
以上のような特徴量抽出装置における特′a足抽出方法
について説明する。
について説明する。
先ず、本実施例で用いられるMEM、及び連立法の原理
を説明する。
を説明する。
MEMとは、前記文献2に記載されているように、エン
トロピーを最大にするスペクトル密度を決定する方法で
ある。
トロピーを最大にするスペクトル密度を決定する方法で
ある。
即ち、I、x :t=1.2.・・・、m)の確率密
℃ 度量数をf (Xl 、 X2 、・++、 Xm )
と表すと、エントロピーは )((xl、・・・、 Xm ) E(■nf(xl、・・・、xIIl))・・・・(6
) て定義される。ここで、(Xl)が正規分布に従うしの
と仮定すると、(6)式は容易に計算できで ]− ■」 In2πθ+ In R□ ・・・・・(7) となる。但し、(7)式で は、Toep I i tZ行列式である。(7)式は
汀1→ωでト■→■となる。そこで、 H(Xl + ’・・+ Xm ) + m−+”’・
・・・・・(9) と定義してエントロピーレートという。HXは次式(1
0〉のように表わせる。
℃ 度量数をf (Xl 、 X2 、・++、 Xm )
と表すと、エントロピーは )((xl、・・・、 Xm ) E(■nf(xl、・・・、xIIl))・・・・(6
) て定義される。ここで、(Xl)が正規分布に従うしの
と仮定すると、(6)式は容易に計算できで ]− ■」 In2πθ+ In R□ ・・・・・(7) となる。但し、(7)式で は、Toep I i tZ行列式である。(7)式は
汀1→ωでト■→■となる。そこで、 H(Xl + ’・・+ Xm ) + m−+”’・
・・・・・(9) と定義してエントロピーレートという。HXは次式(1
0〉のように表わせる。
・・・・・(10)
但し、5(f)ニスベクトル密度
問題は、p+1個の相関関数(Ro、R1,・・・Rp
+が与えられたとき、そのスペクトル密度S(f>を推
定したい。この時、S(f>はエントロピーを最大にす
るように、つまり、Ro、R。
+が与えられたとき、そのスペクトル密度S(f>を推
定したい。この時、S(f>はエントロピーを最大にす
るように、つまり、Ro、R。
・・、R1に適合するモデルの中で最もランダムとなる
ものを定めようとするのが、最大エントロピーの原理で
ある。
ものを定めようとするのが、最大エントロピーの原理で
ある。
次に、連立法の原理について説明する。
連立法とは、DKA法(DLIrand、にerner
、 Aberth法)ともいわれ、n次方程式のn個の
解3’1 、 V2、・・・、y を−斉に求めてしま
おうというものである。即ち、n個の解に対する第ν近
似値をZ(′) ・・・ (L′)とした時、あ
るn変数1 ・ ・Zn の関数ψ1 (zl、 ・ 、Z )、 ・ 、
ψn (Zl 。
、 Aberth法)ともいわれ、n次方程式のn個の
解3’1 、 V2、・・・、y を−斉に求めてしま
おうというものである。即ち、n個の解に対する第ν近
似値をZ(′) ・・・ (L′)とした時、あ
るn変数1 ・ ・Zn の関数ψ1 (zl、 ・ 、Z )、 ・ 、
ψn (Zl 。
・・、2n>を用いて第ν+1近似値を次式(11)で
計算するものである。
計算するものである。
=Z、 (ν)
z i、 (v + 1 > (v )+ψ1(Z
1一、z(ν)) ・・・・・(11) (ν)・・ くなったら、a・−Z・ たということにし(ν) て、それから先のνに対してはZ・ を変化させな
くてよい。これが、連立法の原理である。
1一、z(ν)) ・・・・・(11) (ν)・・ くなったら、a・−Z・ たということにし(ν) て、それから先のνに対してはZ・ を変化させな
くてよい。これが、連立法の原理である。
次に、第1図及び第4図を参照しつつ、本実施例の特徴
量抽出方法について説明する。なお、第4図は第1図中
のピッチ周波数算出処理のフローチャートである。
量抽出方法について説明する。なお、第4図は第1図中
のピッチ周波数算出処理のフローチャートである。
第1図において、最適次数判定部13から出力さn f
s 最適次数514a、514bが、第1. R及び第
2段線形予測分析部10.12に与えられる。
s 最適次数514a、514bが、第1. R及び第
2段線形予測分析部10.12に与えられる。
第1段線形予測分析部10では、最適次数S]−4aに
基づき、音響信号Sjnの周波数包結線成分をMEMに
より推定し、予測係数310aを包絡線成分分析部1]
に与えると共に、その予測係数310aで逆フィルタリ
ングを行い、得られた予測誤差信号510bを第2段線
形予測分析部12へ送る。なお、包絡線成分分析部11
は、最適次数314aのときの予測係数310aから、
周波数包絡線スペクトルを算出する。このスペクトルは
、本実施例とは異なる他の用途に使用さiする。
基づき、音響信号Sjnの周波数包結線成分をMEMに
より推定し、予測係数310aを包絡線成分分析部1]
に与えると共に、その予測係数310aで逆フィルタリ
ングを行い、得られた予測誤差信号510bを第2段線
形予測分析部12へ送る。なお、包絡線成分分析部11
は、最適次数314aのときの予測係数310aから、
周波数包絡線スペクトルを算出する。このスペクトルは
、本実施例とは異なる他の用途に使用さiする。
第2段線形予測分析部12では、MEMを用い、予測誤
差信号510bを、さらにMEM分析し、該予測誤差信
号510bから算出されるエントロピー512aを最適
次数判定部13へ送る。
差信号510bを、さらにMEM分析し、該予測誤差信
号510bから算出されるエントロピー512aを最適
次数判定部13へ送る。
最適次数判定部13は、エントロピー512aを基に、
最適次数514a、514bを算出し、その算出結果を
第1段及び第2段線形予測分析部10.12に与える。
最適次数514a、514bを算出し、その算出結果を
第1段及び第2段線形予測分析部10.12に与える。
最適次数判定部13において行っている最適次数の算出
方法のうち、例えば第2段線形予測分析における最適次
数514bは、次のようにして決定される。即ち、第1
段線形予測分析において、第1段線形予測分析の最適次
数314aと判定された予測係数310aによる逆フィ
ルタリングを行った信号を、さらに第2段線形予測分析
部12乙こおいてMEM分析して得らノまたエントロピ
ーS 12 aが、第2段線形予測分析次数の範囲内で
最も減少した次数を、最適次数514bと判定し、それ
を第2段線形予測分析部]2へ与える。
方法のうち、例えば第2段線形予測分析における最適次
数514bは、次のようにして決定される。即ち、第1
段線形予測分析において、第1段線形予測分析の最適次
数314aと判定された予測係数310aによる逆フィ
ルタリングを行った信号を、さらに第2段線形予測分析
部12乙こおいてMEM分析して得らノまたエントロピ
ーS 12 aが、第2段線形予測分析次数の範囲内で
最も減少した次数を、最適次数514bと判定し、それ
を第2段線形予測分析部]2へ与える。
第2段線形予測分析部12は、最適次数判定部13より
送られた該MEMの最適次数5L4bの予測係数5L2
bを、ピッチ周波数算出部14へ送る。
送られた該MEMの最適次数5L4bの予測係数5L2
bを、ピッチ周波数算出部14へ送る。
ピッチ周波数算出部14では、最適次数S 1.4bの
予測係数512bから、1元高次方程式の解法、例えば
連立法を用いてピッチ周波数を推定する。これは、ピッ
チ信号は線スペクトルを持つため、その極〈即ち、Z平
面の伝達関数の分母の解)の配置も基本周期で等間隔と
なる。そこで、この性質を利用してピッチ周期を算出す
る。この算出方法を第4図のフローチャートを参照しつ
つ、以下説明する。
予測係数512bから、1元高次方程式の解法、例えば
連立法を用いてピッチ周波数を推定する。これは、ピッ
チ信号は線スペクトルを持つため、その極〈即ち、Z平
面の伝達関数の分母の解)の配置も基本周期で等間隔と
なる。そこで、この性質を利用してピッチ周期を算出す
る。この算出方法を第4図のフローチャートを参照しつ
つ、以下説明する。
第4図のステップ21で、入力された予測係数512b
からZ平面上の極を算出する。ステップ22で、極の角
度の小さい順序でソーディング(並び替え)する。ステ
ップ23で、極の番号iに初期値■を与え、ステップ2
4で、極の番号jに初期値i+1を与える。ステップ2
5では、極i、j間を基本周期とみなし、その整数倍の
位置に極があるか否かを判定する。
からZ平面上の極を算出する。ステップ22で、極の角
度の小さい順序でソーディング(並び替え)する。ステ
ップ23で、極の番号iに初期値■を与え、ステップ2
4で、極の番号jに初期値i+1を与える。ステップ2
5では、極i、j間を基本周期とみなし、その整数倍の
位置に極があるか否かを判定する。
極があると判定されると、ステップ26ではその極をピ
ッチ周期候補として出力する。そして、ステップ27〜
30で、極i、jを変化させながら、ピッチ周期候補を
見つけ出す。ステップ31では、ピッチ周期候補のうち
、整数倍の関係にあるものを取り除き、ピッチ周期とし
て出力する。
ッチ周期候補として出力する。そして、ステップ27〜
30で、極i、jを変化させながら、ピッチ周期候補を
見つけ出す。ステップ31では、ピッチ周期候補のうち
、整数倍の関係にあるものを取り除き、ピッチ周期とし
て出力する。
このようなピッチ周波数算出処理を数式を用いて考察す
ると、次のようになる。
ると、次のようになる。
例えば、ピッチ信号p (t)がTl、T2の2つの基
本周期を持つ場合、次式(12)で表わせる。
本周期を持つ場合、次式(12)で表わせる。
p(t)=δ(t−1・T1)+δ(t−j ・T2
)(1,j;整数) ・・・・・・(12) 但し、δ(t)−〇、 t≠0 δ(t)=1. t −〇 一方、自己相関関数C(τ)は、 C(τ) =δ (τ−k ・ 丁1) +δ (τ−
1・ 丁2)+2 ・ δ (τ−m・ 丁1−n ・
丁2) ・・・・・値 13 〉となる。そ
のため、従来のような相関関数の周期から、ピッチ周期
を求める方法の場合、(13)式の第3項のため、2つ
のピッチ周期を正確に求めることができない。
)(1,j;整数) ・・・・・・(12) 但し、δ(t)−〇、 t≠0 δ(t)=1. t −〇 一方、自己相関関数C(τ)は、 C(τ) =δ (τ−k ・ 丁1) +δ (τ−
1・ 丁2)+2 ・ δ (τ−m・ 丁1−n ・
丁2) ・・・・・値 13 〉となる。そ
のため、従来のような相関関数の周期から、ピッチ周期
を求める方法の場合、(13)式の第3項のため、2つ
のピッチ周期を正確に求めることができない。
これに対し、本実施例では、(12)式のピッ子信号p
(t)を連立法を用いて次式(]−4>のように予測
分析している。
(t)を連立法を用いて次式(]−4>のように予測
分析している。
x (t) =x (t −TI) +x
(t −12〉−x (t −TI−T2) ・・・・・・(14) (14)式を、2変換を用いて表わすと、−11−12
−丁1 Z −Z −Z−12+1=0 ・・・・・・(15) となり、この(15)式を変形すれば、1)=0 ・・・・・・(16〉 となる。連立法を用いて(16)式を因数分解すると、 ・・・・・・(17) となる。これより、極の位置は、半径1の円周上に角度 となる。極は基本周期Tl、T2間隔で、単位円周上に
存在している。従って、これを第4図の処理により、基
本周期を発見すれは、簡単かつ正確に2つの基本周期T
l、T2を求めることができる。
(t −12〉−x (t −TI−T2) ・・・・・・(14) (14)式を、2変換を用いて表わすと、−11−12
−丁1 Z −Z −Z−12+1=0 ・・・・・・(15) となり、この(15)式を変形すれば、1)=0 ・・・・・・(16〉 となる。連立法を用いて(16)式を因数分解すると、 ・・・・・・(17) となる。これより、極の位置は、半径1の円周上に角度 となる。極は基本周期Tl、T2間隔で、単位円周上に
存在している。従って、これを第4図の処理により、基
本周期を発見すれは、簡単かつ正確に2つの基本周期T
l、T2を求めることができる。
さらに、本実施例では、第1段及び第2段線形予測分析
部10.12で、MEMを用いて分析を行っているので
、常に安定な推定が行える、高い分解能が得られる、雑
音に対しても分析精度が高い等の利点がある。その上、
連立法を用いてピ・;・千周波数の算出を行っているの
で、演算処理の高速化が図れる。
部10.12で、MEMを用いて分析を行っているので
、常に安定な推定が行える、高い分解能が得られる、雑
音に対しても分析精度が高い等の利点がある。その上、
連立法を用いてピ・;・千周波数の算出を行っているの
で、演算処理の高速化が図れる。
なお、本発明は上記実施例に限定されず、種々の変形が
可能である。その変形例としては、例えば次のようなも
のがある。
可能である。その変形例としては、例えば次のようなも
のがある。
(a) 第1段及び第2段線形予測分析部10゜12
において、MEM以外のパーコール分析法、線スペクト
ル対(LSP)分析法、複合正弦波(C8P)法等とい
った他の線形予測分析法を使用してもよい。
において、MEM以外のパーコール分析法、線スペクト
ル対(LSP)分析法、複合正弦波(C8P)法等とい
った他の線形予測分析法を使用してもよい。
(b) ピッチ周波数算出部14において、連立法以
外の他の1元高次方程式の解法を用いてもよい。
外の他の1元高次方程式の解法を用いてもよい。
(C) 第1図の各ブロックは、個別回路で構成する
以外に、ディジタル・シグナル・プロセッサ(DSP>
やマイクロプロセッサ等で実行するようにしてしよい。
以外に、ディジタル・シグナル・プロセッサ(DSP>
やマイクロプロセッサ等で実行するようにしてしよい。
さらに、本発明は、音声や機械振動音等の種々の音響信
号に適用できるばかりか、3以上の基本周期を持つピッ
チ信号に対してし、高い精度で抽出が行える。
号に適用できるばかりか、3以上の基本周期を持つピッ
チ信号に対してし、高い精度で抽出が行える。
(発明の効果)
以上詳細に説明したように、本発明によれば、線形予測
分析により周波数包絡線成分を抽出し、逆フィルタリン
グを行い、得られた予測誤差信号をさらに線形予測分析
し、その予測係数からピッチ周波数を算出するようにし
ている。そのため、複数の基本周期を持つピッチ信号に
おける周波数等の特徴量を、容易に、かつ高精度で、高
速に、抽出することができる。
分析により周波数包絡線成分を抽出し、逆フィルタリン
グを行い、得られた予測誤差信号をさらに線形予測分析
し、その予測係数からピッチ周波数を算出するようにし
ている。そのため、複数の基本周期を持つピッチ信号に
おける周波数等の特徴量を、容易に、かつ高精度で、高
速に、抽出することができる。
また、MEMを用いて線形予測分析を行うと、常に安定
な推定が行える、高い分解能が得られる、雑音に対して
も分析精度が高い等の効果がある。
な推定が行える、高い分解能が得られる、雑音に対して
も分析精度が高い等の効果がある。
さらに、連立法を用いてピッチ周波数の算出を行えば、
演算処理の高速化が期待できる。
演算処理の高速化が期待できる。
第1図は本発明の実施例を示す特徴址抽出方法を用いた
特徴量抽出装置の機能ブロック図、第2図は模擬信号発
生過程を示す図、第3図(a)〜(d)は第2図の波形
図、第4図は第1図のピッチ周波数算出処理を示すフロ
ーチャートである。 10.12・・・・・・第1段、第2段線形予測分析部
、11・・・・・・包絡線成分分析部、13・・・・・
・最適次数判定部、14・・・・・・ピッチ周波数算出
部、Sin・・・・・音響信号。
特徴量抽出装置の機能ブロック図、第2図は模擬信号発
生過程を示す図、第3図(a)〜(d)は第2図の波形
図、第4図は第1図のピッチ周波数算出処理を示すフロ
ーチャートである。 10.12・・・・・・第1段、第2段線形予測分析部
、11・・・・・・包絡線成分分析部、13・・・・・
・最適次数判定部、14・・・・・・ピッチ周波数算出
部、Sin・・・・・音響信号。
Claims (1)
- 【特許請求の範囲】 1、音響信号におけるピッチ信号の特徴量を抽出するピ
ッチ信号の特徴量抽出方法において、前記音響信号を、
線形予測分析法により求められた予測係数により逆フィ
ルタリングし、その逆フィルタリングにより得られた予
測誤差信号をさらに線形予測分析法により分析し、 得られた最適次数における予測係数から、1元高次方程
式の解法により算出した極の角度が、前記音響信号にお
ける基本周期の整数倍であることを見いだすことにより
、 ピッチ周期を求めるピッチ信号の特徴量抽出方法。 2、請求項1記載のピッチ信号の特徴量抽出方法におい
て、 前記線形予測分析法は最大エントロピー法を用い、 前記1元高次方程式の解法は、連立法を用いるピッチ信
号の特徴量抽出方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP19142390A JPH0477799A (ja) | 1990-07-19 | 1990-07-19 | ピッチ信号の特徴量抽出方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP19142390A JPH0477799A (ja) | 1990-07-19 | 1990-07-19 | ピッチ信号の特徴量抽出方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0477799A true JPH0477799A (ja) | 1992-03-11 |
Family
ID=16274369
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP19142390A Pending JPH0477799A (ja) | 1990-07-19 | 1990-07-19 | ピッチ信号の特徴量抽出方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0477799A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH09258795A (ja) * | 1996-03-25 | 1997-10-03 | Nippon Telegr & Teleph Corp <Ntt> | ディジタルフィルタおよび音響符号化/復号化装置 |
| JP2009069309A (ja) * | 2007-09-11 | 2009-04-02 | Nippon Telegr & Teleph Corp <Ntt> | 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体 |
| CN104217722A (zh) * | 2014-08-22 | 2014-12-17 | 哈尔滨工程大学 | 一种海豚哨声信号时频谱轮廓提取方法 |
-
1990
- 1990-07-19 JP JP19142390A patent/JPH0477799A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH09258795A (ja) * | 1996-03-25 | 1997-10-03 | Nippon Telegr & Teleph Corp <Ntt> | ディジタルフィルタおよび音響符号化/復号化装置 |
| JP2009069309A (ja) * | 2007-09-11 | 2009-04-02 | Nippon Telegr & Teleph Corp <Ntt> | 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体 |
| CN104217722A (zh) * | 2014-08-22 | 2014-12-17 | 哈尔滨工程大学 | 一种海豚哨声信号时频谱轮廓提取方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Virtanen | Sound source separation using sparse coding with temporal continuity objective | |
| US8949118B2 (en) | System and method for robust estimation and tracking the fundamental frequency of pseudo periodic signals in the presence of noise | |
| Yegnanarayana et al. | Processing of reverberant speech for time-delay estimation | |
| Sukhostat et al. | A comparative analysis of pitch detection methods under the influence of different noise conditions | |
| KR20110088036A (ko) | 음원 분리를 위해 자동적으로 문턱치를 선택하는 신호 분리 시스템 및 방법 | |
| Singh et al. | Vector quantization approach for speaker recognition using MFCC and inverted MFCC | |
| Takeuchi et al. | Data-driven design of perfect reconstruction filterbank for DNN-based sound source enhancement | |
| Kumar et al. | Performance evaluation of a ACF-AMDF based pitch detection scheme in real-time | |
| Sripriya et al. | Pitch estimation using harmonic product spectrum derived from DCT | |
| Slaney | An introduction to auditory model inversion | |
| Goto | A predominant-F0 estimation method for polyphonic musical audio signals | |
| Slaney | Pattern playback from 1950 to 1995 | |
| JPH0477799A (ja) | ピッチ信号の特徴量抽出方法 | |
| Muhammad | Extended average magnitude difference function based pitch detection | |
| US4161625A (en) | Method for determining the fundamental frequency of a voice signal | |
| JPH02157800A (ja) | 特徴抽出方式 | |
| Degani et al. | Harmonic change detection for musical chords segmentation | |
| Kereliuk et al. | Improved hidden Markov model partial tracking through time-frequency analysis | |
| Jaureguiberry et al. | Adaptation of source-specific dictionaries in non-negative matrix factorization for source separation | |
| CN118230741A (zh) | 一种基于正弦谐波模型的低速率语音编解码方法 | |
| Lee et al. | Discriminative training of complex-valued deep recurrent neural network for singing voice separation | |
| US7822602B2 (en) | Adaptive reduction of noise signals and background signals in a speech-processing system | |
| Vestman et al. | Time-varying autoregressions for speaker verification in reverberant conditions | |
| Kobayashi et al. | Phase-recovery algorithm for harmonic/percussive source separation based on observed phase information and analytic computation | |
| Zeremdini et al. | Multi-pitch estimation based on multi-scale product analysis, improved comb filter and dynamic programming |