JPH0477799A

JPH0477799A - ピッチ信号の特徴量抽出方法

Info

Publication number: JPH0477799A
Application number: JP19142390A
Authority: JP
Inventors: Satoshi Shimizu; 聡清水; Kiyohito Tokuda; 清仁徳田; Atsushi Fukazawa; 深沢　敦司; Yumi Takizawa; 滝沢　由美
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1990-07-19
Filing date: 1990-07-19
Publication date: 1992-03-11

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、音声認識や機械の故障検出等に用いられるも
ので、音声や機械の振動音等といった音響信号のピッチ
成分（基本周波数成分〉が持つ特徴量を抽出するピッチ
信号の特徴量抽出方法に関するものである。

（従来の技術）従来、このような分野の技術としては、次のような文献
等に記載されるものがあった。

文献１：古井著「ディジタル音声処理」初版（１９８５
−９−２５＞東海大学出版会、Ｐ、６９−７２文献２：中溝著「信号解析をシステム同定」初版（１９
８８−３−２５＞コロナ社、Ｐ、１９３−２０７従来、音響信号におけるピッチ信号の特徴量を抽出する
場合、音声や機械の振動音等といっな音音信号を模擬的
に発生させ、それを解析する手法が採られている。−例
として、第２図に模擬音響信号の模擬発生過程を示し、
その各過程での波形図を第３図（ａ）〜（ｄ）に示す。

第２図において、ピッチ信号発生部１では、第３図（ａ
）に示すように、繰り遅し波形であるピッチ信号Ｓ１を
発生し、周波数包絡線フィルタ２へ送る。ピッチ信号Ｓ
１のスペクトル構造は、零周波数を原点として基本周波
数の整数倍の位置にのみエネルギーを有する線スペクト
ル構造を持つ。

音声の場合、ピッチ信号Ｓ１は声帯波に相当する。

周波数包絡線フィルタ２では、ピッチ信号Ｓ１で励振す
ることにより、ｊｆＦ：擬音音信号Ｓ２を発生する。音
声では、声帯に相当する部分である。この周波数包絡線
フィルタ２では、例えば極の位置を（角度、半径）−（
１／３π、０．９８＞（−１／３π、０．９８＞、（２
／３π、０．９８）、（−２／３π、０．９８）とした
とき、第３図（ｂ）で示す周波数特性を持つ。このとき
発生する模擬音響信号Ｓ２は第３図（ｃ）のようになり
、その周波数スペクトルが第３図（ｄ）に示されている
。

従来のピッチ信号の特徴量抽出方法では、前記文献１に
記載されているように、模擬音響信号Ｓ２の成分からピ
ッチ信号Ｓ１を取り出すために、まず、下記に示す線形
予測法等によって、周波数包絡線成分を抽出し、これを
逆フィルタリングして除去する。

そして、抽出されたピッチ信号から、相関法を用いて周
期を算出することにより、該ピッチ信号の特徴量を抽出
している。これは、予測誤差信号はピッチ信号の基本周
期の整数倍に大きい相関値を示す性質を利用するもので
ある。

ここで、線形予測法について説明する。

いま、ｐ個の過去値データ（ｘｔ−１、ｔ−２・・・、
ｘ　　　）から時刻ｔにおける値Ｘｔを予測す−ｐる線形予測式を、次式のように表す。

Ｘ−ｔ＝　−再ａｉＸｔ−ｉ＝１・・・・・・（１）つまり、予測値天はｐ個の過去値（分析次数）の線形結
合として記述されるものとする。このとき、予測誤差ｅ
、は、である。

ここで、Ｊ　＝Ｅ　（ｅ　ｔ　　）・・・・・・（３）を考える。Ｊをａｈで微分して零とおくと、Ｊ　８　ｋ＝０からを得る。（Ｘ、）は定常時系列であるから、を最小にす
るように予測係数ａ、を決定する場合Ｒｋ−Ｅ　（Ｘ　
ｔ　Ｘ　ｔ−ｋ　）ＲＨ−ｔ　＝Ｅ　（Ｘｔ−１Ｘｔ４　）は自己相関関数
である。したがって（４）式はＲｋす１ｉＲｋ−１−０；に二１．２．・・・、ｐ・・・・（５〉となる。これは最小２乗法における正規方程式である。

もし相関関数Ｒｋ　（ｋ＝０．１．・・・、ｐ）が既知
であれば、（５）式を解いて予測係数ａ。

が定まり、時刻ｔにおける値Ｘｔを予測することができ
る。これが線形予測法の原理である。

（発明が解法しようとする課題〉しかしながら、従来の方法では、相関法を用いているの
で、ピッチ信号Ｓ１が１つの基本周期を持つ場合につい
てのみ有効であり、複数の基本周期を持つ場合には分析
精度が低い。その上、ピッチ周波数を求めるには、相関
値が大であるか否かの判定を行う必要があるが、複数の
基本周期を持つ場合、雑音の影響等により、“大゛であ
る判断の基準となる閾値を適応的に決定することが困難
である。従って、精度の良い特徴量抽出が行えなかった
。

本発明は前記従来技術が持っていた課にとして、ピッチ
信号が複数の基本周期を持つ場合に、精度の良い特徴量
抽出か行えないという点について解法したピッチ信号の
特＠凰抽出方法を提供するものである。

（課題を解法するための手段）本発明は前記課題を解法するために、音声や機械振動音
等といった音響信号におけるピッチ信号の特徴凰抽出方
法において、前記音響信号を、籠大エントロピー法等の
線形予測分析法により求められた予測係数により逆フィ
ルタリングし、その逆フィルタリングの予測誤差信号を
さらに線形予測分析法により分析し、得られた最適次数
における予測係数から、連立法等の１元高次方程式の解
法により算出した極の角度が、前記音響信号における基
本周期の整数倍であることを見いだすことにより、ピッ
チ周期を求めるようにしている。

（作用）本発明によれば、以上のようにピッチ信号の特徴量抽出
方法を構成したので、複数の周期のインパルスが合成さ
れたピッチ信号に対し、線形予測分析により、周波数包
絡線成分が抽出される。そして、逆フィルタリングを行
い、得らｈた予測誤差信号がさらに線形予測分析され、
その予測係数からピッチ周波数が正確に算出される。従
って、前記課題を解法できるのである。

（実施例）第１図は、本発明の実施例を示すもので、ピッチ信号の
特徴量抽出方法を用いた特徴藍抽出装置の機能ブロック
図である。

この特徴量抽出装置は、音響信号Ｓｉｎの周波数包絡線
成分を推定して予測係数３１０ａ及び予測誤差信号５１
０ｂを出力する第１段線形予測分析部１０を有している
。この第１段線形予測分析部１０は、例えば最大エント
ロピー法（以下、ＭＥＭという）を用いて分析するもの
で、その出力側には、包絡線成分分析部１１及び第２段
線形予測分析部１２が接続されている。

包絡線成分分析部１１は、予測係数５１０８から周波数
包絡線スペクトルを算出する機能を有している。第２段
線形予測分析部１２は、例えばＭＥＭを用いて予測誤差
信号５１０ｂを分析し、情報エントロピー５１２ａ及び
予測係数５１２ｂを出力する機能を有し、その出力側に
は、最適次数判定部１３及びピッチ周波数算出部１４が
接続されている。

最適次数判定部１３は、エントロピー５１２ａに基づき
、最適次数５Ｌ４ａ、５１４ｂを算出してそれを第１段
及び第２段線形予測分析部１０１２へ与える機能を有し
ている。ピッチ周波数算出部１４は、１元高次方程式、
例えば連立法を用いて、予測係数５Ｌ２ｂからピッチ周
波数を推定する機能を有している。

以上のような特徴量抽出装置における特′ａ足抽出方法
について説明する。

先ず、本実施例で用いられるＭＥＭ、及び連立法の原理
を説明する。

ＭＥＭとは、前記文献２に記載されているように、エン
トロピーを最大にするスペクトル密度を決定する方法で
ある。

即ち、Ｉ、ｘ　　：ｔ＝１．２．・・・、ｍ）の確率密
℃ 度量数をｆ　（Ｘｌ　、　Ｘ２　、・＋＋、　Ｘｍ　）
と表すと、エントロピーは）（（ｘｌ、・・・、　Ｘｍ　）Ｅ（■ｎｆ（ｘｌ、・・・、ｘＩＩｌ））・・・・（６
）て定義される。ここで、（Ｘｌ）が正規分布に従うしの
と仮定すると、（６）式は容易に計算できで］− ■」Ｉｎ２πθ＋Ｉｎ　　Ｒ□ ・・・・・（７）となる。但し、（７）式では、Ｔｏｅｐ　Ｉ　ｉ　ｔＺ行列式である。（７）式は
汀１→ωでト■→■となる。そこで、Ｈ（Ｘｌ　＋　’・・＋　Ｘｍ　）　＋　ｍ−＋”’・
・・・・・（９）と定義してエントロピーレートという。ＨＸは次式（１
０〉のように表わせる。

・・・・・（１０）但し、５（ｆ）ニスベクトル密度問題は、ｐ＋１個の相関関数（Ｒｏ、Ｒ１，・・・Ｒｐ
＋が与えられたとき、そのスペクトル密度Ｓ（ｆ＞を推
定したい。この時、Ｓ（ｆ＞はエントロピーを最大にす
るように、つまり、Ｒｏ、Ｒ。

・・、Ｒ１に適合するモデルの中で最もランダムとなる
ものを定めようとするのが、最大エントロピーの原理で
ある。

次に、連立法の原理について説明する。

連立法とは、ＤＫＡ法（ＤＬＩｒａｎｄ、にｅｒｎｅｒ
、　Ａｂｅｒｔｈ法）ともいわれ、ｎ次方程式のｎ個の
解３’１　、　Ｖ２、・・・、ｙ　を−斉に求めてしま
おうというものである。即ち、ｎ個の解に対する第ν近
似値をＺ（′）　　・・・　　　（Ｌ′）とした時、あ
るｎ変数１　　　・　・Ｚｎの関数ψ１　　（ｚｌ、　・　、Ｚ　　）、　・　、　
ψｎ　（Ｚｌ　。

・・、２ｎ＞を用いて第ν＋１近似値を次式（１１）で
計算するものである。

＝Ｚ、　　　　　　　　（ν）ｚ　ｉ、　（ｖ　＋　１　＞　　　（ｖ　）＋ψ１（Ｚ
１一、ｚ（ν））・・・・・（１１）（ν）・・くなったら、ａ・−Ｚ・　　　たということにし（ν）て、それから先のνに対してはＺ・　　　を変化させな
くてよい。これが、連立法の原理である。

次に、第１図及び第４図を参照しつつ、本実施例の特徴
量抽出方法について説明する。なお、第４図は第１図中
のピッチ周波数算出処理のフローチャートである。

第１図において、最適次数判定部１３から出力さｎ　ｆ
ｓ　最適次数５１４ａ、５１４ｂが、第１．　Ｒ及び第
２段線形予測分析部１０．１２に与えられる。

第１段線形予測分析部１０では、最適次数Ｓ］−４ａに
基づき、音響信号Ｓｊｎの周波数包結線成分をＭＥＭに
より推定し、予測係数３１０ａを包絡線成分分析部１］
に与えると共に、その予測係数３１０ａで逆フィルタリ
ングを行い、得られた予測誤差信号５１０ｂを第２段線
形予測分析部１２へ送る。なお、包絡線成分分析部１１
は、最適次数３１４ａのときの予測係数３１０ａから、
周波数包絡線スペクトルを算出する。このスペクトルは
、本実施例とは異なる他の用途に使用さｉする。

第２段線形予測分析部１２では、ＭＥＭを用い、予測誤
差信号５１０ｂを、さらにＭＥＭ分析し、該予測誤差信
号５１０ｂから算出されるエントロピー５１２ａを最適
次数判定部１３へ送る。

最適次数判定部１３は、エントロピー５１２ａを基に、
最適次数５１４ａ、５１４ｂを算出し、その算出結果を
第１段及び第２段線形予測分析部１０．１２に与える。

最適次数判定部１３において行っている最適次数の算出
方法のうち、例えば第２段線形予測分析における最適次
数５１４ｂは、次のようにして決定される。即ち、第１
段線形予測分析において、第１段線形予測分析の最適次
数３１４ａと判定された予測係数３１０ａによる逆フィ
ルタリングを行った信号を、さらに第２段線形予測分析
部１２乙こおいてＭＥＭ分析して得らノまたエントロピ
ーＳ　１２　ａが、第２段線形予測分析次数の範囲内で
最も減少した次数を、最適次数５１４ｂと判定し、それ
を第２段線形予測分析部］２へ与える。

第２段線形予測分析部１２は、最適次数判定部１３より
送られた該ＭＥＭの最適次数５Ｌ４ｂの予測係数５Ｌ２
ｂを、ピッチ周波数算出部１４へ送る。

ピッチ周波数算出部１４では、最適次数Ｓ　１．４ｂの
予測係数５１２ｂから、１元高次方程式の解法、例えば
連立法を用いてピッチ周波数を推定する。これは、ピッ
チ信号は線スペクトルを持つため、その極〈即ち、Ｚ平
面の伝達関数の分母の解）の配置も基本周期で等間隔と
なる。そこで、この性質を利用してピッチ周期を算出す
る。この算出方法を第４図のフローチャートを参照しつ
つ、以下説明する。

第４図のステップ２１で、入力された予測係数５１２ｂ
からＺ平面上の極を算出する。ステップ２２で、極の角
度の小さい順序でソーディング（並び替え）する。ステ
ップ２３で、極の番号ｉに初期値■を与え、ステップ２
４で、極の番号ｊに初期値ｉ＋１を与える。ステップ２
５では、極ｉ、ｊ間を基本周期とみなし、その整数倍の
位置に極があるか否かを判定する。

極があると判定されると、ステップ２６ではその極をピ
ッチ周期候補として出力する。そして、ステップ２７〜
３０で、極ｉ、ｊを変化させながら、ピッチ周期候補を
見つけ出す。ステップ３１では、ピッチ周期候補のうち
、整数倍の関係にあるものを取り除き、ピッチ周期とし
て出力する。

このようなピッチ周波数算出処理を数式を用いて考察す
ると、次のようになる。

例えば、ピッチ信号ｐ　（ｔ）がＴｌ、Ｔ２の２つの基
本周期を持つ場合、次式（１２）で表わせる。

ｐ（ｔ）＝δ（ｔ−１・Ｔ１）＋δ（ｔ−ｊ　　・Ｔ２
）（１，ｊ；整数）・・・・・・（１２）但し、δ（ｔ）−〇、　　ｔ≠０ δ（ｔ）＝１．　　　ｔ　−〇一方、自己相関関数Ｃ（τ）は、Ｃ（τ）　＝δ　（τ−ｋ　・　丁１）　＋δ　（τ−
１・　丁２）＋２　・　δ　（τ−ｍ・　丁１−ｎ　・
　丁２）　　　　　・・・・・値　１３　〉となる。そ
のため、従来のような相関関数の周期から、ピッチ周期
を求める方法の場合、（１３）式の第３項のため、２つ
のピッチ周期を正確に求めることができない。

これに対し、本実施例では、（１２）式のピッ子信号ｐ
　（ｔ）を連立法を用いて次式（］−４＞のように予測
分析している。

ｘ　　（ｔ）　　＝ｘ　　（ｔ　　−ＴＩ）　　＋ｘ　
　（ｔ　　−１２〉−ｘ　（ｔ　−ＴＩ−Ｔ２）・・・・・・（１４）（１４）式を、２変換を用いて表わすと、−１１−１２
−丁１Ｚ　　　　−Ｚ −Ｚ−１２＋１＝０・・・・・・（１５）となり、この（１５）式を変形すれば、１）＝０・・・・・・（１６〉となる。連立法を用いて（１６）式を因数分解すると、・・・・・・（１７）となる。これより、極の位置は、半径１の円周上に角度となる。極は基本周期Ｔｌ、Ｔ２間隔で、単位円周上に
存在している。従って、これを第４図の処理により、基
本周期を発見すれは、簡単かつ正確に２つの基本周期Ｔ
ｌ、Ｔ２を求めることができる。

さらに、本実施例では、第１段及び第２段線形予測分析
部１０．１２で、ＭＥＭを用いて分析を行っているので
、常に安定な推定が行える、高い分解能が得られる、雑
音に対しても分析精度が高い等の利点がある。その上、
連立法を用いてピ・；・千周波数の算出を行っているの
で、演算処理の高速化が図れる。

なお、本発明は上記実施例に限定されず、種々の変形が
可能である。その変形例としては、例えば次のようなも
のがある。

（ａ）　　第１段及び第２段線形予測分析部１０゜１２
において、ＭＥＭ以外のパーコール分析法、線スペクト
ル対（ＬＳＰ）分析法、複合正弦波（Ｃ８Ｐ）法等とい
った他の線形予測分析法を使用してもよい。

（ｂ）　　ピッチ周波数算出部１４において、連立法以
外の他の１元高次方程式の解法を用いてもよい。

（Ｃ）　　第１図の各ブロックは、個別回路で構成する
以外に、ディジタル・シグナル・プロセッサ（ＤＳＰ＞
やマイクロプロセッサ等で実行するようにしてしよい。

さらに、本発明は、音声や機械振動音等の種々の音響信
号に適用できるばかりか、３以上の基本周期を持つピッ
チ信号に対してし、高い精度で抽出が行える。

（発明の効果）以上詳細に説明したように、本発明によれば、線形予測
分析により周波数包絡線成分を抽出し、逆フィルタリン
グを行い、得られた予測誤差信号をさらに線形予測分析
し、その予測係数からピッチ周波数を算出するようにし
ている。そのため、複数の基本周期を持つピッチ信号に
おける周波数等の特徴量を、容易に、かつ高精度で、高
速に、抽出することができる。

また、ＭＥＭを用いて線形予測分析を行うと、常に安定
な推定が行える、高い分解能が得られる、雑音に対して
も分析精度が高い等の効果がある。

さらに、連立法を用いてピッチ周波数の算出を行えば、
演算処理の高速化が期待できる。

【図面の簡単な説明】

第１図は本発明の実施例を示す特徴址抽出方法を用いた
特徴量抽出装置の機能ブロック図、第２図は模擬信号発
生過程を示す図、第３図（ａ）〜（ｄ）は第２図の波形
図、第４図は第１図のピッチ周波数算出処理を示すフロ
ーチャートである。１０．１２・・・・・・第１段、第２段線形予測分析部
、１１・・・・・・包絡線成分分析部、１３・・・・・
・最適次数判定部、１４・・・・・・ピッチ周波数算出
部、Ｓｉｎ・・・・・音響信号。

Claims

【特許請求の範囲】１、音響信号におけるピッチ信号の特徴量を抽出するピ
ッチ信号の特徴量抽出方法において、前記音響信号を、
線形予測分析法により求められた予測係数により逆フィ
ルタリングし、その逆フィルタリングにより得られた予
測誤差信号をさらに線形予測分析法により分析し、得られた最適次数における予測係数から、１元高次方程
式の解法により算出した極の角度が、前記音響信号にお
ける基本周期の整数倍であることを見いだすことにより
、ピッチ周期を求めるピッチ信号の特徴量抽出方法。２、請求項１記載のピッチ信号の特徴量抽出方法におい
て、前記線形予測分析法は最大エントロピー法を用い、前記１元高次方程式の解法は、連立法を用いるピッチ信
号の特徴量抽出方法。