JPS63155200A - ピツチ検出法 - Google Patents
ピツチ検出法Info
- Publication number
- JPS63155200A JPS63155200A JP30454386A JP30454386A JPS63155200A JP S63155200 A JPS63155200 A JP S63155200A JP 30454386 A JP30454386 A JP 30454386A JP 30454386 A JP30454386 A JP 30454386A JP S63155200 A JPS63155200 A JP S63155200A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- autocorrelation function
- point
- reference value
- maximum point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Analysing Materials By The Use Of Radiation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概要〕
自己相関関数を利用するピッチ抽出法において、ピッチ
の整数倍の点が自己相関関数の最大点に対応する時点と
成った場合に、該時点よりも短い周期を表す自己相関関
数の極大点に対応する時点がピッチと判断できるための
基準値として、該自己相関関数の最大点に対応する時点
の前後の標本点における値を与えることにより、該基準
値は音声のもつ周波数成分の違いに応じて適応的に設定
され、音声のもつ周波数成分の違いを意識することなく
基準値を設定でき、正確にピッチを検出できるようにし
たものである。
の整数倍の点が自己相関関数の最大点に対応する時点と
成った場合に、該時点よりも短い周期を表す自己相関関
数の極大点に対応する時点がピッチと判断できるための
基準値として、該自己相関関数の最大点に対応する時点
の前後の標本点における値を与えることにより、該基準
値は音声のもつ周波数成分の違いに応じて適応的に設定
され、音声のもつ周波数成分の違いを意識することなく
基準値を設定でき、正確にピッチを検出できるようにし
たものである。
本発明は音声のピッチ抽出法、特に自己相関関数法を用
いるピッチ抽出法において、自己相関関数の最大点に対
応する時点がピッチではなく、ピッチの整数倍に生じた
場合にピッチが与える自己相関関数の極大点を検出する
ピッチ検出法に関するものである。
いるピッチ抽出法において、自己相関関数の最大点に対
応する時点がピッチではなく、ピッチの整数倍に生じた
場合にピッチが与える自己相関関数の極大点を検出する
ピッチ検出法に関するものである。
ピッチは音声処理における重要なパラメータであって、
安定的に、かつ抽出誤りの少ないピッチ抽出法の確立が
強く望まれている。このため、種々の抽出法が提案され
ているが、本発明はその中にあって、自己相関関数法に
属する手法の改良を目的としている。
安定的に、かつ抽出誤りの少ないピッチ抽出法の確立が
強く望まれている。このため、種々の抽出法が提案され
ているが、本発明はその中にあって、自己相関関数法に
属する手法の改良を目的としている。
自己相関関数法におけるピッチ抽出誤りには、声道の共
振周波数であるホルマント周波数が与える自己相関関数
の極大点をピッチとする誤り、及びピッチの整数倍が与
える自己相関関数の極大点をピッチとする誤りの二つが
ある。
振周波数であるホルマント周波数が与える自己相関関数
の極大点をピッチとする誤り、及びピッチの整数倍が与
える自己相関関数の極大点をピッチとする誤りの二つが
ある。
本発明はこの二つの誤りのうち後者の誤りを補正する手
段を提供するものである。
段を提供するものである。
第7図は従来例のピッチ検出法を用いた装置の構成を示
すブロック図である。
すブロック図である。
第7図において、自己相関開数算出処理部30′で入力
端子10に入力した音声信号から自己相関関数が計算さ
れ、この出力がピッチ抽出処理部70′に入力され、ピ
ッチが抽出される。この場合量も簡単な方法は最大点を
ピッチとすることである。該ピッチ抽出処理部70′の
出力がピッチ推定処理部80に入力されるが、過去の抽
出結果から推定された値が保持されている保持レジスタ
90の出力も入力される。そして該ピッチ抽出処理部7
0′からの人力値が、該過去の抽出結果から推定された
値と大きく掛は離れていないかが調べられる。
端子10に入力した音声信号から自己相関関数が計算さ
れ、この出力がピッチ抽出処理部70′に入力され、ピ
ッチが抽出される。この場合量も簡単な方法は最大点を
ピッチとすることである。該ピッチ抽出処理部70′の
出力がピッチ推定処理部80に入力されるが、過去の抽
出結果から推定された値が保持されている保持レジスタ
90の出力も入力される。そして該ピッチ抽出処理部7
0′からの人力値が、該過去の抽出結果から推定された
値と大きく掛は離れていないかが調べられる。
掛は離れていなければ、該ピッチ抽出処理部70′から
の入力値がそのまま出力端子20と保持レジスタ90へ
転送される。掛は離れていれば、該推定値に最も近い自
己相関関数の極大点がピッチとして出力される。
の入力値がそのまま出力端子20と保持レジスタ90へ
転送される。掛は離れていれば、該推定値に最も近い自
己相関関数の極大点がピッチとして出力される。
しかしながら上述のピッチ検出法によれば、過去の抽出
結果を参照しこれを延長して推定するため、過去の抽出
結果に誤りはないという前提が必要である。この前提が
崩れた場合、現時点におけるピッチ抽出に誤りが生じる
ばかりでなく、次回以降においても誤りが連続して生じ
てしまう、即ち、過去の抽出結果を参照しなければ現時
点における誤りで済むところが、その参照によってより
悪い結果を招くこともあるという問題点があった。
結果を参照しこれを延長して推定するため、過去の抽出
結果に誤りはないという前提が必要である。この前提が
崩れた場合、現時点におけるピッチ抽出に誤りが生じる
ばかりでなく、次回以降においても誤りが連続して生じ
てしまう、即ち、過去の抽出結果を参照しなければ現時
点における誤りで済むところが、その参照によってより
悪い結果を招くこともあるという問題点があった。
上記問題点は第1図に示すように、入力音声信号を自己
相関関数算出手段30を介して自己相関関数に変換して
、その出力によりピッチを抽出する手段において、自己
相関関数算出手段30の出力が、自己相関関数の最大点
を検出し、最大点に対応する時点の前後に所定の標本点
を選び、所定の標本点に対応する自己相関関数の値を求
めて出力する標本点選択手段50、及びピッチを抽出す
るピッチ抽出論理手段70に加えられ、標本点選択手段
50で得られる出力を基準値設定手段60に加え、所定
の標本点に対応する自己相関関数の値から、ピッチに対
応する極大値を選出するための基準値を求め、この出力
をピッチ抽出論理手段70の他方の入力端子に加え、ピ
ッチを抽出するように構成した本発明のピッチ検出法に
よって解決される。
相関関数算出手段30を介して自己相関関数に変換して
、その出力によりピッチを抽出する手段において、自己
相関関数算出手段30の出力が、自己相関関数の最大点
を検出し、最大点に対応する時点の前後に所定の標本点
を選び、所定の標本点に対応する自己相関関数の値を求
めて出力する標本点選択手段50、及びピッチを抽出す
るピッチ抽出論理手段70に加えられ、標本点選択手段
50で得られる出力を基準値設定手段60に加え、所定
の標本点に対応する自己相関関数の値から、ピッチに対
応する極大値を選出するための基準値を求め、この出力
をピッチ抽出論理手段70の他方の入力端子に加え、ピ
ッチを抽出するように構成した本発明のピッチ検出法に
よって解決される。
一つの誤りが連続した誤りを引き起こすという従来の方
法における問題点を解決するためには、過去の抽出結果
を参照することなく現時点における抽出誤りを低く抑え
るより他に方法はない。
法における問題点を解決するためには、過去の抽出結果
を参照することなく現時点における抽出誤りを低く抑え
るより他に方法はない。
そこで、ピッチの整数倍における自己相関関数の極大点
の方がピッチにおけるそれよりも大きくなる原因につい
て考えると、標本化周期の整数倍とピッチとの間の誤差
が考えられる。即ち、ピッチと標本化周期の整数倍との
間の誤差と、ピッチの整数倍における同様の誤差とを比
較した時、後者の誤差の方が小さければ、ピッチの整数
倍が与える自己相関関数の極大点が最大点となることは
明らかである。その時雨極大点において、最大、標本化
周期の1/2に対応する値の差が生じる。その分の誤差
は標本化による誤差として無視しなければならない。即
ち、この差以内にある極大点は最大点と同等としなけれ
ばならない。しかし実際には、1/2の標本化周期に対
応する値の差は、これを取り出すことが出来ない。
の方がピッチにおけるそれよりも大きくなる原因につい
て考えると、標本化周期の整数倍とピッチとの間の誤差
が考えられる。即ち、ピッチと標本化周期の整数倍との
間の誤差と、ピッチの整数倍における同様の誤差とを比
較した時、後者の誤差の方が小さければ、ピッチの整数
倍が与える自己相関関数の極大点が最大点となることは
明らかである。その時雨極大点において、最大、標本化
周期の1/2に対応する値の差が生じる。その分の誤差
は標本化による誤差として無視しなければならない。即
ち、この差以内にある極大点は最大点と同等としなけれ
ばならない。しかし実際には、1/2の標本化周期に対
応する値の差は、これを取り出すことが出来ない。
そこで、若干の波形変動、ピッチ変動、その他の誤差を
考慮してこれを下回る値として例えば1標本化周期分の
差を認め、最大点に対応する時点に最も近い前後の標本
点における値を基準値とした。即ち、第1図において、
標本点選択手段50において自己相関関数の最大値を検
出し、その前後の標本点を選択する。この標本点に対応
する自己相関関数を求める。この出力を基準値設定手段
60に加え基準値を求める。この基準値は、自己相関関
数が実際の音声においては非対象となることが多いこと
から、そのいずれか大きい方、あるいは小さい方、ある
いはその平均値から選ばれる。
考慮してこれを下回る値として例えば1標本化周期分の
差を認め、最大点に対応する時点に最も近い前後の標本
点における値を基準値とした。即ち、第1図において、
標本点選択手段50において自己相関関数の最大値を検
出し、その前後の標本点を選択する。この標本点に対応
する自己相関関数を求める。この出力を基準値設定手段
60に加え基準値を求める。この基準値は、自己相関関
数が実際の音声においては非対象となることが多いこと
から、そのいずれか大きい方、あるいは小さい方、ある
いはその平均値から選ばれる。
このようにして基準値を定めた時、この基準値を上回る
自己相関関数の極大点は最大点と同等とみなすことが出
来る。
自己相関関数の極大点は最大点と同等とみなすことが出
来る。
したがって、自己相関関数の最大点をピッチと判定する
自己相関関数法におけるピッチ抽出の基本条件から、最
大点が表す周期以内の極大点においてこの基準値を越え
る点があれば、その点はピッチであると判断でき、なけ
ればその最大点がピッチと判断することが出来る。ただ
し、これは自己相関関数の最大点をピッチと判定する抽
出論理を採用した場合に限っての判断である。
自己相関関数法におけるピッチ抽出の基本条件から、最
大点が表す周期以内の極大点においてこの基準値を越え
る点があれば、その点はピッチであると判断でき、なけ
ればその最大点がピッチと判断することが出来る。ただ
し、これは自己相関関数の最大点をピッチと判定する抽
出論理を採用した場合に限っての判断である。
このようにして該基準値を用いれば、過去の抽出結果を
参照することなく、ピッチの整数倍をピッチと判定する
誤りを防ぐことが出来る。
参照することなく、ピッチの整数倍をピッチと判定する
誤りを防ぐことが出来る。
第2図は本発明の第一の実施例のピッチ検出法を用いた
装置の構成を示すブロック図である。
装置の構成を示すブロック図である。
第3図は本発明を説明する図である。
第4図は本発明の実施例により得られる波形図である。
(低ピツチの場合)。
第5図は本発明の実施例により得られる波形図である。
(高ピツチの場合)。
第6図は本発明の第二の実施例のピッチ検出法を用いた
装置の構成を示すブロック図である。
装置の構成を示すブロック図である。
第4図、第5図において横軸は時間、縦軸は入力音声信
号波形の場合には電圧を示し、自己相関関数の波形の場
合は無次元である。
号波形の場合には電圧を示し、自己相関関数の波形の場
合は無次元である。
全図を通じて同一符号は同一対象物を示す。
第2図の第一の実施例においては、自己相関関数の最大
点に対応する時点をピッチと判定するだけの簡単な抽出
論理を採用している。
点に対応する時点をピッチと判定するだけの簡単な抽出
論理を採用している。
第2図において、入力端子10より入力した音声信号の
自己相関関数R(i)(i=1〜M)が自己相関関数算
出処理部30′で求められ、記憶袋W40に記憶される
。
自己相関関数R(i)(i=1〜M)が自己相関関数算
出処理部30′で求められ、記憶袋W40に記憶される
。
標本点選択処理部50′は、記憶装置40から自己相関
関数を読み出し、その最大点R(N)を抽出し、その最
大点i=Nの前後のil =N 1、iユ =N+
1を決定する(第3図参照)。標本点11 、iユ
の値を基準値設定処理部60′に加えることにより、例
えばAMAXA = (R(iL) + R(ia))
/ 2で与えられる基準値が計算される。上記基準値
は、ピッチ抽出処理部70′に加えられる。
関数を読み出し、その最大点R(N)を抽出し、その最
大点i=Nの前後のil =N 1、iユ =N+
1を決定する(第3図参照)。標本点11 、iユ
の値を基準値設定処理部60′に加えることにより、例
えばAMAXA = (R(iL) + R(ia))
/ 2で与えられる基準値が計算される。上記基準値
は、ピッチ抽出処理部70′に加えられる。
ピッチ抽出処理部70′は、例えば自己相関関数の最大
点をピッチと判定する論理回路ならば、最大点に=N以
下の点、即ち3<Nの点において、R(4) >AM
^X^となる極大点があれば、この点を最大点と同等の
資格ありと判定してここをピッチと定める。
点をピッチと判定する論理回路ならば、最大点に=N以
下の点、即ち3<Nの点において、R(4) >AM
^X^となる極大点があれば、この点を最大点と同等の
資格ありと判定してここをピッチと定める。
第6図は第二の実施例の構成を示している示、動作原理
は上記の第一の実施例の場合と同様にして説明される。
は上記の第一の実施例の場合と同様にして説明される。
要は、自己相関関数の最大点の前後の標本点における自
己相関関数の値を用いて判定基準値を設定し、これを上
回る自己相関関数の極大点は最大点と同等と見なして処
理する構成であればよい。
己相関関数の値を用いて判定基準値を設定し、これを上
回る自己相関関数の極大点は最大点と同等と見なして処
理する構成であればよい。
第2図、第6図以外にも上述の内容を満たす構成は得ら
れる。
れる。
次にこれらを波形を用いて説明する。
第4図、及び第5図において(a) 、(b) 、(c
)、(d)は時間的にこの順序に連続した波形を表して
いる。又、丸く点線で示した部分は最大点であり、実線
はピッチである。この例において、自己相関関数の最大
点の前後の標本点により与えられた基準値を越える最も
短い周期を表す極大点は、ピッチであると判定される。
)、(d)は時間的にこの順序に連続した波形を表して
いる。又、丸く点線で示した部分は最大点であり、実線
はピッチである。この例において、自己相関関数の最大
点の前後の標本点により与えられた基準値を越える最も
短い周期を表す極大点は、ピッチであると判定される。
第5図は高い周波数成分を含む音声における例であるが
、この場合低い周波数成分から成る音声(第4図)と比
べて波形の変化が急峻なため、基準値が適応的に低くな
って、ピッチを表す極大点がピッチとして検出されるよ
うになっている。低くなってはいても、第5図(c)に
示すように本発明が与える基準値は、ホルマント周波数
が与える鋭い極大点を上回っているためピッチとして誤
って抽出することはない。
、この場合低い周波数成分から成る音声(第4図)と比
べて波形の変化が急峻なため、基準値が適応的に低くな
って、ピッチを表す極大点がピッチとして検出されるよ
うになっている。低くなってはいても、第5図(c)に
示すように本発明が与える基準値は、ホルマント周波数
が与える鋭い極大点を上回っているためピッチとして誤
って抽出することはない。
又、第4図の例では、逆に基準値が第5図の場合に比べ
て高くなって、ピッチの前にあるホルマント周波数が与
える極大点をピッチとする誤りは生じていない。
て高くなって、ピッチの前にあるホルマント周波数が与
える極大点をピッチとする誤りは生じていない。
以上説明のように本発明のピッチ検出法によれば、ピッ
チの整数倍の点が自己相関関数の最大点となっても、前
回の検出結果を参照することなくピッチの検出が可能と
なり、又標本化周期が与える誤差を吸収してピッチを抽
出することができる。
チの整数倍の点が自己相関関数の最大点となっても、前
回の検出結果を参照することなくピッチの検出が可能と
なり、又標本化周期が与える誤差を吸収してピッチを抽
出することができる。
更に、音声の周波数成分に応じて基準値が上下するので
、音声の持つ周波数成分の違いを意識する必要がなく、
抽出誤りは次回以降の抽出に波及しないという効果があ
る。
、音声の持つ周波数成分の違いを意識する必要がなく、
抽出誤りは次回以降の抽出に波及しないという効果があ
る。
第1図は本発明のピッチ検出法を説明する原理ブロック
図、 第2図は本発明の第一の実施例のピッチ検出法を用いた
装置の構成を示すブロック図、第3図は本発明を説明す
る図、 第4図は本発明の実施例により得られる波形図(低ピツ
チの場合)、 第5図は本発明の実施例により得られる波形図(高ピッ
チの場合)、 第6図は本発明の第二の実施例のピッチ検出法を用いた
装置の構成を示すブロック図、第7図は従来例のピッチ
検出法を用いた装置の構成を示すブロック図である。 図において 10は入力端子、20は出力端子、 30は自己相関関数算出手段、 30′は自己相関関数算出処理部、 40は記憶装置、 50は標本点選択手段、50′は標本点選択処理部、6
0は基準値設定手段、60′は基準値設定処理部、70
はピッチ抽出論理手段、 70′はピッチ抽出処理部、 80はピッチ推定処理部、 90は保持レジスタ を示す。 ン o 0 0(+)
自己相関閉包/)7皮汁ニ9 爪杷朔のに先例1:、F・ノ傅ヤrろ液拒反鵠 42 (LAご一汁の鳩舎) ピ・シ+1−文づ′rこ <1) 自乙指関関贅の5反形図 ネあ明の文兇像11;よ“ノ得られ 第 5 図
図、 第2図は本発明の第一の実施例のピッチ検出法を用いた
装置の構成を示すブロック図、第3図は本発明を説明す
る図、 第4図は本発明の実施例により得られる波形図(低ピツ
チの場合)、 第5図は本発明の実施例により得られる波形図(高ピッ
チの場合)、 第6図は本発明の第二の実施例のピッチ検出法を用いた
装置の構成を示すブロック図、第7図は従来例のピッチ
検出法を用いた装置の構成を示すブロック図である。 図において 10は入力端子、20は出力端子、 30は自己相関関数算出手段、 30′は自己相関関数算出処理部、 40は記憶装置、 50は標本点選択手段、50′は標本点選択処理部、6
0は基準値設定手段、60′は基準値設定処理部、70
はピッチ抽出論理手段、 70′はピッチ抽出処理部、 80はピッチ推定処理部、 90は保持レジスタ を示す。 ン o 0 0(+)
自己相関閉包/)7皮汁ニ9 爪杷朔のに先例1:、F・ノ傅ヤrろ液拒反鵠 42 (LAご一汁の鳩舎) ピ・シ+1−文づ′rこ <1) 自乙指関関贅の5反形図 ネあ明の文兇像11;よ“ノ得られ 第 5 図
Claims (2)
- (1)入力音声信号を自己相関関数算出手段(30)を
介して自己相関関数に変換して、その出力によりピッチ
を抽出する手段において、 該自己相関関数算出手段(30)の出力が、該自己相関
関数の最大点を検出し、該最大点に対応する時点の前後
に所定の標本点を選び、該所定の標本点に対応する自己
相関関数の値を求めて出力する標本点選択手段(50)
、及びピッチを抽出するピッチ抽出論理手段(70)に
加えられ、 該標本点選択手段(50)で得られる出力を基準値設定
手段(60)に加え、該所定の標本点に対応する自己相
関関数の値から、ピッチに対応する極大値を選出するた
めの基準値を求め、この出力を該ピッチ抽出論理手段(
70)の他方の入力端子に加え、ピッチを抽出するよう
に構成したことを特徴とするピッチ検出法。 - (2)前記基準値を、該最大点に対応する時点に最も近
い前後の標本点における自己相関関数の値の平均値を以
てすることを特徴とする特許請求の範囲第1項記載のピ
ッチ検出法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP30454386A JPS63155200A (ja) | 1986-12-19 | 1986-12-19 | ピツチ検出法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP30454386A JPS63155200A (ja) | 1986-12-19 | 1986-12-19 | ピツチ検出法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS63155200A true JPS63155200A (ja) | 1988-06-28 |
Family
ID=17934266
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP30454386A Pending JPS63155200A (ja) | 1986-12-19 | 1986-12-19 | ピツチ検出法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS63155200A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5388230A (en) * | 1988-06-23 | 1995-02-07 | Hitachi, Ltd. | Parallel processor having multi-processing units either connected or bypassed in either series or parallel by the use of bus switching |
| EP2816558A1 (en) | 2013-06-17 | 2014-12-24 | Fujitsu Limited | Speech processing device and method |
-
1986
- 1986-12-19 JP JP30454386A patent/JPS63155200A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5388230A (en) * | 1988-06-23 | 1995-02-07 | Hitachi, Ltd. | Parallel processor having multi-processing units either connected or bypassed in either series or parallel by the use of bus switching |
| EP2816558A1 (en) | 2013-06-17 | 2014-12-24 | Fujitsu Limited | Speech processing device and method |
| US9672809B2 (en) | 2013-06-17 | 2017-06-06 | Fujitsu Limited | Speech processing device and method |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0092611B1 (en) | Speech analysis system | |
| JPS63155200A (ja) | ピツチ検出法 | |
| EP0092612A1 (en) | Speech analysis system | |
| US20050110903A1 (en) | Data slicer circuit | |
| US4780789A (en) | Method for generating circuit-breaking signals | |
| JPH0533342B2 (ja) | ||
| JPS628200A (ja) | 音声分析方式 | |
| JPS62237498A (ja) | 音声区間検出方法 | |
| JPH05119070A (ja) | デイジタルオシロスコープ | |
| JPS61259296A (ja) | 音声区間検出方式 | |
| JPS60101598A (ja) | 音声区間検出装置 | |
| JPS63110858A (ja) | リンガ検出装置 | |
| JPS622300A (ja) | 音声ピツチ抽出装置 | |
| JPS60201400A (ja) | 音声スペクトルの2値化装置 | |
| JPH0383100A (ja) | 音声区間の検出装置 | |
| JPH01233497A (ja) | ピッチ抽出装置 | |
| JP2574233B2 (ja) | ピッチ抽出方法 | |
| JPH04296650A (ja) | 分析計用データ処理装置 | |
| JPS62258499A (ja) | 音声開始時点検知方法 | |
| JPH0552956B2 (ja) | ||
| JPS63155100A (ja) | ホルマントが与える自己相関関数の極大点検出方法 | |
| JPS60216399A (ja) | 音声認識装置における音声区間検出回路 | |
| JPS61173598A (ja) | 画像信号処理装置 | |
| JPS63155197A (ja) | 無声音検出方法 | |
| JPS60191300A (ja) | 音声区間検出回路 |