JPS6214839B2 - - Google Patents
Info
- Publication number
- JPS6214839B2 JPS6214839B2 JP54118972A JP11897279A JPS6214839B2 JP S6214839 B2 JPS6214839 B2 JP S6214839B2 JP 54118972 A JP54118972 A JP 54118972A JP 11897279 A JP11897279 A JP 11897279A JP S6214839 B2 JPS6214839 B2 JP S6214839B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- voiced
- period
- pitch period
- search range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000000605 extraction Methods 0.000 claims description 15
- 238000001514 detection method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000000034 method Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000001052 transient effect Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 4
- 230000007547 defect Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 230000001788 irregular Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
【発明の詳細な説明】
本発明は音声波形をピツチ周期程度のフレーム
周期で分析して得られる自己相関係数に基づいて
前記音声波形のピツチ抽出を行なうピツチ抽出方
法に関し、殊に聴覚的に重要な有声音連続部にお
けるピツチ抽出誤りを大幅に減少し得るピツチ抽
出方法に係るものである。
周期で分析して得られる自己相関係数に基づいて
前記音声波形のピツチ抽出を行なうピツチ抽出方
法に関し、殊に聴覚的に重要な有声音連続部にお
けるピツチ抽出誤りを大幅に減少し得るピツチ抽
出方法に係るものである。
音声波形における有声音部分は周期的な繰り返
し波形を持ちその周期(ピツチ周期)の変化特性
は音声の分析合成、認識等における重要なパラメ
ータであることが知られている。例えば、音声の
分析合成系においては分析部で抽出されるピツチ
抽出結果が合成部において合成される合成音の品
質に大きな影響を及ぼす。
し波形を持ちその周期(ピツチ周期)の変化特性
は音声の分析合成、認識等における重要なパラメ
ータであることが知られている。例えば、音声の
分析合成系においては分析部で抽出されるピツチ
抽出結果が合成部において合成される合成音の品
質に大きな影響を及ぼす。
音声波形のピツチ周期の抽出方法としては、従
来、ピツチ周期程度の時間長を持つフレーム毎に
自己相関係数を算出し抽出する方法等、種々の分
析パラメータを用いる方法が知られている。
来、ピツチ周期程度の時間長を持つフレーム毎に
自己相関係数を算出し抽出する方法等、種々の分
析パラメータを用いる方法が知られている。
自己相関係数に基づくピツチ抽出法は、自己相
関係数が時間領域内の処理で求め得る点と、被分
析波形とフレームとの位相の影響が比較的に小さ
い点とから広く用いられる。しかしながら自己相
関係数に基づくピツチ抽出法は、後述するように
ピツチ周期の整数倍、又はピツチ周期のN1/N2
倍の周期をピツチ周期として誤つて検出すること
が多いという欠点を有している。(但しN1,N2は
整数であり、N1<N2である)。前記欠点の発生す
る被分析波形を、その波形形状から分類すると、
いわゆる有声音定常部と語頭等の有声音過渡部と
に大別される。
関係数が時間領域内の処理で求め得る点と、被分
析波形とフレームとの位相の影響が比較的に小さ
い点とから広く用いられる。しかしながら自己相
関係数に基づくピツチ抽出法は、後述するように
ピツチ周期の整数倍、又はピツチ周期のN1/N2
倍の周期をピツチ周期として誤つて検出すること
が多いという欠点を有している。(但しN1,N2は
整数であり、N1<N2である)。前記欠点の発生す
る被分析波形を、その波形形状から分類すると、
いわゆる有声音定常部と語頭等の有声音過渡部と
に大別される。
有声音定常部に前記欠点が発生する一つの原因
は被分析波形の定常性が著しく強いことである。
なぜならば、いわゆる有声音定常部は、例えば数
百mSEC程度の比較的に長時間について観察する
ならば、そのピツチ周期を一単位とする波形素片
は、ピツチ周期、波形素片共に、除々に変化して
いることを認められている。しかし、有声音定常
部の種々のセグメントについて、フレーム周期毎
に切出される波形の時間長(例えば30mSEC)程
度の比較的に短時間に限定して観察すると、その
波形は、ほぼ完全な定常性、すなわち周期性を示
すことがしばしばある。例えば正弦波の自己相関
係数波形が前記正弦波と同一周期を有する余弦波
となる等、よく知られている様に、定常性、すな
わち周期性を有する波形の自己相関係数波形は周
期性を有する。従つてフレーム周期毎に例えば
30mSEC程度の時間長で切り出される波形がほぼ
完全な定常性すなわち周期性を示す場合には、そ
の自己相関係数波形は、ほぼ完全な周期性を示
す。故に例えば第1図に示す様にピツチ周期にお
ける自己相関係数の極大値101と倍ピツチ周期
における極大値102とがほとんど等しくなり、
演算精度や、わずかな外乱等の影響でピツチ周期
における極大値101よりも倍ピツチ周期におけ
る極大値102が大きくなることが頻繁に発生す
るからである。
は被分析波形の定常性が著しく強いことである。
なぜならば、いわゆる有声音定常部は、例えば数
百mSEC程度の比較的に長時間について観察する
ならば、そのピツチ周期を一単位とする波形素片
は、ピツチ周期、波形素片共に、除々に変化して
いることを認められている。しかし、有声音定常
部の種々のセグメントについて、フレーム周期毎
に切出される波形の時間長(例えば30mSEC)程
度の比較的に短時間に限定して観察すると、その
波形は、ほぼ完全な定常性、すなわち周期性を示
すことがしばしばある。例えば正弦波の自己相関
係数波形が前記正弦波と同一周期を有する余弦波
となる等、よく知られている様に、定常性、すな
わち周期性を有する波形の自己相関係数波形は周
期性を有する。従つてフレーム周期毎に例えば
30mSEC程度の時間長で切り出される波形がほぼ
完全な定常性すなわち周期性を示す場合には、そ
の自己相関係数波形は、ほぼ完全な周期性を示
す。故に例えば第1図に示す様にピツチ周期にお
ける自己相関係数の極大値101と倍ピツチ周期
における極大値102とがほとんど等しくなり、
演算精度や、わずかな外乱等の影響でピツチ周期
における極大値101よりも倍ピツチ周期におけ
る極大値102が大きくなることが頻繁に発生す
るからである。
有声音定常部に前記欠点が発生する他の原因は
被分析波形の発声者において、例えば第1ホルマ
ントの帯域巾が狭く、更に第1ホルマントの中心
周波数がピツチ周波数(ピツチ周期の逆数)の2
倍等の整数倍の場合に、ピツチ周波数の例えば第
2高調波が第1ホルマントと共振し、ピツチ周波
数の2倍の周波数成分が極端に強調され被分析波
形の基本周波数が、あたかもピツチ周波数の2倍
となることに起因する。ピツチ周波数の2倍の周
波数成分が極端に強調された被分析波形の見かけ
上の周期、すなわち見かけ上の基本周波数の逆数
が本来のピツチ周期の1/2になると、被分析波形
の自己相関係数波形は本来のピツチ周期の1/2の
周期で周期性を示す。故に例えば第2図に示す様
に、ホルマントとピツチとの共振により出現する
自己相関係数の極大値201と本来のピツチ周期
における極大値202とがほとんど等しくなりピ
ツチ周期の誤検出の原因となる。
被分析波形の発声者において、例えば第1ホルマ
ントの帯域巾が狭く、更に第1ホルマントの中心
周波数がピツチ周波数(ピツチ周期の逆数)の2
倍等の整数倍の場合に、ピツチ周波数の例えば第
2高調波が第1ホルマントと共振し、ピツチ周波
数の2倍の周波数成分が極端に強調され被分析波
形の基本周波数が、あたかもピツチ周波数の2倍
となることに起因する。ピツチ周波数の2倍の周
波数成分が極端に強調された被分析波形の見かけ
上の周期、すなわち見かけ上の基本周波数の逆数
が本来のピツチ周期の1/2になると、被分析波形
の自己相関係数波形は本来のピツチ周期の1/2の
周期で周期性を示す。故に例えば第2図に示す様
に、ホルマントとピツチとの共振により出現する
自己相関係数の極大値201と本来のピツチ周期
における極大値202とがほとんど等しくなりピ
ツチ周期の誤検出の原因となる。
有声音過渡部に前記欠点が発生する原因は、有
声音過渡部はピツチ周期及び音声波形の形状の変
化が大きく、かつ比較的に不規則なことに起因す
る。ピツチ周期及び音声波形の形状の変化が大き
く、かつ比較的に不規則な被分析波形の自己相関
係数波形は多くの場合にピツチ周期による大まか
な周期性は認められるが、ピツチ周期又はピツチ
周期の整数倍の周期における自己相関係数の極大
値が比較的に不揃いとなり、しばしばピツチ周期
における自己相関係数の極大値がピツチ周期の整
数倍周期における極大値より小さくなり、いわゆ
る整数倍ピツチ周期エラーが多く起る。
声音過渡部はピツチ周期及び音声波形の形状の変
化が大きく、かつ比較的に不規則なことに起因す
る。ピツチ周期及び音声波形の形状の変化が大き
く、かつ比較的に不規則な被分析波形の自己相関
係数波形は多くの場合にピツチ周期による大まか
な周期性は認められるが、ピツチ周期又はピツチ
周期の整数倍の周期における自己相関係数の極大
値が比較的に不揃いとなり、しばしばピツチ周期
における自己相関係数の極大値がピツチ周期の整
数倍周期における極大値より小さくなり、いわゆ
る整数倍ピツチ周期エラーが多く起る。
なお、有声音過渡部は一般にピツチ周波数の変
化が大きく、ピツチ周波数の高周波とホルマント
周波数との共振による音声波形への影響は、有声
音定常部における影響と比較すると小さく、有声
音過渡部におけるいわゆるホルマントピツチエラ
ーの発生頻度は有声音定常部における発生頻度よ
り小さい。
化が大きく、ピツチ周波数の高周波とホルマント
周波数との共振による音声波形への影響は、有声
音定常部における影響と比較すると小さく、有声
音過渡部におけるいわゆるホルマントピツチエラ
ーの発生頻度は有声音定常部における発生頻度よ
り小さい。
ピツチ検出エラーの影響が音声分析合成系にお
ける合成音の品質に与える影響は、聴覚的には、
有声音定常部におけるエラーが大きく、有声音過
渡部におけるエラーの影響は比較的に軽微であ
る。
ける合成音の品質に与える影響は、聴覚的には、
有声音定常部におけるエラーが大きく、有声音過
渡部におけるエラーの影響は比較的に軽微であ
る。
従来、特に合成音の品質に大きな影響を与える
有声音定常部におけるピツチ検出エラーを軽減な
いし除去するために、種々の方法が試みられてい
る。しかしながら従来の方法は有声音の定常部と
語頭等の過渡部とを一率に扱つていたために、例
えば語頭において、たまたまピツチ検出誤りが発
生すると、前記ピツチ検出誤りが将来のピツチ検
出特性に悪影響を及ぼすという欠点を有してい
る。
有声音定常部におけるピツチ検出エラーを軽減な
いし除去するために、種々の方法が試みられてい
る。しかしながら従来の方法は有声音の定常部と
語頭等の過渡部とを一率に扱つていたために、例
えば語頭において、たまたまピツチ検出誤りが発
生すると、前記ピツチ検出誤りが将来のピツチ検
出特性に悪影響を及ぼすという欠点を有してい
る。
従来の方法として、例えば音声のピツチ周期の
変化が比較的にゆるやかであることを利用して相
隣るフレームにおけるピツチ周期の差分を、あら
かじめ定められた範囲内に限定してピツチ周期の
抽出を行なうことによりピツチ周期の検出誤りを
防ぐ方法が知られている。しかしながら、この様
に検索範囲内に制限する方法、例えば第3図に示
すように基本ピツチ周期の曲線301上から検出
誤り等のため一度例えば2倍のピツチ周期を持つ
倍ピツチ周期曲線302上のいわゆる倍ピツチ周
期を検出してしまうと、再び正しい基本ピツチ周
期を検出することが困難となる欠点を持つている
特にいわゆる語頭等の無音部から有声音部に移行
する場合、あるいは無声音部から有声音部に移行
する場合には前記倍ピツチ周期を誤つて検出する
危険性が大きい。
変化が比較的にゆるやかであることを利用して相
隣るフレームにおけるピツチ周期の差分を、あら
かじめ定められた範囲内に限定してピツチ周期の
抽出を行なうことによりピツチ周期の検出誤りを
防ぐ方法が知られている。しかしながら、この様
に検索範囲内に制限する方法、例えば第3図に示
すように基本ピツチ周期の曲線301上から検出
誤り等のため一度例えば2倍のピツチ周期を持つ
倍ピツチ周期曲線302上のいわゆる倍ピツチ周
期を検出してしまうと、再び正しい基本ピツチ周
期を検出することが困難となる欠点を持つている
特にいわゆる語頭等の無音部から有声音部に移行
する場合、あるいは無声音部から有声音部に移行
する場合には前記倍ピツチ周期を誤つて検出する
危険性が大きい。
前記欠点を緩和するために、過去数フレームで
検出されたピツチ周期からピツチの検索範囲を決
定する場合には、いわゆる語頭におけるピツチの
検索範囲の決定が困難であるという欠点を有して
いた。
検出されたピツチ周期からピツチの検索範囲を決
定する場合には、いわゆる語頭におけるピツチの
検索範囲の決定が困難であるという欠点を有して
いた。
本発明の目的は自己相関係数に基づいてピツチ
抽出を行なうピツチ抽出方法において、ピツチ周
期の検出誤りを防止し、より確実に正しいピツチ
の検出を可能とするピツチ抽出方法を提供するこ
とにある。
抽出を行なうピツチ抽出方法において、ピツチ周
期の検出誤りを防止し、より確実に正しいピツチ
の検出を可能とするピツチ抽出方法を提供するこ
とにある。
一般にピツチ周波数即ちピツチ周期の逆数は、
その時間的変化が例えば第4図に示す様に“へ”
の字を示すことが実験的に知られている。従つて
語頭部分のピツチ周期の分布範囲は全有声音部の
ピツチ周期の分布範囲よりも狭い。故に語頭部分
におけるピツチ周期の検索範囲を可能な限り狭く
し、語頭部分におけるピツチ検出エラーを極力減
少することにより、語頭に相隣る有声音定常部の
ピツチ検索範囲を語頭におけるピツチ周期の近傍
に制限し、前記有声音定常部のピツチ抽出エラー
を減少し得る。
その時間的変化が例えば第4図に示す様に“へ”
の字を示すことが実験的に知られている。従つて
語頭部分のピツチ周期の分布範囲は全有声音部の
ピツチ周期の分布範囲よりも狭い。故に語頭部分
におけるピツチ周期の検索範囲を可能な限り狭く
し、語頭部分におけるピツチ検出エラーを極力減
少することにより、語頭に相隣る有声音定常部の
ピツチ検索範囲を語頭におけるピツチ周期の近傍
に制限し、前記有声音定常部のピツチ抽出エラー
を減少し得る。
本発明はピツチ周期の検索範囲の初期値を設け
更にピツチ周期の検索範囲を過去のフレームにお
いて検出れたピツチ周期の近傍に制限してピツチ
周期の検索を行なう手段により構成され、有声音
語頭部分については、ピツチ周期の検索範囲を初
期値により決定し、有声音定常部についてはピツ
チ周期の検索範囲を過去のフレームにおいて検出
されたピツチ周期の近傍に制限してピツチ周期の
検索を行なうことを特徴とするピツチ抽出方法が
得られる。
更にピツチ周期の検索範囲を過去のフレームにお
いて検出れたピツチ周期の近傍に制限してピツチ
周期の検索を行なう手段により構成され、有声音
語頭部分については、ピツチ周期の検索範囲を初
期値により決定し、有声音定常部についてはピツ
チ周期の検索範囲を過去のフレームにおいて検出
されたピツチ周期の近傍に制限してピツチ周期の
検索を行なうことを特徴とするピツチ抽出方法が
得られる。
次に本発明の実施例を図面を参照して説明す
る。
る。
第5図は本発明の実施例を説明するためのブロ
ツク図である。第5図において一点鎖線512で
囲んだ部分は本発明の構成を示す。波形入力端子
501を介して高域周波数を除去された音声波形
入力信号がA/D変換器502へ入力される。
ツク図である。第5図において一点鎖線512で
囲んだ部分は本発明の構成を示す。波形入力端子
501を介して高域周波数を除去された音声波形
入力信号がA/D変換器502へ入力される。
A/D変換器502は前記音声波形入力信号に
含まれる最高周波数成分の2倍以上の周波数で前
記音声波形入力信号を標本化し、更に量子化して
標本化音声波形信号を発生し、前記標本化音声波
形信号を一時記憶器503へ出力する。
含まれる最高周波数成分の2倍以上の周波数で前
記音声波形入力信号を標本化し、更に量子化して
標本化音声波形信号を発生し、前記標本化音声波
形信号を一時記憶器503へ出力する。
一時記憶器503は前記標本化音声波形信号を
一時的に記憶し、フレーム周期毎に前記標本化音
声波形信号を有声無声判定器508と自己相関係
数計測器504とへ出力する。有声無声判定器5
08はフレーム毎に切り出される標本化音声波形
信号を一般によく知られている種々の有声音/無
声音判別手段により有声音と無声音とに分類す
る。なお、前記無声音は無音を含む。
一時的に記憶し、フレーム周期毎に前記標本化音
声波形信号を有声無声判定器508と自己相関係
数計測器504とへ出力する。有声無声判定器5
08はフレーム毎に切り出される標本化音声波形
信号を一般によく知られている種々の有声音/無
声音判別手段により有声音と無声音とに分類す
る。なお、前記無声音は無音を含む。
更に有声無声判定器508は前記分類結果を有
声無声信号としてピツチ検索範囲計測器509へ
出力する。自己相関係数計測器504は一時記憶
器503からフレーム周期毎に供給される標本化
音声波形信号から自己相関係数列を計測し、前記
自己相関係数列を自己相関係数伝送路505を介
してピツチ検索器506へ出力する。
声無声信号としてピツチ検索範囲計測器509へ
出力する。自己相関係数計測器504は一時記憶
器503からフレーム周期毎に供給される標本化
音声波形信号から自己相関係数列を計測し、前記
自己相関係数列を自己相関係数伝送路505を介
してピツチ検索器506へ出力する。
ピツチ検索器506は自己相関係数伝送路50
5を介して供給された自己相関係数列から、検索
範囲データ伝送路507を介して供給されるピツ
チ周期検索範囲データに基づいて、ピツチ周期検
索範囲内での自己相関係数の最大値を検索すると
ともに、前記最大値に対応する自己相関係数の遅
れ時間をピツチ周期データとしてピツチ検索範囲
計測器509へ供給し、更に前記ピツチ周期デー
タをピツチ周期データ出力端子511へ出力す
る。
5を介して供給された自己相関係数列から、検索
範囲データ伝送路507を介して供給されるピツ
チ周期検索範囲データに基づいて、ピツチ周期検
索範囲内での自己相関係数の最大値を検索すると
ともに、前記最大値に対応する自己相関係数の遅
れ時間をピツチ周期データとしてピツチ検索範囲
計測器509へ供給し、更に前記ピツチ周期デー
タをピツチ周期データ出力端子511へ出力す
る。
ピツチ検索範囲計測器509は有声無声判別器
508より供給される有声無声信号に基づいて有
声音語頭部分と有声音定常部とを判別し、有声音
語頭部分についてはピツチ検索範囲初期値記憶器
510より供給されるピツチ検索範囲初期値をピ
ツチ周期検索範囲データとして、又、有声音定常
部についてはピツチ検索器506より供給される
ピツチ周期データに基づいて、前記ピツチ周期デ
ータの近傍をピツチ周期検索範囲データとして、
前記ピツチ周期検索範囲データを検索範囲データ
伝送路507を介してピツチ検索器506へ出力
する。
508より供給される有声無声信号に基づいて有
声音語頭部分と有声音定常部とを判別し、有声音
語頭部分についてはピツチ検索範囲初期値記憶器
510より供給されるピツチ検索範囲初期値をピ
ツチ周期検索範囲データとして、又、有声音定常
部についてはピツチ検索器506より供給される
ピツチ周期データに基づいて、前記ピツチ周期デ
ータの近傍をピツチ周期検索範囲データとして、
前記ピツチ周期検索範囲データを検索範囲データ
伝送路507を介してピツチ検索器506へ出力
する。
次に図面を参照してピツチ検索範囲計測器50
9を詳細に説明する。
9を詳細に説明する。
第6図はピツチ検索範囲計測器509を詳細に
説明するためのブロツク図である。有声無声信号
入力端子601を介して有声無声信号がシフトレ
ジスタ602へ供給される。なお、前記有声無声
信号は有声時には論理的“1”に無声時には論理
的に“0”に設定されている。前記有声無声信号
はフレーム周期毎に供給され、又シフトレジスタ
602はフレーム周期毎に有声無声信号入力端子
601から供給された有声無声信号がレジスタセ
ル6021へ、レジスタセル6021に記憶され
ていたデータがレジスタセル6022へと転送さ
れる。NORゲート603はシフトレジスタ60
2の全レジスタセル、即ち6021,6022,
…6023,…,6024が“0”のときのみ
SET信号をフリツプフロツプ605へ出力す
る。
説明するためのブロツク図である。有声無声信号
入力端子601を介して有声無声信号がシフトレ
ジスタ602へ供給される。なお、前記有声無声
信号は有声時には論理的“1”に無声時には論理
的に“0”に設定されている。前記有声無声信号
はフレーム周期毎に供給され、又シフトレジスタ
602はフレーム周期毎に有声無声信号入力端子
601から供給された有声無声信号がレジスタセ
ル6021へ、レジスタセル6021に記憶され
ていたデータがレジスタセル6022へと転送さ
れる。NORゲート603はシフトレジスタ60
2の全レジスタセル、即ち6021,6022,
…6023,…,6024が“0”のときのみ
SET信号をフリツプフロツプ605へ出力す
る。
なお、シフトレジスタ602の全レジスタセル
が“0”のときには、例えばシフトレジスタ60
2の段数を10段、フレーム周期を30mSECとして
300mSEC間連続して無声音であることを示し、
ピツチ抽出の見地からは音声ポーズと見ることが
できる。
が“0”のときには、例えばシフトレジスタ60
2の段数を10段、フレーム周期を30mSECとして
300mSEC間連続して無声音であることを示し、
ピツチ抽出の見地からは音声ポーズと見ることが
できる。
ANDゲート604はシフトレジスタ602の
レジスタセル6021,6022,…,6023
が全て“1”のときのみRESET信号をフリツプ
フロツプ605へ出力する。なお、シフトレジス
タ602のレジスタセル6021,6022,
…,6023が全て“1”のときには、例えばシ
フトレジスタ602のレジスタセル6021から
6023までの段数を4段フレーム周期を
30mSECとして120mSEC間連続して有声音であ
ることを示し、有声音定常部を検出していると言
える。フリツプフロツプ605はNORゲート6
03より供給されるSET信号によりSETされ
ANDゲート604より供給されるRESET信号に
よりRESETされる。従つて、ブリツプフロツプ
605は有声音定常部ではRESETされ語頭部分
及び無声音部分ではSETされる。フリツプフロ
ツプ605がSETされると通過ゲート607は
ピツチ検索範囲初期値入力端子606より供給さ
れるピツチ検索範囲初期値をORゲート608へ
通過させる。又、阻止ゲート609はピツチ検索
範囲決定器617より供給されるピツチ周期検索
範囲データがORゲート608へ伝搬するのを阻
止する。故に語頭部分については、ピツチ検索範
囲初期値入力端子606より供給されるピツチ検
索範囲初期値が検索範囲データ出力端子618へ
出力される。
レジスタセル6021,6022,…,6023
が全て“1”のときのみRESET信号をフリツプ
フロツプ605へ出力する。なお、シフトレジス
タ602のレジスタセル6021,6022,
…,6023が全て“1”のときには、例えばシ
フトレジスタ602のレジスタセル6021から
6023までの段数を4段フレーム周期を
30mSECとして120mSEC間連続して有声音であ
ることを示し、有声音定常部を検出していると言
える。フリツプフロツプ605はNORゲート6
03より供給されるSET信号によりSETされ
ANDゲート604より供給されるRESET信号に
よりRESETされる。従つて、ブリツプフロツプ
605は有声音定常部ではRESETされ語頭部分
及び無声音部分ではSETされる。フリツプフロ
ツプ605がSETされると通過ゲート607は
ピツチ検索範囲初期値入力端子606より供給さ
れるピツチ検索範囲初期値をORゲート608へ
通過させる。又、阻止ゲート609はピツチ検索
範囲決定器617より供給されるピツチ周期検索
範囲データがORゲート608へ伝搬するのを阻
止する。故に語頭部分については、ピツチ検索範
囲初期値入力端子606より供給されるピツチ検
索範囲初期値が検索範囲データ出力端子618へ
出力される。
ピツチ周期データ入力端子610を介してピツ
チ周期データがシフトレジスタ611へ供給され
る。シフトレジスタ611は例えば4段シフトレ
ジスタでありフレーム周期毎にピツチ周期データ
を取り込み順次後段へシフトする。612,61
3,614,615は各々重み係数掛算器であ
る。なお、612,613,614,615に掛
けられる係数の和は例えば1、0である。重み係
数掛算器612,613,614,615の出力
は加算器616へ供給される。加算器616は重
み係数掛算器612,613,614,615か
ら供給される各データを加算し、加算結果を平均
ピツチ周期データとしてピツチ検索範囲決定器6
17へ出力する。
チ周期データがシフトレジスタ611へ供給され
る。シフトレジスタ611は例えば4段シフトレ
ジスタでありフレーム周期毎にピツチ周期データ
を取り込み順次後段へシフトする。612,61
3,614,615は各々重み係数掛算器であ
る。なお、612,613,614,615に掛
けられる係数の和は例えば1、0である。重み係
数掛算器612,613,614,615の出力
は加算器616へ供給される。加算器616は重
み係数掛算器612,613,614,615か
ら供給される各データを加算し、加算結果を平均
ピツチ周期データとしてピツチ検索範囲決定器6
17へ出力する。
ピツチ検索範囲決定器617は前記平均ピツチ
周期データの例えば1.6倍から0.6倍の範囲をピツ
チ周期検索範囲データとして阻止ゲート609へ
出力する。前に述べた様に有声音定常部において
はフリツプフロツプ605はRESETされ、通過
ゲート607はピツチ検索範囲初期値入力端子6
06より供給されるピツチ検索範囲初期値を阻止
する。又、阻止ゲート609は前記ピツチ周期検
索範囲データを通過させる。従つて有声音定常部
においてはピツチ周期検索範囲データが阻止ゲー
ト609,ORゲート608を通過して検索範囲
データ出力端子618へ出力される。
周期データの例えば1.6倍から0.6倍の範囲をピツ
チ周期検索範囲データとして阻止ゲート609へ
出力する。前に述べた様に有声音定常部において
はフリツプフロツプ605はRESETされ、通過
ゲート607はピツチ検索範囲初期値入力端子6
06より供給されるピツチ検索範囲初期値を阻止
する。又、阻止ゲート609は前記ピツチ周期検
索範囲データを通過させる。従つて有声音定常部
においてはピツチ周期検索範囲データが阻止ゲー
ト609,ORゲート608を通過して検索範囲
データ出力端子618へ出力される。
なおシフトレジスタ611のシフトを有声フレ
ームのみに制限することにより、より正確な平均
ピツチ周期データを求め得ることは明らかであ
る。
ームのみに制限することにより、より正確な平均
ピツチ周期データを求め得ることは明らかであ
る。
以上説明した様に、本発明はピツチ周期の検索
範囲の初期値を設け、更にピツチ周期の検索範囲
を過去のフレームにおいて検索されたピツチ周期
の近傍に制限してピツチ周期の検索を行なうこと
により、語頭部分におけるピツチ検出エラーを極
力減少するとともに、語頭に相隣る有声音定常部
のピツチ抽出エラーを減少し得るという効果を有
する。
範囲の初期値を設け、更にピツチ周期の検索範囲
を過去のフレームにおいて検索されたピツチ周期
の近傍に制限してピツチ周期の検索を行なうこと
により、語頭部分におけるピツチ検出エラーを極
力減少するとともに、語頭に相隣る有声音定常部
のピツチ抽出エラーを減少し得るという効果を有
する。
第1図は倍ピツチ周期の影響を説明するための
自己相関係数波形図、第2図はホルマントの影響
を説明するための自己相関係数波形図、第3図は
従来方式において生じるピツチ検出エラーの一例
を説明する図、第4図はピツチ周波数の一般的な
時間的変化特性を説明するための図、第5図は本
発明の実施例を説明するためのブロツク図、第6
図は第5図の構成の一部を詳細に説明するブロツ
ク図である。 501……波形入力端子、502……A/D変
換器、503……一時記憶器、504……自己相
関係数計測器、505……自己相関係数伝送路、
506……ピツチ検索器、507……検索範囲デ
ータ伝送路、508……有声無声判定器、509
……ピツチ検索範囲計測器、510……ピツチ検
索範囲初期値記憶器、601……有声無声信号入
力端子、602……シフトレジスタ、603……
NORゲート、604……ANDゲート、605…
…フリツプフロツプ、606……ピツチ検索範囲
初期値入力端子、607……通過ゲート、608
……ORゲート、609……阻止ゲート、610
……ピツチ周期データ入力端子、611……シフ
トレジスタ、612〜615……重み係数掛算
器、616……加算器、617……ピツチ検索範
囲決定器、618……検索範囲データ出力端子、
6021〜6024……レジスタセル。
自己相関係数波形図、第2図はホルマントの影響
を説明するための自己相関係数波形図、第3図は
従来方式において生じるピツチ検出エラーの一例
を説明する図、第4図はピツチ周波数の一般的な
時間的変化特性を説明するための図、第5図は本
発明の実施例を説明するためのブロツク図、第6
図は第5図の構成の一部を詳細に説明するブロツ
ク図である。 501……波形入力端子、502……A/D変
換器、503……一時記憶器、504……自己相
関係数計測器、505……自己相関係数伝送路、
506……ピツチ検索器、507……検索範囲デ
ータ伝送路、508……有声無声判定器、509
……ピツチ検索範囲計測器、510……ピツチ検
索範囲初期値記憶器、601……有声無声信号入
力端子、602……シフトレジスタ、603……
NORゲート、604……ANDゲート、605…
…フリツプフロツプ、606……ピツチ検索範囲
初期値入力端子、607……通過ゲート、608
……ORゲート、609……阻止ゲート、610
……ピツチ周期データ入力端子、611……シフ
トレジスタ、612〜615……重み係数掛算
器、616……加算器、617……ピツチ検索範
囲決定器、618……検索範囲データ出力端子、
6021〜6024……レジスタセル。
Claims (1)
- 1 音声波形をピツチ周期程度のフレーム周期で
分析して得られる自己相関係数を用いてピツチ抽
出を行なうピツチ抽出装置において、前記音声波
形の被分析部が有声音語頭部か有声音定常部かを
識別し、前記有声語頭部の場合には前記ピツチ周
期分析の検索範囲を予め定めた初期値で決定し、
前記有声音定常部の場合には前記ピツチ周期分析
の検索範囲を過去のフレームにおいて検出された
ピツチ周期の近傍に制限してピツチ周期の検索を
行なうことを特徴とするピツチ抽出方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11897279A JPS5642296A (en) | 1979-09-17 | 1979-09-17 | Pitch extractor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11897279A JPS5642296A (en) | 1979-09-17 | 1979-09-17 | Pitch extractor |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5642296A JPS5642296A (en) | 1981-04-20 |
| JPS6214839B2 true JPS6214839B2 (ja) | 1987-04-03 |
Family
ID=14749832
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11897279A Granted JPS5642296A (en) | 1979-09-17 | 1979-09-17 | Pitch extractor |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5642296A (ja) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS57159806A (en) * | 1981-03-30 | 1982-10-02 | Mitsui Petrochem Ind Ltd | Polymerization of olefin |
| JPS58140798A (ja) * | 1982-02-15 | 1983-08-20 | 株式会社日立製作所 | 音声ピツチ抽出方法 |
| JPS58179898A (ja) * | 1982-04-15 | 1983-10-21 | 日本電気株式会社 | ピツチ抽出装置 |
| JPS58193597A (ja) * | 1982-05-07 | 1983-11-11 | 日本電気株式会社 | ピッチ抽出装置 |
| JPS61289398A (ja) * | 1985-06-17 | 1986-12-19 | 富士通株式会社 | ピツチ周期抽出方式 |
| US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
-
1979
- 1979-09-17 JP JP11897279A patent/JPS5642296A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS5642296A (en) | 1981-04-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| NL192701C (nl) | Werkwijze en inrichting voor het herkennen van een foneem in een stemsignaal. | |
| US7124075B2 (en) | Methods and apparatus for pitch determination | |
| Kane et al. | Identifying regions of non-modal phonation using features of the wavelet transform. | |
| JPH05346797A (ja) | 有声音判別方法 | |
| US20040133424A1 (en) | Processing speech signals | |
| JPH0990974A (ja) | 信号処理方法 | |
| JP2009008836A (ja) | 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体 | |
| US20140200889A1 (en) | System and Method for Speech Recognition Using Pitch-Synchronous Spectral Parameters | |
| JPS6214839B2 (ja) | ||
| Kadiri et al. | Determination of glottal closure instants from clean and telephone quality speech signals using single frequency filtering | |
| Imperl et al. | A study of harmonic features for the speaker recognition | |
| JPS6151320B2 (ja) | ||
| US5208861A (en) | Pitch extraction apparatus for an acoustic signal waveform | |
| KR20050003814A (ko) | 음정 인식 장치 | |
| JP4537821B2 (ja) | オーディオ信号分析方法、その方法を用いたオーディオ信号認識方法、オーディオ信号区間検出方法、それらの装置、プログラムおよびその記録媒体 | |
| JPH0377998B2 (ja) | ||
| Martino et al. | An efficient F0 determination algorithm based on the implicit calculation of the autocorrelation of the temporal excitation signal | |
| JP3223564B2 (ja) | ピッチ抽出方法 | |
| JP3012272B2 (ja) | 基本周波数抽出方法 | |
| Laleye et al. | Automatic boundary detection based on entropy measures for text-independent syllable segmentation | |
| d’Alessandro et al. | Phase-based methods for voice source analysis | |
| JP3919359B2 (ja) | 楽音信号のアタック位置検出装置 | |
| JPH0246960B2 (ja) | ||
| EP0421341B1 (en) | Speech recognizer | |
| Hosom | F0 estimation for adult and children's speech. |