JP2532618B2 - ピッチ抽出装置 - Google Patents
ピッチ抽出装置Info
- Publication number
- JP2532618B2 JP2532618B2 JP63274870A JP27487088A JP2532618B2 JP 2532618 B2 JP2532618 B2 JP 2532618B2 JP 63274870 A JP63274870 A JP 63274870A JP 27487088 A JP27487088 A JP 27487088A JP 2532618 B2 JP2532618 B2 JP 2532618B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- pitch
- positive
- negative
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000605 extraction Methods 0.000 claims abstract description 23
- 230000003247 decreasing effect Effects 0.000 abstract 1
- 238000000034 method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
Landscapes
- Electrophonic Musical Instruments (AREA)
Description
【発明の詳細な説明】 産業上の利用分野 本発明は、ピッチ抽出装置に関するものである。
従来の技術 近年、音声認識技術の発達と共に、音声認識装置が様
々の分野で実用化されようとしている。実用化するため
には、認識装置を実際に使用する上での様々の課題を解
決する必要がある。この使用上の課題の1つに、認識装
置に音声以外の信号(たとえば、様々な環境雑音、また
は音声の前後に入力されやすい息音など)が大きいパワ
ーで入力された場合に、入力信号から音声区間のみを抽
出できずに誤った認識結果を出力してしまうという点が
あった。上記課題を解決するためにはパワーの有無以外
の情報を用いて音声区間抽出を行なう必要があり、ピッ
チ抽出装置を音声認識装置に利用することでピッチの有
無情報を区間抽出に使用することが試みられているが、
音声と雑音が同時に入力されると音声部でピッチが抽出
できない場合があるという課題があった。
々の分野で実用化されようとしている。実用化するため
には、認識装置を実際に使用する上での様々の課題を解
決する必要がある。この使用上の課題の1つに、認識装
置に音声以外の信号(たとえば、様々な環境雑音、また
は音声の前後に入力されやすい息音など)が大きいパワ
ーで入力された場合に、入力信号から音声区間のみを抽
出できずに誤った認識結果を出力してしまうという点が
あった。上記課題を解決するためにはパワーの有無以外
の情報を用いて音声区間抽出を行なう必要があり、ピッ
チ抽出装置を音声認識装置に利用することでピッチの有
無情報を区間抽出に使用することが試みられているが、
音声と雑音が同時に入力されると音声部でピッチが抽出
できない場合があるという課題があった。
従来のピッチ抽出装置では上記課題を解決するため
に、入力信号を信号のレベルの大小により3値化し、3
値化された信号の相関の有無によりピッチの有無を判定
した。以上の方法により、音声と雑音が同時に入力され
た場合でも音声部でピッチを抽出することが可能とな
る。
に、入力信号を信号のレベルの大小により3値化し、3
値化された信号の相関の有無によりピッチの有無を判定
した。以上の方法により、音声と雑音が同時に入力され
た場合でも音声部でピッチを抽出することが可能とな
る。
以下,図面を参照しながら、上述したような従来のピ
ッチ抽出装置について説明を行う。第5図は、従来のピ
ッチ抽出装置のブロック図である。1は音声入力端子,1
0はLPF(Low Pass Filter)部,11は3値化部、12は相関
演算部、13はピッチ有無判定部、7はピッチ抽出結果出
力端子である。以上のように構成されたピッチ抽出装置
について以下その動作について説明する。
ッチ抽出装置について説明を行う。第5図は、従来のピ
ッチ抽出装置のブロック図である。1は音声入力端子,1
0はLPF(Low Pass Filter)部,11は3値化部、12は相関
演算部、13はピッチ有無判定部、7はピッチ抽出結果出
力端子である。以上のように構成されたピッチ抽出装置
について以下その動作について説明する。
まず,音声入力端子1より入力された信号は、LPF部1
0に入力され、LPF部10でLPF(たとえば、カットオフ周
波数900Hz)を通過した信号は、3値化部11に入力され
る。3値化部11では、上記信号の単位時間ごとの絶対値
のピークレベルを見つけ、ピークレベルの一定倍(例え
ば、70%)のレベルをクリップレベルとし、正信号に関
してはクリップレベル以上を1、以下を0とし、負信号
に関しては信号の絶対値についてクリップレベル以上を
−1、以下を0として信号を3値化する。ピークレベル
の探索方法は、たとえば単位時間を24msecとすると、単
位区間の最初と最後の8msecの信号の絶対値の最大レベ
ルのうち小さい方をピークレベルとしてもよい。
0に入力され、LPF部10でLPF(たとえば、カットオフ周
波数900Hz)を通過した信号は、3値化部11に入力され
る。3値化部11では、上記信号の単位時間ごとの絶対値
のピークレベルを見つけ、ピークレベルの一定倍(例え
ば、70%)のレベルをクリップレベルとし、正信号に関
してはクリップレベル以上を1、以下を0とし、負信号
に関しては信号の絶対値についてクリップレベル以上を
−1、以下を0として信号を3値化する。ピークレベル
の探索方法は、たとえば単位時間を24msecとすると、単
位区間の最初と最後の8msecの信号の絶対値の最大レベ
ルのうち小さい方をピークレベルとしてもよい。
次に、相関演算部12で上記で3値化された信号の自己
相関を求める。たとえば、サンプリング周波数8000Hzの
信号で単位区間長24msecの場合に区間全長の相関を求め
ると192次の相関係数が算出される。
相関を求める。たとえば、サンプリング周波数8000Hzの
信号で単位区間長24msecの場合に区間全長の相関を求め
ると192次の相関係数が算出される。
次に、ピッチ有無判定部13で上記相関係数の次数の小
さい方から最初のピークレベルと最初から2番目のピー
クレベルの比が一定値以上(例えば、30%以上)であれ
ば相当する単位区間にピッチが有るとみなし、以下であ
ればピッチが無いとみなし、ピッチ抽出結果を出力端子
7より出力する。
さい方から最初のピークレベルと最初から2番目のピー
クレベルの比が一定値以上(例えば、30%以上)であれ
ば相当する単位区間にピッチが有るとみなし、以下であ
ればピッチが無いとみなし、ピッチ抽出結果を出力端子
7より出力する。
発明が解決しようとする課題 しかしながら、上記のような構成では、比較的S/Nの
高い場合にはピッチ抽出性能は良いが、S/Nが低く雑音
レベルがクリップレベルより大きくなる場合には、3値
化による雑音除去が困難になり、音声区間でピッチ抽出
が正しく行なわれない。また、雑音レベルに合わせてク
リップレベルを大きく設定すると、1ピッチ内の最大波
高値と同符号側の波形はピッチごとに周期のある2値化
波となる場合が多いが、異符号側の波形がクリップレベ
ルに対し不安定になるために、やはり音声区間の相関が
低くなりピッチが抽出されないという課題を有してい
た。
高い場合にはピッチ抽出性能は良いが、S/Nが低く雑音
レベルがクリップレベルより大きくなる場合には、3値
化による雑音除去が困難になり、音声区間でピッチ抽出
が正しく行なわれない。また、雑音レベルに合わせてク
リップレベルを大きく設定すると、1ピッチ内の最大波
高値と同符号側の波形はピッチごとに周期のある2値化
波となる場合が多いが、異符号側の波形がクリップレベ
ルに対し不安定になるために、やはり音声区間の相関が
低くなりピッチが抽出されないという課題を有してい
た。
本発明は、このような従来技術の課題に鑑み、S/Nが
低く雑音レベルが1ピッチ内の最大波高値以外の信号レ
ベルより大きい場合でも、音声区間にてピッチを抽出す
ることができるピッチ抽出装置を提供することを目的と
する。
低く雑音レベルが1ピッチ内の最大波高値以外の信号レ
ベルより大きい場合でも、音声区間にてピッチを抽出す
ることができるピッチ抽出装置を提供することを目的と
する。
課題を解決するための手段 請求項1の本発明は、入力信号の正負を判定する正負
判定部と正信号部または負信号部を2値化する2値化部
と、信号の相関を求める相関演算部とピッチの有無を判
定するピッチ有無判定部とから構成されている。
判定部と正信号部または負信号部を2値化する2値化部
と、信号の相関を求める相関演算部とピッチの有無を判
定するピッチ有無判定部とから構成されている。
請求項2の本発明は、入力信号の正負を判定する正負
判定部と正信号部または負信号部を2値化する2値化部
と、信号の相関を求める相関演算部とピッチ候補を決定
するピッチ候補決定部とピッチの有無を判定するピッチ
有無判定部とから構成されている。
判定部と正信号部または負信号部を2値化する2値化部
と、信号の相関を求める相関演算部とピッチ候補を決定
するピッチ候補決定部とピッチの有無を判定するピッチ
有無判定部とから構成されている。
作用 この構成によって、請求項1の本発明のピッチ抽出装
置は、正負判定部で信号を正信号部と負信号部に分け、
2値化部で正信号、または負信号を信号のエネルギーレ
ベルの大小により2値化し、相関演算部で2値化された
各々の信号の自己相関を求め、ピッチ有無判定部で正信
号または負信号のどちらか一方に相関があればピッチ有
りと判定する。
置は、正負判定部で信号を正信号部と負信号部に分け、
2値化部で正信号、または負信号を信号のエネルギーレ
ベルの大小により2値化し、相関演算部で2値化された
各々の信号の自己相関を求め、ピッチ有無判定部で正信
号または負信号のどちらか一方に相関があればピッチ有
りと判定する。
請求項2の本発明のピッチ抽出装置は、正負判定部で
信号を正信号部と負信号部に分け、2値化部で正信号、
または負信号を信号のエネルギーレベルの大小により2
値化し、相関演算部で2値化された各々の信号の相関を
求め、ピッチ候補決定部で正信号または負信号のどちら
にも相関がなければピッチ無し、どちらか一方に相関が
あればピッチ候補を決定し、ピッチ有無判定部で上記ピ
ッチ候補が有音声のピッチとして適当であればピッチ有
り、不適当であればピッチ無しとする。
信号を正信号部と負信号部に分け、2値化部で正信号、
または負信号を信号のエネルギーレベルの大小により2
値化し、相関演算部で2値化された各々の信号の相関を
求め、ピッチ候補決定部で正信号または負信号のどちら
にも相関がなければピッチ無し、どちらか一方に相関が
あればピッチ候補を決定し、ピッチ有無判定部で上記ピ
ッチ候補が有音声のピッチとして適当であればピッチ有
り、不適当であればピッチ無しとする。
実施例 以下,本発明のピッチ抽出装置における実施例につい
て図面を参照しながら説明する。
て図面を参照しながら説明する。
実施例1 第1図は本発明の一実施例におけるピッチ抽出装置の
ブロック図である。1は音声入力端子,2はLPF(Low Pas
s Filter)部,3は正負判定部、4は2値化部、5は相関
演算部、6はピッチ有無判定部、7はピッチ抽出結果出
力端子であり、前記従来例と同じものは,同一の番号を
付与している。
ブロック図である。1は音声入力端子,2はLPF(Low Pas
s Filter)部,3は正負判定部、4は2値化部、5は相関
演算部、6はピッチ有無判定部、7はピッチ抽出結果出
力端子であり、前記従来例と同じものは,同一の番号を
付与している。
以上のように構成されたピッチ抽出装置について以下
その動作について説明する。
その動作について説明する。
まず,音声入力端子1より入力された信号は(第3
図、ステップ21)、LPF部2に入力され、LPF部2でLPF
(たとえば、カットオフ周波数900Hz)を通過した信号
は(第3図、ステップ22)正負判定部3に入力される。
正負判定部3では、信号の単位時間ごとの波形ピークレ
ベルを見つけた後、信号を正信号部と負信号部に分け、
まず単位時間ごとの正信号部を2値化部4に入力する
(第3図、ステップ23)。ピークレベルの探索方法は、
たとえば単位時間を24msecとすると、単位区間の最初と
最後の8msecの波形最大レベルのうち小さい方をピーク
レベルとしてもよい。
図、ステップ21)、LPF部2に入力され、LPF部2でLPF
(たとえば、カットオフ周波数900Hz)を通過した信号
は(第3図、ステップ22)正負判定部3に入力される。
正負判定部3では、信号の単位時間ごとの波形ピークレ
ベルを見つけた後、信号を正信号部と負信号部に分け、
まず単位時間ごとの正信号部を2値化部4に入力する
(第3図、ステップ23)。ピークレベルの探索方法は、
たとえば単位時間を24msecとすると、単位区間の最初と
最後の8msecの波形最大レベルのうち小さい方をピーク
レベルとしてもよい。
2値化部4では、上記波形ピークレベルの一定倍(例
えば、70%)のレベルをクリップレベルとし、クリップ
レベル以上を1、以下を0として信号を2値化する(第
3図、ステップ24)。次に、相関演算部5で上記で2値
化された信号の自己相関を求める(第3図、ステップ2
5)。たとえば、サンプリング周波数8000Hzの信号で単
位区間長24msecの場合に区間全長の相関を算出すると19
2次の相関係数が算出される。
えば、70%)のレベルをクリップレベルとし、クリップ
レベル以上を1、以下を0として信号を2値化する(第
3図、ステップ24)。次に、相関演算部5で上記で2値
化された信号の自己相関を求める(第3図、ステップ2
5)。たとえば、サンプリング周波数8000Hzの信号で単
位区間長24msecの場合に区間全長の相関を算出すると19
2次の相関係数が算出される。
次に、ピッチ有無判定部6で上記相関係数の次数の小
さい方から最初のピーク値と最初から2番目のピーク値
の比が一定値以上(例えば、30%以上)の場合に相当す
る単位区間にピッチが有ると判定し、結果をピッチ抽出
結果出力端子7より出力する(第3図、ステップ27)。
さい方から最初のピーク値と最初から2番目のピーク値
の比が一定値以上(例えば、30%以上)の場合に相当す
る単位区間にピッチが有ると判定し、結果をピッチ抽出
結果出力端子7より出力する(第3図、ステップ27)。
上記ピーク値の比が一定値以下の場合には、上記の処
理と同単位時間内の負信号部を2値化部に入力し(第3
図、ステップ28)、以上の2値化部以降の処理を行い
(第3図、ステップ29、30)、ピッチ有無判定部6で相
関係数の最初のピークと最初から2番目のピーク値の比
が一定値以上の場合にピッチ有り、一定値未満の場合に
ピッチ無しと判定し(第3図、ステップ31)、結果をピ
ッチ抽出結果出力端子7に入力する(第3図、ステップ
32)。
理と同単位時間内の負信号部を2値化部に入力し(第3
図、ステップ28)、以上の2値化部以降の処理を行い
(第3図、ステップ29、30)、ピッチ有無判定部6で相
関係数の最初のピークと最初から2番目のピーク値の比
が一定値以上の場合にピッチ有り、一定値未満の場合に
ピッチ無しと判定し(第3図、ステップ31)、結果をピ
ッチ抽出結果出力端子7に入力する(第3図、ステップ
32)。
以上のように,本実施例によれば,正負判定部で信号
を正信号部と負信号部に分け、2値化部で正信号、また
は負信号を信号のエネルギーレベルの大小により2値化
し、相関演算部で2値化された各々の信号の自己相関を
求め、ピッチ有無判定部で正信号または負信号のどちら
か一方に相関があればピッチ有りと判定することによ
り、S/Nが低く雑音レベルが1ピッチ内の最大波高値以
外の信号レベルより大きい場合でも、音声区間にてピッ
チを抽出することができる。
を正信号部と負信号部に分け、2値化部で正信号、また
は負信号を信号のエネルギーレベルの大小により2値化
し、相関演算部で2値化された各々の信号の自己相関を
求め、ピッチ有無判定部で正信号または負信号のどちら
か一方に相関があればピッチ有りと判定することによ
り、S/Nが低く雑音レベルが1ピッチ内の最大波高値以
外の信号レベルより大きい場合でも、音声区間にてピッ
チを抽出することができる。
実施例2 第2図は請求項2の一実施例におけるピッチ抽出装置
のブロック図である。1は音声入力端子,2はLPF(Low P
ass Filter)部,3は正負判定部、4は2値化部、5は相
関演算部、8はピッチ候補決定部、9はピッチ有無判定
部、7はピッチ抽出結果出力端子であり、前記実施例と
同じものは,同一の番号を付与している。
のブロック図である。1は音声入力端子,2はLPF(Low P
ass Filter)部,3は正負判定部、4は2値化部、5は相
関演算部、8はピッチ候補決定部、9はピッチ有無判定
部、7はピッチ抽出結果出力端子であり、前記実施例と
同じものは,同一の番号を付与している。
以上のように構成されたピッチ抽出装置について以下
その動作について説明する。
その動作について説明する。
まず,音声入力端子1より入力された信号は(第4
図、ステップ41)、LPF部2に入力され、LPF部2でLPF
(たとえば、カットオフ周波数900Hz)を通過した信号
は(第4図、ステップ42)は正負判定部3に入力され
る。正負判定部3では、信号の単位時間ごとの波形ピー
クレベルを見つけた後、信号を正信号部と負信号部に分
け、まず単位時間ごとの正信号部を2値化部4に入力す
る(第4図、ステップ43)。ピークレベルの探索方法は
実施例1と同様である。
図、ステップ41)、LPF部2に入力され、LPF部2でLPF
(たとえば、カットオフ周波数900Hz)を通過した信号
は(第4図、ステップ42)は正負判定部3に入力され
る。正負判定部3では、信号の単位時間ごとの波形ピー
クレベルを見つけた後、信号を正信号部と負信号部に分
け、まず単位時間ごとの正信号部を2値化部4に入力す
る(第4図、ステップ43)。ピークレベルの探索方法は
実施例1と同様である。
2値化部4では、上記波形ピークレベルの一定倍(例
えば、70%)のレベルをクリップレベルとし、クリップ
レベル以上を1、以下を0として信号を2値化する(第
4図、ステップ44)。次に、相関演算部5で上記で2値
化された信号の自己相関を求める(第4図、ステップ4
5)。たとえば、サンプリング周波数8000Hzの信号で単
位区間長24msecの場合に区間全長の相関を算出すると19
2次の相関係数が算出される。
えば、70%)のレベルをクリップレベルとし、クリップ
レベル以上を1、以下を0として信号を2値化する(第
4図、ステップ44)。次に、相関演算部5で上記で2値
化された信号の自己相関を求める(第4図、ステップ4
5)。たとえば、サンプリング周波数8000Hzの信号で単
位区間長24msecの場合に区間全長の相関を算出すると19
2次の相関係数が算出される。
次に、ピッチ候補決定部8で上記相関係数の次数の小
さい方から最初のピーク値と最初から2番目のピーク値
の比が一定値以上(例えば、30%以上)の場合に相当す
る単位区間にピッチが有ると判定し、上記ピーク間の距
離(単位は秒)の逆数をピッチとして結果をピッチ有無
判定部9に入力する(第4図、ステップ46、47)。
さい方から最初のピーク値と最初から2番目のピーク値
の比が一定値以上(例えば、30%以上)の場合に相当す
る単位区間にピッチが有ると判定し、上記ピーク間の距
離(単位は秒)の逆数をピッチとして結果をピッチ有無
判定部9に入力する(第4図、ステップ46、47)。
上記ピーク値の比が一定値以下の場合には、上記の処
理と同単位時間内の負信号部を2値化部に入力し(第4
図、ステップ48)、以上の2値化部以降の処理を行い
(第4図、ステップ49、50)、ピッチ有無判定部6で相
関係数の最初のピークと最初から2番目のピーク値の比
が一定値以上の場合にピッチ有り、一定値未満の場合に
ピッチ無しと判定し(第4図、ステップ51)、結果をピ
ッチ有りの場合にはピッチ有無判定部9に入力し(第4
図、ステップ52)、ピッチ無しの場合にはピッチ抽出結
果出力端子7より結果を出力する。
理と同単位時間内の負信号部を2値化部に入力し(第4
図、ステップ48)、以上の2値化部以降の処理を行い
(第4図、ステップ49、50)、ピッチ有無判定部6で相
関係数の最初のピークと最初から2番目のピーク値の比
が一定値以上の場合にピッチ有り、一定値未満の場合に
ピッチ無しと判定し(第4図、ステップ51)、結果をピ
ッチ有りの場合にはピッチ有無判定部9に入力し(第4
図、ステップ52)、ピッチ無しの場合にはピッチ抽出結
果出力端子7より結果を出力する。
次に、ピッチ有無判定部9では上記処理にて決定され
たピッチが音声のピッチとして適当かどうかを次の条件
(1)(2)により判断する(第4図、ステップ54)。
たピッチが音声のピッチとして適当かどうかを次の条件
(1)(2)により判断する(第4図、ステップ54)。
(1)現ピッチ候補と、前単位区間の信号で決定され
たピッチ候補との差が20Hz以下である。
たピッチ候補との差が20Hz以下である。
(2)ピッチ候補は40Hz以上かつ400Hz以下である。
上記2つの条件を共に満たした場合のみピッチ有りと
しどちらか一方でも満たさなかった場合にはピッチ無し
として結果をピッチ抽出結果出力端子7より出力する。
(第4図、ステップ55)。
しどちらか一方でも満たさなかった場合にはピッチ無し
として結果をピッチ抽出結果出力端子7より出力する。
(第4図、ステップ55)。
以上述べたように,本実施例によれば,正負判定部で
信号を正信号部と負信号部に分け、2値化部で正信号、
または負信号を信号のエネルギーレベルの大小により2
値化し、相関演算部で2値化された各々の信号の相関を
求め、ピッチ候補決定部で正信号または負信号のどちら
にも相関がなければピッチ無し、どちらか一方に相関が
あればピッチ候補が決定し、ピッチ有無判定部で上記ピ
ッチ候補が有音声のピッチとして適当であればピッチ有
り、不適当であればピッチ無しとすることにより、S/N
が低く雑音レベルが1ピッチ内の最大波高値以外の信号
レベルより大きい場合でも、音声区間にてピッチを抽出
し、さらに音声以外の信号区間でピッチの誤抽出を少な
くすることができる。
信号を正信号部と負信号部に分け、2値化部で正信号、
または負信号を信号のエネルギーレベルの大小により2
値化し、相関演算部で2値化された各々の信号の相関を
求め、ピッチ候補決定部で正信号または負信号のどちら
にも相関がなければピッチ無し、どちらか一方に相関が
あればピッチ候補が決定し、ピッチ有無判定部で上記ピ
ッチ候補が有音声のピッチとして適当であればピッチ有
り、不適当であればピッチ無しとすることにより、S/N
が低く雑音レベルが1ピッチ内の最大波高値以外の信号
レベルより大きい場合でも、音声区間にてピッチを抽出
し、さらに音声以外の信号区間でピッチの誤抽出を少な
くすることができる。
発明の効果 本発明は、正負判定部で信号を正信号部と負信号部に
分け、2値化部で正信号、または負信号を信号のエネル
ギーレベルの大小により2値化し、相関演算部で2値化
された各々の信号の自己相関を求め、ピッチ有無判定部
で正信号または負信号のどちらか一方に相関があればピ
ッチ有りと判定することにより、S/Nが低く雑音レベル
が1ピッチ内の最大波高値以外の信号レベルより大きい
場合でも、音声区間にてピッチを抽出することができる
優れた抽出装置を実現するものである。
分け、2値化部で正信号、または負信号を信号のエネル
ギーレベルの大小により2値化し、相関演算部で2値化
された各々の信号の自己相関を求め、ピッチ有無判定部
で正信号または負信号のどちらか一方に相関があればピ
ッチ有りと判定することにより、S/Nが低く雑音レベル
が1ピッチ内の最大波高値以外の信号レベルより大きい
場合でも、音声区間にてピッチを抽出することができる
優れた抽出装置を実現するものである。
また、本発明は、正負判定部で信号を正信号部と負信
号部に分け、2値化部で正信号、または負信号を信号の
エネルギーレベルの大小により2値化し、相関演算部で
2値化された各々の信号の相関を求め、ピッチ候補決定
部で正信号または負信号のどちらにも相関がなければピ
ッチ無し、どちらか一方に相関があればピッチ候補を決
定し、ピッチ有無判定部で上記ピッチ候補が有音声のピ
ッチとして適当であればピッチ有り、不適当であればピ
ッチ無しとすることにより、S/Nが低く雑音レベルが1
ピッチ内の最大波高値以外の信号レベルより大きい場合
でも、音声区間にてピッチを抽出し、さらに音声以外の
信号区間でピッチの誤抽出を少なくすることができる優
れたピッチ抽出装置を実現するものである。
号部に分け、2値化部で正信号、または負信号を信号の
エネルギーレベルの大小により2値化し、相関演算部で
2値化された各々の信号の相関を求め、ピッチ候補決定
部で正信号または負信号のどちらにも相関がなければピ
ッチ無し、どちらか一方に相関があればピッチ候補を決
定し、ピッチ有無判定部で上記ピッチ候補が有音声のピ
ッチとして適当であればピッチ有り、不適当であればピ
ッチ無しとすることにより、S/Nが低く雑音レベルが1
ピッチ内の最大波高値以外の信号レベルより大きい場合
でも、音声区間にてピッチを抽出し、さらに音声以外の
信号区間でピッチの誤抽出を少なくすることができる優
れたピッチ抽出装置を実現するものである。
第1図は、本発明の一実施例におけるピッチ抽出装置の
ブロック図、第2図は、本発明の第2の実施例における
ピッチ抽出装置のブロック図、第3図は、同第1実施例
のフローチャート、第4図は、同第2実施例のフローチ
ャート、第5図は、従来例におけるピッチ抽出装置のブ
ロック図である。 1……音声入力端子、2……LPF部、3……正負判定
部、4……2値化部、5……相関演算部、6、9……ピ
ッチ有無判定部、7……ピッチ抽出結果出力端子、8…
…ピッチ候補決定部
ブロック図、第2図は、本発明の第2の実施例における
ピッチ抽出装置のブロック図、第3図は、同第1実施例
のフローチャート、第4図は、同第2実施例のフローチ
ャート、第5図は、従来例におけるピッチ抽出装置のブ
ロック図である。 1……音声入力端子、2……LPF部、3……正負判定
部、4……2値化部、5……相関演算部、6、9……ピ
ッチ有無判定部、7……ピッチ抽出結果出力端子、8…
…ピッチ候補決定部
Claims (2)
- 【請求項1】入力信号の正負を判定する正負判定部と信
号の正の値である部分(以後正信号部という)または信
号の負の値である部分(以後負信号部という)を2値化
する2値化部と、信号の相関を求める相関演算部とピッ
チの有無を判定するピッチ有無判定部を具備し、正負判
定部で信号を正信号部と負信号部に分け、2値化部で正
信号、または負信号を信号のエネルギーレベルの大小に
より2値化し、相関演算部で2値化された各々の信号の
相関を求め、ピッチ有無判定部で正信号または負信号の
どちらか一方に相関があればピッチ有りと判定すること
を特徴とするピッチ抽出装置。 - 【請求項2】入力信号の正負を判定する正負判定部と正
信号部または負信号部を2値化する2値化部と、信号の
相関を求める相関演算部とピッチ候補を決定するピッチ
候補決定部とピッチの有無を判定するピッチ有無判定部
を具備し、正負判定部で信号を正信号部と負信号部に分
け、2値化部で正信号、または負信号を信号のエネルギ
ーレベルの大小により2値化し、相関演算部で2値化さ
れた各々の信号の相関を求め、ピッチ候補決定部で正信
号または負信号のどちらにも相関がなければピッチ無
し、どちらか一方に相関があればピッチ候補を決定し、
ピッチ有無判定部で上記ピッチ候補が有声音のピッチと
して適当であればピッチ有り、不適当であればピッチ無
しとすることを特徴とするピッチ抽出装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63274870A JP2532618B2 (ja) | 1988-10-31 | 1988-10-31 | ピッチ抽出装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63274870A JP2532618B2 (ja) | 1988-10-31 | 1988-10-31 | ピッチ抽出装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH02120800A JPH02120800A (ja) | 1990-05-08 |
| JP2532618B2 true JP2532618B2 (ja) | 1996-09-11 |
Family
ID=17547709
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63274870A Expired - Lifetime JP2532618B2 (ja) | 1988-10-31 | 1988-10-31 | ピッチ抽出装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2532618B2 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3119204B2 (ja) * | 1997-06-27 | 2000-12-18 | 日本電気株式会社 | 音声符号化装置 |
| WO2001078062A1 (en) * | 2000-04-06 | 2001-10-18 | Telefonaktiebolaget Lm Ericsson (Publ) | Pitch estimation in speech signal |
-
1988
- 1988-10-31 JP JP63274870A patent/JP2532618B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPH02120800A (ja) | 1990-05-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN100485780C (zh) | 基于基音频率的快速音频分割方法 | |
| CN101625858A (zh) | 语音端点检测中短时能频值的提取方法 | |
| JP2532618B2 (ja) | ピッチ抽出装置 | |
| JPH01159697A (ja) | 音声認識装置 | |
| JP3091537B2 (ja) | 音声パターン作成方法 | |
| JP2992324B2 (ja) | 音声区間検出方法 | |
| JPH04261591A (ja) | 自動採譜装置 | |
| Xu et al. | Voice activity detection using entropy-based method | |
| JPS62141595A (ja) | 音声検出方式 | |
| JPS61233791A (ja) | 音声認識装置における音声区間検出方式 | |
| JP3484559B2 (ja) | 音声認識装置および音声認識方法 | |
| JP3008404B2 (ja) | 音声認識装置 | |
| JP3212785B2 (ja) | 信号検出装置 | |
| KR100345402B1 (ko) | 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법 | |
| Huici et al. | A COMBINED ALGORITHM FOR PITCH DETECTION OF SPEECH SIGNALS | |
| JPS6131880B2 (ja) | ||
| JPS63163495A (ja) | 音声区間検出装置 | |
| KR100523905B1 (ko) | 이중화된 검출조건을 이용한 음성 추출 방법 | |
| KR970060044A (ko) | 유색 잡음 환경에서 주파수 영역의 정보를 이용한 끝점 검출 방법 | |
| JP3450972B2 (ja) | パターン認識装置 | |
| KR950002704B1 (ko) | 음성인식 시스템의 유사음성 구분장치 및 구분방법 | |
| JPS63281199A (ja) | 音声セグメンテ−ション装置 | |
| KR20000074086A (ko) | 음성의 피치 차이값을 이용한 음성 파일의 끝점 검출방법 | |
| JPH0451840B2 (ja) | ||
| JPH0383100A (ja) | 音声区間の検出装置 |