JPH0240700A - 音声検出装置 - Google Patents
音声検出装置Info
- Publication number
- JPH0240700A JPH0240700A JP63192519A JP19251988A JPH0240700A JP H0240700 A JPH0240700 A JP H0240700A JP 63192519 A JP63192519 A JP 63192519A JP 19251988 A JP19251988 A JP 19251988A JP H0240700 A JPH0240700 A JP H0240700A
- Authority
- JP
- Japan
- Prior art keywords
- value
- circuit
- average amplitude
- time constant
- zero
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
この発明は、音声の録音装置等で利用する音声検出装置
に関するものである。
に関するものである。
7従来の技術
従来、この種の音声検出方法には、例えば特公昭50−
65527号公報に記載されているように、設定した固
定的な基準値と入力信号とを比較し、基準値を入力信号
が越えたときに音声区間とする方法が知られている。
65527号公報に記載されているように、設定した固
定的な基準値と入力信号とを比較し、基準値を入力信号
が越えたときに音声区間とする方法が知られている。
第3図は従来の音声検出装置を示すブロック図である。
第3図において、1は入力信号の平均振幅を求める平均
振幅算出回路、2は基準振幅値を設定する基準振幅設定
回路、3は比較器を示し、平均振幅算出回路1が出力す
る平均振幅値と基準振幅設定回路2が出力する基準振幅
値とを比較するものである。
振幅算出回路、2は基準振幅値を設定する基準振幅設定
回路、3は比較器を示し、平均振幅算出回路1が出力す
る平均振幅値と基準振幅設定回路2が出力する基準振幅
値とを比較するものである。
次に、上記従来例の動作について説明する。
上記従来例において、一定時間毎に入力信号の平均振幅
値(または実効値)を求めた平均振幅算出回路1の平均
振幅値と、基準振幅設定回路2に設定した基準振幅値と
を比較器3で比較し、基準振幅値を越えた平均振幅値を
有する入力信号が音声と判定される。
値(または実効値)を求めた平均振幅算出回路1の平均
振幅値と、基準振幅設定回路2に設定した基準振幅値と
を比較器3で比較し、基準振幅値を越えた平均振幅値を
有する入力信号が音声と判定される。
尚、上記従来例の他に、基準振幅値を2段階に設定して
検出精度を向上させたり、音声区間前後の一定時間の非
音声区間をハングオーバーと称して強制的に音声区間と
みなし、音声の頭切れや語尾切れを防止する音声検出装
置や、固定基準振幅値以下の入力信号のゼロクロス頻度
から音声区間を検出し、音声区間の誤削除を防止する音
声検出装置なども提案されている。
検出精度を向上させたり、音声区間前後の一定時間の非
音声区間をハングオーバーと称して強制的に音声区間と
みなし、音声の頭切れや語尾切れを防止する音声検出装
置や、固定基準振幅値以下の入力信号のゼロクロス頻度
から音声区間を検出し、音声区間の誤削除を防止する音
声検出装置なども提案されている。
発明が解決しようとする課題
しかしながら、上記従来の音声検出装置では、入力音声
全体の平均振幅値が小さい場合には音声の誤削除が起こ
り易く、背景騒音が大きい場合には音声と騒音との区別
がつかないという問題があった0 この発明は、このような従来の問題を解決するものであ
シ、音声レベルの変動や背景騒音レベルの変動に影響さ
れずに安定して音声区間を検出することかできる音声検
出装置を提供することを目的とするものである。
全体の平均振幅値が小さい場合には音声の誤削除が起こ
り易く、背景騒音が大きい場合には音声と騒音との区別
がつかないという問題があった0 この発明は、このような従来の問題を解決するものであ
シ、音声レベルの変動や背景騒音レベルの変動に影響さ
れずに安定して音声区間を検出することかできる音声検
出装置を提供することを目的とするものである。
課題を解決するだめの手段
この発明は、上記目的を達成するため、ローパスフィル
タの立ち上がり時定数を1ミリ秒以下、立ち下がり時定
数を70ミリ秒〜100ミリ秒とした入力信号の第1の
平均振幅値を求めるとともに、ローパスフィルタの立ち
上がり時定数を2秒〜10秒、立ち下がり時定数を1秒
〜2秒とした入力信号の第2の平均振幅値を求め、また
、音声信号のゼロクロス頻度を計数するとともに、基準
周波数のゼロクロス頻度を求め、第2の平均振幅値が第
1の平均振幅値以上のときに音声検出信号を出力すると
ともに、音声信号のゼロクロス計数値が基準周波数のゼ
ロクロス計数値以上のときに音声検出信号を出力するよ
うにしたものである。
タの立ち上がり時定数を1ミリ秒以下、立ち下がり時定
数を70ミリ秒〜100ミリ秒とした入力信号の第1の
平均振幅値を求めるとともに、ローパスフィルタの立ち
上がり時定数を2秒〜10秒、立ち下がり時定数を1秒
〜2秒とした入力信号の第2の平均振幅値を求め、また
、音声信号のゼロクロス頻度を計数するとともに、基準
周波数のゼロクロス頻度を求め、第2の平均振幅値が第
1の平均振幅値以上のときに音声検出信号を出力すると
ともに、音声信号のゼロクロス計数値が基準周波数のゼ
ロクロス計数値以上のときに音声検出信号を出力するよ
うにしたものである。
作用
本発明は上記のような構成によシ次のような作用を有す
る。入力信号の比較的長時間の平均振幅は、背景騒音レ
ベルに応じて比較的に緩慢に変動し、音声入力時の急激
な振幅変化は発声レベルと無関係に比較的短時間の平均
振幅に現れる。そこで、この比較的長時間の平均振幅を
基準として、比較的短時間の平均振幅が監視され、音声
区間が検出されている。まだ振幅レベルが小さく騒音と
振幅だけでは区別の難しい無声音はゼロクロス頻度が周
囲騒音より高いため、ゼロクロス頻度が基準周波数に相
幽するゼロクロス頻度と比較されて検出される。
る。入力信号の比較的長時間の平均振幅は、背景騒音レ
ベルに応じて比較的に緩慢に変動し、音声入力時の急激
な振幅変化は発声レベルと無関係に比較的短時間の平均
振幅に現れる。そこで、この比較的長時間の平均振幅を
基準として、比較的短時間の平均振幅が監視され、音声
区間が検出されている。まだ振幅レベルが小さく騒音と
振幅だけでは区別の難しい無声音はゼロクロス頻度が周
囲騒音より高いため、ゼロクロス頻度が基準周波数に相
幽するゼロクロス頻度と比較されて検出される。
したがって、本発明によれば、発声レベルの変動や周囲
騒音の変動に無関係に音声区間を検出できるという効果
を有する。
騒音の変動に無関係に音声区間を検出できるという効果
を有する。
実施例
第1図はこの発明の一実施例による音声検出器を示すブ
ロック図である。
ロック図である。
第1図において、11は、入力音声信号の比較的短時間
の平均振幅値を求める短時間平均振幅算出回路、12は
、入力音声信号の比較的長時間の平均振幅値を求める長
時間平均振幅算出回路、13は、入力音声信号のゼロク
ロス頻度を計数するゼロクロス計数回路、14は、基準
周波数のゼロクロス頻度を計数する基準ゼロクロス計数
回路を示す。
の平均振幅値を求める短時間平均振幅算出回路、12は
、入力音声信号の比較的長時間の平均振幅値を求める長
時間平均振幅算出回路、13は、入力音声信号のゼロク
ロス頻度を計数するゼロクロス計数回路、14は、基準
周波数のゼロクロス頻度を計数する基準ゼロクロス計数
回路を示す。
なお、平均振幅算出回路11.12はそれぞれ、全波整
流出力をローパスフィルタを通して所望の平均振幅値を
得ている。
流出力をローパスフィルタを通して所望の平均振幅値を
得ている。
15は比較器を示し、反転端子に短時間平均振幅算出回
路11の出力信号(短時間平均振幅値)が供給され、非
反転端子に長時間平均振幅算出回路12の出力信号(長
時間平均振幅値)が供給され、長時間平均振幅値が短時
間平均振幅値以上のときにハイレベルの音声検出信号を
出力するものである。
路11の出力信号(短時間平均振幅値)が供給され、非
反転端子に長時間平均振幅算出回路12の出力信号(長
時間平均振幅値)が供給され、長時間平均振幅値が短時
間平均振幅値以上のときにハイレベルの音声検出信号を
出力するものである。
16はゼロクロス比較回路を示し、ゼロクロス計数回路
13の出力信号(ゼロクロス計数値)と基準周波数ゼロ
クロス計数回路14の出力信号(基準周波数ゼロクロス
計数値)とを比較し、ゼロクロス計数値が基準周波数ゼ
ロクロス計数値以上のときにハイレベルの音声検出信号
を出力するものでちる0 17は比較器150反転出力出力色ゼロクロス比較回路
16の出力信号とを入力とするAND回路、18は比較
器15の出力信号とAND回路16の出力信号とを入力
とするOR回路を示す。
13の出力信号(ゼロクロス計数値)と基準周波数ゼロ
クロス計数回路14の出力信号(基準周波数ゼロクロス
計数値)とを比較し、ゼロクロス計数値が基準周波数ゼ
ロクロス計数値以上のときにハイレベルの音声検出信号
を出力するものでちる0 17は比較器150反転出力出力色ゼロクロス比較回路
16の出力信号とを入力とするAND回路、18は比較
器15の出力信号とAND回路16の出力信号とを入力
とするOR回路を示す。
次に、上記実施例の動作について説明する。
まず、入力信号の長時間平均振幅値は背景騒音レベルに
応じて比較的緩慢に変動し、音声入力時の急激な振幅変
化は発生レベルと無関係に短時間平均振幅値として現わ
れるので、長時間平均振幅算出回路12が出力する長時
間平均振幅値が、短時間平均振幅算出回路11が出力す
る短時間平均振幅値以上である場合は比較器15からハ
イレベルの信号が出力されるので、OR回路18の出力
にハイレベルの信号が得られる。
応じて比較的緩慢に変動し、音声入力時の急激な振幅変
化は発生レベルと無関係に短時間平均振幅値として現わ
れるので、長時間平均振幅算出回路12が出力する長時
間平均振幅値が、短時間平均振幅算出回路11が出力す
る短時間平均振幅値以上である場合は比較器15からハ
イレベルの信号が出力されるので、OR回路18の出力
にハイレベルの信号が得られる。
そして、振幅レベルが小さくて騒音と振幅だけでは区別
の難しい無音声は、ゼロクロス計数回路13のゼロクロ
ス計数値が基準周波数ゼロクロス計数回路14の基準周
波数ゼロクロス計数値よりも大きいので、ゼロクロス計
数値が基準周波数ゼロクロス計数値以上である場合はゼ
ロクロス比較回路16からハイレベルの信号が出力され
るので、OR回路18の出力にハイレベルの信号が得ら
れる。
の難しい無音声は、ゼロクロス計数回路13のゼロクロ
ス計数値が基準周波数ゼロクロス計数回路14の基準周
波数ゼロクロス計数値よりも大きいので、ゼロクロス計
数値が基準周波数ゼロクロス計数値以上である場合はゼ
ロクロス比較回路16からハイレベルの信号が出力され
るので、OR回路18の出力にハイレベルの信号が得ら
れる。
しかしながら、平均振幅算出回路11.12のローパス
フィルタの時定数が適切でないと、語頭や語尾での音切
れがあったり、逆に音声終了後に無音区間が必要以上に
付加される等の不都合が生ずる。
フィルタの時定数が適切でないと、語頭や語尾での音切
れがあったり、逆に音声終了後に無音区間が必要以上に
付加される等の不都合が生ずる。
したがって、以下のように両時間平均振幅算出回路11
.12の各ローパスフィルタの時定数を決定した。
.12の各ローパスフィルタの時定数を決定した。
まず、短時間平均振幅算出回路11のローパスフィルタ
において、立ち上がりは音声が急峻な立ち上がりに追い
つけるようにダイオードで実質的に1ミリ秒以内として
いる。
において、立ち上がりは音声が急峻な立ち上がりに追い
つけるようにダイオードで実質的に1ミリ秒以内として
いる。
これは、音声のピッチの波形を見ると、大きなピークを
持つ波形の周波数は100Hz〜300Hz程度である
が、構成する要素を調べると、IKHz程度の周波数が
主成分となっておシ、このIKHz程度の周波数に追随
するには1ミリ秒以内の立ち上がり時定数が必要なため
である。
持つ波形の周波数は100Hz〜300Hz程度である
が、構成する要素を調べると、IKHz程度の周波数が
主成分となっておシ、このIKHz程度の周波数に追随
するには1ミリ秒以内の立ち上がり時定数が必要なため
である。
そして、立ち下がり時定数は、長時間平均振幅値よりも
速くなければ、音声終了後の無音を音声と誤ってしまい
、あまり速いと、音切れの原因となる。
速くなければ、音声終了後の無音を音声と誤ってしまい
、あまり速いと、音切れの原因となる。
そこで、後述のように計算機シミュレーションによって
適切な時定数を決定した。
適切な時定数を決定した。
次に、長時間平均振幅算出回路12のローパスフィルタ
において、7立ち上がりは音声区間で短時間平均振幅値
に追いつかないことが条件であり、音声の呼気段落(−
息で話す時間)の平均が2秒程度であるため、長時間平
均振幅値の立ち上がりは2秒以上が必要である。
において、7立ち上がりは音声区間で短時間平均振幅値
に追いつかないことが条件であり、音声の呼気段落(−
息で話す時間)の平均が2秒程度であるため、長時間平
均振幅値の立ち上がりは2秒以上が必要である。
しかし、あまり立ち上がりが遅いと、周囲騒音レベルに
追いつけず、無音区間を音声区間と誤ることになる。
追いつけず、無音区間を音声区間と誤ることになる。
そこで、計算機シミュレーションでは、短時間平均振幅
算出回路11の立ち上がり時定数に対して100秒程ま
で立ち上がり時定数を延ばしても圧縮率に変化がなかっ
た(SN比は7dBtで実験)ので、2秒〜io秒とし
た。
算出回路11の立ち上がり時定数に対して100秒程ま
で立ち上がり時定数を延ばしても圧縮率に変化がなかっ
た(SN比は7dBtで実験)ので、2秒〜io秒とし
た。
そして、立ち下がり時定数は、音声発生中の呼気段落間
ポーズ(息継ぎなどの休止)が1秒程度であるため、こ
の間に周囲騒音平均レベルに達するように1秒〜2秒と
した。
ポーズ(息継ぎなどの休止)が1秒程度であるため、こ
の間に周囲騒音平均レベルに達するように1秒〜2秒と
した。
第2図(a)〜(c)は短時間平均振幅算出回路の立ち
下がり時定数を説明するための波形図である。
下がり時定数を説明するための波形図である。
第2図において、IIs I2、工2は入力信号(音声
信号)、Sl、S2、S2は短時間平均振幅出力、Ll
%L2、L2は長時間平均振幅出力を示す。
信号)、Sl、S2、S2は短時間平均振幅出力、Ll
%L2、L2は長時間平均振幅出力を示す。
第2図から明らかなように、立ち下がり時定数は100
ミリ秒以下でないと、短時間平均振幅値が長時間平均振
幅値に追いつけず、無音が検出できないことがわかる。
ミリ秒以下でないと、短時間平均振幅値が長時間平均振
幅値に追いつけず、無音が検出できないことがわかる。
そして、逆に70ミリ秒以上ないと、音声の語尾を削っ
てしまう恐れがあることがわかる。
てしまう恐れがあることがわかる。
したがって、短時間平均振幅算出回路11のローパスフ
ィルタの立ち下がり時定数は、70ミリ秒〜100ミリ
秒が妥当である。
ィルタの立ち下がり時定数は、70ミリ秒〜100ミリ
秒が妥当である。
なお、上記実施例では、比較器15、ゼロクロス比較回
路16、AND回路17およびOR回路18で比較手段
を構成した例で説明したが、同様に動作する他の構成で
もよい。
路16、AND回路17およびOR回路18で比較手段
を構成した例で説明したが、同様に動作する他の構成で
もよい。
そして、短、長時間平均振幅算出手段は全波整流部を共
有する構成としてもよい。
有する構成としてもよい。
さらに、短時間平均振幅算出手段が騒音による立ち上が
りを音声と誤判断するのを避けるため、数デシベル程度
のマージンが設けられている。
りを音声と誤判断するのを避けるため、数デシベル程度
のマージンが設けられている。
発明の効果
この発明は、上記実施例より明らかなように、ローパス
フィルタの立ち上がり時定数を1ミリ秒以下、立ち下が
り時定数を70ミリ秒〜100ミリ秒とした入力信号の
第1の平均振幅値を求めるとともに、ローパスフィルタ
の立ち上がり時定数を2秒〜10秒、立ち下がり時定数
を1秒〜2秒とした入力信号の第2の平均振幅値を求め
、また、音声信号のゼロクロス頻度を計数するとともに
、基準周波数のゼロクロス頻度を求め、第2の平均振幅
値が第1の平均振幅値以上のときに音声検出信号を出力
するとともに、音声信号のゼロクロス計数値が基準周波
数のゼロクロス計数以上のときに音声検出信号を出力す
るようにしたので、音声レベルの変動や背景騒音レベル
の変動に影響されずに安定して音声区間を検出すること
ができるという効果がある。
フィルタの立ち上がり時定数を1ミリ秒以下、立ち下が
り時定数を70ミリ秒〜100ミリ秒とした入力信号の
第1の平均振幅値を求めるとともに、ローパスフィルタ
の立ち上がり時定数を2秒〜10秒、立ち下がり時定数
を1秒〜2秒とした入力信号の第2の平均振幅値を求め
、また、音声信号のゼロクロス頻度を計数するとともに
、基準周波数のゼロクロス頻度を求め、第2の平均振幅
値が第1の平均振幅値以上のときに音声検出信号を出力
するとともに、音声信号のゼロクロス計数値が基準周波
数のゼロクロス計数以上のときに音声検出信号を出力す
るようにしたので、音声レベルの変動や背景騒音レベル
の変動に影響されずに安定して音声区間を検出すること
ができるという効果がある。
第1図はこの発明の一実施例による音声検出装置を示す
ブロック図、第2図(a)〜(c)は短時間平均振幅算
出回路の立ち下がり時定数を説明するための波形図、第
3図は従来の音声検出装置を示すブロック図である。 11・・短時間平均振幅算出回路、12・・・長時間平
均振幅算出回路、13・・・ゼロクロス計数回路、14
・・・基準周波数ゼロクロス計数回路、15・・・比較
器、16・・・ゼロクロス比較回路、17・・・AND
回路、18・・・OR回路。 代理人の氏名 弁理士 粟野重孝 ほか1名第2図 図 ノ、5−・ yこ杖15ミ /7−・AND日) 、131.、OR目各 ノl
ブロック図、第2図(a)〜(c)は短時間平均振幅算
出回路の立ち下がり時定数を説明するための波形図、第
3図は従来の音声検出装置を示すブロック図である。 11・・短時間平均振幅算出回路、12・・・長時間平
均振幅算出回路、13・・・ゼロクロス計数回路、14
・・・基準周波数ゼロクロス計数回路、15・・・比較
器、16・・・ゼロクロス比較回路、17・・・AND
回路、18・・・OR回路。 代理人の氏名 弁理士 粟野重孝 ほか1名第2図 図 ノ、5−・ yこ杖15ミ /7−・AND日) 、131.、OR目各 ノl
Claims (1)
- ローパスフィルタの立ち上がり時定数を1ミリ秒以下、
立ち下がり時定数を70ミリ秒〜100ミリ秒とした入
力信号の平均振幅値を求める第1の算出手段と、ローパ
スフィルタの立ち上がり時定数を2秒〜10秒、立ち下
がり時定数を1秒〜2秒とした音声信号の平均振幅値を
求める第2の算出手段と、入力信号のゼロクロス頻度を
計数する第1の計数手段と、基準周波数のゼロクロス頻
度を計数する第2の計数手段と、前記第2の算出手段の
平均振幅値が前記第1の算出手段の平均振幅値以上のと
きに音声検出信号を出力するとともに、前記第1の計数
手段の計数値が前記第2の計数手段の計数値以上のとき
に音声検出信号を出力する手段とを備えた音声検出装置
。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63192519A JPH0240700A (ja) | 1988-08-01 | 1988-08-01 | 音声検出装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63192519A JPH0240700A (ja) | 1988-08-01 | 1988-08-01 | 音声検出装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0240700A true JPH0240700A (ja) | 1990-02-09 |
Family
ID=16292635
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63192519A Pending JPH0240700A (ja) | 1988-08-01 | 1988-08-01 | 音声検出装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0240700A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0549432U (ja) * | 1991-12-12 | 1993-06-29 | マツダ株式会社 | 車両のドア構造 |
| JP2006189907A (ja) * | 2001-06-11 | 2006-07-20 | Alcatel | 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ |
| CN102010472A (zh) * | 2010-10-22 | 2011-04-13 | 上海贝西生物科技有限公司 | 一种抗d-二聚体单克隆抗体及其用途 |
-
1988
- 1988-08-01 JP JP63192519A patent/JPH0240700A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0549432U (ja) * | 1991-12-12 | 1993-06-29 | マツダ株式会社 | 車両のドア構造 |
| JP2006189907A (ja) * | 2001-06-11 | 2006-07-20 | Alcatel | 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ |
| CN102010472A (zh) * | 2010-10-22 | 2011-04-13 | 上海贝西生物科技有限公司 | 一种抗d-二聚体单克隆抗体及其用途 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6249757B1 (en) | System for detecting voice activity | |
| US8165880B2 (en) | Speech end-pointer | |
| KR100569612B1 (ko) | 음성활동검출방법및장치 | |
| KR100307065B1 (ko) | 음성검출장치 | |
| Yatsuzuka | Highly sensitive speech detector and high-speed voiceband data discriminator in DSI-ADPCM systems | |
| KR100302370B1 (ko) | 음성구간검출방법과시스템및그음성구간검출방법과시스템을이용한음성속도변환방법과시스템 | |
| US6285979B1 (en) | Phoneme analyzer | |
| JPS6245730B2 (ja) | ||
| JPS603700A (ja) | 音声検出方式 | |
| JPH0240700A (ja) | 音声検出装置 | |
| JPS60200300A (ja) | 音声の始端・終端検出装置 | |
| JP3413862B2 (ja) | 音声区間検出方法 | |
| US6539350B1 (en) | Method and circuit arrangement for speech level measurement in a speech signal processing system | |
| JPH06164278A (ja) | ハウリング抑制装置 | |
| CN100559470C (zh) | 在数字音频信号内的微小静电干扰噪声检测 | |
| JPH01255897A (ja) | 音声検出方法 | |
| JP2666296B2 (ja) | 音声認識装置 | |
| JP2539027B2 (ja) | 音声検出方式 | |
| KR950001540B1 (ko) | 음성신호의 끝점 검출장치 | |
| JP2882792B2 (ja) | 標準パターン作成方式 | |
| Dokku et al. | Detection of stop consonants in continuous noisy speech based on an extrapolation technique | |
| JP2557497B2 (ja) | 男女声の識別方法 | |
| JP2702446B2 (ja) | ノイズ除去回路 | |
| JPH0376471B2 (ja) | ||
| Sakhnov et al. | Low-complexity voice activity detector using periodicity and energy ratio |