JPH1091184A - 音声検出装置 - Google Patents
音声検出装置Info
- Publication number
- JPH1091184A JPH1091184A JP8241458A JP24145896A JPH1091184A JP H1091184 A JPH1091184 A JP H1091184A JP 8241458 A JP8241458 A JP 8241458A JP 24145896 A JP24145896 A JP 24145896A JP H1091184 A JPH1091184 A JP H1091184A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- threshold value
- voice
- signal
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 56
- 230000003044 adaptive effect Effects 0.000 claims abstract description 34
- 238000010586 diagram Methods 0.000 description 9
- 206010019133 Hangover Diseases 0.000 description 8
- 238000000034 method Methods 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 6
- 238000009434 installation Methods 0.000 description 1
Abstract
(57)【要約】
【課題】 周囲雑音が急激に増大し、その雑音レベルが
維持されるような場合に、音声検出の判定で有音の状態
が継続することを防止する。 【解決手段】 音声検出回路4は、入力信号Sinの電力
レベルと、適応しきい値制御回路3で設定された適応し
きい値ST のレベルとを比較し、しきい値ST のレベル
より入力信号Sinのレべルの方が高ければ有音と判定
し、低ければ無音と判定する。さらに、音声検出回路4
で有音と判別された後の有音の継続時間を計るタイマ回
路5を備えている。タイマ回路5は、有音/無音判定信
号Cが一定時間(T0 )以上、継続して「1」となった
ときに、電力算出回路2に指令信号6を出力して、既に
算出されている雑音の平均電力Pをk(>1.0)倍して
出力するように指令する。
維持されるような場合に、音声検出の判定で有音の状態
が継続することを防止する。 【解決手段】 音声検出回路4は、入力信号Sinの電力
レベルと、適応しきい値制御回路3で設定された適応し
きい値ST のレベルとを比較し、しきい値ST のレベル
より入力信号Sinのレべルの方が高ければ有音と判定
し、低ければ無音と判定する。さらに、音声検出回路4
で有音と判別された後の有音の継続時間を計るタイマ回
路5を備えている。タイマ回路5は、有音/無音判定信
号Cが一定時間(T0 )以上、継続して「1」となった
ときに、電力算出回路2に指令信号6を出力して、既に
算出されている雑音の平均電力Pをk(>1.0)倍して
出力するように指令する。
Description
【0001】
【発明の属する技術分野】この発明は、入力信号に含ま
れる雑音信号と音声信号との電力レベル差に基づいて音
声信号を検出する音声検出装置に関する。
れる雑音信号と音声信号との電力レベル差に基づいて音
声信号を検出する音声検出装置に関する。
【0002】
【従来の技術】音声検出器は、TV会議システムのエコ
ーキャンセラや、電話など音声通信用の音声コーデック
(符号化・復号化装置)等の音声処理装置に使用される
もので、雑音信号と音声信号とが含まれている入力信号
から音声信号を検出する機能を有している。
ーキャンセラや、電話など音声通信用の音声コーデック
(符号化・復号化装置)等の音声処理装置に使用される
もので、雑音信号と音声信号とが含まれている入力信号
から音声信号を検出する機能を有している。
【0003】こうした音声信号の検出に際しては、入力
信号の電力レベルが所定のしきい値より大きいか、小さ
いかのみに基づいて、入力信号中に音声が含まれている
(有音)か、それとも雑音のみである(無音)かの判定
を行うことが可能である。しかし、音声処理装置の設置
場所が屋内であるか屋外であるかによって、雑音信号の
電力レベルは変化し、さらに同じ屋内で使用する場合で
も、そこでエアコン等が使用されているか否かによって
も、雑音の大きさは異なってくる。したがって、固定さ
れたしきい値による音声検出方法にあっては、装置の設
置場所の雑音レベルが変化する場合に、音声と誤まって
雑音を検出してしまう不都合があった。
信号の電力レベルが所定のしきい値より大きいか、小さ
いかのみに基づいて、入力信号中に音声が含まれている
(有音)か、それとも雑音のみである(無音)かの判定
を行うことが可能である。しかし、音声処理装置の設置
場所が屋内であるか屋外であるかによって、雑音信号の
電力レベルは変化し、さらに同じ屋内で使用する場合で
も、そこでエアコン等が使用されているか否かによって
も、雑音の大きさは異なってくる。したがって、固定さ
れたしきい値による音声検出方法にあっては、装置の設
置場所の雑音レベルが変化する場合に、音声と誤まって
雑音を検出してしまう不都合があった。
【0004】このような不都合を防止するためには、音
声処理装置が置かれている周囲の雑音レベルを算出し、
その雑音レベルより常に一定値だけ大きいレベルにしき
い値を設定し、このしきい値レベル以上の信号を検出す
る適応しきい値方法が有効である。
声処理装置が置かれている周囲の雑音レベルを算出し、
その雑音レベルより常に一定値だけ大きいレベルにしき
い値を設定し、このしきい値レベル以上の信号を検出す
る適応しきい値方法が有効である。
【0005】図4には、従来の適応しきい値法による音
声検出装置の一例を示している。
声検出装置の一例を示している。
【0006】図において、1は音声信号と雑音信号とが
入力されるマイクロフォン、2は電力算出回路である。
この電力算出回路2は、入力信号Sinの直前の短時間の
平均電力P(移動平均)を計算して、しきい値算出回路
3に出力する。しきい値算出回路3は、平均電力Pに一
定値を加算した適応しきい値ST を設定し、音声検出回
路4に出力している。音声検出回路4は、入力信号Sin
から有音/無音判定を行なうものであり、入力信号Sin
の電力レベルと、しきい値算出回路3で設定された適応
しきい値ST のレベルとを比較し、しきい値ST のレベ
ルより入力信号Sinのレべルの方が高ければ有音と判定
し、低ければ無音と判定している。この判定によって音
声検出回路4からは有音/無音判定信号Cが出力され
る。また、この有音/無音判定信号Cは電力算出回路2
及びしきい値算出回路3にも入力され、有音の場合に
は、平均電力Pの算出と適応しきい値ST の更新動作と
を停止させている。
入力されるマイクロフォン、2は電力算出回路である。
この電力算出回路2は、入力信号Sinの直前の短時間の
平均電力P(移動平均)を計算して、しきい値算出回路
3に出力する。しきい値算出回路3は、平均電力Pに一
定値を加算した適応しきい値ST を設定し、音声検出回
路4に出力している。音声検出回路4は、入力信号Sin
から有音/無音判定を行なうものであり、入力信号Sin
の電力レベルと、しきい値算出回路3で設定された適応
しきい値ST のレベルとを比較し、しきい値ST のレベ
ルより入力信号Sinのレべルの方が高ければ有音と判定
し、低ければ無音と判定している。この判定によって音
声検出回路4からは有音/無音判定信号Cが出力され
る。また、この有音/無音判定信号Cは電力算出回路2
及びしきい値算出回路3にも入力され、有音の場合に
は、平均電力Pの算出と適応しきい値ST の更新動作と
を停止させている。
【0007】図5は、この音声検出装置の動作を説明す
る信号波形図である。
る信号波形図である。
【0008】同図(a)に示す音声は、同図(b)に示
す徐々に増大する周囲雑音とともにマイクロフォン1で
集音され、入力信号Sinとなる。
す徐々に増大する周囲雑音とともにマイクロフォン1で
集音され、入力信号Sinとなる。
【0009】同図(c)には、これら音声と雑音とが合
成された入力信号Sinから計算される平均電力Pと適応
しきい値ST とを示している。電力算出回路2では、有
音/無音判定信号Cに基づいて、無音区間だけで入力信
号Sinの平均電力値を計算しており、その短時間の平均
電力Pがしきい値算出回路3に出力される。適応しきい
値ST は、差分ΔPだけ平均電力Pより高いレべルに制
御され、音声検出回路4に出力されている。
成された入力信号Sinから計算される平均電力Pと適応
しきい値ST とを示している。電力算出回路2では、有
音/無音判定信号Cに基づいて、無音区間だけで入力信
号Sinの平均電力値を計算しており、その短時間の平均
電力Pがしきい値算出回路3に出力される。適応しきい
値ST は、差分ΔPだけ平均電力Pより高いレべルに制
御され、音声検出回路4に出力されている。
【0010】同図(d)には、音声検出回路4から出力
される有音/無音判定信号Cの波形を示している。音声
検出回路4では、入力信号Sinのレベルが適応しきい値
STより高くなると有音と判定し、適応しきい値ST よ
り低い場合には、無音と判定する。そして、この有音/
無音判定信号Cが、それぞれ論理レベル1(以下、単に
「1」と記す)、論理レベル0(以下、単に「0」と記
す)の信号出力となる。
される有音/無音判定信号Cの波形を示している。音声
検出回路4では、入力信号Sinのレベルが適応しきい値
STより高くなると有音と判定し、適応しきい値ST よ
り低い場合には、無音と判定する。そして、この有音/
無音判定信号Cが、それぞれ論理レベル1(以下、単に
「1」と記す)、論理レベル0(以下、単に「0」と記
す)の信号出力となる。
【0011】ただし、有音から無音に変化するタイミン
グでは、一定時間、ここでは例えばTH だけ無音が継続
してはじめて、周囲雑音の平均電力Pの計算が再開さ
れ、音声検出回路4の有音/無音判定信号Cが「0」に
なる。この電力算出回路2に設定された時間TH は、い
わゆるハングオーバ時間であって、例えば電話などでは
話中なのに音声レベルが一時的に低下して、しきい値S
T を下回ったような場合でも、この時間TH の間だけ
は、音声検出回路4の出力を「1」に維持する働きをし
ている。
グでは、一定時間、ここでは例えばTH だけ無音が継続
してはじめて、周囲雑音の平均電力Pの計算が再開さ
れ、音声検出回路4の有音/無音判定信号Cが「0」に
なる。この電力算出回路2に設定された時間TH は、い
わゆるハングオーバ時間であって、例えば電話などでは
話中なのに音声レベルが一時的に低下して、しきい値S
T を下回ったような場合でも、この時間TH の間だけ
は、音声検出回路4の出力を「1」に維持する働きをし
ている。
【0012】図6は、周囲雑音が急激に増大した場合の
動作を説明するための信号波形図である。
動作を説明するための信号波形図である。
【0013】図に示すように、例えば部屋の空調装置の
稼働を開始し、或いは、それまで閉められていたドアを
開けて室外からの騒音が入るなど、入力信号Sinがある
時点で急激に変化し、その変化量が適応しきい値ST の
平均電力Pに対する差分ΔPを越えて、入力信号Sinの
レベルが適応しきい値ST より高くなる場合がある。こ
のとき、音声検出回路4の出力である有音/無音判定信
号Cが「0」から「1」に変化する。この時点で、電力
算出回路2における平均電力Pの計算が停止され、しき
い値ST の更新も停止される。このように雑音レベルの
みが高くなって、適応しきい値ST が更新できないと、
入力信号Sinに雑音成分だけしか含まれていないにもか
かわらず、有音/無音判定信号Cがいつまでも「0」レ
ベルに戻らず、有音の判断が継続することとなる。
稼働を開始し、或いは、それまで閉められていたドアを
開けて室外からの騒音が入るなど、入力信号Sinがある
時点で急激に変化し、その変化量が適応しきい値ST の
平均電力Pに対する差分ΔPを越えて、入力信号Sinの
レベルが適応しきい値ST より高くなる場合がある。こ
のとき、音声検出回路4の出力である有音/無音判定信
号Cが「0」から「1」に変化する。この時点で、電力
算出回路2における平均電力Pの計算が停止され、しき
い値ST の更新も停止される。このように雑音レベルの
みが高くなって、適応しきい値ST が更新できないと、
入力信号Sinに雑音成分だけしか含まれていないにもか
かわらず、有音/無音判定信号Cがいつまでも「0」レ
ベルに戻らず、有音の判断が継続することとなる。
【0014】
【発明が解決しようとする課題】上述のように、従来の
適応しきい値法による音声検出装置にあっては、周囲の
雑音レベルがしきい値を越える程に急激に高くなると、
それまで「0」であった有音/無音判定信号Cが「1」
に変化して有音と判定される。そして、有音と判定され
たら、その後は音声検出装置のしきい値ST が変らない
ために、同じ雑音レベルが維持された場合には、有音の
判断が継続するという問題があった。
適応しきい値法による音声検出装置にあっては、周囲の
雑音レベルがしきい値を越える程に急激に高くなると、
それまで「0」であった有音/無音判定信号Cが「1」
に変化して有音と判定される。そして、有音と判定され
たら、その後は音声検出装置のしきい値ST が変らない
ために、同じ雑音レベルが維持された場合には、有音の
判断が継続するという問題があった。
【0015】この発明は、このような課題を解決するた
めになされたもので、周囲雑音が急激に増大し、その雑
音レベルが維持されるような場合に、音声検出の判定で
有音の状態が継続することを防止した音声検出装置を提
供することを目的とするものである。
めになされたもので、周囲雑音が急激に増大し、その雑
音レベルが維持されるような場合に、音声検出の判定で
有音の状態が継続することを防止した音声検出装置を提
供することを目的とするものである。
【0016】
【課題を解決するための手段】請求項1に係る音声検出
装置は、入力信号に含まれる雑音信号と音声信号との電
力レベル差に基づいて音声信号を検出する音声検出装置
において、前記入力信号の電力レベルから、前記音声信
号を検出するためのしきい値を設定する適応しきい値制
御手段と、前記しきい値と前記入力信号とを比較して有
音/無音を判定する音声検出手段と、前記音声検出手段
で継続して有音と判定された時間を計る計時手段とを備
え、前記適応しきい値制御手段では、前記無音と判定さ
れている間は、前記しきい値を前記入力信号の電力レベ
ルに対応した値に設定し、前記計時手段にあらかじめ設
定された時間を越えて前記有音が検出されたときには、
前記しきい値を所定量だけ増加させるものである。
装置は、入力信号に含まれる雑音信号と音声信号との電
力レベル差に基づいて音声信号を検出する音声検出装置
において、前記入力信号の電力レベルから、前記音声信
号を検出するためのしきい値を設定する適応しきい値制
御手段と、前記しきい値と前記入力信号とを比較して有
音/無音を判定する音声検出手段と、前記音声検出手段
で継続して有音と判定された時間を計る計時手段とを備
え、前記適応しきい値制御手段では、前記無音と判定さ
れている間は、前記しきい値を前記入力信号の電力レベ
ルに対応した値に設定し、前記計時手段にあらかじめ設
定された時間を越えて前記有音が検出されたときには、
前記しきい値を所定量だけ増加させるものである。
【0017】請求項2に係る音声検出装置の適応しきい
値制御手段は、前記計時手段にあらかじめ設定された時
間を越えて前記有音が検出される毎に、前記しきい値を
所定量繰り返し増加させるものである。
値制御手段は、前記計時手段にあらかじめ設定された時
間を越えて前記有音が検出される毎に、前記しきい値を
所定量繰り返し増加させるものである。
【0018】請求項3に係る音声検出装置の適応しきい
値制御手段は、前記しきい値を所定の上限値以上にはし
ないものである。
値制御手段は、前記しきい値を所定の上限値以上にはし
ないものである。
【0019】
【発明の実施の形態】以下、添付した図面を参照して、
この発明の実施の形態を説明する。
この発明の実施の形態を説明する。
【0020】図1は、本発明の音声検出装置の一例を示
すブロック図である。音声検出回路4は、入力信号Sin
から有音/無音判定を行なうものであり、入力信号Sin
の電力レベルと、しきい値算出回路3で設定された適応
しきい値ST のレベルとを比較し、しきい値ST のレベ
ルより入力信号Sinのレべルの方が高ければ有音と判定
し、低ければ無音と判定している。
すブロック図である。音声検出回路4は、入力信号Sin
から有音/無音判定を行なうものであり、入力信号Sin
の電力レベルと、しきい値算出回路3で設定された適応
しきい値ST のレベルとを比較し、しきい値ST のレベ
ルより入力信号Sinのレべルの方が高ければ有音と判定
し、低ければ無音と判定している。
【0021】また音声検出装置は、音声検出回路4で有
音と判別された後の有音の継続時間を計るタイマ回路5
を備えている。このタイマ回路5は、有音/無音判定信
号Cが一定時間(T0 )以上、継続して「1」となった
ときに、電力算出回路2に指令信号6を出力して、既に
算出されている雑音の平均電力Pをk(>1.0)倍して
出力するように指令する。なお、図1において図4の従
来装置と同一符号を付してあるブロックや信号は、同一
又は対応するブロック及び信号を示している。また、し
きい値制御手段7とは、電力算出回路2としきい値算出
回路3とを含む回路構成を指している。
音と判別された後の有音の継続時間を計るタイマ回路5
を備えている。このタイマ回路5は、有音/無音判定信
号Cが一定時間(T0 )以上、継続して「1」となった
ときに、電力算出回路2に指令信号6を出力して、既に
算出されている雑音の平均電力Pをk(>1.0)倍して
出力するように指令する。なお、図1において図4の従
来装置と同一符号を付してあるブロックや信号は、同一
又は対応するブロック及び信号を示している。また、し
きい値制御手段7とは、電力算出回路2としきい値算出
回路3とを含む回路構成を指している。
【0022】次に、図1の音声検出装置の動作を説明す
る。
る。
【0023】同図において、電力算出回路2及びしきい
値算出回路3には有音/無音判定信号Cが入力され、有
音と判断された場合には、その平均電力Pの算出が停止
され、無音時の雑音の平均電力Pが継続してしきい値算
出回路3に出力される。その結果、適応しきい値ST の
更新動作も、有音の場合には停止されることになる。
値算出回路3には有音/無音判定信号Cが入力され、有
音と判断された場合には、その平均電力Pの算出が停止
され、無音時の雑音の平均電力Pが継続してしきい値算
出回路3に出力される。その結果、適応しきい値ST の
更新動作も、有音の場合には停止されることになる。
【0024】ここで、新たに追加されたタイマ回路5か
らの指令信号6は、有音/無音判定信号Cが一定時間
(T0 )以上、継続して「1」となったときに、電力算
出回路2に対して有音と判断される直前の雑音の平均電
力Pを逓倍してしきい値算出回路3に出力するように制
御する。これによって、電力算出回路2からしきい値算
出回路3に出力される平均電力Pは、有音区間と判定さ
れてから一定時間T0 が経過した後に、新しい値k×P
として出力される。
らの指令信号6は、有音/無音判定信号Cが一定時間
(T0 )以上、継続して「1」となったときに、電力算
出回路2に対して有音と判断される直前の雑音の平均電
力Pを逓倍してしきい値算出回路3に出力するように制
御する。これによって、電力算出回路2からしきい値算
出回路3に出力される平均電力Pは、有音区間と判定さ
れてから一定時間T0 が経過した後に、新しい値k×P
として出力される。
【0025】なお、必要に応じて音声検出回路4からの
有音/無音判定信号Cとともに音声出力Sout が、有音
区間で後段の図示しない音声処理装置へと出力される。
有音/無音判定信号Cとともに音声出力Sout が、有音
区間で後段の図示しない音声処理装置へと出力される。
【0026】さらに、上記音声検出装置の動作につい
て、図2に示すフローチャートによって説明する。
て、図2に示すフローチャートによって説明する。
【0027】マイクロフォン1から入力された音声と背
景雑音とは入力信号Sinとして、電力算出回路2と音声
検出回路4に入力され、音声検出回路4で有音/無音判
定が実行される(ステップST1)。音声検出回路4で
しきい値ST より大きな入力信号Sinが検出されると、
有音/無音判定信号Cが「1」となって有音と判断され
(ステップST2)、ステップST3に進み、タイマ回
路5における計時動作が開始され、ハングオーバ時間T
H がセットされる(ステップST4)。
景雑音とは入力信号Sinとして、電力算出回路2と音声
検出回路4に入力され、音声検出回路4で有音/無音判
定が実行される(ステップST1)。音声検出回路4で
しきい値ST より大きな入力信号Sinが検出されると、
有音/無音判定信号Cが「1」となって有音と判断され
(ステップST2)、ステップST3に進み、タイマ回
路5における計時動作が開始され、ハングオーバ時間T
H がセットされる(ステップST4)。
【0028】また、この音声検出回路4で、入力信号S
inがしきい値ST より小さいと判定されると、ステップ
ST5に進んで、ハングオーバ時間TH がタイムオーバ
しているか否かの判断が行なわれる。そして、ハングオ
ーバ時間TH がタイムオーバしている(TH ≦0)とき
には、有音/無音判定信号Cを「0」として(ステップ
ST6)、電力算出回路2で平均電力Pが算出される
(ステップST7)。ハングオーバ時間TH がタイムオ
ーバしていない(TH >0)ときには、有音/無音判定
信号Cを「1」として(ステップST8)、ハングオー
バ時間TH を単位時間ΔTH だけ低減して(ステップS
T9)、ステップST1に戻る。
inがしきい値ST より小さいと判定されると、ステップ
ST5に進んで、ハングオーバ時間TH がタイムオーバ
しているか否かの判断が行なわれる。そして、ハングオ
ーバ時間TH がタイムオーバしている(TH ≦0)とき
には、有音/無音判定信号Cを「0」として(ステップ
ST6)、電力算出回路2で平均電力Pが算出される
(ステップST7)。ハングオーバ時間TH がタイムオ
ーバしていない(TH >0)ときには、有音/無音判定
信号Cを「1」として(ステップST8)、ハングオー
バ時間TH を単位時間ΔTH だけ低減して(ステップS
T9)、ステップST1に戻る。
【0029】タイマ回路5では、Δt毎に一定時間T0
が経過したか否かを判断して(ステップST10)、経
過していなければステップST1に戻る。そして、上述
の有音/無音判定が実行され、タイマ回路5により一定
時間T0 が経過したと判断されるまでステップST10
から、ステップST1〜4が繰り返し実行される。しか
し、この間に音声検出回路4でSin<ST がハングオー
バ時間TH 以上継続し、その出力である有音/無音判定
信号Cが「0」になれば、ステップST7に進み、電力
算出回路2での平均電力Pの算出が再開される。
が経過したか否かを判断して(ステップST10)、経
過していなければステップST1に戻る。そして、上述
の有音/無音判定が実行され、タイマ回路5により一定
時間T0 が経過したと判断されるまでステップST10
から、ステップST1〜4が繰り返し実行される。しか
し、この間に音声検出回路4でSin<ST がハングオー
バ時間TH 以上継続し、その出力である有音/無音判定
信号Cが「0」になれば、ステップST7に進み、電力
算出回路2での平均電力Pの算出が再開される。
【0030】ステップST10において、タイマ回路5
で一定時間T0 が経過したとき、タイマ回路5から電力
算出回路2に対して指令信号6が出力される。これによ
り、電力算出回路2で算出された平均電力Pをk倍して
出力するようになる(ステップST11)。この平均電
力Pには、ステップST7において有音と判断される直
前に算出された値が使用される。
で一定時間T0 が経過したとき、タイマ回路5から電力
算出回路2に対して指令信号6が出力される。これによ
り、電力算出回路2で算出された平均電力Pをk倍して
出力するようになる(ステップST11)。この平均電
力Pには、ステップST7において有音と判断される直
前に算出された値が使用される。
【0031】その結果、しきい値算出回路3に出力され
る新しい平均電力Pの値が上昇し、しきい値算出回路3
では、新しい平均電力Pによってしきい値ST が更新さ
れる(ステップST12)。その後、タイマ回路5がリ
セットされ(ステップST13)、ステップST1に戻
って音声検出回路4で有音/無音判定が実行される。
る新しい平均電力Pの値が上昇し、しきい値算出回路3
では、新しい平均電力Pによってしきい値ST が更新さ
れる(ステップST12)。その後、タイマ回路5がリ
セットされ(ステップST13)、ステップST1に戻
って音声検出回路4で有音/無音判定が実行される。
【0032】このように、新しい平均電力Pに基づいて
更新されたしきい値ST が設定され、その更新されたし
きい値ST が音声検出回路4に入力するから、音声検出
回路4では前回とは異なる基準で有音/無音の判定が実
行される。そして、前回と同様に一定時間T0 が経過す
るまで、更新されたしきい値ST に基づいて、さらに有
音区間終了判定が繰り返し実行される。
更新されたしきい値ST が設定され、その更新されたし
きい値ST が音声検出回路4に入力するから、音声検出
回路4では前回とは異なる基準で有音/無音の判定が実
行される。そして、前回と同様に一定時間T0 が経過す
るまで、更新されたしきい値ST に基づいて、さらに有
音区間終了判定が繰り返し実行される。
【0033】なお、ステップST1で無音と判断された
後には、ステップST7で電力算出回路2での平均電力
Pの算出が再開され、ステップST12で新しい平均電
力Pに基づくしきい値ST に更新され(ステップST1
2)、タイマ回路5をリセットして(ステップST1
3)、ステップST1に戻って、有音/無音判定が繰り
返される。
後には、ステップST7で電力算出回路2での平均電力
Pの算出が再開され、ステップST12で新しい平均電
力Pに基づくしきい値ST に更新され(ステップST1
2)、タイマ回路5をリセットして(ステップST1
3)、ステップST1に戻って、有音/無音判定が繰り
返される。
【0034】図3は、上述の音声検出装置の一連の動作
の具体例を示す信号波形図である。
の具体例を示す信号波形図である。
【0035】同図において、音声検出回路4における有
音/無音判定信号Cが「0」(無音)から「1」(有
音)に変化する時刻t1 までの動作は、従来の音声検出
装置(図4)の動作と全く同じである。本発明における
音声検出回路4では、有音/無音判定信号Cが「1」に
なると、タイマ回路5の計時動作がスタートする。タイ
マ回路5に設定されている一定時間(T0 )が経過する
までは、平均電力Pと適応しきい値ST は一定レベルを
保持する。
音/無音判定信号Cが「0」(無音)から「1」(有
音)に変化する時刻t1 までの動作は、従来の音声検出
装置(図4)の動作と全く同じである。本発明における
音声検出回路4では、有音/無音判定信号Cが「1」に
なると、タイマ回路5の計時動作がスタートする。タイ
マ回路5に設定されている一定時間(T0 )が経過する
までは、平均電力Pと適応しきい値ST は一定レベルを
保持する。
【0036】時刻t2 になると、電力算出回路2では最
後に算出された平均電力Pにk(>1.0)を乗じた値
(k×P)が新たな平均電力としてしきい値算出回路3
に入力され、これに伴い適応しきい値ST も同様に上昇
した値に更新される。この更新されたしきい値ST が、
図示のように入力信号Sinのレベルより高くなると、ハ
ングオーバ時間TH が経過した時刻t3 で、音声検出回
路4の有音/無音判定信号Cは「1」から「0」に変化
する。したがって、電力算出回路2では入力信号Sinに
対応する平均電力Pの更新が再開され、これに伴って適
応しきい値ST の更新が再開される。
後に算出された平均電力Pにk(>1.0)を乗じた値
(k×P)が新たな平均電力としてしきい値算出回路3
に入力され、これに伴い適応しきい値ST も同様に上昇
した値に更新される。この更新されたしきい値ST が、
図示のように入力信号Sinのレベルより高くなると、ハ
ングオーバ時間TH が経過した時刻t3 で、音声検出回
路4の有音/無音判定信号Cは「1」から「0」に変化
する。したがって、電力算出回路2では入力信号Sinに
対応する平均電力Pの更新が再開され、これに伴って適
応しきい値ST の更新が再開される。
【0037】図3に示す例では、周囲雑音によって有音
という判断が継続し、算出電力値を1回だけk倍するこ
とで、適応しきい値ST が入力信号Sinのレベルより高
くなるような周囲雑音が想定されている。しかし、雑音
の大きさや定数kの設定によっては、1回の逓倍操作だ
けでしきい値ST が入力信号Sinのレベルより高くなら
ないような場合も考えられる。そのような場合には、図
2のフローチャートに示すように、一定時間T0 が経過
する毎に徐々に算出電力値を高めていくことになる。
という判断が継続し、算出電力値を1回だけk倍するこ
とで、適応しきい値ST が入力信号Sinのレベルより高
くなるような周囲雑音が想定されている。しかし、雑音
の大きさや定数kの設定によっては、1回の逓倍操作だ
けでしきい値ST が入力信号Sinのレベルより高くなら
ないような場合も考えられる。そのような場合には、図
2のフローチャートに示すように、一定時間T0 が経過
する毎に徐々に算出電力値を高めていくことになる。
【0038】なお、通常人間の話し言葉には、継続して
話を行っている場合でも、途中に必ず区切りや、途切れ
が入るので、音声信号を電力レベルで詳細に観察すれ
ば、その信号レベルは断続状態となっている。このた
め、図1のタイマ回路5における一定時間T0 を、例え
ば1〜10秒程度の幅で適当な値に選んでおけば、音声
信号によってしきい値ST が更新されてしまうおそれは
少ない。またたとえ、いったんしきい値ST が音声信号
によって更新されたとしても、その後に話が途切れれば
再び雑音のみによるしきい値ST の更新が行われるた
め、適切なしきい値ST に戻すことが可能である。
話を行っている場合でも、途中に必ず区切りや、途切れ
が入るので、音声信号を電力レベルで詳細に観察すれ
ば、その信号レベルは断続状態となっている。このた
め、図1のタイマ回路5における一定時間T0 を、例え
ば1〜10秒程度の幅で適当な値に選んでおけば、音声
信号によってしきい値ST が更新されてしまうおそれは
少ない。またたとえ、いったんしきい値ST が音声信号
によって更新されたとしても、その後に話が途切れれば
再び雑音のみによるしきい値ST の更新が行われるた
め、適切なしきい値ST に戻すことが可能である。
【0039】以上説明したように、上記音声検出装置に
おいては、有音となった後も一定時間経過後に適応しき
い値ST を変化させているから、周囲雑音が急激に変化
して雑音を音声とする誤った検出をした場合でも、繰り
返し周囲雑音に対応して確実に有音/無音の判定を行な
うことができる。
おいては、有音となった後も一定時間経過後に適応しき
い値ST を変化させているから、周囲雑音が急激に変化
して雑音を音声とする誤った検出をした場合でも、繰り
返し周囲雑音に対応して確実に有音/無音の判定を行な
うことができる。
【0040】上述の実施の形態を変形して、入力信号S
inの平均電力Pの算出値、或いは適応しきい値ST のい
ずれかに上限を設け、それらの値が一定レベル以上にな
らないように制限して音声検出を行う装置を構成するこ
とも可能である。このような音声検出装置では、例えば
BGMのような音楽演奏などを音声信号とする入力信号
Sinのように、音声の連続した入力があった場合にも、
通常の周囲雑音が取り得る電力値より適応しきい値ST
の上限を高く設定しておけば、音声検出動作を保障でき
る。
inの平均電力Pの算出値、或いは適応しきい値ST のい
ずれかに上限を設け、それらの値が一定レベル以上にな
らないように制限して音声検出を行う装置を構成するこ
とも可能である。このような音声検出装置では、例えば
BGMのような音楽演奏などを音声信号とする入力信号
Sinのように、音声の連続した入力があった場合にも、
通常の周囲雑音が取り得る電力値より適応しきい値ST
の上限を高く設定しておけば、音声検出動作を保障でき
る。
【0041】また、上記電力算出回路2では所定の係数
kを平均電力Pに掛けて、新しい電力値を算出している
が、所定値ΔPを加算するものであってもよい。
kを平均電力Pに掛けて、新しい電力値を算出している
が、所定値ΔPを加算するものであってもよい。
【0042】さらに、上記音声検出装置では、タイマ回
路5の指令信号6は電力算出回路2に対する指令であっ
たが、例えばタイマ回路5の指令信号6をしきい値算出
回路3に供給して、有音となった後も、平均電力Pの値
はそのままに保持し、適応しきい値ST だけを一定時間
T0 が経過する毎に徐々に高めるように制御するように
構成してもよい。
路5の指令信号6は電力算出回路2に対する指令であっ
たが、例えばタイマ回路5の指令信号6をしきい値算出
回路3に供給して、有音となった後も、平均電力Pの値
はそのままに保持し、適応しきい値ST だけを一定時間
T0 が経過する毎に徐々に高めるように制御するように
構成してもよい。
【0043】したがって、請求項1に記載した「しきい
値を所定量だけ増加させる」とは、「所定の割合での増
加」及び「所定値の増加」並びにこれらの組合せを含む
意味に解するべきである。
値を所定量だけ増加させる」とは、「所定の割合での増
加」及び「所定値の増加」並びにこれらの組合せを含む
意味に解するべきである。
【0044】
【発明の効果】この発明の音声検出装置は、以上に説明
したように構成されているので、周囲雑音が急激に変化
した場合にも、新たな周囲雑音に対応してしきい値を更
新して、確実に有音/無音の判定を行なうことができ
る。
したように構成されているので、周囲雑音が急激に変化
した場合にも、新たな周囲雑音に対応してしきい値を更
新して、確実に有音/無音の判定を行なうことができ
る。
【図1】 本発明の音声検出装置の一例を示すブロック
図である。
図である。
【図2】 図1の音声検出装置の動作を示すフローチャ
ートである。
ートである。
【図3】 図1の音声検出装置の動作の具体例を示す信
号波形図である。
号波形図である。
【図4】 従来の適応しきい値法による音声検出装置の
一例を示すブロック図である。
一例を示すブロック図である。
【図5】 図4の音声検出装置の動作を説明する信号波
形図である。
形図である。
【図6】 周囲雑音が急激に増大した場合の動作を説明
するための信号波形図である。
するための信号波形図である。
1 マイクロフォン、 2 電力算出回路、 3 しき
い値算出回路、 4音声検出回路、 5 タイマ回路、
6 指令信号、 7 しきい値制御手段、Sin 入力
信号、 ST 適応しきい値、 P 雑音の平均電力、
C 有音/無音判定信号。
い値算出回路、 4音声検出回路、 5 タイマ回路、
6 指令信号、 7 しきい値制御手段、Sin 入力
信号、 ST 適応しきい値、 P 雑音の平均電力、
C 有音/無音判定信号。
Claims (3)
- 【請求項1】 入力信号に含まれる雑音信号と音声信号
との電力レベル差に基づいて音声信号を検出する音声検
出装置において、 前記入力信号の電力レベルから、前記音声信号を検出す
るためのしきい値を設定する適応しきい値制御手段と、 前記しきい値と前記入力信号とを比較して有音/無音を
判定する音声検出手段と、 前記音声検出手段で継続して有音と判定された時間を計
る計時手段とを備え、 前記適応しきい値制御手段では、前記無音と判定されて
いる間は、前記しきい値を前記入力信号の電力レベルに
対応した値に設定し、前記計時手段にあらかじめ設定さ
れた時間を越えて前記有音が検出されたときには、前記
しきい値を所定量だけ増加させることを特徴とする音声
検出装置。 - 【請求項2】 前記適応しきい値制御手段は、前記計時
手段にあらかじめ設定された時間を越えて前記有音が検
出される毎に、前記しきい値を所定量繰り返し増加させ
ることを特徴とする請求項1に記載の音声検出装置。 - 【請求項3】 前記適応しきい値制御手段は、前記しき
い値を所定の上限値以上にはしないことを特徴とする請
求項2に記載の音声検出装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8241458A JPH1091184A (ja) | 1996-09-12 | 1996-09-12 | 音声検出装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8241458A JPH1091184A (ja) | 1996-09-12 | 1996-09-12 | 音声検出装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH1091184A true JPH1091184A (ja) | 1998-04-10 |
Family
ID=17074621
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8241458A Pending JPH1091184A (ja) | 1996-09-12 | 1996-09-12 | 音声検出装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH1091184A (ja) |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005215204A (ja) * | 2004-01-28 | 2005-08-11 | Ntt Docomo Inc | 有音無音判定装置および有音無音判定方法 |
| US7283953B2 (en) * | 1999-09-20 | 2007-10-16 | International Business Machines Corporation | Process for identifying excess noise in a computer system |
| JP2008170789A (ja) * | 2007-01-12 | 2008-07-24 | Raytron:Kk | 音声区間検出装置および音声区間検出方法 |
| US8442817B2 (en) | 2003-12-25 | 2013-05-14 | Ntt Docomo, Inc. | Apparatus and method for voice activity detection |
| JP2013235032A (ja) * | 2012-05-02 | 2013-11-21 | Nintendo Co Ltd | 情報処理プログラム、情報処理装置、情報処理システム及び情報処理方法 |
| WO2016067644A1 (ja) * | 2014-10-29 | 2016-05-06 | シャープ株式会社 | 音声調整装置 |
| JP2018081277A (ja) * | 2016-11-18 | 2018-05-24 | 富士通株式会社 | 音声区間検出方法、音声区間検出装置および音声区間検出プログラム |
-
1996
- 1996-09-12 JP JP8241458A patent/JPH1091184A/ja active Pending
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7283953B2 (en) * | 1999-09-20 | 2007-10-16 | International Business Machines Corporation | Process for identifying excess noise in a computer system |
| US8442817B2 (en) | 2003-12-25 | 2013-05-14 | Ntt Docomo, Inc. | Apparatus and method for voice activity detection |
| JP2005215204A (ja) * | 2004-01-28 | 2005-08-11 | Ntt Docomo Inc | 有音無音判定装置および有音無音判定方法 |
| JP2008170789A (ja) * | 2007-01-12 | 2008-07-24 | Raytron:Kk | 音声区間検出装置および音声区間検出方法 |
| JP2013235032A (ja) * | 2012-05-02 | 2013-11-21 | Nintendo Co Ltd | 情報処理プログラム、情報処理装置、情報処理システム及び情報処理方法 |
| EP2660712A3 (en) * | 2012-05-02 | 2017-05-03 | Nintendo Co., Ltd. | Information processing program, information processing device, information processing system and information processing method |
| WO2016067644A1 (ja) * | 2014-10-29 | 2016-05-06 | シャープ株式会社 | 音声調整装置 |
| JP2016085420A (ja) * | 2014-10-29 | 2016-05-19 | シャープ株式会社 | 音声調整装置 |
| JP2018081277A (ja) * | 2016-11-18 | 2018-05-24 | 富士通株式会社 | 音声区間検出方法、音声区間検出装置および音声区間検出プログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6574601B1 (en) | Acoustic speech recognizer system and method | |
| JP4282659B2 (ja) | 音声信号処理装置の音声区間検出装置及び方法 | |
| CN1216364C (zh) | 具有声音输出装置的设备及其控制方法 | |
| JP4236726B2 (ja) | 音声活動検出方法及び音声活動検出装置 | |
| US7069221B2 (en) | Non-target barge-in detection | |
| US5737724A (en) | Speech recognition employing a permissive recognition criterion for a repeated phrase utterance | |
| CN1220176C (zh) | 用于一种语音识别设备的训练或适配方法 | |
| JP3984526B2 (ja) | 音声対話システム及び方法 | |
| US20020087306A1 (en) | Computer-implemented noise normalization method and system | |
| JP2003524794A (ja) | 雑音のある信号におけるスピーチのエンドポイント決定 | |
| US20080249779A1 (en) | Speech dialog system | |
| WO2006118886A2 (en) | Controlling an output while receiving a user input | |
| CN102667927A (zh) | 语音活动检测的方法和背景估计器 | |
| WO2004015686A1 (en) | Method for automatic speech recognition | |
| JP2586827B2 (ja) | 受信装置 | |
| JPS62274941A (ja) | 音声符号化方式 | |
| CN100504840C (zh) | 用于背景噪声快速动态估计的方法 | |
| GB2347252A (en) | Voice recognition system | |
| JP3524370B2 (ja) | 音声起動システム | |
| JPH1091184A (ja) | 音声検出装置 | |
| US5054078A (en) | Method and apparatus to suspend speech | |
| KR100200635B1 (ko) | 화상회의 시스템에서의 반향제어 장치 및 제어방법 | |
| JP3877271B2 (ja) | 音声認識用オーディオキャンセル装置 | |
| CN119479634A (zh) | 语音控制方法、装置、存储介质及电子设备 | |
| JP4551817B2 (ja) | ノイズレベル推定方法及びその装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20020813 |