JPH0711759B2 - 音声認識等における音声区間検出方法 - Google Patents

音声認識等における音声区間検出方法

Info

Publication number
JPH0711759B2
JPH0711759B2 JP60282083A JP28208385A JPH0711759B2 JP H0711759 B2 JPH0711759 B2 JP H0711759B2 JP 60282083 A JP60282083 A JP 60282083A JP 28208385 A JP28208385 A JP 28208385A JP H0711759 B2 JPH0711759 B2 JP H0711759B2
Authority
JP
Japan
Prior art keywords
microphone
voice
power level
positive
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60282083A
Other languages
English (en)
Other versions
JPS62143099A (ja
Inventor
孝雄 入間野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60282083A priority Critical patent/JPH0711759B2/ja
Publication of JPS62143099A publication Critical patent/JPS62143099A/ja
Publication of JPH0711759B2 publication Critical patent/JPH0711759B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、音声区間と音声のない区間の連続した入力音
から、その音声区間を検出する、音声認識等における音
声区間検出方法に関する。
(従来の技術) 従来、音声認識等における音声区間の検出は次に示すよ
うな方法で行なわれていた。
すなわち、第2図は従来の音声区間検出を行なう場合
の、発声者とマイクロホンとの位置関係を示す平面図、
第3図は本発明または従来技術の計算アルゴリズムを示
すフローチャートである。第2図において、1は発声
者、2及び3はそれぞれ正及び副のマイクロホンであ
り、それらは等しい特性を有し、正のマイクロホン2は
発声者1の正面20cmの位置に設置され、副のマイクロホ
ン3は上記正のマイクロホン2の側方80cmの位置に設置
されている。このような発声者1と正副のマイクロホン
2,3の関係位置において、第3図に示すように、まず、
正のマイクロホン2により、音声が入力される以前の周
囲ノイズのパワレベルを学習しておき(ステップ1,S1と
略す、以下、同様)、以後、正のマイクロホン2の出力
パワレベルの監視を続け、スレショルドパワレベルPth
より大である時間が、スレショルド時間Tth以上続いた
とき、その区間を検出すべき音声区間候補とし(S2)、
その監視は上記の条件が満足されるまで続行される。
音声区間候補が得られれば、その区間における正のマイ
クロホン2の平均出力のパワレベル(dB)と、副のマイ
クロホン3の平均出力のパワレベル(dB)とのレベル差
を算出し、それがスレショルドレベル差Lth大なるとき
は、その区間を音声区間とし(S3)、上記の条件が満た
されない時は、その音声区間候補を棄却し、さらに正の
マイクロホン2が出力するパワレベルの監視を続行する
(S4)。
なお、上記のスレショルドパワレベルPthは、上記のチ
ェックした周囲ノイズのパワレベルに、予め定めた適当
な値を加えた値とし、またスレショルド時間Tth及び正
のマイクロホン2と副のマイクロホン3が出力するパワ
レベルのスレショルドレベル差Lthは、予め、それぞれ
に定めた値とする。
第4図及び第5図は上記の従来例を具体的に示す図で、
第4図は発声者1(第2図)が一例として「アサヒ」と
発声した時の正のマイクロホン2の出力のパワレベルを
示し、第5図はその時の副のマイクロホン3が出力する
パワレベルを示している。横軸は時間、縦軸がパワレベ
ルであり、4はスレショルドパワレベルPth、5,5′はノ
イズ区間、6,6′はそれぞれ正、副の各マイクロホン2,3
の出力パワレベルである。
これら第4図及び第5図を対比してみると、通常の周囲
ノイズレベル7より大きな十分遠方からのノイズが印加
されたとき、そのノイズのノイズ区間5,5′のパワレベ
ルはほぼ等しい。ところが発声者1と正のマイクロホン
2及び副のマイクロホン3との距離が第2図のように正
面20cmと、さらにそれから側方80cmであるため、正のマ
イクロホン2の出力パワレベルは副のマイクロホン3の
パワレベルよりも約12dB大きい。したがって、この場
合、正副のマイクロホン2,3のスレショルドレベル差をL
th=6dBと定めておけば、ノイズ区間5,5′を検出せずに
正しい音声区間8が検出できることになる。
次に第2の従来例を、第2図のマイクロホン設置として
第3図を援用して説明する。この第2の従来例では、副
のマイクロホン3も周囲ノイズのパワレベルを予め学習
しておく。音声区間候補を第1の従来例と同様にして求
めた後(S1)、その音声区間候補において、正、副それ
ぞれのマイクロホン2,3の出力における平均S/N比を求
め、その値の差がS/N比のスレショルドS/Nthより大きい
時に、その区間を音声区間8として検出するものであ
る。なお、S/N比を求めるときのノイズNの値は、最
初、正及び副のマイクロホン2及び3が予め定めた周囲
ノイズのレベルを用いる。
つまり、第2の従来例はレベルの絶対値によるものでは
なく、マイクロホンそれぞれが出力するパワレベルによ
るS/Nを比較して音声区間8を決定するものである。
この第2の従来例においては正、副のマイクロホン2,3
に感度の異なるものを使用した場合でも、第1の従来例
の場合と同様な音声区間8の検出が可能である。
以上説明したように、音声区間の検出は従来の方法で
も、第4図及び第5図のように正、副のマイクロホン2,
3の入力関係が成立する限り十分可能である。
(発明が解決しようとする問題点) しかしながら、上述のような従来の音声区間検出の方法
は、使用する正、副のマイクロホン2,3設置位置が離隔
しているため、ノイズ源が正のマイクロホン2に近接し
ている場合などでは、ノイズと音声の識別が不可能にな
り、音声区間の検出を誤る欠点があった。
本発明は上記の欠点を排除した音声区間の検出方法の提
供を目的とする。
(問題点を解決するための手段) 本発明は上記の目的を達成するため、正副2個のマイク
ロホンを用い、その正のマイクロホンを指向性マイクロ
ホンとし、発声者の音声と周囲ノイズとのS/N比を大と
するため発声者に向けて設置し、また副のマイクロホン
は無指向性か、または上記正のマイクロホンよりも指向
性が弱いマイクロホンとして、正のマイクロホンの近傍
に設置させ、それら正及び副のマイクロホンに上記発声
者の音声と周囲ノイズを入力して得られる出力パワレベ
ル差または比のうち、上記発声者の音声区間に対する上
記出力パワレベル差または比が、周囲ノイズに対するよ
りも小であることを利用して、音声区間の検出を行なう
ようにしたものである。
(作 用) 本発明は上述した構成をとるから、近接して設置した指
向性の異なる2つのマイクロホンによる出力パワレベ
ル、またはS/N比を比較することにより、真の音声とノ
イズを容易に識別することが可能となり、したがって、
ノイズ区間を音声区間として検出する間違いは殆どあり
得ず、そのため確度の高い優れた音声区間の検出が可能
となる。
(実施例) 以下、本発明を実施例により図面を用いて詳細に説明す
る。
第1図は本発明の一実施例を示すマイクロホン配置図
で、9は指向性を有する正のマイクロホン、10は副のマ
イクロホンで無指向性か、または正のマイクロホン9よ
りも指向性の弱いマイクロホンであって、それら両マイ
クロホン9,10は発声者11に正対して20cmの距離に設置さ
れている。このように設置した2個のマイクロホン9,10
の出力パワレベルから、発声者11による音声区間検出の
アルゴリズムは、前述第1の従来例の発声区間検出と同
様で、前述第3図のフローチャートの通りである。な
お、正、副のマイクロホン9,10は正面感度が等しくなる
ように設置され、また、マイクロホン出力のスレショル
ドレベル差Lthは、0より少し小さい値を選び本実施例
では−1dBに設定してある。
上記、第1図のマイクロホン配置において、発声者11が
「アサヒ」と発声した時の、正のマイクロホン9の出力
パワレベルを第4図のとおりとするとき、副のマイクロ
ホン10の出力パワレベルは、正のマイクロホン9と副の
マイクロホン10の感度が揃い、発声者11に正対している
ところから正のマイクロホン9の出力パワレベル6(第
4図)とほぼ等しいパワレベル6″を有する第6図に示
すようなものとなり、かつ、そのパワレベルはスレショ
ルドパワレベルPth4(第4図)よりも大きいことから、
それら出力パワレベル6,6″の部分が検出すべき音声区
間8,8″であり、音声区間検出を誤ることはない。
一方、通常のノイズレベル7(7″)より大きなノイズ
区間5(5″)においては、そのノイズが正対する発声
者11から生じたものでない限り、副のマイクロホン10の
指向性の方が、正のマイクロホン9のそれよりもブロー
ドであることから、出力パワレベルはその指向性の分だ
け副のマイクロホン10の方が高いレベルを示し、そのた
め、そのノイズ区間5(5″)が音声区間として誤り検
出されることはない。
つぎに第2の実施例を説明する。マイクロホン及びその
配置等は第1図の通りとし、副のマイクロホン10も正の
マイクロホン9と同様、周囲ノイズレベルの学習を行
い、また音声区間検出に使用するパワレベルは第1の実
施例が絶対値を使用するのに対して、正、副のマイクロ
ホン9,10におけるS/N比を使用し、音声区間候補におけ
る正、副のマイクロホン9,10出力それぞれのS/N比の差
を、S/N比のスレショルドS/Nthと比較して音声区間の検
出を行なう点が、第1の実施例とは異なる。この実施例
は前記第1の実施例が感度の揃ったマイクロホンを使用
するに対し、感度の異なるマイクロホンを使用しても、
スレショルドS/Nth等の調整が不要な利点があり、勿
論、第1の実施例と同じ効果を招来することは明らかで
ある。
(発明の効果) 以上説明して明らかなように、本発明は、指向性を有す
る正のマイクロホンと、無指向性、または弱指向性の副
のマイクロホンを使用して、それら正及び副のマイクロ
ホンに発声者の音声と周囲ノイズを入力して得られる出
力パワレベル差または比のうち、上記発声者の音声区間
に対する上記出力パワレベル差または比が、周囲ノイズ
に対するよりも小であることを利用して、音声区間検出
を確度高く行なうものであり、従来例が発声者と反対の
位置からのノイズであっても音声区間として検出をする
ような欠点があったのを排除できる利点があり、音声認
識等に実施して大いに効果がある。
【図面の簡単な説明】
第1図は本発明を実施するためのマイクロホンの配置
図、第2図は、従来例におけるマイクロホンの配置図、
第3図は本発明及び従来例の音声区間検出方法を示すフ
ローチャート、第4図は本発明及び従来例における正の
マイクロホンの出力パワレベルの図、第5図は従来例に
おける副のマイクロホンの出力パワレベルの図、第6図
は本発明における副のマイクロホンの出力パワレベルの
図である。 1,11……発声者、2,9……正のマイクロホン、3,10……
副のマイクロホン、4……スレショルドパワレベル(Pt
h)、5,5′,5″……ノイズ区間、6,6′,6″……出力パ
ワレベル、7,7′,7″……周囲ノイズレベル、8,8′,8″
……音声区間。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】指向性を有するマイクロホンを正のマイク
    ロホンとし、それよりも指向正が弱いか、または無指向
    性のマイクロホンを副のマイクロホンとして、発声者に
    対向させて略々同一位置に設置し、それら正及び副のマ
    イクロホンに上記発声者の音声と周囲ノイズを入力して
    得られる出力パワレベル差または比のうち、上記発声者
    の音声区間に対する上記出力パワレベル差または比が、
    周囲ノイズに対するよりも小であることを利用して、音
    声区間の検出を行なうことを特徴とする音声認識等にお
    ける音声区間検出方法。
JP60282083A 1985-12-17 1985-12-17 音声認識等における音声区間検出方法 Expired - Lifetime JPH0711759B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60282083A JPH0711759B2 (ja) 1985-12-17 1985-12-17 音声認識等における音声区間検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60282083A JPH0711759B2 (ja) 1985-12-17 1985-12-17 音声認識等における音声区間検出方法

Publications (2)

Publication Number Publication Date
JPS62143099A JPS62143099A (ja) 1987-06-26
JPH0711759B2 true JPH0711759B2 (ja) 1995-02-08

Family

ID=17647901

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60282083A Expired - Lifetime JPH0711759B2 (ja) 1985-12-17 1985-12-17 音声認識等における音声区間検出方法

Country Status (1)

Country Link
JP (1) JPH0711759B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6324509B1 (en) * 1999-02-08 2001-11-27 Qualcomm Incorporated Method and apparatus for accurate endpointing of speech in the presence of noise

Also Published As

Publication number Publication date
JPS62143099A (ja) 1987-06-26

Similar Documents

Publication Publication Date Title
US10602267B2 (en) Sound signal processing apparatus and method for enhancing a sound signal
CN110770827B (zh) 基于相关性的近场检测器
US8798993B2 (en) Speech detector
US8565446B1 (en) Estimating direction of arrival from plural microphones
CN102077274B (zh) 多麦克风语音活动检测器
US20050276419A1 (en) Sound source localization based on binaural signals
CN110830870B (zh) 一种基于传声器技术的耳机佩戴者语音活动检测系统
US7792313B2 (en) High precision beamsteerer based on fixed beamforming approach beampatterns
KR100992656B1 (ko) 음향 및 비음향 센서를 이용한 유성음 및 무성음 감지시스템 및 방법
JP4812302B2 (ja) 音源方向推定システム、音源方向推定方法及び音源方向推定プログラム
US10939198B2 (en) Noise eliminating device, echo cancelling device, and abnormal sound detecting device
JPH0711759B2 (ja) 音声認識等における音声区間検出方法
KR101203926B1 (ko) 다중 빔포머를 이용한 잡음 방향 탐지 방법
US11212608B2 (en) Noise elimination device and noise elimination method
Maraboina et al. Multi-speaker voice activity detection using ICA and beampattern analysis
JP2000041228A (ja) 話者位置検出装置
US20070244952A1 (en) Signal analysis methods
Choi et al. Noise-Resistant Sound Source Localization Based on Filter Banks in Disaster Scenarios
JP3332144B2 (ja) 目的音源領域検出方法およびその装置
US20250124939A1 (en) Multi-channel noise reduction for headphones
KR101022309B1 (ko) 도착시간지연 특성행렬을 이용한 음원 위치 측정 장치 및 음원 위치 측정 방법
Kim et al. Two-microphone voice activity detection in the presence of coherent interference.
Seo et al. RoSS: Rotation-induced Aliasing for Audio Source Separation
JP2576044B2 (ja) 信号追尾方法
JPH04322599A (ja) 話者方位検出装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term