JPH0371720B2 - - Google Patents
Info
- Publication number
- JPH0371720B2 JPH0371720B2 JP59099115A JP9911584A JPH0371720B2 JP H0371720 B2 JPH0371720 B2 JP H0371720B2 JP 59099115 A JP59099115 A JP 59099115A JP 9911584 A JP9911584 A JP 9911584A JP H0371720 B2 JPH0371720 B2 JP H0371720B2
- Authority
- JP
- Japan
- Prior art keywords
- threshold
- circuit
- output
- level
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000001514 detection method Methods 0.000 claims description 46
- 230000005236 sound signal Effects 0.000 claims description 28
- 238000009825 accumulation Methods 0.000 claims description 16
- 230000001186 cumulative effect Effects 0.000 claims description 5
- 230000002441 reversible effect Effects 0.000 description 17
- 206010019133 Hangover Diseases 0.000 description 13
- 238000010586 diagram Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002996 emotional effect Effects 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- ZYHMJXZULPZUED-UHFFFAOYSA-N propargite Chemical compound C1=CC(C(C)(C)C)=CC=C1OC1C(OS(=O)OCC#C)CCCC1 ZYHMJXZULPZUED-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Time-Division Multiplex Systems (AREA)
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、音声信号の有無を判定する音声検出
方法及び回路に関する。 (従来技術とその問題点) 音声検出回路は主にDSI(Digital Speech
Interpolationの略称である。)装置に組み込ま
れ、DSI装置への入力チヤンネルに音声信号が存
在するか否かを判定するために用いられる。 尚、DSI装置に関しては、例えば1976年3月発
行の文献、「コムサツト テクニカル レビユー
(COMSAT TECHNICAL REVIEW)」vol.6No.
1の第127〜158頁に掲載されているエス・ジエ
ー・キヤムパネラ(S.J.Campanella)による論
文、デイジタル スピーチ インターポレーシヨ
ン(Digital Speech Interpolation)」に詳述さ
れているので参照されたい。 従来、ハードウエア規模が簡単で検出論理が明
瞭である方法としてレベル検出法が知られている
が、この方法は入力信号の信号エネルギー(電力
及び振幅)を検出後、閾値と比較することにより
音声信号の有無を判定するものである。またレベ
ル検出法を用いた音声検出器の中で、入力信号の
振幅と予め定められた閾値とを比較する固定閾値
型音声検出器が、最もハードウエア規模が簡単で
かつ、確実な音声検出器として知られている。 次に図面を参照しながら、この固定閾値型音声
検出器の原理を説明する。 第1図は固定閾値型音声検出器の原理を示すブ
ロツク図であり、信号入力端子1、振幅閾値入力
端子2、振幅比較回路3、累積回路4、累積回路
への入力信号として+1、−1を与える増加・減
少制御線5および6、音声検出用フリツプフロツ
プ7、音声検出用フリツプフロツプセツト・リセ
ツト制御線8および9、音声検出結果出力端子1
0からなつている。なお、この場合累積回路は可
逆カウンタ(アツプダウン・カウンタ)で置換で
きる。 図において、端子1より入力される入力信号は
標本化周期ごとに振幅比較回路3において、端子
2より入力される予められた振幅閾値(THa)
と比較される。その結果、入力信号振幅が振幅閾
値よりも大きいと、累積回路増加制御線5を使つ
て累積回路4の内容が1だけ増加される。また、
逆に入力信号振幅が振幅閾値よりも小さいと、累
積回路減少制御線6を使つて累積回路4の内容が
1だけ減少される。但し、累積回路の内容は負の
値にならないようになつている。 音声信号が到来し、振幅閾値を超える入力が多
くなると、累積回路の内容は順次増加する。もち
ろん、その間に振幅閾値以下の入力が加わると、
累積回路の内容は1だけ減少する。このようにし
て、累積回路の内容が予め設定された持続時間の
閾値(THt)に達すると、音声検出用フリツプ
フロツプのセツト制御線8を使つて音声検出用フ
リツプフロツプ7がセツトされ、音声が検出され
たことになり、端子10よりその結果が出力され
る。 また、音声が検出されなくなると、例えば、そ
れは累積回路4の内容が0になることで示される
が、その時、音声検出用フリツプフロツプ7は音
声検出用フリツプフロツプのリセツト制御線9を
使つてリセツトされ、端子10よりその結果が出
力されるが、一般にはある一定時間の後にリセツ
トされる。これは、ハングオーバーと称され、通
話中の単語や句の間での切断に耳が敏感であるこ
とから設けられており、その時間長は100〜
250ms程度である。 さらに理解を深めるために第1図で示される固
定閾値型音声検出器に第2図のaの11で示され
る信号が入力した場合を例にとつて説明を加え
る。 第2図では、入力信号11、振幅閾値12、累
積回路の内容13、持続時間の閾値14および音
声検出結果出力15を示している。 まず、入力信号11が端子1から入力される
と、標本化周期Tsごとに振幅比較回路3により
振幅閾値12と比較される。第2図から判るよう
に時刻ta1になつて始めて入力信号の振幅の方が
振幅閾値よりも大きくなるので累積回路の内容1
3は時刻ta1で始めて1になり(第2図b)、以
後、時刻ta2まで1ずつ増加されていく。その結
果、時刻tb1になつて累積回路の内容13が持続
時間の閾値14よりも大きくなるので、音声が検
出されたことになり、出力15は1になる。とこ
ろで、時刻ta3になると、入力信号11の振幅が
振幅閾値12よりも小さくなるで、累積回路の内
容13は1ずつ減少していき、時刻tb2になり、
持続時間の閾値14よりも小さくなるので音声信
号が無くなつたと判定され前述の理由でハングオ
ーバーが付加されハングオーバー終了後、出力1
5は0になる。第2図のcにおけるTHがハング
オーバー時間を示している。 以上説明してきた様な固定閾値型音声検出器で
は確かにハードウエア規模は簡単ではあるが、一
度閾値が設定されると閾値以上のレベルであれば
雑音でも検出してしまうという欠点があつた。 (発明の目的) 本発明の目的は、入力信号中に含まれる雑音電
力に応じて変動する閾値を有し、雑音の誤検出の
発生頻度を低下させかつ音声検出能力を向上させ
た可変閾値型音声検出器を提供することにある。 (発明の構成) 本発明によれば、標本時刻毎に入力される音声
信号と該音声信号の無音区間雑音レベルに応じて
変動する第1及び第2の閾値との大小判定結果を
累積し、該累積値と第3の閾値とを比較し入力信
号の信号レベルを判定し、該判定結果が高信号レ
ベルから低信号レベルに変わつた場合に予め定め
られた時間を該判定結果に有音区間として付加し
て出力を得る音声検出方法において、 前記第3の閾値として高いレベルの予め定めら
れた閾値と雑音レベルに応じて決定される低いレ
ベルの閾値とを用意し、前記音声検出出力が音声
信号有りを知らせる時には低いレベルの閾値を用
い、前記音声検出出力が音声信号無しを知らせる
時には高いレベルの閾値を用いて音声検出を行な
い付加された有音区間でも雑音に応じて決定され
る低いレベルの閾値を用いることを特徴とする音
声検出方法が得られる。 また本発明によれば、標本時刻毎に入力される
入力信号の無音区間雑音レベルを計算する雑音電
力計算回路と、該雑音電力計算回路の出力に応じ
て変動する第1及び第2の閾値を発生する第1の
閾値発生回路と、前記入力信号と前記第1及び第
2の閾値との大小判定を行ないその結果を出力す
るレベル検出回路と該レベル検出回路の出力を累
積する累積回路と、前記第1の閾値発生回路より
出力される前記第2の閾値を入力し該第2の閾値
のレベルに応じて予め定められた複数個の低いレ
ベルの閾値の中から1つを選択し出力する選択回
路と、該選択回路から出力される閾値と予め定め
られた高いレベルの閾値とを入力し、後述する出
力保持回路の出力が音声信号有りを知らせる時に
は前記選択回路から出力される低いレベルの閾値
を選択し、前記出力保持回路の出力が音声信号無
しを知らせる時には前記予め定められた高いレベ
ルの閾値を選択し第3の閾値として出力する第2
の閾値発生回路と、 前記累積回路の出力と前記第2の閾値発生回路
から出力される第3の閾値とを比較することによ
り音声信号の有無を判定する判定回路と、該判定
回路の出力が音声信号有りから無しに変わつた場
合に予め定められた時間を前記判定回路の出力に
有音区間として付加する出力保持回路とから少な
くとも構成され、振幅閾値(第1及び第2の閾
値)と有音区間で使用する第3の閾値を雑音レベ
ルに応じて変動させることを特徴とした音声検出
回路が得られる。 (実施例) 本発明は上述の構成をとり、振幅閾値(第1及
び第2の閾値)と有音区間で使用する第3の閾値
(TH3L)とを雑音レベルに応じて適応的に変え
ることにより雑音による誤検出を増加させること
なく、音声検出能力を向上させている。 本発明を図面を参照しながら詳細に説明する。
第3図は本発明の一実施例であり、入力端子2
0、偶数ビツト反転回路21、符号変換回路2
2、整流回路23、電力計算回路24、第1の閾
値発生回路25、レベル検出回路26、累積回路
27、比較回路28、第2の閾値発生回路29、
可逆カウンタ30、カウンタ設定回路31、判定
回路32、出力端子33及び選択回路34から構
成されている。 例えば、国際電信電話諮問委員会、(CCITT;
Comite´ Consultatif International T´
elegraphaique et T´ele´phonique)からの勧
告案G.711に基づき非線形符号化され、8ビツト
のA−Law符号(オレンジブツクVol.−2,
pp409〜410参照のこと。)となつた入力信号が入
力端子20から入力する場合を例にとつて説明を
加える。通常、電話回線を伝送されるA−Law
符号信号はMSB(Most Significant Bitの略
称である。)側からみて、偶数ビツト目が反転さ
れているので、偶数ビツト反転回路21により入
力信号は偶数ビツトが反転され伝送される前のも
との信号に戻される。もとに戻つたA−Law符
号信号は符号変換回路22で、第4図で示すよう
に、正のA−Law符号信号に対してはMSBだけ、
負のA−Law符号信号に対しては全ビツト反転
され8ビツトの2の補数(Tw´os complement)
符号信号に変換され、整流回路23へ入力され
る。整流回路23では、この入力信号を絶対値信
号(大きさのみを表わす信号)に変換し、一方は
電力計算回路24へ、もう一方はレベル検出回路
26へ送り出す。 電力計算回路24では、入力信号に含まれる雑
音を取り出し、雑音の実効値を計算する。 具体的には、音声が検出されない時(例えば、
後述する比較回路28の出力が0の時)はすべて
の入力信号を雑音とみなすとともに、音声が検出
された時(例えば後述する比較回路28の出力が
1の時)であつても予め定めれたレベル以下の信
号は雑音であるとみなし、この雑音を低域通過フ
イルタに入力することにより雑音の実効値を計算
し、その結果を第1の閾値発生回路25に送出す
る。従つて、雑音の実効値を計算する際に除外さ
れる音声信号とは、後述の比較回路の出力が1で
ありかつ、予め定められたレベル以上の信号レベ
ルを有する信号である。第1の閾値発生回路25
では、電力計算回路24からの出力を定数倍する
ことにより、レベル検出回路26で使用される第
1の閾値(TH1)と、第1の閾値より6dB高い
所に第2の閾値(TH2)とを設定し、レベル検
出回路26へ送出する。 レベル検出回路26では、整流回路23の出力
と、第1の閾値発生回路25より送出される第1
閾値及び第2の閾値とを比較し、整流回路の出力
が第2の閾値より大きい場所には入力信号が音声
信号である確率が高いので+2、第1の閾値と第
2の閾値との間に位置する場合には入力信号が音
声信号である確率と雑音である確率とがほぼ等し
いかあるいは前者が少し高い程であるので+1、
第1の閾値より小さい場合には入力信号が雑音で
ある確率が高いので−1を出力する。累積回路2
7ではレベル検出回路26の出力を累積しており
その累積値を比較回路28へ送出する。比較回路
28では、後述する第2の閾値発生回路29から
出力される第3の閾値(TH3)と前記累積値と
を比較し、後者が前者よりも大きい場合には入力
信号が音声信号であると判定し、+1を、また、
前者が後者よりも大きい場合には入力は雑音であ
ると判定し0を出力する。 選択回路34では、前述の第1の閾値発生回路
より出力される第2の閾値(TH2)のレベルに
応じて、予め定められた複数個の低いレベルの閾
値の中から1つを選択し出力する。 第2の閾値発生回路29では、前記選択回路か
ら出力される低いレベルの閾値(TH3L)とあら
かじめ定められた高いレベルの閾値(TH3H)
とを入力し、後述する判定回路32の出力が0の
場合(無音時)には前記予め定められた高いレベ
ルの閾値を選択し、また、後述する判定回路32
の出力が1の場合(有音時)には前記選択回路よ
り出力される低いレベルの閾値を選択し、前記比
較回路28で使用する第3の閾値として出力す
る。 可逆カウンタ30では、前記比較回路28の出
力を入力し、該入力信号が1の時にはカウンタの
内容を1だけ増加させ、0の時にはカウンタの内
容を1だけ減少させ前記比較回路の出力を累積し
ている。また、カウンタ設定回路31は前記比較
回路の出力を監視しておりその出力が1から0に
変化する時点を検出し、その時点で、前記可逆カ
ウンタ30の内容を予め定められた値に設定す
る。判定回路32では、前記可逆カウンタ30の
内容が予め定められた値(通常は0を用いる。)
より大きい場合に音声信号が検出されたとして1
を出力端子33を介して外部に出力する。もちろ
ん小さい場合には0を出力するがこうすることに
より前述のハングオーバーも付加されることにな
る。 第3図における電力計算回路24及び第1の閾
値発生回路25としては第5図の回路が使用で
き、絶対値信号入力端子50、雑音判定レベル入
力端子51、比較回路出力信号入力端子52、比
較器53、論理和回路54、乗算器55,56,
57,58、被乗数入力端子59,60,61,
62,63、被乗数選択器64、加算器65、リ
ミツター66,67、メモリー68、第1の閾値
出力端子69および第2の閾値出力端子70から
構成されている。絶対値入力信号は入力端子50
より入力され、一方は乗算器55へ、もう一方は
比較器53へ送られる。比較器53では、前記入
力信号と入力端子51より入力される雑音判定レ
ベルと比較され、前者が後者よりも大きい場合に
0、小さい場合に+1を出力し、論理和回路54
では、比較器53の出力信号と、比較回路28か
らの出力信号を反転した信号との論理和がとら
れ、少なくともどちらか一方が+1のときに+1
が出力され、乗算器56の制御信号及び、被乗数
選択器64の選択制御信号となる。前記被乗数選
択器64では、前記選択制御信号が+1の時には
被乗数入力端子59より入力される被乗数が選択
され、また、0の時には被乗数入力端子60より
入力される被乗数(現在は0を用いている。)が
選択され乗算器55の被乗数となる。 また、乗算器55では、絶対値入力信号と前述
のようにして選択された被乗数との積がとられ加
算器65へ送られる。一方、乗算器56では被乗
数入力端子61より入力される被乗数とメモリー
68の内容との積がとられ加算器65へ送られ
る。 但し、論理和回路54の出力が0の時はこの乗
算は行なわずメモリー68の内容がそのまま出力
される。そして、加算器65で前述の乗算器55
の出力と乗算器56の出力との加算が行なわれそ
の結果がリミツター66を介してメモリー68に
備えられる。また、それと同時にリミツター66
の出力は乗算器57により、被乗数入力端子62
より入力される被乗数との積がとられ、雑音の実
効値(σ)と等しくなり、リミツター67を介し
て第1の閾値(TH1)として、出力端子69よ
り出力される。 また、リミツター67の出力は、乗算器58で
被乗数入力端子63より入力される被乗数(現在
は2を用いている。)との積がとられ、第2の閾
値(TH2)として、出力端子70より出力され
る。 ここで、リミツター66,67を用いているの
はメモリー68の内容及び閾値(TH1)の可変
領域を制限することにより閾値調整速度を敏速に
かつ、音声検出器の受信感度および感動レベル範
囲を制限し、雑音に対する免疫性を保証するため
である。 尚、電力計算回路24は前述の様に絶対値信号
を一次の低域通過フイルタに通すことにより、雑
音のレベルを算出していたが、それは振幅分布が
Gauss分布であり分散がσ2である雑音をその絶対
値をとつて一次の低域通過フイルタに通して得ら
れる電力Pが次式で表す様に近似的に標準偏差
(実効値とも云いσで表す5に比例した値となる
ためである。 ここで∫∞ 0x exp{−x2/(2σ2)}dx (x2=yとおくと、2xdx=dy) ∫∞ 01/2exp{−y/(2σ2)}dy =σ2 ゆえに(1)式は次のようになる。 従つて、前記処理を施す事により、一次の低域
通過フイルタの出力で雑音振幅の標準偏差σにほ
ぼ比例した値が得られ、その値を定数倍すれば雑
音振幅の標準偏差(実効値σ)が得られることに
なる。 第3図で用いられる可逆カウンタ30、カウン
タ設定回路31及び判定回路32としては、第6
図の回路が使用でき、入力端子71、1サンプル
遅延回路72、論理積回路73、カウンタ設定値
入力端子74、可逆カウンタ75、比較回路7
6、閾値入力端子77及び出力端子78から構成
されており、破線で囲まれた30,31,32は
それぞれ第3図で示す可逆カウンタ、カウンタ設
定回路、判定回路を示している。入力端子71よ
り入力された入力信号は一方は可逆カウンタ75
へ、もう一方は1サンプル遅延回路72及び論理
積回路73へ送られる。 論理積回路73では現入力信号を反転した信号
と1サンプル時刻前の入力信号との積がとられ、
その結果を可逆カウンタ75へ送出する。可逆カ
ウンタ75では入力信号が1の時にはカウンタの
内容を1だけ増加させ、また、0の時にはカウン
タの内容を1だけ減少させるとともに、前記論理
積回路の出力が1の時、すなわち、入力信号が1
から0に変化する時に、カウンタの内容を強制的
にカウンタ設定値入力端子74から入力される予
め定められた値に設定される。比較器76では閾
値入力端子77より入力される閾値(実際は0を
使用している。)と前記可逆カウンタ75から出
力されるカウンタの内容とを比較し、カウンタの
内容が大きい場合に1を出力端子78を介して外
部に出力する。 また第3図の如く第2の閾値発生回路29を設
け比較回路28で使用される第3の閾値(TH3)
として、判定回路32の出力を選択信号とし、該
選択信号が1の時には低いレベルの第3の閾値
(TH3L)を、0の時には高いレベルの第3の閾
値(TH3H)を選択し使用しているが、これは
比較回路28の出力にヒステリシスを設けること
により音声検出器の過剰なON−OFFを避けるた
めであり、以下に述べる様に語中脱落や語尾切断
が減少する。 例えば、第7図aで示す音声信号(波形130
および131を含む。)が入力された場合を考え
る。波形130が到来し、レベル検出回路26に
おいて第1および第2の閾値と比較されその結
果、第7図bで示す波形132の様な出力が累積
回路27の出力として得られたとすると、比較回
路28では、累積回路27の出力波形132と変
化波形134で示す第3の閾値とが比較される。 第7図bで示す様に、時刻T1までは第3の閾
値の変化波形134の方が累積回路27の出力波
形132よりも大きいので音声信号は検出されな
いが時刻T1で後者の方が大きくなるので比較回
路28の出力波形135は1となり、出力保持用
可逆カウンタ30の内容波形137も増加し始め
る。従つて出力端子33の出力波形138も1と
なり音声信号が検出されたことになる。 ところで、時刻T1までは出力端子33の出力
が0であるので第3の閾値としては高いレベルの
第3の閾値(TH3H)が選択されていたが、時刻
T1以後は出力端子33の出力が1となるので、
第7図bの変化波形134で示す様に低いレベル
の第3の閾値(TH3L)が選択される。 その後、第7図aに示す入力波形130の振幅
が小さくなり、時刻T2で累積回路27の出力波
形132が第3の閾値の変化波形134より小さ
くなると、比較回路28の出力波形135は第7
図cに示す様に0になる。しかしながら、可逆カ
ウンタ30の内容波形137は第7図cで示す様
に、すぐには0にならずデータ設定回路31によ
りハングオーバー用のデータがセツトされるので
第7図dに示した端子33の出力波形にはハング
オーバーが付加される。 そこで、ハングオーバーが付加されている時に
入力端子20に第7図aで示す波形131が到来
すると、第7図bで示す様に時刻T3で累積回路
27の出力波形133が第2の閾値発生回路29
の出力する第3の閾値を示す変化波形134より
大きくなるので、比較回路の28の出力波形13
6は、第7図cで示す様に1となり、出力保持用
可逆カウンタ30の内容137は再び増加してゆ
く。 そして、第7図bで示す様に累積回路27の出
力波形133が時刻T4で第3の閾値を示す変化
波形134よりも小さくなると比較回路28の出
力波形136は第7図cで示す様に0になり、前
述の様に可逆カウンタ30にハングオーバー用の
データがセツトされハングオーバーが付加される
ことになる。 そして、時刻T5になるとハングオーバーが終
了するので、出力端子33の出力波形138(第
7図d)が0となり、第3の閾値は再び高いレベ
ルの第3の閾値が選択されることになる。 このように、第3の閾値を出力端子33の出力
によつて高いレベルの第3の閾値(TH3H)と
低いレベルの第3の閾値(TH3L)とを使い分け
ることにより、有音区間(出力端子33の出力が
1の時)における低いレベルの音声信号(第7図
aで示す波形131)をも検出できる様になり、
語中脱落及び語尾欠落が低減される。 また本発明ではTH3L選択回路34は第8図の
グラフで示す様に、第1の閾値発生回路25より
出力される第2の閾値(TH2)を入力し、TH2
に応じて予め定められた値を選択しTH3Lとして
第2の閾値発生回路29へ出力する。 それ故、閾値TH2が入力信号に含まれる雑音
レベルに応じて決定される値であるので、TH3L
も入力信号に含まれる雑音レベルに応じて決定さ
れる値となる。 尚、第8図で示す様に第2の閾値(TH2)が
小さい程TH3Lとして小さな値を用いている。こ
れは、ハングオーバー付加時において、雑音レベ
ルが小さい程累積値の時間平均値が小さな値とな
るため累積値と第3の閾値(TH3L)との距離を
一定に保つためである。 そして、雑音レベルに依存せずこの距離を一定
に保つことにより一定の検出能力が保証されるの
で動作時間率も雑音レベルに依らず一定の値が得
られる。 それ故、第3の閾値を有音区間と無音区間とで
使いわけ、有音区間で使用する第3の閾値
(TH3L)を第8図で示す様に雑音レベルに応じ
て可変とすれば、ハングオーバー付加時に生じる
雑音による誤検出の低減が計れ、また、語中脱落
や語尾欠落も低減でき、雑音レベルに依存せず一
定の良好な動作時間率を有する音声検出器が実現
できる。 また、本実施例では有音区間で用いる第3の閾
値(TH3L)の選択回路34の出力信号として、
閾値TH2を用いたが、閾値TH1や電力計算回路
24の出力に変更しても、雑音レベルに応じて変
動するTH3Lが得られ、本発明と同じ効果が得ら
れるので本発明に含まれる。 尚、本発明で用いる選択回路34としては、
ROM(Read Only Memory)だけで構成で
きるので、簡単なハードウエアの追加だけで良
い。 さらに、無音区間で用いるTH3HもTH3Lの1
部と考えれば、選択回路34と第2の閾値発生回
路29とを1つ選択回路(例えばROM等の使用
により)で実現できるので、ハードウエアの追加
もほとんどいらない。 (発明の効果) 以上の様に本発明の可変閾値型音声検出回路で
は、PCM符号で信号処理を行なつていることに
より、ハードウエア規模が増大しないこと、雑音
レベルに応じて第1及び第2の閾値を変動させて
いるため雑音に対する免疫性が強いこと、前記閾
値の最大値・最小値を規定することにより受信感
度や感動レベル範囲を任意に設定できること、及
び有音区間と無音区間とで異なるレベルの第3の
閾値を使用していることにより、雑音レベルに依
存せず一定の良好な音声検出特性を実現できる。
方法及び回路に関する。 (従来技術とその問題点) 音声検出回路は主にDSI(Digital Speech
Interpolationの略称である。)装置に組み込ま
れ、DSI装置への入力チヤンネルに音声信号が存
在するか否かを判定するために用いられる。 尚、DSI装置に関しては、例えば1976年3月発
行の文献、「コムサツト テクニカル レビユー
(COMSAT TECHNICAL REVIEW)」vol.6No.
1の第127〜158頁に掲載されているエス・ジエ
ー・キヤムパネラ(S.J.Campanella)による論
文、デイジタル スピーチ インターポレーシヨ
ン(Digital Speech Interpolation)」に詳述さ
れているので参照されたい。 従来、ハードウエア規模が簡単で検出論理が明
瞭である方法としてレベル検出法が知られている
が、この方法は入力信号の信号エネルギー(電力
及び振幅)を検出後、閾値と比較することにより
音声信号の有無を判定するものである。またレベ
ル検出法を用いた音声検出器の中で、入力信号の
振幅と予め定められた閾値とを比較する固定閾値
型音声検出器が、最もハードウエア規模が簡単で
かつ、確実な音声検出器として知られている。 次に図面を参照しながら、この固定閾値型音声
検出器の原理を説明する。 第1図は固定閾値型音声検出器の原理を示すブ
ロツク図であり、信号入力端子1、振幅閾値入力
端子2、振幅比較回路3、累積回路4、累積回路
への入力信号として+1、−1を与える増加・減
少制御線5および6、音声検出用フリツプフロツ
プ7、音声検出用フリツプフロツプセツト・リセ
ツト制御線8および9、音声検出結果出力端子1
0からなつている。なお、この場合累積回路は可
逆カウンタ(アツプダウン・カウンタ)で置換で
きる。 図において、端子1より入力される入力信号は
標本化周期ごとに振幅比較回路3において、端子
2より入力される予められた振幅閾値(THa)
と比較される。その結果、入力信号振幅が振幅閾
値よりも大きいと、累積回路増加制御線5を使つ
て累積回路4の内容が1だけ増加される。また、
逆に入力信号振幅が振幅閾値よりも小さいと、累
積回路減少制御線6を使つて累積回路4の内容が
1だけ減少される。但し、累積回路の内容は負の
値にならないようになつている。 音声信号が到来し、振幅閾値を超える入力が多
くなると、累積回路の内容は順次増加する。もち
ろん、その間に振幅閾値以下の入力が加わると、
累積回路の内容は1だけ減少する。このようにし
て、累積回路の内容が予め設定された持続時間の
閾値(THt)に達すると、音声検出用フリツプ
フロツプのセツト制御線8を使つて音声検出用フ
リツプフロツプ7がセツトされ、音声が検出され
たことになり、端子10よりその結果が出力され
る。 また、音声が検出されなくなると、例えば、そ
れは累積回路4の内容が0になることで示される
が、その時、音声検出用フリツプフロツプ7は音
声検出用フリツプフロツプのリセツト制御線9を
使つてリセツトされ、端子10よりその結果が出
力されるが、一般にはある一定時間の後にリセツ
トされる。これは、ハングオーバーと称され、通
話中の単語や句の間での切断に耳が敏感であるこ
とから設けられており、その時間長は100〜
250ms程度である。 さらに理解を深めるために第1図で示される固
定閾値型音声検出器に第2図のaの11で示され
る信号が入力した場合を例にとつて説明を加え
る。 第2図では、入力信号11、振幅閾値12、累
積回路の内容13、持続時間の閾値14および音
声検出結果出力15を示している。 まず、入力信号11が端子1から入力される
と、標本化周期Tsごとに振幅比較回路3により
振幅閾値12と比較される。第2図から判るよう
に時刻ta1になつて始めて入力信号の振幅の方が
振幅閾値よりも大きくなるので累積回路の内容1
3は時刻ta1で始めて1になり(第2図b)、以
後、時刻ta2まで1ずつ増加されていく。その結
果、時刻tb1になつて累積回路の内容13が持続
時間の閾値14よりも大きくなるので、音声が検
出されたことになり、出力15は1になる。とこ
ろで、時刻ta3になると、入力信号11の振幅が
振幅閾値12よりも小さくなるで、累積回路の内
容13は1ずつ減少していき、時刻tb2になり、
持続時間の閾値14よりも小さくなるので音声信
号が無くなつたと判定され前述の理由でハングオ
ーバーが付加されハングオーバー終了後、出力1
5は0になる。第2図のcにおけるTHがハング
オーバー時間を示している。 以上説明してきた様な固定閾値型音声検出器で
は確かにハードウエア規模は簡単ではあるが、一
度閾値が設定されると閾値以上のレベルであれば
雑音でも検出してしまうという欠点があつた。 (発明の目的) 本発明の目的は、入力信号中に含まれる雑音電
力に応じて変動する閾値を有し、雑音の誤検出の
発生頻度を低下させかつ音声検出能力を向上させ
た可変閾値型音声検出器を提供することにある。 (発明の構成) 本発明によれば、標本時刻毎に入力される音声
信号と該音声信号の無音区間雑音レベルに応じて
変動する第1及び第2の閾値との大小判定結果を
累積し、該累積値と第3の閾値とを比較し入力信
号の信号レベルを判定し、該判定結果が高信号レ
ベルから低信号レベルに変わつた場合に予め定め
られた時間を該判定結果に有音区間として付加し
て出力を得る音声検出方法において、 前記第3の閾値として高いレベルの予め定めら
れた閾値と雑音レベルに応じて決定される低いレ
ベルの閾値とを用意し、前記音声検出出力が音声
信号有りを知らせる時には低いレベルの閾値を用
い、前記音声検出出力が音声信号無しを知らせる
時には高いレベルの閾値を用いて音声検出を行な
い付加された有音区間でも雑音に応じて決定され
る低いレベルの閾値を用いることを特徴とする音
声検出方法が得られる。 また本発明によれば、標本時刻毎に入力される
入力信号の無音区間雑音レベルを計算する雑音電
力計算回路と、該雑音電力計算回路の出力に応じ
て変動する第1及び第2の閾値を発生する第1の
閾値発生回路と、前記入力信号と前記第1及び第
2の閾値との大小判定を行ないその結果を出力す
るレベル検出回路と該レベル検出回路の出力を累
積する累積回路と、前記第1の閾値発生回路より
出力される前記第2の閾値を入力し該第2の閾値
のレベルに応じて予め定められた複数個の低いレ
ベルの閾値の中から1つを選択し出力する選択回
路と、該選択回路から出力される閾値と予め定め
られた高いレベルの閾値とを入力し、後述する出
力保持回路の出力が音声信号有りを知らせる時に
は前記選択回路から出力される低いレベルの閾値
を選択し、前記出力保持回路の出力が音声信号無
しを知らせる時には前記予め定められた高いレベ
ルの閾値を選択し第3の閾値として出力する第2
の閾値発生回路と、 前記累積回路の出力と前記第2の閾値発生回路
から出力される第3の閾値とを比較することによ
り音声信号の有無を判定する判定回路と、該判定
回路の出力が音声信号有りから無しに変わつた場
合に予め定められた時間を前記判定回路の出力に
有音区間として付加する出力保持回路とから少な
くとも構成され、振幅閾値(第1及び第2の閾
値)と有音区間で使用する第3の閾値を雑音レベ
ルに応じて変動させることを特徴とした音声検出
回路が得られる。 (実施例) 本発明は上述の構成をとり、振幅閾値(第1及
び第2の閾値)と有音区間で使用する第3の閾値
(TH3L)とを雑音レベルに応じて適応的に変え
ることにより雑音による誤検出を増加させること
なく、音声検出能力を向上させている。 本発明を図面を参照しながら詳細に説明する。
第3図は本発明の一実施例であり、入力端子2
0、偶数ビツト反転回路21、符号変換回路2
2、整流回路23、電力計算回路24、第1の閾
値発生回路25、レベル検出回路26、累積回路
27、比較回路28、第2の閾値発生回路29、
可逆カウンタ30、カウンタ設定回路31、判定
回路32、出力端子33及び選択回路34から構
成されている。 例えば、国際電信電話諮問委員会、(CCITT;
Comite´ Consultatif International T´
elegraphaique et T´ele´phonique)からの勧
告案G.711に基づき非線形符号化され、8ビツト
のA−Law符号(オレンジブツクVol.−2,
pp409〜410参照のこと。)となつた入力信号が入
力端子20から入力する場合を例にとつて説明を
加える。通常、電話回線を伝送されるA−Law
符号信号はMSB(Most Significant Bitの略
称である。)側からみて、偶数ビツト目が反転さ
れているので、偶数ビツト反転回路21により入
力信号は偶数ビツトが反転され伝送される前のも
との信号に戻される。もとに戻つたA−Law符
号信号は符号変換回路22で、第4図で示すよう
に、正のA−Law符号信号に対してはMSBだけ、
負のA−Law符号信号に対しては全ビツト反転
され8ビツトの2の補数(Tw´os complement)
符号信号に変換され、整流回路23へ入力され
る。整流回路23では、この入力信号を絶対値信
号(大きさのみを表わす信号)に変換し、一方は
電力計算回路24へ、もう一方はレベル検出回路
26へ送り出す。 電力計算回路24では、入力信号に含まれる雑
音を取り出し、雑音の実効値を計算する。 具体的には、音声が検出されない時(例えば、
後述する比較回路28の出力が0の時)はすべて
の入力信号を雑音とみなすとともに、音声が検出
された時(例えば後述する比較回路28の出力が
1の時)であつても予め定めれたレベル以下の信
号は雑音であるとみなし、この雑音を低域通過フ
イルタに入力することにより雑音の実効値を計算
し、その結果を第1の閾値発生回路25に送出す
る。従つて、雑音の実効値を計算する際に除外さ
れる音声信号とは、後述の比較回路の出力が1で
ありかつ、予め定められたレベル以上の信号レベ
ルを有する信号である。第1の閾値発生回路25
では、電力計算回路24からの出力を定数倍する
ことにより、レベル検出回路26で使用される第
1の閾値(TH1)と、第1の閾値より6dB高い
所に第2の閾値(TH2)とを設定し、レベル検
出回路26へ送出する。 レベル検出回路26では、整流回路23の出力
と、第1の閾値発生回路25より送出される第1
閾値及び第2の閾値とを比較し、整流回路の出力
が第2の閾値より大きい場所には入力信号が音声
信号である確率が高いので+2、第1の閾値と第
2の閾値との間に位置する場合には入力信号が音
声信号である確率と雑音である確率とがほぼ等し
いかあるいは前者が少し高い程であるので+1、
第1の閾値より小さい場合には入力信号が雑音で
ある確率が高いので−1を出力する。累積回路2
7ではレベル検出回路26の出力を累積しており
その累積値を比較回路28へ送出する。比較回路
28では、後述する第2の閾値発生回路29から
出力される第3の閾値(TH3)と前記累積値と
を比較し、後者が前者よりも大きい場合には入力
信号が音声信号であると判定し、+1を、また、
前者が後者よりも大きい場合には入力は雑音であ
ると判定し0を出力する。 選択回路34では、前述の第1の閾値発生回路
より出力される第2の閾値(TH2)のレベルに
応じて、予め定められた複数個の低いレベルの閾
値の中から1つを選択し出力する。 第2の閾値発生回路29では、前記選択回路か
ら出力される低いレベルの閾値(TH3L)とあら
かじめ定められた高いレベルの閾値(TH3H)
とを入力し、後述する判定回路32の出力が0の
場合(無音時)には前記予め定められた高いレベ
ルの閾値を選択し、また、後述する判定回路32
の出力が1の場合(有音時)には前記選択回路よ
り出力される低いレベルの閾値を選択し、前記比
較回路28で使用する第3の閾値として出力す
る。 可逆カウンタ30では、前記比較回路28の出
力を入力し、該入力信号が1の時にはカウンタの
内容を1だけ増加させ、0の時にはカウンタの内
容を1だけ減少させ前記比較回路の出力を累積し
ている。また、カウンタ設定回路31は前記比較
回路の出力を監視しておりその出力が1から0に
変化する時点を検出し、その時点で、前記可逆カ
ウンタ30の内容を予め定められた値に設定す
る。判定回路32では、前記可逆カウンタ30の
内容が予め定められた値(通常は0を用いる。)
より大きい場合に音声信号が検出されたとして1
を出力端子33を介して外部に出力する。もちろ
ん小さい場合には0を出力するがこうすることに
より前述のハングオーバーも付加されることにな
る。 第3図における電力計算回路24及び第1の閾
値発生回路25としては第5図の回路が使用で
き、絶対値信号入力端子50、雑音判定レベル入
力端子51、比較回路出力信号入力端子52、比
較器53、論理和回路54、乗算器55,56,
57,58、被乗数入力端子59,60,61,
62,63、被乗数選択器64、加算器65、リ
ミツター66,67、メモリー68、第1の閾値
出力端子69および第2の閾値出力端子70から
構成されている。絶対値入力信号は入力端子50
より入力され、一方は乗算器55へ、もう一方は
比較器53へ送られる。比較器53では、前記入
力信号と入力端子51より入力される雑音判定レ
ベルと比較され、前者が後者よりも大きい場合に
0、小さい場合に+1を出力し、論理和回路54
では、比較器53の出力信号と、比較回路28か
らの出力信号を反転した信号との論理和がとら
れ、少なくともどちらか一方が+1のときに+1
が出力され、乗算器56の制御信号及び、被乗数
選択器64の選択制御信号となる。前記被乗数選
択器64では、前記選択制御信号が+1の時には
被乗数入力端子59より入力される被乗数が選択
され、また、0の時には被乗数入力端子60より
入力される被乗数(現在は0を用いている。)が
選択され乗算器55の被乗数となる。 また、乗算器55では、絶対値入力信号と前述
のようにして選択された被乗数との積がとられ加
算器65へ送られる。一方、乗算器56では被乗
数入力端子61より入力される被乗数とメモリー
68の内容との積がとられ加算器65へ送られ
る。 但し、論理和回路54の出力が0の時はこの乗
算は行なわずメモリー68の内容がそのまま出力
される。そして、加算器65で前述の乗算器55
の出力と乗算器56の出力との加算が行なわれそ
の結果がリミツター66を介してメモリー68に
備えられる。また、それと同時にリミツター66
の出力は乗算器57により、被乗数入力端子62
より入力される被乗数との積がとられ、雑音の実
効値(σ)と等しくなり、リミツター67を介し
て第1の閾値(TH1)として、出力端子69よ
り出力される。 また、リミツター67の出力は、乗算器58で
被乗数入力端子63より入力される被乗数(現在
は2を用いている。)との積がとられ、第2の閾
値(TH2)として、出力端子70より出力され
る。 ここで、リミツター66,67を用いているの
はメモリー68の内容及び閾値(TH1)の可変
領域を制限することにより閾値調整速度を敏速に
かつ、音声検出器の受信感度および感動レベル範
囲を制限し、雑音に対する免疫性を保証するため
である。 尚、電力計算回路24は前述の様に絶対値信号
を一次の低域通過フイルタに通すことにより、雑
音のレベルを算出していたが、それは振幅分布が
Gauss分布であり分散がσ2である雑音をその絶対
値をとつて一次の低域通過フイルタに通して得ら
れる電力Pが次式で表す様に近似的に標準偏差
(実効値とも云いσで表す5に比例した値となる
ためである。 ここで∫∞ 0x exp{−x2/(2σ2)}dx (x2=yとおくと、2xdx=dy) ∫∞ 01/2exp{−y/(2σ2)}dy =σ2 ゆえに(1)式は次のようになる。 従つて、前記処理を施す事により、一次の低域
通過フイルタの出力で雑音振幅の標準偏差σにほ
ぼ比例した値が得られ、その値を定数倍すれば雑
音振幅の標準偏差(実効値σ)が得られることに
なる。 第3図で用いられる可逆カウンタ30、カウン
タ設定回路31及び判定回路32としては、第6
図の回路が使用でき、入力端子71、1サンプル
遅延回路72、論理積回路73、カウンタ設定値
入力端子74、可逆カウンタ75、比較回路7
6、閾値入力端子77及び出力端子78から構成
されており、破線で囲まれた30,31,32は
それぞれ第3図で示す可逆カウンタ、カウンタ設
定回路、判定回路を示している。入力端子71よ
り入力された入力信号は一方は可逆カウンタ75
へ、もう一方は1サンプル遅延回路72及び論理
積回路73へ送られる。 論理積回路73では現入力信号を反転した信号
と1サンプル時刻前の入力信号との積がとられ、
その結果を可逆カウンタ75へ送出する。可逆カ
ウンタ75では入力信号が1の時にはカウンタの
内容を1だけ増加させ、また、0の時にはカウン
タの内容を1だけ減少させるとともに、前記論理
積回路の出力が1の時、すなわち、入力信号が1
から0に変化する時に、カウンタの内容を強制的
にカウンタ設定値入力端子74から入力される予
め定められた値に設定される。比較器76では閾
値入力端子77より入力される閾値(実際は0を
使用している。)と前記可逆カウンタ75から出
力されるカウンタの内容とを比較し、カウンタの
内容が大きい場合に1を出力端子78を介して外
部に出力する。 また第3図の如く第2の閾値発生回路29を設
け比較回路28で使用される第3の閾値(TH3)
として、判定回路32の出力を選択信号とし、該
選択信号が1の時には低いレベルの第3の閾値
(TH3L)を、0の時には高いレベルの第3の閾
値(TH3H)を選択し使用しているが、これは
比較回路28の出力にヒステリシスを設けること
により音声検出器の過剰なON−OFFを避けるた
めであり、以下に述べる様に語中脱落や語尾切断
が減少する。 例えば、第7図aで示す音声信号(波形130
および131を含む。)が入力された場合を考え
る。波形130が到来し、レベル検出回路26に
おいて第1および第2の閾値と比較されその結
果、第7図bで示す波形132の様な出力が累積
回路27の出力として得られたとすると、比較回
路28では、累積回路27の出力波形132と変
化波形134で示す第3の閾値とが比較される。 第7図bで示す様に、時刻T1までは第3の閾
値の変化波形134の方が累積回路27の出力波
形132よりも大きいので音声信号は検出されな
いが時刻T1で後者の方が大きくなるので比較回
路28の出力波形135は1となり、出力保持用
可逆カウンタ30の内容波形137も増加し始め
る。従つて出力端子33の出力波形138も1と
なり音声信号が検出されたことになる。 ところで、時刻T1までは出力端子33の出力
が0であるので第3の閾値としては高いレベルの
第3の閾値(TH3H)が選択されていたが、時刻
T1以後は出力端子33の出力が1となるので、
第7図bの変化波形134で示す様に低いレベル
の第3の閾値(TH3L)が選択される。 その後、第7図aに示す入力波形130の振幅
が小さくなり、時刻T2で累積回路27の出力波
形132が第3の閾値の変化波形134より小さ
くなると、比較回路28の出力波形135は第7
図cに示す様に0になる。しかしながら、可逆カ
ウンタ30の内容波形137は第7図cで示す様
に、すぐには0にならずデータ設定回路31によ
りハングオーバー用のデータがセツトされるので
第7図dに示した端子33の出力波形にはハング
オーバーが付加される。 そこで、ハングオーバーが付加されている時に
入力端子20に第7図aで示す波形131が到来
すると、第7図bで示す様に時刻T3で累積回路
27の出力波形133が第2の閾値発生回路29
の出力する第3の閾値を示す変化波形134より
大きくなるので、比較回路の28の出力波形13
6は、第7図cで示す様に1となり、出力保持用
可逆カウンタ30の内容137は再び増加してゆ
く。 そして、第7図bで示す様に累積回路27の出
力波形133が時刻T4で第3の閾値を示す変化
波形134よりも小さくなると比較回路28の出
力波形136は第7図cで示す様に0になり、前
述の様に可逆カウンタ30にハングオーバー用の
データがセツトされハングオーバーが付加される
ことになる。 そして、時刻T5になるとハングオーバーが終
了するので、出力端子33の出力波形138(第
7図d)が0となり、第3の閾値は再び高いレベ
ルの第3の閾値が選択されることになる。 このように、第3の閾値を出力端子33の出力
によつて高いレベルの第3の閾値(TH3H)と
低いレベルの第3の閾値(TH3L)とを使い分け
ることにより、有音区間(出力端子33の出力が
1の時)における低いレベルの音声信号(第7図
aで示す波形131)をも検出できる様になり、
語中脱落及び語尾欠落が低減される。 また本発明ではTH3L選択回路34は第8図の
グラフで示す様に、第1の閾値発生回路25より
出力される第2の閾値(TH2)を入力し、TH2
に応じて予め定められた値を選択しTH3Lとして
第2の閾値発生回路29へ出力する。 それ故、閾値TH2が入力信号に含まれる雑音
レベルに応じて決定される値であるので、TH3L
も入力信号に含まれる雑音レベルに応じて決定さ
れる値となる。 尚、第8図で示す様に第2の閾値(TH2)が
小さい程TH3Lとして小さな値を用いている。こ
れは、ハングオーバー付加時において、雑音レベ
ルが小さい程累積値の時間平均値が小さな値とな
るため累積値と第3の閾値(TH3L)との距離を
一定に保つためである。 そして、雑音レベルに依存せずこの距離を一定
に保つことにより一定の検出能力が保証されるの
で動作時間率も雑音レベルに依らず一定の値が得
られる。 それ故、第3の閾値を有音区間と無音区間とで
使いわけ、有音区間で使用する第3の閾値
(TH3L)を第8図で示す様に雑音レベルに応じ
て可変とすれば、ハングオーバー付加時に生じる
雑音による誤検出の低減が計れ、また、語中脱落
や語尾欠落も低減でき、雑音レベルに依存せず一
定の良好な動作時間率を有する音声検出器が実現
できる。 また、本実施例では有音区間で用いる第3の閾
値(TH3L)の選択回路34の出力信号として、
閾値TH2を用いたが、閾値TH1や電力計算回路
24の出力に変更しても、雑音レベルに応じて変
動するTH3Lが得られ、本発明と同じ効果が得ら
れるので本発明に含まれる。 尚、本発明で用いる選択回路34としては、
ROM(Read Only Memory)だけで構成で
きるので、簡単なハードウエアの追加だけで良
い。 さらに、無音区間で用いるTH3HもTH3Lの1
部と考えれば、選択回路34と第2の閾値発生回
路29とを1つ選択回路(例えばROM等の使用
により)で実現できるので、ハードウエアの追加
もほとんどいらない。 (発明の効果) 以上の様に本発明の可変閾値型音声検出回路で
は、PCM符号で信号処理を行なつていることに
より、ハードウエア規模が増大しないこと、雑音
レベルに応じて第1及び第2の閾値を変動させて
いるため雑音に対する免疫性が強いこと、前記閾
値の最大値・最小値を規定することにより受信感
度や感動レベル範囲を任意に設定できること、及
び有音区間と無音区間とで異なるレベルの第3の
閾値を使用していることにより、雑音レベルに依
存せず一定の良好な音声検出特性を実現できる。
第1図は従来の音声検出器を示すブロツク図、
第2図は第1図の各部の波形を示す図、第3図は
本発明の音声検出器を示すブロツク図、第4図は
符号変換方法を示す図、第5図、第6図は第3図
の1部の構成要素の詳細を示すブロツク図、第7
図は本発明の音声検出回路の動作を説明するため
の図、第8図は本発明における第2の閾値と第3
の閾値との関係を示す図である。 図において、20は入力端子、21は偶数ビツ
ト反転回路、22は符号変換回路、23は整流回
路、24は電力計算回路、25は第1の閾値発生
回路、26はレベル検出回路、27は累積回路、
28は比較回路、29は第2の閾値発生回路、3
0は可逆カウンタ、31はカウンタ設定回路、3
2は判定回路、33は出力端子、34は選択回路
である。
第2図は第1図の各部の波形を示す図、第3図は
本発明の音声検出器を示すブロツク図、第4図は
符号変換方法を示す図、第5図、第6図は第3図
の1部の構成要素の詳細を示すブロツク図、第7
図は本発明の音声検出回路の動作を説明するため
の図、第8図は本発明における第2の閾値と第3
の閾値との関係を示す図である。 図において、20は入力端子、21は偶数ビツ
ト反転回路、22は符号変換回路、23は整流回
路、24は電力計算回路、25は第1の閾値発生
回路、26はレベル検出回路、27は累積回路、
28は比較回路、29は第2の閾値発生回路、3
0は可逆カウンタ、31はカウンタ設定回路、3
2は判定回路、33は出力端子、34は選択回路
である。
Claims (1)
- 【特許請求の範囲】 1 標本時刻毎に入力される音声信号と該音声信
号の無音区間の雑音レベルに応じて変動する第1
及び第2の閾値との大小判定結果を数値化して累
積し、該累積値と第3の閾値とを比較し音声信号
の有無を判定し、該判定結果が音声信号有りから
無しに変わつた場合に予め定められた時間を該判
定結果に有音区間として付加して音声検出出力を
得る音声検出方法において、 前記第3の閾値として高いレベルの予め定めら
れた閾値と雑音レベルに応じて決定される低いレ
ベルの閾値とを用意し、前記音声検出出力が音声
信号有りを知らせる時には前記低いレベルの閾値
を用い、前記音声検出出力が音声信号無しを知ら
せる時には高いレベルの閾値を用いて音声検出を
行ない、付加された有音区間でも雑音に応じて決
定される低いレベルの閾値を用いることを特徴と
する音声検出方法。 2 標本時刻毎に入力される入力信号の後記判定
回路の出力により指定される無音期間の雑音レベ
ルを計算する雑音電力計算回路と、該雑音電力計
算回路の出力に応じて変動する第1及び第2の閾
値を発生する第1の閾値発生回路と、前記入力信
号と前記第1及び第2の閾値との大小判定を行な
いその結果を数値化して出力するレベル検出回路
と該レベル検出回路の出力を累積する累積回路
と、前記第1の閾値発生回路より出力される前記
第2の閾値を入力し該第2の閾値レベルに応じて
予め定められた複数個の低いレベルの閾値の中か
ら1つを選択し出力する選択回路と、該選択回路
から出力される閾値と予め定められた高いレベル
の閾値とを入力し後述する出力保持回路の出力が
音声信号有りを知らせる時には前記選択回路から
出力される低いレベルの閾値を選択し、前記出力
保持回路の出力が音声信号無しを知らせる時には
前記予め定められた高いレベルの閾値を選択し第
3の閾値として出力する第2の閾値発生回路と、 前記累積回路の出力と前記第2の閾値発生回路
から出力される第3の閾値とを比較することによ
り音声信号の有無を判定する判定回路と、該判定
回路の出力が音声信号有りから無しに変わつた場
合に予め定められた時間を前記判定回路の出力に
有音区間として付加する出力保持回路とから少な
くとも構成され、振幅閾値(第1及び第2の閾
値)と有音区間で使用する第3の閾値を雑音レベ
ルに応じて変動させることを特徴とした音声検出
回路。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59099115A JPS60242500A (ja) | 1984-05-17 | 1984-05-17 | 音声検出方法及び回路 |
| US06/643,929 US4700392A (en) | 1983-08-26 | 1984-08-24 | Speech signal detector having adaptive threshold values |
| CA000461841A CA1220283A (en) | 1983-08-26 | 1984-08-27 | Speech signal detector having adaptive threshold values |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59099115A JPS60242500A (ja) | 1984-05-17 | 1984-05-17 | 音声検出方法及び回路 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS60242500A JPS60242500A (ja) | 1985-12-02 |
| JPH0371720B2 true JPH0371720B2 (ja) | 1991-11-14 |
Family
ID=14238801
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59099115A Granted JPS60242500A (ja) | 1983-08-26 | 1984-05-17 | 音声検出方法及び回路 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS60242500A (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0792672B2 (ja) * | 1986-04-10 | 1995-10-09 | 株式会社リコー | 音声区間検出方法 |
-
1984
- 1984-05-17 JP JP59099115A patent/JPS60242500A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS60242500A (ja) | 1985-12-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4700392A (en) | Speech signal detector having adaptive threshold values | |
| Lee et al. | A study of on-off characteristics of conversational speech | |
| JP3992545B2 (ja) | 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ | |
| EP0571079B1 (en) | Discriminating and suppressing incoming signal noise | |
| US6535844B1 (en) | Method of detecting silence in a packetized voice stream | |
| JP2919685B2 (ja) | 信号識別回路 | |
| EP0116555B1 (en) | Adaptive signal receiving method and apparatus | |
| JPH0371720B2 (ja) | ||
| US4469916A (en) | Method and apparatus for detecting signalling and data signals on a telephone channel | |
| EP0574117B1 (en) | Discriminating and suppressing incoming signal noise | |
| JPH0451035B2 (ja) | ||
| EP0167364A1 (en) | Speech-silence detection with subband coding | |
| JPH0464074B2 (ja) | ||
| JPH0371719B2 (ja) | ||
| JPH10502238A (ja) | 改良形トーン検出手段を具えた伝送システム | |
| JPS61151700A (ja) | 時定数変動型可変閾値音声検出器 | |
| JPS61156296A (ja) | 可変閾値型音声検出器 | |
| US20020126836A1 (en) | Transmit/receive arbitrator | |
| JPS61156298A (ja) | 時定数を変動させる可変閾値型音声検出器 | |
| JPH05130067A (ja) | 可変閾値型音声検出器 | |
| JP2680858B2 (ja) | レベル検出回路 | |
| JPS5834986B2 (ja) | 適応形音声検出回路 | |
| JPH10501954A (ja) | トーン検出を改善した伝送システム | |
| TW202226225A (zh) | 以零點交越檢測改進語音活動檢測之設備及方法 | |
| JPH08321786A (ja) | 有音判定回路 |