JPH0243384B2 - - Google Patents

Info

Publication number
JPH0243384B2
JPH0243384B2 JP55148449A JP14844980A JPH0243384B2 JP H0243384 B2 JPH0243384 B2 JP H0243384B2 JP 55148449 A JP55148449 A JP 55148449A JP 14844980 A JP14844980 A JP 14844980A JP H0243384 B2 JPH0243384 B2 JP H0243384B2
Authority
JP
Japan
Prior art keywords
signal
classification
state
logic
response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP55148449A
Other languages
English (en)
Other versions
JPS5696550A (en
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Publication of JPS5696550A publication Critical patent/JPS5696550A/ja
Publication of JPH0243384B2 publication Critical patent/JPH0243384B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/17Time-division multiplex systems in which the transmission channel allotted to a first user may be taken away and re-allotted to a second user if the first user becomes inactive, e.g. TASI
    • H04J3/175Speech activity or inactivity detectors

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Time-Division Multiplex Systems (AREA)

Description

【発明の詳細な説明】 本発明は信号検出器、とくに信号を検出してそ
の信号を複数の種類のうちの1つに分類する装置
に関するものである。
電気通信システムでは、ソース、たとえば発呼
者から信号が送られ、そのシステムを経由してシ
ンク、たとえば被呼者へ中継されることがある。
ソース・シンク間ではこの信号を様々に操作し
て、通常そのシステムの効率を向上させる。たと
えば、アナログ音声をデイジタル音声信号に変換
し、逆変換し、パルス符号変調(PCM)装置を
経由させ、ことによつては時間割当音声挿入
(TASI)装置を経由することがあり、最終的に
シンクに到達する。
音声挿入システムは通常、中継線の信号を検出
してその信号を複数の種類のうち1つに分類する
音声検出器を使用している。
典型的な音声検出器は米国特許第4028496号に
記載されている方式である。用語「音声検出器」
や「音声挿入」で「音声」なる語を使用すること
は誤用であるかもしれないが、当該技術では一般
にそのように使用されている。たとえば、音声検
出器で第1の型のエネルギーと第2の型のエネル
ギーを検出することがより典型的である。第1の
型のエネルギーとは通常、全体的な「エネルギ
ー」を指し、第2の型のエネルギーは「雑音」と
称する。このように、公知の音声検出器は信号を
エネルギーと雑音に分類する装置を有する。
上述のように、一般に音声検出器は米国特許第
4002841号に記載のデイジタル音声挿入(DSI)
方式などのシステムに使用される。この場合音声
検出器は中継線実動作信号(TAS)を出力して
その中継線にエネルギーが検出されたか雑音が検
出されたかを表示する。TAS信号に応動して処
理装置がその中継線の信号を処理する。たとえ
ば、TAS信号がエネルギーを検出したことを表
わす場合はその中継線の信号をシンクへ向けて中
継する。この場合、その中継線は「実動作」にあ
るという。一方、TAS信号が雑音を検出したこ
とを示す場合、その中継線の信号は送信せず廃棄
する。この場合、その中継線は「非実動作」にあ
るという。その結果、実動作中継線からの信号の
みがエネルギー信号として識別されそのシステム
で中継される。
また、エネルギー信号をシステム中で中継する
途中、異なつたエネルギー信号を異なつて手法に
従つて処理することが望ましい場合がある。たと
えば過負荷状態において、前述の米国特許第
4002841号に記載のDSI方式ではデイジタル信号
の各ビツトを一定の基準で切り捨ててシステムの
効率をさらに改善することがある。一方、たとえ
ば第1のソース・コンピユータから第2のシン
ク・コンピユータへ“通話”を行なう装置では、
ソース信号がデイジタル信号であるのでそのデイ
ジタル信号のビツトを切り捨てることは好ましく
ないことがある。これまでの電気通信方式では、
中継されたエネルギー信号を、第1の手法によつ
て処理する第1の種別の信号、たとえばビツトを
切り捨ててもよい音声信号と、第2の手法によつ
て処理する第2の種別の信号、たとえば各ビツト
を切り捨てることのできない非音声信号などに比
較的高速に分類する装置がないことは奇妙なこと
であつた。
本発明によれば上述その他の問題は、信号を複
数の種類のうちの1つに分類する装置によつて解
決する。被分類信号は入力端子から本分類装置に
入力され、そこで前処理を受ける。前処理後の信
号は特徴抽出器を通過して、被分類信号の少なく
とも1つの特徴が抽出される。この抽出された特
徴信号を判定器に加えて、その種類を判定する。
この判定によつて多状態順序機械が分類信号を発
生する。
本発明の原理によれば、中継線で検出した信号
を音声信号と非音声信号などに分類することによ
つて通信方式を改良することができる。次に、音
声信号を第1の手法に従つて処理し、非音声信号
を第2の手法に従つて処理してもよい。
本発明の原理の理解を助けるために第1図を参
照する。被分類信号を入力端子10から分類器1
000および音声検出器500の入力に同時に与
える。音声検出器500は上述の米国特許第
4028469号に記載の方式でよい。中継線実動作信
号(TAS)を音声検出器500の出力からAND
ゲート610および710の第1の入力に同時に
与え、中継線でエネルギーまたは雑音が検出され
たことを示す。このTAS信号は、エネルギー検
出を示すときは論理1を、雑音検出を示すときは
論理0をとる。音声検出器500と並列な回路と
して、中継線信号を音声信号と非音声信号などに
分類する分類器1000が接続されている。たと
えば非音声信号は音声帯域データ信号や信号音な
どである。分類信号Cを分類器1000の出力か
らANDゲート610の第2の入力および反転後
ANDゲート710の第2の入力に同時に与える。
分類信号Cは、中継線信号が音声信号であるとす
る場合は論理1を、中継線信号が非音声信号であ
るとする場合は論理0をとる。したがつてTAS
信号および分類信号がともに論理1であれば、
ANDゲート610の出力から出力端子620へ
論理1信号が出力され、エネルギー信号が音声信
号であることを示す。これと並列に、TAS信号
が論理1で分類信号が論理0であれば、ANDゲ
ート710の出力から出力端子720へ論理1信
号が出力され、エネルギー信号が非音声信号であ
ることを示す。TAS信号が論理0で中継線信号
が雑音であることを示している場合には、AND
ゲート610および710の各出力からそれぞれ
の出力端子に論理0信号が出力されることがわか
る。次に、出力端子620に信号があれば前述の
第1の音声手法に従つて中継線信号を処理し、出
力端子720に信号があれば第2の非音声手法に
従つて中継線信号を処理するようにしてもよい。
より具体的には、入力中継線信号、たとえばμ
=255のPCM圧伸則に従つて符号化しベルシステ
ムのT1搬送方式で標準的に使用されているよう
なデイジタル符号化8ビツト信号を得るための信
号を端子10から分類器1000に与え、そこで
前処理装置100を通してたとえば高域波器1
10によつて電源線雑音を減衰させ、直流オフセ
ツトを除去し、整流回路120によつて入力信号
の絶対値を得る。次にこの前処理した入力信号を
特徴抽出器200の入力に与えて入力中継線信号
の「特徴」すなわち特性Pを抽出する。ここで抽
出された特徴Pはたとえば入力端子10の信号の
短時間電力を表わしている。本発明の原料によれ
ば他の特徴またはそれらの組合せを抽出しても同
様に良好に機能する。さらに、少なくとも1つの
信号が抽出されると判定器300は信号Fを発生
し、中継線信号が音声信号である(たとえばFが
論理1である)か非音声信号である(たとえばF
が論理0である)かを示す。判定信号Fは判定器
300の出力から順序機械400の入力に与えら
れ、上述の分類信号を出力する。分類信号Cは論
理1で音声信号を示し、論理0で非音声信号を示
す。
分類器1000は第1図および第3図の両図を
参照してさらに具体的に説明できる。前処理した
中継線信号を前処理装置100の出力から特徴抽
出器200を通過させるが、これは2ミリ秒のエ
クスポネンシヤリ・マツプト・パスト(EMP)
変数のユニテイスケール(すなわち利得が1)低
域波器であつてよく、入力端子10の中継線信
号の短時間電力を1つの特徴として抽出する。
EMP変数については上述の米国特許第4028496号
およびその中の引用文献を参照されたい。抽出さ
れた特徴信号Pは特徴抽出器200の出力から判
定器300へ与えられ、そこで極大極小検出器3
10および信号比較器370の第1の入力に同時
に供給される。
機能的に判定器300は、振幅およよび周波数
検出器を用いて入力信号が音声信号か非音声信号
かを判定する装置を有する。第3図Aを参照する
と、縦軸は特徴信号Pを表わし、横軸は時間を表
わす。第3図Aにはたとえば整流された正弦波も
示されている。2つのエネルギー閾値、すなわち
第1のエネルギー閾値E1および第2のエネルギ
ー閾値E2も記載されている。研究の結果、音声
帯域データ信号などの非音声信号のエネルギーレ
ベルは典型的には音声信号のエネルギーレベルよ
り大きいことが判明した。したがつて、大きい方
のエネルギーレベルE1(=3.8)は最小の非音声信
号閾値を設定し、小さい方のエネルギー閾値E2
(=16)は最小の音声信号閾値を設定する。なお
他の実施例では、これらのエネルギー閾値のいず
れか一方または両方とも適応的、すなわち可変と
してもよい。また実験によれば、45dBrnc0の雑
音があるとこの分類器は入力信号を正しく分類す
ることがわかつた。これは図示のエネルギー閾値
E2(=16)と等価である。抽出された特徴信号P
の振幅がエネルギー閾値E2を超えると、第3図
Bに示すような論理1の付勢信号Eが比較器37
0の出力から遅延回路380の入力と、インバー
タ385の入力と、順序機械400の入力とに同
時に与えられ、遅延回路は付勢信号をクロツク発
生器390に出力し、インバータはリセツト信号
を発生器390に出力し、順序機械400は分類
信号Cを出力する。遅延回路380は、ここで約
8ミリ秒の所定の遅延を導入して、たとえばイン
パルス雑音に起因した誤動作を防止している。所
定の遅延の後、クロツク発生器390が付勢され
ウインドウ信号Wを出力する。第3図Cに示すよ
うにウインドウ信号Wは、所定の時間間隔に1
回、ここでは16ミリ秒に1回、論理1のパルスを
有し、(a)ラツチ340を付勢して極値計数器33
0の出力を周波数比較器350に与え、(b)各所定
の時間間隔の最初に極値計数器330をリセツト
し、(c)順序機械400を判定器300に同期させ
る。他のウインドウ信号を使用することもできる
が、実験によれば16ミリ秒のウインドウ信号が典
型的なピツチ周期の(通常非定常的な)会話に許
容できるほど良好に対応することが判明した。ま
た、標準的な8000Hzの標本化速度の場合16ミリ秒
のウインドウ信号で約128個の標本を捕捉できる
ことがわかる。
動作を説明すると、特徴信号Pが極大極小検出
器310に与えられるとその特徴信号の極大およ
び極小、すなわちその振幅の極値を検出する。振
幅の各極大または極小は振幅比較器320の1つ
の入力に与えられる。比較器320の第2の入力
は第1のエネルギー閾値E1である。実験によれ
ば、音声帯域データ信号は通常−23dBm0を越え
るエネルギーを有し、これは図示のエネルギー閾
値E1(=38)に相当することが判明した。特徴信
号Pの各極大または極小がエネルギー閾値E1
超えると、論理1の歩進信号が振幅比較器320
の入力から極値計数器330の入力に与えられ
る。これによつて計数器330は1だけ歩進し、
その計数値がラツチ340に送られ、前述のよう
にウインドウ信号Wに論理1のパルスがあるとこ
れを通過する。このように判定器300は入力信
号の種類の判定に使用する振幅検出装置を有す
る。
ラツチ340の計数値は、ウインドウ信号Wに
次の論理1のパルスがあると、周波数比較器35
0の1つの入力にに加えられる。比較器350の
第2の入力は第3の閾値E3であり、分類すべき
最低の周波数信号を示す。ここでは周波数閾値
E3を40としている。ラツチ340の計数値を所
定の時間間隔、ここでは16ミリ秒で割れば周波数
が求まることが明らかである。また、計数器33
0は典型的な正弦波の1周期中に4回歩進するこ
ともわかる。したがつて、第3の閾値E3(=40)
を有することは約625Hzの最低周波数の信号を検
出することと等価であることは明らかである。こ
のため判定器300は、入力信号の種類を判定す
るのに使用する周波数検出装置を有する。
次に、極値計数が40より少ないと、周波数比較
器350は論理1の判定信号Fを順序機械400
に出して、入力信号が音声信号であると判定した
ことを示す。逆に、極値計数が少なくとも40であ
ると、周波数比較器350は論理0の判定信号F
を出力し、入力信号が非音声信号であること判定
したことを示す。
順序機械400は、おおまかな判定信号F、付
勢信号Eおよびウインドウ信号Wに応動して本発
明の原理による細かな分類信号Cを出力する状態
制御型順序機械である。順序機械を説明する一般
的な方法は状態図によるものである。たとえば、
ドナルド R ハリングによる「シーケンシヤ
ル・サーキツト・シンセシス:ステート・アサイ
ンメント・アスペクツ」(マサチユセツツ州ケン
プリツジ:ザ MITプレス、1966)を参照。第
2図は順序機械400の状態図である。具体的に
は機械400は次の6つの状態をとる。
1 RESTART 2 DETERMINATION 3 DATA 4 WAS DATA 5 SPEECH 6 WAS SPEECH 状態図を説明する前に、仮定と注をいくつか明
確にしておく。第一に、順序機械400はカウン
タを2個使用し、一方は音声カウンタ(SC)と
称し、他方はデータカウンタ(DC)と称する。
SCおよびDCカウンタは、論理1のパルスで1だ
け歩進または逓減するどんな標準の2進nビツト
カウンタであつてもよい。また、SCおよびDCカ
ウンタは8ビツトの可逆ノンネガテイブ・カウン
タ、すなわち0と255の飽和計数状態との間で計
数できるものと仮定する。
第二に、カウンタに動作についてRESTART
状態ではSCカウンタは1ミリ秒クロツクパルス
信号に応動して歩進する。WAS DATA状態で
は、SCカウンタは1ミリ秒クロツクに応動して
歩進し、DCカウンタは4ミリ秒クロツクに応動
して歩進する。WAS SPEECH状態では、SCカ
ウンタは4ミリ秒クロツクに応動して歩進し、
DCカウンタは1ミリ秒クロツクに応動して歩進
する。DETERMINATION状態、SPEECH状
態、およびDATA状態では、SCおよびDCの両カ
ウンタはウインドウ信号Wに応じて増減動作す
る。また後にさらに明らかになるように、カウン
タの増減動作は上述のクロツクパルス信号または
ウインドウ信号と判定信号Fに一致する。
第三に、0/SCおよび0/DCなる表記はSC
およびDCカウンタがそれぞれ0であることを意
味する。また第2図の凡例Cに示すように、各状
態遷移、たとえばRESTART状態から
DETERMINATION状態への遷移でSCおよび
DCカウンタは0になる。さらに、DC+1/DC
およびSC+1/SCなる表記はそれぞれのカウン
タが1だけ歩進することを意味する。SC−1/
SCおよびDC−1/DCなる表記はそれぞれのカ
ウンタが1だけ逓減することを意味する。カウン
タを歩進させるべきか逓減させるべきかは判定信
号Fによつて識別される。すなわち、SCカウン
タは論理1の音声判定信号Fに応動し、DCカウ
ンタは論理0の非音声判定信号Fに応動する。ま
たこの増減動作は上述のようにクロツク信号また
はウインドウ信号Wの論理1のパルスと一致して
行なわれる。
第四に、ある状態から他の状態への遷移線に示
されている記号は、その遷移の発生前に検出しな
ければならない事象(単数または複数)を規定し
ている。たとえば、DETERMINATION状態か
らDATA状態への遷移は次の3事象の論理積に
よつて発生する。
(1) 論理1の付勢信号E、および (2) DCカウンタが所定の計数値、ここでは少な
くとも16なる計数値を有すること、および (3) SCカウンタが所定の計数値、ここでは2よ
り少ない計数値を有すること。
なお、第2図では、記号・は論理積を意味し、
記号Uは論理和を意味する。
第五に、既述のように音声および非音声信号は
異なる手法で処理してもよい。したがつて一方で
は、本実施例において上記6つの状態のうち最初
の4つはいずれも順序機械400が論理0の非音
声分類信号を出力する。他方、SPEECH状態ま
たはWAS SPEECH状態では順序機械400は
論理1の音声分類信号を出力する。
第六に、状態図の説明はRESTART状態から
始める。入力信号が非音声信号であると仮定す
る。具体的にはたとえば、その非音声信号は音声
帯域データ信号であるとする。
RESTART状態 RESTART状態とは、順序機械400が典型
的には非実動作中継線の検出でこれに復帰する状
態である。前述のようにRESTART状態では順
序機械400が論理0の非音声分類信号Cを出力
する。
RESTART状態には2本の枝路がループにな
つている。一方の枝路では、付勢信号Eが論理0
になるときSCおよびDCカウンタが0になり順序
機械400はRESTART状態にとどまる。既述
のように論理0の付勢信号Eは被分類信号のエネ
ルギーが第2のエネルギー閾値E2以下であるこ
とを意味する。第2の枝路では、付勢信号Eが論
理1になるとSCカウンタが1ミリ秒クロツク信
号の論理1のパルスによつて歩進する。SCカウ
ンタが所定の計数値、ここでは計数値8まで歩進
し、かつ付勢信号Eが論理1であるという論理積
を検出すると、RESTART状態から
DETERMINATION状態へ遷移する。
DETERMINATION状態 DETERMINATION状態とは、被分類信号が
音声信号であるか非音声信号であるかを最初に判
定する状態である。既述のように
DETERMINATION状態では順序機械400が
論理0の非音声分類信号Cを出力する。
DETERMINATION状態では1本の枝路がル
ープになつている。その枝路では、論理1の音声
判定信号F(第2図凡例A参照)でSCカウンタが
歩進しDCカウンタが逓減する。逆に論理0の非
音声判定信号F(第2図凡例B参照)ではSCカウ
ンタが逓減しDCカウンタが歩進する。SCおよび
DCカウンタが所定の計数値まで歩進したことが
検出されると、DETERMINATION状態から
DATA状態またはSPEECH状態に遷移する。
具体的には、下記の3事象の論理積を検出する
とDETERMINATION状態からDATA状態へ遷
移する。
(1) 論理1の付勢信号E、および (2) DCカウンタが所定の計数値、ここでは少な
くとも16なる計数値を有すること、および (3) SCカウンタが所定の計数値、ここでは2よ
り少ない計数値を超えないこと。
これと異なり、次の2事象の論理積が検出され
るとDETERMINATION状態からSPEECH状態
へ遷移する。
(1) 論理1の付勢信号E、および (2) SCカウンタが所定の計数値、ここでは少な
くとも2なる計数値を有すること。
または、次の2事象の論理積を検出しても同遷
移が発生する。
(1) 論理0の付勢信号E、および (2) DCカウンタが所定の計数値、ここでは0の
計数値を有すること。
勿論、順序機械400がDETERMINATION
状態にあれば、被分類信号のエネルギーは第2の
エネルギー閾値E2以下に下がることがある。そ
のような場合比較器370の出力に論理0の付勢
信号Eが発生する。次の2事象の論理積の検出で
DETERMINATION状態からRESTART状態へ
遷移する。
(1) 論理0の付勢信号E、および (2) ウインドウ信号Wの論理1パルス。
DATA状態 DATA状態とは順序機械400が非音声信号
の存在する状態にとどまる状態である。既述のよ
うに、DATA状態では順序機械400が論理0
の分類信号Cを出力する。
DATA状態には1本の枝路がループになつて
いる。この枝路は、上述のDETERMINATION
状態の枝路ループと同様の方法でSCおよびDCカ
ウンタが増減動作する(第2図の凡例AおよびB
参照)。
次の2事象の論理積を検出するとDATA状態
からSPEECH状態へ遷移する。
(1) 論理1の付勢信号E、および (2) SCカウンタが所定の計数値、ここでは少な
くとも4なる計数値を有すること。
これと異なり、論理0の付勢信号Eを検出する
とDATA状態からWAS DATA状態へ遷移する。
これは前述のように、被分類信号のエネルギーが
第2のエネルギー閾値E2を超えないことを意味
する。
WAS DATA状態 WAS DATA状態とは、被分類信号のエネル
ギーが不十分であることを検出して順序機械40
0がアイドル状態にある状態である。前述のよう
に、WAS DATA状態では順序機械400が論
理0の非音声分類信号Cを出力する。
WAS DATA状態では2本の枝路がループに
なつている。一つの枝路は、付勢信号Eが論理0
であるとDCカウンタが1だけ歩進する。第2の
枝路は、付勢信号Eが論理1になるとSCカウン
タが1だけ歩進する。前に述べたようにDCカウ
ンタの実際の歩進は4ミリ秒クロツクの論理1の
パルスに応動して行なわれ、SCカウンタの歩進
は1ミリ秒クロツクの論理1のパルスに応動して
行なわれる。
次の2事象の論理積を検出するとWAS
DATA状態からDATA状態へ遷移する。
(1) 論理1の付勢信号E、および (2) SCカウンタが所定の計数値、ここでは少な
くとも8なる計数値を有すること。
これと異なり、DCカウンタが所定の計数値、
ここでは少なくとも250なる計数値を検出すると
WAS DATA状態からRESTART状態へ遷移す
る。
SPEECH状態 SPEECH状態とは順序機械400が音声信号
の存在する状態にとどまる状態にある。前述した
ように、SPEECH状態では順序機械400が論
理1の音声分類信号Cを出力する。
SPEECH状態では1本の枝路がループになつ
ている。この枝路では前述の
DETERMINATION状態の枝路ループと同様の
方法でSCおよびDCカウンタが増減動作する。
次の2事象の論理積を検出するとSPEECH状
態からDATA状態へ遷移する。
(1) 論理1の付勢信号E、および (2) DCカウンタが所定の計数値、ここでは少な
くとも32なる計数値を有すること。
これと異なり、論理0の付勢信号Eを検出する
とSPEECH状態からWAS SPEECH状態へ遷移
する。これは前述のように、被分類信号のエネル
ギーが第2のエネルギー閾値E2を超えないこと
を意味する。
WAS SPEECH状態 WAS SPEECH状態とは被分類信号のエネル
ギーが不十分であることを検出して順序機械40
0がアイドル状態にある状態である。前述のよう
にWAS SPEECH状態では、順序機械400が
論理1の音声分類信号Cを出力する。
WAS SPEECH状態では2本の枝路がループ
になつている。一つの枝路は、付勢信号Eが論理
0になるとSCカウンタが1だけ歩進する。第2
の枝路は、付勢信号Eが論理1になるとDCカウ
ンタが1だけ歩進する。既述のようにSCカウン
タの歩進は4ミリ秒クロツクの論理1のパルスに
応動して行なわれ、DCカウンタの歩進は1ミリ
秒クロツクの論理1のパルスに応動して行なわれ
る。
次の2事象の論理積を検出するとWAS
SPEECH状態からSPEECH状態へ遷移する。
(1) 論理1の付勢信号E、および (2) DCカウンタが所定の計数値、ここでは少な
くとも8なる計数値を有すること。
これと異なり、SCカウンタが所定の計数値、
ここでは少なくとも250なる計数値を有すること
を検出するWAS SPEECH状態からRESTART
状態へ遷移する。
本発明の詳細を図示し説明してきたが、これは
説明用の一例にすぎないことを理解されたい。
本発明の概要は次のとおりである。
(1) 信号を複数の種類のうち1つに分類する装置
において、該装置は、被分類信号を受信する入
力端子10と、この入力端子に結合され前記信
号を分類する手段1000と、この分類手段か
ら分類信号を出力端子620,720に出力す
る手段610,710とを有し、さらに被分類
信号を特徴抽出器200に送る手段100を有
し、この特徴抽出器は被分類信号の少なくとも
1つの特性を抽出し、さらに該特性からその種
類の判定を行なう判定器300と、この判定に
よつて前記分類信号を出力する順序機械400
とを有する。
(2) 前記第(1)項記載の分類装置において、前記判
定器300はさらに、前記特徴において所定の
閾値を超える極値の数を検出する手段310,
320,330,340と、最低周波数特性信
号を検出する手段350,370,380,3
90と、この極値の数および最低周波数に応動
して前記種類の判定を行なう手段350とを有
する。
(3) 前記第(1)項記載の分類装置はさらに、TAS
信号を出力する音声検出器500を有し、この
音声検出器は前記分類手段1000と回路的に
結合され、さらに前記分類信号とTAS信号に
応動して少なくとも1つの出力端子620,7
20に手法信号を出力する手段610,710
を有する。
(4) 前記第(1)項記載の分類装置において、前記順
序機械400はさらに、付勢信号、前記判定信
号およびウインドウ間隔信号に応じて複数の状
態の間を遷移する遷移手段を有し、この遷移は
所定の状態関係に従つており、前記判定信号が
第1の状態にあるウインドウ間隔の数と該判定
信号が第2の状態にあるウインドウ間隔の数と
に応動する。
【図面の簡単な説明】
第1図は本発明の原理による分類装置を示すブ
ロツク図、第2図は第1図の順序機械で実現され
る状態を示す状態図、第3図は第1図の分類装置
の動作説明に使用する波形図である。 〔主要部分の符号の説明〕、10…入力端子、
100…信号を特徴抽出器に送る手段、200…
特徴抽出器、300…判定器、400…順序機
械、610,710…出力端子に分類信号を出力
する手段、620,720…出力端子、1000
…信号を分類する手段。

Claims (1)

  1. 【特許請求の範囲】 1 分類されるべき信号を受信する入力端子(例
    えば10)、該入力端子に結合され該信号を分類
    する手段(例えば100)、入力端子に結合され
    エネルギもしくは雑音が該入力端子に存在するか
    どうかを表わす中継線実動作信号(TAS)を与
    える音声検出器(例えば500)、および該分類
    手段から出力端子(例えば620,720)に分
    類信号を接続する手段(例えば610,710)
    を含み、供給された信号を音声帯域データか音声
    のいずれかに分類するための装置において、該分
    類装置はさらに、 分類されるべき該信号を、分類されるべき該信
    号の少なくとも1つの所定の電気的特徴を抽出す
    るための電気的特徴抽出器(例えば200)に与
    える手段(例えば100)、 該少なくとも1つの所定の電気的特徴に応答し
    て該分類を表わす判定信号を発生させるための判
    定器(例えば300)であつて、所定の閾値を越
    える該少なくとも1つの所定の電気的特徴の極値
    の数を検出する手段(例えば310,320,3
    30,340)、最小の周波数信号を検出する手
    段(例えば350,370,380,390)、
    および該極値の数と該最小周波数信号に応答して
    該判定信号を発生させる手段(例えば350)を
    含む判定器(300)、 該判定信号に応答して該分類信号を与えるため
    の順序手段(400)、および 該分類信号および該中継線実動作信号(TAS)
    に応答して該供給された信号が音声帯域データか
    音声であるかを表わす出力を与える手段(例えば
    610,710)を含むことを特徴とする分類装
    置。 2 特許請求の範囲第1項に記載の分類装置にお
    いて、 該順序手段(例えば400)は該順序手段を付
    勢する付勢信号、該判定信号および時間間隔信号
    に応答して複数の状態遷移の間を移行する遷移手
    段を含み、 該遷移の移行は所定の状態関係にしたがつてお
    り、該遷移移行手段は該判定信号が第1の所定の
    値にある時間間隔の数および該判定信号が第2の
    所定の値にある時間間隔の数に応答するところの
    ものである分類装置。
JP14844980A 1979-10-26 1980-10-24 Signal sorting device Granted JPS5696550A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US06/088,634 US4281218A (en) 1979-10-26 1979-10-26 Speech-nonspeech detector-classifier

Publications (2)

Publication Number Publication Date
JPS5696550A JPS5696550A (en) 1981-08-04
JPH0243384B2 true JPH0243384B2 (ja) 1990-09-28

Family

ID=22212507

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14844980A Granted JPS5696550A (en) 1979-10-26 1980-10-24 Signal sorting device

Country Status (2)

Country Link
US (1) US4281218A (ja)
JP (1) JPS5696550A (ja)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4376874A (en) * 1980-12-15 1983-03-15 Sperry Corporation Real time speech compaction/relay with silence detection
DE3102385A1 (de) * 1981-01-24 1982-09-02 Blaupunkt-Werke Gmbh, 3200 Hildesheim Schaltungsanordnung zur selbstaetigen aenderung der einstellung von tonwiedergabegeraeten, insbesondere rundfunkempfaengern
EP0076233B1 (de) * 1981-09-24 1985-09-11 GRETAG Aktiengesellschaft Verfahren und Vorrichtung zur redundanzvermindernden digitalen Sprachverarbeitung
US4535445A (en) * 1983-06-16 1985-08-13 At&T Information Systems Conferencing system adaptive signal conditioner
US4532849A (en) * 1983-12-15 1985-08-06 Drew Dennis M Signal shape controller
US4764966A (en) * 1985-10-11 1988-08-16 International Business Machines Corporation Method and apparatus for voice detection having adaptive sensitivity
US4920534A (en) 1986-02-28 1990-04-24 At&T Bell Laboratories System for controllably eliminating bits from packet information field based on indicator in header and amount of data in packet buffer
US4815136A (en) * 1986-11-06 1989-03-21 American Telephone And Telegraph Company Voiceband signal classification
US4815137A (en) * 1986-11-06 1989-03-21 American Telephone And Telegraph Company Voiceband signal classification
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US5267301A (en) * 1988-06-29 1993-11-30 Canon Kabushiki Kaisha Data communication apparatus and method capable of discriminating calling stations
JP2573352B2 (ja) * 1989-04-10 1997-01-22 富士通株式会社 音声検出装置
US4979214A (en) * 1989-05-15 1990-12-18 Dialogic Corporation Method and apparatus for identifying speech in telephone signals
US5016247A (en) * 1989-08-07 1991-05-14 Ibm Corporation Multihop time assigned speech interpolation (TASI) system for telecommunication networks
JP2643593B2 (ja) * 1989-11-28 1997-08-20 日本電気株式会社 音声・モデム信号識別回路
US5065395A (en) * 1990-04-09 1991-11-12 Dsc Communications Corporation Rudimentary digital speech interpolation apparatus and method
US5450484A (en) * 1993-03-01 1995-09-12 Dialogic Corporation Voice detection
SE503547C2 (sv) * 1993-06-11 1996-07-01 Ericsson Telefon Ab L M Anordning och förfarande för döljande av förlorade ramar
SE502244C2 (sv) * 1993-06-11 1995-09-25 Ericsson Telefon Ab L M Sätt och anordning för avkodning av ljudsignaler i ett system för mobilradiokommunikation
US5471527A (en) 1993-12-02 1995-11-28 Dsc Communications Corporation Voice enhancement system and method
US5822726A (en) * 1995-01-31 1998-10-13 Motorola, Inc. Speech presence detector based on sparse time-random signal samples
US5884255A (en) * 1996-07-16 1999-03-16 Coherent Communications Systems Corp. Speech detection system employing multiple determinants
US6141345A (en) * 1997-03-06 2000-10-31 Lucent Technologies Inc. Signal processing resource allocation for internet-based telephony
US6205135B1 (en) 1997-03-06 2001-03-20 Lucent Technologies Inc Access platform for internet-based telephony
JP3195274B2 (ja) * 1997-06-16 2001-08-06 埼玉日本電気株式会社 Tdma音声情報読出装置
FR2768544B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de detection d'activite vocale
US6718302B1 (en) * 1997-10-20 2004-04-06 Sony Corporation Method for utilizing validity constraints in a speech endpoint detector
US6205422B1 (en) * 1998-11-30 2001-03-20 Microsoft Corporation Morphological pure speech detection using valley percentage
US6718297B1 (en) 2000-02-15 2004-04-06 The Boeing Company Apparatus and method for discriminating between voice and data by using a frequency estimate representing both a central frequency and an energy of an input signal
US7472059B2 (en) * 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
SG185134A1 (en) * 2003-05-28 2012-11-29 Dolby Lab Licensing Corp Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
KR100546758B1 (ko) * 2003-06-30 2006-01-26 한국전자통신연구원 음성의 상호부호화시 전송률 결정 장치 및 방법
JP4587160B2 (ja) * 2004-03-26 2010-11-24 キヤノン株式会社 信号処理装置および方法
AU2005299410B2 (en) 2004-10-26 2011-04-07 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
EP1931197B1 (de) * 2005-04-18 2015-04-08 Basf Se Zubereitung, enthaltend wenigstens ein conazolfungizid, ein weiteres fungizig und ein stabilisierendes c0p0lymer
KR100770895B1 (ko) * 2006-03-18 2007-10-26 삼성전자주식회사 음성 신호 분리 시스템 및 그 방법
ATE441920T1 (de) * 2006-04-04 2009-09-15 Dolby Lab Licensing Corp Lautstärkemessung von tonsignalen und änderung im mdct-bereich
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
DK2011234T3 (da) 2006-04-27 2011-03-14 Dolby Lab Licensing Corp Audioforstærkningskontrol anvendende specifik-lydstyrke-baseret auditiv hændelsesdetektering
CN101529721B (zh) 2006-10-20 2012-05-23 杜比实验室特许公司 使用复位的音频动态处理
US8521314B2 (en) * 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
EP2168122B1 (en) * 2007-07-13 2011-11-30 Dolby Laboratories Licensing Corporation Audio processing using auditory scene analysis and spectral skewness
KR101251045B1 (ko) * 2009-07-28 2013-04-04 한국전자통신연구원 오디오 판별 장치 및 그 방법
US8879283B2 (en) * 2009-11-05 2014-11-04 On-Bright Electronics (Shanghai) Co., Ltd. System and method providing protection in the event of current sensing failure for power converter
US8995823B2 (en) 2012-07-17 2015-03-31 HighlightCam, Inc. Method and system for content relevance score determination
US9154130B2 (en) * 2014-01-14 2015-10-06 Analog Devices, Inc. Four-state input detection circuitry

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BE790611A (fr) * 1971-12-16 1973-02-15 Tel Tone Corp Dispositif pour analyser le rapport de la largeur d'impulsion des parties de cycle d'un signal d'entree
US4027102A (en) * 1974-11-29 1977-05-31 Pioneer Electronic Corporation Voice versus pulsed tone signal discrimination circuit
JPS5272504A (en) * 1975-12-15 1977-06-17 Fuji Xerox Co Ltd Device for recognizing word audio
US4002841A (en) * 1976-01-21 1977-01-11 Bell Telephone Laboratories, Incorporated Data compression using nearly instantaneous companding in a digital speech interpolation system
US4137510A (en) * 1976-01-22 1979-01-30 Victor Company Of Japan, Ltd. Frequency band dividing filter
US4028496A (en) * 1976-08-17 1977-06-07 Bell Telephone Laboratories, Incorporated Digital speech detector
JPS5947903B2 (ja) * 1978-09-04 1984-11-22 ケイディディ株式会社 デジタル通話音声插入方式

Also Published As

Publication number Publication date
JPS5696550A (en) 1981-08-04
US4281218A (en) 1981-07-28

Similar Documents

Publication Publication Date Title
JPH0243384B2 (ja)
US6154721A (en) Method and device for detecting voice activity
US4696041A (en) Apparatus for detecting an utterance boundary
EP0677202B1 (en) Discriminating between stationary and non-stationary signals
US3940565A (en) Time domain speech recognition system
CA1150413A (en) Speech endpoint detector
EP0480129B1 (en) Voice/voice band data discrimination apparatus
JPH07113840B2 (ja) 音声検出器
US6285979B1 (en) Phoneme analyzer
JPH0210618B2 (ja)
JPS6245730B2 (ja)
EP0347038A2 (en) DTMF receiver
USRE32172E (en) Endpoint detector
US4990848A (en) DTMF receiver
US6199036B1 (en) Tone detection using pitch period
CA1200031A (en) Adaptive signal receiving method and apparatus
US3377428A (en) Voiced sound detector circuits and systems
US3878337A (en) Device for speech detection independent of amplitude
US4845753A (en) Pitch detecting device
US4191862A (en) Dual frequency tone decoder
US7046792B2 (en) Transmit/receive arbitrator
JP2992324B2 (ja) 音声区間検出方法
US3488446A (en) Apparatus for deriving pitch information from a speech wave
JPS60499A (ja) 音声認識装置におけるしきい値設定方式
US6961718B2 (en) Vector estimation system, method and associated encoder