JPH03273722A - 音声・モデム信号識別回路 - Google Patents

音声・モデム信号識別回路

Info

Publication number
JPH03273722A
JPH03273722A JP2327729A JP32772990A JPH03273722A JP H03273722 A JPH03273722 A JP H03273722A JP 2327729 A JP2327729 A JP 2327729A JP 32772990 A JP32772990 A JP 32772990A JP H03273722 A JPH03273722 A JP H03273722A
Authority
JP
Japan
Prior art keywords
signal
modem
input
short
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2327729A
Other languages
English (en)
Other versions
JP2643593B2 (ja
Inventor
Minoru Shinoda
信田 稔
Shinichi Aiko
愛甲 進一
Takao Nishitani
隆夫 西谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPH03273722A publication Critical patent/JPH03273722A/ja
Application granted granted Critical
Publication of JP2643593B2 publication Critical patent/JP2643593B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Time-Division Multiplex Systems (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、ディジタル入力信号が音声信号であるかモデ
ム信号であるかを識別する音声・モデム信号識別回路に
関する。
〔従来の技術〕
衛星通信、海底ケーブル通信等の長距離回線の有効利用
を図るために、高能率音声符号化(例えば、ADPCM
)技術とディジタル音声挿入(DSI)技術とを組合せ
た高能率端局装置(DCMEDigital C1rc
uit Multiplication Equipm
ent)が開発されている。この装置では、音声信号と
モデム信号とで、相異なるビットレートの符号化を行な
う必要を生じる。例えば、音声信号は32Kbps  
ADPCMで符号化されるが、モデム信号にもこれと同
じ符号化を適用すると、特に高速のモデム信号の場合、
データ誤り率が許容限界を超えてしまう。データ誤り率
を許容限界内に抑えるには、モデム信号を音声符号より
も高いレート、例えば40Kbps  ADPCMで符
号化する必要がある。
従って上述の高能率端局装置は、時分割多重化信号中の
音声信号とモデム信号とを識別してそれぞれの符号化回
路に導いてやるために、音声・モデム信号識別回路を必
要とする。
このような音声・モデム信号識別回路は、例え− ばIEEE  GLOBECOM’ 88 (Glob
alTelecommunications Conf
erence & Exibition、1988 )
 。
Conference Record Vol、III
 、 1419〜1427頁に、S、Ca5ale等に
より示されている。この論文中の第2図に示されている
ように、従来の音声・モデム信号識別回路は、与えられ
た信号と、この原信号を高域フィルタに通して高域成分
、および原信号を低域フィルタに通した低域成分、の3
つの信号ごとに、短時間エネルギー、セロ交差数、差分
信号のゼロ交差数を算出し、各算出結果の分布範囲を判
定用の各しきい値と比較することにより、与えられた信
号が音声信号かモデム信号かを判定する。この判定の基
準となる各しきい値は、予め音声信号とモデム信号とに
ついて収集した標本データの統計的特徴を分析した結果
により、設定される。各判定結果を照合して、入力信号
が音声信号あるいはモデム信号のいずれであるかを最終
的に識別する。
〔発明が解決しようとする課題〕
上述した従来の音声・モデム信号識別回路では、短時間
エネルギーおよび零交差数の算出データをそれぞれ別の
判定器へ入力し、各判定器での判定結果を更に最終の判
定器へ入力するよう構成されている。各判定器の判定結
果は0′″およびパ1′”の2値表示なので、短時間エ
ネルギーおよび零交差数の相互関連を示す情報が大幅に
欠落してしまい、信号対雑音比が異なる種々の回線にお
いて音声およびモデム信号を精度良く識別するのに十分
な情報量が得られず、この結果、処理量が多い割には十
分な識別率が得られない。
更に、各判定器における判定結果から矛盾無く最終の判
定を伝えるよう各判定器でのしきい値を設定するには、
多量の実験データと、多大な分析工数とを必要とする。
〔課題を解決するための手段〕
本発明の回路は、入力信号を処理して音声信号またはモ
デム信号のいずれかに応じて異なる特徴をもつ複数の信
号を発生する信号処理手段と、前記複数信号に応答して
音声信号またはモデム信号のいずれに近い特徴をもつか
を示す関数値のデータを発生するニューラルネットワー
クと、前記関数値のデータに応答して前記入力信号が音
声信号またはモデム信号のいずれであるかを示す信号を
出力する判定手段とを含む。
〔実施例〕
次に図面を参照して本発明について説明する。
第1図を参照すると、本発明の第1の実施例の回路は、
短時間自己相関係数計算器30と、ニューラルネットワ
ーク6と、判定器31とを縦続に接続して構成されてい
る。この回路において、入力端子1から入力されるディ
ジタル信号は、短時間自己相関係数計算器30に入力さ
れる。短時間自己相関係数計算器30は、入力ディジタ
ル信号の時系列(x(n)Inは整数)と時間窓幅Wの
方形窓とを用いて、次に式(1)により、自己相関係数
を計算する。
(k=o、1,2.・・・、W−1)  ・・・(1)
この短時間自己相関係数は、入力ディジタル信号の振幅
の影響を除去するため、入力ディジタル信号の電力値で
あるR、(0)で正規化されて、くR、、(k) >と
なる。
正規化された短時間自己相関係数は、ニューラルネット
ワーク6に入力される。
第2図(a)および(b)は、第1図中のニューラルネ
ットワーク6の接続構成および構成要素をそれぞれ例示
するブロック図である。すなわち、同図(a)は、入力
層60.中間層61.出力層62から成る層構造をもつ
ニューラルネットワークを示す。入力層60は4つのユ
ニット70を有し、中間層61は2つのユニット71を
、出力層62は1つのユニット72をそれぞれ有する。
例えばユニット70は、同図(a)に示すごとく、入力
端からデータXll X21 X31 X4を受けて、
乗算器81.82,83.84でそれぞれに重みWl、
 w2゜W3.w4を付けたあと、加算器85で加算し
て総和u1すなわち、 〜9 1〇− U=±wk’xk  ・・・(3) を算出し、これに関数発生器86で関数fを作用させて
出力する。関数fとしては、微分可能なシグモイド(s
igmoid )関数、すなわちf(u)=17 (1
+e−つ  ・(4)を用い、この値をユニット70の
出力データyとする。
第2図(a)中のユニッ)71,72もこれと同様に、
入力データの重み付け総和にシグモイド関数を作用させ
た出力データを発生する。第2図(a)は、階層型のニ
ューラルネットワークを用いた例を示し、それぞれ出力
側から入力側へのフィードバック接続をもたない入力層
61.中間層62.出力層63を縦続に接続した構成で
ある。
階層型のニューラル・ネットワーク6の領域分類機能の
学習は、バックプロパゲーションのアルゴリズムにより
行う。すなわち、入力層60の各ユニット70に入力デ
ータを与えて各ユニットで変換させ、中間層61に伝え
て、最後に出力層62から出力を得る。この実際の出力
値と、望ましい出力値とを比べ、その差を減らすように
重みwlを逐次に修正していく。
この修正では、ユニットの入力X1に対する重みwlの
m回目の修正値w、(m)から、(m+1)回目の修正
値w、(m+1)を次式(5)〜(7)により算出する
w、(m+1)=w+(m)十’7δx ’+    
   ・” (5)但し、X、:当該ユニットで重みw
lを乗算される入力値、 η:学習定数 当該ユニットが出力層にあれば、 δ=v (1−v) (d−v)         −
(6)但し、V:実際の出力値 d:望ましい出力値 また当該ユニットが出力層以外にあれば、δ1:x’+
 (1x’+)Σδkwy       ・・・(7)
但し、総和のkは当該ユニットよりも後段の層のすべて
のユニットにわたる。
Xl:当該ユニットの出力値 以上のアルゴリズムは、実際の出力値■と望ましい出力
値dとの平均二乗誤差を極小化するように、重みW;を
修正していく。学習時には、まずニューラルネットワー
ク6内の各重み値を適宜初期設定したあと、多数の音声
信号およびモデム信号の短期間自己相関数値(正規化し
たもの)の標本データを順次にニューラルネットワーク
6に入力して出力データを得る。また標本データごとに
音声信号が入力された場合には値「1」、モデム信号が
入力された場合には値「0」の2値信号を、希望出力値
として与える。標本データごとに、ニューラルネットワ
ーク6の出力データを得たあと、式(5)〜(7)によ
る各重み値の修正を、出力層62から初めて入力層60
の側に向って、実行する。この修正は、上述の平均二乗
誤差の極小点に到達するまで、繰返される。
上述のバックプロパゲーションによる学習終了後、ニュ
ーラルネットワーク6は、学習結果の重みを用いて動作
する。この動作時に入力された短時間自己相関係数は、
ニューラルネットワーク63 の領域分類機能により、音声信号領域の短時間自己相関
係数であるかモデム信号領域の短時間自己相関係数であ
るかの分類がなされる。
ニューラルネットワーク6の出力は、例えば音声信号の
場合に「1」を、モデム信号の場合に「0」を出力する
ように学習させた場合でも、各ユニッ)70〜72の応
答関数がsigmoid関数であるため、「0」から「
1」までの間の連続値をとり得る。このために、判定器
31において、あらかじめ決められたしきい値(例えば
0.5)との比較により、しきい値以上の場合に音声信
号であると判定し、しきい個未満の場合にモデム信号と
判定して、出力端子8に識別結果として出力している。
第3図は本発明の第2の実施例のブロック図であり、第
1の実施例(第1図参照)の判定器31のあとに、加算
器32と、その出力データに定数を乗算して加算器32
の入力データを与える乗算器33とから成る積分器とを
付加接続し、更にこの積分器のあとに判定器34を付加
接続した構成4− を示す。
この積分器を付加することにより、散発的に生じる誤識
別を平滑化して除去でき、短時間で散発的に生じる識別
結果の不安定性を防止し、識別率を向上できる。
次に、第1および第2の実施例について、実験データの
例を示す。この実験は、第3図の回路(第1図の回路を
含んでいる)を汎用ディジタル信号プロセッザ(D S
 P)集積回路(日本電気■製のμPD77C25)に
より実現して、行われた。短時間自己相関関数計算機3
0では、時間窓幅W=64とし、遅れに=O〜4の関数
値を算出して、基準化値<R(1)>〜<R(4)>を
ニューラルネットワーク6に入力する。ニューラルネッ
トワーク6は、入力層60に3個のユニット70を、ま
た出力層62に1個のユニット72をそれぞれもち、中
間層61を設けない2層構成のものを使用した。ニュー
ラルネットワーク6の学習は、ミニコンピユータ上でオ
フライン・シミュレーションにより行なった。このシミ
ュレーションは、日本人の成人男性2人、成人女性1人
の音声信号と、2400bps (CCITT  V、
26bis)、4800bps (V、27bi s)
、9600bps(V2O)のモデム信号とについて行
ない、音声信号入力時にII I II、モデム信号入
力時にII OIIのニューラルネットワーク出力を得
るよう、バックプロパゲーション法で学習させた。学習
して得られた重み係数値をニューラル・ネットワーク6
に書込んで識別を行なった結果、表1に示すように識別
率が得られた。
表1 表1中で、識別率(A)は第1図の実施例、また識別率
(B)は第3図の実施例の実験データを示す。なお、音
声■〜■、モデム■〜■は学習した入力信号であり、残
余の音声■〜■、モデム■。
■は学習していない入力信号である。
以上説明したように、第1ないし第3の実施例では、少
数の遅れについての短時間自己相関係数により、入力デ
ィジタル信号の特徴を分類でき、実用上十分な識別率が
得られる。これに伴なって、ニューラルネットワークの
ユニット数も少なくて済み、ニューラルネットワークの
学習を自動的に短時間で行える。
なお、ニューラルネットワーク6については、階層型の
ものをバックプロパゲーション法で学習させ使用する場
合を説明したが、これに限定されるものでは無い。ユニ
ット間接続にフィードバック結合を含む相互結合型のも
のを、ホップフィールド(J、J、Hopf 1eld
)による方法あるいはヒントン(に、E、Hinton
)等による方法で学習させ使用しても良い。
17 第4図は本発明の第3の実施例を示すブロック図であり
、第1図の実施例におけるニューラル・ネットワーク6
のすぐあとに、加算器32および乗算器33から成る積
分器を接続し、この積分器の出力データ値がしきい値を
超えたか否かで音声信号かモデム信号かを判定する判定
器34を付加接続した構成を示す。この構成は、第3図
の実施例において、判定器31を除去したものに相当す
るが、第2図の場合と同様に、ニューラルネットワーク
6が出力する関数値の散発的な不安定性を平滑化して、
安定な識別結果を得ることができる。
第1図、第3図、および第4図の回路において、入力デ
ィジタル信号に含まれている背景白色雑音が無視できな
い場合、遅れに=oの短時間自己相関係数R(0)は、
背景白色雑音の電力個分だけ増大する。他方、遅れに=
0以外の短時間自己相関係数R(n)(neo)は、背
景白色雑音の影響を殆んど受けない。この結果、R(0
)で正規化した短時間自己相関係数<R(n)> (n
eo)は、雑音を含まない場合よりも小さな値になり、
信号識8 別を誤らせる原因となる。
第5図は、このような背景白色雑音の悪影響を除去する
手段を付加した、本発明の第4の実施例ブロック図であ
る。同図の回路は、入力ディジタル信号と、短時間自己
相関係数計算器16で得られるR 、 (0)とを受信
し、無音部における入力ディジタル信号の電力値を保持
する雑音電力値保持回路43を、第1図の回路に付加接
続した構成をもつ。
雑音電力値保持回路43は、第6図に示すように、入力
されたディジタル信号の有音部を検出する有音検出器4
3Aと、入力された入力信号の電力値をこの有音検出器
43Aの検出時間に相当する標本時間だけ遅延する遅延
回路43Bと、有音検出器43Aが無音であると出力し
た時の遅延回路43Bの出力を、無音部の信号電力値と
して保持する保持回路43Cとから構成される。
次に、本実施例の音声・モデム信号識別回路の動作につ
いて第5図および第6図を参照して説明する。
入力端子lから入力されたディジタル信号は、短時間自
己相関係数計算器16の相関係数計算器42と雑音電力
値保持回路43とに入力される。
相関係数計算器42は、第1図の回路の場合と同様に、
前述した式(1)により短時間自己相関係数を計算する
また、雑音電力値保持回路43では、入力ディジタル信
号は、有音検出器43Aに入力される。
有音検出器43Aは、入力されたディジタル信号が有音
であるか無音であるかの検出を行う。遅延回路43Bは
、有音検出器43Aの検出遅れを補正するために、この
遅延時間に相当する標本時間だけ、入力の信号すなわち
電力値R1(0)を遅延して出力する。保持回路43C
は、有音検出器43Aの出力が無音の状態から有音の状
態に変化したとの遅延回路43Bの出力値の保持し出力
する。
このように、雑音電力値保持回路43では、入力ディジ
タル信号と相関係数計算器42の出力する遅れOの短時
間自己相関係数B、(0) (入力信号電力値)とを入
力し、入力ディジタル信号が無い時の背景白色雑音の電
力値を保持し、出力する。
正規化器14には、相関係数計算器42および雑音電力
値保持回路43の両出力データが入力される。ここで、
入力信号電力値R(0)は背景白色雑音の電力値が加算
されており、この背景白色雑音の電力値は、信号の有無
にかかわらず一定とみなせる。このため、背景白色雑音
の電力値は入力ディジタル信号が無い時の入力信号の電
力値であり、これが雑音電力値保持回路43からの出力
される。正規化器44では、入力信号電力値R1(0)
から雑音電力値保持回路43の出力値を差引き、背景白
色雑音の影響を取り除いた遅れ0の短時間相関係数をR
n(0)とする。
R;、(の=Rn(0)−No I S       
    ・(8)ただし、式(8)のN0ISは雑音電
力値保持回路13の出力値である。
正規化器44における正規化は式(8)の結果を用いて
次の式(9)により行う。
1− 式(9)により求められた短時間自己相関係数は、背景
白色雑音の影響を取り除いた短時間自己相関係数R狐(
0)で正規化されるため、背景白色雑音の影響を受けな
い。この正規化された短時間自己相関係数は、ニューラ
ルネットワーク6に入力される。入力された短時間自己
相関係数は、ニューラルネットワーク6の領域分類機能
により、音声信号領域の短時間自己相関係数であるかモ
デム信号領域の短時間自己相関係数であるかの分類がな
される。
ニューラルネットワーク6の出力は、例えば音声信号の
場合に「1」を、モデム信号の場合に「0」を出力する
ように学習させた場合でも、ニューロンユニットの応答
関数がsigmoid関数であるため、「0」から「1
」までの間の接続値をとる。このために、判定器31に
おいて、あらかじめ決められたしきい値(例えば0.5
)との比較により、しきい値以上の場合に音声信号であ
ると判定し、しきい値未満の場合にモデム信号と判定し
て、出力端子8に識別結果として出力する。
2 このように、本実施例は、遅れOの短時間自己相関係数
R1(0)から背景白色雑音の信号電力値を差引いた値
で正規化することにより、背景白色雑音の影響を受けな
い短時間自己相関係数R0(k)が得られる。このため
、背景白色雑音の多い状況下でも音声信号とモデム信号
との識別率の低下が起こらない。
第7図(a) 、 (b)は本発明の第5の実施例を示
すブロック図である。同図(a)において、入力端子1
から与えられるディジタル信号は、適応予測器21およ
び減算器22へ入力される。適応予測器21は、例えば
ADPCM用の適応予測器であり、予測信号と入力ディ
ジタル信号との差である誤差信号を減算器22から受け
て、誤差信号をゼロに近付けるよう予測係数24を修正
していく。この適応予測器21は、同図(b)に示すご
とく、m個(mは整数)の遅延器り、、D2.・・・、
Dmから成るタップ付遅延回路の各タップ出力に、係数
器A1゜A 2 、・・・、A□から与えられる係数a
l+a2+・・・。
aイを乗算器M1. M2 、・・・+ Mmにて乗じ
、各乗算結果を加算器Sで加算して、加算結果を予測信
号として出力する。各係数a1ないしamは、減算器2
2から受ける誤差信号をゼロに近付けるよう適応的に修
正されて、乗算器M1ないしMmに与えられると共に、
ニューラルネットワーク6へ予測係数24として与えら
れる。
この予測係数は、音声信号とモデム信号とで異なった特
徴を有し、しかも入力ディジタル信号の信号対雑音比や
信号振幅に依存しない。学習済みのニューラルネットワ
ーク6で音声信号かモデム信号かを分類され、判定器3
1でしきい値との比較によりいずれの信号であるか判定
される。
第8図は本発明の第6の実施例のブロック図である。同
図において、入力端子1から入力する信号は、低域通過
フィルタ11.高域通過フィルタ12、短時間エネルギ
ー計算器13.および零交差数計算器14に入力される
。短時間エネルギー計算器13は、入力信号と、低域通
過フィルタ11および高域通過フィルタ12の出力信号
とを受信し、各信号の短時間エネルギーを計算する。
零交差数計算器14は、入力信号と、低域通過フィルタ
11および高域通過フィルタ12の出力信号とを受信し
、それぞれの零交差数および1ザンプル前との差分信号
についての零交差数を計算する。ニューラルネットワー
ク6には、短時間エネルギー計算器4および零交差数計
算器5の両出力信号を並列に入力する。
このニューラルネットワーク6の入力信号は、従来の音
声・モデム信号を識別回路でも使われているように、音
声信号とモデム信号とで異なった特徴を有している。従
来の識別回路では、短時間エネルギーと零交差数とをそ
れぞれ別の判定器に与えて信号識別にさせているのに対
し、本実施例では、両者を並列にニューラルネットワー
ク6に与えて信号領域の分類を行なわせる。従って従来
の回路では、短時間エネルギーおよび零交差数の相互関
連による信号識別が不可能であるのに対し、本実施例で
は、両者の相互関係を含めた総合的な信号識別を行なう
ことができ、従来回路よりも高い識別率が得られる。
5− 〔発明の効果〕 以上説明したように本発明によれば、入力信号の自己相
関を示す信号は音声信号とモデム信号とで顕著に異なる
特徴をもち、その上白色雑音の影響を受は難いので、こ
れをニューラルネットワークで分類することにより、実
用上十分に高い識別率を得ることができる。また、信号
識別用の条件であるニューラルネットワークの重みの値
は、学習時に自動的に設定される。
更に、入力信号の特徴をもつ信号を複数組用いる場合、
例えば入力信号の短時間エネルギーと零交差数とを用い
る場合でも、その複数組の信号を同一のニューラルネッ
トワークに入力して、各組相互間の関連も含めて分類で
きる。従って、各組ごとに識別している従来回路に比べ
て、より高い識別率が得られる。
【図面の簡単な説明】
第1図は本発明の第1の実施例のブロック図、第2図(
a) 、 (b)は、第1図中のニューラルネット=2
6 ワークの構成を示すブロック図、第3図は本発明の第2
の実施例の一部を示すブロック図、第4図は本発明の第
3の実施例を示すブロック図、第5図は本発明の第4の
実施例を示すブロック図、第6図は第5図中の雑音電力
値保持回路の構成を示すブロック図、第7図(a) 、
 (b)は本発明の第5の実施例を示すブロック図、第
8図は本発明の第6の実施例を示すブロック図である。 1.10・・・・・・入力端子、6・・・・・・ニュー
ラルネットワーク、60・・・・・・入力層、61・・
・・・・中間層、62・・・・・・出力層、70〜72
・・・・・・ユニッ)、31.34・・・・・・判定器
、8・・・・・・出力端子、11・・・・・・低域通過
フィルタ、12・・・・・・高域通過フィルタ、13・
・・・・・短時間エネルギー計算器、14・・・・・・
零交差数計算器、21・・・・・・ 適応予測器、22
・・・・・・減算器、24・・・・・・予測係数、30
・・・・・・短時間自己相関関数計算器、32・・・・
・・加算器、33・・・・・・乗算器、43・・・・・
・雑音電力値保持回路、42・・・・・・相関係数計算
器、44・・・・・・正規化器。

Claims (1)

  1. 【特許請求の範囲】 1、入力信号を処理して音声信号またはモデム信号のい
    ずれかに応じて異なる特徴をもつ複数の信号を発生する
    信号処理手段と、 前記複数信号に応答して音声信号またはモデム信号のい
    ずれに近い特徴をもつかを示す関数値のデータを発生す
    るニューラルネットワークと、 前記関数値のデータに応答して前記入力信号が音声信号
    またはモデム信号のいずれであるかを示す信号を出力す
    る判定手段とを含む音声・モデム信号識別回路。 2、前記信号処理手段は、前記入力信号の短時間自己相
    関係数を計算して各係数値を示す複数の信号を発し前記
    ニューラルネットワークへ送出する請求項1記載の音声
    ・モデム信号識別回路。 3、前記信号処理手段は、前記入力信号の短時間自己相
    関係数を計算したあと、遅れゼロの係数値でこれ以外の
    係数値を除算して得る正規化係数値を示す複数の信号を
    発生し、前記ニューラルネットワークへ送出する請求項
    1記載の音声・モデム信号識別回路。 4、前記信号処理手段は、前記入力信号の短時間自己相
    関係数を計算する相関係数計算器と、前記入力信号の無
    音部を検出し無音部検出時における遅れゼロの前記短時
    間自己相関係数の値を保持する雑音電力値保持回路と、 該雑音電力値保持回路の保持値を遅れゼロの前記短時間
    自己相関係数から減算した値で遅れゼロ以外の前記短時
    間自己相関係数を除算して得る正規化係数値を示す複数
    の信号を送出する正規化器とを有する請求項1記載の音
    声・モデム信号識別回路。 5、前記雑音電力値保持回路は、前記入力信号の有音部
    を検出する有音検出器と、 前記遅れゼロの短時間自己相関係数値を該有音検出器の
    検出時間に相当する標本時間遅延する遅延回路と、 前記有音検出器の検出結果が無音部を示している時の前
    記遅延回路の出力信号を保持し出力する保持回路とを有
    する請求項4記載の音声・モデム信号識別回路。 6、前記信号処理手段は、前記入力信号と予測信号との
    誤差をゼロに近付けるよう予測係数を適応的に修正して
    前記予測信号を発生する適応予測器を有し、 該予測係数の値を示す複数の信号を前記 ニューラルネットワークへ送出する請求項1記載の音声
    ・モデム信号識別回路。 7、前記信号処理手段は、前記入力信号の短時間エネル
    ギーと前記入力信号およびその差分信号の零交差数とを
    算出して各算出値を示す複数の信号を前記ニューラルネ
    ットワークへ送出する請求項1記載の音声・モデム信号
    識別回路。 8、前記ニューラルネットワークは、それぞれ複数の入
    力信号の重み付け総和に予め定めた関数を作用させ該関
    数値のデータを出力する少なくとも1つのユニットを含
    み該ユニット間で フィードバック接続をもたない階層を、少くとも1つ縦
    続に接続した構成をもつ階層型であり、前記重みをバッ
    クプロパゲーション法により学習して設定させた請求項
    1記載の音声・モデム信号識別回路。 9、前記ニューラルネットワークは、それぞれ複数の入
    力信号の重み付け総和に予め定めた関数を作用させ該関
    数値のデータを出力する複数のユニットを含み、該ユニ
    ット間でフィードバック接続をもつ相互結合型であり、 前記重みを学習設定させた請求項1記載の音声・モデム
    信号識別回路。 10、前記判定手段は、前記関数値のデータと予め設定
    したしきい値との大小を比較して前記入力信号が音声信
    号またはモデム信号のいずれであるかを示す信号を出力
    する請求項1記載の音声・モデム信号識別回路。 11、前記判定手段は、前記関数値のデータを積分器に
    通して平滑化したあと、予め設定したしきい値との大小
    を比較して前記入力信号が音声またはモデム信号のいず
    れであるかを示す信号を出力する請求項1記載の音声・
    モデム信号識別回路。 12、前記判定手段は、前記関数値のデータと予め設定
    した第1のしきい値との大小を比較し、この比較結果を
    積分器に通して平滑化したあと、予め設定した第2のし
    きい値との大小を比較して前記入力信号が音声信号ある
    いはモデム信号のいずれであるかを示す信号を出力する
    請求項1記載の音声・モデム信号識別回路。
JP2327729A 1989-11-28 1990-11-27 音声・モデム信号識別回路 Expired - Lifetime JP2643593B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP1-310134 1989-11-28
JP31013489 1989-11-28
JP4786990 1990-02-28
JP2-47869 1990-02-28

Publications (2)

Publication Number Publication Date
JPH03273722A true JPH03273722A (ja) 1991-12-04
JP2643593B2 JP2643593B2 (ja) 1997-08-20

Family

ID=26388074

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2327729A Expired - Lifetime JP2643593B2 (ja) 1989-11-28 1990-11-27 音声・モデム信号識別回路

Country Status (3)

Country Link
US (1) US5315704A (ja)
EP (1) EP0435458B1 (ja)
JP (1) JP2643593B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0685764A (ja) * 1992-08-31 1994-03-25 Nec Corp Adpcm符復号化装置
JPWO2018193590A1 (ja) * 2017-04-20 2020-02-27 ヤマハ株式会社 情報処理装置及び情報処理方法

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0530645B1 (en) 1991-08-30 1999-07-14 Texas Instruments Incorporated Telephone signal classification and phone message delivery method and system
GB2278984A (en) * 1993-06-11 1994-12-14 Redifon Technology Limited Speech presence detector
FR2725859B1 (fr) * 1994-10-17 1996-12-20 Alcatel Mobile Comm France Dispositif de reconnaisance d'informations portees par un signal recu
US5737485A (en) * 1995-03-07 1998-04-07 Rutgers The State University Of New Jersey Method and apparatus including microphone arrays and neural networks for speech/speaker recognition systems
JP3094832B2 (ja) * 1995-03-24 2000-10-03 三菱電機株式会社 信号識別器
GB2306010A (en) * 1995-10-04 1997-04-23 Univ Wales Medicine A method of classifying signals
US5745874A (en) * 1996-03-04 1998-04-28 National Semiconductor Corporation Preprocessor for automatic speech recognition system
JP3199648B2 (ja) * 1996-03-19 2001-08-20 三菱電機株式会社 信号識別器及び音声周波数帯域内信号伝送装置及び信号識別方法
US5999898A (en) * 1996-06-20 1999-12-07 International Business Machines Corporation Voice/data discriminator
WO1998001847A1 (en) * 1996-07-03 1998-01-15 British Telecommunications Public Limited Company Voice activity detector
US5926090A (en) * 1996-08-26 1999-07-20 Sharper Image Corporation Lost article detector unit with adaptive actuation signal recognition and visual and/or audible locating signal
US6708146B1 (en) * 1997-01-03 2004-03-16 Telecommunications Research Laboratories Voiceband signal classifier
FI971679A7 (fi) * 1997-04-18 1998-10-19 Nokia Corp Puheen havaitseminen tietoliikennejärjestelmässä
US6718297B1 (en) 2000-02-15 2004-04-06 The Boeing Company Apparatus and method for discriminating between voice and data by using a frequency estimate representing both a central frequency and an energy of an input signal
KR20040014431A (ko) 2001-08-06 2004-02-14 가부시키가이샤 인덱스 명성의 음성적 특징분석에 기초하는 개의 감정판별장치 및방법
US20030086444A1 (en) * 2001-09-28 2003-05-08 Globespan Virata, Incorporated Voice/tone discriminator
DE10245107B4 (de) * 2002-09-27 2006-01-26 Siemens Ag Voice Activity Detection auf Basis von unüberwacht trainierten Clusterverfahren
US20050015244A1 (en) * 2003-07-14 2005-01-20 Hideki Kitao Speech section detection apparatus
US20060241937A1 (en) * 2005-04-21 2006-10-26 Ma Changxue C Method and apparatus for automatically discriminating information bearing audio segments and background noise audio segments
KR100802984B1 (ko) 2006-11-24 2008-02-14 연세대학교 산학협력단 기준 모델을 이용하여 미확인 신호를 판별하는 방법 및장치
EP3624113A1 (en) * 2018-09-13 2020-03-18 Nxp B.V. Apparatus for processing a signal
CN109472284A (zh) * 2018-09-18 2019-03-15 浙江大学 一种基于无偏嵌入零样本学习的电芯缺陷分类方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01222299A (ja) * 1988-03-01 1989-09-05 Nippon Denso Co Ltd 音声認識装置
JPH01232464A (ja) * 1988-03-11 1989-09-18 Nippon Telegr & Teleph Corp <Ntt> ニューラルネット構成方法
JPH01320565A (ja) * 1988-06-22 1989-12-26 A T R Jido Honyaku Denwa Kenkyusho:Kk ニューラルネットの学習効率化方法
JPH0232395A (ja) * 1988-07-22 1990-02-02 Fujitsu Ltd 音声区間切出制御方式
JPH0272398A (ja) * 1988-09-07 1990-03-12 Hitachi Ltd 音声信号用前処理装置
JPH02192335A (ja) * 1989-01-20 1990-07-30 Toshiba Corp 語頭検出方式
JPH02195399A (ja) * 1989-01-24 1990-08-01 Sekisui Chem Co Ltd 男女声の識別方式

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3097349A (en) * 1961-08-28 1963-07-09 Rca Corp Information processing apparatus
FR2374651A1 (fr) * 1976-12-16 1978-07-13 Labo Cent Telecommunicat Dispositif d'elimination des lobes secondaires d'auto-correlation d'un signal continu periodique code en phase
US4281218A (en) * 1979-10-26 1981-07-28 Bell Telephone Laboratories, Incorporated Speech-nonspeech detector-classifier
US4321686A (en) * 1980-01-24 1982-03-23 Communications Satellite Corporation Correction processor of self-adaptive filters
IT1144551B (it) * 1981-02-24 1986-10-29 Cselt Centro Studi Lab Telecom Dispositivo numerico per la discriminazione di segnali vocali e segnali dati entrambi numerizzati
GB2139052A (en) * 1983-04-20 1984-10-31 Philips Electronic Associated Apparatus for distinguishing between speech and certain other signals
US4660166A (en) * 1985-01-22 1987-04-21 Bell Telephone Laboratories, Incorporated Electronic network for collective decision based on large number of connections between signals
US4773024A (en) * 1986-06-03 1988-09-20 Synaptics, Inc. Brain emulation circuit with reduced confusion
US4807168A (en) * 1987-06-10 1989-02-21 The United States Of America As Represented By The Administrator, National Aeronautics And Space Administration Hybrid analog-digital associative neural network
JP3321156B2 (ja) * 1988-03-11 2002-09-03 ブリテツシユ・テレコミユニケイシヨンズ・パブリツク・リミテツド・カンパニー 音声の動作特性検出
US5048100A (en) * 1988-12-15 1991-09-10 Michael Kuperstein Self organizing neural network method and system for general classification of patterns

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01222299A (ja) * 1988-03-01 1989-09-05 Nippon Denso Co Ltd 音声認識装置
JPH01232464A (ja) * 1988-03-11 1989-09-18 Nippon Telegr & Teleph Corp <Ntt> ニューラルネット構成方法
JPH01320565A (ja) * 1988-06-22 1989-12-26 A T R Jido Honyaku Denwa Kenkyusho:Kk ニューラルネットの学習効率化方法
JPH0232395A (ja) * 1988-07-22 1990-02-02 Fujitsu Ltd 音声区間切出制御方式
JPH0272398A (ja) * 1988-09-07 1990-03-12 Hitachi Ltd 音声信号用前処理装置
JPH02192335A (ja) * 1989-01-20 1990-07-30 Toshiba Corp 語頭検出方式
JPH02195399A (ja) * 1989-01-24 1990-08-01 Sekisui Chem Co Ltd 男女声の識別方式

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0685764A (ja) * 1992-08-31 1994-03-25 Nec Corp Adpcm符復号化装置
JPWO2018193590A1 (ja) * 2017-04-20 2020-02-27 ヤマハ株式会社 情報処理装置及び情報処理方法
US11715013B2 (en) 2017-04-20 2023-08-01 Yamaha Corporation Machine learning device, information processing device and output device

Also Published As

Publication number Publication date
EP0435458A1 (en) 1991-07-03
EP0435458B1 (en) 1995-02-01
JP2643593B2 (ja) 1997-08-20
US5315704A (en) 1994-05-24

Similar Documents

Publication Publication Date Title
JPH03273722A (ja) 音声・モデム信号識別回路
US5185848A (en) Noise reduction system using neural network
CN105611477B (zh) 数字助听器中深度和广度神经网络相结合的语音增强算法
US5715372A (en) Method and apparatus for characterizing an input signal
CN101366078A (zh) 从单音音频信号分离音频信源的神经网络分类器
WO2010001393A9 (en) Apparatus and method for classification and segmentation of audio content, based on the audio signal
KR0173923B1 (ko) 다층구조 신경망을 이용한 음소 분할 방법
CN113077812B (zh) 语音信号生成模型训练方法、回声消除方法和装置及设备
CN117174104A (zh) 基于融合多路编码特征协同解码的单通道语音增强方法
CN114401168A (zh) 一种适用于复杂强噪声环境下短波莫尔斯信号的语音增强方法
TWI749547B (zh) 應用深度學習的語音增強系統
CN111341351A (zh) 基于自注意力机制的语音活动检测方法、装置及存储介质
KR20000063265A (ko) 신경회로망을 이용한 음향식별에 기반한 코골이 음향식별방법
JP3084721B2 (ja) 雑音除去回路
Rosca et al. Multichannel voice detection in adverse environments
KR102358151B1 (ko) 컨볼루션 순환신경망을 이용한 잡음 제거 방법
JPH0462599A (ja) 雑音除去装置
CN116405139A (zh) 一种基于Informer的频谱预测模型和方法
CN115273873A (zh) 基于深度学习的语音增强方法及装置
Lewis et al. Cochannel speaker count labelling based on the use of cepstral and pitch prediction derived features
Sangwan et al. Design and performance analysis of Bayesian, Neyman–Pearson, and competitive Neyman–Pearson voice activity detectors
EP4648049A1 (en) Apparatus and method for processing a pre-processed audio input signal to obtain an activity output signal
JPH04369695A (ja) 音声判別装置
CN120581016A (zh) 一种用于混合语音分离、降噪及声音识别的语音处理方法及系统
CN121506102A (zh) 一种学习机待机关键词识别方法及系统