JPH04182700A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH04182700A
JPH04182700A JP2313049A JP31304990A JPH04182700A JP H04182700 A JPH04182700 A JP H04182700A JP 2313049 A JP2313049 A JP 2313049A JP 31304990 A JP31304990 A JP 31304990A JP H04182700 A JPH04182700 A JP H04182700A
Authority
JP
Japan
Prior art keywords
word
value
section
noise level
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2313049A
Other languages
English (en)
Inventor
Keiko Shimada
島田 桂子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2313049A priority Critical patent/JPH04182700A/ja
Priority to CA002055749A priority patent/CA2055749C/en
Priority to EP91310659A priority patent/EP0487307B1/en
Priority to AU88002/91A priority patent/AU642311B2/en
Priority to DE69118118T priority patent/DE69118118T2/de
Publication of JPH04182700A publication Critical patent/JPH04182700A/ja
Priority to US08/201,093 priority patent/US5416887A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Noise Elimination (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、発声された単語音声を自動的に認識する音声
認識装置に関する。
〔従来の技術] 従来、この種の音声認識装置は、静かな環境、雑音レー
、ルが比較的小さく一定な条件で使用されることを前提
に設計されていたため1、特に雑音に対する対策等はな
されていなかった。従ってリジェクト値は静かな環境乙
こ合わせて設定され常に一定の値であった。
[発明が解決しようとする課題] 周囲の雑音レベルが大きくなると、入力パタンと標準パ
タンの累積距離g″(I、、J)も太き(なる。上述し
た従来の音声認識装置は、リジェクト値Rが周囲の雑音
レベルが変わっても一定であるため、リジェクト値Rを
雑音レベルが高いときに合わせて設定した場合には、雑
音レベルが低いときに認識を行うと、累積距離gn(I
、J)が比較的大きくても認識結果として出力されるこ
とになり、誤認識が多くなる。反対に、リジェクト値R
を雑音レベルが低いときに合わせて設定した場合、雑音
レベルが高いときに認識を行うと、累積距離gn(I、
J)が大きくなるため、リジェクト値Rを越えてしまい
、正しい単語にもかかわらず、認識結果が出力されない
ことが増えてし、まうという欠点がある。
本発明の目的は、高雑音下の認識において、正しいと思
われる標準単語がリジェクト値によりはじかれたり、静
かな環境において誤認識が増えたりすることを防くこと
のできる音声認識装置を提供することにある。
[課題を解決するための手段] 本発明は、特徴ベクトルの時系列である単話人カパタン
A=&+、&z、−,a8.−、at とあらかしめ記
憶されているN個の単語標準パタンB″−bl’、bz
”、b7”、bJI″(n=1.2. ・・・、N)と
の間で、DPマツチングの漸化式計算を、入力パタンの
時間点を示す信号iを1からIまで変化させ、各iに関
して単語を示す信号nを1からNまで変化させ、さらに
各nに関して標準パタンの時間点を示す信号jを1から
jまで変化させて、入力パタンa、と標準パタンb4の
ベクトル間距離d”  (at、b;)を求め、さらに
DPマッチングの漸化式計算より、ベクトル間距離d″
(a、。
bj)の累積距離gn(i、j)を求め、入力単語Aの
終端において累積距離gn(I、J)が最小となる標準
単語Nを認識結果の第一候補とし、その単語Nの累積距
離gN(T、J)が、入力単語と類似しているかどうか
を判定するためのリジェクト値Rを越えない場合に、標
準単語Nを認識結果として出力する音声認識において、 音声認識時の周囲の雑音レベルを推定する手段と、雑音
レベルの関数としてリジェクト値Rを求める手段とを有
することを特徴とする。
また本発明の音声認識装置は、 認識結果の第一候補である単語Nの累積距離gN(r、
J)を入力時間長Iで正規化し、その正規化累積距離G
’(I、J)が、単位時間当りのリジェクト値rを越え
ない場合に、単語Nを認識結果として出力することを特
徴とする。
[作用] 本発明では、DPマッチングの漸化式計算を入力パタン
Aの時間軸iに同期させて行い、時刻iにおいて全ての
標準パタンnの時刻jに対する累積距離gn(i、Nを
求める。DPマッチングの漸化式は、 gn(i、j) =d’ (i、  j) +min [gn (i  
1.  j  P) jp=o、1.2       
 ・・・(1)である。ただし、d″(i、  j)は
時刻iにおける入力パタンと時刻jにおける標準パタン
との距離である。人力単語Aの終端Iにおいて累積距離
gn(I、J)が最小となる標準単語Nの累積距離をg
′4(T、J)とする。この単Mxp4は認識結果の候
補である。累積路MgN(x、J)が十分小さく単語N
と入力単語Aが同一単語であることを判定するリジェク
ト値をr (z)とする。
r (z)は、単位時間当りの距離の上限であり、周囲
雑音レベルZの関数とする。従って、累積距離gN(I
、J)を入力時間Iで正規化し、その正規化累積距離 G″’(I、J)=gN(I、J)/1かリジェクト値
r (z)以下の場合は、単語Nは入力単語Aと同一単
語であるとみなして認識結果として出力する。G’(I
、J)がリジェクト値r (z)を超えた場合は、単語
Nと単語Aは異なる単語であるとみなし出力しない。
周囲雑音レベルが大きくなると、累積距離g。
(I、J)も大きくなる。そこで、リジェクト値r (
z)も雑音レベル2に合わせて変化させる。
リジェクト値r (z)は周囲雑音レベル2より次のよ
うに決定する。
ぼ′”、  (z<z”°1 r  (z)  −1txz  −β (Z し。−≦
 2 ≦ Z  HIGH)tr、、X(Z>Z、、、
、) ・・・(2) ここで、r6,7はリジェクト値rの最小値、rイ、X
はリジェクト値rの最大値、Z LOWは雑音レベルの
下限、Z HIGHは雑音レベルの上限である。
リジェクト値r (z)と雑音レベルZの関係を第2図
に示す。
r ff1aX+ r min+ r HIGH+ Z
 towを最適に選ぶことにより、静かな環境において
も、高雑音下においても一定の認識性能が得られる。
[実施例] 本発明の一実施例である音声認識装置の構成を示す。
この音声認識装置は、制御部10と、音声分析部20と
、雑音レベル推定部30と、音声検出部40と、リジェ
クト値計算部50と、入力パタンハソファ60と、標準
パタンメモリ部70と、距離計算部80と、漸化式計算
部90と、認識結果判定部100とから構成されている
音声分析部20は、入力される音声信号を分析し、一定
時間毎に特徴ベクトルを出力する。この連続分析は例え
ば、多チャネルのフィルタより構成されるフィルタバン
クによる周波数分析などがある。
雑音レベル推定部30では、常に入力レベルを監視し、
音声検出された以外は雑音とみなし、雑音レベルを音声
検出部40とリジェクト値計算部50に伝える。
音声検出部40では、入力音声のレベルを監視し、雑音
レベルから音声の始端、終端を検出し、その検出した時
点を制御部lOへ信号SPにより伝える。
入力パタンハソファ60は、音声の始端が検出された後
、制御部10からの信号11に従って音声分析部20よ
り与えられる特徴ベクトルa、を記憶する。信号11は
入力パタンの時間点iに対応した信号である。
標準パタンメモリ部70は、N個の単語標準パタンB、
、B、、・・・、BNを記憶している。
制御部10は、標準パタンの単語nを指示する信号n1
を標準パタンメモリ部70に発し、標準単語パタンの時
間点jに対応する信号j1を発生する。
信号11に従って、入力パタンバッファ60より入力パ
タンの特徴ベクトルa、が読み出され、信号j1および
nlに従って標準パタンメモリ部70より単語標準パタ
ンb’、が読み出され、信号c122によって距離計算
部80においてベクトル間距離d″(i、j)が計算さ
れる。
入力パタンハンファ60と標準パタンメモリ部70より
制御部10からの信号m1に従ってM個のデータが読み
込まれ、距離d’(i、j)が漸化式計算部90へ入力
される。
漸化式計算部90では、制御部10からの信号cff3
によって指示された(n、i、j)乙こおける漸化式計
算を行い、累積距離g”(i、j)を求める。この漸化
式計算がj=1よりJ″まで算出され、入力単語Aとの
距離g”(I、J)が各nに対して算出される。
入力音声の終端が検出されると、音声検出部40より信
号SPによって制御部10へ通知され、続いて制御部1
0はリジェクト値計算部50へ信号cj21を発する。
リジェクト値計算部50は、音声が入力される直前の雑
音レベルZと式(2)よりリジェクト値rを求め認識結
果判定部100に送る。
制御部10は、認識結果判定部100へ信号12を発し
、認識結果判定部100は、漸化式計算部90より各単
語nに対する累積距離g”(I、J)を受けて、この中
で最小のg″(I、J)となるnを決定する。累積距離
の最小値gN(I、J)を1で正規化した値GN(I、
J)とりジエクト値計算部50より受は取ったリジェク
ト値rを比較する。
CN(I、J)がr以下の場合は単語Nを認識結果とし
て出力し、rを越える場合は認識結果はなかったものと
する。
(発明の効果] 以上説明したように本発明は、リジェクト値を周囲雑音
レベルに対応しで求めることにより、高雑音下の認識に
おいて、正しいと思われる標準単語がリジェクト値によ
りはじかれたり、静かな環境において誤認識が増えたり
することを防く効果がある。
【図面の簡単な説明】
第1図は音声認識装置の一実施例の構成図、第2回は本
発明の原理であるリジェクト値と雑音レベルの関係図で
ある。 10・・・・・制御部 20・・・・・音声分析部 30・・・・・雑音レベル推定部 40・・・・・音声検出部 50・・・ ・リジェクト値計算部 60・・・・・人カパタンハソファ 70・・ ・・・標準パタンメモリ部 80・・・・・距離計算部 90・・・・・漸化式計算部 100  ・・・・認識結果判定部 代理人 弁理士  岩 佐  義 幸

Claims (2)

    【特許請求の範囲】
  1. (1)特徴ベクトルの時系列である単語入力パタンA=
    a_1、a_2、・・・、a_i、・・・、a_Iとあ
    らかじめ記憶されているN個の単語標準パタンB^n=
    b_I^n、b_2^n、b_j^n、b_J^n(n
    =1、2、・・・、N)との間で、DPマッチングの漸
    化式計算を、入力パタンの時間点を示す信号iを1から
    Iまで変化させ、各iに関して単語を示す信号nを1か
    らNまで変化させ、さらに各nに関して標準パタンの時
    間点を示す信号jを1からJまで変化させて、入力パタ
    ンa_iと標準パタンb_jのベクトル間距離d^n(
    a_i、b_j)を求め、さらにDPマッチングの漸化
    式計算より、ベクトル間距離d^n(a_i、b_j)
    の累積距離g^n(i、j)を求め、入力単語Aの終端
    において累積距離g^n(I、J)が最小となる標準単
    語Nを認識結果の第一候補とし、その単語Nの累積距離
    g^N(I、J)が、入力単語と類似しているかどうか
    を判定するためのリジェクト値Rを越えない場合に、標
    準単語Nを認識結果として出力する音声認識において、 音声認識時の周囲の雑音レベルを推定する手段と、雑音
    レベルの関数としてリジェクト値Rを求める手段とを有
    することを特徴とする音声認識装置。
  2. (2)請求項1記載の音声認識装置において、認識結果
    の第一候補である単語Nの累積距離g^N(I、J)を
    入力時間長Iで正規化し、その正規化累積距離G^N(
    I、J)が、単位時間当りのリジェクト値にを越えない
    場合に、単語Nを認識結果として出力することを特徴と
    する音声認識装置。
JP2313049A 1990-11-19 1990-11-19 音声認識装置 Pending JPH04182700A (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2313049A JPH04182700A (ja) 1990-11-19 1990-11-19 音声認識装置
CA002055749A CA2055749C (en) 1990-11-19 1991-11-18 Method and system for speech recognition without noise interference
EP91310659A EP0487307B1 (en) 1990-11-19 1991-11-19 Method and system for speech recognition without noise interference
AU88002/91A AU642311B2 (en) 1990-11-19 1991-11-19 Method and system for speech recognition without noise interference
DE69118118T DE69118118T2 (de) 1990-11-19 1991-11-19 Methode und System zur Spracherkennung ohne Rauschbeeinflussung
US08/201,093 US5416887A (en) 1990-11-19 1994-02-24 Method and system for speech recognition without noise interference

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2313049A JPH04182700A (ja) 1990-11-19 1990-11-19 音声認識装置

Publications (1)

Publication Number Publication Date
JPH04182700A true JPH04182700A (ja) 1992-06-30

Family

ID=18036593

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2313049A Pending JPH04182700A (ja) 1990-11-19 1990-11-19 音声認識装置

Country Status (6)

Country Link
US (1) US5416887A (ja)
EP (1) EP0487307B1 (ja)
JP (1) JPH04182700A (ja)
AU (1) AU642311B2 (ja)
CA (1) CA2055749C (ja)
DE (1) DE69118118T2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0535293A (ja) * 1991-08-01 1993-02-12 Fujitsu Ltd 音声認識装置における認識候補数設定方式
US5323337A (en) * 1992-08-04 1994-06-21 Loral Aerospace Corp. Signal detector employing mean energy and variance of energy content comparison for noise detection
JPH0832494A (ja) * 1994-07-13 1996-02-02 Mitsubishi Electric Corp ハンズフリー通話装置
JP2738403B2 (ja) * 1995-05-12 1998-04-08 日本電気株式会社 音声認識装置
DE19521258A1 (de) * 1995-06-10 1996-12-12 Philips Patentverwaltung Spracherkennungssystem
US5765130A (en) * 1996-05-21 1998-06-09 Applied Language Technologies, Inc. Method and apparatus for facilitating speech barge-in in connection with voice recognition systems
US5825898A (en) * 1996-06-27 1998-10-20 Lamar Signal Processing Ltd. System and method for adaptive interference cancelling
US6178248B1 (en) 1997-04-14 2001-01-23 Andrea Electronics Corporation Dual-processing interference cancelling system and method
US6363345B1 (en) 1999-02-18 2002-03-26 Andrea Electronics Corporation System, method and apparatus for cancelling noise
US6275800B1 (en) * 1999-02-23 2001-08-14 Motorola, Inc. Voice recognition system and method
US6577997B1 (en) 1999-05-28 2003-06-10 Texas Instruments Incorporated System and method of noise-dependent classification
US6519559B1 (en) 1999-07-29 2003-02-11 Intel Corporation Apparatus and method for the enhancement of signals
US6594367B1 (en) 1999-10-25 2003-07-15 Andrea Electronics Corporation Super directional beamforming design and implementation
US20030171900A1 (en) * 2002-03-11 2003-09-11 The Charles Stark Draper Laboratory, Inc. Non-Gaussian detection
EP2107553B1 (en) * 2008-03-31 2011-05-18 Harman Becker Automotive Systems GmbH Method for determining barge-in
EP2148325B1 (en) * 2008-07-22 2014-10-01 Nuance Communications, Inc. Method for determining the presence of a wanted signal component
EP2850611B1 (en) 2012-06-10 2019-08-21 Nuance Communications, Inc. Noise dependent signal processing for in-car communication systems with multiple acoustic zones
DE112012006876B4 (de) 2012-09-04 2021-06-10 Cerence Operating Company Verfahren und Sprachsignal-Verarbeitungssystem zur formantabhängigen Sprachsignalverstärkung
US9613633B2 (en) 2012-10-30 2017-04-04 Nuance Communications, Inc. Speech enhancement

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5491006A (en) * 1977-12-28 1979-07-19 Nec Corp Audio recognition unit
JPS6440898A (en) * 1987-08-06 1989-02-13 Canon Kk Voice recognition equipment

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1116300A (en) * 1977-12-28 1982-01-12 Hiroaki Sakoe Speech recognition system
US4989248A (en) * 1983-01-28 1991-01-29 Texas Instruments Incorporated Speaker-dependent connected speech word recognition method
JPS60179797A (ja) * 1983-10-27 1985-09-13 日本電気株式会社 パタンマツチング装置
US4713777A (en) * 1984-05-27 1987-12-15 Exxon Research And Engineering Company Speech recognition method having noise immunity
JPH0792673B2 (ja) * 1984-10-02 1995-10-09 株式会社東芝 認識用辞書学習方法
US4908865A (en) * 1984-12-27 1990-03-13 Texas Instruments Incorporated Speaker independent speech recognition method and system
GB8517918D0 (en) * 1985-07-16 1985-08-21 British Telecomm Recognition system
JPS62187897A (ja) * 1986-02-14 1987-08-17 日本電気株式会社 連続音声認識装置
JPH06105394B2 (ja) * 1986-03-19 1994-12-21 株式会社東芝 音声認識方式
US4922537A (en) * 1987-06-02 1990-05-01 Frederiksen & Shu Laboratories, Inc. Method and apparatus employing audio frequency offset extraction and floating-point conversion for digitally encoding and decoding high-fidelity audio signals
IL84948A0 (en) * 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
US5212764A (en) * 1989-04-19 1993-05-18 Ricoh Company, Ltd. Noise eliminating apparatus and speech recognition apparatus using the same
US5073939A (en) * 1989-06-08 1991-12-17 Itt Corporation Dynamic time warping (DTW) apparatus for use in speech recognition systems
US5025471A (en) * 1989-08-04 1991-06-18 Scott Instruments Corporation Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns
US5148489A (en) * 1990-02-28 1992-09-15 Sri International Method for spectral estimation to improve noise robustness for speech recognition
CA2042926C (en) * 1990-05-22 1997-02-25 Ryuhei Fujiwara Speech recognition method with noise reduction and a system therefor

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5491006A (en) * 1977-12-28 1979-07-19 Nec Corp Audio recognition unit
JPS6440898A (en) * 1987-08-06 1989-02-13 Canon Kk Voice recognition equipment

Also Published As

Publication number Publication date
EP0487307B1 (en) 1996-03-20
CA2055749C (en) 1996-04-02
CA2055749A1 (en) 1992-05-20
DE69118118T2 (de) 1996-09-19
EP0487307A3 (en) 1992-08-12
US5416887A (en) 1995-05-16
EP0487307A2 (en) 1992-05-27
DE69118118D1 (de) 1996-04-25
AU642311B2 (en) 1993-10-14
AU8800291A (en) 1992-05-21

Similar Documents

Publication Publication Date Title
JPH04182700A (ja) 音声認識装置
US7447634B2 (en) Speech recognizing apparatus having optimal phoneme series comparing unit and speech recognizing method
US4829578A (en) Speech detection and recognition apparatus for use with background noise of varying levels
US4918732A (en) Frame comparison method for word recognition in high noise environments
JPS62231997A (ja) 音声認識システム及びその方法
JPH02267599A (ja) 音声検出装置
JP3611223B2 (ja) 音声認識装置及び方法
JP3069531B2 (ja) 音声認識方法
JPWO2003107326A1 (ja) 音声認識方法及びその装置
JPH05119792A (ja) 音声認識装置
CA1301338C (en) Frame comparison method for word recognition in high noise environments
JPH03120598A (ja) 音声認識方法及び装置
JPS60114900A (ja) 有音・無音判定法
JP3008593B2 (ja) 音声認識装置
JP3360978B2 (ja) 音声認識装置
JPS60129796A (ja) 音声入力装置
EP1079370A2 (en) Method for training a speech recognition system with detection of confusable words
JPH07109559B2 (ja) 音声区間検出方法
KR20040073145A (ko) 음성인식기의 성능 향상 방법
JP3026855B2 (ja) 音声認識装置
JPH0462597A (ja) 音声認識装置
JP5895501B2 (ja) 音声認識装置および音声認識方法
KR100349656B1 (ko) 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법
JPH03220600A (ja) 音声検出装置
JPH06110491A (ja) 音声認識装置