JPH032793A - 音声認識用前処理装置 - Google Patents

音声認識用前処理装置

Info

Publication number
JPH032793A
JPH032793A JP1136873A JP13687389A JPH032793A JP H032793 A JPH032793 A JP H032793A JP 1136873 A JP1136873 A JP 1136873A JP 13687389 A JP13687389 A JP 13687389A JP H032793 A JPH032793 A JP H032793A
Authority
JP
Japan
Prior art keywords
noise
level
section
voice
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1136873A
Other languages
English (en)
Other versions
JP2867425B2 (ja
Inventor
Hiroaki Hattori
浩明 服部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1136873A priority Critical patent/JP2867425B2/ja
Publication of JPH032793A publication Critical patent/JPH032793A/ja
Application granted granted Critical
Publication of JP2867425B2 publication Critical patent/JP2867425B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声認識用前処理装置に関し、特に雑音下で発
声された音声を認識する音声認識装置の性能を向上させ
るための音声認識用前処理装置に関する。
(従来の技術) 従来から音声認識のために、DPマツチングに基づく方
法をはじめとして、さまざまなアルゴリズムが提案され
ている。それらの方法については、古井貞煕、「デジタ
ル信号処理」、東海大学出版会(以下、文献1)に詳し
い。
しかし、それらの方法を用いて雑音下で発声された音声
を認識する場合には、認識率が低下するという問題点が
あった。雑音下で発声された音声の認識が困難であるの
は、音声がこの付加雑音によりマスクされるだけでなく
、発声自身のスペクトルが変形するためである。
同一男性話者が静かな環境と高雑音下において発声した
母音/a/のスペクトルの例を第5図に示す、第5図に
おいて実線は静かな環境において発声された音声のスペ
クトルであり、点線は高雑音下において発声された音声
のスペクトルである。
第6図に示すように高雑音下において発声された場合は
全体のエネルギーの上昇だけでなく、そのスペクトルの
概形やホルマントの位置および帯域幅も変化している。
このような変形は例に示した母音以外でも一般に生じる
。このように、背景雑音レベルが異なる場合の発声は、
同じ母音であってもスペクトル形状が大きく異なったも
のとなるため、母音パターン間距離が大きくなり認識誤
りの原因となっている。
雑音下の音声の認識方法として既にいくつかの方法が提
案されている0例えば、雑音下音声を認識する場合、認
識時と登録時の環境が近いほど認識率はよいことがC,
H,Lee、 K、 Ganesanによって5pee
ch  ReC0gn1tiOn  Under  A
dditiveNoise   、ICASSP  1
984.35.7゜(1984,3)(以下、文献2)
に開示されている。そこで、あらかじめ、多数の環境下
で発声した標準パターンを登録する方法(以下、方法1
)が考えられる。
また、梅崎、板書、「重みつきFFTゲプストラム係数
と平滑化群遅延スペクトル係数による距離尺度の比較と
評価」、日本音響学会講演論文集1−5−11、昭和6
2年10月(以下、文献3)に、重みつきケプストラム
距離を距離尺度とする方法(以下、方法2)が雑音下音
声の認識に有効であることが報告されている。
(発明が解決しようとする課題) 雑音下で発声した音声のスペクトル変形に方法1で対処
する場合には、登録時の手間や記憶量、処理量が膨大に
なるという問題点がある。また、方法2の重みつきケプ
ストラム距離はホルマントピークへの比重が高い距離尺
度であって、加法性の白色雑音等に対しては効果がある
。しかし、この方法はホルマントの位置、帯域幅の変動
の影響を受は易いため、上記のようなスペクトル変形に
は対処できない。
本発明の目的は、登録時と認識時の環境の違いを、発声
者へ音声あるいは雑音をフィードバックし補正すること
により、登録時と認識時の環境が異なる場合であっても
音声も高精度で認識する音声認識用前処理装置を提供す
ることにある。
(課題を解決するための手段) 上述課題を解決するため本発明の第1の構成は、周囲雑
音を入力する雑音入力部と、 周囲雑音のレベルを測定する雑音レベル測定部と、 音声を入力する音声入力部と、 前記雑音レベルより発声者に前記入力音声をフィードバ
ックする際の再生レベルを決定する制御部と、 前記入力された音声を前記再生レベルに従って増幅する
音声増幅部と、 前記増幅された音声を発声者にフィードバックするため
の音声再生部と、を備えて構成される。
また、本発明の第2の構成は、 周囲雑音を入力する雑音入力部と、 周囲雑音のレベルを測定する雑音レベル測定部と、 音声標準パターン登録時の雑音レベルを記憶する登録時
雑音レベル記憶部と、 前記雑音レベルを登録時雑音レベルと比較し発声者に提
示する雑音のレベルを決定する雑音制御部と、 前記決定されたレベルの雑音を発生する雑音発生部と、 前記発生された雑音を発声者に提示するための雑音再生
部と、を備えて構成される。
更に本発明の第3の構成は、 周囲雑音を入力する雑音入力部と、 周囲雑音のレベルを測定する雑音レベル測定部と、 音声を入力する音声入力部と、 前記雑音レベルから、発声者にフィードバックする音声
の再生レベルおよび提示する雑音レベルを決定する#脚
部と、 雑音を発生する雑音発生部と、 入力された音声および発生した雑音を前記再生レベルお
よび雑音レベルに従って増幅、混合する増幅部と、 前記増幅部の出力信号を発声者に提示するための音声再
生部と、を備えて構成される。
(作用) 本発明は発声者に増幅した音声をフィードバックし、ス
ペクトル変形を防ぐことにより、高精度の音声認識装置
を実現するものである。
雑音下で生じる音声の変形(スペクトル変形を含む)は
ロンバード効果として知られている。このロンバード効
果は雑音により自分への音声のフィードバックが妨げら
れるために生じる(し。
Harlan、  ”The  Lon+bard  
Sign  and  The  Roleof  H
earingin  5peech″、 Journa
l  ofSpeech  and  Hearing
  Re5earch、  1 971 。
vol、14.  pp677−709)、そこで、発
声者に音声を増幅してフィードバックしてやれば、この
ような変形を未然に防ぐことができる。
第3図に示すのは男性話者5名が雑音レベルの異なる環
境下(0〜80dB (A))で発声した日本語5を音
の平均パワーである0図において横軸が周囲雑音レベル
、縦軸が母音パワーである。どの話者についても約10
dB程度の上昇が見られる。このパワーの上昇は発声者
が周囲雑音により自分の声が聞き取り辛くなったのを補
正するために生じたものである。したがって、この上昇
に見合う分だけ増幅した音声を、発声者にフィードバッ
クしてやれば、発声レベルは雑音のない状態のレベルと
なり、スペクトルの変形を抑さえることができる。 ま
た、登録時に雑音があった場合には標準パターン自身に
既にスペクトル変形が含まれている。そのような場合に
は登録時の雑音レベルを記憶しておき、認識時にその雑
音レベルに等しい雑音を発声者に提示してやることによ
り登録時と同じスペクトル変形を起こしてやることがで
きる。
〈実施例) 次に本発明の実施例について図面を参照しながら説明す
る。
第1図は本発明の一実t*例を示す構成図である。
音声入力部101には音声信号が、雑音入力部102に
は周囲雑音が入力されるものとする。この際、音声入力
部には信号に周囲雑音が重畳しないように説話形マイク
を、雑音入力部には無指向性マイクを用いる。雑音レベ
ル測定部104は、信号線112から入力音声を受は取
り、雑音レベルを測定し、あらかじめ定められた時間の
平均雑音レベルを計算する。
制御部105は、信号線113より平均雑音レベルを受
は取り、再生ゲインを決定する。再生ゲインは例えば第
2図に示すような関数で決定される。この関数としては
雑音レベルの増加とともに増加するような関数であれば
よい、また、簡単には雑音レベルと再生ゲインのテーブ
ルを作成して使用してもよい。
音声増幅部106は、信号線114から再生ゲインを受
は取り、信号線115から受は取った音声信号を、指定
された再生ゲインで増幅し、信号線116を介して音声
再生部103へ出力する。
音声増幅部としてはゲインが措定可能で、音声帯域の増
幅のできるものが利用可能である。音声出力部としては
例えばヘッドフオンを用いる。
信号線111が接続された音声出力端子107は認識部
へ接続される。認識部としては例えば文献1の方法を用
いることができる。
また、第3図は本発明の他の実施例を示す構成図である
雑音入力部301には周囲雑音が入力される。
雑音入力部としては無指向性のマイクを用いる。
雑音レベル測定部302は信号線311から入力音声を
受は取り、雑音レベルを測定し、あらかじめ定められた
時間の平均雑音レベルを計算する。
登録時雑音レベル記憶部303は標準パターンが登録さ
れた時の雑音レベルを記憶しているものとする。
雑音制御部304は、信号線312より平均雑音レベル
を、信号線313より登録時雑音レベルを受は取り、発
声者に提示する雑音のレベルを決定する。
雑音発生部305は信号線314から提示雑音レベルを
受は取り、指定されたレベルの雑音を発生し、信号線3
15を介して雑音再生部306へ出力する。雑音発生部
305としては例えば白色雑音発生器を用いることがで
きる。雑音再生部306としては例えばヘッドフォンを
用いる。
また、第4図は本発明の更に他の実施例を示す構成図で
ある。
音声入力部401には音声信号が、雑音入力部402に
は周囲雑音が入力されるものとする。この際、音声入力
部には信号に周囲雑音が重畳しないように説話形マイク
を、雑音入力部には無指向性マイクを用いる。
雑音レベル測定部403は、信号線412から入力雑音
を受は取り、雑音レベルを計算する。
制御部405は信号線413より平均雑音レベルを、あ
らかじめ定められた関数に従って音声信号および雑音の
再生ゲインを決定する。増幅部406は、信号線415
から音声および雑音の再生ゲインを受は取り、信号線4
16から受は取った音声信号および信号4!417から
受は取った雑音発生部409からの雑音信号を、指定さ
れた再生ゲインで増幅、混合し、音声再生部407へ出
力する。
音声増幅部としては2系統の入力を持ち、ゲインがそれ
ぞれの入力に対し指定可能で、音声帯域の増幅のできる
ものが利用可能である。音声出力部としては例えばヘッ
ドフオンを用いる。音声出力端子408は認識部へ出力
される。認識部としては例えば文献1の方法を用いるこ
とができる。
(発明の効果) 以上説明したように本発明による音声認識装置では雑音
下で生じるスペクトル変形を抑えることができるので、
雑音下でも高精度の認識装置を実現できる。
【図面の簡単な説明】
第1図は本発明の一実施例を示す構成図、第2図は本実
施例を説明するための説明図、第3図と第4図はそれぞ
れ本発明の他の実施例を示す構成図、第5図と第6図は
従来技術を説明するための図である。 101・・・音声入力部、102・・・雑音入力部、1
03・・・音声再生部、104・・・雑音レベル測定部
、105・・・制御部、106・・・音声増幅部、10
7・・・音声出力端子、301・・・雑音入力部、30
2・・・雑音レベル測定部、303・・・登録時雑音記
憶部、304・・・雑音制御部、305・・・雑音発生
部、306・・・雑音再生部、401・・・音声入力部
、402・・・雑音入力部、403・・・音声レベル測
定部、404・・・雑音レベル測定部、405・・・制
御部、406・・・増幅部、407・・・音声再生部、
408・・・音声出力端子、409・・・雑音発生部。

Claims (3)

    【特許請求の範囲】
  1. (1)周囲雑音を入力する雑音入力部と、 周囲雑音のレベルを測定する雑音レベル測定部と、 音声を入力する音声入力部と、 前記雑音レベルより発声者に前記入力音声をフィードバ
    ックする際の再生レベルを決定する制御部と、 前記入力された音声を前記再生レベルに従って増幅する
    音声増幅部と、 前記増幅された音声を発声者にフィードバックするため
    の音声再生部と、を備えて構成されることを特徴とする
    音声認識用前処理装置。
  2. (2)周囲雑音を入力する雑音入力部と、 周囲雑音のレベルを測定する雑音レベル測定部と、 音声標準パターン登録時の雑音レベルを記憶する登録時
    雑音レベル記憶部と、 前記雑音レベルを登録時雑音レベルと比較し発声者に提
    示する雑音のレベルを決定する雑音制御部と、 前記決定されたレベルの雑音を発生する雑音発生部と、 前記発生された雑音を発声者に提示するための雑音再生
    部と、を備えて構成されることを特徴とする音声認識用
    前処理装置。
  3. (3)周囲雑音を入力する雑音入力部と、 周囲雑音のレベルを測定する雑音レベル測定部と、 音声を入力する音声入力部と、 前記雑音レベルから、発声者にフィードバックする音声
    の再生レベルおよび提示する雑音レベルを決定する制御
    部と、 雑音を発生する雑音発生部と、 入力された音声および発生した雑音を前記再生レベルお
    よび雑音レベルに従って増幅、混合する増幅部と、 前記増幅部の出力信号を発声者に提示するための音声再
    生部と、を備えて構成されることを特徴とする音声認識
    用前処理装置。
JP1136873A 1989-05-30 1989-05-30 音声認識用前処理装置 Expired - Lifetime JP2867425B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1136873A JP2867425B2 (ja) 1989-05-30 1989-05-30 音声認識用前処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1136873A JP2867425B2 (ja) 1989-05-30 1989-05-30 音声認識用前処理装置

Publications (2)

Publication Number Publication Date
JPH032793A true JPH032793A (ja) 1991-01-09
JP2867425B2 JP2867425B2 (ja) 1999-03-08

Family

ID=15185529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1136873A Expired - Lifetime JP2867425B2 (ja) 1989-05-30 1989-05-30 音声認識用前処理装置

Country Status (1)

Country Link
JP (1) JP2867425B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11506845A (ja) * 1995-09-11 1999-06-15 ダイムラー−ベンツ エーロスペイス アクチエンゲゼルシャフト 実時間作動での音声対話又は音声命令による1つ又は複数の機器の自動制御方法及びこの方法を実施する装置
JP2002241223A (ja) * 2001-02-14 2002-08-28 Kose Corp 油性洗浄料
KR20050058164A (ko) * 2003-12-11 2005-06-16 정용수 옥내외용 가설분전반의 다리 (받침대)
JP2005530213A (ja) * 2002-06-19 2005-10-06 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声信号処理装置
JP2009069503A (ja) * 2007-09-13 2009-04-02 Fujitsu Ltd 音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3026855B2 (ja) 1991-06-27 2000-03-27 松下電器産業株式会社 音声認識装置
JP3017127B2 (ja) 1997-04-24 2000-03-06 日本電気ロボットエンジニアリング株式会社 音声認識応答装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11506845A (ja) * 1995-09-11 1999-06-15 ダイムラー−ベンツ エーロスペイス アクチエンゲゼルシャフト 実時間作動での音声対話又は音声命令による1つ又は複数の機器の自動制御方法及びこの方法を実施する装置
JP2002241223A (ja) * 2001-02-14 2002-08-28 Kose Corp 油性洗浄料
JP2005530213A (ja) * 2002-06-19 2005-10-06 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声信号処理装置
KR20050058164A (ko) * 2003-12-11 2005-06-16 정용수 옥내외용 가설분전반의 다리 (받침대)
JP2009069503A (ja) * 2007-09-13 2009-04-02 Fujitsu Ltd 音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム

Also Published As

Publication number Publication date
JP2867425B2 (ja) 1999-03-08

Similar Documents

Publication Publication Date Title
US6411927B1 (en) Robust preprocessing signal equalization system and method for normalizing to a target environment
US7130705B2 (en) System and method for microphone gain adjust based on speaker orientation
US6266633B1 (en) Noise suppression and channel equalization preprocessor for speech and speaker recognizers: method and apparatus
US9591410B2 (en) Hearing assistance apparatus
EP1208563B1 (en) Noisy acoustic signal enhancement
Yamamoto et al. Enhanced robot speech recognition based on microphone array source separation and missing feature theory
US8666737B2 (en) Noise power estimation system, noise power estimating method, speech recognition system and speech recognizing method
US11462200B2 (en) Signal processing apparatus and method, and program
US20050108008A1 (en) System and method for audio signal processing
JP3435686B2 (ja) 収音装置
JPH01296299A (ja) 音声認識装置
JPH032793A (ja) 音声認識用前処理装置
GB1309700A (en) Speech redognition apparatus
JP3367592B2 (ja) 自動利得調整装置
JPS6257040B2 (ja)
JPS6367197B2 (ja)
Aubauer et al. Optimized second-order gradient microphone for hands-free speech recordings in cars
JP2975808B2 (ja) 音声認識装置
KR102044970B1 (ko) 환경 특징 추출 방법 및 이를 이용한 보청기 작동 방법
JPH01236000A (ja) 音声認識装置
JPH039400A (ja) 音声認識装置
Giuliani et al. Experiments of HMM adaptation for hands-free connected digit recognition
JPH0627991A (ja) 音声認識装置
US20250080905A1 (en) Utterance feedback apparatus, utterance feedback method, and program
JPH02178699A (ja) 音声認識装置