JPH0517700U - Voice recognizer - Google Patents

Voice recognizer

Info

Publication number
JPH0517700U
JPH0517700U JP073815U JP7381591U JPH0517700U JP H0517700 U JPH0517700 U JP H0517700U JP 073815 U JP073815 U JP 073815U JP 7381591 U JP7381591 U JP 7381591U JP H0517700 U JPH0517700 U JP H0517700U
Authority
JP
Japan
Prior art keywords
voice
noise
input
gain
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP073815U
Other languages
Japanese (ja)
Inventor
貢一 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP073815U priority Critical patent/JPH0517700U/en
Publication of JPH0517700U publication Critical patent/JPH0517700U/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Selective Calling Equipment (AREA)

Abstract

(57)【要約】 【目的】 登録音声と入力音声とを比較してパターンマ
ッチングを行なう場合、ノイズの影響でミスマッチング
が生ずるのを抑えるようにする。 【構成】 入力音声のノイズレベルを検出するローパス
フィルタ2を接続し、検出されたノイズレベルに応じて
音声増幅回路4の利得を制御する。音声増幅回路4の出
力音声と登録音声とのパターンマッチングを行なえば、
出力音声はノイズの影響が防止されて常に一定の利得で
制御されて増幅されているので、ノイズの影響を避けて
ミスマッチングを少なくすることができる。
(57) [Summary] [Purpose] When performing pattern matching by comparing the registered voice and the input voice, it is intended to suppress the occurrence of mismatching due to the influence of noise. [Structure] A low-pass filter 2 for detecting a noise level of an input voice is connected, and a gain of a voice amplifier circuit 4 is controlled according to the detected noise level. If pattern matching between the output voice of the voice amplifier circuit 4 and the registered voice is performed,
Since the influence of noise is prevented and the output voice is always controlled and amplified with a constant gain, the influence of noise can be avoided and the mismatch can be reduced.

Description

【考案の詳細な説明】[Detailed description of the device]

【0001】[0001]

【産業上の利用分野】[Industrial applications]

本考案は、周囲のノイズに影響されることの少ない音声認識装置に関する。 The present invention relates to a voice recognition device that is less affected by ambient noise.

【0002】[0002]

【従来の技術】[Prior Art]

認識すべき複数の言葉を予め音声登録しておき、認識時に入力された音声と登 録音声とを比較しパターンマッチングを行なって特定話者を認識する音声認識方 法が知られている。最近かかる音声認識方法を採用して音声でデータを入力した り、音声で被制御装置を制御することが行なわれるようになっている。 A voice recognition method is known in which a plurality of words to be recognized are registered in advance and the voice input at the time of recognition is compared with the registered voice to perform pattern matching to recognize a specific speaker. Recently, such a voice recognition method has been adopted to input data by voice and control the controlled device by voice.

【0003】 このような音声登録を行なう場合は、入力された音声信号をAGC(自動利得 制御)回路によって利得を制御するように増幅した後、登録することが行なわれ ている。また、認識時においても入力された音声信号はAGC回路によって利得 の制御が行なわれた後、登録音声との比較が行なわれる。かかる音声認識を行な う場合は、音声登録時と音声認識時における周囲の音の状況が一致していて、各 々音声に対する利得の制御が等しく行なわれていることが望ましい。When performing such voice registration, the input voice signal is amplified by an AGC (automatic gain control) circuit so as to control the gain, and then registered. Also during recognition, the input voice signal is compared with the registered voice after the gain is controlled by the AGC circuit. In the case of performing such voice recognition, it is desirable that the circumstances of the surrounding sounds at the time of voice registration and at the time of voice recognition are the same, and that the gain control for each voice is equally performed.

【0004】[0004]

【考案が解決しようとする課題】[Problems to be solved by the device]

ところで従来の音声認識装置では、音声登録時と音声認識時とでは音声に対す るAGC回路の利得の制御が等しく行なわれないことが多いので、入力音声と登 録音声を比較する場合パターンマッチングがうまくいかなくて、ミスマッチング が生ずるという問題がある。 By the way, in the conventional voice recognition device, the control of the gain of the AGC circuit for the voice is not performed at the same time during the voice registration and the voice recognition. There is a problem that it does not work well and mismatch occurs.

【0005】 すなわち、音声登録は静かなノイズのない場所で行なわれるが、音声認識は周 囲のノイズが多い場所で行なわれることが多いため、ノイズに影響されて利得の 制御が音声登録時と異なってくる。例えば音声認識により車載用オーディオ装置 を制御する場合には、車が走行している状態で音声認識が行なわれるため、ロー ドノイズの影響が避けられなくなる。That is, voice registration is performed in a quiet, noise-free place, but since voice recognition is often performed in a noisy place in the surroundings, the gain control is affected by noise and the gain control is different from that during voice registration. Will be different. For example, when controlling an in-vehicle audio device by voice recognition, voice recognition is performed while the vehicle is running, so the influence of road noise cannot be avoided.

【0006】 音声信号に対する利得の制御は、発声単語に対して行なわれるため音声のパワ ーレベルの低い部分(子音)と、パワーレベルの高い部分(母音)とで利得差が 生じる。しかし、認識時はロードノイズが重畳されるため、入力音声はロードノ イズにマスキングされてしまい、パワーレベルの低い部分とパワーレベルの高い 部分でのレベル差が減少してしまうので、利得差もなくなってくる。このため、 登録音声のパターンと入力音声のパターンとの差異が出てきてしまい、パターン マッチングがうまくいかないのでミスマッチングが生ずる。Since gain control for a voice signal is performed for a spoken word, a gain difference occurs between a low power level portion (consonant) and a high power level portion (vowel). However, since the road noise is superimposed during recognition, the input voice is masked by the load noise, and the level difference between the low power level part and the high power level part is reduced, so there is no gain difference. Come on. For this reason, a difference occurs between the registered voice pattern and the input voice pattern, and the pattern matching does not work well, resulting in a mismatch.

【0007】 本考案は以上のような事情に鑑みてなされたもので、周囲のノイズの影響をな くして音声認識時のミスマッチングを少なくするようにした音声認識装置を提供 することを目的とするものである。The present invention has been made in view of the above circumstances, and an object of the present invention is to provide a voice recognition device that eliminates the influence of ambient noise and reduces mismatching during voice recognition. To do.

【0008】[0008]

【課題を解決するための手段】[Means for Solving the Problems]

上記目的を達成するために本考案は、認識すべき音声を予め複数登録しておき 、入力された音声と前記登録音声とのパターンマッチングを行なって特定話者を 認識する音声認識装置において、音声を入力するときの周囲のノイズレベルを検 出するノイズ検出部と、検出されたノイズレベルに応じて入力音声の利得を制御 する音声増幅部と、音声増幅部の出力のノイズ成分を除去するノイズ成分除去部 と、ノイズ成分除去部の出力と登録音声を比較して特定話者を認識する音声認識 部とを有することを特徴とするものである。 In order to achieve the above object, the present invention provides a voice recognition device that recognizes a specific speaker by registering a plurality of voices to be recognized in advance and performing pattern matching between the input voice and the registered voice. Noise detection section that detects the ambient noise level when inputting, an audio amplification section that controls the gain of the input audio according to the detected noise level, and noise that removes the noise component of the output of the audio amplification section. It is characterized by having a component removal unit and a voice recognition unit that recognizes a specific speaker by comparing the output of the noise component removal unit and the registered voice.

【0009】[0009]

【作用】[Action]

音声認識時入力された音声の周囲のノイズレベルを検出し、この検出されたノ イズレベルに応じて利得を制御するように入力音声を増幅する。この増幅音声出 力からノイズ成分を除去した後登録音声を比較してパターンマッチングを行なう 。入力音声はノイズレベルに応じて利得が制御されているので、常に周囲のノイ ズに応じた増幅が行なわれるようになる。これにより周囲のノイズの影響をなく して音声認識時のミスマッチングを少なくすることができる。 The noise level around the input voice during voice recognition is detected, and the input voice is amplified so that the gain is controlled according to the detected noise level. After removing the noise component from this amplified voice output, the registered voices are compared and pattern matching is performed. Since the gain of the input voice is controlled according to the noise level, amplification is always performed according to the surrounding noise. This can eliminate the influence of surrounding noise and reduce mismatching during voice recognition.

【0010】[0010]

【実施例】【Example】

以下図面を参照して本考案の実施例を説明する。 An embodiment of the present invention will be described below with reference to the drawings.

【0011】 図1は本考案の音声認識装置の実施例を示すブロック図である。1は音声を入 力するマイク、2はロードノイズを検出するローパスフィルタ、3はローパスフ ィルタ3の出力を直流に変える整流平滑回路、4は入力音声の利得の制御を整流 平滑回路3の出力のノイズレベルに応じて増幅するVCA(電圧制御増幅器)形 からなる音声増幅回路、5は音声増幅回路4のノイズ主成分を除去するハイパス フィルタである。FIG. 1 is a block diagram showing an embodiment of a voice recognition device of the present invention. 1 is a microphone for inputting voice, 2 is a low-pass filter for detecting road noise, 3 is a rectifying / smoothing circuit for changing the output of the low-pass filter 3 to DC, and 4 is control of the gain of input voice. A VCA (voltage control amplifier) type voice amplifier circuit 5 that amplifies according to the noise level is a high-pass filter that removes the main noise component of the voice amplifier circuit 4.

【0012】 6はハイパスフィルタ5から出力されたアナログ信号をデジタル信号に変換す るA/D変換器、7は予め複数の音声を登録して記憶しておく音声登録部、8は マイコン構成の登録・認識処理部、9は音声登録及び音声認識を選択する操作部 である。Reference numeral 6 is an A / D converter that converts an analog signal output from the high-pass filter 5 into a digital signal, 7 is a voice registration unit that registers and stores a plurality of voices in advance, and 8 is a microcomputer configuration. A registration / recognition processing unit 9 is an operation unit for selecting voice registration and voice recognition.

【0013】 ローパスフィルタ2は入力音声の中から特にロードノイズ成分を検出するため のものである。車室内のロードノイズを測定の結果、図2に示すような分布が得 られた。ロードノイズはfc=200Hz、12dB/oct の音声分布を有してお り、200Hz以下にエネルギーは集中している。従ってローパスフィルタ2とし てfc=200Hzのものを使用することにより、ロードノイズを検出することが できる。The low-pass filter 2 is for particularly detecting a road noise component from the input voice. As a result of measuring the road noise in the passenger compartment, the distribution shown in Fig. 2 was obtained. Road noise has a voice distribution of fc = 200Hz and 12dB / oct, and energy is concentrated below 200Hz. Therefore, the road noise can be detected by using the low pass filter 2 with fc = 200 Hz.

【0014】 次に本実施例の動作を説明する。Next, the operation of this embodiment will be described.

【0015】 まず音声登録に際しては、静かなノイズのない場所が選ばれる。また、操作部 9によって音声登録を選択しておく。この状態で、マイク1から入力された音声 は、ノイズがないためローパスフィルタ2及び整流平滑回路3の動作に関係なく 、所定の利得の制御が行なわれるように音声増幅回路4によって増幅され、さら にハイパスフィルタ5を通過した後A/D変換器6によってデジタル信号に変換 される。First, at the time of voice registration, a quiet, noise-free place is selected. Also, voice registration is selected by the operation unit 9. In this state, the voice input from the microphone 1 is amplified by the voice amplification circuit 4 so that a predetermined gain control is performed regardless of the operations of the low-pass filter 2 and the rectifying and smoothing circuit 3 because there is no noise. After passing through the high-pass filter 5, it is converted into a digital signal by the A / D converter 6.

【0016】 デジタル信号は登録・認識処理部8へ入力され、この制御の基に音声登録部7 内のメモリに記録される。以後、マイク1から音声が入力されるごとに同様な信 号処理が行なわれて、音声登録部7内のメモリには複数の音声が登録される。The digital signal is input to the registration / recognition processing unit 8 and recorded in the memory in the voice registration unit 7 under this control. After that, the same signal processing is performed every time a voice is input from the microphone 1, and a plurality of voices are registered in the memory in the voice registration unit 7.

【0017】 次に音声認識に際しては、走行中の車内などのように周囲にノイズが多い場所 で行なわれることが多いので、ノイズの影響を受ける。この場合、操作部9によ って音声認識を選択しておく。この状態で、マイク1から入力された音声は音声 増幅回路4へ出力されると共に、ローパスフィルタ2へ出力される。Next, voice recognition is often performed in a place where there is a lot of noise in the surroundings, such as in a moving vehicle, and is therefore affected by noise. In this case, the voice recognition is selected by the operation unit 9. In this state, the voice input from the microphone 1 is output to the voice amplifier circuit 4 and the low pass filter 2.

【0018】 ローパスフィルタ2はfc=200Hzに設定されたものが用いられているので 、ほぼ200Hz以下のロードノイズの主成分はこのローパスフィルタ2を通過し た後、整流平滑回路3で直流に変えられ、この直流は音声増幅回路4へ出力され る。Since the low-pass filter 2 is set to fc = 200 Hz, the main component of road noise of approximately 200 Hz or less passes through the low-pass filter 2 and is then converted into direct current by the rectifying / smoothing circuit 3. This direct current is output to the voice amplifier circuit 4.

【0019】 これによって音声増幅回路4は入力音声をノイズレベルに応じて利得を制御す るように動作する。すなわち、ノイズレベルが高いときは利得を低くするように 制御し、ノイズレベルが低いときは利得を高くするように制御する。これによっ て入力音声の単語中の音素の利得は一定となるように制御される。なお、前記の ように音声登録時のようなノイズレベルが低い場合は、音声増幅回路4の利得は 高くなるように制御される。As a result, the voice amplifier circuit 4 operates so as to control the gain of the input voice according to the noise level. That is, the gain is controlled to be low when the noise level is high, and the gain is controlled to be high when the noise level is low. As a result, the gain of the phoneme in the word of the input speech is controlled to be constant. When the noise level is low as in the voice registration as described above, the gain of the voice amplifier circuit 4 is controlled to be high.

【0020】 ノイズレベルに応じて利得が制御された音声増幅回路4の出力はハイパスフィ ルタ5へ加えられて、ノイズの主成分が除去された後A/D変換器6によってデ ジタル信号に変換される。このデジタル信号はロードノイズの影響が除去された 音声となっている。The output of the audio amplifier circuit 4 whose gain is controlled according to the noise level is added to the high-pass filter 5 to remove the main component of noise, and then converted into a digital signal by the A / D converter 6. It This digital signal is a voice with the influence of road noise removed.

【0021】 デジタル信号は登録・認識処理部8へ入力され、これに基づいて登録・認識処 理部8はこの入力音声の特徴である音声パターンを、音声登録部7内のメモリに 記録されている複数の登録音声の音声パターンとの比較を行なってパターンマッ チングを行なう。パターンマッチングが成立した登録音声が見つかると、特定話 者が認識されたことになり、登録・認識処理部8は被処理装置へ制御信号を出力 する。The digital signal is input to the registration / recognition processing unit 8, and based on this, the registration / recognition processing unit 8 records a voice pattern, which is a feature of the input voice, in a memory in the voice registration unit 7. Pattern matching is performed by comparing the voice patterns of multiple registered voices. When the registered voice for which pattern matching is established is found, it means that the specific speaker is recognized, and the registration / recognition processing unit 8 outputs a control signal to the device to be processed.

【0022】 このように本実施例によれば、音声認識時入力された音声のノイズレベルをロ ーパスフィルタ2によって検出し、このノイズレベルに応じて音声増幅回路3の 利得を制御するので、音声増幅回路3からは常に一定のレベルの音声が出力され る。従って登録音声とのパターンマッチングを行なう場合は、ロードノイズの影 響をなくした入力音声との比較が行なわれるため、ミスマッチングの少ない音声 認識を行なうことができる。また、ロードノイズを音声増幅回路4によって過大 増幅を行なうサチュレーションを防止することもできる。As described above, according to the present embodiment, the noise level of the voice input during voice recognition is detected by the low-pass filter 2 and the gain of the voice amplifier circuit 3 is controlled according to this noise level. The circuit 3 always outputs a constant level of sound. Therefore, when performing pattern matching with the registered voice, the input voice without the influence of road noise is compared, so that voice recognition with less mismatching can be performed. Further, it is possible to prevent saturation in which the road noise is excessively amplified by the audio amplifying circuit 4.

【0023】[0023]

【考案の効果】[Effect of the device]

以上述べたように本考案によれば、ノイズレベルに応じて利得を制御するよう に音声増幅を行ない、この音声出力と登録音声とを比較してパターンマッチング を行なうようにしたので、ミスマッチングの少ない音声認識を行なうことができ る。 As described above, according to the present invention, the voice amplification is performed so as to control the gain according to the noise level, and the pattern output is performed by comparing the voice output with the registered voice. It is possible to perform less voice recognition.

【図面の簡単な説明】[Brief description of drawings]

【図1】本考案の音声認識装置の実施例を示すブロック
図である。
FIG. 1 is a block diagram showing an embodiment of a voice recognition device of the present invention.

【図2】本考案の動作原理を説明するロードノイズのエ
ネルギー分布図である。
FIG. 2 is an energy distribution diagram of road noise for explaining the operating principle of the present invention.

【符号の説明】[Explanation of symbols]

2 ローパスフィルタ 4 音声増幅回路 5 ハイパスフィルタ 7 音声登録部 8 登録・認識処理部 2 Low-pass filter 4 Voice amplification circuit 5 High-pass filter 7 Voice registration unit 8 Registration / recognition processing unit

Claims (1)

【実用新案登録請求の範囲】[Scope of utility model registration request] 【請求項1】 認識すべき音声を予め複数登録してお
き、入力された音声と前記登録音声とのパターンマッチ
ングを行なって特定話者を認識する音声認識装置におい
て、音声を入力するときの周囲のノイズレベルを検出す
るノイズ検出部と、検出されたノイズレベルに応じて入
力音声の利得を制御する音声増幅部と、音声増幅部の出
力のノイズ成分を除去するノイズ成分除去部と、ノイズ
成分除去部の出力と登録音声を比較して特定話者を認識
する音声認識部とを有することを特徴とする音声認識装
置。
1. A voice recognition device for recognizing a specific speaker by registering a plurality of voices to be recognized in advance and performing pattern matching between the input voices and the registered voices. Noise detecting section for detecting the noise level of the sound, a voice amplifying section for controlling the gain of the input voice according to the detected noise level, a noise component removing section for removing the noise component of the output of the voice amplifying section, and a noise component A voice recognition device comprising: a voice recognition unit for recognizing a specific speaker by comparing the output of the removal unit and a registered voice.
JP073815U 1991-08-21 1991-08-21 Voice recognizer Withdrawn JPH0517700U (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP073815U JPH0517700U (en) 1991-08-21 1991-08-21 Voice recognizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP073815U JPH0517700U (en) 1991-08-21 1991-08-21 Voice recognizer

Publications (1)

Publication Number Publication Date
JPH0517700U true JPH0517700U (en) 1993-03-05

Family

ID=13529034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP073815U Withdrawn JPH0517700U (en) 1991-08-21 1991-08-21 Voice recognizer

Country Status (1)

Country Link
JP (1) JPH0517700U (en)

Similar Documents

Publication Publication Date Title
US4558459A (en) Speech recognition system for an automotive vehicle
US20050259834A1 (en) Voice controlled system and method
JPH0517700U (en) Voice recognizer
JP3350106B2 (en) Voice recognition device
JP3114757B2 (en) Voice recognition device
JPS58125099A (en) Voice recognition equipment
JPH0566699U (en) Voice recognizer
JP2000155600A (en) Speech recognition system and input voice level alarming method
JPH0511795A (en) Voice recognition device
JPS59185394A (en) Voice recognition equipment
JP2000039900A (en) Speech interaction device with self-diagnosis function
JPH02176796A (en) Speech recognition device
JPH0749697A (en) Speech recognition device
JPS6326880Y2 (en)
JPS61180296A (en) Voice recognition equipment
JPS6367199B2 (en)
JPH06318098A (en) Talker recognition device
JPS58185000A (en) voice input device
JPH01287699A (en) Noise eliminating device
JPS5872994A (en) Signal input unit
JPH0559500U (en) Voice recognizer
JPH03138698A (en) Input system for on-vehicle speech recognizing device mounting on vehicle
JPH0567039B2 (en)
JPH0277799A (en) On-vehicle speech recognition device
JPH0337197B2 (en)

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19951102