JPH0243893A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0243893A
JPH0243893A JP63193746A JP19374688A JPH0243893A JP H0243893 A JPH0243893 A JP H0243893A JP 63193746 A JP63193746 A JP 63193746A JP 19374688 A JP19374688 A JP 19374688A JP H0243893 A JPH0243893 A JP H0243893A
Authority
JP
Japan
Prior art keywords
filter
speaker
recognition device
microphone
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63193746A
Other languages
English (en)
Inventor
Junichiro Fujimoto
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP63193746A priority Critical patent/JPH0243893A/ja
Publication of JPH0243893A publication Critical patent/JPH0243893A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 五丘分災 本発明は、音声認識装置に関する。
従来技術 近年、音声認識装置の開発が盛んであり、特定話者方式
、不特定話者方式のものが実用化されている。しかし、
この装置も使用環境が変ると認識率が大きく変化してし
まう。
例えば、マイクロフォンの近傍に会議卓や黒板などの反
射体が配置された状態で音声を収音した場合、その伝送
周波数特性は多数のデイツプを有した櫛歯形を呈し、か
つ発声者−マイクロフォン−反射体の位’+?!関係に
よって、レベル特性が大きく変動する。これはDPマツ
チング等によって音声認識を行なう場合、認識率低減要
因の一つにあげられる。伝送周波数特性の認識性能に与
える影響について発声者と収音用マイクロフォンとの距
離を変化し、かつ反射体が有る場合と無い場合の音声を
対象に、類似単語を用いた認識評価実験を行なった結果
が音響学会講演論文集、昭和63年3月、269,27
0ページに報告されている。
その報告によると、発声者の口元から距離を変えて配置
した3本のマイクロフォンを用いて同時に行ない1反射
体から音源(発声者)までの高さ、及び反射体からマイ
クまでの高さをそれぞれ30Gmとして、音源からマイ
クまでの距離りを10゜50.90■としたとき。
■反射体が無い状態でかつ、発声者の個人的変動(発声
する度に生ずる音声のゆらぎ)がない場合の認識率は、
マイク収音距離の違いによる差は殆どない。
■個人内変動がある場合の認識率は、約20%程度の変
動を生じている。
■反射体がある場合の認識率は、発声者と収音用マイク
ロフォンの距離が大きくなるほど低下し、特にL=90
anの場合に顕著となる。なお、その値は話者によって
変化する。
■反射体がある場合でもL=50aoの認識率は、発声
者の個人白変動量に含まれる範囲であるが、同条件での
L=10a++の場合より数パーセント低減している。
ことが分ったとされている。
このように、身近に反射体がある時とない時で認識率に
差が出てしまう。これは例えば自動車の中で不特定話者
認識装置を使うような時に顕著に現われる。特定話者方
式では使用環境で標準パターンを作ることである程度回
避することはできるが、不特定話者ではどのような環境
下で使用されるかわからないため、これに対して対策を
練ることができない。それが自動車内のように狭い空間
では音声を反射するものが多く使用するマイクの周波数
特性が変って認識率が低下する。
目     的 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音響特性が異なった場所、例えば自動車内でも認
識率が低下しないような認識装置を提供することを目的
としてなされたものである。
橋成 本発明は、上記目的を達成するために、音声を電気信号
に変換する音響/電気変換器と、該電気信号を分析する
フィルタ群と、分析された結果を比較するパターン比較
部とを有する音声認識装置において、各フィルタの中心
周波数の音の一つ以上を再生する手段と、各フィルタの
出力の加算又は平均値を算出し、記憶する手段と、各フ
ィルタの出力値と前記記憶された値との差を求める手段
と、その差の大きさによって前記フィルタ出力を大又は
小にせしめる手段を有することを特徴としたものである
。以下1本発明の実施例に基いて説明する。
第1図は1本発明の一実施例を説明するための構成図で
、図中、1はROM、2はD/A変換回路、3は増幅器
、4はスピーカ、5はマイクロフォン、6はマイクアン
プ、7はフィルタ群、8は引き算部、9はレジスタ、1
0は加算器、11はビットシフト部、12はレジスタ、
13は差演算部、14はスイッチ、15は比較部、16
は音声辞書、17は最大類似度算出部、18は認識結果
出力部で、図示実施例では、フィルタ群7のフィルタの
数を8とし、音声入力用のマイクロフォン5の音をマイ
クアンプ6にて増幅し、フィルタ群7で分析する。分析
した結果を整流してA/D変換器(図示せず)で量子化
して引き算部8に入れレジスタ9に保存させる0図には
記さなかったが、マイクアンプ6の出力を対数に変換す
るのが普通である。引き算部8は、第2図に示す如く、
各フィルタ71,7□・・・の出力から決められた値を
差し引くようになっており、差し引く閾値8□8□′・
・・が各々引き算部81.82・・・に与えられるが、
初期値として0が入れられている。次に、レジスタ9に
貯えられた8個の値を加算回路10にて加算し、ビット
シフト部11にて3回ビットシフトすると1/8になり
平均値が算出されるのでこれをレジスタ12へ格納して
おく”。まず、スイッチ14をA側に倒し、レジスタ9
の1〜8の各値をレジスタ12の平均値から差し引き、
その値をフィルタ出力の引き算部8、つまり第2図の閾
値81182/・・・に代入する。従って、閾値iへ設
定される値Yi、はレジスタの8個の値X1(i=1〜
8)を平均Xを使って Yi=X−Xi   ・・・(1) として表わされる。一方、ROM1にはフィルタ7□、
7□・・・71の各中心周波数の正弦波が加算された信
号が例えばPCM等に符号化して記憶されている。\こ
の信号をアナログに直し増幅して電気音響変換器(スピ
ーカ)4から再生する。この時、ROMIに記憶されて
いる周波数の各成分は再生された時に出力レベルが一定
になるような振幅値を設定しなければならない。この音
を再生し゛ながら前記の調整を行なう。
第3図は、上記調整の様子を示す図で、横軸は周波数を
表わす各バンドパスフィルタのチャンネル番号、縦軸は
レベルである。(a)図は自由空間での特性で、不特定
話者認識用の音声辞書はこの条件で作られている。この
認識装置を自動車のような狭い空間に持ち込むと(b)
図のような特性になる。ここでこれらの8つのポイント
から平均レベルを計算すると、図の破線のようになる。
更に式(1)に従って平均値から(b)図の各値を引く
と(c)図のようになり、この値を第2図の各閾値とす
る。この調整後は各フィルタの出力は(d)図のように
なり、もとの(a)図のような特性に補正でき、このた
め、狭い空間で使用することによる認識率の低下が防げ
る。認識の時はスイッチ14をB側に倒し、周波数特性
が補正された状態で行なう。なお、図では認識部として
比較部と最大類似度を求める部分が記されているが、こ
れはパターン照合方式によらず必要な部分であって、具
体的には、動的計画法を用いたDPマツチングとして知
られるものなどどのような方法を用いても良い。
効   果 以上の説明から明らかなように、本発明によると、部屋
等の限られた空間においても音の反射の影響を補正して
マイクからの入力音声の周波数特性を平担にすることが
出来、その結果認m率を向上することができる。
【図面の簡単な説明】
第1図は、本発明の一実施例を説明するための構成図、
第2図は、第1図に示した引き算部の詳細図、第3図は
、本発明の動作説明をするための同である。 1・・・ROM、2・・・D/A変換回路、3・・・増
幅器、4・・・スピーカ、5・・・マイクロフォン、6
・・・マイクアンプ、7・・・フィルタ群、8・・引き
算部、9・・・レジスタ、10・・・加算器、11・・
・ビットシフト部。 12・・・レジスタ、13・・・差演算部、14・・・
スイッチ、15・・・比較部、16・・・音声辞書、1
7・・・最大類似度算出部、18・・・認識結果出力部
。 第  1 図

Claims (1)

    【特許請求の範囲】
  1. 1、音声を電気信号に変換する音響/電気変換器と、該
    電気信号を分析するフィルタ群と、分析された結果を比
    較するパターン比較部とを有する音声認識装置において
    、各フィルタの中心周波数の音の一つ以上を再生する手
    段と、各フィルタの出力の加算又は平均値を算出し、記
    憶する手段と、各フィルタの出力値と前記記憶された値
    との差を求める手段と、その差の大きさによって前記フ
    ィルタ出力を大又は小にせしめる手段を有することを特
    徴とする音声認識装置。
JP63193746A 1988-08-03 1988-08-03 音声認識装置 Pending JPH0243893A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63193746A JPH0243893A (ja) 1988-08-03 1988-08-03 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63193746A JPH0243893A (ja) 1988-08-03 1988-08-03 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0243893A true JPH0243893A (ja) 1990-02-14

Family

ID=16313122

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63193746A Pending JPH0243893A (ja) 1988-08-03 1988-08-03 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0243893A (ja)

Similar Documents

Publication Publication Date Title
KR101444100B1 (ko) 혼합 사운드로부터 잡음을 제거하는 방법 및 장치
KR102191736B1 (ko) 인공신경망을 이용한 음성향상방법 및 장치
US9591410B2 (en) Hearing assistance apparatus
US8391471B2 (en) Echo suppressing apparatus, echo suppressing system, echo suppressing method and recording medium
KR20240007168A (ko) 소음 환경에서 음성 최적화
JP2013117734A (ja) ダイナミックサウンド提供システム及び方法
GB2519117A (en) Speech processing
US20020103636A1 (en) Frequency-domain post-filtering voice-activity detector
JP5030420B2 (ja) 受信オーディオを制限するためのシステム
EP3830823B1 (en) Forced gap insertion for pervasive listening
US11711647B1 (en) Voice detection using ear-based devices
JP3367592B2 (ja) 自動利得調整装置
CN113314121B (zh) 无声语音识别方法、装置、介质、耳机及电子设备
JP4814861B2 (ja) 音量調整装置、方法及びプログラム
WO2021099760A1 (en) Detection of live speech
JPH09311696A (ja) 自動利得調整装置
JPH0243893A (ja) 音声認識装置
CN114724576B (zh) 一种啸叫检测中的门限实时更新方法、装置以及系统
JPS6257040B2 (ja)
CN115668370B (zh) 听力设备自带的语音检测器
JPS6367197B2 (ja)
JPH032793A (ja) 音声認識用前処理装置
JP2975808B2 (ja) 音声認識装置
JP2019197179A (ja) 発声方向判定プログラム、発声方向判定方法、及び、発声方向判定装置
JP6956929B2 (ja) 情報処理装置、制御方法、及び制御プログラム