JPH03122700A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH03122700A
JPH03122700A JP1261101A JP26110189A JPH03122700A JP H03122700 A JPH03122700 A JP H03122700A JP 1261101 A JP1261101 A JP 1261101A JP 26110189 A JP26110189 A JP 26110189A JP H03122700 A JPH03122700 A JP H03122700A
Authority
JP
Japan
Prior art keywords
attenuator
voice
signal
gain
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1261101A
Other languages
English (en)
Inventor
Takashi Ariyoshi
有吉 敬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1261101A priority Critical patent/JPH03122700A/ja
Publication of JPH03122700A publication Critical patent/JPH03122700A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 五監分災 本発明は、音声認識装置、より詳細には、音声認識装置
の特徴量抽出技術に関し1例えば、小型・低価格な音声
認識装置、特に、騒音環境下で使用される音声認識に適
用して好適なものである。
災来技W 音声認識のためにマイクから入力された音声信号のレベ
ルは、口とマイクとの距離や、発声された各音素、周囲
の環境、話者の感情や意志、個人差など多くの要因に左
右され、20dB以上の差がある。レベルが大きく異な
る音声の特徴量を同等に扱うために、従来、音声中の最
大パワー等と規準としたパワー正規化を行なう方法があ
るが、A/D変換を行なう際に、レベルの異なる音声に
対応するためには12〜16ビツト比較的精度のよいA
/Dコンバータが必要となることと、パワー正規化を行
なうことは、音声区間が終了してからでないとできない
ために認識処理が遅くなるという欠点があった。また、
AGCを用いて音声のレベルを一定範囲内に収める方法
は、周囲騒音レベルを引上げるので、騒音環境下での認
識性能がいちじるしく低下するという欠点がある。
且−一五 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、周囲騒音レベルを引上げてしまうAGCを用いず
に、しかも、8ビット程度のA/D変換器を用いて、レ
ベル変動の大きな音声の特徴量を確実にとらえ、かつ、
騒音環境下での認識性能が劣化しない音声認識装置を提
供することを目的としてなされたものである。
隻−一双 本発明は、上記目的を達成するために、入力された音声
信号のゲインを複数段階に切換えるアッテネータと、上
記アッテネータを経た音声信号をデジタル信号に変換す
るA/Dコンバータと、該デジタル信号に変換された音
声信号を用いて音声区間を検出する音声区間検出部とを
具備して成り、上記音声区間検出部は、少なくとも音声
区間である場合と音声区間でない場合との2種類の上記
アッテネータの制御手段を有し、該アッテネータの制御
手段に従って上記アッテネータのゲインを切換える信号
を出力する機能を有する事を特徴としたものである。以
下、本発明の実施例に基づいて説明する。
第1図は1本発明の一実施例を説明するための構成図で
、図中、1はマイクアンプ、2はプリエンファシス、3
はアッテネータ、4はバンドパスフィルタ(BPF)バ
ンク、5はA/Dコンバータ、6は音声区間検出部、7
は入カバターン生成部、8は認識部、9は標準パターン
メモリで、マイクアンプ1は図示しないマイクから入力
された音声信号の増巾を行ない、プリエンファシス2は
、音声信号の高域(IKI(z以上)を強調する。アッ
テネータ3は、音声区間検出部6からのデジタル信号に
より、ゲインを切換える。具体的にはプリエンファシス
の出力信号を抵抗分割により1/2づつ(−6dBづつ
)の6段階の信号を生成し、3ビツトのセレクト信号を
用いて、アナログマルチプレクサで、6段階のうちの1
つの信号を選択する。BPFバンク4は、中心周波数が
250七から6.35 KHzまで173オクターブ毎
に配置された15チヤンネルのバンドパスフィルタと各
々の検波器、各々のローパスフィルタから成り、入力信
号のパワースペクトルを求める。A/Dコンバータ5は
、アッテネータ3の出力と、BPFバンク4の出力の1
5チヤンネルのパワースペクトルをマルチプレクスして
8ビツトのデジタル値にサンプリング周期10m5で変
換する。音声区間検出部6はA/Dコンバータ5から得
られるアッテネータ3の出力のデジタル値の時系列から
、音声区間を検出し、その結果に従って次のサンプリン
グのためのアッテネータ3のゲインを決定する。具体的
には、この音声区間検出部6はその時点でのアッテネー
タ3のゲインを保持していてアッテネータ3の出力のデ
ジタル値にそのゲインを乗じることにより、入力信号パ
ワーの絶対レベルを得る。この乗算はシフト演算だけで
容易に実行できる。この入力信号パワーの絶対レベルの
時系列からフレーム間偏差を求めてしきい値Thvを越
えた時点を音声の開始とみなし、またその直前の入力信
号パワーの絶対レベルを雑音レベルとみなし保持する。
その後、入力信号パワーの絶対レベルが雑音レベルにほ
ぼ等しくなった時点を音声の終了とみなす、ここで音声
の開始を決めるしきい値Thvは、アッテネータ3のゲ
インによって変わる変数である。さらに音声区間検出部
6は、音声区間でない場合のアッテネータ3のゲインを
アッテネータ3の出力のデジタる値がしきい値T hn
d以上の場合に1段階下げ、しきい値T hnuを以下
の場合に1段階上げる。また、音声区間である場合のア
ッテネータ3のゲインをアッテネータ3の出力のデジタ
ル値が、しきい値Th5d以上の場合に1段階下げ、し
きい値Th5u以上の場合に1段階上げる。ここで、各
しきい値は。
Thnd)Thnu、 Th5d>Th5uThnd<
Th5d、 Thnu<Th5uなる8 bitの値で
ある。
第2図は、アッテネータ3の出力信号の一例を示す図で
、アッテネータ3の出力信号Aは、非音声区間において
、該信号AがThndに達すると、アッテネータのゲイ
ンを下げて該信号AをThndとThnuの間に維持す
る。更に、音声区間においてTh5dに達するとアッテ
ネータ3のゲインを下げて該信号AをT hsdとT 
hsuの間に維持し、更に、該信号AがT hsuに低
下するとアッテネータ3のゲインを上げて該信号AをT
 hsdとT hsuの間に維持する。
入カバターン生成部7は、音声区間検出部6で音声区間
と判断された区間の入力信号のパワースペクトルから入
カバターンを生成する。その過程とパターンは、公知の
BTSP方式のものが使用される。また標準パターンメ
モリ9には、同様に公知のBTSP方式の形式で予め登
録された音声の標準パターンが記憶されている。認識部
8は入カバターン生成部7で生成された入カバターンと
標準パターンメモリ9に記憶されている標準パターンを
用して、公知のBTSP方式の認識処理に従って認識を
行ない、認識結果を出力する。
なお、上記の実施例では、アッテネータ3は、1/2づ
つ(−6dBづつ)6段階でゲインを切換えているが、
例えば1 / 汀づつ(−3dBづつ)ゲインを切換え
てもよい。この場合、入力信号パワーの絶対レベルを求
めるのに、アッテネータ3の出力のデジタル値にシフト
演算を施すだけでは実現できないが、8ビツトの値に対
し、1/V「倍した値のテーブル(256バイト)を参
照する演算を加えれば容易に実行できる。また、切換え
る段階の数は必要に応じて決めればよい。さらにアッテ
ネータ3の位置は、プリエンファシス2の後ろにある必
要はなく、例えば、マイクアンプ1か、プリエンファシ
ス2に含めてもよいし、プリエンファシス2の前に配置
してもよい。
BPFバンク4はアナログフィルタで構成されているが
、ローパスフィルタを経てA/D変換した値を用いて、
デジタルフィルタで構成してもよい、この場合、ゲイン
が切換わった時点で、デジタルフィルタの各レジスタの
値をゲインに合わせて変更すること、も可能である。
さらに、音声区間検出部6の音声区間検出方式は、他の
公知の方式やそれらとの併用の方式でも実現でき、入カ
バターン生成部7のパターン生成方式、標準パターンメ
モリ9パターン型式、認識部8の認識方式も他の公知の
方式を用いることが可能である。
効−−−釆一 以上の説明から明らかなように、本発明によれば音声区
間検出部での音声区間検出の結果によって、 i)音声区間でない場合は、入力信号を雑音とみなし、
アッテネータのゲインを比較的低い範囲に抑え。
ii)音声区間の場合は、入力信号を音声とみなし。
アッテネータのゲインをできる限り高い範囲でコントロ
ールしているので、 8ビット程度のA/Dコンバータを用いても十分にレベ
ル変動の大きな音声の特徴量を抽出することができる。
即ち、LSIなどで実現できるので、入力音声のレベル
変動に強く、かつ、耐騒音性に優れた小型、低価格な音
声認識装置を実現できる。
【図面の簡単な説明】
第1@は、本発明の一実施例を説明するための楕成図、
第2図は、アッテネータ3の出力信号の一例を示す図で
ある。 1・・・マイクアンプ、2・・・プリエンファシス、3
・・・アッテネータ、4・・・バンドパスフィルタ(B
PF)バンク、5・・・A/Dコンバータ、6・・・音
声区間検出部、7・・・入カバターン生成部、8・・・
認識部、9・・・標準パターンメモリ。

Claims (1)

    【特許請求の範囲】
  1. 1、入力された音声信号のゲインを複数段階に切換える
    アッテネータと、上記アッテネータを経た音声信号をデ
    ジタル信号に変換するA/Dコンバータと、該デジタル
    信号に変換された音声信号を用いて音声区間を検出する
    音声区間検出部とを具備して成り、上記音声区間検出部
    は、少なくとも音声区間である場合と音声区間でない場
    合との2種類の上記アッテネータの制御手段を有し、該
    アッテネータの制御手段に従って上記アッテネータのゲ
    インを切換える信号を出力する機能を有する事を特徴と
    した音声認識装置。
JP1261101A 1989-10-05 1989-10-05 音声認識装置 Pending JPH03122700A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1261101A JPH03122700A (ja) 1989-10-05 1989-10-05 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1261101A JPH03122700A (ja) 1989-10-05 1989-10-05 音声認識装置

Publications (1)

Publication Number Publication Date
JPH03122700A true JPH03122700A (ja) 1991-05-24

Family

ID=17357095

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1261101A Pending JPH03122700A (ja) 1989-10-05 1989-10-05 音声認識装置

Country Status (1)

Country Link
JP (1) JPH03122700A (ja)

Similar Documents

Publication Publication Date Title
US9117436B2 (en) Sound processing apparatus and sound processing method
JPS63503487A (ja) 音声処理装置
KR20000010930A (ko) 음성 속도 변환 방법 및 그 장치
EP1791393A1 (en) Sound processing apparatus
US6768801B1 (en) Hearing aid having improved speech intelligibility due to frequency-selective signal processing, and method for operating same
US4589136A (en) Circuit for suppressing amplitude peaks caused by stop consonants in an electroacoustic transmission system
JPH03122700A (ja) 音声認識装置
JPH0916193A (ja) 話速変換装置
JPS6257040B2 (ja)
JP2000022469A (ja) 音声処理装置
JP6435133B2 (ja) 音素分割装置、音声処理システム、音素分割方法、および音素分割プログラム
JPH04163497A (ja) 音声区間検出方法
JPS6334477B2 (ja)
JP4079478B2 (ja) 音声信号の処理回路および処理方法
JP4005166B2 (ja) 音声信号の処理回路
JP3550871B2 (ja) 音声認識方法及び装置
JPS6355280B2 (ja)
JPH03122699A (ja) 雑音除去装置及び該装置を用いた音声認識装置
JPH0228878B2 (ja)
WO1993009531A1 (en) Processing of electrical and audio signals
JPH02176796A (ja) 音声認識装置
JP2975808B2 (ja) 音声認識装置
JP2003241792A (ja) 音声認識装置及び方法
JPH03147000A (ja) 音声入力装置
JPS59195291A (ja) 音声認識装置