JPS6167899A

JPS6167899A - 音声認識装置

Info

Publication number: JPS6167899A
Application number: JP59190853A
Authority: JP
Inventors: 潤一郎藤本
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1984-09-12
Filing date: 1984-09-12
Publication date: 1986-04-08

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】及■分■ 本発明は、音声認識装置に関する。

従」む剋訴パターンマツチングを利用した音声認識装置は周知であ
るが、このパターンマツチングを利用した音声認識にお
いては、認識すべき音声をあらかじめ登録しておき、入
力された音声と登録された音声のパターンを比較照合し
て最大類イ以の音声を探し、それを認識結果としている
。しかし、音声が入力された時、登録されている音声全
部と照合すると時間がかかるため、他の特徴によってど
の登録パターンと照合すべきかを判断してから照合する
方法が提案されている。この判断のための特徴として音
声区間の中に無音部が存在するか否かを用いる方法があ
り（特開昭５６−１４２５９８）　　。

無音部が存在する音声は無音部を持つ登録パターンとの
み照合することによって対象を減らし高速認識を狙って
いる。これは／ｐ／、／ｌ／、／に／音や促音の前に無
音区間が生じることを利用しているが、単語音声認識の
場合、無音区間を有するものが多くなりやすいため無音
区間保有に分類された場合、そうでない場合に比べて照
合に時間がかかるという欠点がある。

置皿本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声中に無音区間を有する単語について高速認識
することを目的としてなされたものである。

１戊本発明は、上記目的を達成するため、音声信号を電気信
号に変換する手段と、該電気信号を特徴パラメータに変
換する手段と、このようにして作られた音声パターンを
登録しておく手段を備え、入力された音声パターンとす
でに登録されているパターンを比較照合して認識結果を
出力する音声認識装置において、パターン登録時に同時
に各パラメータが一定値以下になる部分が単語パターン
中のどこに存在するかを単語長で正規化してパターンと
共に記録しておき、入力された音声のパターン中におい
ても同様の部分の位置を求め、登録パターン中で位置の
近いものを選出し、選出されたパターンとのみ照合する
ことを特徴としたものである。以下、本発明の実施例に
基づいて説明する。

本発明は、単語音声中の無音区間の位置が大きく変動し
ないことに注目してなされており、標準パターンの登録
に際して単語全体に対してどの位置に無音区間が存在す
るかを合わせて登録しておき、入力されたパターンにつ
いても同様の位置を求め、登録されているパターン中で
位置の近い単語を選出して照合するようにしている。

図は、本発明の一実施例を説明するための構成図で、図
中、１はマイク、２は特徴抽出部、３は音声区間切り出
し部、４はレベル比較部、５はレジスタ、６は無音位置
決定部、７は正規化部、８は単語辞書部、９は前照合部
、１０は判定部、１１は照合部、１２は結果出力部で、
最初に、単語標準パターンの登録について説明する。ま
ず、マイク１から音声が入力され、特徴抽出部２におい
てその特徴が抽出されるが、その特徴抽出は、例えばバ
ンドパスフィルタを複数個組合わせることによって行う
。次に、レベル比較部４において音声のレベルを比較し
、ある闇値より下ならばこれは無音区間として音声の始
端から無音区間の冒頭までの時間長をレジスタに記憶す
る。この闇値はＯでも良いが、定常的なノイズがある場
合は、闇値をこのノイズレベルと同等にしておかなけれ
ばならない。又、無音区間が連続している場合は、先頭
だけを記憶しておげば良く、間にレベルの大きな部分を
挟んで複数個ある場合には全ての無音区間の先頭位置を
記憶しておく。−単語の入力が終わるとレジスタ５に貯
えられた無音区間までの長さを単語長で割り、小数によ
って無音位置を表わしておく。当然ながら小数ではなく
て一定倍して整数としても良い。登録すべき各単語パタ
ーンの先頭について全てこの操作を行い各単語パターン
の先頭に無音位置情報をつける。無音部がない単語には
０等をつけておけば良い。

次に、認識時は、図の破線の経路を用い、先のパターン
登録と同様無音区間位置を正規化して小数で表わした後
、まず、位置での前照合を行い、位置の近いものだけを
選び出し、選び出されたものについて通常の方式で照合
して類似性を求める。

無音位置が離れている単語は照合をやめ、次の辞書中の
単語パターンへと移る。これを全登録単語についてくり
返し、最も類似度が大きかったものを認識結果として出
力する。

処果　　′ 以上の説明から明らかなように、本発明によると、無音
区間の有無だけでなく、単語中の位置をも記憶している
ので無音区間を持つ単語の認識が速やかに行える。

【図面の簡単な説明】

図は、本発明による音声認識装置の一実施例を説明する
ための電気的ブロック線図である。１・・・マイク、２・・・特徴抽出部、３・・・音声区
間切り出し部、４・・・レベル比較部、５・・・レジス
タ、６・・・無音位置決定部、７・・・正規化部、８・
・・単語辞書部。９・・・前照合部、１０・・・判定部、１１・・・照合
部。１２・・・結果出力部。

Claims

【特許請求の範囲】

音声信号を電気信号に変換する手段と、該電気信号を特
徴パラメータに変換する手段と、このようにして作られ
た音声パターンを登録しておく手段を備え、入力された
音声パターンとすでに登録されているパターンとを比較
照合して認識結果を出力する音声認識装置において、パ
ターン登録時に同時に各パラメータが一定値以下になる
部分が単語パターン中のどこに存在するかを単語長で正
規化してパターンと共に記録しておき、入力された音声
のパターン中においても同様の部分の位置を求め、登録
パターン中で位置の近いものを選出し、選出されたパタ
ーンとのみ照合することを特徴とする音声認識装置。