JPH02278295A

JPH02278295A - 音声パターン登録方式及び音声認識装置

Info

Publication number: JPH02278295A
Application number: JP1101144A
Authority: JP
Inventors: Junichiro Fujimoto; 潤一郎藤本
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1989-04-19
Filing date: 1989-04-19
Publication date: 1990-11-14

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】伎亙分更本発明は、音声認識用のパターン登録方式、及び、該パ
ターン登録方式によって２８したパターンを用いた音声
認識装置に関する。

灸未皮逢音声認識装置が実眉に近付くに従い、実環境の中での使
用を考慮するための研究が行なわれてきた。特に、音声
認識の場合は周囲の騒音が問題で、音声と騒音の区別が
できないと認識することができない、！Ｉ音の中で認識
するために、いくつかの方法が提案されている。例えば
、音声が入力されない時の騒音のスペクトルをメモリー
に保存しておいて、音声が入力された時、そのスペクト
ル成分から騒音の分を差引いてからｔＬ＆するもの（日
本音響学会講演論文集　昭和５７年３月　Ｐ１４１〜１
４２　３−４−６．単語認識の雑音処理に関する実験）
が良く知られている。しかし、この方法ではあらかじめ
メモリーにたくねえた騒音のスペクトル成分が変化した
時には、逆効果となることもある。その他に、音声が入
力される前に騒音の大きさを測定しておいて、それより
も大きな音が入力された時、またはその測定値よりも小
さくなった時、それぞれを音声の始端と終端として騒音
中から取りだすものがある。しかし、この方法では、音
声発声中に騒音が大きくなると、始端検出後の音声レベ
ルがあらかじめ測定しておいたしきい値より下がること
がなくなる。このために、音声の終端が見つからないと
いった現象を引き起こしてしまうことになる。また、２
つの音声入力手段を持ち、一方には音声と周＠騒音が、
他方には周囲騒音が主入力となるようにし、両者の誤差
が最小になるようにフィルター特性を変えていくもの、
いわゆる、アダプティブフィルタによるものがある（音
声研究会資料　５８１−８１ｐ６５１．高速マイクロ・
プロセッサーを用いた雑音除去）。この方法は精度も良
く、入力される騒音が定常的ではなくとも、それを減ら
した信号を取りだすことができるという長所を持ってい
る。

しかし、この方法では、誤差最小に収束させるための計
算量が多く１通常の音声認識のように１０ｍ５ごとにデ
ータを取込めば、取込時間中に収束させることができに
くい。どのような方法であっても、音声を発声している
間に突発的な騒音が発生した場合、これに対処すること
ができない。

几−一並本発明は、上述のごとき従来技術の欠点に鑑みなされた
もので、音声入力中に騒音が発生しても特徴パターンを
修正して認識するための、パターンの作成法を提供する
ことを目的としてなされたものである。

眉ニー」又本発明は、上記目的を達成するために、音声を収集して
電気信号に変換する部分と、変換された電気信号を周波
数分析する部分と、分析された結果から周波数成分の大
なる位置を取り出し、周波数成分の大なる位置が所定の
時間継続するか否かを判定する部分と、所定の時間以上
継続する部分（以降スペクトル安定部と称する）が複数
存在した場合、隣り合うスペクトル安定部が同種のもの
であるかどうかを判定し、同種の時にはそれらを一つの
スペクトル安定部が継続しているものとして修正してパ
ターン登録することを特徴としだものである。以下、本
発明の実施例に基づいて説明する。

第１図は、本発明の一実施例を説明するための構成図で
、図中、１はマイクロフォン、２はフィルタバンク部、
３はサンプリング部、４はピーク検出部、５は時間カウ
ンタ、６は比較部、７はメモリ部、８はパターン比較部
、９はパターン置き換え部、１０は登録メモリ部で、本
発明は、音声中に含まれる定常的な音韻の並びと、出現
順序だけでもかなり良い精度で認識結果をしぼり込むこ
とができるという事実に基づいてなされたものであり、
具体的には、音声を収集して電気信号に変換する部分と
、変換された電気信号を周波数分析する部分と、分析さ
れた結果から周波数成分の大なる位置を取りだし、周波
数成分の大なる位置が所定の時間継続するか否かを判定
する部分と、所定の時間以上継続する部分（以降スペク
トル安定部と称する）が複数存在した場合、隣り合うス
ペクトル安定部が同種のものであるかどうかを判定し、
同種の時にはそれらを一つのスペクトル安定部が継続し
ているものとして修正してパターン登録するようにした
ものである。これを第１図によって説明すると、まず、
マイクロフォン１によって音声を入力し、電気信号に変
換する。変換された信号を周波数分析する周波数分析部
としては、例えばバンドパスフィルタ群２などを使用す
れば良い。あるいは、波形をサンプル３してからＦＦＴ
により周波数変換しても良い。周波数変換した結果の中
で、成分が大きい周波数をピーク検出部４で検出する。

ここでは周波数軸上で成分の大きさを比較しながら、極
大値を取り出す方法で実行するが、周波数軸上の隣り合
うデータの差を取り、その符号が逆転するところをピー
クとするなど、他の方法でも良いことは言うまでもない
。次に、この取り出した極大値が時間的に連続する長さ
を時間カウンタ５で測定し、これを決められた時間長と
比較部６で比較してそれよりも長いかどうかをチエツク
する。決められた時間長としては３０ｍ５程度が良い。

これよりも長い部分に、メモリ部７において、マークを
つける。

ここでマークがつけられるのは母音と／Ｓ／。

／ｆ／、／ｌ　ｆ／などの音韻である。しかもこれらの
音韻の定常的な安定部（スペクトル安定部）にマークが
つけられることになる。例えば、異なる母音が２個連続
する場合は、母音の変り目でパターンに定常性がなくな
るため、２つに分割される。マークをつけられた部分で
、隣り合う部分をパターン比較部８において比較するこ
とにより、隣り合う２つが同じ音韻かそうでないかを判
定する。これは隣り合う部分の類似度を求め、その値が
一定値以上であるのか否かで判定できる。同じ音韻なら
、その２つの部分を連結して１つにまとめてしまう。ま
とめる時にはマークを連続させても良いし、同じ母音の
パターンを挿入して作り替えても良い。このようにして
、このようなパターンを登録しておいて、まず、通常の
認識の前に該パターンによって認識対象を限定してから
、通常のＬｙ２２を行なうのも効果的であるが、登録単
語数があまり多くない場合や、母音や、定常性を持つ子
音の存在位置と組合せの同じものがない場合は、このま
までＬｙ＆識結果が得られる。

もし、母音発声中に突発的な雑音が入り込んだ場合には
、母音の中に雑音が入り込むことになるが、上記の操作
により、母音を復元することができる。また、雑音が定
常性のない子音に混入した時、また、母音の末尾に付い
た時も上記のマークの修正で混入しないものと同じ状態
に戻すことができる。

なお、第１図に示した例は、予備的な認識にこの方法を
使う例であって、認識部がどのような手法を使うかは制
限していない。予備的なＬｙ３識でもマークの並び方か
ら辞書中の同じパターンを取りだしてくるもので、特に
パターンマツチングの必要はない。勿論、パターンマツ
チングをしてもよい。

勿−一二隈以上の説明から明らかなように、本発明によると、突発
的な雑音が加すっだ音声の定常部から雑音部を取除き正
しいパターンに置き換えることができるようになり、こ
の結果、雑音の中でも正しい認識ができるようになった
。

【図面の簡単な説明】

第１図は、本発明の一実施例を説明するための構成図で
ある。１・・・マイクロフォン、２・・・フィルタバンク部、
３サンプリング部、４・・・ピーク検出部、５・・・時
間カウンタ、６・・・比較部、７・・・メモリ部、８・
・・パターン比較部、９・・・パターン置き換え部、１
０・・・登録メモリ部。第１図特許出願人　　株式会社　リコー

Claims

【特許請求の範囲】１、音声を収集して電気信号に変換する部分と、変換さ
れた電気信号を周波数分析する部分と、分析された結果
から周波数成分の大なる位置を取り出し、周波数成分の
大なる位置が所定の時間継続するか否かを判定する部分
と、所定の時間以上継続する部分（以降スペクトル安定
部と称する）が複数存在した場合、隣り合うスペクトル
安定部が同種のものであるかどうかを判定し、同種の時
にはそれらを一つのスペクトル安定部が継続しているも
のとして修正してパターン登録することを特徴とする音
声パターン登録方式。２、請求項第１項に記載のパターン登録方式によって登
録したパターンを用いた音声認識装置。