JPH02278295A - 音声パターン登録方式及び音声認識装置 - Google Patents
音声パターン登録方式及び音声認識装置Info
- Publication number
- JPH02278295A JPH02278295A JP1101144A JP10114489A JPH02278295A JP H02278295 A JPH02278295 A JP H02278295A JP 1101144 A JP1101144 A JP 1101144A JP 10114489 A JP10114489 A JP 10114489A JP H02278295 A JPH02278295 A JP H02278295A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- voice
- pattern
- spectral
- parts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
伎亙分更
本発明は、音声認識用のパターン登録方式、及び、該パ
ターン登録方式によって28したパターンを用いた音声
認識装置に関する。
ターン登録方式によって28したパターンを用いた音声
認識装置に関する。
灸未皮逢
音声認識装置が実眉に近付くに従い、実環境の中での使
用を考慮するための研究が行なわれてきた。特に、音声
認識の場合は周囲の騒音が問題で、音声と騒音の区別が
できないと認識することができない、!I音の中で認識
するために、いくつかの方法が提案されている。例えば
、音声が入力されない時の騒音のスペクトルをメモリー
に保存しておいて、音声が入力された時、そのスペクト
ル成分から騒音の分を差引いてからtL&するもの(日
本音響学会講演論文集 昭和57年3月 P141〜1
42 3−4−6.単語認識の雑音処理に関する実験)
が良く知られている。しかし、この方法ではあらかじめ
メモリーにたくねえた騒音のスペクトル成分が変化した
時には、逆効果となることもある。その他に、音声が入
力される前に騒音の大きさを測定しておいて、それより
も大きな音が入力された時、またはその測定値よりも小
さくなった時、それぞれを音声の始端と終端として騒音
中から取りだすものがある。しかし、この方法では、音
声発声中に騒音が大きくなると、始端検出後の音声レベ
ルがあらかじめ測定しておいたしきい値より下がること
がなくなる。このために、音声の終端が見つからないと
いった現象を引き起こしてしまうことになる。また、2
つの音声入力手段を持ち、一方には音声と周@騒音が、
他方には周囲騒音が主入力となるようにし、両者の誤差
が最小になるようにフィルター特性を変えていくもの、
いわゆる、アダプティブフィルタによるものがある(音
声研究会資料 581−81p651.高速マイクロ・
プロセッサーを用いた雑音除去)。この方法は精度も良
く、入力される騒音が定常的ではなくとも、それを減ら
した信号を取りだすことができるという長所を持ってい
る。
用を考慮するための研究が行なわれてきた。特に、音声
認識の場合は周囲の騒音が問題で、音声と騒音の区別が
できないと認識することができない、!I音の中で認識
するために、いくつかの方法が提案されている。例えば
、音声が入力されない時の騒音のスペクトルをメモリー
に保存しておいて、音声が入力された時、そのスペクト
ル成分から騒音の分を差引いてからtL&するもの(日
本音響学会講演論文集 昭和57年3月 P141〜1
42 3−4−6.単語認識の雑音処理に関する実験)
が良く知られている。しかし、この方法ではあらかじめ
メモリーにたくねえた騒音のスペクトル成分が変化した
時には、逆効果となることもある。その他に、音声が入
力される前に騒音の大きさを測定しておいて、それより
も大きな音が入力された時、またはその測定値よりも小
さくなった時、それぞれを音声の始端と終端として騒音
中から取りだすものがある。しかし、この方法では、音
声発声中に騒音が大きくなると、始端検出後の音声レベ
ルがあらかじめ測定しておいたしきい値より下がること
がなくなる。このために、音声の終端が見つからないと
いった現象を引き起こしてしまうことになる。また、2
つの音声入力手段を持ち、一方には音声と周@騒音が、
他方には周囲騒音が主入力となるようにし、両者の誤差
が最小になるようにフィルター特性を変えていくもの、
いわゆる、アダプティブフィルタによるものがある(音
声研究会資料 581−81p651.高速マイクロ・
プロセッサーを用いた雑音除去)。この方法は精度も良
く、入力される騒音が定常的ではなくとも、それを減ら
した信号を取りだすことができるという長所を持ってい
る。
しかし、この方法では、誤差最小に収束させるための計
算量が多く1通常の音声認識のように10m5ごとにデ
ータを取込めば、取込時間中に収束させることができに
くい。どのような方法であっても、音声を発声している
間に突発的な騒音が発生した場合、これに対処すること
ができない。
算量が多く1通常の音声認識のように10m5ごとにデ
ータを取込めば、取込時間中に収束させることができに
くい。どのような方法であっても、音声を発声している
間に突発的な騒音が発生した場合、これに対処すること
ができない。
几−一並
本発明は、上述のごとき従来技術の欠点に鑑みなされた
もので、音声入力中に騒音が発生しても特徴パターンを
修正して認識するための、パターンの作成法を提供する
ことを目的としてなされたものである。
もので、音声入力中に騒音が発生しても特徴パターンを
修正して認識するための、パターンの作成法を提供する
ことを目的としてなされたものである。
眉ニー」又
本発明は、上記目的を達成するために、音声を収集して
電気信号に変換する部分と、変換された電気信号を周波
数分析する部分と、分析された結果から周波数成分の大
なる位置を取り出し、周波数成分の大なる位置が所定の
時間継続するか否かを判定する部分と、所定の時間以上
継続する部分(以降スペクトル安定部と称する)が複数
存在した場合、隣り合うスペクトル安定部が同種のもの
であるかどうかを判定し、同種の時にはそれらを一つの
スペクトル安定部が継続しているものとして修正してパ
ターン登録することを特徴としだものである。以下、本
発明の実施例に基づいて説明する。
電気信号に変換する部分と、変換された電気信号を周波
数分析する部分と、分析された結果から周波数成分の大
なる位置を取り出し、周波数成分の大なる位置が所定の
時間継続するか否かを判定する部分と、所定の時間以上
継続する部分(以降スペクトル安定部と称する)が複数
存在した場合、隣り合うスペクトル安定部が同種のもの
であるかどうかを判定し、同種の時にはそれらを一つの
スペクトル安定部が継続しているものとして修正してパ
ターン登録することを特徴としだものである。以下、本
発明の実施例に基づいて説明する。
第1図は、本発明の一実施例を説明するための構成図で
、図中、1はマイクロフォン、2はフィルタバンク部、
3はサンプリング部、4はピーク検出部、5は時間カウ
ンタ、6は比較部、7はメモリ部、8はパターン比較部
、9はパターン置き換え部、10は登録メモリ部で、本
発明は、音声中に含まれる定常的な音韻の並びと、出現
順序だけでもかなり良い精度で認識結果をしぼり込むこ
とができるという事実に基づいてなされたものであり、
具体的には、音声を収集して電気信号に変換する部分と
、変換された電気信号を周波数分析する部分と、分析さ
れた結果から周波数成分の大なる位置を取りだし、周波
数成分の大なる位置が所定の時間継続するか否かを判定
する部分と、所定の時間以上継続する部分(以降スペク
トル安定部と称する)が複数存在した場合、隣り合うス
ペクトル安定部が同種のものであるかどうかを判定し、
同種の時にはそれらを一つのスペクトル安定部が継続し
ているものとして修正してパターン登録するようにした
ものである。これを第1図によって説明すると、まず、
マイクロフォン1によって音声を入力し、電気信号に変
換する。変換された信号を周波数分析する周波数分析部
としては、例えばバンドパスフィルタ群2などを使用す
れば良い。あるいは、波形をサンプル3してからFFT
により周波数変換しても良い。周波数変換した結果の中
で、成分が大きい周波数をピーク検出部4で検出する。
、図中、1はマイクロフォン、2はフィルタバンク部、
3はサンプリング部、4はピーク検出部、5は時間カウ
ンタ、6は比較部、7はメモリ部、8はパターン比較部
、9はパターン置き換え部、10は登録メモリ部で、本
発明は、音声中に含まれる定常的な音韻の並びと、出現
順序だけでもかなり良い精度で認識結果をしぼり込むこ
とができるという事実に基づいてなされたものであり、
具体的には、音声を収集して電気信号に変換する部分と
、変換された電気信号を周波数分析する部分と、分析さ
れた結果から周波数成分の大なる位置を取りだし、周波
数成分の大なる位置が所定の時間継続するか否かを判定
する部分と、所定の時間以上継続する部分(以降スペク
トル安定部と称する)が複数存在した場合、隣り合うス
ペクトル安定部が同種のものであるかどうかを判定し、
同種の時にはそれらを一つのスペクトル安定部が継続し
ているものとして修正してパターン登録するようにした
ものである。これを第1図によって説明すると、まず、
マイクロフォン1によって音声を入力し、電気信号に変
換する。変換された信号を周波数分析する周波数分析部
としては、例えばバンドパスフィルタ群2などを使用す
れば良い。あるいは、波形をサンプル3してからFFT
により周波数変換しても良い。周波数変換した結果の中
で、成分が大きい周波数をピーク検出部4で検出する。
ここでは周波数軸上で成分の大きさを比較しながら、極
大値を取り出す方法で実行するが、周波数軸上の隣り合
うデータの差を取り、その符号が逆転するところをピー
クとするなど、他の方法でも良いことは言うまでもない
。次に、この取り出した極大値が時間的に連続する長さ
を時間カウンタ5で測定し、これを決められた時間長と
比較部6で比較してそれよりも長いかどうかをチエツク
する。決められた時間長としては30m5程度が良い。
大値を取り出す方法で実行するが、周波数軸上の隣り合
うデータの差を取り、その符号が逆転するところをピー
クとするなど、他の方法でも良いことは言うまでもない
。次に、この取り出した極大値が時間的に連続する長さ
を時間カウンタ5で測定し、これを決められた時間長と
比較部6で比較してそれよりも長いかどうかをチエツク
する。決められた時間長としては30m5程度が良い。
これよりも長い部分に、メモリ部7において、マークを
つける。
つける。
ここでマークがつけられるのは母音と/S/。
/f/、/l f/などの音韻である。しかもこれらの
音韻の定常的な安定部(スペクトル安定部)にマークが
つけられることになる。例えば、異なる母音が2個連続
する場合は、母音の変り目でパターンに定常性がなくな
るため、2つに分割される。マークをつけられた部分で
、隣り合う部分をパターン比較部8において比較するこ
とにより、隣り合う2つが同じ音韻かそうでないかを判
定する。これは隣り合う部分の類似度を求め、その値が
一定値以上であるのか否かで判定できる。同じ音韻なら
、その2つの部分を連結して1つにまとめてしまう。ま
とめる時にはマークを連続させても良いし、同じ母音の
パターンを挿入して作り替えても良い。このようにして
、このようなパターンを登録しておいて、まず、通常の
認識の前に該パターンによって認識対象を限定してから
、通常のLy22を行なうのも効果的であるが、登録単
語数があまり多くない場合や、母音や、定常性を持つ子
音の存在位置と組合せの同じものがない場合は、このま
までLy&識結果が得られる。
音韻の定常的な安定部(スペクトル安定部)にマークが
つけられることになる。例えば、異なる母音が2個連続
する場合は、母音の変り目でパターンに定常性がなくな
るため、2つに分割される。マークをつけられた部分で
、隣り合う部分をパターン比較部8において比較するこ
とにより、隣り合う2つが同じ音韻かそうでないかを判
定する。これは隣り合う部分の類似度を求め、その値が
一定値以上であるのか否かで判定できる。同じ音韻なら
、その2つの部分を連結して1つにまとめてしまう。ま
とめる時にはマークを連続させても良いし、同じ母音の
パターンを挿入して作り替えても良い。このようにして
、このようなパターンを登録しておいて、まず、通常の
認識の前に該パターンによって認識対象を限定してから
、通常のLy22を行なうのも効果的であるが、登録単
語数があまり多くない場合や、母音や、定常性を持つ子
音の存在位置と組合せの同じものがない場合は、このま
までLy&識結果が得られる。
もし、母音発声中に突発的な雑音が入り込んだ場合には
、母音の中に雑音が入り込むことになるが、上記の操作
により、母音を復元することができる。また、雑音が定
常性のない子音に混入した時、また、母音の末尾に付い
た時も上記のマークの修正で混入しないものと同じ状態
に戻すことができる。
、母音の中に雑音が入り込むことになるが、上記の操作
により、母音を復元することができる。また、雑音が定
常性のない子音に混入した時、また、母音の末尾に付い
た時も上記のマークの修正で混入しないものと同じ状態
に戻すことができる。
なお、第1図に示した例は、予備的な認識にこの方法を
使う例であって、認識部がどのような手法を使うかは制
限していない。予備的なLy3識でもマークの並び方か
ら辞書中の同じパターンを取りだしてくるもので、特に
パターンマツチングの必要はない。勿論、パターンマツ
チングをしてもよい。
使う例であって、認識部がどのような手法を使うかは制
限していない。予備的なLy3識でもマークの並び方か
ら辞書中の同じパターンを取りだしてくるもので、特に
パターンマツチングの必要はない。勿論、パターンマツ
チングをしてもよい。
勿−一二隈
以上の説明から明らかなように、本発明によると、突発
的な雑音が加すっだ音声の定常部から雑音部を取除き正
しいパターンに置き換えることができるようになり、こ
の結果、雑音の中でも正しい認識ができるようになった
。
的な雑音が加すっだ音声の定常部から雑音部を取除き正
しいパターンに置き換えることができるようになり、こ
の結果、雑音の中でも正しい認識ができるようになった
。
第1図は、本発明の一実施例を説明するための構成図で
ある。 1・・・マイクロフォン、2・・・フィルタバンク部、
3サンプリング部、4・・・ピーク検出部、5・・・時
間カウンタ、6・・・比較部、7・・・メモリ部、8・
・・パターン比較部、9・・・パターン置き換え部、1
0・・・登録メモリ部。 第1図 特許出願人 株式会社 リコー
ある。 1・・・マイクロフォン、2・・・フィルタバンク部、
3サンプリング部、4・・・ピーク検出部、5・・・時
間カウンタ、6・・・比較部、7・・・メモリ部、8・
・・パターン比較部、9・・・パターン置き換え部、1
0・・・登録メモリ部。 第1図 特許出願人 株式会社 リコー
Claims (1)
- 【特許請求の範囲】 1、音声を収集して電気信号に変換する部分と、変換さ
れた電気信号を周波数分析する部分と、分析された結果
から周波数成分の大なる位置を取り出し、周波数成分の
大なる位置が所定の時間継続するか否かを判定する部分
と、所定の時間以上継続する部分(以降スペクトル安定
部と称する)が複数存在した場合、隣り合うスペクトル
安定部が同種のものであるかどうかを判定し、同種の時
にはそれらを一つのスペクトル安定部が継続しているも
のとして修正してパターン登録することを特徴とする音
声パターン登録方式。 2、請求項第1項に記載のパターン登録方式によって登
録したパターンを用いた音声認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1101144A JPH02278295A (ja) | 1989-04-19 | 1989-04-19 | 音声パターン登録方式及び音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1101144A JPH02278295A (ja) | 1989-04-19 | 1989-04-19 | 音声パターン登録方式及び音声認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02278295A true JPH02278295A (ja) | 1990-11-14 |
Family
ID=14292885
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1101144A Pending JPH02278295A (ja) | 1989-04-19 | 1989-04-19 | 音声パターン登録方式及び音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02278295A (ja) |
-
1989
- 1989-04-19 JP JP1101144A patent/JPH02278295A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Zhu et al. | On the use of variable frame rate analysis in speech recognition | |
| US4780906A (en) | Speaker-independent word recognition method and system based upon zero-crossing rate and energy measurement of analog speech signal | |
| US5025471A (en) | Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns | |
| US4769844A (en) | Voice recognition system having a check scheme for registration of reference data | |
| US4078154A (en) | Voice recognition system using locus of centroid of vocal frequency spectra | |
| US4924518A (en) | Phoneme similarity calculating apparatus | |
| JPH0558553B2 (ja) | ||
| JPH02278295A (ja) | 音声パターン登録方式及び音声認識装置 | |
| JPS58108590A (ja) | 音声認識装置 | |
| JP2666296B2 (ja) | 音声認識装置 | |
| JPH045198B2 (ja) | ||
| JPS63213899A (ja) | 話者照合方式 | |
| JP2844592B2 (ja) | 離散単語音声認識装置 | |
| JPS59149400A (ja) | 音声入力装置 | |
| JPH0682275B2 (ja) | 音声認識装置 | |
| JPH02205898A (ja) | 音声認識装置 | |
| JPS6227798A (ja) | 音声認識装置 | |
| JPS63226691A (ja) | 標準パターン作成方式 | |
| JPS6236699A (ja) | 音声識別装置 | |
| JPH04365100A (ja) | 音声認識に使用する子音の認識方法 | |
| JPS5885495A (ja) | 音声認識装置 | |
| JPH01209499A (ja) | パターン照合方式 | |
| JPS5936759B2 (ja) | 音声認識方法 | |
| JPH0254560B2 (ja) | ||
| JPH0424697A (ja) | 音声認識装置 |