JPS6167899A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS6167899A JPS6167899A JP59190853A JP19085384A JPS6167899A JP S6167899 A JPS6167899 A JP S6167899A JP 59190853 A JP59190853 A JP 59190853A JP 19085384 A JP19085384 A JP 19085384A JP S6167899 A JPS6167899 A JP S6167899A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- silent
- word
- speech
- recognition device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
及■分■
本発明は、音声認識装置に関する。
従」む剋訴
パターンマツチングを利用した音声認識装置は周知であ
るが、このパターンマツチングを利用した音声認識にお
いては、認識すべき音声をあらかじめ登録しておき、入
力された音声と登録された音声のパターンを比較照合し
て最大類イ以の音声を探し、それを認識結果としている
。しかし、音声が入力された時、登録されている音声全
部と照合すると時間がかかるため、他の特徴によってど
の登録パターンと照合すべきかを判断してから照合する
方法が提案されている。この判断のための特徴として音
声区間の中に無音部が存在するか否かを用いる方法があ
り(特開昭56−142598) 。
るが、このパターンマツチングを利用した音声認識にお
いては、認識すべき音声をあらかじめ登録しておき、入
力された音声と登録された音声のパターンを比較照合し
て最大類イ以の音声を探し、それを認識結果としている
。しかし、音声が入力された時、登録されている音声全
部と照合すると時間がかかるため、他の特徴によってど
の登録パターンと照合すべきかを判断してから照合する
方法が提案されている。この判断のための特徴として音
声区間の中に無音部が存在するか否かを用いる方法があ
り(特開昭56−142598) 。
無音部が存在する音声は無音部を持つ登録パターンとの
み照合することによって対象を減らし高速認識を狙って
いる。これは/p/、/l/、/に/音や促音の前に無
音区間が生じることを利用しているが、単語音声認識の
場合、無音区間を有するものが多くなりやすいため無音
区間保有に分類された場合、そうでない場合に比べて照
合に時間がかかるという欠点がある。
み照合することによって対象を減らし高速認識を狙って
いる。これは/p/、/l/、/に/音や促音の前に無
音区間が生じることを利用しているが、単語音声認識の
場合、無音区間を有するものが多くなりやすいため無音
区間保有に分類された場合、そうでない場合に比べて照
合に時間がかかるという欠点がある。
置皿
本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声中に無音区間を有する単語について高速認識
することを目的としてなされたものである。
特に、音声中に無音区間を有する単語について高速認識
することを目的としてなされたものである。
1戊
本発明は、上記目的を達成するため、音声信号を電気信
号に変換する手段と、該電気信号を特徴パラメータに変
換する手段と、このようにして作られた音声パターンを
登録しておく手段を備え、入力された音声パターンとす
でに登録されているパターンを比較照合して認識結果を
出力する音声認識装置において、パターン登録時に同時
に各パラメータが一定値以下になる部分が単語パターン
中のどこに存在するかを単語長で正規化してパターンと
共に記録しておき、入力された音声のパターン中におい
ても同様の部分の位置を求め、登録パターン中で位置の
近いものを選出し、選出されたパターンとのみ照合する
ことを特徴としたものである。以下、本発明の実施例に
基づいて説明する。
号に変換する手段と、該電気信号を特徴パラメータに変
換する手段と、このようにして作られた音声パターンを
登録しておく手段を備え、入力された音声パターンとす
でに登録されているパターンを比較照合して認識結果を
出力する音声認識装置において、パターン登録時に同時
に各パラメータが一定値以下になる部分が単語パターン
中のどこに存在するかを単語長で正規化してパターンと
共に記録しておき、入力された音声のパターン中におい
ても同様の部分の位置を求め、登録パターン中で位置の
近いものを選出し、選出されたパターンとのみ照合する
ことを特徴としたものである。以下、本発明の実施例に
基づいて説明する。
本発明は、単語音声中の無音区間の位置が大きく変動し
ないことに注目してなされており、標準パターンの登録
に際して単語全体に対してどの位置に無音区間が存在す
るかを合わせて登録しておき、入力されたパターンにつ
いても同様の位置を求め、登録されているパターン中で
位置の近い単語を選出して照合するようにしている。
ないことに注目してなされており、標準パターンの登録
に際して単語全体に対してどの位置に無音区間が存在す
るかを合わせて登録しておき、入力されたパターンにつ
いても同様の位置を求め、登録されているパターン中で
位置の近い単語を選出して照合するようにしている。
図は、本発明の一実施例を説明するための構成図で、図
中、1はマイク、2は特徴抽出部、3は音声区間切り出
し部、4はレベル比較部、5はレジスタ、6は無音位置
決定部、7は正規化部、8は単語辞書部、9は前照合部
、10は判定部、11は照合部、12は結果出力部で、
最初に、単語標準パターンの登録について説明する。ま
ず、マイク1から音声が入力され、特徴抽出部2におい
てその特徴が抽出されるが、その特徴抽出は、例えばバ
ンドパスフィルタを複数個組合わせることによって行う
。次に、レベル比較部4において音声のレベルを比較し
、ある闇値より下ならばこれは無音区間として音声の始
端から無音区間の冒頭までの時間長をレジスタに記憶す
る。この闇値はOでも良いが、定常的なノイズがある場
合は、闇値をこのノイズレベルと同等にしておかなけれ
ばならない。又、無音区間が連続している場合は、先頭
だけを記憶しておげば良く、間にレベルの大きな部分を
挟んで複数個ある場合には全ての無音区間の先頭位置を
記憶しておく。−単語の入力が終わるとレジスタ5に貯
えられた無音区間までの長さを単語長で割り、小数によ
って無音位置を表わしておく。当然ながら小数ではなく
て一定倍して整数としても良い。登録すべき各単語パタ
ーンの先頭について全てこの操作を行い各単語パターン
の先頭に無音位置情報をつける。無音部がない単語には
0等をつけておけば良い。
中、1はマイク、2は特徴抽出部、3は音声区間切り出
し部、4はレベル比較部、5はレジスタ、6は無音位置
決定部、7は正規化部、8は単語辞書部、9は前照合部
、10は判定部、11は照合部、12は結果出力部で、
最初に、単語標準パターンの登録について説明する。ま
ず、マイク1から音声が入力され、特徴抽出部2におい
てその特徴が抽出されるが、その特徴抽出は、例えばバ
ンドパスフィルタを複数個組合わせることによって行う
。次に、レベル比較部4において音声のレベルを比較し
、ある闇値より下ならばこれは無音区間として音声の始
端から無音区間の冒頭までの時間長をレジスタに記憶す
る。この闇値はOでも良いが、定常的なノイズがある場
合は、闇値をこのノイズレベルと同等にしておかなけれ
ばならない。又、無音区間が連続している場合は、先頭
だけを記憶しておげば良く、間にレベルの大きな部分を
挟んで複数個ある場合には全ての無音区間の先頭位置を
記憶しておく。−単語の入力が終わるとレジスタ5に貯
えられた無音区間までの長さを単語長で割り、小数によ
って無音位置を表わしておく。当然ながら小数ではなく
て一定倍して整数としても良い。登録すべき各単語パタ
ーンの先頭について全てこの操作を行い各単語パターン
の先頭に無音位置情報をつける。無音部がない単語には
0等をつけておけば良い。
次に、認識時は、図の破線の経路を用い、先のパターン
登録と同様無音区間位置を正規化して小数で表わした後
、まず、位置での前照合を行い、位置の近いものだけを
選び出し、選び出されたものについて通常の方式で照合
して類似性を求める。
登録と同様無音区間位置を正規化して小数で表わした後
、まず、位置での前照合を行い、位置の近いものだけを
選び出し、選び出されたものについて通常の方式で照合
して類似性を求める。
無音位置が離れている単語は照合をやめ、次の辞書中の
単語パターンへと移る。これを全登録単語についてくり
返し、最も類似度が大きかったものを認識結果として出
力する。
単語パターンへと移る。これを全登録単語についてくり
返し、最も類似度が大きかったものを認識結果として出
力する。
処果 ′
以上の説明から明らかなように、本発明によると、無音
区間の有無だけでなく、単語中の位置をも記憶している
ので無音区間を持つ単語の認識が速やかに行える。
区間の有無だけでなく、単語中の位置をも記憶している
ので無音区間を持つ単語の認識が速やかに行える。
図は、本発明による音声認識装置の一実施例を説明する
ための電気的ブロック線図である。 1・・・マイク、2・・・特徴抽出部、3・・・音声区
間切り出し部、4・・・レベル比較部、5・・・レジス
タ、6・・・無音位置決定部、7・・・正規化部、8・
・・単語辞書部。 9・・・前照合部、10・・・判定部、11・・・照合
部。 12・・・結果出力部。
ための電気的ブロック線図である。 1・・・マイク、2・・・特徴抽出部、3・・・音声区
間切り出し部、4・・・レベル比較部、5・・・レジス
タ、6・・・無音位置決定部、7・・・正規化部、8・
・・単語辞書部。 9・・・前照合部、10・・・判定部、11・・・照合
部。 12・・・結果出力部。
Claims (1)
- 音声信号を電気信号に変換する手段と、該電気信号を特
徴パラメータに変換する手段と、このようにして作られ
た音声パターンを登録しておく手段を備え、入力された
音声パターンとすでに登録されているパターンとを比較
照合して認識結果を出力する音声認識装置において、パ
ターン登録時に同時に各パラメータが一定値以下になる
部分が単語パターン中のどこに存在するかを単語長で正
規化してパターンと共に記録しておき、入力された音声
のパターン中においても同様の部分の位置を求め、登録
パターン中で位置の近いものを選出し、選出されたパタ
ーンとのみ照合することを特徴とする音声認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59190853A JPS6167899A (ja) | 1984-09-12 | 1984-09-12 | 音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59190853A JPS6167899A (ja) | 1984-09-12 | 1984-09-12 | 音声認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS6167899A true JPS6167899A (ja) | 1986-04-08 |
Family
ID=16264860
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59190853A Pending JPS6167899A (ja) | 1984-09-12 | 1984-09-12 | 音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6167899A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6385697A (ja) * | 1986-09-30 | 1988-04-16 | キヤノン株式会社 | 音声認識方法 |
-
1984
- 1984-09-12 JP JP59190853A patent/JPS6167899A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6385697A (ja) * | 1986-09-30 | 1988-04-16 | キヤノン株式会社 | 音声認識方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS6167899A (ja) | 音声認識装置 | |
| Cohen et al. | Unsupervised text independent speaker classification | |
| JPS6131880B2 (ja) | ||
| JPS6193499A (ja) | 音声パタ−ン照合方式 | |
| JPS61180297A (ja) | 話者照合装置 | |
| JP2891259B2 (ja) | 音声区間検出装置 | |
| JPS63173100A (ja) | キ−ワ−ド抽出装置 | |
| JPS5934595A (ja) | 音声認識処理方式 | |
| JPS6312000A (ja) | 音声認識装置 | |
| JP2655637B2 (ja) | 音声パターン照合方式 | |
| JPH01158499A (ja) | 定常雑音除去方式 | |
| JPS6240497A (ja) | 音声パタ−ン分類方式 | |
| JPS58159598A (ja) | 単音節音声認識方式 | |
| JPS62255999A (ja) | 単語音声認識装置 | |
| JPS6287995A (ja) | 音声パタ−ン登録方式 | |
| JPS63306500A (ja) | 音声認識後処理方式 | |
| JPH03269500A (ja) | 音声認識装置 | |
| JPS62159200A (ja) | 特定話者用単語音声認識装置 | |
| JPS607492A (ja) | 単音節音声認識方式 | |
| JPS61122699A (ja) | 単音節音声認識方式 | |
| JPS6151196A (ja) | 音声認識装置 | |
| JPS63247799A (ja) | 音声認識装置 | |
| JPS62166400A (ja) | 音声ワ−ドプロセツサ装置 | |
| JPS6151197A (ja) | 音声認識装置 | |
| JPH07302098A (ja) | 単語音声認識装置 |