JPH0553597A

JPH0553597A - 音声認識装置およびパターン比較方法

Info

Publication number: JPH0553597A
Application number: JP3298344A
Authority: JP
Inventors: Junichiro Fujimoto; 潤一郎藤本; Yoshinaga Kato; 喜永加藤
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1991-06-12
Filing date: 1991-10-17
Publication date: 1993-03-05

Abstract

(57)【要約】【目的】単語音声認識処理において連続的に発声され
た単語を認識させる場合にも、煩雑で特別な処理を必要
とせずに照合精度を向上可能である。【構成】音響分析部４で音声を分析すると、音声区間
検出部８ではこの分析結果のうちで音声に係る部分だけ
を取り出し、これを特徴パターンとして出力する。また
パワー検出部５では音声の大きさ，すなわちパワーを検
出し、比較部７においてはパワー検出部５で検出された
音声の特徴的な部分，例えばピ−クを検知する。パター
ン生成部９では音声の特徴的な部分を符号化し、これを
音声区間検出部８からの特徴パターンに書込み、この新
たな特徴パターンを未知パターン照合用の標準パターン
として生成し辞書２に登録する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、音声を音響分析して照
合用の標準パターンを生成し、該標準パターンを用いて
入力音声の未知パターンに対する音声認識を行なう音声
認識装置およびパタ−ン比較方法に関する。

【０００２】

【従来の技術】一般に、単語音声認識処理においては、
通常、照合用の辞書に孤立した単位の標準パターンのみ
を登録しておき、孤立発声された単語の音声のみを正し
く認識できるようになっている。例えば、“１（い
ち）”，“２（に）”，“３（さん）”と１つづつ区切
って発声された各単語は、各単語ごとの未知パターンが
辞書内の標準パターンと照合されて正しく認識される。
しかしながら、“１（いち）２（に）３（さん）”のよ
うに連続的に発声された単語に対しては、正しく認識す
ることができない場合が多い。すなわち、例えば３つの
単語が連続的に発声された場合には、各単語の境界が不
明確となって、３つの単語の各特徴パターンとしてとら
えるべきところを１つの単語の特徴パターンとしてとら
えて辞書内の１つの単語音声の標準パターンと照合して
しまうので、誤まった認識結果を得てしまうことが多
い。

【０００３】このような問題を解消するため、従来、例
えば昭和６１年１０月に発行の著者「三木」等による文
献「音響学会講演論文集３−５−７」には、単語と単語
のつながりの部分をも照合用の標準パターンとして辞書
に登録しておくことが提案されている。

【０００４】

【発明が解決しようとする課題】この従来技術によれ
ば、単語と単語のつながり部分をも標準パターンとして
辞書に登録することで、連続的に発声される単語の照合
精度を確かに向上させることができる。しかしながら、
この場合には、照合用の標準パターンの種類数が著しく
増大し、辞書が大容量化するとともに、辞書への登録作
業が煩雑になるなどの欠点があった。

【０００５】また、従来では、２段ＤＰマッチングを用
いた装置なども知られているが、これらの装置では計算
量が非常に多く、迅速に音声認識処理を行なわせること
ができないなどの欠点があった。

【０００６】本発明は、例えば単語音声認識処理におい
て連続的に発声された単語を認識させようとする場合に
も、上記従来技術のような煩雑で特別な処理を必要とせ
ずに照合精度を向上させることの可能な音声認識装置お
よびパタ−ン比較方法を提供することを目的としてい
る。

【０００７】

【課題を解決するための手段】上記目的を達成するため
に本発明は、音声を音響分析した結果に基づき特徴パタ
ーンを作成する特徴パターン作成手段と、音声の大きさ
を検出するパワー検出手段と、検出された音声の大きさ
の特徴的な部分を符号化して前記特徴パターン作成手段
によって作成された特徴パターンに書込みこれを標準パ
ターンとして生成するパターン生成手段とを有し、パタ
ーン生成手段によって生成された標準パターンを用いて
入力音声の未知パターンに対する音声認識を行なうよう
になっていることを特徴としている。

【０００８】また、前記パターン生成手段は、検出され
た音声の大きさの特徴的な部分を符号化し、さらに該符
号化部分を中心として時系列方向に符号化値を徐々に減
少させて前記特徴パターン作成手段からの特徴パターン
に書込みこれを標準パターンとして生成するようになっ
ていることを特徴としている。

【０００９】また、検出された音声の大きさが所定の閾
値よりも大きいときにこの部分を符号化するようになっ
ていることを特徴としている。

【００１０】また、検出された音声の大きさが所定の閾
値よりも小さいときにこの部分を符号化するようになっ
ていることを特徴としている。

【００１１】また、検出された音声の大きさが第１の閾
値よりも大きい部分と、第１の閾値に比べて小さな閾値
よりも小さい部分との両方の部分を符号化するようにな
っていることを特徴としている。

【００１２】また、上記両方の部分は、互いに区別可能
に符号化がなされるようになっていることを特徴として
いる。

【００１３】また、同じ言葉を複数回発声させてそれぞ
れの特徴パターンを形成し、各特徴パターン上の音声の
大きさの特徴的な部分を対応させた上でこれらの平均を
とり、標準パターンとして登録し、該標準パターンを用
いて入力音声の未知パターンに対する音声認識を行なう
ようになっていることを特徴としている。

【００１４】また、孤立発声された単語の音声の特徴パ
ターンを標準パターンとして登録する際に、該音声の始
端，終端のいずれか一方、または両方に対応する特徴パ
ターンの部分に音声の大きさが小さい旨の符号を付して
標準パターンとして登録し、該標準パターンを用いて入
力音声の未知パターンに対する音声認識を行なうように
なっていることを特徴としている。

【００１５】また、同じ言葉を複数回発声させてそれぞ
れの特徴パターンを形成し、各特徴パターン上の音声の
大きさの特徴的な部分を対応させた上でこれらの平均を
とるとともに、音声の始端，終端のいずれか一方にも、
または両方にも音声の大きさが小さい旨の符号を付して
標準パターンとして登録し、該標準パターンを用いて入
力音声の未知パターンに対する音声認識を行なうように
なっていることを特徴としている。

【００１６】さらに、音声の大きさを計測し、計測した
音声の大きさの特徴的な部分を符号化して特徴パタ−ン
の一部，または全部に書き込み新たな特徴パタ−ンに変
換し、これを標準パタ−ンとして予め登録しておき、未
知の音声が入力された時には該未知の音声については同
様の新たな特徴パタ−ンに変換するとともに、予め登録
した標準パタ−ンの１つ以上を連結して、音の大きさの
特徴的な部分を一致させるような時間的対応を付けて比
較するようになっていることを特徴としている。

【００１７】また、予め登録した標準パタ−ンの１つ以
上を連結して、音の大きさの特徴的な部分を一致させる
ように線形伸縮によって時間的対応を付けて比較するよ
うになっていることを特徴としている。

【００１８】また、決められた条件を満たす単語の標準
パタ−ン間で連結を行なう場合には、標準パタ−ンの先
端または後端に付されている特徴的な部分を表わす符号
を取り消した後に連結を行ない比較するようになってい
ることを特徴としている。

【００１９】また、計測した音声の大きさの特徴的な部
分を符号化して特徴パタ−ンの一部，または全部に書き
込み新たな特徴パタ−ンに変換して、これを標準パタ−
ンとし、さらに、登録すべき単語の連結の可能性を調
べ、決められた条件を満たすものについては、音声の大
きさの特徴的な部分を表わす符号を付けない標準パタ−
ンをも併せて登録しておき、未知の音声が入力された時
には該未知の音声について同様の特徴パタ−ンに変換す
るとともに、予め登録した標準パタ−ンの１つ以上を連
結して、音の大きさの特徴的な部分を一致させるような
時間的対応を付けて比較するようになっていることを特
徴としている。

【００２０】

【作用】本発明では、音声を音響分析した結果に基づき
先づ特徴パターン作成手段により特徴パターンを作成す
る。パターン生成手段では、パワー検出手段で検出した
音声の大きさの特徴的な部分を符号化して上記のように
作成された特徴パターンに書込みこれを標準パターンと
して生成する。このようにして生成された標準パターン
を用いて入力音声の未知パターンに対する音声認識を行
なう。

【００２１】上記パターン生成手段は、検出された音声
の大きさの特徴的な部分を符号化し、さらに該符号化部
分を中心として時系列方向に符号化値を徐々に減少させ
て特徴パターン作成手段からの特徴パターンに書込みこ
れを標準パターンとして生成しても良い。

【００２２】また、本発明では、同じ言葉を複数回発声
させてそれぞれの特徴パターンを形成し、各特徴パター
ン上の音声の大きさの特徴的な部分を対応させた上でこ
れらの平均をとり、標準パターンとして登録し、該標準
パターンを用いて入力音声の未知パターンに対する音声
認識を行なう。

【００２３】あるいは、孤立発声された単語の音声の特
徴パターンを標準パターンとして登録する際に、該音声
の始端，終端のいずれか一方、または両方に対応する特
徴パターンの部分に音声の大きさが小さい旨の符号を付
して標準パターンとして登録し、該標準パターンを用い
て入力音声の未知パターンに対する音声認識を行なう。

【００２４】さらには、同じ言葉を複数回発声させてそ
れぞれの特徴パターンを形成し、各特徴パターン上の音
声の大きさの特徴的な部分を対応させた上でこれらの平
均をとるとともに、音声の始端，終端のいずれか一方に
も、または両方にも音声の大きさが小さい旨の符号を付
して標準パターンとして登録し、該標準パターンを用い
て入力音声の未知パターンに対する音声認識を行なう。

【００２５】

【実施例】以下、本発明の実施例を図面に基づいて説明
する。図１は本発明に係る音声認識装置の第１の実施例
のブロック図である。図１の音声認識装置は、単語音声
の標準パターンが記憶される辞書２と、音声を音響分析
するための音響分析部４と、音声の大きさ，すなわちパ
ワーを検出するパワー検出部５と、音声のパワーに対す
る閾値が格納される閾値格納部６と、検出されたパワー
を閾値格納部６に格納された閾値ＴＨと比較し音声の大
きさの特徴的な部分を検出する比較部７と、音響分析部
４で分析された結果が入力し、この分析結果のうちで音
声に係る部分だけを取り出し、これを特徴パターンとし
て出力する音声区間検出部８と、比較部７において検出
された音声の特徴的な部分を符号化し、これを音声区間
検出部８からの特徴パターンに書込み新たな特徴パター
ンを未知パターン照合用の標準パターンとして生成し辞
書２に登録するパターン生成部９とを有している。

【００２６】音響分析部４は、例えば、通常８〜３２個
程度のバンドパスフィルタを用いたフィルタバンクによ
り構成され、フィルタバンクとして構成するときには、
音声を周波数分析して分析結果を出力するようになって
いる。

【００２７】例えば、音響分析部４として、１６個のバ
ンドパスフィルタを用いる場合には、１６個の周波数帯
域での周波数分析がなされ、このときには、パワー検出
部５は、周波数分析された１６個の成分を例えば加算す
ることにより、音声全体のパワーの検出を行なうことが
できる。あるいは、パワー検出部５は、全域通過のフィ
ルタの出力を検波するように構成したりすることもでき
る。

【００２８】また、この第１の実施例において、比較部
７は、音声の大きさの特徴的な部分として、通常のレベ
ルよりも大きな部分，例えば音声のパワーのピークの検
出を行なうようになっており、具体的には、現時点での
パワーを閾値格納部６に格納されている閾値ＴＨと比較
することにより音声のパワーのピークを検出するように
なっている。

【００２９】このため、閾値格納部６には、比較部７が
ピークを検出するまでの間は、ある時点でのパワーとそ
れより１つ前の時点でのパワーとを比べたとき、いずれ
か大きい方のパワーが閾値ＴＨとして更新格納され、比
較部７がピークを検出した後においては、ある時点での
パワーとそれより１つ前の時点でのパワーとを比べたと
き、いずれか小さい方のパワーが閾値ＴＨとして更新格
納されるようになっている。なお、閾値ＴＨの初期値は
例えば“０”となっている。

【００３０】すなわち、ピークが検出されるまでの間
は、閾値ＴＨは最終的にはパワーの最大値となり、従っ
て、比較部７としては、例えば、現時点でのパワーが閾
値格納部６に格納されている閾値ＴＨよりも低くなった
ことを検出することによってパワーのピークを検出し、
比較結果としてピーク検出信号ＰＫを出力するように構
成されている。

【００３１】また、パターン生成部９は、比較部７から
ピーク検出信号ＰＫが送られたときに、音声区間検出部
８からの特徴パターンに対して、ピークに該当する部分
へその旨の符号を書込むことによって新しい特徴パター
ンを標準パターンとして生成するようになっている。

【００３２】次にこのような構成における音声認識装置
の処理動作について図２のフローチャートを用いて説明
する。標準パターンを作成しこれを辞書２に登録するた
めに、音声を入力すると、音響分析部４では、入力され
た音声を音響分析し、分析結果をパワー検出部５並びに
音声区間検出部８に与える（ステップＳ１）。

【００３３】音響分析された結果に基づき、パワー検出
部５では、入力された音声のパワーを測定する。また、
音声区間検出部８では、パワー検出部５で検出されたパ
ワーを参照して分析結果から音声の部分のみを取出し、
横軸に例えば周波数，縦軸に時間，すなわちフレーム系
列をとった特徴パターンを作成しこれを出力する（ステ
ップＳ２）。

【００３４】次いで、比較部７では、パワー検出部５か
らのパワーを閾値格納部６に格納されている閾値ＴＨと
比較することで、パワーの特徴的な部分，すなわちこの
第１の実施例ではパワーのピークを検出し、ピークを検
出したときにはピーク検出信号ＰＫをパターン生成部９
に与える。

【００３５】パターン生成部９では、比較部７からピー
ク検出信号ＰＫが送られたか否かにより、音声の特徴的
部分であるか否かを判断する（ステップＳ３）。

【００３６】ピーク検出信号ＰＫが送られて音声の特徴
的部分であると判断されたときには、パターン生成部９
は、音声区間検出部８からの特徴パターンに対して、こ
の特徴的部分（ピーク）に相当する部分にその旨の符号
を書込み符号化する（ステップＳ４）。

【００３７】図３（ａ），（ｂ）および図４はこの様子
を説明するための図である。いま、辞書から音声“１
（いち）”が発声されると、パワー検出部５においては
入力された音声“１（いち）”のパワーが図３（ａ）の
ように検出される。また音声区間検出部８においては図
３（ｂ）の特徴パターンが作成される。なお、図３
（ｂ）では、１６個の周波数帯域で周波数分析がなされ
た結果が示されており、各周波数成分の大きさは１６数
進数で表わされている。

【００３８】入力された音声のパワーが図３（ａ）のよ
うに検出されると、パワー検出部５ではこの音声のパワ
ーのピークを検出し、このときに図示のようにピーク検
出信号ＰＫをパターン生成部９に出力する。これによ
り、パターン生成部９は、図４に示すように、図３
（ｂ）の特徴パターンのうちで、ピークに対応するフレ
ームの部分（全帯域）を例えば“ｆｆ”で符号化し変換
する。なお、“ｆｆ”で符号化する場合には、このフレ
ーム部分の成分に最大の大きさをもたせることができ
る。

【００３９】パターン生成部９は、図４に示すような新
しい特徴パターンを生成すると、これを入力された音声
の標準パターンとして辞書２に登録する（ステップＳ
５）。各音声についてこのような標準パターンの登録を
行なった後、実際の認識処理がなされる。すなわち認識
処理では、入力音声の未知パターンと辞書２内に上記の
ように登録されている標準パターンとのパターンマッチ
ングを行なう。このパターンマッチングには、様々の仕
方があるが、いま例えば、未知パターンｂと標準パター
ンａとの間の距離Ｄとして、良く知られた次式を用いた
とする。

【００４０】

【数１】

【００４１】ここで、ａ_ijは標準パターンａの時刻ｊの
ｉ番目の周波数成分，ｂ_ijは未知パターンｂ_ijの時刻ｊ
のｉ番目の周波数成分である。

【００４２】この場合のパターンマッチングでは、距離
Ｄが小さくなるように非線形伸縮を行なって未知パター
ンの時間軸と標準パターンの時間軸とを整合させ、しか
る後、未知パターンｂと標準パターンａとの照合を行な
う。このような時間軸方向の正規化処理を行なった後の
照合処理において、標準パターンのピーク，すなわち他
の部分に比べて極めて大きな値“ｆｆ”をもつように符
号化された部分と未知パターンのピークとが時間軸上で
ほぼ同じ位置にあれば、距離Ｄは小さくなって、未知パ
ターンはその標準パターンと一致すると判断される。こ
れに対し、ピーク同士が時間軸上で異なる位置にあれ
ば、距離Ｄは大きくなって、未知パターンはその標準パ
ターンと一致しないと判断される。

【００４３】特に、標準パターンのピークに相当する部
分に極めて大きな値“ｆｆ”を符号として割り当ててい
るので、距離Ｄに与えるこのピーク部分の影響は他の部
分に比べて著しく大きく、従って、距離Ｄの感度を高め
ることができる。この結果、通常の照合処理によって
も、照合精度を向上させることができる。さらには、単
語音声認識処理において辞書２内に単語単位の標準パタ
ーンのみが登録されている状態で、連続的に発声された
単語を認識させようとする場合にも、辞書内の単語単位
の各標準パターンがピーク部分に大きな値“ｆｆ”をも
つ上述したようなものとなっているときには、これらの
単語単位の各標準パターンをつなぎ合わせて認識処理を
行なわせることにより、主にピーク同士の照合がなさ
れ、照合精度を向上させることができて、認識率を高め
ることが可能となる。

【００４４】上記例では、パターン生成部９は、図４に
示したように、特徴パターンの特徴的部分，すなわちピ
ークに対応するフレームの部分のみに値“ｆｆ”を符号
として割り当てているが、さらにピークに対応するフレ
ームの前後のフレームの部分にも値“ｆｆ”の半分の値
“７ｆ”を符号として割り当てて、図４のかわりに図５
のような新しい特徴パターンを標準パターンとして生成
するようになっていても良い。この場合にはさらに、ピ
ークとして検出されたフレームの部分の符号値“ｆｆ”
に比べて、その周囲の符号値が値“ｆｆ”の半分以下の
値に必ず小さくなるので、照合時にピーク値“ｆｆ”を
書き込んだ部分の伸縮時のずれによってマッチング距離
Ｄが大きくなるのを避けることができる。

【００４５】なお、前後のフレームに割り当てる符号値
としては“７ｆ”に限らず例えば“４ｆ”等の任意の値
で良い。また、前後のフレームのみならず、ピークのフ
レームを中心としてこれから遠ざかるに従って値が徐々
に減少するような符号をより多くのフレームに対して割
り当てることもできる。

【００４６】図６は本発明に係る音声認識装置の第２の
実施例のブロック図である。なお図６において図１と同
様の箇所には同じ符号を付している。この第２の実施例
では、上記第１の実施例と反対に、音声のパワーの谷の
部分を検出し、この谷の部分に相当する特徴パターンの
部分を符号化し新しい特徴パターンとして（標準パター
ンとして）生成するようになっており、具体的には、比
較部１７は、現時点でのパワーを閾値格納部１６に格納
されている閾値ＴＨと比較することにより音声のパワー
の谷を検出するようになっている。このため、閾値格納
部１６には、比較部１７が谷を検出するまでの間はある
時点でのパワーとそれより１つ前の時点でのパワーとを
比べたとき、いずれか小さい方のパワーが閾値ＴＨとし
て更新格納され、比較部１７が谷を検出した後において
は、ある時点でのパワーとそれより１つ前の時点でのパ
ワーとを比べたとき、いずれか大きい方のパワーが閾値
ＴＨとして更新格納されるようになっている。

【００４７】すなわち、谷が検出されるまでの間は、閾
値ＴＨは最終的にはパワーの最小値となり、従って、比
較部１７としては、例えば現時点でのパワーが閾値格納
部１６に格納されている閾値ＴＨよりも大きくなったこ
とを検出することによってパワーの谷を検出し、比較結
果として検出信号ＰＫを出力するように構成されてい
る。

【００４８】閾値格納部１６への閾値ＴＨの設定の仕方
は、上記以外にも可能であって、例えば、音声区間検出
部８で音声の入力がないときのレベルを覚えておき、音
声入力の最中にこれに近い大きさにパワーが低下したと
きにこれを無音区間として検出し、この無音区間におけ
るパワーを閾値格納部１６に閾値ＴＨとして記憶するこ
ともできる。この場合には、比較部１７は、音声のパワ
ーが無音区間におけるパワーに対応した閾値よりも低下
したときにこれを谷として検出するようになっており、
谷として検出される箇所は１つに限らず、連続した複数
の箇所になることもある。

【００４９】このようにして比較部１７から谷の検出信
号ＰＫが谷の長さ分だけ継続して送られると、パターン
生成部１９では、音声区間検出部８からの特徴パターン
に対して、谷に相当する部分にその旨の符号を書込むこ
とによって新しい特徴パターンを標準パターンとして生
成するようになっている。

【００５０】このため、パターン生成部１９には、谷を
表わすパターンを保持するレジスタ２１と、比較部１７
から谷の検出信号ＰＫが送られたときに、レジスタ２１
に保持されている谷を表わすパターンの時間長を谷の長
さに伸縮する伸縮部２２と、伸縮されたパターンを音声
区間検出部８からの特徴パターンに重ね合わせる重ね合
せ部２３とが設けられている。

【００５１】図７はレジスタ２１に保持されている谷を
表わす符号化パターンの一例を示す図であり、この例で
は、谷を表わす符号化パターンは谷の中心が値“ｆｆ”
で、その前後が値“７ｆ”で表現されており、パターン
の時間長Ｌ₂は“５”となっている。図８（ａ），
（ｂ）および図９はレジスタ２１に図７に示すようなパ
ターンが保持されている状態のときに、谷を検出して新
しい特徴パターンとしての標準パターンを生成するまで
の様子を説明するための図である。

【００５２】いま、パワー検出部５において音声のパワ
ーが図３（ａ）に示したと同様に図８（ａ）のように検
出され、音声区間検出部８において図８（ｂ）のように
して特徴パターンが作成される場合、音声区間検出部８
は、部分ＮＰを無音区間として検出し、比較部１７は、
この無音区間ＮＰのパワーにより定められた閾値よりも
低いパワーの部分をＰＫで示すように谷として検出す
る。図８（ａ），（ｂ）の例では谷の部分は、５個の連
続箇所（５フレーム分）として検出され、谷の長さＬ₁
は“５”となる。比較部１７から谷の検出信号ＰＫが送
られると、パターン生成部１９の伸縮部２２では、図７
に示すパターンの時間長Ｌ₂をこの谷の長さＬ₁に伸縮す
る。

【００５３】いまの場合、パターンの時間長Ｌ₂は谷の
長さＬ₁と一致するので、伸縮部２２は、図７に示す符
号化パターンを伸縮せず、そのままの形で重ね合せ部２
３に送る。

【００５４】重ね合せ部２３では、図７の符号化パター
ンを図８（ｂ）に示す特徴パターンに重ね合せ、図９に
示すような新たな特徴パターンを標準パターンとして生
成する。図９からわかるように、この新たな特徴パター
ンにおいては、谷に対応するフレームの部分は、その全
帯域が図５と同様に符号化されており、この新たな特徴
パターンを辞書内に標準パターンとして登録した後、入
力音声の未知パターンとのマッチングを例えば前述の数
１に基づいて行なわせると、ピーク検出時の照合処理と
同様の原理によって、未知パターンと標準パターンとの
間で主に谷同士の照合がなされるので、この場合にもピ
ーク検出時と同様、照合精度を向上させることができ、
認識率を高めることが可能となる。

【００５５】なお、レジスタ２１には、谷を表わすパタ
ーンとして、図７のかわりに例えば図１０のようなパタ
ーンが保持されていても良い。図１０に示すパターン
は、５種類の符号値をもち、図１０に示すパターンがレ
ジスタ２１に保持されているときには、新しい特徴パタ
ーンには、谷の中心フレームを中心としてこれから遠ざ
かるに従って値が徐々に減少するような符号値が書込ま
れる。このように谷を表わす符号化パターンとしては必
要に応じ任意のものを用いることができる。

【００５６】さらに、音声のパワーが図８（ａ）のよう
に検出され、音声区間検出部８において特徴パターンが
図１１のように２値化された状態で作成される場合に
は、谷を表わす符号化パターンとして図１２に示すよう
な２値化パターンをレジスタ２１に保持させておくこと
もできる。このときには、パターン生成部１９では、谷
に対応するフレームの部分の全帯域が全て“１”となる
図１３に示すような新しい特徴パターンを標準パターン
として生成することができる。

【００５７】このように第２の実施例では、音声の大き
さの特徴的な部分としてパワーのピークのかわりに谷を
検出し、この谷の部分に相当する特徴パターンの部分を
符号化し標準パターンとして生成して辞書２に登録し、
これに基づいて入力音声の未知パターンに対する音声認
識処理を行なわせるようにしており、この場合もパワー
のピークを検出する場合と同様にして、照合精度を向上
させ、認識率を高めることが可能となる。

【００５８】なお、上述した第１，第２の実施例では、
パワーのピークだけ、またはパワーの谷だけを用いた
が、これらの両方を併用しても良い。すなわち、パワー
のピークと谷との両方に相当する特徴パターンの部分を
上述した方法によって符号化して新しい特徴パターンを
標準パターンとして生成し、辞書２に登録すれば良い。
この場合には、照合精度をより一層向上させることがで
きる。但し、この際に、ピークと谷とに相当する部分に
同じ値を割り当てて符号化すると、マッチング時に例え
ば未知パターンのピークと標準パターンの谷とが誤って
対応付けられてしまうことがある。従って、ピークと谷
とに相当する部分にそれぞれ異なる値を割り当てて互い
に区別できるように符号化するのが良い。例えば、特徴
パターンが２値で生成されるとしたときに、ピークに相
当する部分には図１４（ａ）に示すような符号化パター
ンを割り当て、谷に相当する部分には図１４（ｂ）に示
すような符号化パターンを割り当てて両者を区別するこ
とができる。このような符号化をしておくと、未知パタ
ーンのピーク（または谷）と標準パターンのピーク（ま
たは谷）とを正しく対応させたとき数１に従って未知パ
ターンと標準パターンと距離Ｄは最小になり、未知パタ
ーンのピーク（または谷）と標準パターンの谷（または
ピーク）とを対応させたときには、これらの間の距離Ｄ
は最大となるので、これにより、ピークと谷とが誤って
対応付けされる恐れをなくすことができる。ピーク，谷
に相当する部分に割り当てられる符号化パターンとして
は図１４（ａ），（ｂ）の例に限らず、互いの距離が大
きくなるような２組のものであれば良い。

【００５９】また、上述したような各実施例の方式は、
例えば文献「数理科学１９８７年２月Ｎｏ．２８４，第
６３頁，サイエンス社」に示されているような特徴パタ
ーンの作成方式にも適用可能である。すなわち、上記文
献には、１つのカテゴリに対して複数回発声させてそれ
ぞれの特徴パターンを得て、これらの加算平均をとって
標準パターンを作成する方式が示されており、これに本
発明を適用し、同じ言葉に対して複数回発声して得られ
た各特徴パターン上の音声の大きさの特徴的な部分，例
えばピークや谷を対応させた上でこれらの加算平均をと
り、これを標準パターンとして作成することも可能であ
る。この場合、加算の仕方も特別な方法を必要とせず、
誤差が最小となるように互いに対応付けて加え合せれば
良い。但し、単語が連結された発声では、前述したよう
に、連結した単語が１つの単語として誤まって対応付け
される恐れがある。この対策としては、連結した単語の
発声では、１つ１つの単語のつなぎ目でパワーが落ちる
ことがあることに着目し、孤立に発声された単語の音声
の特徴パターンを標準パターンとして登録する際に、そ
の音声のパターンの始端または終端のいずか一方にも、
あるいは両方にも、音声のパワーが小さい旨の符号を付
けるようにすることができる。これにより、連結されて
発声された音声のつなぎ目に生じるパワーの谷と、孤立
発声された単語の標準パターンの始端，終端とを一致さ
せることができて、連結した単語の発声においても各単
語を正しく照合させることができる。

【００６０】図１５はこのような方式を採用した音声認
識装置の構成例を示す図である。図１５の構成例は、図
６の構成例と同じ方式のものとなっているが、図６の機
能に加えてさらに、図１６（ａ），（ｂ）に示すような
符号化パターンをレジスタ３１内に保持させ、伸縮部３
２では音声区間検出部８からの区間開始信号が受付けら
れたときに図１６（ａ）の符号化パターンを選択して重
ね合せ部３３に送る一方、区間終了信号が受付けられた
ときに図１６（ｂ）の符号化パターンを選択して重ね合
せ部３３に送るようになっている。これにより、図１５
のパターン生成部４０では、孤立発声された単語の音声
の特徴パターンの始端および終端にもそれぞれ図１６
（ａ），（ｂ）に示すような谷を表わす符号化パターン
を付加し、これを標準パターンとして辞書内に予め登録
させることが可能である。この結果、マッチングによる
照合処理において、連結されて発声された音声の単語の
つなぎ目に生じるパワーの谷と、孤立発声された単語の
標準パターンの始端，終端とを一致させることができ、
認識精度を向上させることができる。

【００６１】なお、特徴パターンが２値のパターンとし
て作成される場合には、図１６（ａ），（ｂ）の符号化
パターンのかわりに、図１７（ａ），（ｂ）に示すよう
な２値の符号化パターンがレジスタ３１内に保持される
ようになっていても良い。

【００６２】以上は音声を特徴パターンに変換した後の
照合処理について述べたが、１フレームごとに記号化し
て照合するような方式に対しても本発明を適用すること
ができる。

【００６３】図１８は、本発明に係る音声認識装置の第
３の実施例のブロック図である。なお図１８において、
パタ−ン生成部５０の前段部分としては、音声区間検出
部５１，比較部５２だけが示されており、音響分析部，
パワ−検出部，閾値格納部については、例えば図１ある
いは図６の構成と同様な構成のものにすることができる
とし、簡単のため、図示を省略している。また、パタ−
ン生成部５０，音声区間検出部５１，比較部５２は、図
１あるいは図６のパタ−ン生成部，音声区間検出部５
１，比較部５２と同様な機能を有しており、パタ−ン生
成部５０は、検出された音声の大きさの特徴的な部分を
符号化して特徴パタ−ンの一部または全部に書き込むよ
うになっている。

【００６４】ところで、この第３の実施例の音声認識装
置では、パタ−ン生成部５０で生成された特徴パタ−ン
を標準パタ−ンとして辞書６０に登録するか、あるいは
生成された特徴パタ−ンを音声認識されるべき入力音声
の未知パタ−ンとして使用するかを切替るための切替部
５３と，標準パタ−ンを辞書６０に登録したり辞書６０
から読み出したりするための辞書レジスタ５４と、１つ
以上の標準パタ−ンをつなぎ合わせる連結部５５と、連
結部５５において連結された標準パタ−ンと入力音声の
未知パタ−ンとを照合する照合部５６とがさらに設けら
れている。

【００６５】このような構成の音声認識装置の動作を図
１９のフロ−チャ−トを用いて説明する。なお、この処
理例では、パタ−ン生成部５０は、図１５のパタ−ン生
成部４０に対応した構成のものであるとし、音声の大き
さの特徴的な部分として、パワ−の谷の部分を符号化し
て特徴パタ−ンに書き込むようになっているとする。先
ず、音声が入力すると（ステップＳ１１）、これを周波
数変換し（ステップＳ１２）、パワ−の測定を行ない
（ステップＳ１３）、パワ−の谷を抽出する（ステップ
Ｓ１４）。次いで、抽出された谷の部分を符号化して、
特徴パタ−ンに書き込み、新たな特徴パタ−ンを生成す
る（ステップＳ１５）。これにより前述したように、図
１１のような特徴パタ−ンを図１３のような特徴パタ−
ンにすることができる。

【００６６】しかる後、パタ−ン生成部５０で上記のよ
うに生成された新たな特徴パタ−ンを標準パタ−ンとし
て辞書６０に登録するのか、あるいは、これを音声認識
対象としての入力音声の未知のパタ−ンとして使用する
のかが切替部５３の状態によって判断される（ステップ
Ｓ１６）。いま、この新たな特徴パタ−ンを標準パタ−
ンとして辞書６０に登録させるよう利用者によって切替
部５３が切替えられているときには、新たな特徴パタ−
ンは、辞書レジスタ５４を介し、辞書６０（例えばフロ
ッピィディスク）に標準パタ−ンとして登録される（ス
テップＳ１７）。

【００６７】これに対し、未知の音声で認識させるよう
切替部５３が切替られているときには、新たな特徴パタ
−ンは照合部５６に送られ、そこで標準パタ−ンと照合
されるが、これに先立って、予め辞書６０に登録されて
いる標準パタ−ンを連結部５５において所定の仕方でつ
なぎ合わせる（ステップＳ１８）。このようにして１つ
以上の標準パタ−ンを連結し、そのうち、新たな特徴パ
タ−ンと特徴的な部分（いまの場合、谷の部分）の数
（あるいはさらに位置）が一致するものを照合部５６に
送る（ステップＳ１９）。これにより、照合部５６で
は、新たな特徴パタ−ンをステップＳ１９で選別された
連結標準パタ−ンと照合し（ステップＳ２０）、最大類
似度を与える連結標準パタ−ンを選出して（ステップＳ
２１）、これを音声認識結果として出力する（ステップ
Ｓ２２）。

【００６８】図２０（ａ），（ｂ），（ｃ）は、上記連
結，照合処理の具体例を示す図である。いま、話者が単
語「１」と単語「９」とを「１９（ｉｃｉｋｊｕ）」の
ように連続的に発声し、これを音声認識させようとする
場合、連続的に発声された単語「１９（ｉｃｉｋｊ
ｕ）」は、特徴的な部分（すなわち谷の部分）に所定の
符号が付されて、図２０（ａ）のような特徴パタ−ン，
すなわち未知パタ−ンとして照合部５６に送られる。こ
の際、辞書６０に登録されてる標準パタ−ンは、
「１」，「２」，・・・，「９」等の個々に孤立した１つ
の単語の音声のパタ−ンであり、単語の音声の開始部と
終了部でパワ−が小さくなることから、この部分にも特
徴的な部分を示す符号が付されている。連結部５５で
は、辞書６０に登録されている個々の単語の標準パタ−
ンを種々組み合わせてつなぎ合わせる。例えば、「１」
の標準パタ−ンと「２」の標準パタ−ンとをつなぎ合わ
せ、また「１」の標準パタ−ンと「５」の標準パタ−ン
をつなぎ合わせるというように、種々の連結標準パタ−
ンを作成する。なお、つなぎ合わせを行なわない個々の
単語の標準パタ−ン自体もここでは連結標準パタ−ンと
呼ぶことにする。図２０（ｂ）は、「１（ｉｃｉ）」の
標準パタ−ンと「９（ｋｊｕ）」の標準パタ−ンとの一
例を示すものであり、これらを組合せつなぎ合わせる
と、図２０（ｃ）に示すような連結標準パタ−ンとな
る。なお、この連結時において、「１（ｉｃｉ）」の終
了部と「９（ｋｊｕ）」の開始部には、特徴的な部分を
示す符号が付されているので、これらを連結した結果、
これらの間には特徴的な部分を示す符号が付される。こ
のようにつなぎ合わせを行なわなかったものをも含めて
種々の連結標準パタ−ンを作成した後、連結部５５は、
これらの連結標準パタ−ンのうちで、図２０（ａ）の未
知パタ−ン上の符号の数（図２０（ａ）の例では４個）
および符号の位置が一致する連結標準パタ−ンを選別す
る。図２０（ｃ）に示す連結標準パタ−ンは、図２０
（ａ）の未知パタ−ンと同じ数の符号を有し、また符号
が同じ位置であるので、図２０（ｃ）の連結標準パタ−
ンも１つの候補として選別されて、照合部５６に送られ
る。照合部５６では、連結部５５から送られた連結標準
パタ−ンの各候補と図２０（ａ）に示す未知パタ−ンと
をマッチングし、最大類似度を与える候補を１つ選択す
る。例えば、図２０（ｃ）に示す連結標準パタ−ンが最
大類似度を与える場合には、この連結標準パタ−ンが最
終的に選択され、未知音声の認識結果として、「１９」
を得ることができる。

【００６９】なお、上記の照合処理は、具体的には、入
力音声の未知パタ−ンとしての新たな特徴パタ−ンと連
結標準パタ−ンとのそれぞれにおいて、ある１つの谷の
部分から次の谷の部分までを切って取り出し、これらを
互いに照合するようになっていても良いし、ＤＰマッチ
ングで計算量が多いときには、この部分を線形伸縮で置
き換えても良い。また、これら以外のマッチング手法に
よって照合がなされるようになっていても良い。

【００７０】このように、第３の実施例においては、音
声の大きさの特徴的な部分を符号化して、その音声の特
徴パタ−ンの一部，または全部に書き込んで予め辞書６
０に登録しておき、未知の音声が入力されたときには、
この未知音声についても同様の特徴パタ−ンに変換する
とともに、予め辞書６０に登録されている標準パタ−ン
の１つ以上を連結し、未知音声の特徴パタ−ンと連結標
準パタ−ンとの特徴的な部分を一致させるような時間的
対応を付けてこれらを比較照合するようにしており、こ
れにより、個々の単語の標準パタ−ンが登録されるよう
辞書６０が構成されている場合であっても、すなわち辞
書６０を非常に大きな容量のものにせずとも、簡単な処
理の仕方で、連続発声された未知音声をも正しく認識さ
せることができる。

【００７１】ところで、図２０（ａ）に示した例では、
連続的に発声した音声が「１９（ｉｃｉｋｊｕ）」であ
る場合でも次の単語「９（ｋｊｕ）」の先頭が“ｋ”で
始まる子音であることから、「１（ｉｃｉ）」と「９
（ｋｊｕ）」との間には、パワ−の小さくなる部分，す
なわち特徴的な部分（符号）が存在し、従って、これら
の間には特徴的な部分を示す符号が書き込まれるので、
これにより、「１（ｉｃｉ）」と「９（ｋｊｕ）」との
連結標準パタ−ンとの対応がとることができた。

【００７２】しかしながら、次の単語の始まりが母音で
あるような未知の音声の場合、例えば、連続的に発声し
た音声が「８１（ｈａｃｉｉｔｉ）」のような場合は、
この特徴パタ−ンは、図２１（ａ）のようになる。すな
わち、「８」と「１」とのつなぎ目がいずれも母音
“ｉ”であることから、この間にはパワ−の小さくなる
特徴的な部分が発声せず、従って符号が書き込まれな
い。一方、連結部５５によって生成される「８（ｈａｃ
ｉ）」と「１（ｉｃｉ）」との連結標準パタ−ンは、図
２１（ｂ）のように単語「８（ｈａｃｉ）」の終了部に
符号が付され、単語「１（ｉｃｉ）」の開始部に符号が
付されているので、図２１（ｃ）に示すようにこれらの
間には符号が付されたものとなる。従って、このような
場合には、両者の間に良好な対応付けを行なうことがで
きない。

【００７３】図２２は本発明に係る音声認識装置の第４
の実施例のブロック図であり、この第４の実施例では、
上述したような場合にも対応できるような構成となって
いる。すなわち、図２２の音声認識装置では、１つの単
語の音声の音素ストリング（つづり）を格納するストリ
ングレジスタ７０が設けられ、パタ−ン作成部６０は、
さらに、１つの単語の音声に対して新たに作成した特徴
パタ−ンを標準パタ−ンとして辞書６０に登録するに際
して、この単語の連結の可能性を調べ、この単語が決め
られた条件を満たすものか否か，例えば単語の先端また
は後端が母音であるか否かをストリングレジスタ７０か
ら音素ストリングを取り出して調べ、所定の条件を満た
す場合には、新たに作成した特徴パタ−ンをバッファメ
モリ７１に格納するとともに、新たに作成した特徴パタ
−ンの所定箇所に付されている符号を取り除いて辞書レ
ジスタ５４に格納するようになっている。従って、この
第４の実施例では、先端または後端が母音の単語につい
ては、第３の実施例におけると同様の標準パタ−ンとと
もに、開始部，終了部の符号を付けない変換標準パタ−
ンをも辞書６０に登録させるようになっている。

【００７４】そして、連結部７２は、標準パタ−ンをつ
なぐ際に、前の単語の最後の音素が、母音で、次につな
がる単語の先頭の音素も母音であるときには、それぞれ
開始部，終了部に符号の付いていない変換標準パタ−ン
を辞書６０から読み出して、これらを連結するようにな
っている。

【００７５】このような構成では、例えば単語「８（ｈ
ａｃｉ）」と単語「１（ｉｔｉ）」とを連結する場合
に、連結部５５は、これらの単語の最後，先頭がそれぞ
れ母音“ｉ”であることから、図２３（ａ）に示すよう
にこれらの単語の変換標準パタ−ンを辞書６０から読み
出して、連結し、図２３（ｂ）に示すように、これらの
単語のつなぎ目に符号の付されていない連結特徴パタ−
ンを生成することができる。図２３（ｂ）を図２１
（ａ）と比べればわかるように、先端または後端が母音
である場合にも、この第４の実施例によれば、連結特徴
パタ−ンと未知音声パタ−ンとの対応を良好にとること
ができる。また、先端または後端が母音でない場合に
は、開始部，終了部に符号の付いている標準パタ−ンを
辞書６０から読み出して連結し、第３の実施例で説明し
たような単語のつなぎ目に符号の付されている連結特徴
パタ−ンを生成することができる。

【００７６】このように第４の実施例では、音声の大き
さの特徴的な部分を符号化してその音声の特徴パタ−ン
の一部，または全部に書き込み、さらには、登録すべき
単語の連結の可能性を調べ、決められた条件を満たすも
のについては、音声の大きさの特徴的な部分を表わす符
号を付けないパタ−ンも併せて登録し、未知の音声が入
力された時に同様の特徴パタ−ンに変換するとともに、
予め登録した標準パタ−ンの１つ以上を連結して、未知
音声特徴パタ−ンと連結標準パタ−ンとの特徴的な部分
を一致させるような時間的対応を付けてこれらを比較照
合するようにしているので、これにより、連続発声され
た未知音声がどのような種類のものであっても、これに
良好に対応した連結標準パタ−ンによって、未知音声を
正しく認識させることができる。

【００７７】

【発明の効果】以上に説明したように本発明によれば、
音声の大きさの特徴的な部分を符号化し、これを特徴パ
ターンに書込み標準パターンとして生成し、この標準パ
ターンを用いて入力音声の未知パターンに対する音声認
識を行なうようになっているので、煩雑で特別な照合処
理を必要とすることなく、照合精度を向上させ、認識率
を高めることができる。

【００７８】音声の大きさの特徴的な部分を符号化し、
さらに該符号化部分を中心として時系列方向に符号化値
を徐々に減少させて特徴パターンに書込み、標準パター
ンを作成すれば、より照合精度を向上させることができ
る。

【００７９】また、音声の大きさが所定の閾値よりも大
きいときにこの部分を符号化するようにすれば、音声の
パワーのピークを特徴的部分として割り当てることがで
きる。

【００８０】また、音声の大きさが所定の閾値よりも小
さいときにこの部分を符号化するようにすれば、音声の
パワーの谷を特徴的部分として割り当てることができ
る。

【００８１】さらに、上記両方の部分を併用することに
より、より照合精度を向上させることができる。

【００８２】この際に、両方の部分が、互いに区別可能
に符号化がなされていれば、ピークと谷とが誤まって対
応付けされる恐れをなくすことができる。

【００８３】また、同じ言葉を複数回発声させてそれぞ
れの特徴パターンを形成し、各特徴パターン上の音声の
大きさの特徴的な部分を対応させた上でこれらの平均を
とり、これを標準パターンとして登録するようにすれ
ば、極めて照合精度の良い信頼性に優れた標準パターン
を得ることができ、これを用いることによって認識精度
を著しく向上させることができる。

【００８４】また、同じ言葉を複数回発声させてそれぞ
れの特徴パターンを形成し、各特徴パターン上の音声の
大きさの特徴的な部分を対応させた上でこれらの平均を
とるとともに、音声の始端，終端のいずれか一方にも、
または両方にも音声の大きさが小さい旨の符号を付して
標準パターンとして登録すれば、単語が連続的に発声さ
れた音声であっても、各単語との照合精度を高め各単語
を精度良く認識させることができる。

【００８５】また、音声の大きさの特徴的な部分を符号
化して特徴パタ−ンの一部，または全部に書き込み新た
な特徴パタ−ンに変換し、これを標準パタ−ンとして予
め登録しておき、未知の音声が入力された時には該未知
の音声については同様の新たな特徴パタ−ンに変換する
とともに、予め登録した標準パタ−ンの１つ以上を連結
して、音の大きさの特徴的な部分を一致させるような時
間的対応を付けて比較すれば、メモリ量等を増加させず
簡単な構成により、単語が連続的に発せられた音声につ
いてもこの音声を直接かつ容易に認識させることができ
る。

【００８６】また、決められた条件を満たす単語の標準
パタ−ン間で連結を行なう場合には、標準パタ−ンの先
端または後端に付されている特徴的な部分を表わす符号
を取り消した後に連結を行ない比較するときには、例え
ば、連続的に発声された単語の最後，先頭がそれぞれ母
音である場合にも、音声を直接かつ正しく認識させるこ
とができる。

【００８７】また、音声の大きさの特徴的な部分を符号
化して特徴パタ−ンの一部，または全部に書き込み新た
な特徴パタ−ンに変換して、これを標準パタ−ンとし、
さらに、、登録すべき単語の連結の可能性を調べ、決め
られた条件を満たすものについては、音声の大きさの特
徴的な部分を表わす符号を付けない標準パタ−ンをも併
せて登録しておき、未知の音声が入力された時には該未
知の音声について同様の特徴パタ−ンに変換するととも
に、予め登録した標準パタ−ンの１つ以上を連結して、
音の大きさの特徴的な部分を一致させるような時間的対
応を付けて比較すれば、任意の単語が連続的に発声され
た場合にも、この音声を正しく認識させることができ
る。

【図面の簡単な説明】

【図１】本発明に係る音声認識装置の第１の実施例のブ
ロック図である。

【図２】図１の構成において未知パターン照合用の標準
パターンを生成する処理の流れを示すフローチャートで
ある。

【図３】（ａ），（ｂ）は図１の構成において標準パタ
ーンを生成する処理の具体例を説明するための図であ
る。

【図４】図１の構成において標準パターンを生成する処
理の具体例を説明するための図である。

【図５】図１の構成において標準パターンを生成する処
理の具体例を説明するための図である。

【図６】本発明に係る音声認識装置の第２の実施例のブ
ロック図である。

【図７】谷を表わす符号化パターンの一例を示す図であ
る。

【図８】（ａ），（ｂ）は図６の構成において標準パタ
ーンを生成する処理の具体例を説明するための図であ
る。

【図９】図６の構成において標準パターンを生成する処
理の具体例を説明するための図である。

【図１０】谷を表わす符号化パターンの一例を示す図で
ある。

【図１１】図６の構成において標準パターンを生成する
処理の具体例を説明するための図である。

【図１２】谷を表わす符号化パターンの一例を示す図で
ある。

【図１３】図６の構成において標準パターンを生成する
処理の具体例を説明するための図である。

【図１４】（ａ），（ｂ）はピーク，谷をそれぞれ表わ
す符号化パターンの一例を示す図である。

【図１５】図６の構成の音声認識装置の変形例を示す図
である。

【図１６】（ａ），（ｂ）は図１５の構成において音声
の特徴パターンの始端，終端に付される符号の符号化パ
ターンの一例を示す図である。

【図１７】（ａ），（ｂ）は図１５の構成において音声
の特徴パターンの始端，終端に付される符号の符号化パ
ターンの一例を示す図である。

【図１８】本発明に係る音声認識装置の第３の実施例の
ブロック図である。

【図１９】図１８の音声認識装置の動作を説明するため
のフロ−チャ−トである。

【図２０】（ａ），（ｂ），（ｃ）は図１８の音声認識
装置における連結，照合処理の具体例を示す図である。

【図２１】（ａ），（ｂ），（ｃ）は図１８の音声認識
装置における連結，照合処理の具体例を示す図である。

【図２２】本発明に係る音声認識装置の第４の実施例の
ブロック図である。

【図２３】（ａ），（ｂ）は図２２の音声認識装置にお
ける連結，照合処理の具体例を示す図である。

【符号の説明】

２辞書４音響分析部５パワー検出部６，１６閾値格納部７，１７比較部８音声区間検出部９，１９，４０パターン生成部２１，３１レジスタ２２，３２伸縮部２３，３３重ね合せ部５０パタ−ン生成部５１音声区間検出部５２比較部５３切替部５４辞書レジスタ５５連結部５６照合部６０辞書７０ストリングレジスタ７１バッファメモリ７２連結部

Claims

【特許請求の範囲】

【請求項１】音声を音響分析した結果に基づき特徴パ
ターンを作成する特徴パターン作成手段と、音声の大き
さを検出するパワー検出手段と、検出された音声の大き
さの特徴的な部分を符号化して前記特徴パターン作成手
段によって作成された特徴パターンに書込みこれを標準
パターンとして生成するパターン生成手段とを有し、パ
ターン生成手段によって生成された標準パターンを用い
て入力音声の未知パターンに対する音声認識を行なうよ
うになっていることを特徴とする音声認識装置。
【請求項２】請求項１記載の音声認識装置において、
前記パターン生成手段は、検出された音声の大きさの特
徴的な部分を符号化し、さらに該符号化部分を中心とし
て時系列方向に符号化値を徐々に減少させて前記特徴パ
ターン作成手段からの特徴パターンに書込みこれを標準
パターンとして生成するようになっていることを特徴と
する音声認識装置。
【請求項３】前記パターン生成手段は、検出された音
声の大きさが所定の閾値よりも大きいときにこの部分を
符号化するようになっていることを特徴とする請求項１
または２記載の音声認識装置。
【請求項４】前記パターン生成手段は、検出された音
声の大きさが所定の閾値よりも小さいときにこの部分を
符号化するようになっていることを特徴とする請求項１
または２記載の音声認識装置。
【請求項５】前記パターン生成手段は、検出された音
声の大きさが第１の閾値よりも大きい部分と、第１の閾
値に比べて低く設定されている第２の閾値よりも小さい
部分との両方の部分を符号化するようになっていること
を特徴とする請求項１または２記載の音声認識装置。
【請求項６】前記両方の部分は、互いに区別可能に符
号化がなされるようになっていることを特徴とする請求
項５記載の音声認識装置。
【請求項７】同じ言葉を複数回発声させてそれぞれの
特徴パターンを形成し、各特徴パターン上の音声の大き
さの特徴的な部分を対応させた上でこれらの平均をと
り、標準パターンとして登録し、該標準パターンを用い
て入力音声の未知パターンに対する音声認識を行なうよ
うになっていることを特徴とする音声認識装置。
【請求項８】孤立発声された単語の音声の特徴パター
ンを標準パターンとして登録する際に、該音声の始端，
終端のいずれか一方、または両方に対応する特徴パター
ンの部分に音声の大きさが小さい旨の符号を付して標準
パターンとして登録し、該標準パターンを用いて入力音
声の未知パターンに対する音声認識を行なうようになっ
ていることを特徴とする音声認識装置。
【請求項９】同じ言葉を複数回発声させてそれぞれの
特徴パターンを形成し、各特徴パターン上の音声の大き
さの特徴的な部分を対応させた上でこれらの平均をとる
とともに、音声の始端，終端のいずれか一方にも、また
は両方にも音声の大きさが小さい旨の符号を付して標準
パターンとして登録し、該標準パターンを用いて入力音
声の未知パターンに対する音声認識を行なうようになっ
ていることを特徴とする音声認識装置。
【請求項１０】音声の大きさを計測し、計測した音声
の大きさの特徴的な部分を符号化して特徴パタ−ンの一
部，または全部に書き込み新たな特徴パタ−ンに変換
し、これを標準パタ−ンとして予め登録しておき、未知
の音声が入力された時には該未知の音声については同様
の新たな特徴パタ−ンに変換するとともに、予め登録し
た標準パタ−ンの１つ以上を連結して、音の大きさの特
徴的な部分を一致させるような時間的対応を付けて比較
するようになっていることを特徴とするパタ−ン比較方
法。
【請求項１１】音声の大きさを計測し、計測した音声
の大きさの特徴的な部分を符号化して特徴パタ−ンの一
部，または全部に書き込み新たな特徴パタ−ンに変換
し、これを標準パタ−ンとして予め登録しておき、未知
の音声が入力された時には該未知の音声については同様
の新たな特徴パタ−ンに変換するとともに、予め登録し
た標準パタ−ンの１つ以上を連結して、音の大きさの特
徴的な部分を一致させるように線形伸縮によって時間的
対応を付けて比較するようになっていることを特徴とす
るパタ−ン比較方法。
【請求項１２】請求項１０または請求項１１記載のパ
タ−ン比較方法において、決められた条件を満たす単語
の標準パタ−ン間で連結を行なう場合には、標準パタ−
ンの先端または後端に付されている特徴的な部分を表わ
す符号を取り消した後に連結を行ない比較するようにな
っていることを特徴とするパタ−ン比較方法。
【請求項１３】音声の大きさを計測し、計測した音声
の大きさの特徴的な部分を符号化して該特徴パタ−ンの
一部，または全部に書き込み新たな特徴パタ−ンに変換
して、これを標準パタ−ンとし、さらに、、登録すべき
単語の連結の可能性を調べ、決められた条件を満たすも
のについては、音声の大きさの特徴的な部分を表わす符
号を付けない標準パタ−ンをも併せて登録しておき、未
知の音声が入力された時には該未知の音声について同様
の特徴パタ−ンに変換するとともに、予め登録した標準
パタ−ンの１つ以上を連結して、音の大きさの特徴的な
部分を一致させるような時間的対応を付けて比較するよ
うになっていることを特徴とするパタ−ン比較方法。