JPH0553597A - 音声認識装置およびパターン比較方法 - Google Patents

音声認識装置およびパターン比較方法

Info

Publication number
JPH0553597A
JPH0553597A JP3298344A JP29834491A JPH0553597A JP H0553597 A JPH0553597 A JP H0553597A JP 3298344 A JP3298344 A JP 3298344A JP 29834491 A JP29834491 A JP 29834491A JP H0553597 A JPH0553597 A JP H0553597A
Authority
JP
Japan
Prior art keywords
pattern
voice
characteristic
standard
unknown
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3298344A
Other languages
English (en)
Inventor
Junichiro Fujimoto
潤一郎 藤本
Yoshinaga Kato
喜永 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3298344A priority Critical patent/JPH0553597A/ja
Publication of JPH0553597A publication Critical patent/JPH0553597A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 単語音声認識処理において連続的に発声され
た単語を認識させる場合にも、煩雑で特別な処理を必要
とせずに照合精度を向上可能である。 【構成】 音響分析部4で音声を分析すると、音声区間
検出部8ではこの分析結果のうちで音声に係る部分だけ
を取り出し、これを特徴パターンとして出力する。また
パワー検出部5では音声の大きさ,すなわちパワーを検
出し、比較部7においてはパワー検出部5で検出された
音声の特徴的な部分,例えばピ−クを検知する。パター
ン生成部9では音声の特徴的な部分を符号化し、これを
音声区間検出部8からの特徴パターンに書込み、この新
たな特徴パターンを未知パターン照合用の標準パターン
として生成し辞書2に登録する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声を音響分析して照
合用の標準パターンを生成し、該標準パターンを用いて
入力音声の未知パターンに対する音声認識を行なう音声
認識装置およびパタ−ン比較方法に関する。
【0002】
【従来の技術】一般に、単語音声認識処理においては、
通常、照合用の辞書に孤立した単位の標準パターンのみ
を登録しておき、孤立発声された単語の音声のみを正し
く認識できるようになっている。例えば、“1(い
ち)”,“2(に)”,“3(さん)”と1つづつ区切
って発声された各単語は、各単語ごとの未知パターンが
辞書内の標準パターンと照合されて正しく認識される。
しかしながら、“1(いち)2(に)3(さん)”のよ
うに連続的に発声された単語に対しては、正しく認識す
ることができない場合が多い。すなわち、例えば3つの
単語が連続的に発声された場合には、各単語の境界が不
明確となって、3つの単語の各特徴パターンとしてとら
えるべきところを1つの単語の特徴パターンとしてとら
えて辞書内の1つの単語音声の標準パターンと照合して
しまうので、誤まった認識結果を得てしまうことが多
い。
【0003】このような問題を解消するため、従来、例
えば昭和61年10月に発行の著者「三木」等による文
献「音響学会講演論文集3−5−7」には、単語と単語
のつながりの部分をも照合用の標準パターンとして辞書
に登録しておくことが提案されている。
【0004】
【発明が解決しようとする課題】この従来技術によれ
ば、単語と単語のつながり部分をも標準パターンとして
辞書に登録することで、連続的に発声される単語の照合
精度を確かに向上させることができる。しかしながら、
この場合には、照合用の標準パターンの種類数が著しく
増大し、辞書が大容量化するとともに、辞書への登録作
業が煩雑になるなどの欠点があった。
【0005】また、従来では、2段DPマッチングを用
いた装置なども知られているが、これらの装置では計算
量が非常に多く、迅速に音声認識処理を行なわせること
ができないなどの欠点があった。
【0006】本発明は、例えば単語音声認識処理におい
て連続的に発声された単語を認識させようとする場合に
も、上記従来技術のような煩雑で特別な処理を必要とせ
ずに照合精度を向上させることの可能な音声認識装置お
よびパタ−ン比較方法を提供することを目的としてい
る。
【0007】
【課題を解決するための手段】上記目的を達成するため
に本発明は、音声を音響分析した結果に基づき特徴パタ
ーンを作成する特徴パターン作成手段と、音声の大きさ
を検出するパワー検出手段と、検出された音声の大きさ
の特徴的な部分を符号化して前記特徴パターン作成手段
によって作成された特徴パターンに書込みこれを標準パ
ターンとして生成するパターン生成手段とを有し、パタ
ーン生成手段によって生成された標準パターンを用いて
入力音声の未知パターンに対する音声認識を行なうよう
になっていることを特徴としている。
【0008】また、前記パターン生成手段は、検出され
た音声の大きさの特徴的な部分を符号化し、さらに該符
号化部分を中心として時系列方向に符号化値を徐々に減
少させて前記特徴パターン作成手段からの特徴パターン
に書込みこれを標準パターンとして生成するようになっ
ていることを特徴としている。
【0009】また、検出された音声の大きさが所定の閾
値よりも大きいときにこの部分を符号化するようになっ
ていることを特徴としている。
【0010】また、検出された音声の大きさが所定の閾
値よりも小さいときにこの部分を符号化するようになっ
ていることを特徴としている。
【0011】また、検出された音声の大きさが第1の閾
値よりも大きい部分と、第1の閾値に比べて小さな閾値
よりも小さい部分との両方の部分を符号化するようにな
っていることを特徴としている。
【0012】また、上記両方の部分は、互いに区別可能
に符号化がなされるようになっていることを特徴として
いる。
【0013】また、同じ言葉を複数回発声させてそれぞ
れの特徴パターンを形成し、各特徴パターン上の音声の
大きさの特徴的な部分を対応させた上でこれらの平均を
とり、標準パターンとして登録し、該標準パターンを用
いて入力音声の未知パターンに対する音声認識を行なう
ようになっていることを特徴としている。
【0014】また、孤立発声された単語の音声の特徴パ
ターンを標準パターンとして登録する際に、該音声の始
端,終端のいずれか一方、または両方に対応する特徴パ
ターンの部分に音声の大きさが小さい旨の符号を付して
標準パターンとして登録し、該標準パターンを用いて入
力音声の未知パターンに対する音声認識を行なうように
なっていることを特徴としている。
【0015】また、同じ言葉を複数回発声させてそれぞ
れの特徴パターンを形成し、各特徴パターン上の音声の
大きさの特徴的な部分を対応させた上でこれらの平均を
とるとともに、音声の始端,終端のいずれか一方にも、
または両方にも音声の大きさが小さい旨の符号を付して
標準パターンとして登録し、該標準パターンを用いて入
力音声の未知パターンに対する音声認識を行なうように
なっていることを特徴としている。
【0016】さらに、音声の大きさを計測し、計測した
音声の大きさの特徴的な部分を符号化して特徴パタ−ン
の一部,または全部に書き込み新たな特徴パタ−ンに変
換し、これを標準パタ−ンとして予め登録しておき、未
知の音声が入力された時には該未知の音声については同
様の新たな特徴パタ−ンに変換するとともに、予め登録
した標準パタ−ンの1つ以上を連結して、音の大きさの
特徴的な部分を一致させるような時間的対応を付けて比
較するようになっていることを特徴としている。
【0017】また、予め登録した標準パタ−ンの1つ以
上を連結して、音の大きさの特徴的な部分を一致させる
ように線形伸縮によって時間的対応を付けて比較するよ
うになっていることを特徴としている。
【0018】また、決められた条件を満たす単語の標準
パタ−ン間で連結を行なう場合には、標準パタ−ンの先
端または後端に付されている特徴的な部分を表わす符号
を取り消した後に連結を行ない比較するようになってい
ることを特徴としている。
【0019】また、計測した音声の大きさの特徴的な部
分を符号化して特徴パタ−ンの一部,または全部に書き
込み新たな特徴パタ−ンに変換して、これを標準パタ−
ンとし、さらに、登録すべき単語の連結の可能性を調
べ、決められた条件を満たすものについては、音声の大
きさの特徴的な部分を表わす符号を付けない標準パタ−
ンをも併せて登録しておき、未知の音声が入力された時
には該未知の音声について同様の特徴パタ−ンに変換す
るとともに、予め登録した標準パタ−ンの1つ以上を連
結して、音の大きさの特徴的な部分を一致させるような
時間的対応を付けて比較するようになっていることを特
徴としている。
【0020】
【作用】本発明では、音声を音響分析した結果に基づき
先づ特徴パターン作成手段により特徴パターンを作成す
る。パターン生成手段では、パワー検出手段で検出した
音声の大きさの特徴的な部分を符号化して上記のように
作成された特徴パターンに書込みこれを標準パターンと
して生成する。このようにして生成された標準パターン
を用いて入力音声の未知パターンに対する音声認識を行
なう。
【0021】上記パターン生成手段は、検出された音声
の大きさの特徴的な部分を符号化し、さらに該符号化部
分を中心として時系列方向に符号化値を徐々に減少させ
て特徴パターン作成手段からの特徴パターンに書込みこ
れを標準パターンとして生成しても良い。
【0022】また、本発明では、同じ言葉を複数回発声
させてそれぞれの特徴パターンを形成し、各特徴パター
ン上の音声の大きさの特徴的な部分を対応させた上でこ
れらの平均をとり、標準パターンとして登録し、該標準
パターンを用いて入力音声の未知パターンに対する音声
認識を行なう。
【0023】あるいは、孤立発声された単語の音声の特
徴パターンを標準パターンとして登録する際に、該音声
の始端,終端のいずれか一方、または両方に対応する特
徴パターンの部分に音声の大きさが小さい旨の符号を付
して標準パターンとして登録し、該標準パターンを用い
て入力音声の未知パターンに対する音声認識を行なう。
【0024】さらには、同じ言葉を複数回発声させてそ
れぞれの特徴パターンを形成し、各特徴パターン上の音
声の大きさの特徴的な部分を対応させた上でこれらの平
均をとるとともに、音声の始端,終端のいずれか一方に
も、または両方にも音声の大きさが小さい旨の符号を付
して標準パターンとして登録し、該標準パターンを用い
て入力音声の未知パターンに対する音声認識を行なう。
【0025】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。図1は本発明に係る音声認識装置の第1の実施例
のブロック図である。図1の音声認識装置は、単語音声
の標準パターンが記憶される辞書2と、音声を音響分析
するための音響分析部4と、音声の大きさ,すなわちパ
ワーを検出するパワー検出部5と、音声のパワーに対す
る閾値が格納される閾値格納部6と、検出されたパワー
を閾値格納部6に格納された閾値THと比較し音声の大
きさの特徴的な部分を検出する比較部7と、音響分析部
4で分析された結果が入力し、この分析結果のうちで音
声に係る部分だけを取り出し、これを特徴パターンとし
て出力する音声区間検出部8と、比較部7において検出
された音声の特徴的な部分を符号化し、これを音声区間
検出部8からの特徴パターンに書込み新たな特徴パター
ンを未知パターン照合用の標準パターンとして生成し辞
書2に登録するパターン生成部9とを有している。
【0026】音響分析部4は、例えば、通常8〜32個
程度のバンドパスフィルタを用いたフィルタバンクによ
り構成され、フィルタバンクとして構成するときには、
音声を周波数分析して分析結果を出力するようになって
いる。
【0027】例えば、音響分析部4として、16個のバ
ンドパスフィルタを用いる場合には、16個の周波数帯
域での周波数分析がなされ、このときには、パワー検出
部5は、周波数分析された16個の成分を例えば加算す
ることにより、音声全体のパワーの検出を行なうことが
できる。あるいは、パワー検出部5は、全域通過のフィ
ルタの出力を検波するように構成したりすることもでき
る。
【0028】また、この第1の実施例において、比較部
7は、音声の大きさの特徴的な部分として、通常のレベ
ルよりも大きな部分,例えば音声のパワーのピークの検
出を行なうようになっており、具体的には、現時点での
パワーを閾値格納部6に格納されている閾値THと比較
することにより音声のパワーのピークを検出するように
なっている。
【0029】このため、閾値格納部6には、比較部7が
ピークを検出するまでの間は、ある時点でのパワーとそ
れより1つ前の時点でのパワーとを比べたとき、いずれ
か大きい方のパワーが閾値THとして更新格納され、比
較部7がピークを検出した後においては、ある時点での
パワーとそれより1つ前の時点でのパワーとを比べたと
き、いずれか小さい方のパワーが閾値THとして更新格
納されるようになっている。なお、閾値THの初期値は
例えば“0”となっている。
【0030】すなわち、ピークが検出されるまでの間
は、閾値THは最終的にはパワーの最大値となり、従っ
て、比較部7としては、例えば、現時点でのパワーが閾
値格納部6に格納されている閾値THよりも低くなった
ことを検出することによってパワーのピークを検出し、
比較結果としてピーク検出信号PKを出力するように構
成されている。
【0031】また、パターン生成部9は、比較部7から
ピーク検出信号PKが送られたときに、音声区間検出部
8からの特徴パターンに対して、ピークに該当する部分
へその旨の符号を書込むことによって新しい特徴パター
ンを標準パターンとして生成するようになっている。
【0032】次にこのような構成における音声認識装置
の処理動作について図2のフローチャートを用いて説明
する。標準パターンを作成しこれを辞書2に登録するた
めに、音声を入力すると、音響分析部4では、入力され
た音声を音響分析し、分析結果をパワー検出部5並びに
音声区間検出部8に与える(ステップS1)。
【0033】音響分析された結果に基づき、パワー検出
部5では、入力された音声のパワーを測定する。また、
音声区間検出部8では、パワー検出部5で検出されたパ
ワーを参照して分析結果から音声の部分のみを取出し、
横軸に例えば周波数,縦軸に時間,すなわちフレーム系
列をとった特徴パターンを作成しこれを出力する(ステ
ップS2)。
【0034】次いで、比較部7では、パワー検出部5か
らのパワーを閾値格納部6に格納されている閾値THと
比較することで、パワーの特徴的な部分,すなわちこの
第1の実施例ではパワーのピークを検出し、ピークを検
出したときにはピーク検出信号PKをパターン生成部9
に与える。
【0035】パターン生成部9では、比較部7からピー
ク検出信号PKが送られたか否かにより、音声の特徴的
部分であるか否かを判断する(ステップS3)。
【0036】ピーク検出信号PKが送られて音声の特徴
的部分であると判断されたときには、パターン生成部9
は、音声区間検出部8からの特徴パターンに対して、こ
の特徴的部分(ピーク)に相当する部分にその旨の符号
を書込み符号化する(ステップS4)。
【0037】図3(a),(b)および図4はこの様子
を説明するための図である。いま、辞書から音声“1
(いち)”が発声されると、パワー検出部5においては
入力された音声“1(いち)”のパワーが図3(a)の
ように検出される。また音声区間検出部8においては図
3(b)の特徴パターンが作成される。なお、図3
(b)では、16個の周波数帯域で周波数分析がなされ
た結果が示されており、各周波数成分の大きさは16数
進数で表わされている。
【0038】入力された音声のパワーが図3(a)のよ
うに検出されると、パワー検出部5ではこの音声のパワ
ーのピークを検出し、このときに図示のようにピーク検
出信号PKをパターン生成部9に出力する。これによ
り、パターン生成部9は、図4に示すように、図3
(b)の特徴パターンのうちで、ピークに対応するフレ
ームの部分(全帯域)を例えば“ff”で符号化し変換
する。なお、“ff”で符号化する場合には、このフレ
ーム部分の成分に最大の大きさをもたせることができ
る。
【0039】パターン生成部9は、図4に示すような新
しい特徴パターンを生成すると、これを入力された音声
の標準パターンとして辞書2に登録する(ステップS
5)。各音声についてこのような標準パターンの登録を
行なった後、実際の認識処理がなされる。すなわち認識
処理では、入力音声の未知パターンと辞書2内に上記の
ように登録されている標準パターンとのパターンマッチ
ングを行なう。このパターンマッチングには、様々の仕
方があるが、いま例えば、未知パターンbと標準パター
ンaとの間の距離Dとして、良く知られた次式を用いた
とする。
【0040】
【数1】
【0041】ここで、aijは標準パターンaの時刻jの
i番目の周波数成分,bijは未知パターンbijの時刻j
のi番目の周波数成分である。
【0042】この場合のパターンマッチングでは、距離
Dが小さくなるように非線形伸縮を行なって未知パター
ンの時間軸と標準パターンの時間軸とを整合させ、しか
る後、未知パターンbと標準パターンaとの照合を行な
う。このような時間軸方向の正規化処理を行なった後の
照合処理において、標準パターンのピーク,すなわち他
の部分に比べて極めて大きな値“ff”をもつように符
号化された部分と未知パターンのピークとが時間軸上で
ほぼ同じ位置にあれば、距離Dは小さくなって、未知パ
ターンはその標準パターンと一致すると判断される。こ
れに対し、ピーク同士が時間軸上で異なる位置にあれ
ば、距離Dは大きくなって、未知パターンはその標準パ
ターンと一致しないと判断される。
【0043】特に、標準パターンのピークに相当する部
分に極めて大きな値“ff”を符号として割り当ててい
るので、距離Dに与えるこのピーク部分の影響は他の部
分に比べて著しく大きく、従って、距離Dの感度を高め
ることができる。この結果、通常の照合処理によって
も、照合精度を向上させることができる。さらには、単
語音声認識処理において辞書2内に単語単位の標準パタ
ーンのみが登録されている状態で、連続的に発声された
単語を認識させようとする場合にも、辞書内の単語単位
の各標準パターンがピーク部分に大きな値“ff”をも
つ上述したようなものとなっているときには、これらの
単語単位の各標準パターンをつなぎ合わせて認識処理を
行なわせることにより、主にピーク同士の照合がなさ
れ、照合精度を向上させることができて、認識率を高め
ることが可能となる。
【0044】上記例では、パターン生成部9は、図4に
示したように、特徴パターンの特徴的部分,すなわちピ
ークに対応するフレームの部分のみに値“ff”を符号
として割り当てているが、さらにピークに対応するフレ
ームの前後のフレームの部分にも値“ff”の半分の値
“7f”を符号として割り当てて、図4のかわりに図5
のような新しい特徴パターンを標準パターンとして生成
するようになっていても良い。この場合にはさらに、ピ
ークとして検出されたフレームの部分の符号値“ff”
に比べて、その周囲の符号値が値“ff”の半分以下の
値に必ず小さくなるので、照合時にピーク値“ff”を
書き込んだ部分の伸縮時のずれによってマッチング距離
Dが大きくなるのを避けることができる。
【0045】なお、前後のフレームに割り当てる符号値
としては“7f”に限らず例えば“4f”等の任意の値
で良い。また、前後のフレームのみならず、ピークのフ
レームを中心としてこれから遠ざかるに従って値が徐々
に減少するような符号をより多くのフレームに対して割
り当てることもできる。
【0046】図6は本発明に係る音声認識装置の第2の
実施例のブロック図である。なお図6において図1と同
様の箇所には同じ符号を付している。この第2の実施例
では、上記第1の実施例と反対に、音声のパワーの谷の
部分を検出し、この谷の部分に相当する特徴パターンの
部分を符号化し新しい特徴パターンとして(標準パター
ンとして)生成するようになっており、具体的には、比
較部17は、現時点でのパワーを閾値格納部16に格納
されている閾値THと比較することにより音声のパワー
の谷を検出するようになっている。このため、閾値格納
部16には、比較部17が谷を検出するまでの間はある
時点でのパワーとそれより1つ前の時点でのパワーとを
比べたとき、いずれか小さい方のパワーが閾値THとし
て更新格納され、比較部17が谷を検出した後において
は、ある時点でのパワーとそれより1つ前の時点でのパ
ワーとを比べたとき、いずれか大きい方のパワーが閾値
THとして更新格納されるようになっている。
【0047】すなわち、谷が検出されるまでの間は、閾
値THは最終的にはパワーの最小値となり、従って、比
較部17としては、例えば現時点でのパワーが閾値格納
部16に格納されている閾値THよりも大きくなったこ
とを検出することによってパワーの谷を検出し、比較結
果として検出信号PKを出力するように構成されてい
る。
【0048】閾値格納部16への閾値THの設定の仕方
は、上記以外にも可能であって、例えば、音声区間検出
部8で音声の入力がないときのレベルを覚えておき、音
声入力の最中にこれに近い大きさにパワーが低下したと
きにこれを無音区間として検出し、この無音区間におけ
るパワーを閾値格納部16に閾値THとして記憶するこ
ともできる。この場合には、比較部17は、音声のパワ
ーが無音区間におけるパワーに対応した閾値よりも低下
したときにこれを谷として検出するようになっており、
谷として検出される箇所は1つに限らず、連続した複数
の箇所になることもある。
【0049】このようにして比較部17から谷の検出信
号PKが谷の長さ分だけ継続して送られると、パターン
生成部19では、音声区間検出部8からの特徴パターン
に対して、谷に相当する部分にその旨の符号を書込むこ
とによって新しい特徴パターンを標準パターンとして生
成するようになっている。
【0050】このため、パターン生成部19には、谷を
表わすパターンを保持するレジスタ21と、比較部17
から谷の検出信号PKが送られたときに、レジスタ21
に保持されている谷を表わすパターンの時間長を谷の長
さに伸縮する伸縮部22と、伸縮されたパターンを音声
区間検出部8からの特徴パターンに重ね合わせる重ね合
せ部23とが設けられている。
【0051】図7はレジスタ21に保持されている谷を
表わす符号化パターンの一例を示す図であり、この例で
は、谷を表わす符号化パターンは谷の中心が値“ff”
で、その前後が値“7f”で表現されており、パターン
の時間長L2は“5”となっている。図8(a),
(b)および図9はレジスタ21に図7に示すようなパ
ターンが保持されている状態のときに、谷を検出して新
しい特徴パターンとしての標準パターンを生成するまで
の様子を説明するための図である。
【0052】いま、パワー検出部5において音声のパワ
ーが図3(a)に示したと同様に図8(a)のように検
出され、音声区間検出部8において図8(b)のように
して特徴パターンが作成される場合、音声区間検出部8
は、部分NPを無音区間として検出し、比較部17は、
この無音区間NPのパワーにより定められた閾値よりも
低いパワーの部分をPKで示すように谷として検出す
る。図8(a),(b)の例では谷の部分は、5個の連
続箇所(5フレーム分)として検出され、谷の長さL1
は“5”となる。比較部17から谷の検出信号PKが送
られると、パターン生成部19の伸縮部22では、図7
に示すパターンの時間長L2をこの谷の長さL1に伸縮す
る。
【0053】いまの場合、パターンの時間長L2は谷の
長さL1と一致するので、伸縮部22は、図7に示す符
号化パターンを伸縮せず、そのままの形で重ね合せ部2
3に送る。
【0054】重ね合せ部23では、図7の符号化パター
ンを図8(b)に示す特徴パターンに重ね合せ、図9に
示すような新たな特徴パターンを標準パターンとして生
成する。図9からわかるように、この新たな特徴パター
ンにおいては、谷に対応するフレームの部分は、その全
帯域が図5と同様に符号化されており、この新たな特徴
パターンを辞書内に標準パターンとして登録した後、入
力音声の未知パターンとのマッチングを例えば前述の数
1に基づいて行なわせると、ピーク検出時の照合処理と
同様の原理によって、未知パターンと標準パターンとの
間で主に谷同士の照合がなされるので、この場合にもピ
ーク検出時と同様、照合精度を向上させることができ、
認識率を高めることが可能となる。
【0055】なお、レジスタ21には、谷を表わすパタ
ーンとして、図7のかわりに例えば図10のようなパタ
ーンが保持されていても良い。図10に示すパターン
は、5種類の符号値をもち、図10に示すパターンがレ
ジスタ21に保持されているときには、新しい特徴パタ
ーンには、谷の中心フレームを中心としてこれから遠ざ
かるに従って値が徐々に減少するような符号値が書込ま
れる。このように谷を表わす符号化パターンとしては必
要に応じ任意のものを用いることができる。
【0056】さらに、音声のパワーが図8(a)のよう
に検出され、音声区間検出部8において特徴パターンが
図11のように2値化された状態で作成される場合に
は、谷を表わす符号化パターンとして図12に示すよう
な2値化パターンをレジスタ21に保持させておくこと
もできる。このときには、パターン生成部19では、谷
に対応するフレームの部分の全帯域が全て“1”となる
図13に示すような新しい特徴パターンを標準パターン
として生成することができる。
【0057】このように第2の実施例では、音声の大き
さの特徴的な部分としてパワーのピークのかわりに谷を
検出し、この谷の部分に相当する特徴パターンの部分を
符号化し標準パターンとして生成して辞書2に登録し、
これに基づいて入力音声の未知パターンに対する音声認
識処理を行なわせるようにしており、この場合もパワー
のピークを検出する場合と同様にして、照合精度を向上
させ、認識率を高めることが可能となる。
【0058】なお、上述した第1,第2の実施例では、
パワーのピークだけ、またはパワーの谷だけを用いた
が、これらの両方を併用しても良い。すなわち、パワー
のピークと谷との両方に相当する特徴パターンの部分を
上述した方法によって符号化して新しい特徴パターンを
標準パターンとして生成し、辞書2に登録すれば良い。
この場合には、照合精度をより一層向上させることがで
きる。但し、この際に、ピークと谷とに相当する部分に
同じ値を割り当てて符号化すると、マッチング時に例え
ば未知パターンのピークと標準パターンの谷とが誤って
対応付けられてしまうことがある。従って、ピークと谷
とに相当する部分にそれぞれ異なる値を割り当てて互い
に区別できるように符号化するのが良い。例えば、特徴
パターンが2値で生成されるとしたときに、ピークに相
当する部分には図14(a)に示すような符号化パター
ンを割り当て、谷に相当する部分には図14(b)に示
すような符号化パターンを割り当てて両者を区別するこ
とができる。このような符号化をしておくと、未知パタ
ーンのピーク(または谷)と標準パターンのピーク(ま
たは谷)とを正しく対応させたとき数1に従って未知パ
ターンと標準パターンと距離Dは最小になり、未知パタ
ーンのピーク(または谷)と標準パターンの谷(または
ピーク)とを対応させたときには、これらの間の距離D
は最大となるので、これにより、ピークと谷とが誤って
対応付けされる恐れをなくすことができる。ピーク,谷
に相当する部分に割り当てられる符号化パターンとして
は図14(a),(b)の例に限らず、互いの距離が大
きくなるような2組のものであれば良い。
【0059】また、上述したような各実施例の方式は、
例えば文献「数理科学1987年2月No.284,第
63頁,サイエンス社」に示されているような特徴パタ
ーンの作成方式にも適用可能である。すなわち、上記文
献には、1つのカテゴリに対して複数回発声させてそれ
ぞれの特徴パターンを得て、これらの加算平均をとって
標準パターンを作成する方式が示されており、これに本
発明を適用し、同じ言葉に対して複数回発声して得られ
た各特徴パターン上の音声の大きさの特徴的な部分,例
えばピークや谷を対応させた上でこれらの加算平均をと
り、これを標準パターンとして作成することも可能であ
る。この場合、加算の仕方も特別な方法を必要とせず、
誤差が最小となるように互いに対応付けて加え合せれば
良い。但し、単語が連結された発声では、前述したよう
に、連結した単語が1つの単語として誤まって対応付け
される恐れがある。この対策としては、連結した単語の
発声では、1つ1つの単語のつなぎ目でパワーが落ちる
ことがあることに着目し、孤立に発声された単語の音声
の特徴パターンを標準パターンとして登録する際に、そ
の音声のパターンの始端または終端のいずか一方にも、
あるいは両方にも、音声のパワーが小さい旨の符号を付
けるようにすることができる。これにより、連結されて
発声された音声のつなぎ目に生じるパワーの谷と、孤立
発声された単語の標準パターンの始端,終端とを一致さ
せることができて、連結した単語の発声においても各単
語を正しく照合させることができる。
【0060】図15はこのような方式を採用した音声認
識装置の構成例を示す図である。図15の構成例は、図
6の構成例と同じ方式のものとなっているが、図6の機
能に加えてさらに、図16(a),(b)に示すような
符号化パターンをレジスタ31内に保持させ、伸縮部3
2では音声区間検出部8からの区間開始信号が受付けら
れたときに図16(a)の符号化パターンを選択して重
ね合せ部33に送る一方、区間終了信号が受付けられた
ときに図16(b)の符号化パターンを選択して重ね合
せ部33に送るようになっている。これにより、図15
のパターン生成部40では、孤立発声された単語の音声
の特徴パターンの始端および終端にもそれぞれ図16
(a),(b)に示すような谷を表わす符号化パターン
を付加し、これを標準パターンとして辞書内に予め登録
させることが可能である。この結果、マッチングによる
照合処理において、連結されて発声された音声の単語の
つなぎ目に生じるパワーの谷と、孤立発声された単語の
標準パターンの始端,終端とを一致させることができ、
認識精度を向上させることができる。
【0061】なお、特徴パターンが2値のパターンとし
て作成される場合には、図16(a),(b)の符号化
パターンのかわりに、図17(a),(b)に示すよう
な2値の符号化パターンがレジスタ31内に保持される
ようになっていても良い。
【0062】以上は音声を特徴パターンに変換した後の
照合処理について述べたが、1フレームごとに記号化し
て照合するような方式に対しても本発明を適用すること
ができる。
【0063】図18は、本発明に係る音声認識装置の第
3の実施例のブロック図である。なお図18において、
パタ−ン生成部50の前段部分としては、音声区間検出
部51,比較部52だけが示されており、音響分析部,
パワ−検出部,閾値格納部については、例えば図1ある
いは図6の構成と同様な構成のものにすることができる
とし、簡単のため、図示を省略している。また、パタ−
ン生成部50,音声区間検出部51,比較部52は、図
1あるいは図6のパタ−ン生成部,音声区間検出部5
1,比較部52と同様な機能を有しており、パタ−ン生
成部50は、検出された音声の大きさの特徴的な部分を
符号化して特徴パタ−ンの一部または全部に書き込むよ
うになっている。
【0064】ところで、この第3の実施例の音声認識装
置では、パタ−ン生成部50で生成された特徴パタ−ン
を標準パタ−ンとして辞書60に登録するか、あるいは
生成された特徴パタ−ンを音声認識されるべき入力音声
の未知パタ−ンとして使用するかを切替るための切替部
53と,標準パタ−ンを辞書60に登録したり辞書60
から読み出したりするための辞書レジスタ54と、1つ
以上の標準パタ−ンをつなぎ合わせる連結部55と、連
結部55において連結された標準パタ−ンと入力音声の
未知パタ−ンとを照合する照合部56とがさらに設けら
れている。
【0065】このような構成の音声認識装置の動作を図
19のフロ−チャ−トを用いて説明する。なお、この処
理例では、パタ−ン生成部50は、図15のパタ−ン生
成部40に対応した構成のものであるとし、音声の大き
さの特徴的な部分として、パワ−の谷の部分を符号化し
て特徴パタ−ンに書き込むようになっているとする。先
ず、音声が入力すると(ステップS11)、これを周波
数変換し(ステップS12)、パワ−の測定を行ない
(ステップS13)、パワ−の谷を抽出する(ステップ
S14)。次いで、抽出された谷の部分を符号化して、
特徴パタ−ンに書き込み、新たな特徴パタ−ンを生成す
る(ステップS15)。これにより前述したように、図
11のような特徴パタ−ンを図13のような特徴パタ−
ンにすることができる。
【0066】しかる後、パタ−ン生成部50で上記のよ
うに生成された新たな特徴パタ−ンを標準パタ−ンとし
て辞書60に登録するのか、あるいは、これを音声認識
対象としての入力音声の未知のパタ−ンとして使用する
のかが切替部53の状態によって判断される(ステップ
S16)。いま、この新たな特徴パタ−ンを標準パタ−
ンとして辞書60に登録させるよう利用者によって切替
部53が切替えられているときには、新たな特徴パタ−
ンは、辞書レジスタ54を介し、辞書60(例えばフロ
ッピィディスク)に標準パタ−ンとして登録される(ス
テップS17)。
【0067】これに対し、未知の音声で認識させるよう
切替部53が切替られているときには、新たな特徴パタ
−ンは照合部56に送られ、そこで標準パタ−ンと照合
されるが、これに先立って、予め辞書60に登録されて
いる標準パタ−ンを連結部55において所定の仕方でつ
なぎ合わせる(ステップS18)。このようにして1つ
以上の標準パタ−ンを連結し、そのうち、新たな特徴パ
タ−ンと特徴的な部分(いまの場合、谷の部分)の数
(あるいはさらに位置)が一致するものを照合部56に
送る(ステップS19)。これにより、照合部56で
は、新たな特徴パタ−ンをステップS19で選別された
連結標準パタ−ンと照合し(ステップS20)、最大類
似度を与える連結標準パタ−ンを選出して(ステップS
21)、これを音声認識結果として出力する(ステップ
S22)。
【0068】図20(a),(b),(c)は、上記連
結,照合処理の具体例を示す図である。いま、話者が単
語「1」と単語「9」とを「19(icikju)」の
ように連続的に発声し、これを音声認識させようとする
場合、連続的に発声された単語「19(icikj
u)」は、特徴的な部分(すなわち谷の部分)に所定の
符号が付されて、図20(a)のような特徴パタ−ン,
すなわち未知パタ−ンとして照合部56に送られる。こ
の際、辞書60に登録されてる標準パタ−ンは、
「1」,「2」,・・・,「9」等の個々に孤立した1つ
の単語の音声のパタ−ンであり、単語の音声の開始部と
終了部でパワ−が小さくなることから、この部分にも特
徴的な部分を示す符号が付されている。連結部55で
は、辞書60に登録されている個々の単語の標準パタ−
ンを種々組み合わせてつなぎ合わせる。例えば、「1」
の標準パタ−ンと「2」の標準パタ−ンとをつなぎ合わ
せ、また「1」の標準パタ−ンと「5」の標準パタ−ン
をつなぎ合わせるというように、種々の連結標準パタ−
ンを作成する。なお、つなぎ合わせを行なわない個々の
単語の標準パタ−ン自体もここでは連結標準パタ−ンと
呼ぶことにする。図20(b)は、「1(ici)」の
標準パタ−ンと「9(kju)」の標準パタ−ンとの一
例を示すものであり、これらを組合せつなぎ合わせる
と、図20(c)に示すような連結標準パタ−ンとな
る。なお、この連結時において、「1(ici)」の終
了部と「9(kju)」の開始部には、特徴的な部分を
示す符号が付されているので、これらを連結した結果、
これらの間には特徴的な部分を示す符号が付される。こ
のようにつなぎ合わせを行なわなかったものをも含めて
種々の連結標準パタ−ンを作成した後、連結部55は、
これらの連結標準パタ−ンのうちで、図20(a)の未
知パタ−ン上の符号の数(図20(a)の例では4個)
および符号の位置が一致する連結標準パタ−ンを選別す
る。図20(c)に示す連結標準パタ−ンは、図20
(a)の未知パタ−ンと同じ数の符号を有し、また符号
が同じ位置であるので、図20(c)の連結標準パタ−
ンも1つの候補として選別されて、照合部56に送られ
る。照合部56では、連結部55から送られた連結標準
パタ−ンの各候補と図20(a)に示す未知パタ−ンと
をマッチングし、最大類似度を与える候補を1つ選択す
る。例えば、図20(c)に示す連結標準パタ−ンが最
大類似度を与える場合には、この連結標準パタ−ンが最
終的に選択され、未知音声の認識結果として、「19」
を得ることができる。
【0069】なお、上記の照合処理は、具体的には、入
力音声の未知パタ−ンとしての新たな特徴パタ−ンと連
結標準パタ−ンとのそれぞれにおいて、ある1つの谷の
部分から次の谷の部分までを切って取り出し、これらを
互いに照合するようになっていても良いし、DPマッチ
ングで計算量が多いときには、この部分を線形伸縮で置
き換えても良い。また、これら以外のマッチング手法に
よって照合がなされるようになっていても良い。
【0070】このように、第3の実施例においては、音
声の大きさの特徴的な部分を符号化して、その音声の特
徴パタ−ンの一部,または全部に書き込んで予め辞書6
0に登録しておき、未知の音声が入力されたときには、
この未知音声についても同様の特徴パタ−ンに変換する
とともに、予め辞書60に登録されている標準パタ−ン
の1つ以上を連結し、未知音声の特徴パタ−ンと連結標
準パタ−ンとの特徴的な部分を一致させるような時間的
対応を付けてこれらを比較照合するようにしており、こ
れにより、個々の単語の標準パタ−ンが登録されるよう
辞書60が構成されている場合であっても、すなわち辞
書60を非常に大きな容量のものにせずとも、簡単な処
理の仕方で、連続発声された未知音声をも正しく認識さ
せることができる。
【0071】ところで、図20(a)に示した例では、
連続的に発声した音声が「19(icikju)」であ
る場合でも次の単語「9(kju)」の先頭が“k”で
始まる子音であることから、「1(ici)」と「9
(kju)」との間には、パワ−の小さくなる部分,す
なわち特徴的な部分(符号)が存在し、従って、これら
の間には特徴的な部分を示す符号が書き込まれるので、
これにより、「1(ici)」と「9(kju)」との
連結標準パタ−ンとの対応がとることができた。
【0072】しかしながら、次の単語の始まりが母音で
あるような未知の音声の場合、例えば、連続的に発声し
た音声が「81(haciiti)」のような場合は、
この特徴パタ−ンは、図21(a)のようになる。すな
わち、「8」と「1」とのつなぎ目がいずれも母音
“i”であることから、この間にはパワ−の小さくなる
特徴的な部分が発声せず、従って符号が書き込まれな
い。一方、連結部55によって生成される「8(hac
i)」と「1(ici)」との連結標準パタ−ンは、図
21(b)のように単語「8(haci)」の終了部に
符号が付され、単語「1(ici)」の開始部に符号が
付されているので、図21(c)に示すようにこれらの
間には符号が付されたものとなる。従って、このような
場合には、両者の間に良好な対応付けを行なうことがで
きない。
【0073】図22は本発明に係る音声認識装置の第4
の実施例のブロック図であり、この第4の実施例では、
上述したような場合にも対応できるような構成となって
いる。すなわち、図22の音声認識装置では、1つの単
語の音声の音素ストリング(つづり)を格納するストリ
ングレジスタ70が設けられ、パタ−ン作成部60は、
さらに、1つの単語の音声に対して新たに作成した特徴
パタ−ンを標準パタ−ンとして辞書60に登録するに際
して、この単語の連結の可能性を調べ、この単語が決め
られた条件を満たすものか否か,例えば単語の先端また
は後端が母音であるか否かをストリングレジスタ70か
ら音素ストリングを取り出して調べ、所定の条件を満た
す場合には、新たに作成した特徴パタ−ンをバッファメ
モリ71に格納するとともに、新たに作成した特徴パタ
−ンの所定箇所に付されている符号を取り除いて辞書レ
ジスタ54に格納するようになっている。従って、この
第4の実施例では、先端または後端が母音の単語につい
ては、第3の実施例におけると同様の標準パタ−ンとと
もに、開始部,終了部の符号を付けない変換標準パタ−
ンをも辞書60に登録させるようになっている。
【0074】そして、連結部72は、標準パタ−ンをつ
なぐ際に、前の単語の最後の音素が、母音で、次につな
がる単語の先頭の音素も母音であるときには、それぞれ
開始部,終了部に符号の付いていない変換標準パタ−ン
を辞書60から読み出して、これらを連結するようにな
っている。
【0075】このような構成では、例えば単語「8(h
aci)」と単語「1(iti)」とを連結する場合
に、連結部55は、これらの単語の最後,先頭がそれぞ
れ母音“i”であることから、図23(a)に示すよう
にこれらの単語の変換標準パタ−ンを辞書60から読み
出して、連結し、図23(b)に示すように、これらの
単語のつなぎ目に符号の付されていない連結特徴パタ−
ンを生成することができる。図23(b)を図21
(a)と比べればわかるように、先端または後端が母音
である場合にも、この第4の実施例によれば、連結特徴
パタ−ンと未知音声パタ−ンとの対応を良好にとること
ができる。また、先端または後端が母音でない場合に
は、開始部,終了部に符号の付いている標準パタ−ンを
辞書60から読み出して連結し、第3の実施例で説明し
たような単語のつなぎ目に符号の付されている連結特徴
パタ−ンを生成することができる。
【0076】このように第4の実施例では、音声の大き
さの特徴的な部分を符号化してその音声の特徴パタ−ン
の一部,または全部に書き込み、さらには、登録すべき
単語の連結の可能性を調べ、決められた条件を満たすも
のについては、音声の大きさの特徴的な部分を表わす符
号を付けないパタ−ンも併せて登録し、未知の音声が入
力された時に同様の特徴パタ−ンに変換するとともに、
予め登録した標準パタ−ンの1つ以上を連結して、未知
音声特徴パタ−ンと連結標準パタ−ンとの特徴的な部分
を一致させるような時間的対応を付けてこれらを比較照
合するようにしているので、これにより、連続発声され
た未知音声がどのような種類のものであっても、これに
良好に対応した連結標準パタ−ンによって、未知音声を
正しく認識させることができる。
【0077】
【発明の効果】以上に説明したように本発明によれば、
音声の大きさの特徴的な部分を符号化し、これを特徴パ
ターンに書込み標準パターンとして生成し、この標準パ
ターンを用いて入力音声の未知パターンに対する音声認
識を行なうようになっているので、煩雑で特別な照合処
理を必要とすることなく、照合精度を向上させ、認識率
を高めることができる。
【0078】音声の大きさの特徴的な部分を符号化し、
さらに該符号化部分を中心として時系列方向に符号化値
を徐々に減少させて特徴パターンに書込み、標準パター
ンを作成すれば、より照合精度を向上させることができ
る。
【0079】また、音声の大きさが所定の閾値よりも大
きいときにこの部分を符号化するようにすれば、音声の
パワーのピークを特徴的部分として割り当てることがで
きる。
【0080】また、音声の大きさが所定の閾値よりも小
さいときにこの部分を符号化するようにすれば、音声の
パワーの谷を特徴的部分として割り当てることができ
る。
【0081】さらに、上記両方の部分を併用することに
より、より照合精度を向上させることができる。
【0082】この際に、両方の部分が、互いに区別可能
に符号化がなされていれば、ピークと谷とが誤まって対
応付けされる恐れをなくすことができる。
【0083】また、同じ言葉を複数回発声させてそれぞ
れの特徴パターンを形成し、各特徴パターン上の音声の
大きさの特徴的な部分を対応させた上でこれらの平均を
とり、これを標準パターンとして登録するようにすれ
ば、極めて照合精度の良い信頼性に優れた標準パターン
を得ることができ、これを用いることによって認識精度
を著しく向上させることができる。
【0084】また、同じ言葉を複数回発声させてそれぞ
れの特徴パターンを形成し、各特徴パターン上の音声の
大きさの特徴的な部分を対応させた上でこれらの平均を
とるとともに、音声の始端,終端のいずれか一方にも、
または両方にも音声の大きさが小さい旨の符号を付して
標準パターンとして登録すれば、単語が連続的に発声さ
れた音声であっても、各単語との照合精度を高め各単語
を精度良く認識させることができる。
【0085】また、音声の大きさの特徴的な部分を符号
化して特徴パタ−ンの一部,または全部に書き込み新た
な特徴パタ−ンに変換し、これを標準パタ−ンとして予
め登録しておき、未知の音声が入力された時には該未知
の音声については同様の新たな特徴パタ−ンに変換する
とともに、予め登録した標準パタ−ンの1つ以上を連結
して、音の大きさの特徴的な部分を一致させるような時
間的対応を付けて比較すれば、メモリ量等を増加させず
簡単な構成により、単語が連続的に発せられた音声につ
いてもこの音声を直接かつ容易に認識させることができ
る。
【0086】また、決められた条件を満たす単語の標準
パタ−ン間で連結を行なう場合には、標準パタ−ンの先
端または後端に付されている特徴的な部分を表わす符号
を取り消した後に連結を行ない比較するときには、例え
ば、連続的に発声された単語の最後,先頭がそれぞれ母
音である場合にも、音声を直接かつ正しく認識させるこ
とができる。
【0087】また、音声の大きさの特徴的な部分を符号
化して特徴パタ−ンの一部,または全部に書き込み新た
な特徴パタ−ンに変換して、これを標準パタ−ンとし、
さらに、、登録すべき単語の連結の可能性を調べ、決め
られた条件を満たすものについては、音声の大きさの特
徴的な部分を表わす符号を付けない標準パタ−ンをも併
せて登録しておき、未知の音声が入力された時には該未
知の音声について同様の特徴パタ−ンに変換するととも
に、予め登録した標準パタ−ンの1つ以上を連結して、
音の大きさの特徴的な部分を一致させるような時間的対
応を付けて比較すれば、任意の単語が連続的に発声され
た場合にも、この音声を正しく認識させることができ
る。
【図面の簡単な説明】
【図1】本発明に係る音声認識装置の第1の実施例のブ
ロック図である。
【図2】図1の構成において未知パターン照合用の標準
パターンを生成する処理の流れを示すフローチャートで
ある。
【図3】(a),(b)は図1の構成において標準パタ
ーンを生成する処理の具体例を説明するための図であ
る。
【図4】図1の構成において標準パターンを生成する処
理の具体例を説明するための図である。
【図5】図1の構成において標準パターンを生成する処
理の具体例を説明するための図である。
【図6】本発明に係る音声認識装置の第2の実施例のブ
ロック図である。
【図7】谷を表わす符号化パターンの一例を示す図であ
る。
【図8】(a),(b)は図6の構成において標準パタ
ーンを生成する処理の具体例を説明するための図であ
る。
【図9】図6の構成において標準パターンを生成する処
理の具体例を説明するための図である。
【図10】谷を表わす符号化パターンの一例を示す図で
ある。
【図11】図6の構成において標準パターンを生成する
処理の具体例を説明するための図である。
【図12】谷を表わす符号化パターンの一例を示す図で
ある。
【図13】図6の構成において標準パターンを生成する
処理の具体例を説明するための図である。
【図14】(a),(b)はピーク,谷をそれぞれ表わ
す符号化パターンの一例を示す図である。
【図15】図6の構成の音声認識装置の変形例を示す図
である。
【図16】(a),(b)は図15の構成において音声
の特徴パターンの始端,終端に付される符号の符号化パ
ターンの一例を示す図である。
【図17】(a),(b)は図15の構成において音声
の特徴パターンの始端,終端に付される符号の符号化パ
ターンの一例を示す図である。
【図18】本発明に係る音声認識装置の第3の実施例の
ブロック図である。
【図19】図18の音声認識装置の動作を説明するため
のフロ−チャ−トである。
【図20】(a),(b),(c)は図18の音声認識
装置における連結,照合処理の具体例を示す図である。
【図21】(a),(b),(c)は図18の音声認識
装置における連結,照合処理の具体例を示す図である。
【図22】本発明に係る音声認識装置の第4の実施例の
ブロック図である。
【図23】(a),(b)は図22の音声認識装置にお
ける連結,照合処理の具体例を示す図である。
【符号の説明】
2 辞書 4 音響分析部 5 パワー検出部 6,16 閾値格納部 7,17 比較部 8 音声区間検出部 9,19,40 パターン生成部 21,31 レジスタ 22,32 伸縮部 23,33 重ね合せ部 50 パタ−ン生成部 51 音声区間検出部 52 比較部 53 切替部 54 辞書レジスタ 55 連結部 56 照合部 60 辞書 70 ストリングレジスタ 71 バッファメモリ 72 連結部

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 音声を音響分析した結果に基づき特徴パ
    ターンを作成する特徴パターン作成手段と、音声の大き
    さを検出するパワー検出手段と、検出された音声の大き
    さの特徴的な部分を符号化して前記特徴パターン作成手
    段によって作成された特徴パターンに書込みこれを標準
    パターンとして生成するパターン生成手段とを有し、パ
    ターン生成手段によって生成された標準パターンを用い
    て入力音声の未知パターンに対する音声認識を行なうよ
    うになっていることを特徴とする音声認識装置。
  2. 【請求項2】 請求項1記載の音声認識装置において、
    前記パターン生成手段は、検出された音声の大きさの特
    徴的な部分を符号化し、さらに該符号化部分を中心とし
    て時系列方向に符号化値を徐々に減少させて前記特徴パ
    ターン作成手段からの特徴パターンに書込みこれを標準
    パターンとして生成するようになっていることを特徴と
    する音声認識装置。
  3. 【請求項3】 前記パターン生成手段は、検出された音
    声の大きさが所定の閾値よりも大きいときにこの部分を
    符号化するようになっていることを特徴とする請求項1
    または2記載の音声認識装置。
  4. 【請求項4】 前記パターン生成手段は、検出された音
    声の大きさが所定の閾値よりも小さいときにこの部分を
    符号化するようになっていることを特徴とする請求項1
    または2記載の音声認識装置。
  5. 【請求項5】 前記パターン生成手段は、検出された音
    声の大きさが第1の閾値よりも大きい部分と、第1の閾
    値に比べて低く設定されている第2の閾値よりも小さい
    部分との両方の部分を符号化するようになっていること
    を特徴とする請求項1または2記載の音声認識装置。
  6. 【請求項6】 前記両方の部分は、互いに区別可能に符
    号化がなされるようになっていることを特徴とする請求
    項5記載の音声認識装置。
  7. 【請求項7】 同じ言葉を複数回発声させてそれぞれの
    特徴パターンを形成し、各特徴パターン上の音声の大き
    さの特徴的な部分を対応させた上でこれらの平均をと
    り、標準パターンとして登録し、該標準パターンを用い
    て入力音声の未知パターンに対する音声認識を行なうよ
    うになっていることを特徴とする音声認識装置。
  8. 【請求項8】 孤立発声された単語の音声の特徴パター
    ンを標準パターンとして登録する際に、該音声の始端,
    終端のいずれか一方、または両方に対応する特徴パター
    ンの部分に音声の大きさが小さい旨の符号を付して標準
    パターンとして登録し、該標準パターンを用いて入力音
    声の未知パターンに対する音声認識を行なうようになっ
    ていることを特徴とする音声認識装置。
  9. 【請求項9】 同じ言葉を複数回発声させてそれぞれの
    特徴パターンを形成し、各特徴パターン上の音声の大き
    さの特徴的な部分を対応させた上でこれらの平均をとる
    とともに、音声の始端,終端のいずれか一方にも、また
    は両方にも音声の大きさが小さい旨の符号を付して標準
    パターンとして登録し、該標準パターンを用いて入力音
    声の未知パターンに対する音声認識を行なうようになっ
    ていることを特徴とする音声認識装置。
  10. 【請求項10】 音声の大きさを計測し、計測した音声
    の大きさの特徴的な部分を符号化して特徴パタ−ンの一
    部,または全部に書き込み新たな特徴パタ−ンに変換
    し、これを標準パタ−ンとして予め登録しておき、未知
    の音声が入力された時には該未知の音声については同様
    の新たな特徴パタ−ンに変換するとともに、予め登録し
    た標準パタ−ンの1つ以上を連結して、音の大きさの特
    徴的な部分を一致させるような時間的対応を付けて比較
    するようになっていることを特徴とするパタ−ン比較方
    法。
  11. 【請求項11】 音声の大きさを計測し、計測した音声
    の大きさの特徴的な部分を符号化して特徴パタ−ンの一
    部,または全部に書き込み新たな特徴パタ−ンに変換
    し、これを標準パタ−ンとして予め登録しておき、未知
    の音声が入力された時には該未知の音声については同様
    の新たな特徴パタ−ンに変換するとともに、予め登録し
    た標準パタ−ンの1つ以上を連結して、音の大きさの特
    徴的な部分を一致させるように線形伸縮によって時間的
    対応を付けて比較するようになっていることを特徴とす
    るパタ−ン比較方法。
  12. 【請求項12】 請求項10または請求項11記載のパ
    タ−ン比較方法において、決められた条件を満たす単語
    の標準パタ−ン間で連結を行なう場合には、標準パタ−
    ンの先端または後端に付されている特徴的な部分を表わ
    す符号を取り消した後に連結を行ない比較するようにな
    っていることを特徴とするパタ−ン比較方法。
  13. 【請求項13】 音声の大きさを計測し、計測した音声
    の大きさの特徴的な部分を符号化して該特徴パタ−ンの
    一部,または全部に書き込み新たな特徴パタ−ンに変換
    して、これを標準パタ−ンとし、さらに、、登録すべき
    単語の連結の可能性を調べ、決められた条件を満たすも
    のについては、音声の大きさの特徴的な部分を表わす符
    号を付けない標準パタ−ンをも併せて登録しておき、未
    知の音声が入力された時には該未知の音声について同様
    の特徴パタ−ンに変換するとともに、予め登録した標準
    パタ−ンの1つ以上を連結して、音の大きさの特徴的な
    部分を一致させるような時間的対応を付けて比較するよ
    うになっていることを特徴とするパタ−ン比較方法。
JP3298344A 1991-06-12 1991-10-17 音声認識装置およびパターン比較方法 Pending JPH0553597A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3298344A JPH0553597A (ja) 1991-06-12 1991-10-17 音声認識装置およびパターン比較方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP3-167829 1991-06-12
JP16782991 1991-06-12
JP3298344A JPH0553597A (ja) 1991-06-12 1991-10-17 音声認識装置およびパターン比較方法

Publications (1)

Publication Number Publication Date
JPH0553597A true JPH0553597A (ja) 1993-03-05

Family

ID=26491753

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3298344A Pending JPH0553597A (ja) 1991-06-12 1991-10-17 音声認識装置およびパターン比較方法

Country Status (1)

Country Link
JP (1) JPH0553597A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013195685A (ja) * 2012-03-19 2013-09-30 Fuji Xerox Co Ltd 言語モデル作成プログラム、言語モデル作成装置及び音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013195685A (ja) * 2012-03-19 2013-09-30 Fuji Xerox Co Ltd 言語モデル作成プログラム、言語モデル作成装置及び音声認識装置

Similar Documents

Publication Publication Date Title
JP3180655B2 (ja) パターンマッチングによる単語音声認識方法及びその方法を実施する装置
JP2745562B2 (ja) ノイズ適応形音声認識装置
JPH0553597A (ja) 音声認識装置およびパターン比較方法
JP4475380B2 (ja) 音声認識装置及び音声認識プログラム
JP2006039382A (ja) 音声認識装置
JP2813209B2 (ja) 大語彙音声認識装置
JPH0774960B2 (ja) テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
JP3039453B2 (ja) 音声認識装置
JP2001175276A (ja) 音声認識装置及び記録媒体
JP3110025B2 (ja) 発声変形検出装置
KR100275446B1 (ko) 음소 인식률을 이용한 기본 음소 설정 방법
JP2003345384A (ja) 音声認識装置、音声認識方法および音声認識プログラム
JP2712586B2 (ja) 単語音声認識装置用パターンマッチング方式
JP2864511B2 (ja) 話者識別方式と装置
JP3357752B2 (ja) パターンマッチング装置
JP3004749B2 (ja) 標準パターン登録方法
JPH01185599A (ja) 音声認識装置
JPH11184492A (ja) 話者認識装置及びその方法
JP3011984B2 (ja) パターン照合方法
JPH0640274B2 (ja) 音声認識装置
JPH0534679B2 (ja)
JP2528105B2 (ja) 音声認識装置
JPH0316038B2 (ja)
JPS61165797A (ja) 音声認識装置
JPS62111295A (ja) 音声認識装置