JPH01159699A

JPH01159699A - 音声認識装置

Info

Publication number: JPH01159699A
Application number: JP62319657A
Authority: JP
Inventors: Yumi Honda; 本多　由美
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1987-12-17
Filing date: 1987-12-17
Publication date: 1989-06-22

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔概要〕単語の促音から作成された促音情報に基づき、単語を切
り出す条件を自動的に制御することで、利用者の負担を
軽減する音声認識装置に関し、認識精度の低下防止を図
ると共に、利用者の負担を軽減することを目的とし、音声信号から一つの単語の音声パターンを切り出し、音
声パターンの特徴パラメータを送出する音声切り出し部
と、音声切り出し部の送出する特徴パラメータを、辞書
に保持する特徴パラメータと照合して音声認識処理を行
う照合部と、促音を含む単語と促音を含まない単語とに
よって異なる音声切り出し条件を設定するように音声切
り出し部を制御する音声切り出し条件制御部とを有する
音声認識装置であって、辞書には単語の特徴パラメータ
と共に、単語に促音が含まれるか否かを示す促音情報を
設定し、認識すべき単語のグループについて、辞書の該
促音情報を索引し、該単語のグループに促音を含む単語
が有るか否かを識別して、識別結果を音声切り出し条件
制御部に通知する促音パターン検索手段を照合部に設け
、音声切り出し条件制御部は促音パターン検索手段の通
知に従って、音声切り出し部の制御を行う構成とする。

〔産業上の利用分野〕

本発明は単語を入力して認識させる音声認識装置に係り
、特に単語に存在する促音から作成された促音情報に基
づき、単語を区別して切り出す際の条件を自動的に制御
することで、利用者の負担を軽減する音声認識装置に関
する。

音声認識技術の発展に伴い、データ入力装置としての音
声認識装置が実用化されてきており、その運用において
は、認識精度が高いだけではな（、発声方法についても
制約が少ない事が望ましい。

〔従来の技術〕

第４図は従来の技術を説明するブロック図である。

端子Ａを経て図示省略したマイクロホンから、単語の発
声に伴うアナログ信号が入力する。このアナログ信号は
単語の音声パターンを形成しており、帯域フィルタ群ｌ
は、このアナログ信号の所定の周波数帯毎のパワーをデ
ィジタル値に変換して、音声切り出し部２に送出する。

音声切り出し条件制御部３は端子Ｂから入力する切り出
し条件指示に従い、音声パターンのパワーレベルを検出
する闇値と、該闇値以下のパワーレベルの継続時間に対
応して、単語の切れ目を判定する切り出し条件を音声切
り出し部２に送出する。

従って、音声切り出し部２は指定された闇値に基づき、
この闇値より高い音声パワーレベルを検出した時、単語
の音声パターンの始めと認識し、その後、この閾値より
音声パワーレベルが低下すると、その継続時間を調べ指
定された時間以上になると単語の切れ目と判定し、闇値
より音声パワーレベルが低下した時点が単語の音声パタ
ーンの終わりと認識する。そして、先に検出した闇値よ
り高い音声パワーのｌｉｌ！続した間を単語の音声パタ
ーン部分として切り出し、この音声パターン部分の特徴
パラメータを抽出して切替回路７に送出する。

辞書を作成する場合には、切替回路７は点線で示す如く
接続され、音声切り出し部２の送出する特徴パラメータ
を辞書作成部４に送出しており、辞書作成部４は音声切
り出し部２が送出した特徴パラメータを、辞書６に各単
語毎の特徴パラメータ８．・−・、９として順次格納す
る。

この辞書６に格納した単語に対応して、マイクロホンか
ら帯域フィルタ群１に入力する音声パターンを認識する
場合、切替回路７は実線で示す如く接続されており、音
声切り出し部２が送出する特徴パラメータを照合部５に
送出する。従って、照合部５は辞書６に格納されている
各単語の特徴パラメータ８．−・、９と、音声切り出し
部２が送出した特徴パラメータとを比較照合し、辞書６
内の似ている特徴パラメータを持つ音声パターンを照合
結果として端子Ｃに送出する。

〔発明が解決しようとする問題点〕

Ａ！−２ｎに含まれる促音は、音声が入力されていない
部分と同様の特徴を持つため、促音のある単語の音声パ
ターンを正しく切り出す為には、単語の音声パターンの
終了を判定する際に、促音部分より長い時間待つ必要が
ある。

即ち、前記の如く、闇値以下に音声パワーレベ　。

ルが低下した継続時間により、単語の切れ目を判定して
いるため、促音を含む単語が入力する場合、単語の切れ
目を検出するには、促音部分より長い時間、闇値以下の
音声パワーレベルが継続する時間を検出する必要がある
からである。

従って、音声切り出し条件制御部３に入力する切り出し
条件指示において、促音に対応するためには単語の切れ
目検出時間を長くするように指示するため、利用者にお
いては単語の発声間隔を長くする必要がある。

一方、数字や英字等の連続するコードの如き一連のデー
タを入力する場合、−息に複数の数字や英字等を発声す
る方が発声負荷が少なく、作業も速いが、このような発
声を行う場合は、通常側々の数字や英字の発声間隔は短
くなる。

従って、促音に対応するように音声切り出し条件制御部
３に指示した切り出し条件により、音声切り出し部２が
動作している場合、このように発声間隔が短いと、単語
間の切れ目を促音とする誤判定が発生する。

又、促音の無い単語を認識するように、単語の切れ目検
出時間を短くするように指示した切り出し条件により、
音声切り出し部２が動作している場合、促音を含む単語
を入力すると、促音の部分で一つのパターンが終了した
と誤判定し、促音の前後を別のパターンとして切り出し
てしまう。

従って、音声切り出し条件制御部３に対して、端子Ｂか
ら切り出し条件の指示を行うことが出来ることを利用し
、利用者が直接入力手段がら、促音に対応する音声切り
出し条件を入力するが、又は、促音の無い単語を認識す
る切り出し条件を入力するか、それとも、プログラムに
よって切り出し条件を指示する場合は、プログラム作成
時に、同様な切り出し条件を設定するように作成するが
、いずれにしても、音声認識のため入力する単語に促音
を含むものがあるか否かを調べる必要があるため煩わし
く、且つ、音声認識装置が促音を認識するために設定さ
れる閾値とか、促音と単語間の無音状態の継続時間に係
わる判定条件等、装置の機能を利用者が十分に知らない
と、切り出し条件の指示を誤り、音声認識装置に的確な
判断をさせることが出来ず認識精度が低下するという問
題がある。

又、コードの如き一連のデータを入力する場合、前記の
如く一息に複数の数字や英字を発声する方が発声負荷が
少なくなるが、この数字や英字等を区切って発声するよ
うに、発声間隔に制限があると、利用者に負担がかかり
、発声自体も不自然になることがあるため、認識精度の
低下につながるという問題がある。

本発明は辞書に促音情報を設けて、音声切り出し条件を
自動的に制御させることで、促音に対する的確な判断に
よる認識精度の低下防止を図ると共に、促音の含まれな
い単語を連続発声する場合には、発声間隔を長く取らな
くとも良いようにして、利用者の負担を軽減することを
目的としている。

〔問題点を解決するための手段〕

第１図は本発明の原理ブロック図である。

第１図は第４図の音声切り出し部２に促音検出手段１４
を、辞書作成部４に促音情報格納手段１５を、照合部５
に促音パターン検索手段１６を夫々追加したものである
。

辞書を作成する場合、単語の発声間隔は長いため、音声
切り出し条件制御部３は、一つの単語の音声パターンを
切り出すと共に、該−つの単語に促音が存在するか否か
を検出する検出条件として、常に促音に対応した音声切
り出し条件を送出しており、音声切り出し部ｌＯは前記
同様にして、特徴パラメータを切替回路７を経て辞書作
成部１１に送出するが、この時促音検出手段１４は単語
に促音が存在していた場合は、この促音が存在すること
を示す促音情報を作成して同時に送出する。

従って、辞書作成部１１は音声パターンの特徴パラメー
タに、促音情報格納手段１５の指示で促音情報を付加し
て辞書１２に送出し、辞書１２はこの特徴パラメータと
促音情報を各単語毎の特徴パラメータ・促音情報２１．
・−１２２として順次格納する。

音声認識を行う場合、照合部１３の促音パターン検索手
段１６は、予め利用者から指示された認識すべき単語の
グループについて、辞書１２（７）促音情報を検索し、
促音情報が存在する場合、音声切り出し条件制御部３に
対し、促音の存在を通知する。従って、音声切り出し条
件制御部３は音声切り出し部１０に、促音の検出に適し
た検出条件、即ち、促音に対応した音声切り出し条件を
送出する。

又、辞書１２に促音情報が存在しなければ、音声切り出
し条件制御部３に対し、促音が存在しないことを通知す
る。従って、音声切り出し条件制御部３は音声切り出し
部１０に、各単語の発声間隔に制約を与えない検出条件
、即ち、単語の切れ口検出時間を短（した切り出し条件
を送出する。

〔作用〕

上記の如く構成することにより、辞書作成時には、音声
切り出し部１０が単語に促音が存在することを検出した
時、促音検出手段１４がその存在を促音情報にするため
、音声切り出し部１０は、この促音情報を辞書作成部１
１に送出し、辞書作成部１１は促音情報格納手段１５の
指示で辞書１２に特徴パラメータと共に促音情報を付加
して記憶させることが出来る。

又、音声認識時には、辞書１２から照合部１３の促音パ
ターン検索手段１６が検索した促音情報の有無により、
照合部１３が音声切り出し条件制御部３に対し、促音情
報の有無を通知することで、地名の如く一息で複数の単
語を発声することが無く、自然に単語の発声間隔が長く
なるような促音の含まれる単語の認識を行う場合と、−
息で複数のＪ４’ｌ　ｆ７ｉを発声し、単語の発声間隔
が短くなる促音の含゛まれないコードの如き数字や英字
等を認識する場合とで、音声切り出し条件制御部３が音
声切り出し部１０に送出する切り出し条件を自動的に選
択して指示するため、促音に対する的確な判断による認
識精度の向上が図れると共に、促音の含まれない単３Ｑ
を連続発声する場合に、発声間隔を長く取らな（とも良
くなり、利用者の負担を軽減することが出来る。

〔実施例〕

第２図は本発明の一実施例を示す回路のブロック図で、
第３図は第２図の動作を説明する図である。

第２図において、第４図と同一符号は同一機能のものを
示す。辞書作成時には、音声切り出し条件制御部３は常
に促音に対応した音声切り出し条件を送出しており、音
声切り出し部１０は前記同様にして、帯域フィルタ群ｌ
を経て入力する音声パターンの特徴パラメータを切替回
路７を経て辞書作成部１１に送出するが、この時促音検
出回路１８は単語に促音が存在していた場合は、この促
音が存在することを示す促音情報を作成して同時に送出
する。

従って、辞書作成部１１は音声パターンの特徴バラメー
クに、促音情報格納処理回路１９の指示で促音情報を付
加して辞書１２に送出し、辞書１２はこの特徴パラメー
タと促音情報を各単語毎の特徴パラメータ・促音情報２
１．−・・、２２として順次格納する。

第３図（ａ）は地名を示す単語のトウキヨウ、オオサカ
、サソボロを発声した時の音声パターンと、促音情報を
示す。辞書１２の特徴パラメータ・促音情報２１〜２２
には、促音が含まれる単語のサソボロに付いて、促音情
報「有り」が記録され、トウキヨウ、オオサカには促音
情報「無し」が記録される。

又、第３図（Ｃ）は数字を示す単語のゼロ、イチ、ニイ
を発声した時の音声パターンと、促音情報を示す。この
場合、促音の含まれる単語が存在しないため、辞書１２
の特徴パラメータ・促音情報２１〜２２には、促音情報
「無し」が記録される。

音声認識を行う場合、照合部１３の促音パターン検索回
路２０は、端子りを経て予め利用者から図示省略した入
力手段により、認識すべき単語のグループとして指定さ
れた範囲、即ち、辞書１２の指定された記憶領域の範囲
内に記録された特徴パラメータ・促音情報２１〜２２か
ら促音情報を検索するか、又は、辞書１２の総ての領域
に記録された特徴パラメータ・促音情報２１〜２２から
促音情報を検索し、促音情報が存在する場合、音声切り
出し条件制御部３に対し、促音の存在を通知する。従っ
て、音声切り出し条件制御部３は音声切り出し部１０に
、促音に対応した音声切り出し条件を送出する。

第３図中）は促音を含む単語の音声パターンを切り出す
条件を示す。横軸に時間を縦軸に音声パワーレベルをと
ると、サラポロと発声されたパターンは「ン」の部分が
促音であり、時間ｔ１で示す範囲の長さで判定される。

即ち、時間ｔ１で示す範囲が所定の時間より短いと促音
と判定され、時間ｔ２で示す範囲が、この所定の時間よ
り成る程度長いと単語の切れ目と判定される。

又、■で示す点線は闇値のレベルであり、このレベルは
促音の無い単語を切り出す場合より低（設定される。こ
れは、閾値が高いと時間１．が長くなり、単語の切れ目
と誤判定され易（なるためである。

辞書１２に促音情報が存在しなければ、促音パターン検
索回路２０は、音声切り出し条件制御部３に対し、促音
が存在しないことを通知する。従って、音声切り出し条
件制御部３は、音声切り出し部１０に、閾値のレベルを
上げると共に、単語の切れ口検出時間を短くした切り出
し条件を送出する。

第３図（ｄｌは促音を含まない単語の音声パターンを切
り出す条件を示す。横軸に時間を縦軸に音声パワーレベ
ルをとると、ゼロ、イチと発声されたパターンは促音が
含まれないため、時間Ｌ３＋　ｔ４で示す範囲が短くて
も単語の切れ目と判定され、閾値■のレベルも閾値■よ
り高く設定される。

〔発明の効果〕

以上説明した如く、本発明は各単語のパターンに対して
辞書自身に促音情報が付加されているため、利用者から
の指示が無（でも単語のパターンを切り出す条件の制御
が可能となる。従って、音声認識対象内に地名のような
単語に促音が存在する時のみ、促音に対応した切り出し
条件を用い、数字や英字の如く促音の無い場合は、発声
間隔を短（し得ることで、利用者の負担を軽減すると共
に、利用者が直接又はプログラムにより、切り出し条件
の指定をする必要を無くして、促音に対する的確な判断
による認識精度の向上を図ることが出来る。

【図面の簡単な説明】

第１図は本発明の原理ブロック図、第２図は本発明の一実施例を示す回路のブロック図、第３図は第２図の動作を説明する図、第４図は従来の技術を説明するブロック図である。図において、１は帯域フィルタ群、２．ｌＯは音声切り出し部、３は
音声切り出し条件制御部、４．１１は辞書作成部、　５，１３は照合部、６．１２
は辞書、　　　　７は切替回路、１４は促音検出手段、
　１５は促音情報格納手段、本音日月の一実方ヒ′多１
１Ｆガ？を回ｐ鮎りフ′”Ｄツ２図第　２　図（Ｉ））（り第２図／７動作ｌ免明すうｍ第３　図

Claims

【特許請求の範囲】音声信号から一つの単語の音声パターンを切り出し、該
音声パターンの特徴パラメータを送出する音声切り出し
部（１０）と、該音声切り出し部（１０）の送出する該
特徴パラメータを、辞書（１２）に保持する特徴パラメ
ータと照合して音声認識処理を行う照合部（１３）と、
促音を含む単語と促音を含まない単語とによって異なる
音声切り出し条件を設定するように該音声切り出し部（
１０）を制御する音声切り出し条件制御部（３）とを有
する音声認識装置であって、該辞書（１２）には単語の
特徴パラメータと共に、該単語に促音が含まれるか否か
を示す促音情報を設定し、認識すべき単語のグループについて、該辞書（１２）の
該促音情報を索引し、該単語のグループに促音を含む単
語が有るか否かを識別して、該識別結果を該音声切り出
し条件制御部（３）に通知する促音パターン検索手段（
１６）を該照合部（１３）に設け、該音声切り出し条件
制御部（３）は該促音パターン検索手段（１６）の通知
に従って、該音声切り出し部（１０）の制御を行うこと
を特徴とする音声認識装置。