JPH01159699A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH01159699A
JPH01159699A JP62319657A JP31965787A JPH01159699A JP H01159699 A JPH01159699 A JP H01159699A JP 62319657 A JP62319657 A JP 62319657A JP 31965787 A JP31965787 A JP 31965787A JP H01159699 A JPH01159699 A JP H01159699A
Authority
JP
Japan
Prior art keywords
consonant
voice
word
dictionary
cutting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62319657A
Other languages
English (en)
Inventor
Yumi Honda
本多 由美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62319657A priority Critical patent/JPH01159699A/ja
Publication of JPH01159699A publication Critical patent/JPH01159699A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 単語の促音から作成された促音情報に基づき、単語を切
り出す条件を自動的に制御することで、利用者の負担を
軽減する音声認識装置に関し、認識精度の低下防止を図
ると共に、利用者の負担を軽減することを目的とし、 音声信号から一つの単語の音声パターンを切り出し、音
声パターンの特徴パラメータを送出する音声切り出し部
と、音声切り出し部の送出する特徴パラメータを、辞書
に保持する特徴パラメータと照合して音声認識処理を行
う照合部と、促音を含む単語と促音を含まない単語とに
よって異なる音声切り出し条件を設定するように音声切
り出し部を制御する音声切り出し条件制御部とを有する
音声認識装置であって、辞書には単語の特徴パラメータ
と共に、単語に促音が含まれるか否かを示す促音情報を
設定し、認識すべき単語のグループについて、辞書の該
促音情報を索引し、該単語のグループに促音を含む単語
が有るか否かを識別して、識別結果を音声切り出し条件
制御部に通知する促音パターン検索手段を照合部に設け
、音声切り出し条件制御部は促音パターン検索手段の通
知に従って、音声切り出し部の制御を行う構成とする。
〔産業上の利用分野〕
本発明は単語を入力して認識させる音声認識装置に係り
、特に単語に存在する促音から作成された促音情報に基
づき、単語を区別して切り出す際の条件を自動的に制御
することで、利用者の負担を軽減する音声認識装置に関
する。
音声認識技術の発展に伴い、データ入力装置としての音
声認識装置が実用化されてきており、その運用において
は、認識精度が高いだけではな(、発声方法についても
制約が少ない事が望ましい。
〔従来の技術〕
第4図は従来の技術を説明するブロック図である。
端子Aを経て図示省略したマイクロホンから、単語の発
声に伴うアナログ信号が入力する。このアナログ信号は
単語の音声パターンを形成しており、帯域フィルタ群l
は、このアナログ信号の所定の周波数帯毎のパワーをデ
ィジタル値に変換して、音声切り出し部2に送出する。
音声切り出し条件制御部3は端子Bから入力する切り出
し条件指示に従い、音声パターンのパワーレベルを検出
する闇値と、該闇値以下のパワーレベルの継続時間に対
応して、単語の切れ目を判定する切り出し条件を音声切
り出し部2に送出する。
従って、音声切り出し部2は指定された闇値に基づき、
この闇値より高い音声パワーレベルを検出した時、単語
の音声パターンの始めと認識し、その後、この閾値より
音声パワーレベルが低下すると、その継続時間を調べ指
定された時間以上になると単語の切れ目と判定し、闇値
より音声パワーレベルが低下した時点が単語の音声パタ
ーンの終わりと認識する。そして、先に検出した闇値よ
り高い音声パワーのlil!続した間を単語の音声パタ
ーン部分として切り出し、この音声パターン部分の特徴
パラメータを抽出して切替回路7に送出する。
辞書を作成する場合には、切替回路7は点線で示す如く
接続され、音声切り出し部2の送出する特徴パラメータ
を辞書作成部4に送出しており、辞書作成部4は音声切
り出し部2が送出した特徴パラメータを、辞書6に各単
語毎の特徴パラメータ8.・−・、9として順次格納す
る。
この辞書6に格納した単語に対応して、マイクロホンか
ら帯域フィルタ群1に入力する音声パターンを認識する
場合、切替回路7は実線で示す如く接続されており、音
声切り出し部2が送出する特徴パラメータを照合部5に
送出する。従って、照合部5は辞書6に格納されている
各単語の特徴パラメータ8.−・、9と、音声切り出し
部2が送出した特徴パラメータとを比較照合し、辞書6
内の似ている特徴パラメータを持つ音声パターンを照合
結果として端子Cに送出する。
〔発明が解決しようとする問題点〕
A!−2nに含まれる促音は、音声が入力されていない
部分と同様の特徴を持つため、促音のある単語の音声パ
ターンを正しく切り出す為には、単語の音声パターンの
終了を判定する際に、促音部分より長い時間待つ必要が
ある。
即ち、前記の如く、闇値以下に音声パワーレベ 。
ルが低下した継続時間により、単語の切れ目を判定して
いるため、促音を含む単語が入力する場合、単語の切れ
目を検出するには、促音部分より長い時間、闇値以下の
音声パワーレベルが継続する時間を検出する必要がある
からである。
従って、音声切り出し条件制御部3に入力する切り出し
条件指示において、促音に対応するためには単語の切れ
目検出時間を長くするように指示するため、利用者にお
いては単語の発声間隔を長くする必要がある。
一方、数字や英字等の連続するコードの如き一連のデー
タを入力する場合、−息に複数の数字や英字等を発声す
る方が発声負荷が少なく、作業も速いが、このような発
声を行う場合は、通常側々の数字や英字の発声間隔は短
くなる。
従って、促音に対応するように音声切り出し条件制御部
3に指示した切り出し条件により、音声切り出し部2が
動作している場合、このように発声間隔が短いと、単語
間の切れ目を促音とする誤判定が発生する。
又、促音の無い単語を認識するように、単語の切れ目検
出時間を短くするように指示した切り出し条件により、
音声切り出し部2が動作している場合、促音を含む単語
を入力すると、促音の部分で一つのパターンが終了した
と誤判定し、促音の前後を別のパターンとして切り出し
てしまう。
従って、音声切り出し条件制御部3に対して、端子Bか
ら切り出し条件の指示を行うことが出来ることを利用し
、利用者が直接入力手段がら、促音に対応する音声切り
出し条件を入力するが、又は、促音の無い単語を認識す
る切り出し条件を入力するか、それとも、プログラムに
よって切り出し条件を指示する場合は、プログラム作成
時に、同様な切り出し条件を設定するように作成するが
、いずれにしても、音声認識のため入力する単語に促音
を含むものがあるか否かを調べる必要があるため煩わし
く、且つ、音声認識装置が促音を認識するために設定さ
れる閾値とか、促音と単語間の無音状態の継続時間に係
わる判定条件等、装置の機能を利用者が十分に知らない
と、切り出し条件の指示を誤り、音声認識装置に的確な
判断をさせることが出来ず認識精度が低下するという問
題がある。
又、コードの如き一連のデータを入力する場合、前記の
如く一息に複数の数字や英字を発声する方が発声負荷が
少なくなるが、この数字や英字等を区切って発声するよ
うに、発声間隔に制限があると、利用者に負担がかかり
、発声自体も不自然になることがあるため、認識精度の
低下につながるという問題がある。
本発明は辞書に促音情報を設けて、音声切り出し条件を
自動的に制御させることで、促音に対する的確な判断に
よる認識精度の低下防止を図ると共に、促音の含まれな
い単語を連続発声する場合には、発声間隔を長く取らな
くとも良いようにして、利用者の負担を軽減することを
目的としている。
〔問題点を解決するための手段〕
第1図は本発明の原理ブロック図である。
第1図は第4図の音声切り出し部2に促音検出手段14
を、辞書作成部4に促音情報格納手段15を、照合部5
に促音パターン検索手段16を夫々追加したものである
辞書を作成する場合、単語の発声間隔は長いため、音声
切り出し条件制御部3は、一つの単語の音声パターンを
切り出すと共に、該−つの単語に促音が存在するか否か
を検出する検出条件として、常に促音に対応した音声切
り出し条件を送出しており、音声切り出し部lOは前記
同様にして、特徴パラメータを切替回路7を経て辞書作
成部11に送出するが、この時促音検出手段14は単語
に促音が存在していた場合は、この促音が存在すること
を示す促音情報を作成して同時に送出する。
従って、辞書作成部11は音声パターンの特徴パラメー
タに、促音情報格納手段15の指示で促音情報を付加し
て辞書12に送出し、辞書12はこの特徴パラメータと
促音情報を各単語毎の特徴パラメータ・促音情報21.
・−122として順次格納する。
音声認識を行う場合、照合部13の促音パターン検索手
段16は、予め利用者から指示された認識すべき単語の
グループについて、辞書12(7)促音情報を検索し、
促音情報が存在する場合、音声切り出し条件制御部3に
対し、促音の存在を通知する。従って、音声切り出し条
件制御部3は音声切り出し部10に、促音の検出に適し
た検出条件、即ち、促音に対応した音声切り出し条件を
送出する。
又、辞書12に促音情報が存在しなければ、音声切り出
し条件制御部3に対し、促音が存在しないことを通知す
る。従って、音声切り出し条件制御部3は音声切り出し
部10に、各単語の発声間隔に制約を与えない検出条件
、即ち、単語の切れ口検出時間を短(した切り出し条件
を送出する。
〔作用〕
上記の如く構成することにより、辞書作成時には、音声
切り出し部10が単語に促音が存在することを検出した
時、促音検出手段14がその存在を促音情報にするため
、音声切り出し部10は、この促音情報を辞書作成部1
1に送出し、辞書作成部11は促音情報格納手段15の
指示で辞書12に特徴パラメータと共に促音情報を付加
して記憶させることが出来る。
又、音声認識時には、辞書12から照合部13の促音パ
ターン検索手段16が検索した促音情報の有無により、
照合部13が音声切り出し条件制御部3に対し、促音情
報の有無を通知することで、地名の如く一息で複数の単
語を発声することが無く、自然に単語の発声間隔が長く
なるような促音の含まれる単語の認識を行う場合と、−
息で複数のJ4’l f7iを発声し、単語の発声間隔
が短くなる促音の含゛まれないコードの如き数字や英字
等を認識する場合とで、音声切り出し条件制御部3が音
声切り出し部10に送出する切り出し条件を自動的に選
択して指示するため、促音に対する的確な判断による認
識精度の向上が図れると共に、促音の含まれない単3Q
を連続発声する場合に、発声間隔を長く取らな(とも良
くなり、利用者の負担を軽減することが出来る。
〔実施例〕
第2図は本発明の一実施例を示す回路のブロック図で、
第3図は第2図の動作を説明する図である。
第2図において、第4図と同一符号は同一機能のものを
示す。辞書作成時には、音声切り出し条件制御部3は常
に促音に対応した音声切り出し条件を送出しており、音
声切り出し部10は前記同様にして、帯域フィルタ群l
を経て入力する音声パターンの特徴パラメータを切替回
路7を経て辞書作成部11に送出するが、この時促音検
出回路18は単語に促音が存在していた場合は、この促
音が存在することを示す促音情報を作成して同時に送出
する。
従って、辞書作成部11は音声パターンの特徴バラメー
クに、促音情報格納処理回路19の指示で促音情報を付
加して辞書12に送出し、辞書12はこの特徴パラメー
タと促音情報を各単語毎の特徴パラメータ・促音情報2
1.−・・、22として順次格納する。
第3図(a)は地名を示す単語のトウキヨウ、オオサカ
、サソボロを発声した時の音声パターンと、促音情報を
示す。辞書12の特徴パラメータ・促音情報21〜22
には、促音が含まれる単語のサソボロに付いて、促音情
報「有り」が記録され、トウキヨウ、オオサカには促音
情報「無し」が記録される。
又、第3図(C)は数字を示す単語のゼロ、イチ、ニイ
を発声した時の音声パターンと、促音情報を示す。この
場合、促音の含まれる単語が存在しないため、辞書12
の特徴パラメータ・促音情報21〜22には、促音情報
「無し」が記録される。
音声認識を行う場合、照合部13の促音パターン検索回
路20は、端子りを経て予め利用者から図示省略した入
力手段により、認識すべき単語のグループとして指定さ
れた範囲、即ち、辞書12の指定された記憶領域の範囲
内に記録された特徴パラメータ・促音情報21〜22か
ら促音情報を検索するか、又は、辞書12の総ての領域
に記録された特徴パラメータ・促音情報21〜22から
促音情報を検索し、促音情報が存在する場合、音声切り
出し条件制御部3に対し、促音の存在を通知する。従っ
て、音声切り出し条件制御部3は音声切り出し部10に
、促音に対応した音声切り出し条件を送出する。
第3図中)は促音を含む単語の音声パターンを切り出す
条件を示す。横軸に時間を縦軸に音声パワーレベルをと
ると、サラポロと発声されたパターンは「ン」の部分が
促音であり、時間t1で示す範囲の長さで判定される。
即ち、時間t1で示す範囲が所定の時間より短いと促音
と判定され、時間t2で示す範囲が、この所定の時間よ
り成る程度長いと単語の切れ目と判定される。
又、■で示す点線は闇値のレベルであり、このレベルは
促音の無い単語を切り出す場合より低(設定される。こ
れは、閾値が高いと時間1.が長くなり、単語の切れ目
と誤判定され易(なるためである。
辞書12に促音情報が存在しなければ、促音パターン検
索回路20は、音声切り出し条件制御部3に対し、促音
が存在しないことを通知する。従って、音声切り出し条
件制御部3は、音声切り出し部10に、閾値のレベルを
上げると共に、単語の切れ口検出時間を短くした切り出
し条件を送出する。
第3図(dlは促音を含まない単語の音声パターンを切
り出す条件を示す。横軸に時間を縦軸に音声パワーレベ
ルをとると、ゼロ、イチと発声されたパターンは促音が
含まれないため、時間L3+ t4で示す範囲が短くて
も単語の切れ目と判定され、閾値■のレベルも閾値■よ
り高く設定される。
〔発明の効果〕
以上説明した如く、本発明は各単語のパターンに対して
辞書自身に促音情報が付加されているため、利用者から
の指示が無(でも単語のパターンを切り出す条件の制御
が可能となる。従って、音声認識対象内に地名のような
単語に促音が存在する時のみ、促音に対応した切り出し
条件を用い、数字や英字の如く促音の無い場合は、発声
間隔を短(し得ることで、利用者の負担を軽減すると共
に、利用者が直接又はプログラムにより、切り出し条件
の指定をする必要を無くして、促音に対する的確な判断
による認識精度の向上を図ることが出来る。
【図面の簡単な説明】
第1図は本発明の原理ブロック図、 第2図は本発明の一実施例を示す回路のブロック図、 第3図は第2図の動作を説明する図、 第4図は従来の技術を説明するブロック図である。 図において、 1は帯域フィルタ群、2.lOは音声切り出し部、3は
音声切り出し条件制御部、 4.11は辞書作成部、 5,13は照合部、6.12
は辞書、    7は切替回路、14は促音検出手段、
 15は促音情報格納手段、本音日月の一実方ヒ′多1
1Fガ?を回p鮎りフ′”Dツ2図第 2 図 (I)) (り 第2図/7動作l免明すうm 第3 図

Claims (1)

  1. 【特許請求の範囲】 音声信号から一つの単語の音声パターンを切り出し、該
    音声パターンの特徴パラメータを送出する音声切り出し
    部(10)と、該音声切り出し部(10)の送出する該
    特徴パラメータを、辞書(12)に保持する特徴パラメ
    ータと照合して音声認識処理を行う照合部(13)と、
    促音を含む単語と促音を含まない単語とによって異なる
    音声切り出し条件を設定するように該音声切り出し部(
    10)を制御する音声切り出し条件制御部(3)とを有
    する音声認識装置であって、該辞書(12)には単語の
    特徴パラメータと共に、該単語に促音が含まれるか否か
    を示す促音情報を設定し、 認識すべき単語のグループについて、該辞書(12)の
    該促音情報を索引し、該単語のグループに促音を含む単
    語が有るか否かを識別して、該識別結果を該音声切り出
    し条件制御部(3)に通知する促音パターン検索手段(
    16)を該照合部(13)に設け、該音声切り出し条件
    制御部(3)は該促音パターン検索手段(16)の通知
    に従って、該音声切り出し部(10)の制御を行うこと
    を特徴とする音声認識装置。
JP62319657A 1987-12-17 1987-12-17 音声認識装置 Pending JPH01159699A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62319657A JPH01159699A (ja) 1987-12-17 1987-12-17 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62319657A JPH01159699A (ja) 1987-12-17 1987-12-17 音声認識装置

Publications (1)

Publication Number Publication Date
JPH01159699A true JPH01159699A (ja) 1989-06-22

Family

ID=18112745

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62319657A Pending JPH01159699A (ja) 1987-12-17 1987-12-17 音声認識装置

Country Status (1)

Country Link
JP (1) JPH01159699A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007015803A (ja) * 2005-07-07 2007-01-25 Aichi Corp 高所作業車

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007015803A (ja) * 2005-07-07 2007-01-25 Aichi Corp 高所作業車

Similar Documents

Publication Publication Date Title
US4769844A (en) Voice recognition system having a check scheme for registration of reference data
JP3789246B2 (ja) 音声区間検出装置、音声区間検出方法、音声認識装置、音声認識方法および記録媒体
JPS6147440B2 (ja)
JPS6316766B2 (ja)
JPH01159699A (ja) 音声認識装置
EP0177854B1 (en) Keyword recognition system using template-concatenation model
JP3114757B2 (ja) 音声認識装置
JP3039453B2 (ja) 音声認識装置
JPH05108091A (ja) 音声認識装置
JP3259734B2 (ja) 音声認識装置
JP2844592B2 (ja) 離散単語音声認識装置
JP2000276189A (ja) 日本語ディクテーションシステム
JP3357752B2 (ja) パターンマッチング装置
JPS60170900A (ja) 音節音声標準パタン登録方式
JPH0233200A (ja) データベース検索方式
JP2892004B2 (ja) 単語音声認識装置
JPS61165797A (ja) 音声認識装置
JPS59211098A (ja) 音声認識装置
JPS6240497A (ja) 音声パタ−ン分類方式
JPS58156998A (ja) 情報入力装置
JPH04310000A (ja) 連続音声認識装置
JPS6375800A (ja) 音声認識装置
JPS6391700A (ja) 音声認識装置
JPS59195300A (ja) 音声認識装置
JPS61121167A (ja) 区切り発声に基づく音声ワ−ドプロセツサ