JPH0632014B2 - 単語検出方式 - Google Patents
単語検出方式Info
- Publication number
- JPH0632014B2 JPH0632014B2 JP61307047A JP30704786A JPH0632014B2 JP H0632014 B2 JPH0632014 B2 JP H0632014B2 JP 61307047 A JP61307047 A JP 61307047A JP 30704786 A JP30704786 A JP 30704786A JP H0632014 B2 JPH0632014 B2 JP H0632014B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- candidate
- word
- syllable
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000001514 detection method Methods 0.000 title claims description 22
- 238000000034 method Methods 0.000 claims description 15
- 238000011156 evaluation Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 239000000872 buffer Substances 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000001072 colon Anatomy 0.000 description 1
Description
【発明の詳細な説明】 (産業上の利用分野) 本発明は単語検出装置に関し、特に音声認識、音声入力
装置等において入力音声中に含まれる単語を検出する単
語検出装置に関する。
装置等において入力音声中に含まれる単語を検出する単
語検出装置に関する。
(従来の技術) 音声認識装置、音声入力装置等においては、入力音声中
の単語を検出する方法のひとつとして、入力音声を音
節、音素、音素クラスのカテゴリの列と見なし、入力音
声から検出したカテゴリを用いて作成したカテゴリ列が
単語辞書に記憶されている単語のカテゴリ列に対応すれ
ばその単語を検出結果とするという方法がある。
の単語を検出する方法のひとつとして、入力音声を音
節、音素、音素クラスのカテゴリの列と見なし、入力音
声から検出したカテゴリを用いて作成したカテゴリ列が
単語辞書に記憶されている単語のカテゴリ列に対応すれ
ばその単語を検出結果とするという方法がある。
一般に、上述したカテゴリは、その発声時間長が短いこ
とや類似するカテゴリが存在することなどから、入力音
声中から正しいカテゴリだけを誤りなく検出することが
困難である。そこで従来から、入力音声中の各カテゴリ
区間に対して複数個のカテゴリ候補を検出したのち、単
語辞書を参照して単語に対応するカテゴリ候補列を見つ
けるという方法を用いている。しかしながらこの場合に
も、発声のなまけや隣接するカテゴリ例えば音節どうし
の調音結合等の原因によって、あるカテゴリ区間の存在
が検出できなかったり、あるいはカテゴリ区間に正しい
カテゴリ候補が検出できない場合がある。
とや類似するカテゴリが存在することなどから、入力音
声中から正しいカテゴリだけを誤りなく検出することが
困難である。そこで従来から、入力音声中の各カテゴリ
区間に対して複数個のカテゴリ候補を検出したのち、単
語辞書を参照して単語に対応するカテゴリ候補列を見つ
けるという方法を用いている。しかしながらこの場合に
も、発声のなまけや隣接するカテゴリ例えば音節どうし
の調音結合等の原因によって、あるカテゴリ区間の存在
が検出できなかったり、あるいはカテゴリ区間に正しい
カテゴリ候補が検出できない場合がある。
そこで、特願昭61−190258,190259,1
90260,190261の「単語検出方式」に述べら
れている方式のように、入力音声中のカテゴリ候補を検
出したのち単語辞書中の単語のカテゴリ並びに従ってカ
テゴリ候補を選択するとともに、単語中のあるカテゴリ
が検出されなかった場合にはその前後のカテゴリに対応
するカテゴリ候補を手掛かりにして単語のカテゴリ列に
対応するカテゴリ候補列を見つけている。また、対応す
るカテゴリ候補列が見つかった単語については、そのカ
テゴリ候補列のスコアを計算して単語のスコアとすると
いう手段をとっている。
90260,190261の「単語検出方式」に述べら
れている方式のように、入力音声中のカテゴリ候補を検
出したのち単語辞書中の単語のカテゴリ並びに従ってカ
テゴリ候補を選択するとともに、単語中のあるカテゴリ
が検出されなかった場合にはその前後のカテゴリに対応
するカテゴリ候補を手掛かりにして単語のカテゴリ列に
対応するカテゴリ候補列を見つけている。また、対応す
るカテゴリ候補列が見つかった単語については、そのカ
テゴリ候補列のスコアを計算して単語のスコアとすると
いう手段をとっている。
一方、多数の単語のうちからスコアの良い単語を選択す
る場合には、それぞれの単語について個別に上述の方法
で対応するカテゴリ候補列及びスコアを求めるとする
と、特に単語辞書中の単語数が多い場合には多大な計算
量を必要とし現実的でない。
る場合には、それぞれの単語について個別に上述の方法
で対応するカテゴリ候補列及びスコアを求めるとする
と、特に単語辞書中の単語数が多い場合には多大な計算
量を必要とし現実的でない。
そこで、スコアの良いカテゴリ候補列を優先して求める
ことにより、すべての単語について対応するカテゴリ候
補列を求めることなく、スコアの良い単語を求めるよう
にしている。すなわち、単語のカテゴリ列をその始端か
ら辿ってその途中までの一部分に対応するカテゴリ候補
列を求めたうえそこまでのカテゴリ候補列のスコアを求
める。そして、各時点でもっともスコアの良いカテゴリ
候補列を選び、それに対応するカテゴリ列をさらに先に
辿る。この処理を繰り返しつつある単語の終端に達した
ときにその単語を結果として出力する。この結果、スコ
アの良いカテゴリ候補列に対応する単語が優先して求め
られることになる。
ことにより、すべての単語について対応するカテゴリ候
補列を求めることなく、スコアの良い単語を求めるよう
にしている。すなわち、単語のカテゴリ列をその始端か
ら辿ってその途中までの一部分に対応するカテゴリ候補
列を求めたうえそこまでのカテゴリ候補列のスコアを求
める。そして、各時点でもっともスコアの良いカテゴリ
候補列を選び、それに対応するカテゴリ列をさらに先に
辿る。この処理を繰り返しつつある単語の終端に達した
ときにその単語を結果として出力する。この結果、スコ
アの良いカテゴリ候補列に対応する単語が優先して求め
られることになる。
ここで、カテゴリ候補列のスコアとしてはそのカテゴリ
候補列を構成するカテゴリ候補のスコアの平均値が与え
られることが常である。
候補列を構成するカテゴリ候補のスコアの平均値が与え
られることが常である。
(発明が解決しようとする問題点) 上述のように、カテゴリ列の始端から途中までに対応す
るカテゴリ候補列のスコアをそのカテゴリ候補列を構成
するカテゴリ候補のスコアの平均値から求めた場合、正
しい単語のカテゴリ列の始端に近いカテゴリに対応する
候補のスコアが他の候補に比べて大幅に悪いときにはそ
の単語がなかなか検出されないことが多いという欠点が
ある。
るカテゴリ候補列のスコアをそのカテゴリ候補列を構成
するカテゴリ候補のスコアの平均値から求めた場合、正
しい単語のカテゴリ列の始端に近いカテゴリに対応する
候補のスコアが他の候補に比べて大幅に悪いときにはそ
の単語がなかなか検出されないことが多いという欠点が
ある。
第3図は入力音声から抽出された音声候補の一例を示す
説明図である。例えば、カテゴリとして音節を用い、
「ザイセイ」という音声が入力されたときにその各音節
に対して第3図に示されるような音節候補が得られたと
する。ここで、各音節候補に記されている数字はその音
節候補のスコアで、その値が小さいほど良い、すなわち
より信頼できるとする。このとき、単語「セイゲン(制
限)」、「ザイゲン(財源)」、「ゼイセイ(税
制)」、「ザイセイ(財政)」の各単語に対応する音節
候補列を第3図の音節候補を用いて作成するとそのスコ
アは、 セイゲン:(3+7+8+4)/4=5.5 ザイゲン:(8+7+8+4)/4=6.75 ゼイセイ:(12+7+1+1)/4=5.25 ザイセイ:(8+7+1+1)/4=4.25 となり、正しい単語である「ザイセイ」のスコアが最も
小さく、従って最も良いスコアとなる。ところが、これ
らの各単語の音節列の始端から途中までの、長さがn
(n=1,2,3,4)の部分音節列に対応する音節候
補列のスコアを、同じく各音節候補のスコアの平均値と
して求めると、次のようになる。
説明図である。例えば、カテゴリとして音節を用い、
「ザイセイ」という音声が入力されたときにその各音節
に対して第3図に示されるような音節候補が得られたと
する。ここで、各音節候補に記されている数字はその音
節候補のスコアで、その値が小さいほど良い、すなわち
より信頼できるとする。このとき、単語「セイゲン(制
限)」、「ザイゲン(財源)」、「ゼイセイ(税
制)」、「ザイセイ(財政)」の各単語に対応する音節
候補列を第3図の音節候補を用いて作成するとそのスコ
アは、 セイゲン:(3+7+8+4)/4=5.5 ザイゲン:(8+7+8+4)/4=6.75 ゼイセイ:(12+7+1+1)/4=5.25 ザイセイ:(8+7+1+1)/4=4.25 となり、正しい単語である「ザイセイ」のスコアが最も
小さく、従って最も良いスコアとなる。ところが、これ
らの各単語の音節列の始端から途中までの、長さがn
(n=1,2,3,4)の部分音節列に対応する音節候
補列のスコアを、同じく各音節候補のスコアの平均値と
して求めると、次のようになる。
セ:3/1=3 セイ:(3+7)/2=5 セイゲ:(3+7+8)/3=6 セイゲン:(3+7+8+4)/4=5.5 ザ:8/1=8 ザイ:(8+7)/2=7.5 ザイゲ:(8+7+8)/3=7.66 ザイゲン:(8+7+8+4)/4=6.75 ゼ:12/1=12 ゼイ:(12+7)/2=9.5 ゼイセ:(12+7+1)/3=6.66 ゼイセイ:(12+7+1+1)/4=5.25 ザ:8/1=8 ザイ:(8+7)/2=7.5 ザイセ:(8+7+1)/3=5.33 ザイセイ:(8+7+1+1)/4=4.25 従って、上述のようにスコアの最も良い音節候補列を選
びながら音節列を辿るとすると、上の4単語の音節列は
次の順序で辿られることになる。ここで、コロン(:)
右側に記す数字はその音節列に対応する音節候補列のス
コアである。
びながら音節列を辿るとすると、上の4単語の音節列は
次の順序で辿られることになる。ここで、コロン(:)
右側に記す数字はその音節列に対応する音節候補列のス
コアである。
まず、この4単語の各々の先頭の音節に対応する音節候
補列を求める。
補列を求める。
セ:3 ザ:8 ザ:8 ゼ:12 次に、この中でスコアのもっとも良い(小さい)音節候
補列を選び先に辿るという処理を繰り返す。すると、以
下の順序で音節候補列が作成される。
補列を選び先に辿るという処理を繰り返す。すると、以
下の順序で音節候補列が作成される。
セイ:5 セイゲ:6 セイゲン:5.5 ザイ:7.5 ザイゲ:7.66 ザイゲン:6.75 ザイ:7.5 ザイセイ:4.25 このように、単語「セイゲン」、「ザイゲン」の音節列
を辿り終えてから、初めて単語「ザイセイ」の音節列を
得ることにより、誤った単語「制限」、「財源」が正し
い単語「財政」よりも先に検出されてしまう。これは
「ザイセイ」の先頭の「ザ」に対応する音節候補のスコ
ア8と悪いために、8よりも良いスコアの音節候補列が
なくなるまで「ザイゲン」の「ザ」が選ばれないことに
起因する。
を辿り終えてから、初めて単語「ザイセイ」の音節列を
得ることにより、誤った単語「制限」、「財源」が正し
い単語「財政」よりも先に検出されてしまう。これは
「ザイセイ」の先頭の「ザ」に対応する音節候補のスコ
ア8と悪いために、8よりも良いスコアの音節候補列が
なくなるまで「ザイゲン」の「ザ」が選ばれないことに
起因する。
本発明の目的は、上述した欠点を除去し、このように正
しい単語のカテゴリ列の始端に近いカテゴリに対応する
候補のスコアが他の候補に比べて大幅に悪いときにも正
しい単語をより先にかつ少ない処理量で検出することを
可能にする単語検出方式を提供することにある。
しい単語のカテゴリ列の始端に近いカテゴリに対応する
候補のスコアが他の候補に比べて大幅に悪いときにも正
しい単語をより先にかつ少ない処理量で検出することを
可能にする単語検出方式を提供することにある。
(問題点を解決するための手段) 本発明の単語検出方式は、音節、音素、音素クラス等の
カテゴリの列である入力音声から複数個のカテゴリ候補
およびこれらカテゴリ候補の検出評価における信頼度の
尺度としてのスコアの位置情報とを抽出するとともに単
語辞書に記憶されている単語のカテゴリ列を辿りながら
単語のカテゴリ列に対応するカテゴリ候補列を求めるこ
とによって入力音声中の単語を検出する単語検出方式に
おいて、n個のカテゴリ候補からなるカテゴリ候補列の
スコアをnがあらかじめ定めた数N以上のときにはn個
のカテゴリ候補のスコアの平均値を用いて算出しnがN
未満のときにはn個のカテゴリ候補にnおよびNに依存
しあらかじめ設定する関数としての個数m個の仮想的な
カテゴリ候補を加えた(n+m)個のカテゴリ候補のス
コアの平均値を用いて算出して常にこのスコアが最も良
いカテゴリ候補列を求めるように前記単語辞書中の単語
のカテゴリ列を辿る手段を備えて構成される。
カテゴリの列である入力音声から複数個のカテゴリ候補
およびこれらカテゴリ候補の検出評価における信頼度の
尺度としてのスコアの位置情報とを抽出するとともに単
語辞書に記憶されている単語のカテゴリ列を辿りながら
単語のカテゴリ列に対応するカテゴリ候補列を求めるこ
とによって入力音声中の単語を検出する単語検出方式に
おいて、n個のカテゴリ候補からなるカテゴリ候補列の
スコアをnがあらかじめ定めた数N以上のときにはn個
のカテゴリ候補のスコアの平均値を用いて算出しnがN
未満のときにはn個のカテゴリ候補にnおよびNに依存
しあらかじめ設定する関数としての個数m個の仮想的な
カテゴリ候補を加えた(n+m)個のカテゴリ候補のス
コアの平均値を用いて算出して常にこのスコアが最も良
いカテゴリ候補列を求めるように前記単語辞書中の単語
のカテゴリ列を辿る手段を備えて構成される。
(作用) 上述の例においては、音節列「ザイセイ」に対応する音
節候補列のスコアは4.25と他の単語のスコアよりも
良いのにもかかわらず、その先頭の音節「ザ」に対応す
る音節候補のスコアが8と悪い。一方、音節列「セイゲ
ン」に対応する音節候補列のスコアは5.5と単語「ザ
イセイ」よりも悪いが、その先頭の音節「セ」に対応す
る音節候補のスコアは3と単語「ザイセイ」の先頭の音
節候補のスコアよりも良くなっている。
節候補列のスコアは4.25と他の単語のスコアよりも
良いのにもかかわらず、その先頭の音節「ザ」に対応す
る音節候補のスコアが8と悪い。一方、音節列「セイゲ
ン」に対応する音節候補列のスコアは5.5と単語「ザ
イセイ」よりも悪いが、その先頭の音節「セ」に対応す
る音節候補のスコアは3と単語「ザイセイ」の先頭の音
節候補のスコアよりも良くなっている。
このように、単語全体のカテゴリ列に対応するカテゴリ
候補列から算出したスコアとしてはその単語の信頼性を
正しく評価しているが、従来技術では単語の一部分のカ
テゴリ列に対応するカテゴリ候補列だけから算出したス
コアを単語のスコアとして扱っているために、その一部
分に偶然悪いスコアのカテゴリ候補が含まれている場合
にその単語のスコアが悪くなってしまう。
候補列から算出したスコアとしてはその単語の信頼性を
正しく評価しているが、従来技術では単語の一部分のカ
テゴリ列に対応するカテゴリ候補列だけから算出したス
コアを単語のスコアとして扱っているために、その一部
分に偶然悪いスコアのカテゴリ候補が含まれている場合
にその単語のスコアが悪くなってしまう。
一方、単語の一部分のカテゴリ列にしか対応するカテゴ
リ候補列が定まっていない段階では、単語全体のカテゴ
リ列に対応するカテゴリ候補列のスコアを用いることは
できない。
リ候補列が定まっていない段階では、単語全体のカテゴ
リ列に対応するカテゴリ候補列のスコアを用いることは
できない。
そこで本発明の方法では、単語のカテゴリ列中のカテゴ
リのうち、まだ対応するカテゴリ候補が定まっていない
カテゴリに対しては、ある平均的なスコアを持つカテゴ
リ候補を仮想する。すなわち、カテゴリ候補列のスコア
を求める際に、その長さnがあらかじめ定めた長さNよ
りも短い場合には、そのカテゴリ候補列は単語の一部分
のカテゴリ列に対応するものであると判断し、n及びN
に依存するしあらかじめ設定する関数としての個数のカ
テゴリ候補を仮想する。この結果、対応するカテゴリ候
補列の一部分に悪いスコアのカテゴリ候補が含まれてい
た場合にも、仮想されたカテゴリ候補列のスコアによっ
て平均化されることにより、単語のスコアはそれほど悪
くならない。従って、その単語に対応するカテゴリ候補
列をすばやく求めることができる。
リのうち、まだ対応するカテゴリ候補が定まっていない
カテゴリに対しては、ある平均的なスコアを持つカテゴ
リ候補を仮想する。すなわち、カテゴリ候補列のスコア
を求める際に、その長さnがあらかじめ定めた長さNよ
りも短い場合には、そのカテゴリ候補列は単語の一部分
のカテゴリ列に対応するものであると判断し、n及びN
に依存するしあらかじめ設定する関数としての個数のカ
テゴリ候補を仮想する。この結果、対応するカテゴリ候
補列の一部分に悪いスコアのカテゴリ候補が含まれてい
た場合にも、仮想されたカテゴリ候補列のスコアによっ
て平均化されることにより、単語のスコアはそれほど悪
くならない。従って、その単語に対応するカテゴリ候補
列をすばやく求めることができる。
(実施例) 次に図面を参照して本発明を詳細に説明する。
第1図は本発明の一実施例を示すブロック図である。第
1図に示す実施例では日本語の音声が入力されるものと
し、またカテゴリとしては音節を用いている。
1図に示す実施例では日本語の音声が入力されるものと
し、またカテゴリとしては音節を用いている。
音節候補抽出部101は入力音声中の音節候補を検出
し、その候補をそのスコアの入力音声中での位置ととも
に音節候補記憶部102に記憶する。
し、その候補をそのスコアの入力音声中での位置ととも
に音節候補記憶部102に記憶する。
第2図は音節候補抽出部101の一例を示すブロック図
である。第2図において、入力音声は音声パッファ20
1に一旦格納される。まず、母音候補検出部202が音
声バッファ201に格納された音声中の母音候補を検出
し母音候補記憶部203に格納する。母音候補の検出は
母音パタン記憶部204にあらかじめ格納されている各
母音の音声標準パタンと入力音声の各区間とを照合する
ことによって行われる。母音の音声信号は比較的定常で
あるので検出は容易ある。各母音は少なくとも母音名の
ほか、入力音声中での位置の情報を保持している。
である。第2図において、入力音声は音声パッファ20
1に一旦格納される。まず、母音候補検出部202が音
声バッファ201に格納された音声中の母音候補を検出
し母音候補記憶部203に格納する。母音候補の検出は
母音パタン記憶部204にあらかじめ格納されている各
母音の音声標準パタンと入力音声の各区間とを照合する
ことによって行われる。母音の音声信号は比較的定常で
あるので検出は容易ある。各母音は少なくとも母音名の
ほか、入力音声中での位置の情報を保持している。
母音候補の検出が終了した後、子音候補検出部205に
よって子音候補が次に述べるようにして検出される。日
本語においては、音節は子音(C)−母音(V)の組で
ある。従って入力音声中では、2個の母音に挾まれた区
間のうちのある時間長以下の区間(以下これをVCV区
間と呼ぶ)及び入力音声の始端からある時間長以内にあ
る区間(以下これをCV区間と呼ぶ)までの各に1個の
子音が存在するといえる。子音候補検出部204は母音
候補検出部203に記憶されている母音候補から作られ
るすべてのVCV区間及びCV区間の各々に対して、あ
らかじめ子音パタン記憶部206に記憶されているVC
V及びCV標準音声パタンとの照合を行い、類似度の高
い複数個の音声パタンの名前を子音候補とする。以上で
決定された母音候補と子音候補とを組み合わせて音節候
補とし、入力音声中での位置と共に音節候補記憶部10
2に記憶する。
よって子音候補が次に述べるようにして検出される。日
本語においては、音節は子音(C)−母音(V)の組で
ある。従って入力音声中では、2個の母音に挾まれた区
間のうちのある時間長以下の区間(以下これをVCV区
間と呼ぶ)及び入力音声の始端からある時間長以内にあ
る区間(以下これをCV区間と呼ぶ)までの各に1個の
子音が存在するといえる。子音候補検出部204は母音
候補検出部203に記憶されている母音候補から作られ
るすべてのVCV区間及びCV区間の各々に対して、あ
らかじめ子音パタン記憶部206に記憶されているVC
V及びCV標準音声パタンとの照合を行い、類似度の高
い複数個の音声パタンの名前を子音候補とする。以上で
決定された母音候補と子音候補とを組み合わせて音節候
補とし、入力音声中での位置と共に音節候補記憶部10
2に記憶する。
例として、「ザイセイ(財政)」という音声が入力され
たとする。この場合、音節認識結果として例えば第3図
に示されるような音節候補が抽出される。第3図におい
ては、各音節区間に複数個の音節候補が抽出されてお
り、各音節候補に記されている数字がその候補のスコア
である。
たとする。この場合、音節認識結果として例えば第3図
に示されるような音節候補が抽出される。第3図におい
ては、各音節区間に複数個の音節候補が抽出されてお
り、各音節候補に記されている数字がその候補のスコア
である。
単語記憶部103には検出すべき単語の音節列が記憶さ
れている。いま、単語記憶部103には「セイゲン(制
限)」、「ザイゲン(財源)」、「ゼイセイ(税制)」
「ザイセイ(財政)」の4単語が記憶されているとす
る。
れている。いま、単語記憶部103には「セイゲン(制
限)」、「ザイゲン(財源)」、「ゼイセイ(税制)」
「ザイセイ(財政)」の4単語が記憶されているとす
る。
音節候補列生成部104は、まず、単語記憶部103の
各単語の先頭に対応する音節候補を音節候補記憶部10
2に記憶されている音節候補から選し、各々を長さ1の
音節候補列とする。次にスコア計算部105によってそ
れぞれの音節候補列のスコアを計算する。本実施例で
は、N=4とし、nおよびNに依存してあらかじめ設定
する関数としてのmは、m=N−nを利用し、仮想する
音節候補のスコアは1としている。
各単語の先頭に対応する音節候補を音節候補記憶部10
2に記憶されている音節候補から選し、各々を長さ1の
音節候補列とする。次にスコア計算部105によってそ
れぞれの音節候補列のスコアを計算する。本実施例で
は、N=4とし、nおよびNに依存してあらかじめ設定
する関数としてのmは、m=N−nを利用し、仮想する
音節候補のスコアは1としている。
例えば、単語「セイゲン」の先頭の音節「セ」に対応す
る音節候補セ「3」だけからなる音節候補列のスコア
は、この音節候補と3個のスコア1の仮想的な音節候補
の計4個の音節候補のスコアの平均値であるから、(3
+1+1+1)/4=1.5となる。
る音節候補セ「3」だけからなる音節候補列のスコア
は、この音節候補と3個のスコア1の仮想的な音節候補
の計4個の音節候補のスコアの平均値であるから、(3
+1+1+1)/4=1.5となる。
これらの音節候補列は、そのスコアと対応する単語と共
に、音節候補列記憶部106に記憶される。この結果、
音節候補列記憶部106には、 セ:1.5「セイゲン」 ザ:2.75「ザイゲン」 ゼ:3.75「ゼイセイ」 ザ:2.75「ザイセイ」 の4個の音節候補列が記憶されている。ここで「 」の
中は対応する単語である。
に、音節候補列記憶部106に記憶される。この結果、
音節候補列記憶部106には、 セ:1.5「セイゲン」 ザ:2.75「ザイゲン」 ゼ:3.75「ゼイセイ」 ザ:2.75「ザイセイ」 の4個の音節候補列が記憶されている。ここで「 」の
中は対応する単語である。
次に、音節候補列選択部107は、音節候補列記憶部1
06中の音節候補列のうち、もっともスコアの良い、即
ちその値の小さい音節候補列を取り出し、その音節候補
列及び単語を音節候補列生成部104に送る。音節列候
補列生成部104は受け取った音節候補列を、単語の音
節列に従って更に延長し、改めてそのスコアをスコア計
算部105で計算した後、音節候補列記憶部106に記
憶する。
06中の音節候補列のうち、もっともスコアの良い、即
ちその値の小さい音節候補列を取り出し、その音節候補
列及び単語を音節候補列生成部104に送る。音節列候
補列生成部104は受け取った音節候補列を、単語の音
節列に従って更に延長し、改めてそのスコアをスコア計
算部105で計算した後、音節候補列記憶部106に記
憶する。
いまの場合、 セ:1.5「セイゲン」 が取り出され、新たに、 セイ:3「セイゲン」 が音節列記憶部106に記憶される。この結果、音節候
補列記憶部106には、 ザ:2.75「ザイゲン」 ゼ:3.75「ゼイセイ」 :2.75「ザイセイ」 セイ:3「セイゲン」 が記憶されている。従って次に、この中でもっとも良い
スコアを持つ音節候補列である、 ザ:2.75「ザイゲン」 が取り出される。
補列記憶部106には、 ザ:2.75「ザイゲン」 ゼ:3.75「ゼイセイ」 :2.75「ザイセイ」 セイ:3「セイゲン」 が記憶されている。従って次に、この中でもっとも良い
スコアを持つ音節候補列である、 ザ:2.75「ザイゲン」 が取り出される。
以上の処理を繰り返すと、次に示す音節候補列が作られ
ていく。
ていく。
ザイ:4.25「ザイゲン」 ザイ:4.25「ザイセイ」 セイゲ:4.75「セイゲ」 ザイゲ:6「ザイゲン」 ザイセ:4.25「ザイセイ」 ザイセイ:4.25「ザイセイ」 ここで、音節候補列は単語「ザイセイ」の終端に達し
ているので、音節候補列選択部107はこの単語を検出
結果として出力する。
ているので、音節候補列選択部107はこの単語を検出
結果として出力する。
このように、正しい単語「ザイセイ」が最初に検出され
る。しかも従来の方法では前述のように13の音節候補
を作成した段階で「ザイセイ」が検出されたのに対し
て、本発明の方法では11個の音節候補列を作成した段
階で検出されている。
る。しかも従来の方法では前述のように13の音節候補
を作成した段階で「ザイセイ」が検出されたのに対し
て、本発明の方法では11個の音節候補列を作成した段
階で検出されている。
以上、本発明の一実施例を説明した。この実施例では説
明を簡単にするために音節認識の段階で音節認識誤りが
起こらなかった場合、すなわち入力されたすべての音節
に対して少なくとも正しい音節候補が抽出された場合に
ついて述べたが、音節認識誤りが生じた場合にも、前述
した特願昭61−190258,190259,190
260,190261の「単語検出方式」に述べられて
いる方式を用いることによって、上記実施例と同様に効
率よく正しい単語を検出することができる。
明を簡単にするために音節認識の段階で音節認識誤りが
起こらなかった場合、すなわち入力されたすべての音節
に対して少なくとも正しい音節候補が抽出された場合に
ついて述べたが、音節認識誤りが生じた場合にも、前述
した特願昭61−190258,190259,190
260,190261の「単語検出方式」に述べられて
いる方式を用いることによって、上記実施例と同様に効
率よく正しい単語を検出することができる。
なお、検出対象の単語が多数存在するときには、それら
の単語を木構造形式で表現することにより、すなわち音
節を節点とし、根節点から葉節点までの節点列が各の単
語の音節列を表わすことが一般的であるが、その場合に
も各の音節列についてみれば、本発明の方法を適用する
と上記の実施例と同様の結果となる。
の単語を木構造形式で表現することにより、すなわち音
節を節点とし、根節点から葉節点までの節点列が各の単
語の音節列を表わすことが一般的であるが、その場合に
も各の音節列についてみれば、本発明の方法を適用する
と上記の実施例と同様の結果となる。
(発明の効果) 以上説明したように本発明によれば、正しい単語のカテ
ゴリ列の始端に近いカテゴリに対応する候補のスコアや
他の候補に比べて大幅に悪いときにも、正しい単語を他
の単語よりも先に検出し、しかも生成されるカテゴリ候
補列の数が少なく、効率の良い単語検出を行うことが可
能となる単語検出方式が実現できるという効果がある。
ゴリ列の始端に近いカテゴリに対応する候補のスコアや
他の候補に比べて大幅に悪いときにも、正しい単語を他
の単語よりも先に検出し、しかも生成されるカテゴリ候
補列の数が少なく、効率の良い単語検出を行うことが可
能となる単語検出方式が実現できるという効果がある。
第1図は本発明の一実施例を示すブロック図、第2図は
第1図の実施例における音節候補抽出部の一例を示すブ
ロック図、第3図は入力音声から抽出された音節候補の
一例を示す説明図である。 101……音節候補抽出部、102……音節候補記憶
部、103……単語記憶部、104……音節候補列生成
部、105……スコア計算部、106……音節候補列記
憶部、107……音節候補列選択部、201……音声バ
ッファ、202……母音候補検出部、203……母音候
補記憶部、204……母音パタン記憶部、205……子
音候補検出部、206……子音パタン記憶部。
第1図の実施例における音節候補抽出部の一例を示すブ
ロック図、第3図は入力音声から抽出された音節候補の
一例を示す説明図である。 101……音節候補抽出部、102……音節候補記憶
部、103……単語記憶部、104……音節候補列生成
部、105……スコア計算部、106……音節候補列記
憶部、107……音節候補列選択部、201……音声バ
ッファ、202……母音候補検出部、203……母音候
補記憶部、204……母音パタン記憶部、205……子
音候補検出部、206……子音パタン記憶部。
Claims (1)
- 【請求項1】音節、音素、音素クラス等のカテゴリの列
である入力音声から複数個のカテゴリ候補およびこれら
カテゴリ候補の検出評価における信頼度の尺度としての
スコアと位置情報とを抽出するとともに単語辞書に記憶
されている単語のカテゴリ列を辿りながら単語のカテゴ
リ列に対応するカテゴリ候補列を求めることによって入
力音声中の単語を検出する単語検出方式において、 n個のカテゴリ候補からなるカテゴリ候補列のスコアを
nがあらかじめ定めた数N以上のときにはn個のカテゴ
リ候補のスコアの平均値を用いて算出しnがN未満のと
きにはn個のカテゴリ候補にnおよびNに依存しあらか
じめ設定する関数としての個数m個の仮想的なカテゴリ
候補を加えた(n+m)個のカテゴリ候補のスコアの平
均値を用いて算出して常にこのスコアが最も良いカテゴ
リ候補列を求めるように前記単語辞書中の単語のカテゴ
リ列を辿る手段を備えて成ることを特徴とする単語検出
方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61307047A JPH0632014B2 (ja) | 1986-12-22 | 1986-12-22 | 単語検出方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61307047A JPH0632014B2 (ja) | 1986-12-22 | 1986-12-22 | 単語検出方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS63158597A JPS63158597A (ja) | 1988-07-01 |
| JPH0632014B2 true JPH0632014B2 (ja) | 1994-04-27 |
Family
ID=17964406
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP61307047A Expired - Lifetime JPH0632014B2 (ja) | 1986-12-22 | 1986-12-22 | 単語検出方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0632014B2 (ja) |
-
1986
- 1986-12-22 JP JP61307047A patent/JPH0632014B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPS63158597A (ja) | 1988-07-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6912499B1 (en) | Method and apparatus for training a multilingual speech model set | |
| US20020049590A1 (en) | Speech data recording apparatus and method for speech recognition learning | |
| EP0074769A1 (en) | Recognition of speech or speech-like sounds using associative memory | |
| JPH0632014B2 (ja) | 単語検出方式 | |
| JP2001312293A (ja) | 音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体 | |
| EP0987681B1 (en) | Speech recognition method and apparatus | |
| JPH0632015B2 (ja) | 単語検出装置 | |
| JP2867695B2 (ja) | 連続音声認識装置 | |
| JP3039453B2 (ja) | 音声認識装置 | |
| US20250365360A1 (en) | Method and apparatus for providing voice dial | |
| JP2000099084A (ja) | 音声認識方法及びその装置 | |
| KR960001950B1 (ko) | 음성인식방법 및 그 장치 | |
| JP2979912B2 (ja) | 音声認識装置 | |
| JPH0464077B2 (ja) | ||
| JPS63158599A (ja) | 単語検出方式 | |
| JPS6344698A (ja) | 単語検出方式 | |
| JP3056745B2 (ja) | 音声認識辞書管理装置 | |
| JPH0290384A (ja) | 文字認識装置の後処理方式 | |
| JPH0415960B2 (ja) | ||
| JPS60251484A (ja) | 単語認識装置 | |
| JPH0575119B2 (ja) | ||
| JPS6335996B2 (ja) | ||
| JPS6147992A (ja) | 音声認識方式 | |
| JPS60217490A (ja) | 文字認識装置 | |
| JPS63158600A (ja) | 単語検出装置 |