JPS6344700A

JPS6344700A - 単語検出方式

Info

Publication number: JPS6344700A
Application number: JP61190258A
Authority: JP
Inventors: 畑崎　香一郎
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1986-08-12
Filing date: 1986-08-12
Publication date: 1988-02-25
Anticipated expiration: 2009-07-27
Also published as: JPH0656556B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は音声認識装置、音声入力装置等において用いら
れ、入力音声中に含まれる単語とその惧語の音声中での
位置とを検出する単語検出方式に関する。

（従来の技術）音声認識装置、音声入力装置等において入力音声中の単
シ５とその位置を検出する方法に１．音節、音素、音素
クラス等のカテゴリの列である入力音声から各カテゴリ
とそれらの入力音声中での位置情報とを抽出し、抽出さ
れたカテゴリから作成したカテゴリ列がある単語のカテ
コ゛りン１］に対応すれば、その単語と入力音声中１ご
のカテゴリ列の位置とを検出結果として田力ｒる方法が
ある。

一般１、：上述のカテゴリは、その時間長が短かく、ま
た類似するカテゴリが存在することなどから、入力音声
中のカテゴリを完全に誤りなく抽出することは困難であ
る。このため、従来は、入力音声中の各カテゴリの区間
に対して複数個のカテゴリ候補を抽出しておき、入力音
声の端から頚に、カテゴリ候補を用いて部分的なカテゴ
リ候補列を生成しては単語のカテゴリタｑとの照合を行
なうという処理を繰り返すことによって、その単語に対
応するカテゴリ候補列を見つけていた。この方法の詳細
は、例えば、文献１１特願昭５８＝２１４５４４号、バ
タン認識装置、に述べられているので、ここでは省略す
る。

また、入力音声中のカテゴリ抽出の段階において、発声
のなまけや隣接するカテゴリ（例えば音節）どうしの調
音結合などの原因によって、あるカテゴリが消失してい
たり、あるいはその存在が検出できなかった結果、その
前後のカテゴリが隣接するものとして抽出きれてしまう
ことがある。

この現象を以後、カテゴリの脱落と呼ぶ。

このことに対処するため、従来は、どのようなカテゴリ
の並びのときにカテゴリ脱落が起こるかということをあ
らかじめ調査し、その結果から比較的頻度の高いカテゴ
リ脱落について、そのカテゴリ脱落の起こっているカテ
ゴリ列を脱落したカテゴリが復元されたカテゴリ列に変
換するカテゴリタ９訂正規則を用意する。この規則を、
単語検出時に、カテゴリ候補列に適用することによって
、比較的頻度の高いカテゴリ脱落に対しては、脱落した
カテゴリを復元することができる。この方法の詳細は、
例えば文献２ｒ並木、浜田、中津、“音声認識を用いた
日本語入力方式”、信学論Ｖｏ１．　Ｊ　６７　　Ｄ　
　Ｎｏ、　４　、１９８４．４　Ｊに述べられているの
で、ここでは省略する。

（発明が解決しようとしている問題点）上記従来の方法
では、入力音声から抽出されたカテゴリ候補を用いてカ
テゴリ候補列を生成したのちに、単語のカテゴリ列との
照合を行なっていたために、最終的に無駄になるカテゴ
リ候補列が多数生成きれてしまい、そのために多大な計
算量を必要としていた。

また、検出すべき単語の区間が入力音声の一部分しか占
めない場合でも、従来は、その単語の存在しない区間を
含め、入力音声の端からすべてのカテゴリ候補について
等しく単語中のカテゴリとの照合を行なわねばならず、
無駄な計算時間を必要とし、Ｉ−ｉの検出まで長い時間
を必要としていた。

さらに、前記のカテゴリ列訂正規則は、カテゴリ脱’１
ｇの起こっているカテゴリ候補列だけではなくて、起こ
っていないカテゴリ候補列にも等しく適用される。また
、−つのカテゴリ候補列に対しては多くの場合、複数個
の訂正規則が個別に適用きれる。このため、一つのカテ
ゴリ候補列から多くのカテゴリ候補タリが生成されてし
まい、検出すべき！Ｘ語に対応するカテゴリ候補列が見
つかるまで、多くのカテゴリ候補列を検査しなければな
らない。しかもそのカテゴリ候補列のほとんどは、検出
すべき単語のカテゴリ列とは一致せずに最終的に無駄に
なるものである。

また、訂正規則で復元できるカテゴリは、比較的頻繁に
起こるカテゴリ脱落によるものに限られ、比較的まれに
起こる脱落に対しては復元は不可能である。復元できる
脱落を増やすためには訂正規則の数を増加させなければ
ならず、この結果、生成きれるカテゴリ候補列はますま
す増加する。

例えば、「オンセイニンシキトワ（音声認識とは）、と
発声移れた音声から、その中の音節候補を抽出しようと
したところ、音節“シ”の！！統待時間長短く、音節“
シ”とその前後の音節“ン”と“キ”のそれぞれとの音
節境界が接近していたために、音節“シ”の存在が検出
できずに、その前後の音節“ン”と“キ”の音節候補が
隣接する位置に抽出されたとする。この結果、音節“シ
”以外のすべての音節に対しては正しい音節候補が得ら
れた場合でも、生成される音節候補列は“オンセイニン
キトワ゛となり、脱落した音節“シ”を訂正規則で復元
しなければならない。しかしながら、このような音節の
脱落は比較的まれな種類のものであり、この脱落を訂正
する規則が用意されていることが少ないと思われる。ま
た、たとえ、この訂正規則が用意きれていても、その他
に、例えば、“ニン”→“ニイン”、“イ”→“イイ”
という訂正規則が用意されていることは多く、これらが
適用きれることによって、“オンセイイニンキトワ″、
“オンセイニイントワ”、“オンセイイニイントワ”な
どの無駄な音節候補列も生成きれてしまう。

本発明の目的は、無駄なカテゴリ候補列を生成せず、ま
た、検出すべき単語の区間が入力音声全体のごく一部で
ある場合や、きらに入力音声中の検出すべき単語中のい
くつかのカテゴリが脱落した場合でも、効率よく入力音
声から単語と−１の位置とを検出することを可能にする
！Ｘ語検出方式を提供することにある。

（問題点を解決するための手段）前述の問題点を解決し上記目的を達成するために本発明
が提供する手段は、音節、音素、音素クラス等のカテゴ
リの列である入力音声から抽出した複数個のカテゴリ候
補とそれらの位置情報とを用いて、単語のカテゴリタ［
１に対応するカテゴリ候補列を生成することによって、
入力音声中の単語とその出現位置を検出する単語検出方
式であって、入力音声から得た複数個のカテゴリ候補の
それぞれをそのカテゴリ名で分類して記ｔαし、単語中
のカテゴリの並びの顕に従って各カテゴリに対応するカ
テゴリ候補をそのカテゴリと同じ名前に分類されて記憶
されているカテゴリ候補の中から選ぶとともに、単語中
の連続する３個のカテゴリの並びの最初と最後のカテゴ
リが、入力音声中の連続する２個のカテゴリ候補の並び
のそれぞれのカテゴリ候補に対応するときは、その３個
のカテゴリの並びと２個のカテゴリ候補の並びとを対応
させて、カテゴリ候補列の生成を行なうことを特徴とす
る。

（作用）本発明の方式では、入力音声から抽出きれたカテゴリ候
補のうち、検出すべき単語に含まれるカテゴリと同じ名
前のカテゴリ候補だけを用いて、かつ単語中のカテゴリ
の並びを辿りながら対応するカテゴリ候補タロを生成す
る。このことによって、単語のカテゴリ列あるいはその
部分列に対応するカテゴリ候補列だけが生成されること
になり、無駄なカテゴリ列を生成することを避けること
が可能となる。

また、入力音声中のカテゴリ候補のうち、単語中のカテ
ゴリに対応するカテゴリ候補からカテゴリ候補列を生成
してゆくために、検出すべき単語の区間が入力音声の全
体のごく一部の場合であっても、また、その区間が入力
音声中のどの位置にあっても、素早くその単語を検出す
ることが可能となる。

入力音声中の単語の中のあるカテゴリが脱落した場合、
そのカテゴリの前後にそれぞれ隣接する２個のカテゴリ
に対するカテゴリ候補は入力音声中で互いに隣り合う。

すなわち、単語中のカテゴリ列をＣ＋−Ｉ　ＣＩ　ＣＩ
ｏｌとし、カテゴリＣ１が脱落すると、Ｃ＋＋ＩはＣＩ
−１に後続するものとして、それぞれのカテゴリ候補が
抽出される。

そこで、検出すべき単語中のカテゴリの並びを辿りなが
ら、その単語に対応するカテゴリ候補列を生成するとき
に、上記のＣＩ＋　Ｈに対応するカテゴリ候補がＣｌ−
１に対応するカテゴリ候補に入力音声中で後続するなら
ば、その２個のカテゴリ候補の並びを単語中のカテゴリ
列Ｃ＋−＋　Ｃ、Ｃ、、、に対応させる。このことによ
って、カテゴリＣ５が脱落していても、カテゴリ候補列
とカテゴリ列との正しい対応をとることが可能になる。

また、単語のカテゴリ列に対応するカテゴリ候補列だけ
が生成きれることになるため、無駄なカテゴリ候補列の
生成を避けることができる。

（実施例）以下、図面を参照しつつ、実施例に従って本発明を一層
詳細に説明する。

第１図は本発明の一実施例を示すブロック図である。

本実施例では日本語の音声の入力がされるものとして、
カテゴリとして音節を用いる。

音節抽出部１は入力音声中の音節候補を検出し、その候
補を音節候補記憶部２に記憶する。例として、“オンセ
イニンシキトハ”（音声Ｔ２ｍとは）という音声が入力
されたとする。この場合、音節認識の結果として例えば
第２区に示されるような音節候補が抽出される。第２図
において、矢印の線が各音節候補の区間であり、各区間
に複数個の音節候補が抽出されている。これらの音節候
補は、音節者で分類されて、音節候補記憶部２に記憶さ
れる。この結果、音節候補記憶部２の内容は第３図に示
されるようになる。この図では、各音節候補を“音節基
／始端時刻：終端時刻”の形式で表現している。

単語記憶部３には検出すべき単語の音節列が記憶されて
いる。その中の１個の単語を単語バッファ４に取り出し
た後、入力音声にこのａｉ語が含まれるかどうかが調べ
られる。今、単語バッファ４には！！Ｌ語ｒ認識」の音
節列“ニンシキ”が記憶されているとする。

音節候補列生成部５は単語バッファ４に記憶されている
一屯語中の音節の並びの順に、音節候補記憶部２中の音
節候補から音節候補列を作成し、その結果の音節候補列
と対応する音節列とを音節候補列記憶部６に記憶する。

本実流側では、単Ｊ１の先頭の音節から順に音ｆｆｉ列
を作成（７てゆく。

まず、単語バッファ４の先頭の音節は“二“であるから
、音節候補列生成部５は音節俣？＋！ｉ記憶部２中で“
二”に分類されて記憶きれている音節候補を取り出し、
それぞれを長さ１の音節候補列として音節“二”ととも
に音節俣補列記士α部６に記憶する。この結果、音節候
補列記憶部６には、■二／２：４（ニ） ■二／１０：１３（ニ）の２個の音節候補列が記憶される。ここで、括弧の中が
対応する音節列である。

次に、音節候補列生成部５はＭ６Ｄバッファ４中の次の
音節ン゛′とその次の音節“シ″に注目し、音節候補記
憶部２中で“ン”あるいは“シ”に分類きれて記憶され
ている音節候補のそれぞれについて、音節候補記憶部Ｇ
中のいずれかの音節候補夕Ｕの最後尾の音節候補に入力
音声中で後読しているかどうかを調べる。後続している
音節候補があれば、その音節候補を音節候補列の最後尾
に連結して新たな音節候補列を生成し音節候補列記憶部
６に記憶する。“ン”あるいは“シ”に分類されて記憶
されている音節候補列は、ン／２：４、ン／１３：１６
、シ／４ニアの３個である。

音節候補Ａが他の音節候補Ｂに後読しているかどうかは
音節候補Ａの終端時刻と音節候補Ｂの始端時刻とを比較
することによって判定することができる。ここでは、そ
れらの時刻の差がプラスマイナス１以下のときに後読す
ると判定する。そこで今の場合は、音節候補ン／１３：
１６を音節候補列■に連結して音節列“ニン”に対応さ
せ、音節候補シ／４ニアを音節候補■に連結し工、音節
列４ニンシ”に対応させろ。また、それまで音節候補列
記憶部６に記憶きれていた音節候補列は削除する。この
結果、音節候補列記憶部６の中には、■二／１０：ｉ３
−ン／′１３：１６にン′）■二／２：４−シ／４ニア
にンン）の２個の音節候補列が残る。

読いて、音節“シ”についての処理に進む６音節候補記
憶部２中で、“シ”あるいはその次の音節“キ“′に分
類されて記憶されている音節候補は、シ／４ニアとキ／
１６：１９の２個である。このそれぞれについて音節候
補列■あるいは■の最後尾の音節候補に入力音声中で後
読するかを調べると、キ／１６：１９が音４５侯補列■
の最後尾の音節候補ン／１３　：　ｉ６に後続すると判
定される。この結果、音節候補列■に音節候補キ／１６
　：　１９を連結してできた新たな音節候補列■を、音
節不１１″ニンシキ”と対応させて、音罪列記憶部６に
記憶する。

従って、音節候補列記憶部６の内容は ■二／１０：１Ｂ−ン／１３：１６−キ／１６：１９に
ンシキ）となる。

ここで、単語バッファ４の中の最後の音節に達している
ため、音節候補列生成部５は、屯Ｂｎ１認識、が入力音
＞’４３中の時刻１０から時刻１９に至る区間に存在す
るということを出力ず乙。

ｊ〕（上、本発明の一実施併ｊを説明した。なお、音節
の脱落は、連続しないかぎり、１個の爪語中に複数細土
じていてもよい。

（発明の効果）以上説明したように、本発明によれば、入力音声からの
音節候補抽出の段階で、検出すべき単語中の連続しない
いくつかの音節が脱落した場合でも、その単語の存在と
入力音声中での位置を検出することが可能となり、しか
も検出処理の途中で生成される音節候補列の数が極めて
少なくて、効率の良い単語検出を行なうことが可能とな
る、単語検出方式を提供することができる。

【図面の簡単な説明】

第１図は本発明の一実施例を示すブロック図、第２図は
第１図実施例における入力音声と抽出された音節候補の
一例を示す図、第３図は第１図実施例における音節候補
記憶部の内容の一例を示す図である。１・・・音節検出部、２・・・音節候補記憶部、３・・
・単語記憶部、４・・・単語バッファ、５・・・音節列
生成部、６・・・音節列記憶部。入力音声第１図第２図第３図

Claims

【特許請求の範囲】

音節、音素、音素クラス等のカテゴリの列である入力音
声から抽出した複数個のカテゴリ候補とそれらの位置情
報とを用いて、単語のカテゴリ列に対応するカテゴリ候
補列を生成することによって、入力音声中の単語とその
出現位置を検出する単語検出方式において、入力音声か
ら得た複数個のカテゴリ候補のそれぞれをそのカテゴリ
名で分類して記憶し、単語中のカテゴリの並びの順に従
って各カテゴリに対応するカテゴリ候補をそのカテゴリ
と同じ名前に分類されて記憶されているカテゴリ候補の
中から選ぶとともに、単語中の連続する３個のカテゴリ
の並びの最初と最後のカテゴリが、入力音声中の連続す
る２個のカテゴリ候補の並びのそれぞれのカテゴリ候補
に対応するときには、その３個のカテゴリの並びと２個
のカテゴリ候補の並びとを対応させて、カテゴリ候補列
の生成を行なうことを特徴とする単語検出方式。