JPS6283797A

JPS6283797A - 認識装置

Info

Publication number: JPS6283797A
Application number: JP60224554A
Authority: JP
Inventors: 楠原　久代
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1985-10-08
Filing date: 1985-10-08
Publication date: 1987-04-17

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は、認識すべき情報を単位要素ごとに認識して複
数の候補を出力し、単位要素の認識誤りを、単位要素列
で構成された文単位で訂正する認識装置に関するもので
あり、例えば単音節単位で音声入力された仮名文字の認
識誤りを文節単位で訂正する音声ワードプロセッサに利
用される。

従来の技術近年、キーボードからかな文字列を入力し、漢字かな混
じり文を作成する日本語ワードプロセッサの普及がめざ
ましい。しかし、かなキーボードに不慣れな操作者にと
って、キーボード上から所望のかな文字列を捜し出すの
は容易でない。このため、かなキーの代わりに音声によ
って入力を行う音声ワードプロセッサ（以下、音声ワー
プロと称す）の開発が盛んである。

従来の音声ワープロにおいては、例えば入力音声を単音
節単位に認識し、この認識された単音節候補の組合せに
より複数の文節候補を作成し、辞書照合を含む文法処理
を行って文節単位の認識結果を出力している。この際、
一つの単音節に対しＮ個の候補を用いるとすると、Ｍ音
節の文節に対して文節候補数はＮ　個になる。文節長が
長くなると文節候補は莫大な数になってしまい、必要な
メモリ容量や文法処理に要する処理時間も莫大なものに
なる。そこで文節候補数を削減し、文法処理にかかる時
間を減少させる方法として、特開昭６９−５８４９２号
公報に示されるものがある。

これは遷移不可能な音節遷移を含む文節候補を排除する
ものである。

発明が解決しようとする問題点しかしながら、音節遷移を利用した上記の方法において
も、文節長が長くなるに従って、文節候補数は極端に多
くなる。例えば「山小屋の」という文を作成する場合は
以下のようになる。なお遷移可能性は、約３００００語
の辞書を基にしている０ここでは単音節候補の数を５個とする。いま「山小屋の
」を発声した時、各単音節の候補が第２図に示すもので
あったとする。１番目の単音節から２番目の単音節への
遷移を調べると、第４図に示すように９個の遷移不可能
な組み合せがある。

さらに２番目の単音節から３番目の単音節への遷移では
４個、３番目の単音節から４番目の単音節への遷移では
１０個、４番目の単音節から６番目の単音節への遷移で
は９個が遷移不可能である。

文節候補の総数は５５＝３１２５個であるが、遷移不可能な音節遷移を含む文節候補を排
除した場合の文節候補数は以下の通９である。

１番目の単音節から２番目の単音節への遷移可能な組み
合せを第６図Ａに示す。２番目の単音節が「ま」、「な
」、「ら」、「だ」である組み合せは各々４通り、「ば
」である組み合せは１通りである。

次に、２番目の単音節から３番目の単音節への遷移可能
な組み合せを第６図Ｂに示す。３番目の単音節が「ど」
である組み合せは「ま→ど」。

「な→ど」、「ら→ど」、「だ→ど」である。１番目と
２番目の単音節の組み合せのうち、２番目の単音節が「
ま」、「な」、「ら」、「だ」であるものは各々４通り
なので、３番目の単音節が「ど」である組み合せは４＋４＋４＋４＝１　８通りである。同様にして３番目の単音節が「ぞ」である
組み合せは４＋４＋４＝１２　　　（ま→ぞ、な→ぞ。

ら→ぞ）通り、３番目の単音節が「ご」である組み合せは４＋４
＋４＋４：１６（ま→ご、な→ご。

ら→ご、だ→ご）通り、３番目の単音節が「こ」である組み合せは４＋４
＋４＋４＋１＝１７（ま→こ、な→こ、ら→こ、だ→こ
、ば→こ）通り、３番目の単音節が「ろ」である組み合せは４＋４
＋４＋４＋１＝１７（ま→ろ、な→ろ、ら→ろ、だ→ろ
、ば→ろ）通りとなる。

さらに、３番目の単音節から４番目の単音節への遷移可
能な組み合せを第５図Ｃに示す。上記と同様に、４番目
の単音節が「や」、「だ」、「な」である組み合せは各
々１　６＋１　２＋１　６＋１　７＋１　７＝７８通りと
なり、「にゃ」、「みゃ」である組み合せは存在しない
。

最後に、４番目の単音節から５番目の単音節への遷移可
能な組み合せを第５図りに示す。６番目の単音節が「ろ
」、「の」、「も」、「ご」である組み合せは各々７８＋７８＋７８＝２３４通り、「ど」である組み合せは了８＋７８＝１５６通りである。

したがって、遷移不可能な文節候補を排除した場合の文
節候補数は２３４＋２３４＋２３４＋２３４＋１５６＝１０９２通
りであり、約２／３　の文節候補が排除されている。

次に「山小屋」という文を作成する場合について文節候
補数を求めてみる。「山小屋」を発声した時、各単音節
の候補が第２図に示すものであったとする。このとき文
節候補の総数は６４＝　６２５個、遷移不可能な文節候補を排除した場合の文節候補数
は２３４個である。即ち文節長が１音節長くなっただけ
で文節候補数は４倍以上になっている。文節長がさらに
長くなれば文節候補数は美大な数になると予想される。

以上のように、従来の音節遷移による候補削減方法にお
いては、文節長が長くなるに従って文節候補数は極端に
多くなり、必要なメモリ容量や文法処理に要する処理時
間も大きくなる。

本発明はかかる点に鑑み、新たな単音節が入力される度
に文法処理を行うことにより、文節候補数を大きく削減
し必要なメモリ容量を削減するとともに、文法処理の総
回数を削減することを目的とする。

問題点を解決するだめの手段単位要素列で構成された文単位で訂正する手段を備え、
この訂正する手段は、ｍ　＋　１番目の単位要素が認識
された時、ｍ番目の文単位の候補とｍ＋１番目の単位要
素の認識候補とからｍ　＋　１番目の文単位の候補を作
成する文単位候補作成部と、新に作成されだ文単位候補
の各々が正しい文単位と一致又は正しい文単位の一部で
あるかどうかを調べ、正しい文単位と一致せず正しい文
単位の一部でもない文単位候補を排除する文法処理部と
、排除されずに残された文単位候補をｍ　＋　１番目の
文単位候補として記憶する文単位候補記憶部を有するこ
とを特徴とする認識装置である。

作　　用本発明は、上記した構成により、新たな単位要素が認識
される度に、それ以上単位要素が入力されても正しい文
単位となり得ない文単位候補が排除され、単位要素列の
長さが長くなっても文単位候補数は極端に多くなること
がない。

実施例第１図は、本発明の一実施例における音声ワープロのブ
ロック図を示すものである。第１図において１は音声を
単音節単位で認識する音声認識部である。単音節認識装
置は公知の技術であり、例えば日本音響学会講演論文集
（昭和６８年３月）の講演番号２−２−７記載の装置が
ある。２は音声認識部１から出力される複数の単音節候
補と、後述の文節候補記憶部に記憶されている文節候補
から、新たな文節候補を作成する文節候補作成部、３は
文節候補作成部２によって作成された文節候補に対し文
法処理を行って文節候補を削減する文法処理部、４は文
法処理部３により文節候補と判定されたものを記憶する
文節候補記憶部、５は文節の区切りと文節候補の出力を
指示する訂正キー、６は文節候補キー５の指示に従って
文節候補記憶部のうち、日本語文節として正しいものを
優先順位の高いものから順に取り出す訂正制御部、７は
音声認識結果や文節訂正部６によって取りだされた文節
候補をかな漢字変換するかな漢字変換部、８はかな漢字
変換された文字列を未確定文字列として一時記憶する未
確定文字列記憶部、９は未確定文字列等を表示するＣＲ
Ｔディスプレイ、１゜は文節の確定を指示する確定キー
、１１は確定キー１０の指示により未確定文字列全確定
して保存する文書保存部である。

以上のように構成された本実施例の音声ワープロについ
て、「山小屋の」という文章を作成する場合を例にとっ
て以下その動作を説明する。「山小屋の」を発声した時
の各単音節の候補は、従来例の説明と同様第２図に示す
ものとする。また、ある文字列が日本語文節であるかど
うかの判定は、従来例の説明時における遷移可能性と同
じ、約３００００語の辞書を基にしている。

マイクから一つ目の単音節「や」が入力されると、音声
認識部１はこれを認識し、認識候補「みゃ」、「や」、
「にゃ」、「ん」、「だ」が出力される。かな漢字変換
部７は第１位の認識候補「みゃ」をかな漢字変換しよう
とするが、該当する漢字がないので「みゃ」を未確定文
字列記憶部８に出力する。ＣＲＴディスプレイ９は「み
ゃ」を表示する。一方、文節候補作成部２は５個の単音
節候補をそれぞれ文節候補とする。文法処理部３はこれ
ら６個の文節候補に対し、各々が日本語文節或いは日本
語文節の一部であるかどうか、即ち文節となる可能性が
あるかどうかを調べる。ある文字列が日本語文節である
かどうかを調べることは、文節単位のかな漢字変換技術
を用いれば容易に実現できる。またある文字列が日本語
文節の一部であるかどうかを調べることは、いわゆるベ
タ書きと呼ばれるかな漢字変換方式において通常用いら
れる技術である。第２図の例の場合、文節の先頭に「ん
」が来ることは有り得ないので「ん」は文節候補から排
除される。文節候補記憶部４は後の４個を文節候補とし
て記憶する。

次に２番目の単音節「ま」が入力されると、音声認識部
はこれを認識し、認識候補「ま」、「な」。

「ら」、「だ」、「ば」が出力される。かな漢字変換部
７は「みゃま」をかな漢字変換しようとするが、該当す
る漢字がないので「みゃまＪを未確定文字列記憶部８に
出力する。ＣＲＴディスプレイ９は「みゃま」を表示す
る。一方、文節候補作成部２は、文節候補記憶部４に記
憶されている４個の文節候補と、新たに入力された６個
の単音節候補を組み合せて２０個の文節候補を作成する
。

文法処理部３はこれら２０個の文節候補に対し、各々が
日本語文節或いは日本語文節の一部であるかどうかを調
べる。ここでは、「みゃま」、「にゃま」、「やば」、
「だば」など１４個の文節候補が排除され、文節候補記
憶部４は第３図に示す６個の文節候補を記憶する。これ
らのうち例えば「やな」は「柳」の一部になっている。

次に３番目の単音節「ご」が入力されると、音声認識部
はこれを認識し、認識候補「どＪ、「ぞＪ。

「ご」、「こ」、「ろ」が出方される。かな漢字変換部
７は「みゃまど」をかな漢字変換しようとするが、該当
する漢字がないので「みゃまど」を未確定文字列記憶部
８に出方する。ＣＲＴディスプレイ９は「みゃまど」を
表示する。一方、文節候補作成部２は、文節候補記憶部
４に記憶されている６個の文節候補と、新たに入力され
た６個の単音節候補を組み合せて３０個の文節候補を作
成する。文法処理部３はこれら３０個の文節候補に対し
、各々が日本語文節或いは日本語文節の一部であるかど
うかを調べる。ここでは、「やまぞ」。

「やだと」、「だだぞ」など２４個の文節候補が排除さ
れ、文節候補記憶部４は第３図に示す６個の文節候補を
記憶する。

次に４番目の単音節「や」が入力された場合も同様の処
理が行われ、第３図に示すように文節候補記憶部４は「
やまごや」、「やなどや」、「やなどだ」の３個の文節
候補を記憶する。

最後の単音節「の」が入力された場合も同様の処理が行
われ、第３図に示すように文節候補記憶部４は「やまご
やの」、「やまごやも」、「やなどだろ」の３個の文節
候補を記憶する。

「やまごやの」を発声し終えた時、ＣＲＴディスプレイ
９上には単音節第１候補の列「みゃまどやろ」が表示さ
れている。所望の文字列「山小屋の」ではないので、操
作者は訂正キー６を押す。

訂正制御部６は文節候補記憶部４に記憶されている３個
の文節候補のうち、日本語文節として正しいものを優先
順位の高いものから順に取９出す。

優先順位は例えば単音節認識の際に計算された各単音節
候補の尤度や、単音節候補の順位を基に求められる。第
３図の例の場合、「やなどだろ」は例えば「矢なのだろ
う」の一部ではあるが、このままでは日本語文節として
正しくない。したがって「やまごやのｊと「やまごやも
」が取り出される。「やまごやの」の方が優先順位が高
いので、最初に取シ出され、かな漢字変換されて「山小
屋の」が未確定文字列記憶部８に出方されＣＲＴディス
プレイ９上に表示される。訂正キー６を押しても所望の
文字列が得られない場合には、さらに訂正キーを押すと
次の文字列が表示される。所望の文字列が得られたので
、操作者は確定キー１０を押す。文書保存部１１は「山
小屋の」を確定して保存する。

以上のようにして「山小屋の」が作成される。

以上のように本実施例によれば、新な単音節が認識され
る度に、それ以上単音節が入力されても正しい文節とな
り得ない文節候補が排除されるため、文節候補作成部が
作成する文節候補の数は、上記の場合最大３０個である
。したがって、文節候補を記憶するメモリ容量は従来の
約１／３６でよい。また文法処理の回数は、文節候補削
減時に１００回、訂正時に３回の合計１０３回であり従
来の約１／１ｏである。

従来例においては文節長が長くなるに従って文節候補数
が多くなっていた。本実施例によれば、文節長がある程
度以上長くなると、それ以上単音節が入力されても正し
い文節となシ得ない文節候補が増えるので、文節候補数
は逆に減少する。したがって文節長が長くなるほど本実
施例の効果は顕著に現われる。

なお本実施例においては音節遷移情報を利用していない
が、文節候補作成部が作成した文節候補からまず遷移不
可能な音節遷移を含むものを排除し、残った文節候補に
対して文法処理による候補削減を行ってもよい。

発明の詳細な説明したように、本発明は、新な単位要素が認識され
る度に、それ以上単位要素が入力されても正しい文単位
となり得ない文単位候補を排除することによシ、単位要
素列の長さが長くなっても文単位候補数は極端に多くな
ることのない認識装置であり、その実用的効果は大きい
。

【図面の簡単な説明】

第１図は本発明における一実施例の音声ワードプロセッ
サの構成を表すブロック図、第２図は同実施例及び従来
例の動作を説明するだめの単音節候補を示す説明図、第
３図は同実施例の文節候補を示す説明図、第４図は従来
例の遷移不可能な音節の組み合せを示す説明図、第６図
は従来例の文節候補数を求める際の説明図である。１・・・・・・音声認識部、２・・・・・・文節候補作
成部、３・・・・・・文法処理部、４・・・・・・文節
候補記憶部、６・旧・・訂正制御部。代理人の氏名　弁理士　中　尾　敏　男　はが１名第１
図第　２１１１第３図第４図第５図第５図（７Ｓ）Ｄ（０）（７δ）（７Ｓ）ヤ（−べ促

Claims

【特許請求の範囲】

（１）認識すべき情報を単位要素ごとに認識して複数の
候補を出力する単位要素認識手段と、単位要素の認識誤
りを、単位要素列で構成された文単位で訂正する手段を
備え、この訂正する手段は、ｍ＋１番目の単位要素が認
識された時、ｍ番目の文単位の候補とｍ＋１番目の単位
要素の認識候補とからｍ＋１番目の文単位の候補を作成
する文単位候補作成部と、新たに作成された文単位候補
の各々が正しい文単位と一致又は正しい文単位の一部で
あるかどうかを調べ、正しい文単位と一致せず正しい文
単位の一部でもない文単位候補を排除する文法処理部と
、排除されずに残された文単位候補をｍ＋１番目の文単
位候補として記憶する文単位候補記憶部を含むことを特
徴とする認識装置。
（２）単位要素は単音節であり、文単位は文節又は単語
であるところの特許請求の範囲第１項記載の認識装置。