JPS6283797A - 認識装置 - Google Patents

認識装置

Info

Publication number
JPS6283797A
JPS6283797A JP60224554A JP22455485A JPS6283797A JP S6283797 A JPS6283797 A JP S6283797A JP 60224554 A JP60224554 A JP 60224554A JP 22455485 A JP22455485 A JP 22455485A JP S6283797 A JPS6283797 A JP S6283797A
Authority
JP
Japan
Prior art keywords
unit
candidates
clause
monosyllable
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60224554A
Other languages
English (en)
Inventor
楠原 久代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60224554A priority Critical patent/JPS6283797A/ja
Publication of JPS6283797A publication Critical patent/JPS6283797A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、認識すべき情報を単位要素ごとに認識して複
数の候補を出力し、単位要素の認識誤りを、単位要素列
で構成された文単位で訂正する認識装置に関するもので
あり、例えば単音節単位で音声入力された仮名文字の認
識誤りを文節単位で訂正する音声ワードプロセッサに利
用される。
従来の技術 近年、キーボードからかな文字列を入力し、漢字かな混
じり文を作成する日本語ワードプロセッサの普及がめざ
ましい。しかし、かなキーボードに不慣れな操作者にと
って、キーボード上から所望のかな文字列を捜し出すの
は容易でない。このため、かなキーの代わりに音声によ
って入力を行う音声ワードプロセッサ(以下、音声ワー
プロと称す)の開発が盛んである。
従来の音声ワープロにおいては、例えば入力音声を単音
節単位に認識し、この認識された単音節候補の組合せに
より複数の文節候補を作成し、辞書照合を含む文法処理
を行って文節単位の認識結果を出力している。この際、
一つの単音節に対しN個の候補を用いるとすると、M音
節の文節に対して文節候補数はN 個になる。文節長が
長くなると文節候補は莫大な数になってしまい、必要な
メモリ容量や文法処理に要する処理時間も莫大なものに
なる。そこで文節候補数を削減し、文法処理にかかる時
間を減少させる方法として、特開昭69−58492号
公報に示されるものがある。
これは遷移不可能な音節遷移を含む文節候補を排除する
ものである。
発明が解決しようとする問題点 しかしながら、音節遷移を利用した上記の方法において
も、文節長が長くなるに従って、文節候補数は極端に多
くなる。例えば「山小屋の」という文を作成する場合は
以下のようになる。なお遷移可能性は、約30000語
の辞書を基にしている0 ここでは単音節候補の数を5個とする。いま「山小屋の
」を発声した時、各単音節の候補が第2図に示すもので
あったとする。1番目の単音節から2番目の単音節への
遷移を調べると、第4図に示すように9個の遷移不可能
な組み合せがある。
さらに2番目の単音節から3番目の単音節への遷移では
4個、3番目の単音節から4番目の単音節への遷移では
10個、4番目の単音節から6番目の単音節への遷移で
は9個が遷移不可能である。
文節候補の総数は 55=3125 個であるが、遷移不可能な音節遷移を含む文節候補を排
除した場合の文節候補数は以下の通9である。
1番目の単音節から2番目の単音節への遷移可能な組み
合せを第6図Aに示す。2番目の単音節が「ま」、「な
」、「ら」、「だ」である組み合せは各々4通り、「ば
」である組み合せは1通りである。
次に、2番目の単音節から3番目の単音節への遷移可能
な組み合せを第6図Bに示す。3番目の単音節が「ど」
である組み合せは「ま→ど」。
「な→ど」、「ら→ど」、「だ→ど」である。1番目と
2番目の単音節の組み合せのうち、2番目の単音節が「
ま」、「な」、「ら」、「だ」であるものは各々4通り
なので、3番目の単音節が「ど」である組み合せは 4+4+4+4=1 8 通りである。同様にして3番目の単音節が「ぞ」である
組み合せは 4+4+4=12   (ま→ぞ、な→ぞ。
ら→ぞ) 通り、3番目の単音節が「ご」である組み合せは4+4
+4+4:16(ま→ご、な→ご。
ら→ご、だ→ご) 通り、3番目の単音節が「こ」である組み合せは4+4
+4+4+1=17(ま→こ、な→こ、ら→こ、だ→こ
、ば→こ) 通り、3番目の単音節が「ろ」である組み合せは4+4
+4+4+1=17(ま→ろ、な→ろ、ら→ろ、だ→ろ
、ば→ろ) 通りとなる。
さらに、3番目の単音節から4番目の単音節への遷移可
能な組み合せを第5図Cに示す。上記と同様に、4番目
の単音節が「や」、「だ」、「な」である組み合せは各
々 1 6+1 2+1 6+1 7+1 7=78通りと
なり、「にゃ」、「みゃ」である組み合せは存在しない
最後に、4番目の単音節から5番目の単音節への遷移可
能な組み合せを第5図りに示す。6番目の単音節が「ろ
」、「の」、「も」、「ご」である組み合せは各々 78+78+78=234 通り、「ど」である組み合せは 了8+78=156 通りである。
したがって、遷移不可能な文節候補を排除した場合の文
節候補数は 234+234+234+234+156=1092通
りであり、約2/3 の文節候補が排除されている。
次に「山小屋」という文を作成する場合について文節候
補数を求めてみる。「山小屋」を発声した時、各単音節
の候補が第2図に示すものであったとする。このとき文
節候補の総数は 64= 625 個、遷移不可能な文節候補を排除した場合の文節候補数
は234個である。即ち文節長が1音節長くなっただけ
で文節候補数は4倍以上になっている。文節長がさらに
長くなれば文節候補数は美大な数になると予想される。
以上のように、従来の音節遷移による候補削減方法にお
いては、文節長が長くなるに従って文節候補数は極端に
多くなり、必要なメモリ容量や文法処理に要する処理時
間も大きくなる。
本発明はかかる点に鑑み、新たな単音節が入力される度
に文法処理を行うことにより、文節候補数を大きく削減
し必要なメモリ容量を削減するとともに、文法処理の総
回数を削減することを目的とする。
問題点を解決するだめの手段 単位要素列で構成された文単位で訂正する手段を備え、
この訂正する手段は、m + 1番目の単位要素が認識
された時、m番目の文単位の候補とm+1番目の単位要
素の認識候補とからm + 1番目の文単位の候補を作
成する文単位候補作成部と、新に作成されだ文単位候補
の各々が正しい文単位と一致又は正しい文単位の一部で
あるかどうかを調べ、正しい文単位と一致せず正しい文
単位の一部でもない文単位候補を排除する文法処理部と
、排除されずに残された文単位候補をm + 1番目の
文単位候補として記憶する文単位候補記憶部を有するこ
とを特徴とする認識装置である。
作  用 本発明は、上記した構成により、新たな単位要素が認識
される度に、それ以上単位要素が入力されても正しい文
単位となり得ない文単位候補が排除され、単位要素列の
長さが長くなっても文単位候補数は極端に多くなること
がない。
実施例 第1図は、本発明の一実施例における音声ワープロのブ
ロック図を示すものである。第1図において1は音声を
単音節単位で認識する音声認識部である。単音節認識装
置は公知の技術であり、例えば日本音響学会講演論文集
(昭和68年3月)の講演番号2−2−7記載の装置が
ある。2は音声認識部1から出力される複数の単音節候
補と、後述の文節候補記憶部に記憶されている文節候補
から、新たな文節候補を作成する文節候補作成部、3は
文節候補作成部2によって作成された文節候補に対し文
法処理を行って文節候補を削減する文法処理部、4は文
法処理部3により文節候補と判定されたものを記憶する
文節候補記憶部、5は文節の区切りと文節候補の出力を
指示する訂正キー、6は文節候補キー5の指示に従って
文節候補記憶部のうち、日本語文節として正しいものを
優先順位の高いものから順に取り出す訂正制御部、7は
音声認識結果や文節訂正部6によって取りだされた文節
候補をかな漢字変換するかな漢字変換部、8はかな漢字
変換された文字列を未確定文字列として一時記憶する未
確定文字列記憶部、9は未確定文字列等を表示するCR
Tディスプレイ、1゜は文節の確定を指示する確定キー
、11は確定キー10の指示により未確定文字列全確定
して保存する文書保存部である。
以上のように構成された本実施例の音声ワープロについ
て、「山小屋の」という文章を作成する場合を例にとっ
て以下その動作を説明する。「山小屋の」を発声した時
の各単音節の候補は、従来例の説明と同様第2図に示す
ものとする。また、ある文字列が日本語文節であるかど
うかの判定は、従来例の説明時における遷移可能性と同
じ、約30000語の辞書を基にしている。
マイクから一つ目の単音節「や」が入力されると、音声
認識部1はこれを認識し、認識候補「みゃ」、「や」、
「にゃ」、「ん」、「だ」が出力される。かな漢字変換
部7は第1位の認識候補「みゃ」をかな漢字変換しよう
とするが、該当する漢字がないので「みゃ」を未確定文
字列記憶部8に出力する。CRTディスプレイ9は「み
ゃ」を表示する。一方、文節候補作成部2は5個の単音
節候補をそれぞれ文節候補とする。文法処理部3はこれ
ら6個の文節候補に対し、各々が日本語文節或いは日本
語文節の一部であるかどうか、即ち文節となる可能性が
あるかどうかを調べる。ある文字列が日本語文節である
かどうかを調べることは、文節単位のかな漢字変換技術
を用いれば容易に実現できる。またある文字列が日本語
文節の一部であるかどうかを調べることは、いわゆるベ
タ書きと呼ばれるかな漢字変換方式において通常用いら
れる技術である。第2図の例の場合、文節の先頭に「ん
」が来ることは有り得ないので「ん」は文節候補から排
除される。文節候補記憶部4は後の4個を文節候補とし
て記憶する。
次に2番目の単音節「ま」が入力されると、音声認識部
はこれを認識し、認識候補「ま」、「な」。
「ら」、「だ」、「ば」が出力される。かな漢字変換部
7は「みゃま」をかな漢字変換しようとするが、該当す
る漢字がないので「みゃまJを未確定文字列記憶部8に
出力する。CRTディスプレイ9は「みゃま」を表示す
る。一方、文節候補作成部2は、文節候補記憶部4に記
憶されている4個の文節候補と、新たに入力された6個
の単音節候補を組み合せて20個の文節候補を作成する
文法処理部3はこれら20個の文節候補に対し、各々が
日本語文節或いは日本語文節の一部であるかどうかを調
べる。ここでは、「みゃま」、「にゃま」、「やば」、
「だば」など14個の文節候補が排除され、文節候補記
憶部4は第3図に示す6個の文節候補を記憶する。これ
らのうち例えば「やな」は「柳」の一部になっている。
次に3番目の単音節「ご」が入力されると、音声認識部
はこれを認識し、認識候補「どJ、「ぞJ。
「ご」、「こ」、「ろ」が出方される。かな漢字変換部
7は「みゃまど」をかな漢字変換しようとするが、該当
する漢字がないので「みゃまど」を未確定文字列記憶部
8に出方する。CRTディスプレイ9は「みゃまど」を
表示する。一方、文節候補作成部2は、文節候補記憶部
4に記憶されている6個の文節候補と、新たに入力され
た6個の単音節候補を組み合せて30個の文節候補を作
成する。文法処理部3はこれら30個の文節候補に対し
、各々が日本語文節或いは日本語文節の一部であるかど
うかを調べる。ここでは、「やまぞ」。
「やだと」、「だだぞ」など24個の文節候補が排除さ
れ、文節候補記憶部4は第3図に示す6個の文節候補を
記憶する。
次に4番目の単音節「や」が入力された場合も同様の処
理が行われ、第3図に示すように文節候補記憶部4は「
やまごや」、「やなどや」、「やなどだ」の3個の文節
候補を記憶する。
最後の単音節「の」が入力された場合も同様の処理が行
われ、第3図に示すように文節候補記憶部4は「やまご
やの」、「やまごやも」、「やなどだろ」の3個の文節
候補を記憶する。
「やまごやの」を発声し終えた時、CRTディスプレイ
9上には単音節第1候補の列「みゃまどやろ」が表示さ
れている。所望の文字列「山小屋の」ではないので、操
作者は訂正キー6を押す。
訂正制御部6は文節候補記憶部4に記憶されている3個
の文節候補のうち、日本語文節として正しいものを優先
順位の高いものから順に取9出す。
優先順位は例えば単音節認識の際に計算された各単音節
候補の尤度や、単音節候補の順位を基に求められる。第
3図の例の場合、「やなどだろ」は例えば「矢なのだろ
う」の一部ではあるが、このままでは日本語文節として
正しくない。したがって「やまごやのjと「やまごやも
」が取り出される。「やまごやの」の方が優先順位が高
いので、最初に取シ出され、かな漢字変換されて「山小
屋の」が未確定文字列記憶部8に出方されCRTディス
プレイ9上に表示される。訂正キー6を押しても所望の
文字列が得られない場合には、さらに訂正キーを押すと
次の文字列が表示される。所望の文字列が得られたので
、操作者は確定キー10を押す。文書保存部11は「山
小屋の」を確定して保存する。
以上のようにして「山小屋の」が作成される。
以上のように本実施例によれば、新な単音節が認識され
る度に、それ以上単音節が入力されても正しい文節とな
り得ない文節候補が排除されるため、文節候補作成部が
作成する文節候補の数は、上記の場合最大30個である
。したがって、文節候補を記憶するメモリ容量は従来の
約1/36でよい。また文法処理の回数は、文節候補削
減時に100回、訂正時に3回の合計103回であり従
来の約1/1oである。
従来例においては文節長が長くなるに従って文節候補数
が多くなっていた。本実施例によれば、文節長がある程
度以上長くなると、それ以上単音節が入力されても正し
い文節となシ得ない文節候補が増えるので、文節候補数
は逆に減少する。したがって文節長が長くなるほど本実
施例の効果は顕著に現われる。
なお本実施例においては音節遷移情報を利用していない
が、文節候補作成部が作成した文節候補からまず遷移不
可能な音節遷移を含むものを排除し、残った文節候補に
対して文法処理による候補削減を行ってもよい。
発明の詳細 な説明したように、本発明は、新な単位要素が認識され
る度に、それ以上単位要素が入力されても正しい文単位
となり得ない文単位候補を排除することによシ、単位要
素列の長さが長くなっても文単位候補数は極端に多くな
ることのない認識装置であり、その実用的効果は大きい
【図面の簡単な説明】
第1図は本発明における一実施例の音声ワードプロセッ
サの構成を表すブロック図、第2図は同実施例及び従来
例の動作を説明するだめの単音節候補を示す説明図、第
3図は同実施例の文節候補を示す説明図、第4図は従来
例の遷移不可能な音節の組み合せを示す説明図、第6図
は従来例の文節候補数を求める際の説明図である。 1・・・・・・音声認識部、2・・・・・・文節候補作
成部、3・・・・・・文法処理部、4・・・・・・文節
候補記憶部、6・旧・・訂正制御部。 代理人の氏名 弁理士 中 尾 敏 男 はが1名第1
図 第 2111 第3図 第4図 第5図 第5図 (7S) D(0) (7δ) (7S) ヤ (−べ 促

Claims (2)

    【特許請求の範囲】
  1. (1)認識すべき情報を単位要素ごとに認識して複数の
    候補を出力する単位要素認識手段と、単位要素の認識誤
    りを、単位要素列で構成された文単位で訂正する手段を
    備え、この訂正する手段は、m+1番目の単位要素が認
    識された時、m番目の文単位の候補とm+1番目の単位
    要素の認識候補とからm+1番目の文単位の候補を作成
    する文単位候補作成部と、新たに作成された文単位候補
    の各々が正しい文単位と一致又は正しい文単位の一部で
    あるかどうかを調べ、正しい文単位と一致せず正しい文
    単位の一部でもない文単位候補を排除する文法処理部と
    、排除されずに残された文単位候補をm+1番目の文単
    位候補として記憶する文単位候補記憶部を含むことを特
    徴とする認識装置。
  2. (2)単位要素は単音節であり、文単位は文節又は単語
    であるところの特許請求の範囲第1項記載の認識装置。
JP60224554A 1985-10-08 1985-10-08 認識装置 Pending JPS6283797A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60224554A JPS6283797A (ja) 1985-10-08 1985-10-08 認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60224554A JPS6283797A (ja) 1985-10-08 1985-10-08 認識装置

Publications (1)

Publication Number Publication Date
JPS6283797A true JPS6283797A (ja) 1987-04-17

Family

ID=16815599

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60224554A Pending JPS6283797A (ja) 1985-10-08 1985-10-08 認識装置

Country Status (1)

Country Link
JP (1) JPS6283797A (ja)

Similar Documents

Publication Publication Date Title
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
JP2002091492A (ja) 音声補完方法、装置および記録媒体
JP2000298667A (ja) 構文情報による漢字変換装置
US5745875A (en) Stenographic translation system automatic speech recognition
JPH10269204A (ja) 中国語文書自動校正方法及びその装置
JPS6283797A (ja) 認識装置
JPS634206B2 (ja)
JPS6229796B2 (ja)
JP2002189490A (ja) ピンイン音声入力の方法
JP2812495B2 (ja) 漢字を使用する言語の音節入力語音逐次区切漢字逐次変換方式
JPH0140372B2 (ja)
JP2001013992A (ja) 音声理解装置
JPS61122781A (ja) 音声ワ−ドプロセツサ
JPS6283796A (ja) 音声入力装置
JPS61189599A (ja) 記号比較装置
JP2004053871A (ja) 音声認識システム
JP3402480B2 (ja) 文書朗読装置
JP3048793B2 (ja) 文字変換装置
JPH0552506B2 (ja)
JPS63259686A (ja) 音声入力装置
JPS6211898A (ja) 音声認識装置
JPS63214872A (ja) かな漢字変換方式
JPH06103457B2 (ja) 音声タイプライタ
JPH0414168A (ja) 文書作成装置
JP2000330998A (ja) 発音電子辞書