JPH04332094A - 文字認識装置および認識文字の修正方法 - Google Patents

文字認識装置および認識文字の修正方法

Info

Publication number
JPH04332094A
JPH04332094A JP3101687A JP10168791A JPH04332094A JP H04332094 A JPH04332094 A JP H04332094A JP 3101687 A JP3101687 A JP 3101687A JP 10168791 A JP10168791 A JP 10168791A JP H04332094 A JPH04332094 A JP H04332094A
Authority
JP
Japan
Prior art keywords
character
code
pattern
operator
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3101687A
Other languages
English (en)
Inventor
Tamotsu Maeda
保 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3101687A priority Critical patent/JPH04332094A/ja
Publication of JPH04332094A publication Critical patent/JPH04332094A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字パターンを読み取
ってその文字パターンから文字認識を行う文字認識装置
および認識文字の修正方法に関するものである。
【0002】
【従来の技術】図6は従来の文字認識装置の構成を示す
ブロック図である。図6において、文字入力部1は文字
認識部2を介して文字コードメモリ3に接続され、文字
入力部1から2値化入力された文字パターン列に対して
文字認識部2で文字を切り出し、特徴抽出、および文字
認識処理を行い、文字コードを文字コードメモリ3に出
力する。文字コードメモリ3は表示部4に接続され、文
字コードメモリ3の内容を表示する。
【0003】ここで、操作者は表示部4を見て、誤って
認識した文字(以下誤認識文字という)があれば、これ
を修正するための作業に入るが、このとき、誤認識文字
の文字コードメモリ3における先頭番地からの順番N(
すなわち、N番目の文字が誤ったという情報)と修正す
べき正解の文字Cを修正情報入力部5から入力する。 修正情報入力部5が接続される修正部6は文字コードメ
モリ3に接続され、修正部6で文字コードメモリ3内の
N番目の文字コードを文字Cに修正する。
【0004】
【発明が解決しようとする課題】上記従来の構成では、
誤認識文字に関する修正情報として文字コードメモリ3
における順番Nとこの順番Nに対する正解の文字Cを入
力するため、1回の操作で1か所の文字しか修正するこ
とができない。つまり、文字入力部1から読み込んだ文
字パターン列内に同一の文字パターンが複数箇所に存在
する場合には同様の誤認識文字が発生しやすい傾向があ
るが、この場合でも誤認識文字の数だけその都度修正情
報を入力しなければならず作業量が多く非常に使い難い
という問題を有していた。
【0005】また、文字コードメモリ3における順番N
の代わりに誤認識文字の文字コードを誤認識文字に関す
る情報として入力する場合には、文字コードメモリ3内
の該当する文字コードを全て正解の文字コードに修正し
てしまうという方法も考えられるが、この方法では誤認
識文字以外の文字をも誤って修正してしまい、さらに、
同一の文字パターンが別の文字コードに誤認識した場合
には修正できないという問題を有していた。
【0006】本発明は上記従来の問題を解決するもので
、認識文字を少ない作業量で効率良く修正することがで
きる文字認識装置および認識文字の修正方法を提供する
ことを目的とするものである。
【0007】
【課題を解決するための手段】上記課題を解決するため
に本発明の文字認識装置は、認識すべき各文字パターン
を読み取る文字入力手段と、前記文字入力手段により読
み取られた前記各文字パターンの特徴を抽出し、抽出さ
れた各文字パターンの特徴と辞書を比較して文字認識処
理を行い、前記各文字パターンの文字コードおよび特徴
量、誤認識の可能性の高さを示すリジェクトコードを読
みだす文字認識手段と、前記文字認識手段で読みだされ
た文字コードのうち前記リジェクトコードにより誤認識
の可能性が高いと判断された文字に関する情報を操作者
に提示可能であり、また、前記誤認識の可能性が高いと
判断された文字とそれ以外の文字との類似に関する情報
を表示可能な表示手段と、前記表示手段に提示された文
字コードを修正するための修正情報入力手段により操作
者が前記誤認識の可能性が高い文字に対応する文字コー
ドに対して修正入力した場合に、この修正入力の対象と
した文字パターンの特徴量とそれ以外の各文字パターン
の特徴量とをそれぞれ比較し、文字パターンの特徴量の
類似度が所定値よりも大きい文字パターンに対応する文
字コードを修正入力された修正文字コードに更新するこ
とを操作者に前記表示手段を介して知らせ、操作者がこ
れを了承したときに前記修正文字コードに更新する更新
手段とを備えたものである。
【0008】また、本発明の認識文字の修正方法は、認
識すべき各文字パターンを読み取って前記各文字パター
ンの特徴を抽出し、抽出された各文字パターンの特徴と
辞書とを比較して文字認識処理を行い、前記各文字パタ
ーンの文字コードおよびリジェクトコードを読みだし、
読みだされた文字コードのうち前記リジェクトコードに
より誤認識の可能性が高い文字に関する情報を操作者に
提示し、操作者が前記誤認識の可能性が高い文字に対応
する文字コードに対して修正入力した場合に、この修正
入力の対象とした文字パターンの特徴量とそれ以外の各
文字パターンの特徴量とをそれぞれ比較し、文字パター
ンの特徴量の類似度が所定値よりも大きい場合、この文
字パターンに対応する文字コードを前記修正入力された
修正文字コードに更新することを操作者に対して知らせ
、操作者がこれを了承したときに前記修正文字コードに
更新するものである。
【0009】
【作用】上記構成により、誤認識の可能性の高い文字が
表示手段に表示されて操作者に提示され、この認識文字
を修正する場合に、この提示された誤認識の可能性の高
い文字に対して操作者が正しい文字コードを入力すれば
、他の同様の文字についても確認して了承するだけで誤
認識文字が正解の文字コードに自動的に修正され、これ
により、認識文字の修正作業が少ない作業量で効率良く
行われることになる。
【0010】
【実施例】以下、本発明の実施例について図面を参照し
ながら説明する。図1は本発明の実施例の文字認識装置
の機能構成を示すブロック図である。図1において、文
字入力部11は文書パターンメモリ12に接続され、認
識すべき各文字パターンよりなる文書を光電変換して2
値化データとして読み取り文書パターンメモリ12に記
憶させる。文書パターンメモリ12が接続される文字認
識部13は上記2値化データを前処理、各文字パターン
の特徴抽出、抽出された各文字パターンの特徴と辞書と
を比較するマッチングなどの文字認識処理を行い、文字
パターン、特徴量、文字コードおよび、誤認識の可能性
の高さを示すリジェクトコードを出力する。文字認識部
13に接続される文字パターンメモリ14は、文字認識
部13で認識された文字パターンを蓄える。また、文字
認識部13に接続される特徴量メモリ15は、文字認識
部13で認識された特徴量を蓄える。さらに、文字認識
部13に接続される文字コードメモリ16は、文字認識
部13で認識された文字コードを蓄える。さらには、文
字認識部13に接続されるリジェクト情報メモリ17は
、文字認識部13で認識されたリジェクトコードを蓄え
る。文書パターンメモリ12、文字パターンメモリ14
、文字コードメモリ16およびリジェクト情報メモリ1
7が接続される表示部18は、文字認識部13で読みだ
された文字コードのうちリジェクトコードにより誤認識
の可能性が高いと判断された文字に関する情報を操作者
に提示するようにメモリ内容を表示する。また、表示部
18は、誤認識の可能性が高いと判断された文字とそれ
以外の文字との類似に関する情報を表示可能である。
【0011】修正情報入力部19は、表示部18に提示
された文字コードを修正するために操作者から修正情報
が入力される。この修正情報入力部19およびリジェク
ト情報メモリ17、特徴量メモリ15が接続される照合
修正部20は確認部21を介して文字コードメモリ16
に接続され、修正情報入力部19およびリジェクト情報
メモリ17の内容により特徴量メモリ15の内容を照合
し、確認部21で操作者が修正を了承した場合に文字コ
ードメモリ16の内容を修正する。すなわち、表示部1
8に提示された誤認識の可能性が高い文字に対応する文
字コードに対して修正情報入力部19から修正入力した
場合に、この修正入力の対象とした文字パターンの特徴
量とそれ以外の各文字パターンの特徴量とをそれぞれ照
合修正部20で比較して、文字パターンの特徴量の類似
度が所定値よりも大きい文字パターンに対応する文字コ
ードを修正入力された文字コードに更新することを操作
者に表示手段18で知らせ、操作者がこれを確認して了
承したときに確認部21を介して修正文字コードに更新
する構成である。以上の修正情報入力部19および照合
修正部20、確認部21により更新手段を構成している
【0012】図2は本発明の実施例の文字認識装置のハ
ード構成を示すブロック図である。図2において、文字
入力部11としてのスキャナ11aは文書を読み取り、
その読み取った文書をビットデータにして出力する。ラ
ンダムアクセスメモリ(RAM)22は、スキャナ11
aからのビットデータを記憶する文書パターンメモリ1
2と、この文書パターンメモリ12から切り出された文
字パターンを記憶する文字パターンメモリ14と、この
文字パターンを解析して得られる特徴量を記憶する特徴
量メモリ15と、この特徴量から決定される文字コード
を記憶する文字コードメモリ16と、この文字コードの
うち誤認識の高い文字に関する情報を記憶するリジェク
ト情報メモリ17と、操作者からの誤認識文字に対する
修正情報を記憶する修正情報領域23と、各種処理にお
いて利用するレジスタ領域24とを有している。また、
リードオンリーメモリ(ROM)25は、各文字パター
ンの特徴と辞書とを比較するマッチングなどの文字認識
処理を行うため、特徴量とこれに対応する文字コードを
記憶した辞書領域26と、制御プログラムを記憶したプ
ログラム記憶領域27とを有している。さらに、処理回
路28は、プログラム記憶領域27に記憶された制御プ
ログラムに従って処理を行う。キーボード29はデータ
を入力し、表示部18は文字パターンメモリ14内の文
字パターンと、文字コードメモリ16内の文字コード、
または、これに対応する文字フォントを表示する。
【0013】以上のように構成された文字認識装置につ
いて、その認識文字の修正方法を図3のフローチャート
にしたがって説明する。まず、ステップS1で文字入力
部11により文書を光電変換して2値化データとして入
力し、文書パターンメモリ12に書き込む。そして、ス
テップS2で上記2値化データにノイズ除去、文字切り
出しなどの前処理を行うことにより文字パターンを得、
さらに、この文字パターンから特徴抽出およびマッチン
グなどの文字認識処理を行い、特徴量、文字コードおよ
びリジェクトコードを出力する。そして、文字パターン
は文字パターンメモリ14に、特徴量は特徴量メモリ1
5に、文字コードは文字コードメモリ16に、さらに、
リジェクトコードはリジェクト情報メモリ17に保存さ
れる。特徴量メモリ15、文字コードメモリ16および
リジェクト情報メモリ17内のデータの並びは文書パタ
ーンメモリ12から文字切り出しされる文字パターンの
順番である。そして、表示部18には、文書パターンメ
モリ12の内容、文字コードメモリ16内の文字コード
、または、これに対応する文字フォントが表示される。
【0014】次に、ステップS3でリジェクト情報メモ
リ17内に記憶されている番地Nが指す文字パターンメ
モリ14の文字パターンと文字コードメモリ16の文字
コード、または、これに対応する文字フォントを表示部
18に表示して操作者に提示する。さらに、ステップS
4で、表示部18に提示された文字が修正を要する場合
には、この提示された文字の、特徴量メモリ15内にお
ける順番Nに関する修正情報、すなわち、正解の文字コ
ードを操作者が修正情報入力部19より入力してこれを
修正情報領域23に記憶する。そして、ステップS5で
この修正情報に基づき特徴量メモリ15内の特徴量同士
を照合する。さらに、ステップS6で類似度が所定値以
上の場合に操作者に対して知らせ、修正するか否かを確
認する。最後に、ステップS7で操作者が了承した場合
に修正を実行する。
【0015】上記ステップS3〜S7までの処理をさら
に詳しく図4のフローチャートを用いて説明する。まず
、ステップS11でリジェクト情報メモリ17内に記憶
されているリジェクトされた文字の個数を調べて、修正
すべき文字が存在するか否かの判定をする。修正すべき
文字が存在しない場合には処理を終了し、また、修正す
べき文字が存在する場合にはステップS12に進む。ス
テップS12でリジェクト情報メモリ17内の順番Nが
指す、誤認識の可能性が高い文字の文字パターンと文字
コードを表示部18に表示して提示する。すなわち、文
字認識部13で読みだされた文字コードのうちリジェク
トコードにより誤認識の可能性が高いと判断された文字
に関する情報、すなわち、疑わしい文字のパターンとコ
ードを表示部18に表示して操作者に提示する。
【0016】次に、ステップS13で、表示部18に提
示された文字コードを別の文字コードに修正する場合に
はステップS14に進み、提示された文字コードを別の
文字コードに修正しない場合にはステップS11に戻る
。ステップS14で操作者が修正情報、すなわち、正解
の文字コードCを入力する。そして、ステップS15で
カウンタiに順番Nを代入する。さらに、ステップS1
6で特徴量メモリ15内のN番目の文字の特徴量Fnと
i番目の文字の特徴量Fiの類似度を計算し、その類似
度が予め定めたしきい値より大きいか否かを判断する。 大きい場合にはステップS17に進み、また、それ以外
の場合にはステップS18に進む。ステップS17では
操作者に対して修正して良いか否かを確認し、修正が許
可されるときにステップS19に進み、また、修正が許
可されないときにステップS20に進む。そして、ステ
ップS19では文字コードメモリ16内のi番目の文字
コードを正解の文字コードCに修正してステップS20
に進む。このステップS20ではiが文字列の最後か否
かを判断し、最後であればステップS11に戻り、それ
以外の場合にはステップS21に進む。このステップS
21ではiを1増やしてi+1とし、ステップS16に
戻って以降同様にiが最後になるまで繰り返す。
【0017】図5のAに示す認識例題文字列パターン「
あかいあさがお」を具体例として、以下その動作を説明
する。まず、文字入力部11において認識例題文字列パ
ターン「あかいあさがお」を2値画像として入力して文
書パターンメモリ12に記憶する。そして、文字認識部
13において、文書パターンメモリ12に記憶された画
像にノイズ除去、文字切り出しなどの処理により切り出
した文字パターンを文字パターンメモリ14に格納し、
特徴抽出および文字認識処理により特徴量、文字コード
、リジェクトコードをそれぞれ特徴量メモリ15、文字
コードメモリ16、リジェクト情報メモリ17に文字パ
ターンの並びの順に格納する。このとき、図5のAに文
字パターンメモリ14の内容を示し、図5のBに文字コ
ードメモリ16の内容を示し、図5のCに特徴量メモリ
15の内容を示し、さらに、図5のDにリジェクト情報
メモリ17の内容を示している。このリジェクトコード
の値は1が誤認識の可能性が高い場合、0が誤認識の可
能性が低い場合とする。
【0018】ここでは、図5のBに示すように「おかい
おさがお」と誤認識したものとする。すると照合修正部
20は図5のDに示すリジェクトコード=1の文字数を
計数し、その結果(この場合は2)をリジェクト情報メ
モリ17内に記憶する。そして、図5のDの1番目と4
番目が誤認識の可能性が高いので、まず、この1番目の
文字の文字パターンと文字コードを表示部18に表示し
て操作者に提示する。
【0019】ここで、操作者は、表示部18に表示され
た1番目の文字の文字パターンと文字コードを確認して
、修正する場合には修正情報入力部19から、図5のE
に示すように、修正情報(この例では正解の文字コード
C=‘あ’)を入力する。修正しない場合には次にリジ
ェクトコードが1となる順番をリジェクト情報メモリ1
7から捜し、無ければその処理を終了する。
【0020】このとき、照合修正部20においては文字
コードメモリ16内のN=1番目の文字コードC1 を
‘あ’に修正した後、特徴量メモリ15内のN=1番目
の特徴量F1とi=2番目の特徴量F2 の類似度を計
算し、この類似度が予め定めたしきい値よりも大きいか
否かのメッセージを表示部18に提示する。操作者がこ
れを修正することを了承した場合に、文字コードメモリ
16内のi番目の文字コードCiを‘あ’に修正し、リ
ジェクト情報メモリ17内のリジェクトコード=1であ
る文字数の値を1だけ減じる。そして、類似度が小さい
場合には次にF1 とF3 を照合する。以降、F1 
とF4 、F1 とF5 、F1 とF6 、・・・F
6 とF7 まで、照合および修正処理が終わるまで処
理を繰り返す。この場合、F1 とF4 の類似度がし
きい値よりも高いので、上述と同様に修正確認して了承
されれば、C4 =‘お’を‘あ’に修正する。このよ
うにして、図5のFに示すように、文字コードメモリ1
6の内容は書き換えられて更新される。
【0021】したがって、特徴量メモリ15とリジェク
ト情報メモリ17と照合修正部20を設けたことにより
、文字認識部13から出力された誤認識文字を修正する
場合に、表示部18に提示された誤認識の可能性の高い
文字に対して、操作者が正しい文字コードを入力すれば
、目的の誤認識文字以降の誤認識文字についても確認し
て了承するだけで正解の文字コードに自動的に修正する
ことができる。
【0022】
【発明の効果】以上のように本発明によれば、認識文字
を修正する場合に、表示手段に提示された誤認識の可能
性の高い文字に対して、操作者が正しい文字コードを入
力すれば、他の同様の文字についても確認して了承する
だけで誤認識文字の文字コードを正解の文字コードに自
動的に修正することができるため、認識文字を少ない作
業量で効率良く修正することができ、マン・マシン・イ
ンターフェースに対して優れた認識文字の修正を行うこ
とができるものである。
【図面の簡単な説明】
【図1】本発明の実施例の文字認識装置の機能構成を示
すブロック図である。
【図2】本発明の実施例の文字認識装置のハード構成を
示すブロック図である。
【図3】本発明の実施例の認識文字の修正方法を示すフ
ローチャートである。
【図4】図3におけるステップS3〜S7の処理をさら
に詳しく示すフローチャートである。
【図5】本発明の実施例の認識文字の具体的修正方法を
示す説明図であり、Aは文字パターンメモリ14の内容
、Bは文字コードメモリ16の内容、Cは特徴量メモリ
15の内容、Dはリジェクト情報メモリ17の内容、E
は修正情報領域の内容、Fは修正後の文字コードメモリ
16の内容を示している。
【図6】従来の文字認識装置の構成を示すブロック図で
ある。
【符号の説明】
11    文字入力部 11a    スキャナ 12    文書パターンメモリ 13    文字認識部 14    文字パターンメモリ 15    特徴量メモリ 16    文字コードメモリ 17    リジェクト情報メモリ 18    表示部 19    修正情報入力部 20    照合修正部 21    確認部 22    RAM 23    修正情報領域 25    ROM 26    辞書領域 27    プログラム記憶領域 28    処理回路 29    キーボード

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】認識すべき各文字パターンを読み取る文字
    入力手段と、前記文字入力手段により読み取られた前記
    各文字パターンの特徴を抽出し、抽出された各文字パタ
    ーンの特徴と辞書を比較して文字認識処理を行い、前記
    各文字パターンの文字コードおよび特徴量、誤認識の可
    能性の高さを示すリジェクトコードを読みだす文字認識
    手段と、前記文字認識手段で読みだされた文字コードの
    うち前記リジェクトコードにより誤認識の可能性が高い
    と判断された文字に関する情報を操作者に提示可能であ
    り、また、前記誤認識の可能性が高いと判断された文字
    とそれ以外の文字との類似に関する情報を表示可能な表
    示手段と、前記表示手段に提示された文字コードを修正
    するための修正情報入力手段により操作者が前記誤認識
    の可能性が高い文字に対応する文字コードに対して修正
    入力した場合に、この修正入力の対象とした文字パター
    ンの特徴量とそれ以外の各文字パターンの特徴量とをそ
    れぞれ比較し、文字パターンの特徴量の類似度が所定値
    よりも大きい文字パターンに対応する文字コードを修正
    入力された修正文字コードに更新することを操作者に前
    記表示手段を介して知らせ、操作者がこれを了承したと
    きに前記修正文字コードに更新する更新手段とを備えた
    文字認識装置。
  2. 【請求項2】認識すべき各文字パターンを読み取って前
    記各文字パターンの特徴を抽出し、抽出された各文字パ
    ターンの特徴と辞書とを比較して文字認識処理を行い、
    前記各文字パターンの文字コードおよびリジェクトコー
    ドを読みだし、読みだされた文字コードのうち前記リジ
    ェクトコードにより誤認識の可能性が高い文字に関する
    情報を操作者に提示し、操作者が前記誤認識の可能性が
    高い文字に対応する文字コードに対して修正入力した場
    合に、この修正入力の対象とした文字パターンの特徴量
    とそれ以外の各文字パターンの特徴量とをそれぞれ比較
    し、文字パターンの特徴量の類似度が所定値よりも大き
    い場合、この文字パターンに対応する文字コードを前記
    修正入力された修正文字コードに更新することを操作者
    に対して知らせ、操作者がこれを了承したときに前記修
    正文字コードに更新する認識文字の修正方法。
JP3101687A 1991-05-08 1991-05-08 文字認識装置および認識文字の修正方法 Pending JPH04332094A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3101687A JPH04332094A (ja) 1991-05-08 1991-05-08 文字認識装置および認識文字の修正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3101687A JPH04332094A (ja) 1991-05-08 1991-05-08 文字認識装置および認識文字の修正方法

Publications (1)

Publication Number Publication Date
JPH04332094A true JPH04332094A (ja) 1992-11-19

Family

ID=14307252

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3101687A Pending JPH04332094A (ja) 1991-05-08 1991-05-08 文字認識装置および認識文字の修正方法

Country Status (1)

Country Link
JP (1) JPH04332094A (ja)

Similar Documents

Publication Publication Date Title
US8489388B2 (en) Data detection
EP0330170B1 (en) European language processing machine with a spelling correction function
US4975974A (en) Character recognition apparatus
US5956433A (en) Method and device for removing spots from a character image in an optical character reader
JPH0696263A (ja) パターン認識装置
JPH04332094A (ja) 文字認識装置および認識文字の修正方法
JP3222481B2 (ja) プログラム更新システム
JPH05119896A (ja) 文字列入力方式
JP3221968B2 (ja) 文字認識装置
JPH0612520A (ja) 文字認識装置の確認修正方式
JP3270551B2 (ja) 文字認識装置および文字認識方法
JPH04268684A (ja) 認識文字の修正方法
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH0721303A (ja) 文字認識装置
JPH0467282A (ja) 認識文字の修正方法
JPH0668261A (ja) パターン認識装置
JP3481850B2 (ja) 文字認識装置
JPH09138836A (ja) 文字認識結果の修正方式
JP2639314B2 (ja) 文字認識方式
JP2875678B2 (ja) 文字認識結果の後処理方法
JPH0573709A (ja) 認識文字の修正方法
JPH0721327A (ja) 画像パターンの同定・認識処理装置
JPH0436885A (ja) 光学式文字読取装置
JPH05298489A (ja) 文字認識方式
JPH04138583A (ja) 文字認識装置