JPH06195514A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH06195514A JPH06195514A JP4344137A JP34413792A JPH06195514A JP H06195514 A JPH06195514 A JP H06195514A JP 4344137 A JP4344137 A JP 4344137A JP 34413792 A JP34413792 A JP 34413792A JP H06195514 A JPH06195514 A JP H06195514A
- Authority
- JP
- Japan
- Prior art keywords
- character
- separated
- recognition result
- recognition
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
(57)【要約】
【目的】 同一文字に関する切り出しミスを低減し、文
字認識効率を向上させる。 【構成】 入力された文書画像に対して1文字ずつの切
り出しを行う切出手段と、該切出手段により切り出され
た文字画像を認識する認識手段と、分離文字に関する前
記切出手段による文字切り出しミス情報を登録する学習
辞書と、該学習辞書を用いて前記認識手段による認識結
果に分離文字があるか否かを検索する検索手段と、該検
索手段により得られた分離文字を前記学習辞書に基づい
て当該分離文字を修正する修正手段とを具える。
字認識効率を向上させる。 【構成】 入力された文書画像に対して1文字ずつの切
り出しを行う切出手段と、該切出手段により切り出され
た文字画像を認識する認識手段と、分離文字に関する前
記切出手段による文字切り出しミス情報を登録する学習
辞書と、該学習辞書を用いて前記認識手段による認識結
果に分離文字があるか否かを検索する検索手段と、該検
索手段により得られた分離文字を前記学習辞書に基づい
て当該分離文字を修正する修正手段とを具える。
Description
【0001】
【産業上の利用分野】本発明は、文書画像を入力して、
該文書画像の文字に認識処理を施す文字認識装置に関す
るものである。
該文書画像の文字に認識処理を施す文字認識装置に関す
るものである。
【0002】
【従来の技術】一般に文字認識装置とは、文書画像デー
タから1文字ずつ文字切り出し処理を行うことにより得
られた文字画像データに対して位置、傾き、線幅、濃度
等の正規化処理を行った上で輪郭線特徴等の抽出を行
い、その抽出された特徴抽出量とあらかじめ用意された
認識辞書とのマッチングを取ることにより、それがどん
な文字かを識別するものである。なお、ここで認識辞書
とは、マッチングの対象となる全ての認識対象文字の標
準パターンおよびその文字を表わす文字コードとのセッ
トをまとめて登録したものである。
タから1文字ずつ文字切り出し処理を行うことにより得
られた文字画像データに対して位置、傾き、線幅、濃度
等の正規化処理を行った上で輪郭線特徴等の抽出を行
い、その抽出された特徴抽出量とあらかじめ用意された
認識辞書とのマッチングを取ることにより、それがどん
な文字かを識別するものである。なお、ここで認識辞書
とは、マッチングの対象となる全ての認識対象文字の標
準パターンおよびその文字を表わす文字コードとのセッ
トをまとめて登録したものである。
【0003】また認識率の向上を目的とし、それまでの
認識辞書で認識された結果を基に認識辞書に登録されて
いる文字コードの標準パターンを修正したり、文字コー
ドと標準パターンセットの認識辞書への追加登録を新た
に行ったりすることを認識辞書の学習という。
認識辞書で認識された結果を基に認識辞書に登録されて
いる文字コードの標準パターンを修正したり、文字コー
ドと標準パターンセットの認識辞書への追加登録を新た
に行ったりすることを認識辞書の学習という。
【0004】文字切り出し処理において正しく切り出さ
れた文字画像データに対しては、仮に認識結果が誤りと
なってしまった場合、その誤った認識結果に対応する正
解文字コードおよび文字イメージの特徴抽出量から作成
された特徴パターンを用いて認識辞書の学習をさせるこ
とにより、次回の認識では同じ認識の誤りが生ずる可能
性を低下させることが可能となる。
れた文字画像データに対しては、仮に認識結果が誤りと
なってしまった場合、その誤った認識結果に対応する正
解文字コードおよび文字イメージの特徴抽出量から作成
された特徴パターンを用いて認識辞書の学習をさせるこ
とにより、次回の認識では同じ認識の誤りが生ずる可能
性を低下させることが可能となる。
【0005】
【発明が解決しようとする課題】文字切り出し処理にお
いては、2つの隣接する文字画像間の空白の有無を文字
と文字との区切りを決めるための指標のひとつとしてい
る。そのため図2に示すような文字切り出し処理の失敗
がしばしば生ずることとなる。このような誤った切り出
し処理がなされた文字を分離文字と呼ぶ。分離文字では
本来1文字であるものを2文字以上の文字と判断するた
め、当然認識結果も正解とは異なったものとなる。
いては、2つの隣接する文字画像間の空白の有無を文字
と文字との区切りを決めるための指標のひとつとしてい
る。そのため図2に示すような文字切り出し処理の失敗
がしばしば生ずることとなる。このような誤った切り出
し処理がなされた文字を分離文字と呼ぶ。分離文字では
本来1文字であるものを2文字以上の文字と判断するた
め、当然認識結果も正解とは異なったものとなる。
【0006】しかしながらこの分離文字においては、文
字切り出し処理により得られた文字画像データと正解文
字コードとを1対1に対応づけることができないため、
その誤った結果を認識辞書に登録することが不可能であ
った。従って分離文字に関してはその誤りを学習させる
ことができず、何度同じ文字画像を認識させても、同様
な文字切り出しミスを繰り返すことになってしまってい
た。
字切り出し処理により得られた文字画像データと正解文
字コードとを1対1に対応づけることができないため、
その誤った結果を認識辞書に登録することが不可能であ
った。従って分離文字に関してはその誤りを学習させる
ことができず、何度同じ文字画像を認識させても、同様
な文字切り出しミスを繰り返すことになってしまってい
た。
【0007】そこで本発明の目的は以上のような問題を
解消した文字認識装置を提供することにある。
解消した文字認識装置を提供することにある。
【0008】
【課題を解決するための手段】上記目的を達成するため
本発明は入力された文書画像に対して1文字ずつの切り
出しを行う切出手段と、該切出手段により切り出された
文字画像を認識する認識手段と、分離文字に関する前記
切出手段による文字切り出しミス情報を登録する学習辞
書と、該学習辞書を用いて前記認識手段による認識結果
に分離文字があるか否かを検索する検索手段と、該検索
手段により得られた分離文字を前記学習辞書に基づいて
当該分離文字を修正する修正手段とを具えたことを特徴
とする。
本発明は入力された文書画像に対して1文字ずつの切り
出しを行う切出手段と、該切出手段により切り出された
文字画像を認識する認識手段と、分離文字に関する前記
切出手段による文字切り出しミス情報を登録する学習辞
書と、該学習辞書を用いて前記認識手段による認識結果
に分離文字があるか否かを検索する検索手段と、該検索
手段により得られた分離文字を前記学習辞書に基づいて
当該分離文字を修正する修正手段とを具えたことを特徴
とする。
【0009】
【作用】本発明によれば分離文字に関する文字切り出し
ミス情報を登録するための学習辞書(以下ではこれを分
離文字切り学習辞書と呼ぶ)を作成し、それを基にして
分離文字に関する文字切り出しミスの学習(以下ではこ
れを分離文字切り学習と呼ぶ)を行い、学習後の認識に
おいては分離文字切り学習辞書を用いた分離文字のチェ
ックにより分離文字の修正を行い、同じ分離文字の文字
切り出しミスが生じないようにすることができる。
ミス情報を登録するための学習辞書(以下ではこれを分
離文字切り学習辞書と呼ぶ)を作成し、それを基にして
分離文字に関する文字切り出しミスの学習(以下ではこ
れを分離文字切り学習と呼ぶ)を行い、学習後の認識に
おいては分離文字切り学習辞書を用いた分離文字のチェ
ックにより分離文字の修正を行い、同じ分離文字の文字
切り出しミスが生じないようにすることができる。
【0010】
【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。
に説明する。
【0011】図1は本発明の実施例である文字認識装置
の概略構成を示すブロック図である。同図において、2
01は読み取り対象から文書情報をアナログ信号に変換
して読み取るスキャナである。202は、スキャナ20
1から出力されたアナログ信号を二値のデジタル信号に
変換する二値化回路である。203は、割込み入力ポー
ト、割込み制御回路、クロックパルス発生器、命令デコ
ーダ、レジスタ群、ALU、入力ポート、出力ポート及
びイメージ入力シフトレジスタを含む大規模集積回路
(LSI)よりなる中央処理装置(CPU)である。2
04は、アドレスごとに割り付けられた読み書き可能な
記憶部を有するランダムアクセスメモリ(RAM)であ
り、CPU203のワークエリアとして使用されるとと
もに二値化回路202より入力された文書画像データ、
文書画像に対する認識結果データ、分離文字切り学習に
より作成されたかあるいは既に作成済のもので外部記憶
206より読込まれた分離文字切り学習辞書を一時的に
格納するための記憶領域として使われる。
の概略構成を示すブロック図である。同図において、2
01は読み取り対象から文書情報をアナログ信号に変換
して読み取るスキャナである。202は、スキャナ20
1から出力されたアナログ信号を二値のデジタル信号に
変換する二値化回路である。203は、割込み入力ポー
ト、割込み制御回路、クロックパルス発生器、命令デコ
ーダ、レジスタ群、ALU、入力ポート、出力ポート及
びイメージ入力シフトレジスタを含む大規模集積回路
(LSI)よりなる中央処理装置(CPU)である。2
04は、アドレスごとに割り付けられた読み書き可能な
記憶部を有するランダムアクセスメモリ(RAM)であ
り、CPU203のワークエリアとして使用されるとと
もに二値化回路202より入力された文書画像データ、
文書画像に対する認識結果データ、分離文字切り学習に
より作成されたかあるいは既に作成済のもので外部記憶
206より読込まれた分離文字切り学習辞書を一時的に
格納するための記憶領域として使われる。
【0012】205は、CPU203によって順次実行
されるプログラム、認識辞書、及び各種判定等で用いら
れる定数をコード化して収納しているリードオンリーメ
モリ(ROM)である。206は、RAM204に一時
的に格納した文書画像データや認識結果データ、分離文
字切り学習辞書を長期的に保存するための記憶領域とし
て使われる外部記憶である。207は、出力データを受
け取ってCRT208に表示するための信号を発生させ
るCRTインターフェイスである。キーボード209と
ポインティングデバイス210はオペレータが該文字認
識装置に対する指示を入力するための装置である。21
1は、外部アドレス及び外部データバスを含む外部バス
ラインであり、これを介してROM205及び外部記憶
206のアドレッシングやデータのやり取り等が行われ
る。
されるプログラム、認識辞書、及び各種判定等で用いら
れる定数をコード化して収納しているリードオンリーメ
モリ(ROM)である。206は、RAM204に一時
的に格納した文書画像データや認識結果データ、分離文
字切り学習辞書を長期的に保存するための記憶領域とし
て使われる外部記憶である。207は、出力データを受
け取ってCRT208に表示するための信号を発生させ
るCRTインターフェイスである。キーボード209と
ポインティングデバイス210はオペレータが該文字認
識装置に対する指示を入力するための装置である。21
1は、外部アドレス及び外部データバスを含む外部バス
ラインであり、これを介してROM205及び外部記憶
206のアドレッシングやデータのやり取り等が行われ
る。
【0013】図3は、図1の実施例におけるCPU20
3の動作を説明するフローチャートであり、この処理を
実行する制御プログラムはROM205に記憶されてい
る。
3の動作を説明するフローチャートであり、この処理を
実行する制御プログラムはROM205に記憶されてい
る。
【0014】まず、ステップS301で、スキャナ20
1においてオペレータによりセットされた読取り対象か
らの文書画像情報をアナログ信号として読込み、さらに
二値化回路202によって該アナログ信号を二値化して
RAM204に記憶する。続いてステップS302で
は、ステップS301で入力した二値化された文書画像
データに対して文字切り出し処理を行う。文字の切り出
し処理は、1文字づつの文字画像の外接矩形を求め、そ
の矩形の大きさの文字画像データをRAM204に記憶
させることによって行う。
1においてオペレータによりセットされた読取り対象か
らの文書画像情報をアナログ信号として読込み、さらに
二値化回路202によって該アナログ信号を二値化して
RAM204に記憶する。続いてステップS302で
は、ステップS301で入力した二値化された文書画像
データに対して文字切り出し処理を行う。文字の切り出
し処理は、1文字づつの文字画像の外接矩形を求め、そ
の矩形の大きさの文字画像データをRAM204に記憶
させることによって行う。
【0015】次にステップS303では、S302で切
り出し処理を行った文字画像データに対して認識処理を
行う。認識処理ではまず、位置、傾き、線幅、濃度等の
正規化処理を行う。続いてこの正規化された切り出し文
字画像データを認識部に送り込むことによってそれがど
んな文字かを認識する。認識は、まず正規化された切り
出し文字画像データに対し輪郭線特徴等の抽出を行い、
その抽出された特徴ベクトルと認識辞書における全ての
文字の標準パターンベクトルとのマッチングをとり、そ
の際最も確からしいとされた文字を第1候補とし、その
後2番目に確からしいものを第2候補、3番目に確から
しいものを第3候補…と以下同様に第8候補までを出力
することによって行う。このS303による結果は認識
結果データとしてRAM204に記憶される。図4は認
識結果データのデータ構造を示している。1つの切り出
し文字画像データに対する1文字あたりの認識結果デー
タは、まずその文字画像の文書画像上での位置と大きさ
を示す4つの情報、すなわち文字切り出し矩形の左上頂
点のx座標(x)とy座標(y)、矩形の幅(w)と高
さ(h)、続いてマッチングの結果得られた第1から第
8候補までの8つの文字コード、そして同じ第1候補文
字を修正後も記憶しておくためのコード(以下これを保
存用第1候補文字コードと呼ぶ)、さらに修正処理の方
法や内容を記憶するための修正フラグコードおよび修正
時に文字コードの追加が行われた場合に用いるポインタ
アドレスコードという計15種類の情報を表わすコード
列によって構成される。
り出し処理を行った文字画像データに対して認識処理を
行う。認識処理ではまず、位置、傾き、線幅、濃度等の
正規化処理を行う。続いてこの正規化された切り出し文
字画像データを認識部に送り込むことによってそれがど
んな文字かを認識する。認識は、まず正規化された切り
出し文字画像データに対し輪郭線特徴等の抽出を行い、
その抽出された特徴ベクトルと認識辞書における全ての
文字の標準パターンベクトルとのマッチングをとり、そ
の際最も確からしいとされた文字を第1候補とし、その
後2番目に確からしいものを第2候補、3番目に確から
しいものを第3候補…と以下同様に第8候補までを出力
することによって行う。このS303による結果は認識
結果データとしてRAM204に記憶される。図4は認
識結果データのデータ構造を示している。1つの切り出
し文字画像データに対する1文字あたりの認識結果デー
タは、まずその文字画像の文書画像上での位置と大きさ
を示す4つの情報、すなわち文字切り出し矩形の左上頂
点のx座標(x)とy座標(y)、矩形の幅(w)と高
さ(h)、続いてマッチングの結果得られた第1から第
8候補までの8つの文字コード、そして同じ第1候補文
字を修正後も記憶しておくためのコード(以下これを保
存用第1候補文字コードと呼ぶ)、さらに修正処理の方
法や内容を記憶するための修正フラグコードおよび修正
時に文字コードの追加が行われた場合に用いるポインタ
アドレスコードという計15種類の情報を表わすコード
列によって構成される。
【0016】なおS303での認識直後、すなわち未修
正時の修正フラグコードとポインタアドレスコードの値
にはそれぞれ0およびヌルポインタが格納されている。
なおヌルポインタとはアドレスとなり得ないある一定の
値であり、ポインタアドレスコードにこの値が格納され
ている場合にはポインタアドレスコードはどのアドレス
もさしていないことを意味する。
正時の修正フラグコードとポインタアドレスコードの値
にはそれぞれ0およびヌルポインタが格納されている。
なおヌルポインタとはアドレスとなり得ないある一定の
値であり、ポインタアドレスコードにこの値が格納され
ている場合にはポインタアドレスコードはどのアドレス
もさしていないことを意味する。
【0017】続くS304では、分離文字切り学習辞書
が既に作成されている場合に限り分離文字の修正処理が
行われるが、これについては後で詳細に説明する。続い
てS305では、これらの認識結果データをCRT20
8に表示する。認識終了直後において、CRT208に
表示されるものは、1文字当たりの認識結果データにお
ける第1候補文字のみであるが、その中の任意の文字を
ポインティングデバイス210で示すと、CRT208
には、その文字の第1候補〜第8候補までも併せて表示
される。その時のCRT画面を図5に示す。
が既に作成されている場合に限り分離文字の修正処理が
行われるが、これについては後で詳細に説明する。続い
てS305では、これらの認識結果データをCRT20
8に表示する。認識終了直後において、CRT208に
表示されるものは、1文字当たりの認識結果データにお
ける第1候補文字のみであるが、その中の任意の文字を
ポインティングデバイス210で示すと、CRT208
には、その文字の第1候補〜第8候補までも併せて表示
される。その時のCRT画面を図5に示す。
【0018】S305で表示される各文字データにおけ
る認識結果の第1候補が正解文字と異なっている場合、
オペレータはS306の指示により認識結果データの修
正を行うことが可能である。第2候補〜第8候補の中に
正解文字が含まれている場合には、オペレータは不正解
文字である第1候補と第2候補〜第8候補との入れ換え
をキーボード209やポインティングデバイス210を
用いて指示することにより認識結果を修正することが可
能である。また、候補文字に頼らず通常のテキストファ
イルのようにキーボード209からの入力を用いて直
接、第1候補文字の交換・削除・挿入により認識結果デ
ータの修正を指示することも可能である。S306の修
正の指示に基づき、S307では認識結果データの修正
を行う。修正された認識結果データは、S306の修正
指示の方法や内容の違いにより次の4つのパターンに分
類される。
る認識結果の第1候補が正解文字と異なっている場合、
オペレータはS306の指示により認識結果データの修
正を行うことが可能である。第2候補〜第8候補の中に
正解文字が含まれている場合には、オペレータは不正解
文字である第1候補と第2候補〜第8候補との入れ換え
をキーボード209やポインティングデバイス210を
用いて指示することにより認識結果を修正することが可
能である。また、候補文字に頼らず通常のテキストファ
イルのようにキーボード209からの入力を用いて直
接、第1候補文字の交換・削除・挿入により認識結果デ
ータの修正を指示することも可能である。S306の修
正の指示に基づき、S307では認識結果データの修正
を行う。修正された認識結果データは、S306の修正
指示の方法や内容の違いにより次の4つのパターンに分
類される。
【0019】(1) 第2候補〜第8候補に含まれる正解と
第1候補とを交換する。この場合修正フラグコードには
値1が格納される。
第1候補とを交換する。この場合修正フラグコードには
値1が格納される。
【0020】(2) キーボード209からの入力により第
1候補の文字コードを正解文字コードで置き換える。オ
ペレータの処理としてはある認識結果データの第1候補
の文字コードの削除を行った後で、1文字分の挿入を行
うことになる。この場合修正フラグコードには値2が格
納される。
1候補の文字コードを正解文字コードで置き換える。オ
ペレータの処理としてはある認識結果データの第1候補
の文字コードの削除を行った後で、1文字分の挿入を行
うことになる。この場合修正フラグコードには値2が格
納される。
【0021】(3) キーボード209からの入力により第
1候補の文字コードの削除を行う。この場合修正フラグ
コードには値3が格納される。
1候補の文字コードの削除を行う。この場合修正フラグ
コードには値3が格納される。
【0022】(4) キーボード209からの入力により文
字コードの挿入を行う。この場合修正フラグコードには
それまでの内容が保持され、あらかじめRAM204の
空きメモリ領域に確保しておいた挿入文字コード記憶領
域に挿入文字列コードを記憶させた上で、その先頭のメ
モリ空間アドレスの値をポインタアドレスコードに記憶
させる。
字コードの挿入を行う。この場合修正フラグコードには
それまでの内容が保持され、あらかじめRAM204の
空きメモリ領域に確保しておいた挿入文字コード記憶領
域に挿入文字列コードを記憶させた上で、その先頭のメ
モリ空間アドレスの値をポインタアドレスコードに記憶
させる。
【0023】以上のような4つのパターンにより修正さ
れる認識結果データをそれぞれ図6〜図9に示す。なお
図9の挿入文字列コードにおける“\0”は、追加した
文字列の末尾であることを示す文字コードである。
れる認識結果データをそれぞれ図6〜図9に示す。なお
図9の挿入文字列コードにおける“\0”は、追加した
文字列の末尾であることを示す文字コードである。
【0024】また認識結果データを修正する際には、た
とえオペレータが最終的に同じ修正を行ったとしても、
その交換・削除・挿入などの処理を行う順序によって認
識結果のデータ構造が変わってしまう可能性がある。そ
こでこれをできるだけ避けるために、次の3つの編集規
則に従った認識結果データの編集を行うこととする。
とえオペレータが最終的に同じ修正を行ったとしても、
その交換・削除・挿入などの処理を行う順序によって認
識結果のデータ構造が変わってしまう可能性がある。そ
こでこれをできるだけ避けるために、次の3つの編集規
則に従った認識結果データの編集を行うこととする。
【0025】(1) 修正フラグコードの値が2である認識
結果データ(データ1)の直前の認識結果データ(デー
タ0)において第1候補の文字コードの削除がなされた
場合、すなわち修正フラグコードに値3が格納された場
合には、その2つの認識結果データの修正フラグコード
の値を交換し、さらにデータ0の第1候補の文字をデー
タ1の第1候補の文字で置き換える。
結果データ(データ1)の直前の認識結果データ(デー
タ0)において第1候補の文字コードの削除がなされた
場合、すなわち修正フラグコードに値3が格納された場
合には、その2つの認識結果データの修正フラグコード
の値を交換し、さらにデータ0の第1候補の文字をデー
タ1の第1候補の文字で置き換える。
【0026】(2) 文字列の挿入が行われた認識結果デー
タ(データ1)の直後の認識結果データ(データ2)に
おいて第1候補の文字コードの削除がなされた場合、す
なわち修正フラグコードに値3が格納された場合には、
データ1における挿入文字列の第1文字目の文字コード
をデータ2における第1候補の文字として置き換え、デ
ータ2の修正フラグコードには値2を格納する。そし
て、挿入文字列の第2文字目の文字コードを格納したメ
モリ空間アドレスの値をデータ2のポインタアドレスコ
ードに記憶させる。
タ(データ1)の直後の認識結果データ(データ2)に
おいて第1候補の文字コードの削除がなされた場合、す
なわち修正フラグコードに値3が格納された場合には、
データ1における挿入文字列の第1文字目の文字コード
をデータ2における第1候補の文字として置き換え、デ
ータ2の修正フラグコードには値2を格納する。そし
て、挿入文字列の第2文字目の文字コードを格納したメ
モリ空間アドレスの値をデータ2のポインタアドレスコ
ードに記憶させる。
【0027】(3) 文字列の挿入が行われた認識結果デー
タにおいて第1候補の文字コードの削除がなされた場
合、すなわちフラグコードに値3が格納された場合に
は、挿入文字列の第1文字目の文字コードを第1候補の
文字として置き換え、修正フラグコードには値2を格納
する。そして、挿入文字列の第2文字目の文字コードを
格納したメモリ空間アドレスの値をポインタアドレスコ
ードに記憶させる。
タにおいて第1候補の文字コードの削除がなされた場
合、すなわちフラグコードに値3が格納された場合に
は、挿入文字列の第1文字目の文字コードを第1候補の
文字として置き換え、修正フラグコードには値2を格納
する。そして、挿入文字列の第2文字目の文字コードを
格納したメモリ空間アドレスの値をポインタアドレスコ
ードに記憶させる。
【0028】以上のような3つの規則による認識結果デ
ータの編集処理の1例をそれぞれ図10〜図12に示
す。このようなS306〜S307の処理を繰り返すこ
とにより、一通り認識結果データの修正が行われる。
ータの編集処理の1例をそれぞれ図10〜図12に示
す。このようなS306〜S307の処理を繰り返すこ
とにより、一通り認識結果データの修正が行われる。
【0029】続くS308では分離文字切り学習処理が
行われる。この学習処理の手順を図13のフローチャー
トに示す。まずS1301において、オペレータは修正
結果による分離文字切り学習を行うか否かを指示するこ
とができる。S1301における学習の指示は、キーボ
ード209やポインティングデバイス210を用いて所
定の指示を入力することにより行われる。
行われる。この学習処理の手順を図13のフローチャー
トに示す。まずS1301において、オペレータは修正
結果による分離文字切り学習を行うか否かを指示するこ
とができる。S1301における学習の指示は、キーボ
ード209やポインティングデバイス210を用いて所
定の指示を入力することにより行われる。
【0030】S1301の学習の指示に応じ、分離文字
切り学習のための一連の処理がS1302以下のステッ
プで開始される。S1302では今回の認識結果におけ
るすべての認識結果データの中から、文字切り処理の失
敗により分離文字となってしまった文字画像に対応する
認識結果の選択を行う。実施例では分離文字切り学習に
用いる分離文字の選択処理を、修正後の認識結果データ
の修正フラグコードおよびポインタアドレスコードを調
べることにより自動的に行っている。S306〜S30
7の修正処理において、最終的に分離文字に対する正し
い修正が行われた場合には、修正後の分離文字の認識結
果データの修正フラグコードおよびポインタアドレスコ
ードは、図14に示すようなパターンに当てはまる。そ
の際、先に述べた3つの編集規則に従った認識結果デー
タの編集により、修正の過程における文字の交換・削除
・挿入がどのような順序で行われたとしても、認識結果
データの修正フラグコードおよびポインタアドレスコー
ドは同じパターンに収束するようになっている。
切り学習のための一連の処理がS1302以下のステッ
プで開始される。S1302では今回の認識結果におけ
るすべての認識結果データの中から、文字切り処理の失
敗により分離文字となってしまった文字画像に対応する
認識結果の選択を行う。実施例では分離文字切り学習に
用いる分離文字の選択処理を、修正後の認識結果データ
の修正フラグコードおよびポインタアドレスコードを調
べることにより自動的に行っている。S306〜S30
7の修正処理において、最終的に分離文字に対する正し
い修正が行われた場合には、修正後の分離文字の認識結
果データの修正フラグコードおよびポインタアドレスコ
ードは、図14に示すようなパターンに当てはまる。そ
の際、先に述べた3つの編集規則に従った認識結果デー
タの編集により、修正の過程における文字の交換・削除
・挿入がどのような順序で行われたとしても、認識結果
データの修正フラグコードおよびポインタアドレスコー
ドは同じパターンに収束するようになっている。
【0031】図14の認識結果データにおける(N)文
字目から(N+M)文字目の認識結果データは、文字切
り出し処理において分離文字になっている文字画像群に
対応している。(N)文字目から(N+M)文字目に対
応する認識結果での修正フラグコードの値は、(N)文
字目の第1候補文字コードは他の文字コードと交換さ
れ、(N+1)〜(N+M)文字目までの第1候補文字
コードは削除されていることを示している。これは(M
+1)文字に分離・認識されていた文字をひとつの文字
にまとめるという認識結果の修正処理をオペレータが行
った結果である。
字目から(N+M)文字目の認識結果データは、文字切
り出し処理において分離文字になっている文字画像群に
対応している。(N)文字目から(N+M)文字目に対
応する認識結果での修正フラグコードの値は、(N)文
字目の第1候補文字コードは他の文字コードと交換さ
れ、(N+1)〜(N+M)文字目までの第1候補文字
コードは削除されていることを示している。これは(M
+1)文字に分離・認識されていた文字をひとつの文字
にまとめるという認識結果の修正処理をオペレータが行
った結果である。
【0032】さらに(N−1)文字目の文字、すなわち
分離文字の直前の文字に対応する認識結果データについ
ては、フラグコードの値が0か1であり、かつポインタ
アドレスコードがヌルポインタであることが条件となっ
ている。この条件は、分離文字の直前の文字において文
字切り出し処理の失敗が生じていないための条件と等価
であり、ある文字において認識結果データが修正されて
いない(フラグコードが0である)か若しくは他の第2
候補〜第8候補との交換で修正がなされている(フラグ
コードが1である)場合および文字の挿入が行われてい
ない(ポインタアドレスコードがヌルポインタである)
場合には、その文字の前後で文字切り出し処理の失敗が
生じている可能性が低いという前提に基づいている。一
方(N+M+1)文字目の文字、すなわち分離文字の直
後の文字に対応する認識結果データについては、(N−
1)文字目の認識結果の場合と同じ理由によりフラグコ
ードの値が0か1であることが条件となっている。なお
ここでポインタアドレスコードに関する制約が与えられ
ていないのは、分離文字の直後の文字のフラグコードの
値が0か1である場合には、たとえ文字の挿入が行われ
ていたとしても、その文字のさらに後ろの文字に関する
文字切り出し処理の失敗の可能性を示しているに過ぎな
いためである。
分離文字の直前の文字に対応する認識結果データについ
ては、フラグコードの値が0か1であり、かつポインタ
アドレスコードがヌルポインタであることが条件となっ
ている。この条件は、分離文字の直前の文字において文
字切り出し処理の失敗が生じていないための条件と等価
であり、ある文字において認識結果データが修正されて
いない(フラグコードが0である)か若しくは他の第2
候補〜第8候補との交換で修正がなされている(フラグ
コードが1である)場合および文字の挿入が行われてい
ない(ポインタアドレスコードがヌルポインタである)
場合には、その文字の前後で文字切り出し処理の失敗が
生じている可能性が低いという前提に基づいている。一
方(N+M+1)文字目の文字、すなわち分離文字の直
後の文字に対応する認識結果データについては、(N−
1)文字目の認識結果の場合と同じ理由によりフラグコ
ードの値が0か1であることが条件となっている。なお
ここでポインタアドレスコードに関する制約が与えられ
ていないのは、分離文字の直後の文字のフラグコードの
値が0か1である場合には、たとえ文字の挿入が行われ
ていたとしても、その文字のさらに後ろの文字に関する
文字切り出し処理の失敗の可能性を示しているに過ぎな
いためである。
【0033】分離文字の直前および直後の文字において
文字切り出しミスが生じている場合には、分離文字にお
ける文字画像の文字切り出し結果にもなんらかの影響を
与えている可能性があるため、こうした分離文字の直前
の文字と直後の文字に対応する認識結果データに関する
条件を加えることにより、学習させても意味のない認識
結果が、分離文字切り学習に用いられることを防止して
いる。なお、(N)文字目〜(N+M)文字目の前後に
改行がある場合には、(N−1)文字目および(N+M
+1)文字目の認識結果データに関する各条件は無視す
ることとする。
文字切り出しミスが生じている場合には、分離文字にお
ける文字画像の文字切り出し結果にもなんらかの影響を
与えている可能性があるため、こうした分離文字の直前
の文字と直後の文字に対応する認識結果データに関する
条件を加えることにより、学習させても意味のない認識
結果が、分離文字切り学習に用いられることを防止して
いる。なお、(N)文字目〜(N+M)文字目の前後に
改行がある場合には、(N−1)文字目および(N+M
+1)文字目の認識結果データに関する各条件は無視す
ることとする。
【0034】続くS1303では、S1302で選択さ
れた分離文字に対応する認識結果データを基にして、R
AM204に一時的に記憶されている分離文字切り学習
辞書の更新、あるいは分離文字切り学習辞書を過去に作
成したことがなければ新たな分離文字切り学習辞書の作
成を行う。
れた分離文字に対応する認識結果データを基にして、R
AM204に一時的に記憶されている分離文字切り学習
辞書の更新、あるいは分離文字切り学習辞書を過去に作
成したことがなければ新たな分離文字切り学習辞書の作
成を行う。
【0035】分離文字切り学習辞書に登録されるひとつ
の分離文字に関する情報は、次の4項目により構成され
ている。
の分離文字に関する情報は、次の4項目により構成され
ている。
【0036】(1) 分離文字がいくつの文字画像に分離し
ていたかを示す数 (2) 文字の分離によって誤認識された認識文字コード列
(以下誤認識文字コード列と呼ぶ) (3) 認識結果の修正による正解文字コード (4) 分離文字を構成するそれぞれの文字画像の文書画像
上での位置と大きさを示す4つの情報、すなわち文字切
り出し矩形の左上頂点のx座標(x)とy座標(y)、
矩形の幅(w)と高さ(h) これらの情報は全て認識結果データに記憶されているも
のであるため、S1302で選択された分離文字に対応
する認識結果データの内容より得られる上記の情報を順
次記憶させていくことで、分離文字切り学習辞書の更新
および作成を行うことができる。なお、分離文字切り学
習辞書に登録されるひとつの分離文字に関する情報の1
例を図15に示す。
ていたかを示す数 (2) 文字の分離によって誤認識された認識文字コード列
(以下誤認識文字コード列と呼ぶ) (3) 認識結果の修正による正解文字コード (4) 分離文字を構成するそれぞれの文字画像の文書画像
上での位置と大きさを示す4つの情報、すなわち文字切
り出し矩形の左上頂点のx座標(x)とy座標(y)、
矩形の幅(w)と高さ(h) これらの情報は全て認識結果データに記憶されているも
のであるため、S1302で選択された分離文字に対応
する認識結果データの内容より得られる上記の情報を順
次記憶させていくことで、分離文字切り学習辞書の更新
および作成を行うことができる。なお、分離文字切り学
習辞書に登録されるひとつの分離文字に関する情報の1
例を図15に示す。
【0037】図13を用いて詳細に説明した分離文字切
り学習処理S308が行われた後、最後にステップS3
09では、S303〜S307で作成・修正された認識
結果データおよびS308で作成・更新された分離文字
切り学習辞書を外部記憶206に格納する。外部記憶2
06に記憶された分離文字切り学習辞書を用いることに
より、実施例においては分離文字の修正処理を行うこと
が可能である。分離文字の修正処理は、図3のフローチ
ャートにおけるS304で行われる。その処理のフロー
チャートを図16に示す。
り学習処理S308が行われた後、最後にステップS3
09では、S303〜S307で作成・修正された認識
結果データおよびS308で作成・更新された分離文字
切り学習辞書を外部記憶206に格納する。外部記憶2
06に記憶された分離文字切り学習辞書を用いることに
より、実施例においては分離文字の修正処理を行うこと
が可能である。分離文字の修正処理は、図3のフローチ
ャートにおけるS304で行われる。その処理のフロー
チャートを図16に示す。
【0038】まずS1601において、オペレータは分
離文字の修正処理を行うか否かを指示することができ
る。S1601における分離文字の修正処理の指示は、
キーボード209やポインティングデバイス210を用
いて所定の指示を入力することにより行われる。S16
01の指示に応じ、一連の分離文字の修正処理がS16
02以下のステップより開始される。
離文字の修正処理を行うか否かを指示することができ
る。S1601における分離文字の修正処理の指示は、
キーボード209やポインティングデバイス210を用
いて所定の指示を入力することにより行われる。S16
01の指示に応じ、一連の分離文字の修正処理がS16
02以下のステップより開始される。
【0039】まずS1602では、認識結果データの1
位候補文字コード列を順次検索し、分離文字切り学習辞
書に登録されている各分離文字に関する情報における誤
認識文字コード列と同じ文字列の並びが1位候補文字コ
ード列の中に存在していないかを調べる。もしここで誤
認識文字コード列と同じ文字列の並びが発見されなけれ
ばここで処理は終了するが、発見された場合には、今回
の認識結果においても同じ分離文字の文字切り出しミス
を犯している可能性があるのでさらにS1603で詳細
に調べる。
位候補文字コード列を順次検索し、分離文字切り学習辞
書に登録されている各分離文字に関する情報における誤
認識文字コード列と同じ文字列の並びが1位候補文字コ
ード列の中に存在していないかを調べる。もしここで誤
認識文字コード列と同じ文字列の並びが発見されなけれ
ばここで処理は終了するが、発見された場合には、今回
の認識結果においても同じ分離文字の文字切り出しミス
を犯している可能性があるのでさらにS1603で詳細
に調べる。
【0040】S1603では、誤認識文字コード列と同
じ文字列の並びになっている認識結果データにおける文
字切り出し矩形の幅および高さと、S1602で該当し
た分離文字切り学習辞書に登録されている分離文字画像
の切り出し矩形の幅および高さとをそれぞれ比べ、その
差がある基準閾値以下であるかどうかを調べる。もしこ
こで基準閾値以上であった場合には、この認識結果デー
タの文字列は分離文字でないと判断して処理を終了し、
さらに以下の認識結果データの1位候補文字コード列を
検索すべく処理はS1602に戻る。一方ここで基準閾
値以下という条件を満たした場合には、この認識結果デ
ータに対応する文字画像群は分離文字であると決定す
る。
じ文字列の並びになっている認識結果データにおける文
字切り出し矩形の幅および高さと、S1602で該当し
た分離文字切り学習辞書に登録されている分離文字画像
の切り出し矩形の幅および高さとをそれぞれ比べ、その
差がある基準閾値以下であるかどうかを調べる。もしこ
こで基準閾値以上であった場合には、この認識結果デー
タの文字列は分離文字でないと判断して処理を終了し、
さらに以下の認識結果データの1位候補文字コード列を
検索すべく処理はS1602に戻る。一方ここで基準閾
値以下という条件を満たした場合には、この認識結果デ
ータに対応する文字画像群は分離文字であると決定す
る。
【0041】S1604では、S1603で分離文字で
あると判断された認識結果の修正を行う。
あると判断された認識結果の修正を行う。
【0042】まず分離文字であると判断された認識結果
データに対応する文字画像群をひとつに結合した文字画
像の文字切り出し矩形枠を決める。なおこれは、認識結
果データにおける文字切り出し矩形の左上頂点のx座標
とy座標、矩形の幅と高さより容易に求めることができ
る。続いて、この新たな文字切り出し矩形枠で切り出さ
れた文字画像に対し、図3のフローチャートにおけるS
303で行われたのと同様な認識処理を行い、その認識
結果データをそれまでの分離文字の認識結果データと置
き換える。S1604のステップが終了すると、さらに
以下の認識結果データの1位候補文字コード列を検索す
べく処理はS1602に戻る。S304で修正処理がな
された認識結果データは、S303の認識処理終了後の
認識結果データと同じ形式になっており、S305以下
の処理を続けることが可能である。
データに対応する文字画像群をひとつに結合した文字画
像の文字切り出し矩形枠を決める。なおこれは、認識結
果データにおける文字切り出し矩形の左上頂点のx座標
とy座標、矩形の幅と高さより容易に求めることができ
る。続いて、この新たな文字切り出し矩形枠で切り出さ
れた文字画像に対し、図3のフローチャートにおけるS
303で行われたのと同様な認識処理を行い、その認識
結果データをそれまでの分離文字の認識結果データと置
き換える。S1604のステップが終了すると、さらに
以下の認識結果データの1位候補文字コード列を検索す
べく処理はS1602に戻る。S304で修正処理がな
された認識結果データは、S303の認識処理終了後の
認識結果データと同じ形式になっており、S305以下
の処理を続けることが可能である。
【0043】(他の実施例)認識結果の候補は必ずしも
8個選び出す必要はなく、任意のN個の候補としても良
い。
8個選び出す必要はなく、任意のN個の候補としても良
い。
【0044】認識結果データの構造は、必ずしも図4の
形式による必要はなく、文字画像の文書画像上での位置
と大きさを示す文字切り出し矩形の左上頂点のx座標と
y座標、矩形の幅と高さ、マッチングの結果得られた第
1から第8候補までの8つの文字コードと認識結果の修
正後も変わらない保存用第1候補文字コード、認識結果
の修正方法や内容等を識別することができるフラグコー
ド、修正時に文字の挿入が行われた場合に用いるポイン
タアドレスという以上の情報がデータの中に含まれてい
れば良い。また、マッチングの結果の情報(距離または
類似度)を同時に保存しておいてもよい。
形式による必要はなく、文字画像の文書画像上での位置
と大きさを示す文字切り出し矩形の左上頂点のx座標と
y座標、矩形の幅と高さ、マッチングの結果得られた第
1から第8候補までの8つの文字コードと認識結果の修
正後も変わらない保存用第1候補文字コード、認識結果
の修正方法や内容等を識別することができるフラグコー
ド、修正時に文字の挿入が行われた場合に用いるポイン
タアドレスという以上の情報がデータの中に含まれてい
れば良い。また、マッチングの結果の情報(距離または
類似度)を同時に保存しておいてもよい。
【0045】前記実施例においては、横書き文書の分離
文字の学習についてのみの説明を行ったが、縦書き文書
の分離文字についても同様の手法で学習することが可能
である。
文字の学習についてのみの説明を行ったが、縦書き文書
の分離文字についても同様の手法で学習することが可能
である。
【0046】また前記実施例においては、分離文字切り
学習に用いる分離文字の選択処理を、修正後の認識結果
データのフラグコードおよびポインタアドレスコードを
調べることにより自動的に行っているが、分離文字切り
学習に効果的であると予測される分離文字をオペレータ
がキーボード209やポインティングデバイス210を
用いてひとつひとつ指示することにより選択することも
可能である。
学習に用いる分離文字の選択処理を、修正後の認識結果
データのフラグコードおよびポインタアドレスコードを
調べることにより自動的に行っているが、分離文字切り
学習に効果的であると予測される分離文字をオペレータ
がキーボード209やポインティングデバイス210を
用いてひとつひとつ指示することにより選択することも
可能である。
【0047】さらに前記実施例における分離文字の修正
処理の指示はひとつの文書画像を認識するごとに行われ
ているが、全ての文字認識のための処理を行う前にオペ
レータが所定の指示を与えておくことにより、文書画像
を認識するごとの修正処理の指示を省略することも可能
である。
処理の指示はひとつの文書画像を認識するごとに行われ
ているが、全ての文字認識のための処理を行う前にオペ
レータが所定の指示を与えておくことにより、文書画像
を認識するごとの修正処理の指示を省略することも可能
である。
【0048】さらに前記実施例のS1603における矩
形枠の大きさによる分離文字かどうかの判断は、矩形枠
の縦横比、すなわち矩形枠の高さを幅で割ったものを基
準に行うことも可能である。
形枠の大きさによる分離文字かどうかの判断は、矩形枠
の縦横比、すなわち矩形枠の高さを幅で割ったものを基
準に行うことも可能である。
【0049】
【発明の効果】本発明によれば、文字切り出し処理の失
敗による分離文字のパターンをあらかじめ学習しておく
ことにより、学習後の文字認識における分離文字の修正
を可能とし、それによって過去に生じたものと同じ分離
文字による文字切り出しミスを低減し、文字認識率の向
上を実現することができる。
敗による分離文字のパターンをあらかじめ学習しておく
ことにより、学習後の文字認識における分離文字の修正
を可能とし、それによって過去に生じたものと同じ分離
文字による文字切り出しミスを低減し、文字認識率の向
上を実現することができる。
【図1】本発明実施例のブロック図である。
【図2】文字切り処理の失敗による分離文字の例を示す
図である。
図である。
【図3】同実施例のフローチャートである。
【図4】同実施例の認識結果データの記憶形式を示す図
である。
である。
【図5】同実施例の表示画面を示す図である。
【図6】第2候補〜第8候補に含まれる正解と第1候補
との交換による修正がなされた場合の認識結果データの
構造の1例を示す図である。
との交換による修正がなされた場合の認識結果データの
構造の1例を示す図である。
【図7】キーボード209からの入力により第1候補の
文字コードを正解文字コードで置き換えることによる修
正がなされた場合の認識結果データの構造の1例を示す
図である。
文字コードを正解文字コードで置き換えることによる修
正がなされた場合の認識結果データの構造の1例を示す
図である。
【図8】キーボード209からの入力により第1候補の
文字コードの削除を行うことによる修正がなされた場合
の認識結果データの構造の1例を示す図である。
文字コードの削除を行うことによる修正がなされた場合
の認識結果データの構造の1例を示す図である。
【図9】キーボード209からの入力により第1候補の
文字コードの挿入を行うことによる修正がなされた場合
の認識結果データの記憶形式を示す図である。
文字コードの挿入を行うことによる修正がなされた場合
の認識結果データの記憶形式を示す図である。
【図10】フラグコードの値が2である認識結果データ
の直前の認識結果データにおいて第1候補の文字コード
の削除がなされた場合の認識結果データの編集の1例を
示す図である。
の直前の認識結果データにおいて第1候補の文字コード
の削除がなされた場合の認識結果データの編集の1例を
示す図である。
【図11】文字列の挿入が行われた認識結果データの直
後の認識結果データにおいて第1候補の文字コードの削
除がなされた場合の認識結果データの編集の1例を示す
図である。
後の認識結果データにおいて第1候補の文字コードの削
除がなされた場合の認識結果データの編集の1例を示す
図である。
【図12】文字列の挿入が行われた認識結果データにお
いて第1候補の文字コードの削除がなされた場合の認識
結果データの編集の1例を示す図である。
いて第1候補の文字コードの削除がなされた場合の認識
結果データの編集の1例を示す図である。
【図13】同実施例における分離文字切り学習処理のフ
ローチャートである。
ローチャートである。
【図14】修正後の認識結果データが分離文字である場
合のフラグコードおよびポインタアドレスコードのパタ
ーンを示す図である。
合のフラグコードおよびポインタアドレスコードのパタ
ーンを示す図である。
【図15】分離文字切り学習辞書に登録される分離文字
に関する情報の1例を示す図である。
に関する情報の1例を示す図である。
【図16】同実施例における分離文字の修正処理のフロ
ーチャートである。
ーチャートである。
201 スキャナ 202 二値化回路 203 CPU 204 RAM 205 ROM 206 外部記憶 207 CRTインターフェイス 208 CRT 209 キーボード 210 ポインティングデバイス
Claims (2)
- 【請求項1】 入力された文書画像に対して1文字ずつ
の切り出しを行う切出手段と、該切出手段により切り出
された文字画像を認識する認識手段と、分離文字に関す
る前記切出手段による文字切り出しミス情報を登録する
学習辞書と、該学習辞書を用いて前記認識手段による認
識結果に分離文字があるか否かを検索する検索手段と、
該検索手段により得られた分離文字を前記学習辞書に基
づいて当該分離文字を修正する修正手段とを具えたこと
を特徴とする文字認識装置。 - 【請求項2】 前記学習辞書に前記文字切り出しミス情
報を登録するために、前記認識手段により得られた分離
文字のために誤認識となった認識結果において第1認識
候補文字を修正する手段、前記第1認識候補文字の修正
がおこなわれたかについての有無および修正内容を記憶
する記憶手段、および認識結果の前記修正の際に前記記
憶手段に記憶された修正内容を基準として選択された、
分離文字に関する修正後の認識結果に基づいて分離文字
による誤認識情報の作成および更新を前記学習辞書に対
して行う辞書学習手段を有することを特徴とする請求項
1に記載の文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4344137A JPH06195514A (ja) | 1992-12-24 | 1992-12-24 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4344137A JPH06195514A (ja) | 1992-12-24 | 1992-12-24 | 文字認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH06195514A true JPH06195514A (ja) | 1994-07-15 |
Family
ID=18366930
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4344137A Pending JPH06195514A (ja) | 1992-12-24 | 1992-12-24 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH06195514A (ja) |
-
1992
- 1992-12-24 JP JP4344137A patent/JPH06195514A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0439951B1 (en) | Data processing | |
| US5416849A (en) | Data processing system and method for field extraction of scanned images of document forms | |
| US6466694B2 (en) | Document image processing device and method thereof | |
| US5907631A (en) | Document image processing method and system having function of determining body text region reading order | |
| JP2588491B2 (ja) | 画像切り出し装置及びその方法 | |
| JP2009122722A (ja) | 帳票認識プログラム、帳票認識装置および帳票認識方法 | |
| US5265171A (en) | Optical character reading apparatus for performing spelling check | |
| JP3394694B2 (ja) | フォーマット情報登録方法及びocrシステム | |
| JPH0696263A (ja) | パターン認識装置 | |
| JP3792759B2 (ja) | 文字認識方法とその装置 | |
| JPH06195514A (ja) | 文字認識装置 | |
| JP3270551B2 (ja) | 文字認識装置および文字認識方法 | |
| JP3221968B2 (ja) | 文字認識装置 | |
| JPH08180066A (ja) | インデックス作成方法、文書検索方法及び文書検索装置 | |
| JPH0991371A (ja) | 文字表示装置 | |
| JP2842263B2 (ja) | 住所読み取り装置 | |
| JPH0589190A (ja) | 図面情報のチエツク方式 | |
| JP3335494B2 (ja) | 文字認識処理装置 | |
| JP3750406B2 (ja) | 文書ファイリング装置 | |
| JP2000132635A (ja) | 認識データ確認方法 | |
| JP2687902B2 (ja) | 文書画像認識装置 | |
| JPH07271921A (ja) | 文字認識装置および文字認識方法 | |
| JPH0612520A (ja) | 文字認識装置の確認修正方式 | |
| JPH05120471A (ja) | 文字認識装置 | |
| JPH01292586A (ja) | 文字認識支援装置 |