JPH0850631A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH0850631A JPH0850631A JP6184740A JP18474094A JPH0850631A JP H0850631 A JPH0850631 A JP H0850631A JP 6184740 A JP6184740 A JP 6184740A JP 18474094 A JP18474094 A JP 18474094A JP H0850631 A JPH0850631 A JP H0850631A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition result
- recognition
- image
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【構成】 誤認判定部103は、文字認識処理部102
による認識結果の信頼度が低く誤認の可能性の高い文字
を判別する。誤認領域判定部104は、誤認の可能性が
高いと判定された文字、その前後各n文字を含めた範
囲、あるいは、半数以上の文字が誤認の恐れが高いと判
断さた行の範囲を誤認領域と判定する。誤認領域抽出部
105は、誤認領域内の文字については、認識結果に加
えてイメージと候補文字群を認識結果ファイル108に
書き込む。 【効果】 認識結果ファイルのサイズを小さくでき、文
字認識装置のメモリ容量・ファイル容量が小さい場合に
も不都合がない。認識結果ファイルのデータを用いて誤
認文字の修正を行なう際に、修正に必要な文字イメージ
及び候補文字群を表示させることができるため、効率的
な修正作業が可能である。
による認識結果の信頼度が低く誤認の可能性の高い文字
を判別する。誤認領域判定部104は、誤認の可能性が
高いと判定された文字、その前後各n文字を含めた範
囲、あるいは、半数以上の文字が誤認の恐れが高いと判
断さた行の範囲を誤認領域と判定する。誤認領域抽出部
105は、誤認領域内の文字については、認識結果に加
えてイメージと候補文字群を認識結果ファイル108に
書き込む。 【効果】 認識結果ファイルのサイズを小さくでき、文
字認識装置のメモリ容量・ファイル容量が小さい場合に
も不都合がない。認識結果ファイルのデータを用いて誤
認文字の修正を行なう際に、修正に必要な文字イメージ
及び候補文字群を表示させることができるため、効率的
な修正作業が可能である。
Description
【0001】
【産業上の利用分野】本発明は、文字認識装置に関す
る。
る。
【0002】
【従来の技術】従来、文字認識と誤認文字の修正に関し
ては、同一装置上において、原稿単位に文字認識と誤認
文字修正とを連続的に行なうというのが一般的であっ
た。この誤認文字修正時に、ディスプレイ上に原稿イメ
ージあるいは文字イメージを表示させることにより、原
稿に視点を移すことなく、ディスプレイ上で原稿と認識
結果とを突き合わせる方法が採用されることが多い(例
えば特開平4−34671号)。また、効率的な修正を
可能にするため、ディスプレイ上に候補文字群を表示さ
せ、その中から正解文字を選択できるようにする等、さ
まざまな方法が考案されている。
ては、同一装置上において、原稿単位に文字認識と誤認
文字修正とを連続的に行なうというのが一般的であっ
た。この誤認文字修正時に、ディスプレイ上に原稿イメ
ージあるいは文字イメージを表示させることにより、原
稿に視点を移すことなく、ディスプレイ上で原稿と認識
結果とを突き合わせる方法が採用されることが多い(例
えば特開平4−34671号)。また、効率的な修正を
可能にするため、ディスプレイ上に候補文字群を表示さ
せ、その中から正解文字を選択できるようにする等、さ
まざまな方法が考案されている。
【0003】また、一般的に、文字認識と誤認文字修正
は同一のアプリケーションとして行なわれるため、文字
認識結果の候補文字群や文字イメージを保存する必要が
なく、また、保存しない場合が多い。文字イメージを保
存する場合でも、文書全体あるいは認識処理対象範囲の
イメージをそっくり保存するのが一般的であった。
は同一のアプリケーションとして行なわれるため、文字
認識結果の候補文字群や文字イメージを保存する必要が
なく、また、保存しない場合が多い。文字イメージを保
存する場合でも、文書全体あるいは認識処理対象範囲の
イメージをそっくり保存するのが一般的であった。
【0004】
【発明が解決しようとする課題】さて、文字認識装置
は、単独装置として実現されることが多かったが、スキ
ャナーや複写機等の機器に組み込まれる形態も増加しつ
つある。
は、単独装置として実現されることが多かったが、スキ
ャナーや複写機等の機器に組み込まれる形態も増加しつ
つある。
【0005】この組み込み形態の場合、機器のメモリ容
量もしくはファイル容量が制約されたり、あるいはキー
ボード等の文字入力手段が存在しないか、存在してもそ
の能力が弱体であることが少なくない。このような機器
では、文字認識だけを実行し、その誤認文字の修正は他
の装置上で別のアプリケーションとして行なうのが得策
であり、また、そうせざるを得ない場合が多いであろ
う。
量もしくはファイル容量が制約されたり、あるいはキー
ボード等の文字入力手段が存在しないか、存在してもそ
の能力が弱体であることが少なくない。このような機器
では、文字認識だけを実行し、その誤認文字の修正は他
の装置上で別のアプリケーションとして行なうのが得策
であり、また、そうせざるを得ない場合が多いであろ
う。
【0006】このように文字認識と誤認文字修正とを分
離する場合に、前述のような誤認文字の効率的な修正を
可能にするためには、文字認識装置側で認識結果ととも
に、候補文字群及び文字領域のイメージをファイルとし
て保存するようにすると好都合であることは明らかであ
る。しかし、文字認識装置側でメモリ容量もしくはファ
イル容量を多くとれない場合、すべての文字について、
イメージと候補文字群を保存することは能力的に無理で
あったり、また、誤認文字の修正を実行する装置側の環
境にも負荷がかかる可能性がある。
離する場合に、前述のような誤認文字の効率的な修正を
可能にするためには、文字認識装置側で認識結果ととも
に、候補文字群及び文字領域のイメージをファイルとし
て保存するようにすると好都合であることは明らかであ
る。しかし、文字認識装置側でメモリ容量もしくはファ
イル容量を多くとれない場合、すべての文字について、
イメージと候補文字群を保存することは能力的に無理で
あったり、また、誤認文字の修正を実行する装置側の環
境にも負荷がかかる可能性がある。
【0007】また、同じ文字認識装置上で文字認識と誤
認文字修正とを別アプリケーションとして実行する形態
においても、認識結果のみならず候補文字群とイメージ
とを保存すると好都合であるが、文字認識装置のメモリ
容量もしくはファイル容量を大きくとれない場合には、
すべての文字についてのイメージと候補文字群を保存す
ることは困難である。
認文字修正とを別アプリケーションとして実行する形態
においても、認識結果のみならず候補文字群とイメージ
とを保存すると好都合であるが、文字認識装置のメモリ
容量もしくはファイル容量を大きくとれない場合には、
すべての文字についてのイメージと候補文字群を保存す
ることは困難である。
【0008】本発明の目的は、文字認識と誤認文字修正
とを文字認識装置と他の装置とに分離して行なう処理形
態において、あるいは、同一の文字認識装置上で文字認
識と誤認文字修正とを別アプリケーションとして行なう
処理形態において、文字認識装置のメモリ容量もしくは
ファイル容量を多くとれない場合にも、効率的な誤認文
字修正を可能にしようとするものである。より具体的に
は、本発明の目的は、文字認識を行なって認識結果ファ
イルを生成する文字認識装置において、誤認文字修正作
業の効率を犠牲にすることなく、認識結果ファイルのサ
イズを削減することにある。
とを文字認識装置と他の装置とに分離して行なう処理形
態において、あるいは、同一の文字認識装置上で文字認
識と誤認文字修正とを別アプリケーションとして行なう
処理形態において、文字認識装置のメモリ容量もしくは
ファイル容量を多くとれない場合にも、効率的な誤認文
字修正を可能にしようとするものである。より具体的に
は、本発明の目的は、文字認識を行なって認識結果ファ
イルを生成する文字認識装置において、誤認文字修正作
業の効率を犠牲にすることなく、認識結果ファイルのサ
イズを削減することにある。
【0009】
【課題を解決するための手段】請求項1ないし5の各項
の発明は文字認識装置の発明であり、上記目的を達成す
るため、それぞれ以下に述べる構成を有するものであ
る。
の発明は文字認識装置の発明であり、上記目的を達成す
るため、それぞれ以下に述べる構成を有するものであ
る。
【0010】請求項1の発明は、文字入力画像上の文字
イメージに対する文字認識を行なう手段と、該手段によ
る認識結果を認識結果ファイルに保存する段と、認識結
果の信頼度の低い文字のイメージを該認識結果ファイル
に保存する手段とを有することを特徴とする。
イメージに対する文字認識を行なう手段と、該手段によ
る認識結果を認識結果ファイルに保存する段と、認識結
果の信頼度の低い文字のイメージを該認識結果ファイル
に保存する手段とを有することを特徴とする。
【0011】請求項2の発明は、入力画像上の文字イメ
ージに対する文字認識を行なう手段と、該手段による認
識結果を認識結果ファイルに保存する手段と、認識結果
の信頼度の低い文字とその前後各n文字(ただしnは正
整数)のイメージを該認識結果ファイルに保存する手段
とを有することを特徴とする。
ージに対する文字認識を行なう手段と、該手段による認
識結果を認識結果ファイルに保存する手段と、認識結果
の信頼度の低い文字とその前後各n文字(ただしnは正
整数)のイメージを該認識結果ファイルに保存する手段
とを有することを特徴とする。
【0012】請求項3の発明は、請求項1または2の発
明の構成において、認識結果の信頼度の低い文字が所定
割合以上を占める行について、該行の全文字のイメージ
が認識結果ファイルに保存されることを特徴とする。
明の構成において、認識結果の信頼度の低い文字が所定
割合以上を占める行について、該行の全文字のイメージ
が認識結果ファイルに保存されることを特徴とする。
【0013】請求項4の発明は、請求項1または2の発
明の構成に加え、認識結果ファイルにイメージの保存さ
れる文字に対する候補文字群を該認識結果ファイルに保
存する手段を有することを特徴とする。
明の構成に加え、認識結果ファイルにイメージの保存さ
れる文字に対する候補文字群を該認識結果ファイルに保
存する手段を有することを特徴とする。
【0014】請求項5の発明は、請求項3の発明の構成
に加えて、認識結果ファイルにイメージの保存される文
字に対する候補文字群を該認識結果ファイルに保存する
手段を有することを特徴とする。
に加えて、認識結果ファイルにイメージの保存される文
字に対する候補文字群を該認識結果ファイルに保存する
手段を有することを特徴とする。
【0015】
【作用】認識結果の信頼度の低い文字は、誤認の可能性
が高く修正が必要となることが予想される。請求項1の
発明によれば、このような文字のイメージも認識結果と
ともに認識結果ファイルに保存されるので、この認識結
果ファイルのデータを用いて同じ文字認識装置上で文字
認識とは別アプリケーションとして誤認文字の修正を行
なう際に、あるいは別の装置上で誤認文字の修正を行な
う際に、修正の必要が予想される文字のイメージを表示
させることにより、原稿を参照することなく、効率的に
認識結果の確認と必要な修正を行なうことができる。し
かも、イメージが保存されるのは認識結果の信頼度の低
い文字のものだけであるので、すべての文字のイメージ
を無条件に保存する場合に比べ、認識結果ファイルのサ
イズを大幅に減らすことができる。
が高く修正が必要となることが予想される。請求項1の
発明によれば、このような文字のイメージも認識結果と
ともに認識結果ファイルに保存されるので、この認識結
果ファイルのデータを用いて同じ文字認識装置上で文字
認識とは別アプリケーションとして誤認文字の修正を行
なう際に、あるいは別の装置上で誤認文字の修正を行な
う際に、修正の必要が予想される文字のイメージを表示
させることにより、原稿を参照することなく、効率的に
認識結果の確認と必要な修正を行なうことができる。し
かも、イメージが保存されるのは認識結果の信頼度の低
い文字のものだけであるので、すべての文字のイメージ
を無条件に保存する場合に比べ、認識結果ファイルのサ
イズを大幅に減らすことができる。
【0016】文字単位の認識結果の信頼度のみでは、必
ずしも正確に誤認を判断できないことがある。信頼度の
低い文字の前後の文字で、その信頼度が高くとも誤認が
起きていることが少なくない。特に、文字切り出しや言
語処理でバックトラックをしない文字認識処理方式を採
用している場合には、そのようなケースが多い。かかる
点に着目したのが請求項2の発明であり、同発明によれ
ば、認識結果の信頼度の低い文字の前後一定範囲内の文
字まで、イメージの保存範囲が拡張される。したがっ
て、請求項1の発明による場合に比べイメージ保存範囲
の拡張された分だけ認識結果ファイルのサイズは増加す
るが、それでも全文字のイメージを保存する場合に比べ
認識結果ファイルのサイズは十分に小さくなる。しか
も、誤認文字修正の際に、認識結果の信頼度の低い文字
のみならず、その前後一定範囲の文字のイメージをも表
示させることができるので、前後の文字の誤認が生じて
いる場合でも的確かつ効率的な修正作業が可能になる。
ずしも正確に誤認を判断できないことがある。信頼度の
低い文字の前後の文字で、その信頼度が高くとも誤認が
起きていることが少なくない。特に、文字切り出しや言
語処理でバックトラックをしない文字認識処理方式を採
用している場合には、そのようなケースが多い。かかる
点に着目したのが請求項2の発明であり、同発明によれ
ば、認識結果の信頼度の低い文字の前後一定範囲内の文
字まで、イメージの保存範囲が拡張される。したがっ
て、請求項1の発明による場合に比べイメージ保存範囲
の拡張された分だけ認識結果ファイルのサイズは増加す
るが、それでも全文字のイメージを保存する場合に比べ
認識結果ファイルのサイズは十分に小さくなる。しか
も、誤認文字修正の際に、認識結果の信頼度の低い文字
のみならず、その前後一定範囲の文字のイメージをも表
示させることができるので、前後の文字の誤認が生じて
いる場合でも的確かつ効率的な修正作業が可能になる。
【0017】文書中の一部の行の認識率が極端に悪いこ
とがある。例えば、仕様外のポイント数の文字が用いら
れた見出しや注釈などの行である。このような行の認識
結果の修正を行なう場合には、行全体の文字イメージを
確認できることが望まれる。しかして、請求項3の発明
によれば、行の一定割合以上の文字の信頼度が低い場合
には、文字イメージの保存範囲を行全体まで拡張するた
め、そのような認識率が極端に悪い見出しや注釈等の行
の誤認文字修正を容易かつ的確に行なうことができるよ
うになる。
とがある。例えば、仕様外のポイント数の文字が用いら
れた見出しや注釈などの行である。このような行の認識
結果の修正を行なう場合には、行全体の文字イメージを
確認できることが望まれる。しかして、請求項3の発明
によれば、行の一定割合以上の文字の信頼度が低い場合
には、文字イメージの保存範囲を行全体まで拡張するた
め、そのような認識率が極端に悪い見出しや注釈等の行
の誤認文字修正を容易かつ的確に行なうことができるよ
うになる。
【0018】請求項4または5の発明によれば、誤認の
予想される文字について、イメージのみならず候補文字
群も認識結果ファイルに保存される。したがって、同じ
文字認識装置上あるいは他の装置上で、認識結果ファイ
ルのデータを用いて誤認文字修正を行なう場合に、文字
イメージを表示させて参照できるほか、候補文字群を表
示させ、その中から正解文字を選択することができるた
め、効率的な修正作業が可能になる。しかも、イメージ
と候補文字群(キャラクタデータ)が保存されるのは誤
認の可能性の高い文字だけであるので、全文字について
それを保存する場合に比べ、認識結果ファイルのサイズ
を十分に小さくできる。
予想される文字について、イメージのみならず候補文字
群も認識結果ファイルに保存される。したがって、同じ
文字認識装置上あるいは他の装置上で、認識結果ファイ
ルのデータを用いて誤認文字修正を行なう場合に、文字
イメージを表示させて参照できるほか、候補文字群を表
示させ、その中から正解文字を選択することができるた
め、効率的な修正作業が可能になる。しかも、イメージ
と候補文字群(キャラクタデータ)が保存されるのは誤
認の可能性の高い文字だけであるので、全文字について
それを保存する場合に比べ、認識結果ファイルのサイズ
を十分に小さくできる。
【0019】
【実施例】図1は本発明による文字認識装置の一例を示
す概略ブロック図である。画像入力部101より文書等
の画像データを入力する。この入力画像データは画像メ
モリ107に格納される。文字認識処理部102におい
て、画像メモリ107に記憶された画像データより文字
イメージを切り出し文字認識するが、この文字認識処理
は従来と同様の手法によってよいので、その詳細説明は
割愛する。
す概略ブロック図である。画像入力部101より文書等
の画像データを入力する。この入力画像データは画像メ
モリ107に格納される。文字認識処理部102におい
て、画像メモリ107に記憶された画像データより文字
イメージを切り出し文字認識するが、この文字認識処理
は従来と同様の手法によってよいので、その詳細説明は
割愛する。
【0020】文字認識処理部102は、文字毎に、認識
結果(第一候補文字)の文字コード、第二候補以下の候
補文字群の文字コード、文字イメージの座標値(例え
ば、文字イメージの外接矩形の左上位置と右下位置の座
標値)を認識結果情報格納部106に(本例では文字毎
の配列の形で)格納する。なお、認識結果情報格納部1
06に格納される情報としては、上述の情報のほか、認
識結果の信頼度または誤認識別フラグ、領域切り出しフ
ラグがある。
結果(第一候補文字)の文字コード、第二候補以下の候
補文字群の文字コード、文字イメージの座標値(例え
ば、文字イメージの外接矩形の左上位置と右下位置の座
標値)を認識結果情報格納部106に(本例では文字毎
の配列の形で)格納する。なお、認識結果情報格納部1
06に格納される情報としては、上述の情報のほか、認
識結果の信頼度または誤認識別フラグ、領域切り出しフ
ラグがある。
【0021】文字認識処理部102による認識結果(第
一候補文字)の妥当性あるいは認識誤りの度合い(信頼
度)の判定を、誤認文字判定部103で行なう。この判
定に関する従来技術は様々なものがあるが、本発明で
は、その方法は問わない。誤認文字判定部103は判定
の結果を出力するが、その出力の内容は、例えば信頼度
の数値または、信頼度がある閾値より低く誤認の予想さ
れることを示す誤認識別フラグである。この出力内容は
認識結果情報格納部106内の該当文字の配列に格納さ
れる。なお、信頼度の最も単純な例は、認識結果と辞書
との距離の逆数である。
一候補文字)の妥当性あるいは認識誤りの度合い(信頼
度)の判定を、誤認文字判定部103で行なう。この判
定に関する従来技術は様々なものがあるが、本発明で
は、その方法は問わない。誤認文字判定部103は判定
の結果を出力するが、その出力の内容は、例えば信頼度
の数値または、信頼度がある閾値より低く誤認の予想さ
れることを示す誤認識別フラグである。この出力内容は
認識結果情報格納部106内の該当文字の配列に格納さ
れる。なお、信頼度の最も単純な例は、認識結果と辞書
との距離の逆数である。
【0022】次に、誤認領域判定部による誤認領域判定
処理について説明する。図2は、その処理の全体的な流
れを示すフローチャートである。この処理の処理単位は
改行コードで区切られた1行である。図3は、図2中の
処理ステップ203の詳細を示すフローチャートであ
る。
処理について説明する。図2は、その処理の全体的な流
れを示すフローチャートである。この処理の処理単位は
改行コードで区切られた1行である。図3は、図2中の
処理ステップ203の詳細を示すフローチャートであ
る。
【0023】誤認領域判定部104において、認識結果
情報格納部106より、改行コードまでの1行分の認識
結果とその付帯情報を読み出して内部のバッファに格納
する(ステップ201)。このバッファ内の1行分につ
いて誤認領域の選定の処理(ステップ203)を行なう
が、その詳細は図3に示すとおりである。
情報格納部106より、改行コードまでの1行分の認識
結果とその付帯情報を読み出して内部のバッファに格納
する(ステップ201)。このバッファ内の1行分につ
いて誤認領域の選定の処理(ステップ203)を行なう
が、その詳細は図3に示すとおりである。
【0024】ステップ301において、バッファ内の信
頼度または誤認識別フラグを参照して、信頼度の低い文
字の数(N)をカウントする。信頼度が数値である場合
には、信頼度がある閾値より低い文字を誤認が予想され
るものとしてカウントする。信頼度が誤認識別フラグの
形で表示されている場合には、誤認と予想されることを
示すフラグ値をカウントする。また、対象としている行
内の文字数(M)をカウントする。
頼度または誤認識別フラグを参照して、信頼度の低い文
字の数(N)をカウントする。信頼度が数値である場合
には、信頼度がある閾値より低い文字を誤認が予想され
るものとしてカウントする。信頼度が誤認識別フラグの
形で表示されている場合には、誤認と予想されることを
示すフラグ値をカウントする。また、対象としている行
内の文字数(M)をカウントする。
【0025】つぎにステップ302において、対象行の
誤認率=N/Mを算出する。そして、ステップ303に
おいて、誤認率が50%以上であるかを判定する。
誤認率=N/Mを算出する。そして、ステップ303に
おいて、誤認率が50%以上であるかを判定する。
【0026】誤認率が50%以上の場合、対象行全体の
認識結果の信頼度が低いと判断される。したがって、ス
テップ304において対象行内のすべての文字に対す
る、認識結果情報格納部106内の領域切り出しフラグ
を”1”(ON)にする。このような例を図4に示す。
図4中の”×”は信頼度が低いことを意味している。
認識結果の信頼度が低いと判断される。したがって、ス
テップ304において対象行内のすべての文字に対す
る、認識結果情報格納部106内の領域切り出しフラグ
を”1”(ON)にする。このような例を図4に示す。
図4中の”×”は信頼度が低いことを意味している。
【0027】誤認率が50%未満の場合、ステップ30
5において、信頼度の低い文字と、その前後各1文字に
対する、認識結果情報格納部106内の領域切り出しフ
ラグを”1”(ON)にする。それ以外の文字に対する
領域切り出しフラグは”0”(OFF)にする。このよ
うな例を図5に示す。”×”は信頼度が低いことを意味
している。
5において、信頼度の低い文字と、その前後各1文字に
対する、認識結果情報格納部106内の領域切り出しフ
ラグを”1”(ON)にする。それ以外の文字に対する
領域切り出しフラグは”0”(OFF)にする。このよ
うな例を図5に示す。”×”は信頼度が低いことを意味
している。
【0028】なお、一般的には、認識結果の信頼度の低
い文字と、その前後各n文字の領域切り出しフラグを”
1”にする。nは正整数である。ここに示す例はn=1
としたケースであるが、通常、このように設定するのが
最も効率的でる。また、n=0に選んだ場合には、信頼
度の低い文字の領域切り出しフラグだけが”1”に設定
される。
い文字と、その前後各n文字の領域切り出しフラグを”
1”にする。nは正整数である。ここに示す例はn=1
としたケースであるが、通常、このように設定するのが
最も効率的でる。また、n=0に選んだ場合には、信頼
度の低い文字の領域切り出しフラグだけが”1”に設定
される。
【0029】以上の処理を最終の行まで繰り返すと、ス
テップ201で終了と判断し、次の誤認領域抽出部10
5による誤認領域抽出処理に移行する。この処理におい
て、認識結果情報格納部106内の領域切り出しフラグ
を参照し、認識結果及び付帯情報、並びに誤認識文字の
修正のために役立つイメージを認識結果ファイル108
に書き出す。図6は、この誤認領域抽出処理の流れを示
すフローチャートであり、以下、各ステップの処理内容
を説明する。
テップ201で終了と判断し、次の誤認領域抽出部10
5による誤認領域抽出処理に移行する。この処理におい
て、認識結果情報格納部106内の領域切り出しフラグ
を参照し、認識結果及び付帯情報、並びに誤認識文字の
修正のために役立つイメージを認識結果ファイル108
に書き出す。図6は、この誤認領域抽出処理の流れを示
すフローチャートであり、以下、各ステップの処理内容
を説明する。
【0030】ステップ402において、認識結果情報格
納部106内の対象文字の領域切り出しフラグを調べ
る。領域切り出しフラグが”1”(ON)の場合には、
認識結果情報格納部106内のイメージデータの座標値
を使って対象文字のイメージを画像メモリ107より切
り出し、認識結果情報格納部106より読み出した対象
文字の認識結果(第一候補文字)の文字コード及び信頼
度と、候補文字群フラグ(この場合はONに設定)、イ
メージフラグ(この場合はONに設定)、第二位以下の
候補文字群の文字コード、切り出したイメージ、イメー
ジと候補文字群のデータのバイト数を設定した可変長バ
イト数を認識結果ファイル108に書き込む(ステップ
403,404)。
納部106内の対象文字の領域切り出しフラグを調べ
る。領域切り出しフラグが”1”(ON)の場合には、
認識結果情報格納部106内のイメージデータの座標値
を使って対象文字のイメージを画像メモリ107より切
り出し、認識結果情報格納部106より読み出した対象
文字の認識結果(第一候補文字)の文字コード及び信頼
度と、候補文字群フラグ(この場合はONに設定)、イ
メージフラグ(この場合はONに設定)、第二位以下の
候補文字群の文字コード、切り出したイメージ、イメー
ジと候補文字群のデータのバイト数を設定した可変長バ
イト数を認識結果ファイル108に書き込む(ステップ
403,404)。
【0031】一方、対象文字の領域切り出しフラグが”
0”(OFF)の場合には、認識結果の文字コードと信
頼度、候補文字群フラグ(この場合はOFFに設定)、
イメージフラグ(この場合はOFFに設定)、可変長バ
イト数(この場合はゼロに設定)を認識結果ファイル1
08に書き出す(ステップ404)。
0”(OFF)の場合には、認識結果の文字コードと信
頼度、候補文字群フラグ(この場合はOFFに設定)、
イメージフラグ(この場合はOFFに設定)、可変長バ
イト数(この場合はゼロに設定)を認識結果ファイル1
08に書き出す(ステップ404)。
【0032】このような処理を1文字単位に繰り返し、
最後の文字の処理終了をステップ401で判断すると、
一連の処理を完了する。
最後の文字の処理終了をステップ401で判断すると、
一連の処理を完了する。
【0033】以上の処理によって、認識結果の信頼度が
低く修正作業が必要と予想される文字、または、その文
字と周辺の一定範囲内の文字、あるいは、全体として認
識結果の信頼度が低いとみなされる行の範囲に限定し
て、イメージデータ及び候補文字群が認識結果ファイル
108に保存される。したがって、すべての文字につい
て、イメージや候補文字群を保存する場合にくらべて、
認識結果ファイル108のサイズを大幅に減らすことが
でき、同ファイル用の記憶スペースが少なくて済む。こ
のことは、文字認識装置(文字認識機能)を、メモリ容
量の小さいスキャナや複写機といった機器に組み込む場
合に極めて有利である。
低く修正作業が必要と予想される文字、または、その文
字と周辺の一定範囲内の文字、あるいは、全体として認
識結果の信頼度が低いとみなされる行の範囲に限定し
て、イメージデータ及び候補文字群が認識結果ファイル
108に保存される。したがって、すべての文字につい
て、イメージや候補文字群を保存する場合にくらべて、
認識結果ファイル108のサイズを大幅に減らすことが
でき、同ファイル用の記憶スペースが少なくて済む。こ
のことは、文字認識装置(文字認識機能)を、メモリ容
量の小さいスキャナや複写機といった機器に組み込む場
合に極めて有利である。
【0034】また、誤認の疑いのある文字については、
イメージと候補文字群が保存されるので、文字認識装置
以外のパソコン等の装置上で容易に修正することが可能
であり、文字認識装置は誤認文字修正のための機能を備
える必要がない。このことは、キーボード等の文字入力
手段を持たない、あるいは文字入力機能の貧弱な機器、
例えばスキャナや複写機といった機器への文字認識装置
(文字認識機能)の組み込みを容易にするという効果を
有する。
イメージと候補文字群が保存されるので、文字認識装置
以外のパソコン等の装置上で容易に修正することが可能
であり、文字認識装置は誤認文字修正のための機能を備
える必要がない。このことは、キーボード等の文字入力
手段を持たない、あるいは文字入力機能の貧弱な機器、
例えばスキャナや複写機といった機器への文字認識装置
(文字認識機能)の組み込みを容易にするという効果を
有する。
【0035】前述の認識結果ファイル108のデータを
用いて、パソコン等の装置上で認識結果の修正を行なう
ことができる。当然のことながら、文字認識装置上にお
いて、文字認識とは別のアプリケーションとして誤認文
字の修正を行なうような構成にすることも可能である。
この構成の場合においても、認識結果ファイル108の
サイズが小さいということはメモリ容量あるいはファイ
ル容量の面で有利であることは前述したとおりである。
用いて、パソコン等の装置上で認識結果の修正を行なう
ことができる。当然のことながら、文字認識装置上にお
いて、文字認識とは別のアプリケーションとして誤認文
字の修正を行なうような構成にすることも可能である。
この構成の場合においても、認識結果ファイル108の
サイズが小さいということはメモリ容量あるいはファイ
ル容量の面で有利であることは前述したとおりである。
【0036】ここで、一般的なパソコン上でアプリケー
ションの一つとして誤認文字修正処理を行なう例を簡単
に説明する。誤認文字修正のためのアプリケーションプ
ログラムは、認識結果ファイル108のデータを読み込
み、まず、認識結果の文字コードを、例えば1行分だけ
ディスプレイ上に文字表示する。この際に、信頼度が高
いか低いかによって、文字の表示色や明るさを変えた
り、反転表示をさせる。つぎに、アプリケーションプロ
グラムは、当該行中のイメージフラグがONの文字のイ
メージを、ディスプレイ上に文字と対応付けて表示す
る。これで、オペレータは疑わしい文字を容易に識別で
き、かつ、そのイメージを参照することによって容易に
正解文字を認識できる。
ションの一つとして誤認文字修正処理を行なう例を簡単
に説明する。誤認文字修正のためのアプリケーションプ
ログラムは、認識結果ファイル108のデータを読み込
み、まず、認識結果の文字コードを、例えば1行分だけ
ディスプレイ上に文字表示する。この際に、信頼度が高
いか低いかによって、文字の表示色や明るさを変えた
り、反転表示をさせる。つぎに、アプリケーションプロ
グラムは、当該行中のイメージフラグがONの文字のイ
メージを、ディスプレイ上に文字と対応付けて表示す
る。これで、オペレータは疑わしい文字を容易に識別で
き、かつ、そのイメージを参照することによって容易に
正解文字を認識できる。
【0037】オペレータがマウス操作等によって修正し
たい文字を指定すると、アプリケーションプログラム
は、その指定文字に対する候補文字群フラグを調べ、そ
れがONであれば、対応の候補文字群をディスプレイに
表示する。オペレータは、表示された候補文字群中に正
解文字が見つかった場合には、その文字をマウス操作あ
るいはキーボードからの番号指定等によって選択する。
正解文字が見つからない場合には、オペレータはキーボ
ードによって正解文字を入力する。アプリケーションプ
ログラムは、選択あるいは入力された正解文字に従って
ディスプレイの表示を更新し、かつメモリ上の認識結果
データを修正する。
たい文字を指定すると、アプリケーションプログラム
は、その指定文字に対する候補文字群フラグを調べ、そ
れがONであれば、対応の候補文字群をディスプレイに
表示する。オペレータは、表示された候補文字群中に正
解文字が見つかった場合には、その文字をマウス操作あ
るいはキーボードからの番号指定等によって選択する。
正解文字が見つからない場合には、オペレータはキーボ
ードによって正解文字を入力する。アプリケーションプ
ログラムは、選択あるいは入力された正解文字に従って
ディスプレイの表示を更新し、かつメモリ上の認識結果
データを修正する。
【0038】なお、信頼度の低い文字が行中の文字の過
半数を占めた場合には、行中の全文字のイメージと候補
文字群が認識結果ファイル108に保存される。このよ
うなケースは、仕様外のポイント数の文字が用いられた
行(例えば見出しや注釈のような行)で見られる。この
場合、修正時に行全体の文字イメージが表示されるため
正解文字の判断が容易になる。また、候補文字群を表示
させることができるので、正解文字の選択入力も容易に
なる。
半数を占めた場合には、行中の全文字のイメージと候補
文字群が認識結果ファイル108に保存される。このよ
うなケースは、仕様外のポイント数の文字が用いられた
行(例えば見出しや注釈のような行)で見られる。この
場合、修正時に行全体の文字イメージが表示されるため
正解文字の判断が容易になる。また、候補文字群を表示
させることができるので、正解文字の選択入力も容易に
なる。
【0039】
【発明の効果】請求項1、2または3の発明によれば、
修正が必要となることが予想される範囲に限って認識結
果とともに文字イメージも認識結果ファイルに保存され
るので、この認識結果ファイルのデータを用いて、同じ
文字認識装置上で文字認識とは別アプリケーションとし
て誤認文字の修正を行なう際に、あるいは別の装置上で
誤認文字の修正を行なう際に、修正の必要が予想される
文字のイメージを表示させることにより、原稿を参照す
ることなく、効率的に認識結果の確認と必要な修正を行
なうことができる。請求項2または3の発明によれば、
請求項1の発明によるよりも認識結果ファイルのサイズ
は若干増大する反面、1文字単位の認識結果の信頼度か
らは判断できないような誤認文字のイメージも保存され
るので、それらの文字も、イメージを表示させて効率的
な修正が可能である。
修正が必要となることが予想される範囲に限って認識結
果とともに文字イメージも認識結果ファイルに保存され
るので、この認識結果ファイルのデータを用いて、同じ
文字認識装置上で文字認識とは別アプリケーションとし
て誤認文字の修正を行なう際に、あるいは別の装置上で
誤認文字の修正を行なう際に、修正の必要が予想される
文字のイメージを表示させることにより、原稿を参照す
ることなく、効率的に認識結果の確認と必要な修正を行
なうことができる。請求項2または3の発明によれば、
請求項1の発明によるよりも認識結果ファイルのサイズ
は若干増大する反面、1文字単位の認識結果の信頼度か
らは判断できないような誤認文字のイメージも保存され
るので、それらの文字も、イメージを表示させて効率的
な修正が可能である。
【0040】しかも、イメージが保存されるのは修正が
必要となることが予想される範囲の文字のものだけであ
るので、すべての文字のイメージを無条件に保存する場
合に比べ、認識結果ファイルのサイズを大幅に減らすこ
とができる。そのため、メモリ容量もしくはファイル容
量を多くとれない文字認識装置、例えばスキャナや複写
機等の機器に組み込まれるような文字認識装置において
もイメージを含む認識結果ファイルの保存が可能にな
り、また、このようなメモリ容量もしくはファイル容量
を多くとれない文字認識装置においても、文字認識と切
り離して、誤認文字修正を効率的に行なうことが可能に
なる。
必要となることが予想される範囲の文字のものだけであ
るので、すべての文字のイメージを無条件に保存する場
合に比べ、認識結果ファイルのサイズを大幅に減らすこ
とができる。そのため、メモリ容量もしくはファイル容
量を多くとれない文字認識装置、例えばスキャナや複写
機等の機器に組み込まれるような文字認識装置において
もイメージを含む認識結果ファイルの保存が可能にな
り、また、このようなメモリ容量もしくはファイル容量
を多くとれない文字認識装置においても、文字認識と切
り離して、誤認文字修正を効率的に行なうことが可能に
なる。
【0041】請求項4または5の発明によれば、文字イ
メージを保存した文字について候補文字群も認識結果フ
ァイルに保存されるため、同じ文字認識装置上で文字認
識とは別アプリケーションとして誤認文字修正を行なう
場合、あるいは他の装置上で誤認文字修正を行なう場合
に、認識結果ファイルに保存されたイメージとともに候
補文字群をも表示させ、その中から正解文字を選択する
ことができるため、効率的な修正作業が可能になる。し
かも、候補文字群(キャラクタデータ)が保存される文
字の範囲は限定されるので、認識結果ファイルのサイズ
の増大を抑えることができるため、請求項1乃至3の発
明に関して述べた利益が損なわれることもない。
メージを保存した文字について候補文字群も認識結果フ
ァイルに保存されるため、同じ文字認識装置上で文字認
識とは別アプリケーションとして誤認文字修正を行なう
場合、あるいは他の装置上で誤認文字修正を行なう場合
に、認識結果ファイルに保存されたイメージとともに候
補文字群をも表示させ、その中から正解文字を選択する
ことができるため、効率的な修正作業が可能になる。し
かも、候補文字群(キャラクタデータ)が保存される文
字の範囲は限定されるので、認識結果ファイルのサイズ
の増大を抑えることができるため、請求項1乃至3の発
明に関して述べた利益が損なわれることもない。
【図1】本発明による文字認識装置の一例を示すブロッ
ク図である。
ク図である。
【図2】誤認領域判定部の処理の全体的フローを示すフ
ローチャートである。
ローチャートである。
【図3】図2中の一部処理ステップの詳細を示すフロー
チャートである。
チャートである。
【図4】誤認領域判定部による処理結果の一例を示す図
である。
である。
【図5】誤認領域判定部による処理結果の他の一例を示
す図である。
す図である。
【図6】誤認領域抽出部の処理フローを示すフローチャ
ートである。
ートである。
101 画像入力部 102 文字認識処理部 103 誤認文字判定部 104 誤認領域判定部 105 誤認領域抽出部 106 認識結果情報格納部 107 画像メモリ 108 認識結果ファイル
Claims (5)
- 【請求項1】 入力画像上の文字イメージに対する文字
認識を行なう手段と、該手段による認識結果を認識結果
ファイルに保存する手段と、認識結果の信頼度の低い文
字のイメージを該認識結果ファイルに保存する手段とを
有することを特徴とする文字認識装置。 - 【請求項2】 入力画像上の文字イメージに対する文字
認識を行なう手段と、該手段による認識結果を認識結果
ファイルに保存する手段と、認識結果の信頼度の低い文
字とその前後各n文字(ただしnは正整数)のイメージ
を該認識結果ファイルに保存する手段とを有することを
特徴とする文字認識装置。 - 【請求項3】 認識結果の信頼度の低い文字が所定割合
以上を占める行については、該行の全文字のイメージが
認識結果ファイルに保存されることを特徴とする請求項
1または2記載の文字認識装置。 - 【請求項4】 認識結果ファイルにイメージの保存され
る文字に対する候補文字群を該認識結果ファイルに保存
する手段を有することを特徴とする請求項1または2記
載の文字認識装置。 - 【請求項5】 認識結果ファイルにイメージの保存され
る文字に対する候補文字群を該認識結果ファイルに保存
する手段を有することを特徴とする請求項3記載の文字
認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6184740A JPH0850631A (ja) | 1994-08-05 | 1994-08-05 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6184740A JPH0850631A (ja) | 1994-08-05 | 1994-08-05 | 文字認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0850631A true JPH0850631A (ja) | 1996-02-20 |
Family
ID=16158532
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6184740A Pending JPH0850631A (ja) | 1994-08-05 | 1994-08-05 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0850631A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002279353A (ja) * | 2001-03-15 | 2002-09-27 | Ricoh Co Ltd | 文字認識装置、その方法、および記録媒体 |
| EP2332684A1 (en) | 2009-12-09 | 2011-06-15 | Kawasaki Jukogyo Kabushiki Kaisha | Method of manufacturing high-heat-load equipment by metallurgically joining carbon material with copper-alloy material |
| WO2016121401A1 (en) * | 2015-01-30 | 2016-08-04 | Ricoh Company, Ltd. | Information processing apparatus and program |
-
1994
- 1994-08-05 JP JP6184740A patent/JPH0850631A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002279353A (ja) * | 2001-03-15 | 2002-09-27 | Ricoh Co Ltd | 文字認識装置、その方法、および記録媒体 |
| EP2332684A1 (en) | 2009-12-09 | 2011-06-15 | Kawasaki Jukogyo Kabushiki Kaisha | Method of manufacturing high-heat-load equipment by metallurgically joining carbon material with copper-alloy material |
| WO2016121401A1 (en) * | 2015-01-30 | 2016-08-04 | Ricoh Company, Ltd. | Information processing apparatus and program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101199747B1 (ko) | 단어 인식 방법 및 단어 인식용 프로그램의 기록매체 및 정보 처리 장치 | |
| JPH1139428A (ja) | 文書映像の方向修正方法 | |
| US6947596B2 (en) | Character recognition method, program and recording medium | |
| JPH0850631A (ja) | 文字認識装置 | |
| CN119337866A (zh) | 一种ocr病历文本的纠错方法 | |
| JP2003030654A (ja) | パターン識別装置、パターン識別方法及びパターン識別用プログラム | |
| JPH06215184A (ja) | 抽出領域のラベリング装置 | |
| CN114529918A (zh) | 一种试卷倒置识别方法、装置及介质 | |
| JPH06180771A (ja) | 英文字認識装置 | |
| JPH10207981A (ja) | 帳票認識方法 | |
| JPH0728935A (ja) | 文書画像処理装置 | |
| JPH0830717A (ja) | 文字認識方法とその装置 | |
| JP3270551B2 (ja) | 文字認識装置および文字認識方法 | |
| JPH04199483A (ja) | 文書認識修正装置 | |
| JP2963474B2 (ja) | 類似文字識別方法 | |
| JPH08161426A (ja) | 手書き文字ストローク切出し装置 | |
| JPH01292586A (ja) | 文字認識支援装置 | |
| JPH07104940B2 (ja) | 図形認識装置 | |
| JP2977244B2 (ja) | 文字認識方法及び文字認識装置 | |
| JP2000029982A (ja) | 文字認識装置及び文字認識結果の出力方法 | |
| JP3138665B2 (ja) | 手書き文字認識方式および記録媒体 | |
| JP3600364B2 (ja) | 文字切り出し方法及び装置 | |
| JPH04348475A (ja) | 画像情報検索方法及びその装置 | |
| JP2931485B2 (ja) | 文字切出し装置及び方法 | |
| JPH02292691A (ja) | 文字認識装置 |