JPH0362280A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPH0362280A
JPH0362280A JP1198351A JP19835189A JPH0362280A JP H0362280 A JPH0362280 A JP H0362280A JP 1198351 A JP1198351 A JP 1198351A JP 19835189 A JP19835189 A JP 19835189A JP H0362280 A JPH0362280 A JP H0362280A
Authority
JP
Japan
Prior art keywords
document
reading
character
read
sum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1198351A
Other languages
English (en)
Inventor
Kazuji Kiyono
清野 和司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1198351A priority Critical patent/JPH0362280A/ja
Publication of JPH0362280A publication Critical patent/JPH0362280A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 【発明の目的1 (産業上の利用分野) 本発明は、帳票に記入された文書を読取る文字読取装置
に関する。
(従来の技術) 一般に、文字読取装置(OCR)を用いて、帳票に記入
された一般文書(文字)の読み取りが行われている。こ
のような、文字読取装置を用いた一般文書の人力などで
は、帳票に記入されている図形や文字の箇所の判別が行
われている。すなわち、帳票における文字が記入されて
いる部分の行や、各文字を自動的に検出して、この検出
された各文字について認識処理を行なうものである。
こうした認識処理は、漢字を含む多数の字種についての
認識技術と組み合わせて、和文の汎用ドキュメントリー
ダとして実現されている。
(発明が解決しようとする課′XJ) ところが、このようなドキュメントリーダ(文字読取装
置)においては、入力結果の修正等を行なう場合、はと
んど人間によって修正箇所等の確認が行なわれている。
具体的には、ドキュメントリーダによって読み取った結
果の表示と、実際に読み取らせた帳票に記入された文書
との比較を行ないながら、修正箇所の確認が行なわれて
いた。このために、読み取り結果の修正効率が悪く、多
くの時間を必要とするという問題があった。
本発明は前記のような点に鑑みてなされたもので、文書
の読み取り結果についての修正を効率良く行なうことが
可能な文字読取装置を提供することを目的とする。
[発明の構成] (課題を解決するための手段) 本発明は、文書、及び同文書の所定範囲内に含まれる文
字群に対応する数値情報が記入された帳票から、前記文
書及び前記数値情報を読み取る読取り手段と、この読取
手段によって読み取られた文書の前記所定範囲内に含ま
れる文字の文字コードの総和を算出する算出手段と、こ
の算出手段によって算出された文字コードの総和と前記
読取り手段によって読み取られた数値情報とに基づいて
、前記読取り手段によって読み取られた文書が正しく読
み取られたものであるか否かを判別する判別手段と、こ
の判別手段によって正しく読み取られていないと判別さ
れた場合に、この旨を示す表示を行なう表示手段とを具
備して構成するものである。
また本発明は、文書、及び同文書の各行、各列に含まれ
る文字群にそれぞれ対応する数値情報が記入された帳票
から、前記文書及び前記数値情報を読み取る読取り手段
と、この読取手段によって読み取られた文書の各行、各
列のそれぞれに含まれる文字の文字コードの総和を算出
する算出手段と、この算出手段によって算出された文字
コードの総和と前記読取り手段によって読み取られた数
値情報とに基づいて、前記読取り手段によって読み取ら
れた文書が正しく読み取られたものであるか否かを各行
、各列毎に判別する判別手段と、この判別手段によって
正しく読み取られていないと判別された行1列の位置に
基づいて、正しく読み取られなかった文字を示す表示を
行なう表示手段とを具備して構成するものである。
(作 用) このようにして構成される文字読取装置においては、自
動的に修正箇所が表示されるために、読み取られた文書
の修正を容易に行なうことが可能となる。
(実施例) 以下、図面を参照して本発明の一実施例を説明する。第
1図は同実施例に係わる文字読取装置の構成を示すブロ
ック図である。同図において、読取り部11は、帳票に
記入された文書等の文字情報を検出するものである。読
取り部11には、同読取り部11によって読み取られた
文書中の誤り箇所を検出するチエツクサム・チエツク部
12が接続されている。チエツクサム・チエツク部12
は、読み取られた文字の文字コードの総和計算を行なう
算出部13、及び算出部18において得られた総和値と
チエツクサムとに基づいて、誤り箇所を判別する判別部
14によって構成されている。また、チェックサム・チ
エツク部12には、読み取り結果をチエツクサム・チエ
ツクに応じて表示を行なう表示部15が接続されている
第2図は、同実施例において処理対象とする帳票への記
入方法の一例を示す図である。第2図に示す例は、一般
文書と同文書の各行、各列にそれぞれ対応するチエツク
サム(数値情報)が記入されているものである。図中に
おいては、各行に対応するチエツクサムを「xx」、各
列に対応するチエツクサムをrYYJとして示している
。また、チエツクサム(XX、YY)は、各行、各列(
所定範囲)に含まれる文字の文字コードの総和の下2桁
の数値を示すものである。
次に、同実施例の動作を説明する。
まず、第2図に示すような帳票について、読取り部11
は、文字読取り処理を行なう。読取り部11は、和文汎
用ドキュメントリーダとし、帳票サイズが限定されない
。読取り部11は、帳票を光学的に走査することにより
、帳票に記入された文字等のイメージを含む帳票イメー
ジを検出する。読取り部11は、検出された帳票イメー
ジから、文書の各行位置を検出し、さらに各行中に含ま
れる各文字を検出する。そして、1文字毎に文字パター
ンの切り出しを行なう。こうして切り出された文字パタ
ーンは、それぞれについて認識処理が行われる。ここで
は、一般の文書(文字)とチエツクサム(数字)は、同
様にして認識処理が行われる。
ただし、認識結果(文字コード)は、文書とチエツクサ
ムに分類されるものとする。読取り部11は、認識結果
をチエツクサム・チエツク部12に転送する。
チエツクサム・チエツク部12は、算出部13において
、読取り部11からの認識結果(文字コード)について
文書の各行、各列毎に加算計算を行なう。
各行、各列の認識結果(文字コード)の和が算出される
と、算出部13は、この算出データ、及び各行、各列に
対応するチエツクサムについての認識結果を判別部14
に転送する。
判別部14は、算出部13からの各情報に基づいて読み
取られた文書が正しく読み取られたものであるか否かを
判別する判別処理を行なう。すなわち、各行、各列につ
いての算出データの下2桁と、それぞれに対応するチエ
ツクサムについての認識結果との比較を行なうものであ
る。ここで、算出データの下2桁とチエツクサムについ
ての認識結果が一致する場合(整合)は、正しく文書の
読み取りが行われたものとし、一致しない場合(不整合
)は、誤認識された文字が含まれているものと判別する
。読み取られた文書の各行、各列について判別処理が終
了すると、判別部14は、判別結果を表示部15に通知
する。
表示部15は、判別結果に応じて、帳票に記入されてい
た文書についての読取り結果を表示し、これを修正画面
とする。この場合、表示部15は、誤認識された文字が
含まれる(不整合)と判別された行1列について倍輝度
表示などによって表示する。また、不整合となった行1
列の交点にある文字を、リジェクト扱いにし、例えば第
3図に示すように、リジェクトを示す記号「?」に置き
換えて表示する。また、この修正画面では、リジェクト
記号にのみ、カーソルが移動するように制御を行なう。
このよう゛にすれば、表示画面から容易に修正箇所を判
別することができる。また、図示せぬ人力部(キーボー
ド等によって構成される)を介して、リジェクト文字に
対して正しい文字データを入力して修正を行なう場合に
、効率的に修正(エデイツト)を行なうことが可能とな
る。また、誤認識された文字が一つの場合、その文字だ
けが指摘されるが、複数ある場合であっても誤認識され
た文字とする候補を複数指摘することができる。
これより、読み取った結果の表示と文書との比較を行な
いながら修正を行なうより、格段に修正効率を向上させ
ることができる。
このような方式は、読み取り部11において読み取らせ
る帳票に、チエツクサムを記入することが可能なもの全
てに応用することができる。
また、具体的な利用方法として、文字読取装置の認識率
計算を行なう際のテストシートに応用すれば、マスター
データを作成する手間を軽減することができる。
なお、前記実施例においては、和文文書が帳票に記入さ
れた場合について述べたが、当然ながら数字、英字、カ
ナ等であっても適用可能である。
また、チエツクサム(数値情報)は、各行、各列に対応
するものを予め帳票に記入するものとしたが、これに限
定されるものではない。
さらに、各行、各列の文字コードの総和の下2桁の計算
方式は、各種考えることが可能である。
[発明の効果〕 以上のように本発明によれば、帳票に記入された文書の
所定範囲内(行や列等)に含まれる文字の認識結果(文
字コード)の総和と、これに対応する帳票に同じく記入
された数値情報(チエツクサム)に基づいて誤認識箇所
が判別され、修正画面から修正すべき箇所が容易にわか
るように表示が行われるので、文書の読み取り結果につ
いての修正を効率良く行なうことが可能となるものであ
る。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる文字読取装置の構成
を示すブロック図、第2図は同実施例において処理対象
とする帳票への記入方法の一例を示す図、第3図は同実
施例における表示画面の例を説明するための図である。 11・・・読取り部(読取り手段)  12・・・チエ
ツクサム・チエツク部、13・・・算出部(算出手段)
、14・・・判別部(判別手段)15・・・表示部(表
示手段)。

Claims (2)

    【特許請求の範囲】
  1. (1)文書、及び同文書の所定範囲内に含まれる文字群
    にそれぞれ対応する数値情報が記入された帳票から、前
    記文書及び前記数値情報を読み取る読取り手段と、 前記読取手段によって読み取られた文書の前記所定範囲
    内に含まれる文字の文字コードの総和を算出する算出手
    段と、 前記算出手段によって算出された文字コードの総和と前
    記読取り手段によって読み取られた数値情報とに基づい
    て、前記読取り手段によって読み取られた文書が正しく
    読み取られたものであるか否かを判別する判別手段と、 前記判別手段によって正しく読み取られていないと判別
    された場合に、この旨を示す表示を行なう表示手段と、 を具備したことを特徴とする文字読取装置。
  2. (2)文書、及び同文書の各行、各列に含まれる文字群
    にそれぞれ対応する数値情報が記入された帳票から、前
    記文書及び前記数値情報を読み取る読取り手段と、 前記読取手段によって読み取られた文書の各行、各列の
    それぞれに含まれる文字の文字コードの総和を算出する
    算出手段と、 前記算出手段によって算出された文字コードの総和と前
    記読取り手段によって読み取られた数値情報とに基づい
    て、前記読取り手段によって読み取られた文書が正しく
    読み取られたものであるか否かを各行、各列毎に判別す
    る判別手段と、前記判別手段によって正しく読み取られ
    ていないと判別された行、列の位置に基づいて、正しく
    読み取られなかった文字を示す表示を行なう表示手段と
    、 を具備したことを特徴とする文字読取装置。
JP1198351A 1989-07-31 1989-07-31 文字読取装置 Pending JPH0362280A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1198351A JPH0362280A (ja) 1989-07-31 1989-07-31 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1198351A JPH0362280A (ja) 1989-07-31 1989-07-31 文字読取装置

Publications (1)

Publication Number Publication Date
JPH0362280A true JPH0362280A (ja) 1991-03-18

Family

ID=16389665

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1198351A Pending JPH0362280A (ja) 1989-07-31 1989-07-31 文字読取装置

Country Status (1)

Country Link
JP (1) JPH0362280A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06243189A (ja) * 1993-02-16 1994-09-02 Nec Corp ライブラリ検証装置
JP2017182195A (ja) * 2016-03-28 2017-10-05 コニカミノルタ株式会社 文書修正方法、文書修正装置、文書印刷装置、誤り検出のための画像、およびコンピュータプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06243189A (ja) * 1993-02-16 1994-09-02 Nec Corp ライブラリ検証装置
JP2017182195A (ja) * 2016-03-28 2017-10-05 コニカミノルタ株式会社 文書修正方法、文書修正装置、文書印刷装置、誤り検出のための画像、およびコンピュータプログラム

Similar Documents

Publication Publication Date Title
US7106904B2 (en) Form identification method
US6760490B1 (en) Efficient checking of key-in data entry
JPS6077279A (ja) 文字イメ−ジ切出し方法
JPH04195692A (ja) 文書読取装置
US5696854A (en) Batched character image processing
RU2707320C1 (ru) Способ распознавания символа на банкноте и сопроцессор для вычислительной системы устройства для обработки банкнот
JPH0362280A (ja) 文字読取装置
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
JP4160206B2 (ja) 文字認識装置を利用したデータベース登録方法
JPH0520794B2 (ja)
EP0726540B1 (en) Apparatus and method for video coding
JPH0773267A (ja) 誤りを識別し補正する方法および装置
JP3157530B2 (ja) 文字切り出し方法
JP2677271B2 (ja) 文字認識装置
JP2529421B2 (ja) 文字認識装置
JPS60217483A (ja) 文字認識装置
JPS61150081A (ja) 文字認識装置
JP3138665B2 (ja) 手書き文字認識方式および記録媒体
JP2953162B2 (ja) 文字認識装置
JPH03161886A (ja) Ocrの誤読修正方法
JPH0612520A (ja) 文字認識装置の確認修正方式
JP2578768B2 (ja) 画像処理方法
JP2761251B2 (ja) バーコード読み取り方式
JP2578767B2 (ja) 画像処理方法
JPH0496882A (ja) 全角/半角判定方法