JPH0765111A - 光学的文字認識装置 - Google Patents

光学的文字認識装置

Info

Publication number
JPH0765111A
JPH0765111A JP5213048A JP21304893A JPH0765111A JP H0765111 A JPH0765111 A JP H0765111A JP 5213048 A JP5213048 A JP 5213048A JP 21304893 A JP21304893 A JP 21304893A JP H0765111 A JPH0765111 A JP H0765111A
Authority
JP
Japan
Prior art keywords
information
item
result data
character recognition
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5213048A
Other languages
English (en)
Inventor
Toshihiro Nakamura
敏浩 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5213048A priority Critical patent/JPH0765111A/ja
Publication of JPH0765111A publication Critical patent/JPH0765111A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字を読み取るための指定操作が容易であり
ながら、文字認識後のデータ処理に伴う負担が小さい光
学的文字認識装置を提供する。 【構成】 本装置は、レイアウト情報作成部70、出力
順序情報作成部71、記憶部6、文字認識部3を有す
る。指定操作によりレイアウト情報及び出力順序情報を
作成でき、帳票識別情報を指定すると、文字認識部3
は、指定された項目順序に従って各項目に対応する認識
結果データを出力する。これにより、指定操作が容易で
ありながら、処理対象とする帳票の実際の項目順序に拘
らず、出力順序が統一された認識結果データを得ること
ができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学的文字認識装置
(OCR)に関する。
【0002】
【従来の技術】OCRが帳票に記入された文字を認識す
る方法を大別すると、従来より次の3通りの方法が知ら
れている。
【0003】第1の方法は、予め読取領域(フィール
ド)の座標、読取桁数、字種等を指定したテーブル(F
C情報)を作成しておき、そのFC情報に基づいてOC
Rが文字を認識する方法である。第2の方法は、予め読
取領域のレイアウト情報(LC情報)を作成しておき、
そのLC情報に基づいてOCRが読取領域を判別して、
文字を認識する方法である。第3の方法は、OCRが光
学的走査(スキャン)により得られた帳票イメージから
読取領域を自動判別して文字を認識する方法である。な
お、第1の方法によるOCRは、帳票OCRと称せら
れ、第2及び第3の方法によるOCRは、テキストリー
ダと称せられている。
【0004】帳票OCRは、認識結果が読取領域の座標
等を指定した通りに得られるため、チェック、編集、演
算等の豊富な機能を実現でき、認識結果がどのような項
目に関するものかが容易に判別できるので、認識結果デ
ータの取扱いが容易となるという長所を有しているが、
各種指定を厳密に行う必要があるため指定に手間がかか
るという欠点を有している。
【0005】一方、テキストリーダは、第2の方法の場
合でもレイアウトの指定が容易に行えるという長所を有
するが、認識結果データが何れの項目に該当するかを判
断することが困難であるという欠点を有する。このた
め、文字認識後のデータ処理に伴う負担が大きくなる。
【0006】
【発明が解決しようとする課題】従って、例えば、振込
依頼書のようにフォーマットが互いに異なる複数の帳票
を集計する場合に、銀行名、支店名、口座番号、受取人
名等の各項目の配列順序が統一されていないため、帳票
OCRでは、指定に手間がかかるという問題があり、テ
キストリーダでは、認識結果データの処理が容易でない
という問題を生ずる。
【0007】そこで、本発明は、上記事情に鑑みてなさ
れたものであり、文字を読み取るための指定操作が容易
でありながら、文字認識後のデータ処理に伴う負担が小
さい光学的文字認識装置を提供することを目的とする。
【0008】
【課題を解決するための手段】上記目的を達成するため
に請求項1記載の光学的文字認識装置は、任意の順序で
配列された複数の項目に対応して読取領域がそれぞれ設
けられた帳票を処理対象とし、その帳票の各読取領域に
記入された文字を読み取り、その認識結果データを出力
する光学的文字認識装置において、前記複数の項目のう
ち一部又は全部の項目を選択し、その項目順序を指定す
る指定手段と、この指定手段にて指定された項目順序に
従って各項目に対応する認識結果データを出力する出力
制御手段とを有することを特徴とするものである。
【0009】また、請求項2記載の光学的文字認識装置
は、任意の順序で配列された複数の項目に対応して読取
領域がそれぞれ設けられた帳票を処理対象とし、その帳
票の各読取領域に記入された文字を読み取り、その認識
結果データを出力する光学的文字認識装置において、指
定操作に基づいて前記読取領域のレイアウト情報を作成
するレイアウト情報作成部と、指定操作に基づいて前記
複数の項目のうち選択された一部又は全部の項目に対応
する各認識結果データの出力順序情報を作成する出力順
序情報作成部と、前記レイアウト情報及び出力順序情報
を対応する帳票識別情報と共に記憶する記憶部と、指定
された帳票識別情報に対応するレイアウト情報及び出力
順序情報を前記記憶部から読み出し、その読み出したレ
イアウト情報及び出力順序情報に基づいて各読取領域に
記入された文字について認識処理を行った後、指定され
た項目順序に従って各項目に対応する認識結果データを
出力する文字認識部とを有することを特徴とするもので
ある。
【0010】また、請求項3記載の光学的文字認識装置
は、前記レイアウト情報及び出力順序情報が作成済みの
帳票識別情報の一覧表を作成する一覧表作成部を有する
ことを特徴とするものである。
【0011】
【作用】請求項1記載の光学的文字認識装置によれば、
指定手段にて項目を選択し、その項目順序を指定する
と、出力制御手段は指定された項目順序に従って各項目
に対応する認識結果データを出力する。これにより、指
定操作が容易でありながら、処理対象とする帳票の実際
の項目順序に拘らず、出力順序が統一された認識結果デ
ータを得ることができる。
【0012】請求項2記載の光学的文字認識装置によれ
ば、指定操作によりレイアウト情報及び出力順序情報を
作成でき、帳票識別情報を指定すると、文字認識部は、
指定された項目順序に従って各項目に対応する認識結果
データを出力する。これにより、指定操作が容易であり
ながら、処理対象とする帳票の実際の項目順序に拘ら
ず、出力順序が統一された認識結果データを得ることが
できる。
【0013】請求項3記載の光学的文字認識装置によれ
ば、一覧表によりレイアウト情報及び出力順序情報が作
成済みか否かの判断が容易となり、操作者の負担軽減が
図れる。
【0014】
【実施例】以下、本発明の実施例を図面を参照して詳述
する。
【0015】図1は本発明の光学的文字認識装置の一実
施例を示す概略ブロック図である。
【0016】同図に示す本実施例装置は、帳票10のイ
メージ11を検出するスキャナ部1と、その帳票イメー
ジ11を記憶するイメージバッファ2と、帳票10に記
入された文字を認識する文字認識部3と、検出された帳
票イメージ11等を表示する表示部4と、各種の指定操
作、入力操作等を行う入力部5と、後述するレイアウト
情報及び出力順序情報を記憶する記憶部6と、この装置
の各部を制御する制御部7とを有して構成されている。
【0017】次に、上記各部の詳細を説明する。
【0018】前記スキャナ部1は、光電変換素子を備
え、帳票10を光学的に走査して帳票イメージ11を検
出するものである。
【0019】前記文字認識部3は、イメージバッファ2
に記憶された帳票イメージ11から後述するレイアウト
情報に基づいて各読取領域(図2参照)13内及び項目
12の文字イメージを切り出し、文字認識辞書との照合
により類似度を求め、その類似度の高いものを認識結果
データとして出力するものである。その認識結果データ
は、後述する項目順序情報に従って、出力するようにな
っている。
【0020】前記表示部4は、イメージバッファ2に記
憶された帳票イメージ11や操作者に対する操作の案内
情報等を対話形式で表示するものである。
【0021】前記入力部5は、マウス、キーボード等を
備え、帳票10上の文字を認識する上で必要な指定操作
例えば帳票10上の各項目12に対応して設けられた読
取領域13のレイアウトの指定を行うものであり、認識
結果後のデータ処理に必要な指定操作例えば各認識結果
データの出力順序の指定を行うものである。また、この
入力部5は、キーボードにより定義モード、読取モード
の如く各種のモードを選択できるようになっており、定
義モード又は読取モードを選択した際に、帳票10の識
別情報(依頼人コード)を入力できるようになってい
る。
【0022】前記記憶部6は、レイアウト情報を記憶す
るレイアウト情報記憶部60と、出力順序情報を記憶す
る出力順序情報記憶部61とを具備している。
【0023】前記制御部7は、レイアウト情報作成部7
0及び出力順序情報作成部71を具備している。レイア
ウト情報作成部70は、入力部5での指定操作に基づい
てレイアウト情報を作成するものである。出力順序情報
作成部71は、入力部5での指定操作に基づいて項目1
2の出力順序情報を作成するものである。その作成した
レイアウト情報及び出力順序情報は、帳票10のフォー
マットを特定する識別情報(依頼人コード)と共に記憶
部6のレイアウト情報記憶部60及び出力順序情報記憶
部61にそれぞれ記憶するようになっている。本実施例
では、振込依頼書を読取対象としており、この振込依頼
書は依頼人の側でフォーマットが作成されているため、
依頼人コードを特定することにより、帳票10のフォー
マットが特定できるので、依頼人コードを識別情報とし
ている。なお、この識別情報は、帳票10のフォーマッ
トを特定できる情報であるなら、他の情報でもよい。
【0024】次に、本実施例の動作を図9,図10に示
すフローチャートに従って説明する。なお、図2に示す
帳票10を読取対象とする場合について説明する。読取
対象の帳票10上には、同図に示すように、任意の順序
で配列された複数の銀行名(上段)12a,支店名(下
段)12b,預金種目12c,口座番号12d,受取人
12e及び金額12f等の各項目12が設けられ、その
各項目12に対応して読取領域13がそれぞれ設けら
れ、各読取領域13に文字が記入されているとする。
【0025】まず、図2に示す帳票10のフォーマット
が未登録であるとする。
【0026】最初に操作者は、入力部5のキーボードを
操作して定義モードを選択し、帳票10の識別情報であ
る依頼人コードを入力する(S1)。
【0027】スキャナ部1は、制御部7の制御の下に、
新フォーマットの帳票10のイメージ11を検出し(S
2)、その帳票イメージ11をイメージバッファ2に記
憶する。
【0028】制御部7は、イメージバッファ2に記憶さ
れた帳票イメージ11を表示部4に表示する(S3)。
その一例を図3に示す。同図に示すように、この表示画
面の左側には、スキャナ部1により検出された帳票イメ
ージ11が白黒の2値化データとして表示される。な
お、入力部5での操作により、画面右側には同図に示す
ように、画面左側の帳票イメージ11を部分的に拡大し
て表示することも可能である。
【0029】次に、図4に示すように、入力部5のマウ
スの操作により、画面左側に表示された帳票イメージ1
1上において複数の項目12a乃至12fのうち認識結
果データを必要とする項目12を選択するために、その
必要とする各項目12に対応する読取領域13の中に矩
形状の指定領域14を設定すると、制御部7は、フィー
ルド名15を自動設定する(S4)。同図では、銀行名
12a及び支店名12bの読取領域13中に指定領域1
4を設定し、「AA−2」がフィールド名15として自
動設定されている場合を示す。銀行名12a及び支店名
12b以外に他の項目12を選択する場合は、例えば図
5に示すように、必要な口座番号12d及び受取人12
eの項目12を選択し、これらに対しても同様に行う。
このようにして複数の項目12に対応して設けられた読
取領域13のレイアウトが指定される。
【0030】続いて制御部7のレイアウト情報作成部7
0は、入力部5にて指定された読取領域13のレイアウ
トに基づいてレイアウト情報を作成し(S5)、帳票1
0の識別情報(依頼人コード)と共にレイアウト情報記
憶部60に記憶する。
【0031】次に、操作者は、図6に示すように、入力
部5のマウスの操作により、画面左側に表示されている
帳票イメージ11上で、最初に出力する読取領域13の
中にマウスポインタ16を移動させてクリックした後、
次に出力する読取領域13の中にマウスポインタ16を
移動させてクリックし、このように順次操作することに
より、各項目12に対応して設けられた読取領域13の
認識結果データの出力順序を指定する(S6)。画面右
側には、同図に示すように、既に名付けられたフィール
ド名(AA−1,AA−2、…)15が出力順に表示さ
れる。
【0032】続いて制御部7の出力順序情報作成部71
は、入力部5にて指定された出力順序に基づいて出力順
序情報を作成し(S7)、出力順序記憶部61に識別情
報(依頼人コード)と共に記憶する。
【0033】このようにして、帳票10の読取領域13
のレイアウト及び項目12の出力順序が定義される。
【0034】次に、定義済みの帳票10を読み取る場合
について説明する。
【0035】まず、操作者は、入力部5のキーボードを
操作して読取モードを選択し、帳票10の識別情報とし
て登録済みの依頼人コードを入力して入力部5のEND
キーを押下する。(S10)。
【0036】制御部7は、ENDキーの押下に基づき、
帳票10の読取りを開始する。なお、操作者が、入力部
5のESCキーを押下した場合は、制御部7は、レイア
ウト情報及び出力順序情報が作成済みの帳票識別情報の
一覧表である帳票定義済一覧表(依頼人情報)を表示部
4に表示する。
【0037】スキャナ部1は、制御部7の制御の下に、
登録済の帳票10のイメージ11を検出し(S11)、
その帳票イメージ11をイメージバッファ2に記憶す
る。
【0038】制御部7は、入力部5にて入力された識別
情報(依頼人コード)に対応するレイアウト情報をレイ
アウト情報記憶部60から読み出し、そのレイアウト情
報に基づいて帳票イメージ11から各読取領域13につ
いてレイアウトの解析を行う。
【0039】文字認識部3は、制御部7によるレイアウ
ト解析結果を用いて読取領域13内に記入された文字及
び項目12の文字の認識を行う。
【0040】制御部7は、入力部5にて入力された依頼
人コードに対応する出力順序情報を出力順序記憶部61
から読み出し、図7に示すように、文字認識部3による
各認識結果データA1 ,B1 ,C1 ,A2 ,…を読み出
した出力順序情報に従って制御部7に出力する。すなわ
ち、指定した項目の銀行名12a,支店名12b,口座
番号12d,受取人12eの順序に従い、最初の行に対
する認識結果データA1 ,B1 ,C1 を出力した後、次
の行に対する認識結果データA2 ,B2 ,C2を出力
し、それ以降の行に対しても同様に指定された項目順序
に従ってサイクリックに認識結果データを出力する。
【0041】ここで、操作者が認識結果に対する確認や
修正等のために制御部7への出力結果を表示させたい場
合は、入力部5を操作することにより、図8に示すよう
に、表示部4の表示画面に修正画面が表示される。同図
は、銀行名12a,支店名12b,口座番号12d,受
取人12eの如く指定した項目順序に従って認識結果デ
ータの一部が表示されている状態を示している。同図中
斜線を施した領域は、文字イメージを示し、その各文字
イメージの下に認識結果データが表示される。また、同
図中「?」は、認識できなかったか又は認識できても誤
読のおそれがあるためにリジェクトとしたことを示す記
号を意味する。「?」が表示されている場合は、その位
置にマウスポインタ16を移動させて正しい文字を入力
部5のキーボードから入力することにより、正しい文字
データに変換される。
【0042】このような上記実施例によれば、読取領域
13のレイアウトの指定は、帳票イメージ12の表示画
面上で各読取領域13中に指定領域14を設定するだけ
で済み、帳票OCRの如く厳密に座標等を指定する必要
がないので、文字を読み取るための指定操作が容易に行
える。また、認識後は、指定した出力順序に従って、各
項目に対応する認識結果データが出力されるので、振込
依頼書のようにフォーマットが異なる帳票を集計する場
合でも、出力順序が統一された出力結果を得ることがで
き、集計等のその後のデータ処理において操作者の負担
を軽減できる。
【0043】なお、本発明は上記実施例に限定されず、
その要旨を変更しない範囲内で種々に変形実施できる。
例えば、読取領域13のレイアウトの指定の際に、認識
結果データを必要とする項目12を指定したが、項目順
序の指定の際に、必要とする項目12を指定してもよ
い。
【0044】
【発明の効果】以上詳述した本発明によれば、以下の効
果を奏する。
【0045】請求項1記載の発明によれば、指定された
項目順序に従って各項目に対応する認識結果データを出
力するので、指定操作が容易となる。また、処理対象と
する帳票の実際の項目順序に拘らず、出力順序が統一さ
れた認識結果データを得ることができるので、文字認識
後のデータ処理に伴う負担を小さくできる。
【0046】請求項2記載の発明によれば、指定操作に
よりレイアウト情報及び出力順序情報が作成でき、項目
の順序が互いに異なる帳票であっても、出力順序が統一
された認識結果データを得ることができるので、文字を
読み取るための指定操作が容易でありながら、文字認識
後のデータ処理に伴う負担を小さくできる。
【0047】請求項3記載の発明によれば、一覧表によ
りレイアウト情報及び出力順序情報が作成済みか否かの
判断が容易となり、操作者の負担軽減が図れる。
【図面の簡単な説明】
【図1】本発明の光学的文字認識装置の一実施例を示す
概略ブロック図
【図2】帳票の一例を示す図
【図3】認識結果データの表示画面の一例を示す図
【図4】読取領域のレイアウトの指定方法を説明するた
めの表示画面の一例を示す図
【図5】読取領域のレイアウトの指定方法を説明するた
めの表示画面の一例を示す図
【図6】各項目に対応して設けられた読取領域の認識結
果データの出力順序の指定方法を説明するための表示画
面の一例を示す図
【図7】認識結果データの出力例を示す図
【図8】修正画面の一例を示す図
【図9】本実施例の動作を示すフローチャート
【図10】本実施例の動作を示すフローチャート
【符号の説明】
3 文字認識部 5 入力部 6 記憶部 60 レイアウト情報記憶部 61 出力順序情報記憶部 7 制御部 70 レイアウト情報作成部 71 出力順序情報作成部 10 帳票 12,12a乃至12f 項目 13 読取領域

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 任意の順序で配列された複数の項目に対
    応して読取領域がそれぞれ設けられた帳票を処理対象と
    し、その帳票の各読取領域に記入された文字を読み取
    り、その認識結果データを出力する光学的文字認識装置
    において、 前記複数の項目のうち一部又は全部の項目を選択し、そ
    の項目順序を指定する指定手段と、 この指定手段にて指定された項目順序に従って各項目に
    対応する認識結果データを出力する出力制御手段と、 を有することを特徴とする光学的文字認識装置。
  2. 【請求項2】 任意の順序で配列された複数の項目に対
    応して読取領域がそれぞれ設けられた帳票を処理対象と
    し、その帳票の各読取領域に記入された文字を読み取
    り、その認識結果データを出力する光学的文字認識装置
    において、 指定操作に基づいて前記読取領域のレイアウト情報を作
    成するレイアウト情報作成部と、 指定操作に基づいて前記複数の項目のうち選択された一
    部又は全部の項目に対応する各認識結果データの出力順
    序情報を作成する出力順序情報作成部と、 前記レイアウト情報及び出力順序情報を対応する帳票識
    別情報と共に記憶する記憶部と、 指定された帳票識別情報に対応するレイアウト情報及び
    出力順序情報を前記記憶部から読み出し、その読み出し
    たレイアウト情報及び出力順序情報に基づいて各読取領
    域に記入された文字について認識処理を行った後、指定
    された項目順序に従って各項目に対応する認識結果デー
    タを出力する文字認識部と、 を有することを特徴とする光学的文字認識装置。
  3. 【請求項3】 前記レイアウト情報及び出力順序情報が
    作成済みの帳票識別情報の一覧表を作成する一覧表作成
    部を有することを特徴とする請求項1又は2記載の光学
    的文字認識装置。
JP5213048A 1993-08-27 1993-08-27 光学的文字認識装置 Pending JPH0765111A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5213048A JPH0765111A (ja) 1993-08-27 1993-08-27 光学的文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5213048A JPH0765111A (ja) 1993-08-27 1993-08-27 光学的文字認識装置

Publications (1)

Publication Number Publication Date
JPH0765111A true JPH0765111A (ja) 1995-03-10

Family

ID=16632666

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5213048A Pending JPH0765111A (ja) 1993-08-27 1993-08-27 光学的文字認識装置

Country Status (1)

Country Link
JP (1) JPH0765111A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002109242A (ja) * 2000-09-29 2002-04-12 Glory Ltd 帳票処理方法および装置並びに帳票処理プログラムを記憶した記憶媒体
JP2019117527A (ja) * 2017-12-27 2019-07-18 株式会社日本デジタル研究所 会計処理装置、会計処理システム、会計処理方法及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002109242A (ja) * 2000-09-29 2002-04-12 Glory Ltd 帳票処理方法および装置並びに帳票処理プログラムを記憶した記憶媒体
JP2019117527A (ja) * 2017-12-27 2019-07-18 株式会社日本デジタル研究所 会計処理装置、会計処理システム、会計処理方法及びプログラム

Similar Documents

Publication Publication Date Title
JP7437837B2 (ja) 仮想セルを用いたocrベースの文書分析システム及び方法
EP3541057B1 (en) Scan apparatus and scan result display program
JP5844564B2 (ja) 帳票認識システム
KR102561878B1 (ko) 머신러닝 기반의 ai 블루 ocr 판독 시스템 및 판독 방법
EP1202213B1 (en) Document format identification apparatus and method
KR102165096B1 (ko) 온라인 파츠북 뷰어 시스템
JP2005234790A (ja) 手書き帳票処理システム、手書き帳票処理方法
JPH0765111A (ja) 光学的文字認識装置
JP4356908B2 (ja) 財務諸表自動入力装置
KR20200106472A (ko) 클라우드 기반 온라인 파츠북 서비스 제공 방법 및 시스템
JP3732254B2 (ja) フォーマット情報生成方法及びフォーマット情報生成装置
JP3735313B2 (ja) イメージ管理システム、イメージ管理方法及びイメージ管理プログラム
JP7739834B2 (ja) 書類読取装置、書類読取方法、プログラム
JP2003331216A (ja) 帳票読取方法
JP5243228B2 (ja) 文字認識装置、文字認識装置の確認画面生成方法
JPH07152856A (ja) 光学的文字読取装置
JP2007011656A (ja) 文字認識システム及び文字認識方法
JP3000349B2 (ja) キー入力編集方法及び編集装置
JP7766978B2 (ja) 証憑構造分析システム、証憑構造分析方法及び証憑構造分析プログラム
JP2006252575A (ja) 財務諸表自動入力装置及び財務諸表自動入力方法
JP4216855B2 (ja) データ表示装置、データ表示方法およびデータ表示プログラム
JP3790747B2 (ja) データ表示装置、データ表示方法およびデータ表示プログラム
JP2003099709A (ja) 誤読文字修正方法及び光学的文字認識装置
JPH05303661A (ja) イメージデータ部分取得表示装置
JPH04348475A (ja) 画像情報検索方法及びその装置