JPH03250278A - 表形式文書読取装置 - Google Patents

表形式文書読取装置

Info

Publication number
JPH03250278A
JPH03250278A JP2045547A JP4554790A JPH03250278A JP H03250278 A JPH03250278 A JP H03250278A JP 2045547 A JP2045547 A JP 2045547A JP 4554790 A JP4554790 A JP 4554790A JP H03250278 A JPH03250278 A JP H03250278A
Authority
JP
Japan
Prior art keywords
line
ruled
lines
ruled line
dotted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2045547A
Other languages
English (en)
Other versions
JP2813600B2 (ja
Inventor
Katsumi Hosokawa
勝美 細川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Fuji Facom Corp
Original Assignee
Fuji Electric Co Ltd
Fuji Facom Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd, Fuji Facom Corp filed Critical Fuji Electric Co Ltd
Priority to JP2045547A priority Critical patent/JP2813600B2/ja
Publication of JPH03250278A publication Critical patent/JPH03250278A/ja
Application granted granted Critical
Publication of JP2813600B2 publication Critical patent/JP2813600B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、表を含む文書(表形式文書)の読取装置に関
する。
〔従来の技術〕
従来、表形式文書の罫線を認識する方法として投影法を
用いる方法、追跡法を用いる方法などがあるが、表形式
文書における罫線認識は本来の目的が表内に書かれた文
字を認識することであるため、罫線が実線であっても点
線であっても単なる罫線として認識しているのが普通で
ある。
また、第8図のように手書き文書や印刷物で飾りが付い
た特殊な罫線26(罫線の内部が塗り潰されずにハンチ
ングになっている)の場合や、第9図のように何かの文
字(ここではNJ、r+J「−」を使用している)を羅
列することによって罫線26A、26Bの意味を持たせ
ている場合については、従来は認識ができなかった。
〔発明が解決しようとする課題〕
つまり、従来の方法では罫線の線種(種別)が不明にな
るという問題がある。また、手書き文書や印刷物で飾り
が付いた特殊な罫線や、何かの文字を羅列することによ
って罫線の意味を持たせている場合は従来は認識ができ
ず、罫線を文字と認識したりしてしまい、罫線によって
区切られている表の構造を正しく理解出来ないという問
題もある。
したがって、本発明の目的は罫線をその種別とともに認
識できるようにし、飾りが付いた特殊な罫線や、文字等
を羅列した罫線等についても認識できるようにすること
にある。
〔課題を解決するための手段〕
表形式文書を画像処理して表の構造を認識し、表内にあ
る文字を読取る表形式文書読取装置において、前記表の
罫線が実線1点線、破線、二重線。
一点鎖線を含むいずれの線種からなるかを判別して罫線
を認識する罫線認識部を設け、認識結果を出力するに当
たっては罫線の線種情報も併せて出力可能にする。また
、前記表形式文書の或る罫線が指定されたときその罫線
の特徴データを抽出して登録する罫線登録部を設け、登
録された特徴データにもとづき以後の罫線の認識を可能
にし、さらにはその登録時に罫線を実線1点線、破線。
重線、一点鎖線を含むいずれの線種にて出力するかの指
定も併せてできるようにする。
C作用〕 表形式文書の罫線を認識するに当たり、実線や点線等の
特徴を予め登録しておくことによって罫線の線種を判別
し、その結果を位置情報などと共に出力できるようにす
る。また、手書き文書や印刷物で飾りが付いた特殊な罫
線や、何かの文字を羅列することによって罫線の意味を
持たせている場合は、そのパターンを登録することによ
り、罫線として認識できるようにする。このとき、かか
る罫線がCRTやプリンタ等の装置で出力できないとき
は、実線や点線に置き換えて出力することができるよう
にする。
〔実施例〕
第1図は本発明の実施例を示すブロック図で、1は表形
式文書、2はホス1−CPU、3は画像入力部、4は画
像メモリ、5は文字認識部、6は罫線認識部、7は罫線
登録部、8は罫線特徴チーフル、9は補助記憶部、10
はプリンタ、11はCRTである。
以下、第1図の動作について、第2図ないし第9図を参
照して説明する。
ホストCPU2により制御される画像入力部3によって
表形式文書1を入力すると、画像データは2値化され画
像メモリ4に格納される。いま、例えば第2図の如き表
形式文書1が入力されたとすると、罫線認識部6ではま
ず罫線候補21を抽出する。なお、この段階では符号2
2のように汚れ、折り目等で実際には罫線ではないもの
21Aも含まれている。そこで、罫線であるか否かを判
定するため、罫線候補21の各々の特徴パターンを抽出
する。すなわち、罫線は各線種毎に特徴パターンを持っ
ており、その特徴パターンによって線種を分類すること
ができる。例えば、実線であれば基本的には連続であり
、かつ一定の幅を有するという特徴を持っている。また
、点線や一点鎖線等の罫線は、一定の周期的な規則性を
持っている。
第3図に点線の例を示す。同図からも明らかなように、
線部分DIと間隔部分D2の長さ、DIとD2の比、D
lとD2の出現回数および線幅等のデータがあり、他の
線種も同様に固有の特徴パターンを持っているので、こ
れらの罫線特徴パターンの中の最も近い線として線種を
認識する。そのために、罫線特徴テーブル8には予め実
線1点線などの基本的な線種に関するデータを格納して
おき、罫線認識部6で抽出した罫線データをテーブル8
の内容と比較することにより、罫線をその線種も含めて
認識することが可能となる。この段階で、22は罫線と
しての特徴を持たないことから、不適合として除去され
ることになり、したがって第2図の如き文書からは第4
図のような罫線情報23が得られ、補助記憶部9に保存
される。
第4図からは罫線候補21Aのデータは除かれているの
が分かる。
次に、第4図の如き情報は文字認識部5に送られ、ここ
で第5図に符号24で示すような文字領域が算出され、
この領域24毎に文字認識を行ない、第6図の如き文字
データ25を補助記憶部9に保存する。保存されたデー
タは必要に応じて読み出され、プリンタ10またはCR
TIIに出力される。
また、第8図、第9図のような特殊な罫線がある場合は
、ホストCPU2で罫線登録モードを選択すると、画像
入力部3に入力され画像メモリ4に格納された表形式文
書の画像データがCRT 11に表示されるので、カー
ソル等によりその特殊な罫線部分の範囲27を第8図の
ように指示すると、その範囲の情報が罫線登録部7に与
えられる。
罫線登録部7は指定された範囲27内の画像データから
種々の特徴パターンを抽出し、そのデータをテーブル8
に追加登録する。なお、この追加登録された罫線を出力
するときの罫線種別を、例えば実線とか点線のように指
定することができる。
したがって、第8図で範囲27の罫線を登録し、出力種
別を点線と指定すると、範囲270部分は登録した罫線
として認識され、第7図のように点線として出力される
ことになる。
〔発明の効果〕
本発明によれば、実線1点線等の罫線の種別を判別可能
とすることにより、入力文書と同様の罫線を再現するこ
とができる利点が得られる。また、特殊な罫線の場合は
その画像データを指定し特徴を抽出して登録することに
より、如何なる罫線をも識別することができ、表の構造
を正確に把握することが可能となる。
【図面の簡単な説明】
第1図は本発明の実施例を示すブロック図、第2図は表
形式文書の一例を説明するための説明図、第3図は点線
の例を説明するための説明図、第4図は第2図の罫線情
報を説明するための説明図、第5図は第2図の文字領域
を説明するための説明図、第6図は第2図の文字データ
を説明するための説明図、第7図は罫線登録による認識
結果の例を説明するための説明図、第8図は特殊な罫線
を持つ表形式文書の一例を説明するための説明図、第9
図は文字を罫線として使用した例を説明するための説明
図である。 符号説明 1・・・表形式文書、2・・・ホストCPU、3・・・
画像入力部、4・・・画像メモリ、5・・・文字認識部
、6・・・罫線認識部、7・・・罫線登録部、8・・・
罫線特徴テーブル、9・・・補助記憶部、10・・・プ
リンタ、11・・・CRT、21.21A・・・罫線候
補、22・・・汚れ折れ等、23・・・罫線情報データ
、24・・・文字領域、25・・・文字データ、26.
26A、26B・・・特殊な罫線、27・・・罫線指定
範囲。

Claims (1)

  1. 【特許請求の範囲】 1)表形式文書を画像処理して表の構造を認識し、表内
    にある文字を読取る表形式文書読取装置において、 前記表の罫線が実線、点線、破線、二重線、一点鎖線を
    含むいずれの線種からなるかを判別して罫線を認識する
    罫線認識部を設け、認識結果を出力するに当たっては罫
    線の線種情報も併せて出力可能にしてなることを特徴と
    する表形式文書読取装置。 2)前記表形式文書の或る罫線が指定されたときその罫
    線の特徴データを抽出して登録する罫線登録部を設け、
    登録された特徴データにもとづき以後の罫線の認識を可
    能にしてなることを特徴とする請求項1)に記載の表形
    式文書読取装置。 3)前記罫線の特徴データ登録時に罫線を実線、点線、
    破線、二重線、一点鎖線を含むいずれの線種にて出力す
    るかの指定も併せて可能にしてなることを特徴とする請
    求項2)に記載の表形式文書読取装置。
JP2045547A 1990-02-28 1990-02-28 表形式文書読取装置 Expired - Fee Related JP2813600B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2045547A JP2813600B2 (ja) 1990-02-28 1990-02-28 表形式文書読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2045547A JP2813600B2 (ja) 1990-02-28 1990-02-28 表形式文書読取装置

Publications (2)

Publication Number Publication Date
JPH03250278A true JPH03250278A (ja) 1991-11-08
JP2813600B2 JP2813600B2 (ja) 1998-10-22

Family

ID=12722391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2045547A Expired - Fee Related JP2813600B2 (ja) 1990-02-28 1990-02-28 表形式文書読取装置

Country Status (1)

Country Link
JP (1) JP2813600B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5638683A (en) * 1979-09-05 1981-04-13 Hitachi Ltd Discriminating method of type of line in pattern recognizer
JPS62200472A (ja) * 1986-02-28 1987-09-04 Mitsubishi Electric Corp 線検出装置
JPH01147786A (ja) * 1987-12-04 1989-06-09 Fuji Electric Co Ltd 表を含む文書の読取装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5638683A (en) * 1979-09-05 1981-04-13 Hitachi Ltd Discriminating method of type of line in pattern recognizer
JPS62200472A (ja) * 1986-02-28 1987-09-04 Mitsubishi Electric Corp 線検出装置
JPH01147786A (ja) * 1987-12-04 1989-06-09 Fuji Electric Co Ltd 表を含む文書の読取装置

Also Published As

Publication number Publication date
JP2813600B2 (ja) 1998-10-22

Similar Documents

Publication Publication Date Title
KR19980042782A (ko) 문자 인식 장치 및 방법
JPH07105308A (ja) 書類上の金額フィールドの位置特定方法および識別方法
JPH03161891A (ja) 表形式文書読取装置
JP3178483B2 (ja) 文書処理装置
JP2003018393A (ja) 画像処理システム
JP4738668B2 (ja) 文書管理装置、文書管理方法及びその文書管理装置での処理をコンピュータに行なわせるためのプログラムを格納した記憶媒体
JP4807618B2 (ja) 画像処理装置及び画像処理プログラム
JP3868537B2 (ja) 個人識別媒体発行システム及びデータチェック方法
JPH03250278A (ja) 表形式文書読取装置
Chen et al. Analysis, Understanding and Representation of Chinese newspaper with complex layout
JP3732254B2 (ja) フォーマット情報生成方法及びフォーマット情報生成装置
JP4517822B2 (ja) 画像処理装置及びプログラム
JP2974346B2 (ja) 漢字処理装置
JP2008028716A (ja) 画像処理方法及び装置
KR0183779B1 (ko) 전표 등록 방법 및 장치
JP3006294B2 (ja) 光学的文字読取装置
JP2784004B2 (ja) 文字認識装置
JPH05266244A (ja) 文字読取装置
JPS6180477A (ja) 文書清書装置
JPH08194772A (ja) 光学的文字読取り装置
JPH04309B2 (ja)
JPH03167685A (ja) 帳票入力処理方式
JPH02212989A (ja) 文字読み取り装置
JPH0357506B2 (ja)
JPH0520505A (ja) 文字認識装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070814

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080814

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080814

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090814

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees