JPH03250278A - 表形式文書読取装置 - Google Patents
表形式文書読取装置Info
- Publication number
- JPH03250278A JPH03250278A JP2045547A JP4554790A JPH03250278A JP H03250278 A JPH03250278 A JP H03250278A JP 2045547 A JP2045547 A JP 2045547A JP 4554790 A JP4554790 A JP 4554790A JP H03250278 A JPH03250278 A JP H03250278A
- Authority
- JP
- Japan
- Prior art keywords
- line
- ruled
- lines
- ruled line
- dotted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
め要約のデータは記録されません。
Description
する。
用いる方法、追跡法を用いる方法などがあるが、表形式
文書における罫線認識は本来の目的が表内に書かれた文
字を認識することであるため、罫線が実線であっても点
線であっても単なる罫線として認識しているのが普通で
ある。
た特殊な罫線26(罫線の内部が塗り潰されずにハンチ
ングになっている)の場合や、第9図のように何かの文
字(ここではNJ、r+J「−」を使用している)を羅
列することによって罫線26A、26Bの意味を持たせ
ている場合については、従来は認識ができなかった。
るという問題がある。また、手書き文書や印刷物で飾り
が付いた特殊な罫線や、何かの文字を羅列することによ
って罫線の意味を持たせている場合は従来は認識ができ
ず、罫線を文字と認識したりしてしまい、罫線によって
区切られている表の構造を正しく理解出来ないという問
題もある。
識できるようにし、飾りが付いた特殊な罫線や、文字等
を羅列した罫線等についても認識できるようにすること
にある。
る文字を読取る表形式文書読取装置において、前記表の
罫線が実線1点線、破線、二重線。
を認識する罫線認識部を設け、認識結果を出力するに当
たっては罫線の線種情報も併せて出力可能にする。また
、前記表形式文書の或る罫線が指定されたときその罫線
の特徴データを抽出して登録する罫線登録部を設け、登
録された特徴データにもとづき以後の罫線の認識を可能
にし、さらにはその登録時に罫線を実線1点線、破線。
定も併せてできるようにする。
特徴を予め登録しておくことによって罫線の線種を判別
し、その結果を位置情報などと共に出力できるようにす
る。また、手書き文書や印刷物で飾りが付いた特殊な罫
線や、何かの文字を羅列することによって罫線の意味を
持たせている場合は、そのパターンを登録することによ
り、罫線として認識できるようにする。このとき、かか
る罫線がCRTやプリンタ等の装置で出力できないとき
は、実線や点線に置き換えて出力することができるよう
にする。
式文書、2はホス1−CPU、3は画像入力部、4は画
像メモリ、5は文字認識部、6は罫線認識部、7は罫線
登録部、8は罫線特徴チーフル、9は補助記憶部、10
はプリンタ、11はCRTである。
照して説明する。
表形式文書1を入力すると、画像データは2値化され画
像メモリ4に格納される。いま、例えば第2図の如き表
形式文書1が入力されたとすると、罫線認識部6ではま
ず罫線候補21を抽出する。なお、この段階では符号2
2のように汚れ、折り目等で実際には罫線ではないもの
21Aも含まれている。そこで、罫線であるか否かを判
定するため、罫線候補21の各々の特徴パターンを抽出
する。すなわち、罫線は各線種毎に特徴パターンを持っ
ており、その特徴パターンによって線種を分類すること
ができる。例えば、実線であれば基本的には連続であり
、かつ一定の幅を有するという特徴を持っている。また
、点線や一点鎖線等の罫線は、一定の周期的な規則性を
持っている。
線部分DIと間隔部分D2の長さ、DIとD2の比、D
lとD2の出現回数および線幅等のデータがあり、他の
線種も同様に固有の特徴パターンを持っているので、こ
れらの罫線特徴パターンの中の最も近い線として線種を
認識する。そのために、罫線特徴テーブル8には予め実
線1点線などの基本的な線種に関するデータを格納して
おき、罫線認識部6で抽出した罫線データをテーブル8
の内容と比較することにより、罫線をその線種も含めて
認識することが可能となる。この段階で、22は罫線と
しての特徴を持たないことから、不適合として除去され
ることになり、したがって第2図の如き文書からは第4
図のような罫線情報23が得られ、補助記憶部9に保存
される。
が分かる。
で第5図に符号24で示すような文字領域が算出され、
この領域24毎に文字認識を行ない、第6図の如き文字
データ25を補助記憶部9に保存する。保存されたデー
タは必要に応じて読み出され、プリンタ10またはCR
TIIに出力される。
、ホストCPU2で罫線登録モードを選択すると、画像
入力部3に入力され画像メモリ4に格納された表形式文
書の画像データがCRT 11に表示されるので、カー
ソル等によりその特殊な罫線部分の範囲27を第8図の
ように指示すると、その範囲の情報が罫線登録部7に与
えられる。
種々の特徴パターンを抽出し、そのデータをテーブル8
に追加登録する。なお、この追加登録された罫線を出力
するときの罫線種別を、例えば実線とか点線のように指
定することができる。
別を点線と指定すると、範囲270部分は登録した罫線
として認識され、第7図のように点線として出力される
ことになる。
とすることにより、入力文書と同様の罫線を再現するこ
とができる利点が得られる。また、特殊な罫線の場合は
その画像データを指定し特徴を抽出して登録することに
より、如何なる罫線をも識別することができ、表の構造
を正確に把握することが可能となる。
形式文書の一例を説明するための説明図、第3図は点線
の例を説明するための説明図、第4図は第2図の罫線情
報を説明するための説明図、第5図は第2図の文字領域
を説明するための説明図、第6図は第2図の文字データ
を説明するための説明図、第7図は罫線登録による認識
結果の例を説明するための説明図、第8図は特殊な罫線
を持つ表形式文書の一例を説明するための説明図、第9
図は文字を罫線として使用した例を説明するための説明
図である。 符号説明 1・・・表形式文書、2・・・ホストCPU、3・・・
画像入力部、4・・・画像メモリ、5・・・文字認識部
、6・・・罫線認識部、7・・・罫線登録部、8・・・
罫線特徴テーブル、9・・・補助記憶部、10・・・プ
リンタ、11・・・CRT、21.21A・・・罫線候
補、22・・・汚れ折れ等、23・・・罫線情報データ
、24・・・文字領域、25・・・文字データ、26.
26A、26B・・・特殊な罫線、27・・・罫線指定
範囲。
Claims (1)
- 【特許請求の範囲】 1)表形式文書を画像処理して表の構造を認識し、表内
にある文字を読取る表形式文書読取装置において、 前記表の罫線が実線、点線、破線、二重線、一点鎖線を
含むいずれの線種からなるかを判別して罫線を認識する
罫線認識部を設け、認識結果を出力するに当たっては罫
線の線種情報も併せて出力可能にしてなることを特徴と
する表形式文書読取装置。 2)前記表形式文書の或る罫線が指定されたときその罫
線の特徴データを抽出して登録する罫線登録部を設け、
登録された特徴データにもとづき以後の罫線の認識を可
能にしてなることを特徴とする請求項1)に記載の表形
式文書読取装置。 3)前記罫線の特徴データ登録時に罫線を実線、点線、
破線、二重線、一点鎖線を含むいずれの線種にて出力す
るかの指定も併せて可能にしてなることを特徴とする請
求項2)に記載の表形式文書読取装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2045547A JP2813600B2 (ja) | 1990-02-28 | 1990-02-28 | 表形式文書読取装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2045547A JP2813600B2 (ja) | 1990-02-28 | 1990-02-28 | 表形式文書読取装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH03250278A true JPH03250278A (ja) | 1991-11-08 |
| JP2813600B2 JP2813600B2 (ja) | 1998-10-22 |
Family
ID=12722391
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2045547A Expired - Fee Related JP2813600B2 (ja) | 1990-02-28 | 1990-02-28 | 表形式文書読取装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2813600B2 (ja) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5638683A (en) * | 1979-09-05 | 1981-04-13 | Hitachi Ltd | Discriminating method of type of line in pattern recognizer |
| JPS62200472A (ja) * | 1986-02-28 | 1987-09-04 | Mitsubishi Electric Corp | 線検出装置 |
| JPH01147786A (ja) * | 1987-12-04 | 1989-06-09 | Fuji Electric Co Ltd | 表を含む文書の読取装置 |
-
1990
- 1990-02-28 JP JP2045547A patent/JP2813600B2/ja not_active Expired - Fee Related
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5638683A (en) * | 1979-09-05 | 1981-04-13 | Hitachi Ltd | Discriminating method of type of line in pattern recognizer |
| JPS62200472A (ja) * | 1986-02-28 | 1987-09-04 | Mitsubishi Electric Corp | 線検出装置 |
| JPH01147786A (ja) * | 1987-12-04 | 1989-06-09 | Fuji Electric Co Ltd | 表を含む文書の読取装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2813600B2 (ja) | 1998-10-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR19980042782A (ko) | 문자 인식 장치 및 방법 | |
| JPH07105308A (ja) | 書類上の金額フィールドの位置特定方法および識別方法 | |
| JPH03161891A (ja) | 表形式文書読取装置 | |
| JP3178483B2 (ja) | 文書処理装置 | |
| JP2003018393A (ja) | 画像処理システム | |
| JP4738668B2 (ja) | 文書管理装置、文書管理方法及びその文書管理装置での処理をコンピュータに行なわせるためのプログラムを格納した記憶媒体 | |
| JP4807618B2 (ja) | 画像処理装置及び画像処理プログラム | |
| JP3868537B2 (ja) | 個人識別媒体発行システム及びデータチェック方法 | |
| JPH03250278A (ja) | 表形式文書読取装置 | |
| Chen et al. | Analysis, Understanding and Representation of Chinese newspaper with complex layout | |
| JP3732254B2 (ja) | フォーマット情報生成方法及びフォーマット情報生成装置 | |
| JP4517822B2 (ja) | 画像処理装置及びプログラム | |
| JP2974346B2 (ja) | 漢字処理装置 | |
| JP2008028716A (ja) | 画像処理方法及び装置 | |
| KR0183779B1 (ko) | 전표 등록 방법 및 장치 | |
| JP3006294B2 (ja) | 光学的文字読取装置 | |
| JP2784004B2 (ja) | 文字認識装置 | |
| JPH05266244A (ja) | 文字読取装置 | |
| JPS6180477A (ja) | 文書清書装置 | |
| JPH08194772A (ja) | 光学的文字読取り装置 | |
| JPH04309B2 (ja) | ||
| JPH03167685A (ja) | 帳票入力処理方式 | |
| JPH02212989A (ja) | 文字読み取り装置 | |
| JPH0357506B2 (ja) | ||
| JPH0520505A (ja) | 文字認識装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070814 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080814 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080814 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090814 Year of fee payment: 11 |
|
| LAPS | Cancellation because of no payment of annual fees |