JPH07225809A - 文書読取り枠の自動生成方法 - Google Patents
文書読取り枠の自動生成方法Info
- Publication number
- JPH07225809A JPH07225809A JP6017394A JP1739494A JPH07225809A JP H07225809 A JPH07225809 A JP H07225809A JP 6017394 A JP6017394 A JP 6017394A JP 1739494 A JP1739494 A JP 1739494A JP H07225809 A JPH07225809 A JP H07225809A
- Authority
- JP
- Japan
- Prior art keywords
- extracted
- document
- processing
- block
- read
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
(57)【要約】
【目的】 簡単な操作で短時間に読取り枠を自動生成可
能とする。 【構成】 文書中の読取りたい部分を、その左上の1点
を指示して処理範囲を限定し、その範囲内での段組の抽
出,黒画素を伸長して文字間を塗り潰す処理,その輪郭
追跡による文字行の抽出,行を統合してのブロック抽出
などを含む自動領域抽出処理を行なうことで、簡単かつ
短時間に読取り枠を自動生成する。
能とする。 【構成】 文書中の読取りたい部分を、その左上の1点
を指示して処理範囲を限定し、その範囲内での段組の抽
出,黒画素を伸長して文字間を塗り潰す処理,その輪郭
追跡による文字行の抽出,行を統合してのブロック抽出
などを含む自動領域抽出処理を行なうことで、簡単かつ
短時間に読取り枠を自動生成する。
Description
【0001】
【産業上の利用分野】この発明は、文書中の読み取らせ
たい部分を指定することにより、その部分を囲う読取り
枠を作成する文書読取り枠の自動生成方法に関する。
たい部分を指定することにより、その部分を囲う読取り
枠を作成する文書読取り枠の自動生成方法に関する。
【0002】
【従来の技術】従来、文書中の1部だけを読取りたいと
き、 (1)手作業で読取り枠を作成する。 (2)読取り対象を含む部分を大きく囲み、自動的に領
域を抽出する機能を用いて読取り枠を生成し、その後、
不要な部分を削除する。 などの方法を用いている。
き、 (1)手作業で読取り枠を作成する。 (2)読取り対象を含む部分を大きく囲み、自動的に領
域を抽出する機能を用いて読取り枠を生成し、その後、
不要な部分を削除する。 などの方法を用いている。
【0003】
【発明が解決しようとする課題】しかしながら、上記
(1)の場合に、読取り対象が1文書中に複数あると、
作業が煩雑となり時間が掛かる、また、(2)の場合は
読取り対象に対し、これを全て含むような枠を作成して
自動領域抽出処理を行なうため、無駄な部分も処理しな
ければならないことから時間が掛かるだけでなく、無駄
な部分を削除する処理も必要になるなどの問題がある。
したがって、この発明の課題は簡単な操作で、しかも短
時間に読取り枠を自動生成し得るようにすることにあ
る。
(1)の場合に、読取り対象が1文書中に複数あると、
作業が煩雑となり時間が掛かる、また、(2)の場合は
読取り対象に対し、これを全て含むような枠を作成して
自動領域抽出処理を行なうため、無駄な部分も処理しな
ければならないことから時間が掛かるだけでなく、無駄
な部分を削除する処理も必要になるなどの問題がある。
したがって、この発明の課題は簡単な操作で、しかも短
時間に読取り枠を自動生成し得るようにすることにあ
る。
【0004】
【課題を解決するための手段】このような課題を解決す
るため、この発明では、入力された文書を表示し、指示
手段により文書上の所定1点を指示して処理範囲を限定
し、その処理範囲内で段組を抽出した後黒画素を伸長
し、文字間を塗り潰して輪郭追跡することにより個々の
文字行を抽出し、抽出された各文字行を統合して得られ
る最初のブロックを読取り枠として抽出することを特徴
としている。
るため、この発明では、入力された文書を表示し、指示
手段により文書上の所定1点を指示して処理範囲を限定
し、その処理範囲内で段組を抽出した後黒画素を伸長
し、文字間を塗り潰して輪郭追跡することにより個々の
文字行を抽出し、抽出された各文字行を統合して得られ
る最初のブロックを読取り枠として抽出することを特徴
としている。
【0005】
【作用】読取り対象となるブロックの左上1点を指示す
ることで、そこを基準として処理を行なう範囲を限定
し、その範囲について自動領域抽出処理を行ない、最初
のブロックが抽出された時点で処理を停止することによ
り、簡単な作業で短時間に読取り枠を生成可能とする。
ることで、そこを基準として処理を行なう範囲を限定
し、その範囲について自動領域抽出処理を行ない、最初
のブロックが抽出された時点で処理を停止することによ
り、簡単な作業で短時間に読取り枠を生成可能とする。
【0006】
【実施例】図1はこの発明の実施例を示すフローチャー
トで、図示されない文字読取装置(OCR)に内蔵され
ている処理装置(CPU)の動作を示すものである。図
2〜図8はこの発明を具体的に説明するための説明図で
ある。まず、ステップで文書をスキャナーなどを用い
て入力し、画像として記憶する。なお、ここでは図や表
を含む横書き文書を処理する場合を想定している。図2
にその画像Gを簡略化して示す。いま、図2のR1を読
み取りたい部分とすると、ステップでは、マウス等の
ポインティングデバイスを用いて、図3の左上点P1を
指示する(ステップ−1)。その指示された点を基準
として、その下部,右部を処理範囲として取り出す(ス
テップ−2)。図3に対応する処理範囲を、図4に斜
線S1にて示す。
トで、図示されない文字読取装置(OCR)に内蔵され
ている処理装置(CPU)の動作を示すものである。図
2〜図8はこの発明を具体的に説明するための説明図で
ある。まず、ステップで文書をスキャナーなどを用い
て入力し、画像として記憶する。なお、ここでは図や表
を含む横書き文書を処理する場合を想定している。図2
にその画像Gを簡略化して示す。いま、図2のR1を読
み取りたい部分とすると、ステップでは、マウス等の
ポインティングデバイスを用いて、図3の左上点P1を
指示する(ステップ−1)。その指示された点を基準
として、その下部,右部を処理範囲として取り出す(ス
テップ−2)。図3に対応する処理範囲を、図4に斜
線S1にて示す。
【0007】次に、図5のように文書画像Gの縦方向の
投影PRを取り、図6のように段組を抽出する。次い
で、最初の段組について、横方向に黒画素を伸長して文
字間を潰し、良く知られている輪郭追跡をして行を抽出
する。図6から抽出される行を図7に示す。このような
行は規則的に並んでいることから、この性質を利用して
行統合を行ないブロックB1を抽出し、これを読取り枠
とする。このとき、最初のブロックB1の読取り枠が作
成された時点で処理を終了する。つまり、図8の実線で
示す部分B1が抽出された時点で処理を終了し、点線部
分の処理は行なわない。以上の処理を自動領域抽出処理
として、図1のステップ−3に示す。
投影PRを取り、図6のように段組を抽出する。次い
で、最初の段組について、横方向に黒画素を伸長して文
字間を潰し、良く知られている輪郭追跡をして行を抽出
する。図6から抽出される行を図7に示す。このような
行は規則的に並んでいることから、この性質を利用して
行統合を行ないブロックB1を抽出し、これを読取り枠
とする。このとき、最初のブロックB1の読取り枠が作
成された時点で処理を終了する。つまり、図8の実線で
示す部分B1が抽出された時点で処理を終了し、点線部
分の処理は行なわない。以上の処理を自動領域抽出処理
として、図1のステップ−3に示す。
【0008】読み取りたい部分が図2のR2の場合も上
記と同様に、その左上の1点P2を指示することによ
り、読取り枠が自動生成される。なお、点P2を指示し
た場合の処理範囲は、図4の斜線部とは異なることにな
るのは勿論である。以後は、行切り出し(ステップ参
照),文字切り出し(ステップ参照)などの良く知ら
れている処理が行なわれ、辞書とのパターンマッチング
度などから個々の文字が認識される(ステップ参
照)。なお、以上では横書き文字について説明したが、
この発明は縦書きの場合にも上記と同様にして適用でき
るのは言う迄もない。
記と同様に、その左上の1点P2を指示することによ
り、読取り枠が自動生成される。なお、点P2を指示し
た場合の処理範囲は、図4の斜線部とは異なることにな
るのは勿論である。以後は、行切り出し(ステップ参
照),文字切り出し(ステップ参照)などの良く知ら
れている処理が行なわれ、辞書とのパターンマッチング
度などから個々の文字が認識される(ステップ参
照)。なお、以上では横書き文字について説明したが、
この発明は縦書きの場合にも上記と同様にして適用でき
るのは言う迄もない。
【0009】
【発明の効果】この発明によれば、読取りたい部分につ
いてその左上の1点だけを指示し、自動領域抽出処理を
行なうようにしたので、簡単な操作で短時間に読取り枠
を作成し得る利点が得られる。
いてその左上の1点だけを指示し、自動領域抽出処理を
行なうようにしたので、簡単な操作で短時間に読取り枠
を作成し得る利点が得られる。
【図1】この発明の実施例を示すフローチャートであ
る。
る。
【図2】文書画像を簡略化して説明するための説明図で
ある。
ある。
【図3】読み取りたい部分の指示位置を説明するための
説明図である。
説明図である。
【図4】図3で指示される処理範囲を説明するための説
明図である。
明図である。
【図5】縦方向の投影値を説明するための説明図であ
る。
る。
【図6】段組の例を説明するための説明図である。
【図7】抽出された各行を説明するための説明図であ
る。
る。
【図8】抽出された読取り枠を説明するための説明図で
ある。
ある。
G…文書画像、R1,R2…読み取り対象部分、P1,
P2…指示位置、S1…処理範囲、PR…投影値、B1
…ブロック(読取り枠)。
P2…指示位置、S1…処理範囲、PR…投影値、B1
…ブロック(読取り枠)。
Claims (1)
- 【請求項1】 入力された文書を表示し、指示手段によ
り文書上の所定1点を指示して処理範囲を限定し、その
処理範囲内で段組を抽出した後黒画素を伸長し、文字間
を塗り潰して輪郭追跡することにより個々の文字行を抽
出し、抽出された各文字行を統合して得られる最初のブ
ロックを読取り枠として抽出することを特徴とする文書
読取り枠の自動生成方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6017394A JPH07225809A (ja) | 1994-02-14 | 1994-02-14 | 文書読取り枠の自動生成方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6017394A JPH07225809A (ja) | 1994-02-14 | 1994-02-14 | 文書読取り枠の自動生成方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH07225809A true JPH07225809A (ja) | 1995-08-22 |
Family
ID=11942792
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6017394A Pending JPH07225809A (ja) | 1994-02-14 | 1994-02-14 | 文書読取り枠の自動生成方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH07225809A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7486821B2 (en) | 2003-06-10 | 2009-02-03 | Samsung Electronics Co., Ltd. | Method for recognizing characters in a portable terminal having an image input unit |
-
1994
- 1994-02-14 JP JP6017394A patent/JPH07225809A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7486821B2 (en) | 2003-06-10 | 2009-02-03 | Samsung Electronics Co., Ltd. | Method for recognizing characters in a portable terminal having an image input unit |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5075895A (en) | Method and apparatus for recognizing table area formed in binary image of document | |
| JP2002279433A (ja) | 映像中の文字検索方法及び装置 | |
| EP0457546B1 (en) | Image processing method and apparatus | |
| JP2000181988A (ja) | 光学文字読取装置 | |
| JPH07225809A (ja) | 文書読取り枠の自動生成方法 | |
| US4903315A (en) | Apparatus for enlarging or reducing an image pattern | |
| JP2931041B2 (ja) | 表内文字認識方法 | |
| JP2803736B2 (ja) | 文字認識方式 | |
| JP2792037B2 (ja) | 表および文書画像編集装置 | |
| JP2887803B2 (ja) | 文書画像処理装置 | |
| JP3162414B2 (ja) | 罫線認識方法及び表処理方法 | |
| JP2800205B2 (ja) | 画像処理装置 | |
| JP3157534B2 (ja) | 表認識方法 | |
| JP2933947B2 (ja) | 画像処理方法及び装置 | |
| JPH01270107A (ja) | 数値制御加工装置のプログラム作成装置 | |
| JP2954218B2 (ja) | 画像処理方法及び装置 | |
| JPH08180087A (ja) | 図形の歪み補正方法 | |
| KR100258328B1 (ko) | 화상편집장치의 영역 선택방법 | |
| JPH07120386B2 (ja) | 文字認識装置 | |
| JPH04311283A (ja) | 行方向判定装置 | |
| JP2000172780A (ja) | 帳票登録装置および図形認識装置 | |
| JPS6324367A (ja) | 画像処理方法 | |
| JPH0433079A (ja) | 表処理方式 | |
| JP2564488B2 (ja) | 画像塗りつぶし方法 | |
| JP2926842B2 (ja) | 文字切出し回路 |