JPH03111982A - 文字切出し方法 - Google Patents
文字切出し方法Info
- Publication number
- JPH03111982A JPH03111982A JP1250092A JP25009289A JPH03111982A JP H03111982 A JPH03111982 A JP H03111982A JP 1250092 A JP1250092 A JP 1250092A JP 25009289 A JP25009289 A JP 25009289A JP H03111982 A JPH03111982 A JP H03111982A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- character
- characters
- frame line
- cut out
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は文字認識装置(OCR)において、任意の枠内
に書かれた文字画像からの文字切出し方法に関する。
に書かれた文字画像からの文字切出し方法に関する。
[従来の技術〕
枠内から文字を切出すこれまでの方法としては、規定の
帳票上の枠の位置をあらかじめ与えておく方法や1画像
入力の際の帳票の傾きや位置ずれを検出するためのマー
クを設け、このマークの位置により帳票上の枠の位置を
補正し、文字を切出す方法、あるいは、特開昭60−4
5884号公報などに見られるように、枠内に文字が書
かれた画像に対し、直交する2方向に射影をとって文字
枠を抽出し、文字枠を除去する方法などが知られている
。
帳票上の枠の位置をあらかじめ与えておく方法や1画像
入力の際の帳票の傾きや位置ずれを検出するためのマー
クを設け、このマークの位置により帳票上の枠の位置を
補正し、文字を切出す方法、あるいは、特開昭60−4
5884号公報などに見られるように、枠内に文字が書
かれた画像に対し、直交する2方向に射影をとって文字
枠を抽出し、文字枠を除去する方法などが知られている
。
従来技術において、枠の位置をあらかじめ与えておく方
法は、枠が特定のものに限定され、他の枠を使用する場
合には新たに枠の位置を与えるという汎用性に欠ける欠
点があった。また、帳票上にマークを設ける方法は、画
像入力の際のスキャナ等によるノイズの発生や画像の不
鮮明さにより。
法は、枠が特定のものに限定され、他の枠を使用する場
合には新たに枠の位置を与えるという汎用性に欠ける欠
点があった。また、帳票上にマークを設ける方法は、画
像入力の際のスキャナ等によるノイズの発生や画像の不
鮮明さにより。
傾きや位置ずれ検出のマーク自体や枠そのものがぼやけ
てしまうことがあり、正確な補正が行われず、文字の切
出しがうまくいかないという欠点があった。さらに、従
来の射影により文字枠を除去する方法は、枠線への接触
文字があったり、帳票が傾いていたりした場合、射影に
より文字枠を除去する際1文字が切り落される欠点があ
った。
てしまうことがあり、正確な補正が行われず、文字の切
出しがうまくいかないという欠点があった。さらに、従
来の射影により文字枠を除去する方法は、枠線への接触
文字があったり、帳票が傾いていたりした場合、射影に
より文字枠を除去する際1文字が切り落される欠点があ
った。
本発明の目的は、任意の枠内に書かれた文字画像から、
文字を正確・確実に切出すことにある。
文字を正確・確実に切出すことにある。
上記目的を達成するために、請求項(1)では、枠内に
文字が書かれた帳票類の入力画像について。
文字が書かれた帳票類の入力画像について。
枠線認識により枠座標を求め、該枠座標から得られる個
々の枠に対して上下左右の枠線を含む外接矩形を切出し
た後、垂直及び水平方向の射影をもとに文字を切出すこ
とを特徴とする。
々の枠に対して上下左右の枠線を含む外接矩形を切出し
た後、垂直及び水平方向の射影をもとに文字を切出すこ
とを特徴とする。
また、請求項(2)では、上下左右の枠線を含む外接矩
形での枠線の存在範囲を求め、この範囲内で外接矩形か
ら枠線の除去を行うことを特徴とする。
形での枠線の存在範囲を求め、この範囲内で外接矩形か
ら枠線の除去を行うことを特徴とする。
さらに、請求項(3)では、上記外接矩形からの枠線の
除去を行った後に得られる上下左右に余白を含む画像に
対し、水平または垂直方向の射影を求め、端から中心方
向へ向って、文字を切出す位置を決定することを特徴と
する。
除去を行った後に得られる上下左右に余白を含む画像に
対し、水平または垂直方向の射影を求め、端から中心方
向へ向って、文字を切出す位置を決定することを特徴と
する。
請求項(1)では、枠線認識により得られた枠座標をも
とに文字切出しを行うため任意の枠に対応し、個々の枠
に対して上下左右の枠線を含む外接矩形で切出した後、
垂直及び水平方向の射影をもとに文字を切出すことによ
り、正確に切出すことができる。
とに文字切出しを行うため任意の枠に対応し、個々の枠
に対して上下左右の枠線を含む外接矩形で切出した後、
垂直及び水平方向の射影をもとに文字を切出すことによ
り、正確に切出すことができる。
請求項(2)では、上下左右の枠線探索範囲を求め、こ
の範囲内で枠線の除去を行うことにより、枠線への接触
文字に対しての射影による切出しの際の文字の切落しを
、最小限にとどめることができる。
の範囲内で枠線の除去を行うことにより、枠線への接触
文字に対しての射影による切出しの際の文字の切落しを
、最小限にとどめることができる。
請求項(3)では、枠線の除去を行った後に得られる上
下左右に余白を含む画像から文字を切出す際に、一定斌
未満の画素はノイズと判断することにより、目的とする
文字を確実に切出すことができる。
下左右に余白を含む画像から文字を切出す際に、一定斌
未満の画素はノイズと判断することにより、目的とする
文字を確実に切出すことができる。
以下、本発明の一実施例について図面により説明する。
第1図は本発明の文字切出し方法を実現する処理装置の
概略ブロック図である。画像入力装置11はスキャナな
どからなり、枠内に文字の書かれた帳票類を読み取る。
概略ブロック図である。画像入力装置11はスキャナな
どからなり、枠内に文字の書かれた帳票類を読み取る。
該画像入力装置11で読み取られたディジタル画像情報
は入力画像メモリ13に格納される。CPU (中央処
理装置)12は。
は入力画像メモリ13に格納される。CPU (中央処
理装置)12は。
入力画像メモリ13の画像情報について枠線認識を行い
、枠線を含む文字画像を切出してワーキングメモリ14
に格納し、枠線や余白部を除去して文字を切出す。
、枠線を含む文字画像を切出してワーキングメモリ14
に格納し、枠線や余白部を除去して文字を切出す。
第2図はCPU12での文字切出し処理のフローチャー
トを示したもので、以下、これに沿って本発明の文字切
出し方法の一実施例について詳述する。
トを示したもので、以下、これに沿って本発明の文字切
出し方法の一実施例について詳述する。
入力画像メモリ13に格納された帳票類の入力画像情報
に対し、文字切出しの前処理として枠線認識を行って個
々の枠座標を求める(ステップ10f)。枠線の認識に
は種々の方法が提案されており、そのいずれの方法を用
いてもよい。この枠線認識により得られた枠座標から、
上下左右の枠線を含む一つの外接矩形を切出してワーキ
ングメモリ14に格納し、以下の順序で文字を切出す。
に対し、文字切出しの前処理として枠線認識を行って個
々の枠座標を求める(ステップ10f)。枠線の認識に
は種々の方法が提案されており、そのいずれの方法を用
いてもよい。この枠線認識により得られた枠座標から、
上下左右の枠線を含む一つの外接矩形を切出してワーキ
ングメモリ14に格納し、以下の順序で文字を切出す。
まず、切出された外接矩形について枠線探索範囲を求め
る(ステップ102)。第3図は枠線認識によって得ら
れた外接矩形と枠線探索範囲の関係を示したものである
。枠線探索範囲とは枠線の存在する範囲であり、次の枠
線除去位置を決定するのに用いられるもので、第3図に
示すように、上部、下部、左側、右側の4つからなる。
る(ステップ102)。第3図は枠線認識によって得ら
れた外接矩形と枠線探索範囲の関係を示したものである
。枠線探索範囲とは枠線の存在する範囲であり、次の枠
線除去位置を決定するのに用いられるもので、第3図に
示すように、上部、下部、左側、右側の4つからなる。
これらの範囲は、枠金体に対しての個々の枠の位置によ
り、幾何学的な計算式によって決定される。
り、幾何学的な計算式によって決定される。
次に、切出された外接矩形から、あらかじめ定めた枠線
除去位置の決定条件により、上部・下部枠線除去位置を
決定し、上下の枠線を除去する(ステップ103)。そ
の後、同じく枠線除去位置の決定条件により、左側・右
側枠線除去位置を決定し、左右の枠線を除去する(ステ
ップ104)。
除去位置の決定条件により、上部・下部枠線除去位置を
決定し、上下の枠線を除去する(ステップ103)。そ
の後、同じく枠線除去位置の決定条件により、左側・右
側枠線除去位置を決定し、左右の枠線を除去する(ステ
ップ104)。
この枠線除去位置の決定では、ステップ102で得た枠
線探索範囲内で射影最大値を求めた後。
線探索範囲内で射影最大値を求めた後。
その位置から枠線の中心方向へ向って同範囲内で枠線除
去位置決定のため探索を開始する。この場合、次の2つ
の条件を満すことが必要である。
去位置決定のため探索を開始する。この場合、次の2つ
の条件を満すことが必要である。
(1)現在の射影値が射影最大値を基準としたある一定
値未満 (2)次の射影値が現在の射影値以上 現在位置がこの条件を満たすとき、現在位置を枠線除去
位置とする。
値未満 (2)次の射影値が現在の射影値以上 現在位置がこの条件を満たすとき、現在位置を枠線除去
位置とする。
もし、上記の2つの条件を満たさない場合は、枠線探索
範囲の最も内側の位置を枠線除去位置とする。
範囲の最も内側の位置を枠線除去位置とする。
上記枠線除去位置の決定条件を図示すると第4図のよう
になる。ここで、(a)は(])の場合。
になる。ここで、(a)は(])の場合。
即ち、現在の射影〈射影最大値を基準とした一定値の場
合、(b)は(2)の場合、即ち、次の射影≧現在の射
影の場合であり、これらを満足すれば、現在の射影を枠
線除去位置とする。(Q)は、(1)および(2)のい
ずれの条件も満たさない場合であり、この場合は枠線探
索範囲の最も内側の位置を枠線除去位置とする。
合、(b)は(2)の場合、即ち、次の射影≧現在の射
影の場合であり、これらを満足すれば、現在の射影を枠
線除去位置とする。(Q)は、(1)および(2)のい
ずれの条件も満たさない場合であり、この場合は枠線探
索範囲の最も内側の位置を枠線除去位置とする。
第3図の例について、上下の枠線を除去した後の画像を
示すと第5図のようになり、左右の枠線を除去した後の
画像を示すと第6図のようになる。
示すと第5図のようになり、左右の枠線を除去した後の
画像を示すと第6図のようになる。
次に、上下左右の枠線を除去して得られた、上下左右に
余白を含む画像に対し、あらかじめ定めた文字切出し位
置の決定条件により、左右の余白を除去し、文字のX方
向(水平方向)の開始位置・終了位置を決定する(ステ
ップ105)。その後、同じく文字切出し位置の決定条
件により、上下の余白を除去し、Y方向(垂直方向)開
始位置・終了位置を決定しくステップ106)、1文字
の切出しを終了する。
余白を含む画像に対し、あらかじめ定めた文字切出し位
置の決定条件により、左右の余白を除去し、文字のX方
向(水平方向)の開始位置・終了位置を決定する(ステ
ップ105)。その後、同じく文字切出し位置の決定条
件により、上下の余白を除去し、Y方向(垂直方向)開
始位置・終了位置を決定しくステップ106)、1文字
の切出しを終了する。
上下左右に余白を含む画像から、画像の端から中心方向
へ向って文字を切出す位置の決定を行う際、その判定条
件としては、次の(1)を必要条件とし、(2) (3
)のいずれかを満たすものとする。
へ向って文字を切出す位置の決定を行う際、その判定条
件としては、次の(1)を必要条件とし、(2) (3
)のいずれかを満たすものとする。
(1)現在位置以降の連続射影の面積が最小射影面積以
上 (2)現在位置以降、最小射影長以上の射影が最小射影
長以上連続して存在 (3)現在位置以降のある特定位置の射影が最小射影長
以上 現在位置が、これらの条件を満たすとき、現在位置を文
字切出し位置とする。第7図は上記文字切出し位置の決
定条件を図示したもので、(a)は(1)の場合、(b
)は(2)の場合、(c)は(3)の場合にそれぞれ対
応する。
上 (2)現在位置以降、最小射影長以上の射影が最小射影
長以上連続して存在 (3)現在位置以降のある特定位置の射影が最小射影長
以上 現在位置が、これらの条件を満たすとき、現在位置を文
字切出し位置とする。第7図は上記文字切出し位置の決
定条件を図示したもので、(a)は(1)の場合、(b
)は(2)の場合、(c)は(3)の場合にそれぞれ対
応する。
第6図の枠線の除去後の画像について、左右の余白部を
除去すると第8図のようになり、これの上下の余白部を
除去すると第9図のようになり、1文字の切出しが終了
する。
除去すると第8図のようになり、これの上下の余白部を
除去すると第9図のようになり、1文字の切出しが終了
する。
以上の説明から明らかな如く、本発明によれば、任意の
枠に対して枠線認識により得られた枠座標をもとに、個
々の枠に対して上下左右の枠線を含む外接矩形を切出し
た後、垂直及び水平方向の射影をもとに文字を切出すこ
とにより、汎用性に優れた、より正確な文字切出しを行
うことができる。
枠に対して枠線認識により得られた枠座標をもとに、個
々の枠に対して上下左右の枠線を含む外接矩形を切出し
た後、垂直及び水平方向の射影をもとに文字を切出すこ
とにより、汎用性に優れた、より正確な文字切出しを行
うことができる。
また、切出された外接矩形について、上下左右の枠線探
索範囲を求め、この範囲内で枠線の除去を行うことによ
り、文字の切落しを最小限にとどめることができ、さら
には、枠線の除去を行った後に得られる上下左右の余白
を除去することにより、ノイズの除かれた目的とする文
字を確実に切出すことが可能になる。
索範囲を求め、この範囲内で枠線の除去を行うことによ
り、文字の切落しを最小限にとどめることができ、さら
には、枠線の除去を行った後に得られる上下左右の余白
を除去することにより、ノイズの除かれた目的とする文
字を確実に切出すことが可能になる。
第1図は本発明の文字切出し方法を実施する処理装置の
概略ブロック図、第2図は本発明による文字切出し方法
の一実施例のフローチャート、第3図は外接矩形と枠線
探索範囲の関係を示す図、第4図は枠線除去位置の決定
条件を示す図、第5図及び第6図は枠線除去後の画像を
示す図、第7図は文字切出し位置の決定条件を示す図、
第8図及び第9図は余白除去後の画像を示す図である。 11・・・画像入力装置、 12・・・CPU。 13・・・入力画像メモリ、 14・・・ワーキングメモリ。 第8区 第9図
概略ブロック図、第2図は本発明による文字切出し方法
の一実施例のフローチャート、第3図は外接矩形と枠線
探索範囲の関係を示す図、第4図は枠線除去位置の決定
条件を示す図、第5図及び第6図は枠線除去後の画像を
示す図、第7図は文字切出し位置の決定条件を示す図、
第8図及び第9図は余白除去後の画像を示す図である。 11・・・画像入力装置、 12・・・CPU。 13・・・入力画像メモリ、 14・・・ワーキングメモリ。 第8区 第9図
Claims (3)
- (1)任意の枠の中に文字が書かれた画像から文字を切
り出す方法において、枠線認識により枠座標を求め、該
枠座標から得られる個々の枠に対して上下左右の枠線を
含む外接矩形を切出した後、垂直及び水平方向の射影を
もとに文字を切出すことを特徴とする文字切出し方法。 - (2)上下左右の枠線を含む外接矩形での枠線の存在範
囲を求め、この範囲内で外接矩形から枠線の除去を行う
ことを特徴とする請求項(1)記載の文字切出し方法。 - (3)上記外接矩形からの枠線の除去を行った後に得ら
れる上下左右に余白を含む画像に対し、水平または垂直
方向の射影を求め、端から中心方向へ向って、文字を切
出す位置を決定することを特徴とする請求項(2)記載
の文字切出し方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1250092A JPH03111982A (ja) | 1989-09-26 | 1989-09-26 | 文字切出し方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1250092A JPH03111982A (ja) | 1989-09-26 | 1989-09-26 | 文字切出し方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH03111982A true JPH03111982A (ja) | 1991-05-13 |
Family
ID=17202698
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1250092A Pending JPH03111982A (ja) | 1989-09-26 | 1989-09-26 | 文字切出し方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH03111982A (ja) |
-
1989
- 1989-09-26 JP JP1250092A patent/JPH03111982A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3580670B2 (ja) | 入力画像を基準画像に対応付ける方法、そのための装置、及びその方法を実現するプログラムを記憶した記憶媒体 | |
| JP2812982B2 (ja) | 表認識方法 | |
| JP2761467B2 (ja) | 画像切り出し装置及び文字認識装置 | |
| JP3378439B2 (ja) | 帳票画像作成装置 | |
| JP2868134B2 (ja) | 画像処理方法及び装置 | |
| JPH03111982A (ja) | 文字切出し方法 | |
| JP3311551B2 (ja) | イメージデータ入力処理方法およびその装置 | |
| JP3095470B2 (ja) | 文字認識装置 | |
| JP2003069807A (ja) | 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム | |
| JPH03160582A (ja) | 文書画像データに於ける罫線と文字の分離方法 | |
| JP4439054B2 (ja) | 文字認識装置及び文字枠線の検出方法 | |
| JP7310151B2 (ja) | マーク選定装置および画像処理装置 | |
| JPH05128305A (ja) | 領域分割方法 | |
| JP2004088499A (ja) | 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム | |
| JPH06215181A (ja) | 文字・文字列切り出し方法および文字認識装置 | |
| JPH07120392B2 (ja) | 文字パターン切り出し装置 | |
| JPH05303625A (ja) | 道路上の白線抽出装置 | |
| JP3220481B2 (ja) | 原稿の空白領域抽出方法 | |
| JP2954218B2 (ja) | 画像処理方法及び装置 | |
| US20050254728A1 (en) | Automatic cutting method for digital images | |
| JP3381803B2 (ja) | 傾き角検出装置 | |
| JP2931041B2 (ja) | 表内文字認識方法 | |
| CN120932244A (zh) | 图像校正方法及装置 | |
| JPH04154368A (ja) | 文書画像の領域分割方式 | |
| JP2004274704A (ja) | 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム |