JPH02253383A - 画像処理装置 - Google Patents
画像処理装置Info
- Publication number
- JPH02253383A JPH02253383A JP1075366A JP7536689A JPH02253383A JP H02253383 A JPH02253383 A JP H02253383A JP 1075366 A JP1075366 A JP 1075366A JP 7536689 A JP7536689 A JP 7536689A JP H02253383 A JPH02253383 A JP H02253383A
- Authority
- JP
- Japan
- Prior art keywords
- rectangular area
- noise
- image information
- extraction unit
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
新聞、雑誌等の不特定な書式の文書から文字列。
図表、写真、線分、ノイズの領域を抽出し、分類する画
像処理装置に関するものである。
像処理装置に関するものである。
従来の技術
文字1図形の混在する画像から、文字領域7図形領域を
切り分ける画像処理装置には、入力画像を表示しオペレ
ータがマウスなどを使用して指定するものと、オペレー
タの介在なくして自動的に行うものがある。オペレータ
の介在なくして自動的に行うものには、画像全体を文字
と図形に区別することなく所定のフォーマットに基づき
強制的に文字として1文字毎の小領域に切り出し、すで
に知られているパターン認識技術を用いて認識し、その
1文字毎の小領域の認識結果が文字として認識可能であ
るか否かを判定し、その判定結果を用いて1文字毎の小
領域どうしの連続性を調べて文字領域と図形領域を分類
していた(例えば、特開昭61−11888号公報)。
切り分ける画像処理装置には、入力画像を表示しオペレ
ータがマウスなどを使用して指定するものと、オペレー
タの介在なくして自動的に行うものがある。オペレータ
の介在なくして自動的に行うものには、画像全体を文字
と図形に区別することなく所定のフォーマットに基づき
強制的に文字として1文字毎の小領域に切り出し、すで
に知られているパターン認識技術を用いて認識し、その
1文字毎の小領域の認識結果が文字として認識可能であ
るか否かを判定し、その判定結果を用いて1文字毎の小
領域どうしの連続性を調べて文字領域と図形領域を分類
していた(例えば、特開昭61−11888号公報)。
発明が解決しようとする課題
しかしながら、上記のような従来の技術では、文字認識
処理のための文字領域と文字以外の領域の分類に主眼が
おかれており、画像内の文字以外の領域は図表、写真、
線分、ノイズの領域というように、細かく分類すること
ができないという欠点を有していた。
処理のための文字領域と文字以外の領域の分類に主眼が
おかれており、画像内の文字以外の領域は図表、写真、
線分、ノイズの領域というように、細かく分類すること
ができないという欠点を有していた。
本発明はかかる点に鑑みてなされたものであり、画像内
の文字列2図表、写真、線分、ノイズの領域を簡易な方
法で、自動的に抽出し分類する画像処理装置を提供する
ことを目的としている。
の文字列2図表、写真、線分、ノイズの領域を簡易な方
法で、自動的に抽出し分類する画像処理装置を提供する
ことを目的としている。
課題を解決するための手段
本発明は上記目的を達成するために、画像から文字列9
図表、写真、線分、ノイズの矩形領域を抽出する矩形領
域座標抽出部と、前記矩形領域座標抽出部で抽出した矩
形領域の特徴”を抽出する矩形領域特徴抽出部と、前記
矩形領域特徴抽出部から抽出した特徴を用いて、矩形領
域を文字列9図表、写真、線分、ノイズに分類する矩形
領域分類部を備えた画像処理装置である。
図表、写真、線分、ノイズの矩形領域を抽出する矩形領
域座標抽出部と、前記矩形領域座標抽出部で抽出した矩
形領域の特徴”を抽出する矩形領域特徴抽出部と、前記
矩形領域特徴抽出部から抽出した特徴を用いて、矩形領
域を文字列9図表、写真、線分、ノイズに分類する矩形
領域分類部を備えた画像処理装置である。
作 用
本発明は上記の構成により、画像から矩形領域座標抽出
部で矩形領域を抽出し、抽出した矩形領域に対し矩形領
域特徴抽出部で特徴を抽出し、抽出した特徴を矩形領域
分類部で文字列9図表、写真、線分、ノイズそれぞれに
あらかじめ用意した特徴と比較することにより、矩形領
域が文字列。
部で矩形領域を抽出し、抽出した矩形領域に対し矩形領
域特徴抽出部で特徴を抽出し、抽出した特徴を矩形領域
分類部で文字列9図表、写真、線分、ノイズそれぞれに
あらかじめ用意した特徴と比較することにより、矩形領
域が文字列。
図表、写真、線分、ノイズのいずれかに該当するかを判
定する。
定する。
実施例
以下、本発明の実施例について図面を参照しながら説明
する。
する。
第1図は、本発明による画像処理装置の一実施例の構成
図である。1は画像入力部であシ文字列。
図である。1は画像入力部であシ文字列。
図表、写真、線分、ノイズを含む画像を走査し、2値信
号で画像メモリ部2に格納する。3は矩形領域座標抽出
部であシ文字列1図表、写真、a分。
号で画像メモリ部2に格納する。3は矩形領域座標抽出
部であシ文字列1図表、写真、a分。
ノイズを囲む、最小の矩形領域座標を抽出する。
4は矩形領域特徴抽出部であり、矩形領域座標抽出部3
で抽出した文字列2図表、写真、線分、ノイズを囲む矩
形領域の特徴を抽出する。5は矩形領域分類部であり、
矩形領域特徴抽出部4で抽出分類する。
で抽出した文字列2図表、写真、線分、ノイズを囲む矩
形領域の特徴を抽出する。5は矩形領域分類部であり、
矩形領域特徴抽出部4で抽出分類する。
以上のように構成された画像処理装置について、第2図
に示す入力画像Pを例に説明する。
に示す入力画像Pを例に説明する。
画像入力部1から、入力された画像Pは文字列。
図表、写真、線分、ノイズ部の黒画素を1、背景部の白
画素を0の2値データで画像メモリ部2に蓄えられる。
画素を0の2値データで画像メモリ部2に蓄えられる。
矩形領域座標抽出部3では、画像メモリ部2に蓄えられ
ている入力画像Pを横方向に走査して黒画素間の距離が
あらかじめ定めたしきい値R1以下の場合、その黒画素
どうしは連結しているものとする。同様に画像メモリ部
2に蓄えられている入力画像Pを縦方向に走査して黒画
素間の距離があらかじめ定めたしきい値R2以下の場合
、その黒画素どうしは連結しているものとする。横方向
。
ている入力画像Pを横方向に走査して黒画素間の距離が
あらかじめ定めたしきい値R1以下の場合、その黒画素
どうしは連結しているものとする。同様に画像メモリ部
2に蓄えられている入力画像Pを縦方向に走査して黒画
素間の距離があらかじめ定めたしきい値R2以下の場合
、その黒画素どうしは連結しているものとする。横方向
。
縦方向に走査して得られた黒画素間の連結情報に着目し
文字列2図表、写真、線分、ノイズ部分のいずれかを囲
む最小の矩形領域の左上点座標(xmi、n yYmi
n ) r 右下点座標(xm& ! j Ym&
! )を抽出する。第3図に文字列の矩形領域を抽出し
た状態を座標を用いて示す。第4図に第2図の入力画像
Pから矩形領域座標抽出部3で抽出したすべての矩形領
域を示す。
文字列2図表、写真、線分、ノイズ部分のいずれかを囲
む最小の矩形領域の左上点座標(xmi、n yYmi
n ) r 右下点座標(xm& ! j Ym&
! )を抽出する。第3図に文字列の矩形領域を抽出し
た状態を座標を用いて示す。第4図に第2図の入力画像
Pから矩形領域座標抽出部3で抽出したすべての矩形領
域を示す。
矩形領域特徴抽出部4では、矩形領域座標抽出部3で抽
出した文字列9図表、写真、線分、ノイズの矩形領域座
標から、矩形領域の幅Wを式(1)によって求める。
出した文字列9図表、写真、線分、ノイズの矩形領域座
標から、矩形領域の幅Wを式(1)によって求める。
W=XmaニーXm1n+1 ・・・・・・・・
・・・・(1)同様に矩形領域座標から矩形領域の高さ
Hを式@)によって求める。
・・・・(1)同様に矩形領域座標から矩形領域の高さ
Hを式@)によって求める。
H=Y −Y +1 ・・・・・・・・
・・・・C2)maw min 矩形領域の幅Wと高さHから、矩形領域の文字列方向垂
直高さVを式(3)により、て求める。
・・・・C2)maw min 矩形領域の幅Wと高さHから、矩形領域の文字列方向垂
直高さVを式(3)により、て求める。
矩形領域の幅Wと高さHから、矩形領域サイズSを式(
イ)によって求める。
イ)によって求める。
S=wH・・・・・・・・・・・・←)矩形領域の幅W
と高さHから、矩形領域縦横比Eを式(5)によって求
める。
と高さHから、矩形領域縦横比Eを式(5)によって求
める。
矩形領域サイズSと矩形領域内の黒画素数Bから矩形領
域の黒画素密度りを式(6)によって求める。
域の黒画素密度りを式(6)によって求める。
D=丁 ・・・・・・・・・・・塵)矩形
領域分類部6では、−数的な文書の文字列。
領域分類部6では、−数的な文書の文字列。
図表、写真、線分、ノイズは矩形領域特徴抽出部4で抽
出した矩形領域の文字列方向垂直高さV。
出した矩形領域の文字列方向垂直高さV。
矩形領域サイズS、矩形領域縦横比E、矩形領域の黒画
素密度りが特定の性質を持つことを利用して分類を行う
。具体的には、矩形領域の文字列方向垂直高さVがあら
かじめ定めたしきい値vthr以上の場合、その矩形領
域は図表、または写真と分類され、Vがvthr未溝の
場合は文字列、線分。
素密度りが特定の性質を持つことを利用して分類を行う
。具体的には、矩形領域の文字列方向垂直高さVがあら
かじめ定めたしきい値vthr以上の場合、その矩形領
域は図表、または写真と分類され、Vがvthr未溝の
場合は文字列、線分。
ノイズのうちいずれかであると分類される。文字列、線
分、ノイズのうちいずれかであると分類された矩形領域
は、矩形領域サイズSがあらかじめ定めたしきい値8t
hr以上の場合は文字列、線分と分類され、Sが8th
r未満の場合は、ノイズであると分類される。文字列、
線分と分類された矩形領域は、矩形領域縦横比Eがあら
かじめ定めたしきい値Ethr以上の場合は、線分と分
類され、EがEthr未滴の場合は文字列と分類される
。図表または写真と分類された矩形領域は、矩形領域の
黒画素密度りがあらかじめ定めたしきい値Dthr以上
の場合は、写真と分類され、DがDthr未満の場合は
図表と分類される。第5図に矩形領域の分類条件の説明
図を示す。
分、ノイズのうちいずれかであると分類された矩形領域
は、矩形領域サイズSがあらかじめ定めたしきい値8t
hr以上の場合は文字列、線分と分類され、Sが8th
r未満の場合は、ノイズであると分類される。文字列、
線分と分類された矩形領域は、矩形領域縦横比Eがあら
かじめ定めたしきい値Ethr以上の場合は、線分と分
類され、EがEthr未滴の場合は文字列と分類される
。図表または写真と分類された矩形領域は、矩形領域の
黒画素密度りがあらかじめ定めたしきい値Dthr以上
の場合は、写真と分類され、DがDthr未満の場合は
図表と分類される。第5図に矩形領域の分類条件の説明
図を示す。
以上のように構成された画像処理装置では文字列2図表
、写真、線分、ノイズの混在する画像から文字列9図表
、写真、線分、ノイズを抽出し、分類することができる
。
、写真、線分、ノイズの混在する画像から文字列9図表
、写真、線分、ノイズを抽出し、分類することができる
。
尚、本実施例の画像処理装置を文字認識装置に接続する
ことにより、文字列と分類された矩形領域から文字を切
り出し、認識することができる。
ことにより、文字列と分類された矩形領域から文字を切
り出し、認識することができる。
発明の詳細
な説明したように、本発明によれば不特定な書式の文書
の入力画像から簡易な方法で自動的に文字列9図表、写
真、線分、ノイズの領域を抽出することができる。この
方法を使用して、文字列の領域はすでに知られている文
字認識技術によって1文字毎に切り出して認識し、図表
、写真、線分、ノイズの領域はそれぞれ固有の処理を行
うことによって入力画像をより柔軟に加工することがで
き、その実用的効果は大きい。
の入力画像から簡易な方法で自動的に文字列9図表、写
真、線分、ノイズの領域を抽出することができる。この
方法を使用して、文字列の領域はすでに知られている文
字認識技術によって1文字毎に切り出して認識し、図表
、写真、線分、ノイズの領域はそれぞれ固有の処理を行
うことによって入力画像をより柔軟に加工することがで
き、その実用的効果は大きい。
第1図は本発明における一実施例の画像処理装置の構成
図、第2図は入力画像の説明図、第3図は抽出した文字
列の矩形領域座標を示す説明図、第4図は第2図の入力
画像に対して抽出したすべての矩形領域を示す説明図、
第5図は矩形領域の分類条件を示す説明図である。 1・・・・・・画像入力部、2・・・・・・画像メモリ
部、3・・・・・・矩形領域座標抽出部、4・・・・・
・矩形領域特徴抽出部、6・・・・・・矩形領域分類部
、6・・・・・・文字列領域、7・・・・・・線分領域
、8・・・・・・写真領域、9・・・・・・図表領域、
P・・・・・・入力画像。 代理人の氏名 弁理士 粟 野 重 孝 ほか1名第1
図 / 第 図
図、第2図は入力画像の説明図、第3図は抽出した文字
列の矩形領域座標を示す説明図、第4図は第2図の入力
画像に対して抽出したすべての矩形領域を示す説明図、
第5図は矩形領域の分類条件を示す説明図である。 1・・・・・・画像入力部、2・・・・・・画像メモリ
部、3・・・・・・矩形領域座標抽出部、4・・・・・
・矩形領域特徴抽出部、6・・・・・・矩形領域分類部
、6・・・・・・文字列領域、7・・・・・・線分領域
、8・・・・・・写真領域、9・・・・・・図表領域、
P・・・・・・入力画像。 代理人の氏名 弁理士 粟 野 重 孝 ほか1名第1
図 / 第 図
Claims (1)
- 文字列、図表、写真、線分、ノイズのうち、少なくとも
2組の要素からなる画像情報を入力する画像情報入力部
と、前記画像情報入力部に入力された前記画像情報を格
納する画像情報メモリ部と、前記画像情報メモリ部に格
納された画像情報から文字列、図表、写真、線分、ノイ
ズの矩形領域を抽出する矩形領域座標抽出部と、前記矩
形領域座標抽出部で抽出した矩形領域の特徴を抽出する
矩形領域特徴抽出部と、前記矩形領域特徴抽出部で抽出
した特徴を用いて、矩形領域を文字列、図表、写真、線
分、ノイズに分類する矩形領域分類部を有することを特
徴とする画像処理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1075366A JP2939985B2 (ja) | 1989-03-27 | 1989-03-27 | 画像処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1075366A JP2939985B2 (ja) | 1989-03-27 | 1989-03-27 | 画像処理装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH02253383A true JPH02253383A (ja) | 1990-10-12 |
| JP2939985B2 JP2939985B2 (ja) | 1999-08-25 |
Family
ID=13574151
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1075366A Expired - Fee Related JP2939985B2 (ja) | 1989-03-27 | 1989-03-27 | 画像処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2939985B2 (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0728940A (ja) * | 1993-06-30 | 1995-01-31 | Internatl Business Mach Corp <Ibm> | 文書処理のためのイメージ・セグメント化およびイメージ要素分類の方法 |
| US5696843A (en) * | 1994-06-22 | 1997-12-09 | Sharp Kabushiki Kaisha | Automatic image quality controlling apparatus for use in an electronic copier |
| US5757957A (en) * | 1991-11-29 | 1998-05-26 | Ricoh Company, Ltd. | Apparatus and method for area separation for image, having improved separation accuracy |
| US6771842B1 (en) | 1998-05-28 | 2004-08-03 | Fujitsu Limited | Document image skew detection method |
-
1989
- 1989-03-27 JP JP1075366A patent/JP2939985B2/ja not_active Expired - Fee Related
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5757957A (en) * | 1991-11-29 | 1998-05-26 | Ricoh Company, Ltd. | Apparatus and method for area separation for image, having improved separation accuracy |
| JPH0728940A (ja) * | 1993-06-30 | 1995-01-31 | Internatl Business Mach Corp <Ibm> | 文書処理のためのイメージ・セグメント化およびイメージ要素分類の方法 |
| US5696843A (en) * | 1994-06-22 | 1997-12-09 | Sharp Kabushiki Kaisha | Automatic image quality controlling apparatus for use in an electronic copier |
| US6771842B1 (en) | 1998-05-28 | 2004-08-03 | Fujitsu Limited | Document image skew detection method |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2939985B2 (ja) | 1999-08-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110705534B (zh) | 一种适用于电子助视器的错题本生成方法 | |
| US6738154B1 (en) | Locating the position and orientation of multiple objects with a smart platen | |
| US7016536B1 (en) | Method and apparatus for automatic cleaning and enhancing of scanned documents | |
| US6574375B1 (en) | Method for detecting inverted text images on a digital scanning device | |
| US5854854A (en) | Skew detection and correction of a document image representation | |
| US5465304A (en) | Segmentation of text, picture and lines of a document image | |
| JP3338537B2 (ja) | 画像傾き検出装置 | |
| JP2940936B2 (ja) | 表領域識別方法 | |
| US6393150B1 (en) | Region-based image binarization system | |
| EP0472313B1 (en) | Image processing method and apparatus therefor | |
| EP0843277A2 (en) | Page analysis system | |
| US6351559B1 (en) | User-enclosed region extraction from scanned document images | |
| US20080144971A1 (en) | Model-based dewarping method and apparatus | |
| US20050047659A1 (en) | Image processing apparatus, image processing method and computer program | |
| CN100568263C (zh) | 布局分析设备和布局分析方法 | |
| US6289120B1 (en) | Method and system for processing images of forms which have irregular construction and/or determining whether characters are interior to a form | |
| Amamoto et al. | Block segmentation and text area extraction of vertically/horizontally written document | |
| JPH02253383A (ja) | 画像処理装置 | |
| JP3285686B2 (ja) | 領域分割方法 | |
| JPH08180068A (ja) | 電子ファイリング装置 | |
| JPH03126181A (ja) | 文書画像の領域分割方法 | |
| EP0975146A1 (en) | Locating the position and orientation of multiple objects with a smart platen | |
| JPS61193277A (ja) | 文書読取装置 | |
| JP3122476B2 (ja) | 自動文書清書装置 | |
| JPS5949671A (ja) | 光学的文字読取装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |