JPH0660221A - 文書画像の領域抽出方法 - Google Patents

文書画像の領域抽出方法

Info

Publication number
JPH0660221A
JPH0660221A JP4211661A JP21166192A JPH0660221A JP H0660221 A JPH0660221 A JP H0660221A JP 4211661 A JP4211661 A JP 4211661A JP 21166192 A JP21166192 A JP 21166192A JP H0660221 A JPH0660221 A JP H0660221A
Authority
JP
Japan
Prior art keywords
image
character
area
processing
integrated threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4211661A
Other languages
English (en)
Inventor
Naohiro Amamoto
直弘 天本
Akitoshi Tsukamoto
明利 塚本
Sadamasa Hirogaki
節正 広垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP4211661A priority Critical patent/JPH0660221A/ja
Publication of JPH0660221A publication Critical patent/JPH0660221A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 新聞等の文書画像に対して適切な統合閾値を
設定し、本文文字領域とそれ以外の文字領域とを的確に
統合する。 【構成】 領域画像作成処理1で作成された領域画像S
1に対し、ラベル画像作成処理2によってラベル画像S
2を作成する。文字判定処理3では、文書画像における
特定の文字とそれ以外の文字とを判別し、文字画像作成
処理4において特定の文字に対しては第1の文字画像S
4aを作成し、それ以外の文字に対しては第2の文字画
像S4bを作成する。統合閾値設定処理5では、第1の
文字画像S4aから統合閾値S5を求める。これによ
り、適切な統合閾値が得られる。領域抽出処理6では、
統合閾値S5を用い、第1と第2の文字画像S4a,S
4bに対して別々に統合処理を行う。これにより、新聞
等の文書画像の領域抽出が的確に行える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ファクシミリ等の通信
機器や文書画像データベース入力装置、光学的文字読取
り装置(OCR)等において、新聞等の文書画像をその
構成要素の領域に抽出する文書画像の領域抽出方法に関
するものである。
【0002】
【従来の技術】従来、この種の文書画像の領域抽出方法
には、例えば、特開昭62−71379号公報に記載さ
れるものがあった。この文献に記載された文書画像の領
域抽出方法では、文書画像データを入力し、走査方向
(例えば、横方向)に黒画素を計数して閾値を越えるラ
インを検出し、該計数値が閾値以下の白ラインが所定個
数連続する状態を判定して第1の領域切り出しを行う。
この第1の領域切り出し内で、副走査方向(例えば、縦
方向)に黒画素を計数して該計数値が閾値を越える列を
検出し、該計数値が閾値以下の白列が所定個数連続する
状態を判定して第2の領域切り出しを行う。
【0003】さらに、第2の領域切り出し内で、第1の
領域切り出しと同様な処理により、第3の領域切り出し
を行い、この第3の領域切り出し内で、第2の領域切り
出しと同様な処理により、第4の領域切り出しを行う。
そこで、この第4の領域切り出しで検出された領域につ
いて、その領域のランレングス情報、及び黒画素率情報
により、文字部、写真部、及び図表部の領域の属性を判
別している。
【0004】
【発明が解決しようとする課題】しかしながら、上記構
成の文書画像の領域抽出方法では、次のような課題があ
った。 (a)従来の方法では、領域を分割して抽出する際に、
その分割対象に応じて様々な閾値を任意に設定する必要
があった。例えば、個々の論文誌に対して領域分割処理
を施す場合、それらの閾値を各論文誌に応じた適切な値
に設定し直さなければならず、その値の選定に手間がか
かるという問題があった。 (b)前記(a)の問題を解決するため、本願出願人
は、先に特願平3−52846号明細書(提案1)、及
び特願平3−195437号明細書(提案2)におい
て、領域抽出方法の提案を行った。
【0005】提案1では、先ず、入力された白黒2値画
像データと同サイズの全面黒の多値の領域画像を作成す
る。次に、原画像を横及び縦方向に走査し、各々の方向
で閾値T1,T2以上の白ランが存在すれば、領域画像
においてその白ランに対応する部分を白にして、文書画
像の構成要素を黒画素連結領域として表現する。この領
域画像の黒の部分に対してラベル付けを行い、領域画像
の各黒連結領域に一意に番号を与えてラベル画像を作成
し、このラベル画像を用いて領域分割を行うというもの
であった。ところが、この方法では、文字領域が行単位
もしくは文字単位といった小さな領域でしか表現するこ
とができず、文字認識を行う際に文書の構成や、文章の
つながり等を知ることが困難である。そこで、この欠点
を除去するため、提案2では、前記領域分割を行った
後、文字領域について白ラン幅ヒストグラムから統合閾
値を設定し、その統合閾値を用いて統合を行うことによ
り、領域の抽出を行うようにしている。しかし、領域の
抽出対象となる文書画像が例えば新聞のような場合、図
2(a),(b)のような問題が生じる。
【0006】図2(a),(b)は、先の提案2の問題
点の説明図である。図2(a)に示すように、新聞のよ
うな見出し文字A及び本文文字B等を含む文書画像で
は、行間が狭く、段組の間隔が狭いが、このような文書
に対しては適切な統合閾値が得られない。また、図2
(b)の破線で囲まれた領域Cのように、違う段落どう
し、あるいは本文文字Bの領域とそれ以外の見出し文字
A等の文字領域とを誤って統合してしまうという問題が
生じ、未だ技術的に充分満足のゆく領域抽出方法が得ら
れなかった。本発明は、前記従来技術が持っていた課題
として、新聞等のような文書に対しては適切な統合閾値
が得られない点、及び本文文字領域とそれ以外の文字領
域とを誤って統合してしまうという点について解決し
た、新聞等の文書画像の領域抽出方法を提供するもので
ある。
【0007】
【課題を解決するための手段】第1の発明は、前記課題
を解決するために、全面黒の領域画像と原画像から文書
画像の構成要素を黒画素連結領域として表現した領域画
像を作成する領域画像作成処理と、前記領域画像の構成
要素に一意に番号を与えたラベル画像を作成するラベル
画像作成処理とを施し、前記ラベル画像を用いて前記文
書画像の領域抽出を行う文書画像の領域抽出方法におい
て、前記ラベル画像から、文字の大きさによって特定の
文字とそれ以外の文字とを判別する文字判定処理を行
う。そして、文字画像作成処理において、前記特定の文
字について前記ラベル画像から文字領域以外の領域を全
て白にした第1の文字画像を作成すると共に、前記特定
の文字以外の文字について前記ラベル画像から文字領域
以外の領域を全て白にした第2の文字画像を作成する。
その後、前記第1の文字画像を走査して統合閾値を設定
する統合閾値設定処理と、前記統合閾値を用い、前記第
1と第2の文字画像に対して別々に領域抽出を行う領域
抽出処理とを、実行して新聞等の文書画像の領域抽出を
行うようにしている。第2の発明は、第1の発明の領域
抽出処理において、第2の文字画像の領域抽出では統合
閾値を変更して領域抽出を行うようにしている。
【0008】
【作用】第1の発明によれば、以上のように文書画像の
領域抽出方法を構成したので、ラベル画像作成処理によ
って作成されたラベル画像を用いて文書画像を作成する
際、文字判定処理において文字の大きさによって特定の
文字とそれ以外の文字とを判別する。文字画像作成処理
では、特定の文字で構成される第1の文字画像を作成す
ると共に、特定の文字以外の文字で構成される第2の文
字画像を作成する。統合閾値設定処理では、第1の文字
画像から統合閾値を設定し、その統合閾値を用いて領域
抽出処理により、第1の文字画像と第2の文字画像に対
して別々に統合処理を行って新聞等の文書画像の領域抽
出を行う。第2の発明によれば、第2の文字画像の領域
抽出では、異なる統合閾値によって領域抽出が行われる
ので、文書画像の構成に対応した領域抽出が行える。従
って、前記課題を解決できるのである。
【0009】
【実施例】本発明の実施例を示す領域抽出方法の処理全
体説明(I)と、その各処理内容(II)とを、図1、図
3〜図5を参照しつつ、以下説明する。
【0010】 (I) 領域抽出方法の処理全体説明(図1、図3) 図1は領域抽出方法の全体の処理内容図、及び図3
(a),(b)は図1における文字画像(例えば、新
聞)の例を示す図である。図1に示すように、先ず、領
域画像作成処理1により、全面黒の領域画像と原画像か
ら文書画像の構成要素を黒画素連結領域として表現した
領域画像S1を作成し、ラベル画像作成処理2により、
該領域画像S1の構成要素に一意に番号を与えたラベル
画像S2を作成する。
【0011】次に、文字判定処理3で、例えば新聞の本
文を構成する文字とそれ以外の文字とを分類し、その分
類結果を文字画像作成処理4へ送る。一般の新聞では、
本文を構成する文字の大きさがほぼ一定であり、また見
出し文字等に使用される文字が本文を構成する文字に比
べて明らかに大きい。そのため、文字判定処理3では、
例えば文字の大きさで、本文を構成する文字とそれ以外
の文字を容易に判定できる。文字画像作成処理4では、
本文を構成する文字についてラベル画像S2から文字領
域以外の領域を全て白にした第1の文字画像S4aを作
成すると共に、本文を構成する文字以外の文字について
ラベル画像S2から文字領域以外の領域を全て白にした
第2の文字画像S4bを作成し、該第1の文字画像S4
aを統合閾値設定処理5へ送る。
【0012】統合閾値設定処理5では、第1の文字画像
S4aを走査し、統合閾値S5を設定する。例えば、図
3(a)のような文字画像の場合、先の提案2と同様の
統合閾値設定操作を行う。先の提案2では、図3
(a),(b)の両方の要素が混在した文字画像につい
てこの統合閾値設定処理を行っていたのに対し、本実施
例では、図3(a)のような文字画像に対してのみ統合
閾値設定処理5を行うため、より確実に、適切な統合閾
値S5を得ることができる。その後、領域抽出処理6で
は、統合閾値S5を用いて第1と第2の文字画像S4
a,S4bの各々について領域抽出を行う。この領域抽
出処理6では、例えば図3(a),(b)のような文字
画像に対してそれぞれ別々に、先の提案2と同様の領域
抽出処理を行う。但し、図3(b)のような文字画像に
ついては、ブロックの間隔が広いため、統合閾値設定処
理5で設定した統合閾値S5の例えばn倍(n;実数)
の値を統合閾値として領域の抽出を行うことが望まし
い。
【0013】(II) 前記(I)の各処理内容 (II)(1) 統合閾値設定処理5(図4) 図4は、図1中の統合閾値設定処理5の処理内容図であ
る。図4において、先ず、図1中の文字画像作成処理4
により作成された第1の文字画像S4aのデータ51を
横方向に走査し、最長白ラン分布抽出処理52により、
横方向の白ラン分布を抽出する。縦方向も同様な操作を
行う。次に、白ラン幅ヒストグラム作成処理53によ
り、白ラン分布から横及び縦方向のヒストグラムを作成
する。そして、白ラン幅検出処理54により、このヒス
トグラムの最大値を与える連続する白ラン幅を求めた
後、統合閾値決定処理55により、横及び縦方向の統合
閾値からなる統合閾値S5を設定する。
【0014】(II)(2) 領域抽出処理6(図5) 図5は、図1中の領域抽出処理6の内容を示す図であ
る。先ず、第1と第2の文字画像S4a,S4bに対し
てそれぞれ横分割処理61で1回目の横分割を行い、以
降は縦分割処理62と横分割処理64とを交互に行う。
判定処理63,65で、第1と第2の文字画像S4a,
S4bに対し横分割によって得られた第1のブロック数
と、縦分割によって得られた第2のブロック数との一致
/不一致の判定を行い、縦分割のブロック数と横分割の
ブロック数が等しくなった時点で、第1と第2の文字画
像S4a,S4bに対するそれぞれの領域抽出処理を終
了する。
【0015】以上のように、本実施例では、図1の文字
判定処理3で、例えば新聞の本文を構成する文字とそれ
以外の文字とに分類し、本文を構成する文字から作成し
た第1の文字画像S4aに対して統合閾値設定処理5で
統合閾値S5の設定を行うため、適切な統合閾値を得る
ことができる。しかも、領域抽出処理6において、2種
類の文字から作成した第1と第2の文字画像S4a,S
4bに対して別々に領域の抽出を行うため、先の提案2
では本文文字領域とそれ以外の文字領域とを誤って統合
するおそれがあったのに対し、本実施例の方法では正し
く統合が行える。なお、本発明は上記実施例に限定され
ず、種々の変形が可能である。例えば、図5の領域抽出
処理6において、縦分割処理62を行った後に横分割処
理61を行い、その後、その処理を交互に繰り返すよう
にしたり、あるいは図5以外の方法で領域抽出処理6を
行ったり、さらに図4以外の方法で統合閾値設定処理5
を行うようにしてもよい。また、本実施例の領域抽出方
法は、新聞以外の一般の文書画像についても適用が可能
である。
【0016】
【発明の効果】以上詳細に説明したように、第1の発明
によれば、文書画像における特定の文字とそれ以外の文
字とを文字判定処理で判別し、文書画像作成処理によっ
て特定の文字から作成した第1の文字画像に対して統合
閾値設定処理で統合閾値の設定を行うため、適切な統合
閾値を得ることができる。しかも、特定の文字とそれ以
外の文字との2種類の文字から作成した第1と第2の文
字画像に対して領域抽出処理で別々に領域抽出を行うた
め、第1の文字領域と第2の文字領域とを誤って統合す
ることがなく、正しく統合が行える。第2の発明によれ
ば、第2の文字画像の領域抽出では、第1の文字画像の
領域抽出に用いた統合閾値とは異なる値を用いることに
より、ブロックの間隔が広い新聞等の文書画像に対して
的確な領域の抽出が可能となる。
【図面の簡単な説明】
【図1】本発明の実施例を示す文書画像の領域抽出方法
の処理内容図である。
【図2】先の提案2の問題点の説明図である。
【図3】図1の文字画像の例を示す図である。
【図4】図1中の統合閾値設定処理5の処理内容を示す
図である。
【図5】図1中の領域抽出処理6の処理内容を示す図で
ある。
【符号の説明】
1 領域画像作成処理 2 ラベル画像作成処理 3 文字判定処理 4 文字画像作成処理 5 統合閾値設定処理 6 領域抽出処理 S1 領域画像 S2 ラベル画像 S4a,S4b 第1,第2の文字画像 S5 統合閾値

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 全面黒の領域画像と原画像から文書画像
    の構成要素を黒画素連結領域として表現した領域画像を
    作成する領域画像作成処理と、前記領域画像の構成要素
    に一意に番号を与えたラベル画像を作成するラベル画像
    作成処理とを施し、前記ラベル画像を用いて前記文書画
    像の領域抽出を行う文書画像の領域抽出方法において、 前記ラベル画像から、文字の大きさによって特定の文字
    とそれ以外の文字とを判別する文字判定処理と、 前記特定の文字について前記ラベル画像から文字領域以
    外の領域を全て白にした第1の文字画像を作成すると共
    に、前記特定の文字以外の文字について前記ラベル画像
    から文字領域以外の領域を全て白にした第2の文字画像
    を作成する文字画像作成処理と、 前記第1の文字画像を走査して統合閾値を設定する統合
    閾値設定処理と、 前記統合閾値を用い、前記第1と第2の文字画像に対し
    て別々に領域抽出を行う領域抽出処理とを、 実行して前記文書画像の領域抽出を行うことを特徴とす
    る文書画像の領域抽出方法。
  2. 【請求項2】 前記領域抽出処理において、前記第2の
    文字画像の領域抽出では統合閾値を変更して領域抽出を
    行うことを特徴とする請求項1記載の文書画像の領域抽
    出方法。
JP4211661A 1992-08-07 1992-08-07 文書画像の領域抽出方法 Pending JPH0660221A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4211661A JPH0660221A (ja) 1992-08-07 1992-08-07 文書画像の領域抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4211661A JPH0660221A (ja) 1992-08-07 1992-08-07 文書画像の領域抽出方法

Publications (1)

Publication Number Publication Date
JPH0660221A true JPH0660221A (ja) 1994-03-04

Family

ID=16609502

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4211661A Pending JPH0660221A (ja) 1992-08-07 1992-08-07 文書画像の領域抽出方法

Country Status (1)

Country Link
JP (1) JPH0660221A (ja)

Similar Documents

Publication Publication Date Title
US6393150B1 (en) Region-based image binarization system
JP4655335B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US20030128396A1 (en) Image type classification using edge features
US5502777A (en) Method and apparatus for recognizing table and figure having many lateral and longitudinal lines
JPH05225378A (ja) 文書画像の領域分割システム
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
US6269186B1 (en) Image processing apparatus and method
US6289122B1 (en) Intelligent detection of text on a page
US6987879B1 (en) Method and system for extracting information from images in similar surrounding color
JPH0660221A (ja) 文書画像の領域抽出方法
JP4116377B2 (ja) 画像処理方法および画像処理装置
JPH03126181A (ja) 文書画像の領域分割方法
US6678427B1 (en) Document identification registration system
JPH0660220A (ja) 文書画像の領域抽出方法
JP2877548B2 (ja) 文書画像の属性判別方法
JP3020293B2 (ja) 属性判別方法
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JPH0540848A (ja) 文書画像の領域抽出方法
JPH0540849A (ja) 文書画像の領域抽出方法
JP2899356B2 (ja) 文字認識装置
JP2000148908A (ja) 文書画像処理方法、装置および記録媒体
JP2771045B2 (ja) 文書画像の領域分割方法
JPH0535914A (ja) 画像傾き検出方法
JP2001143076A (ja) 画像処理装置
JPH06187490A (ja) 領域分割方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19990518