JPH0660221A

JPH0660221A - 文書画像の領域抽出方法

Info

Publication number: JPH0660221A
Application number: JP4211661A
Authority: JP
Inventors: Naohiro Amamoto; 直弘天本; Akitoshi Tsukamoto; 明利塚本; Sadamasa Hirogaki; 節正広垣
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1992-08-07
Filing date: 1992-08-07
Publication date: 1994-03-04

Abstract

(57)【要約】【目的】新聞等の文書画像に対して適切な統合閾値を
設定し、本文文字領域とそれ以外の文字領域とを的確に
統合する。【構成】領域画像作成処理１で作成された領域画像Ｓ
１に対し、ラベル画像作成処理２によってラベル画像Ｓ
２を作成する。文字判定処理３では、文書画像における
特定の文字とそれ以外の文字とを判別し、文字画像作成
処理４において特定の文字に対しては第１の文字画像Ｓ
４ａを作成し、それ以外の文字に対しては第２の文字画
像Ｓ４ｂを作成する。統合閾値設定処理５では、第１の
文字画像Ｓ４ａから統合閾値Ｓ５を求める。これによ
り、適切な統合閾値が得られる。領域抽出処理６では、
統合閾値Ｓ５を用い、第１と第２の文字画像Ｓ４ａ，Ｓ
４ｂに対して別々に統合処理を行う。これにより、新聞
等の文書画像の領域抽出が的確に行える。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、ファクシミリ等の通信
機器や文書画像データベース入力装置、光学的文字読取
り装置（ＯＣＲ）等において、新聞等の文書画像をその
構成要素の領域に抽出する文書画像の領域抽出方法に関
するものである。

【０００２】

【従来の技術】従来、この種の文書画像の領域抽出方法
には、例えば、特開昭６２−７１３７９号公報に記載さ
れるものがあった。この文献に記載された文書画像の領
域抽出方法では、文書画像データを入力し、走査方向
（例えば、横方向）に黒画素を計数して閾値を越えるラ
インを検出し、該計数値が閾値以下の白ラインが所定個
数連続する状態を判定して第１の領域切り出しを行う。
この第１の領域切り出し内で、副走査方向（例えば、縦
方向）に黒画素を計数して該計数値が閾値を越える列を
検出し、該計数値が閾値以下の白列が所定個数連続する
状態を判定して第２の領域切り出しを行う。

【０００３】さらに、第２の領域切り出し内で、第１の
領域切り出しと同様な処理により、第３の領域切り出し
を行い、この第３の領域切り出し内で、第２の領域切り
出しと同様な処理により、第４の領域切り出しを行う。
そこで、この第４の領域切り出しで検出された領域につ
いて、その領域のランレングス情報、及び黒画素率情報
により、文字部、写真部、及び図表部の領域の属性を判
別している。

【０００４】

【発明が解決しようとする課題】しかしながら、上記構
成の文書画像の領域抽出方法では、次のような課題があ
った。（ａ）従来の方法では、領域を分割して抽出する際に、
その分割対象に応じて様々な閾値を任意に設定する必要
があった。例えば、個々の論文誌に対して領域分割処理
を施す場合、それらの閾値を各論文誌に応じた適切な値
に設定し直さなければならず、その値の選定に手間がか
かるという問題があった。（ｂ）前記（ａ）の問題を解決するため、本願出願人
は、先に特願平３−５２８４６号明細書（提案１）、及
び特願平３−１９５４３７号明細書（提案２）におい
て、領域抽出方法の提案を行った。

【０００５】提案１では、先ず、入力された白黒２値画
像データと同サイズの全面黒の多値の領域画像を作成す
る。次に、原画像を横及び縦方向に走査し、各々の方向
で閾値Ｔ１，Ｔ２以上の白ランが存在すれば、領域画像
においてその白ランに対応する部分を白にして、文書画
像の構成要素を黒画素連結領域として表現する。この領
域画像の黒の部分に対してラベル付けを行い、領域画像
の各黒連結領域に一意に番号を与えてラベル画像を作成
し、このラベル画像を用いて領域分割を行うというもの
であった。ところが、この方法では、文字領域が行単位
もしくは文字単位といった小さな領域でしか表現するこ
とができず、文字認識を行う際に文書の構成や、文章の
つながり等を知ることが困難である。そこで、この欠点
を除去するため、提案２では、前記領域分割を行った
後、文字領域について白ラン幅ヒストグラムから統合閾
値を設定し、その統合閾値を用いて統合を行うことによ
り、領域の抽出を行うようにしている。しかし、領域の
抽出対象となる文書画像が例えば新聞のような場合、図
２（ａ），（ｂ）のような問題が生じる。

【０００６】図２（ａ），（ｂ）は、先の提案２の問題
点の説明図である。図２（ａ）に示すように、新聞のよ
うな見出し文字Ａ及び本文文字Ｂ等を含む文書画像で
は、行間が狭く、段組の間隔が狭いが、このような文書
に対しては適切な統合閾値が得られない。また、図２
（ｂ）の破線で囲まれた領域Ｃのように、違う段落どう
し、あるいは本文文字Ｂの領域とそれ以外の見出し文字
Ａ等の文字領域とを誤って統合してしまうという問題が
生じ、未だ技術的に充分満足のゆく領域抽出方法が得ら
れなかった。本発明は、前記従来技術が持っていた課題
として、新聞等のような文書に対しては適切な統合閾値
が得られない点、及び本文文字領域とそれ以外の文字領
域とを誤って統合してしまうという点について解決し
た、新聞等の文書画像の領域抽出方法を提供するもので
ある。

【０００７】

【課題を解決するための手段】第１の発明は、前記課題
を解決するために、全面黒の領域画像と原画像から文書
画像の構成要素を黒画素連結領域として表現した領域画
像を作成する領域画像作成処理と、前記領域画像の構成
要素に一意に番号を与えたラベル画像を作成するラベル
画像作成処理とを施し、前記ラベル画像を用いて前記文
書画像の領域抽出を行う文書画像の領域抽出方法におい
て、前記ラベル画像から、文字の大きさによって特定の
文字とそれ以外の文字とを判別する文字判定処理を行
う。そして、文字画像作成処理において、前記特定の文
字について前記ラベル画像から文字領域以外の領域を全
て白にした第１の文字画像を作成すると共に、前記特定
の文字以外の文字について前記ラベル画像から文字領域
以外の領域を全て白にした第２の文字画像を作成する。
その後、前記第１の文字画像を走査して統合閾値を設定
する統合閾値設定処理と、前記統合閾値を用い、前記第
１と第２の文字画像に対して別々に領域抽出を行う領域
抽出処理とを、実行して新聞等の文書画像の領域抽出を
行うようにしている。第２の発明は、第１の発明の領域
抽出処理において、第２の文字画像の領域抽出では統合
閾値を変更して領域抽出を行うようにしている。

【０００８】

【作用】第１の発明によれば、以上のように文書画像の
領域抽出方法を構成したので、ラベル画像作成処理によ
って作成されたラベル画像を用いて文書画像を作成する
際、文字判定処理において文字の大きさによって特定の
文字とそれ以外の文字とを判別する。文字画像作成処理
では、特定の文字で構成される第１の文字画像を作成す
ると共に、特定の文字以外の文字で構成される第２の文
字画像を作成する。統合閾値設定処理では、第１の文字
画像から統合閾値を設定し、その統合閾値を用いて領域
抽出処理により、第１の文字画像と第２の文字画像に対
して別々に統合処理を行って新聞等の文書画像の領域抽
出を行う。第２の発明によれば、第２の文字画像の領域
抽出では、異なる統合閾値によって領域抽出が行われる
ので、文書画像の構成に対応した領域抽出が行える。従
って、前記課題を解決できるのである。

【０００９】

【実施例】本発明の実施例を示す領域抽出方法の処理全
体説明（Ｉ）と、その各処理内容（II）とを、図１、図
３〜図５を参照しつつ、以下説明する。

【００１０】（Ｉ）領域抽出方法の処理全体説明（図１、図３）図１は領域抽出方法の全体の処理内容図、及び図３
（ａ），（ｂ）は図１における文字画像（例えば、新
聞）の例を示す図である。図１に示すように、先ず、領
域画像作成処理１により、全面黒の領域画像と原画像か
ら文書画像の構成要素を黒画素連結領域として表現した
領域画像Ｓ１を作成し、ラベル画像作成処理２により、
該領域画像Ｓ１の構成要素に一意に番号を与えたラベル
画像Ｓ２を作成する。

【００１１】次に、文字判定処理３で、例えば新聞の本
文を構成する文字とそれ以外の文字とを分類し、その分
類結果を文字画像作成処理４へ送る。一般の新聞では、
本文を構成する文字の大きさがほぼ一定であり、また見
出し文字等に使用される文字が本文を構成する文字に比
べて明らかに大きい。そのため、文字判定処理３では、
例えば文字の大きさで、本文を構成する文字とそれ以外
の文字を容易に判定できる。文字画像作成処理４では、
本文を構成する文字についてラベル画像Ｓ２から文字領
域以外の領域を全て白にした第１の文字画像Ｓ４ａを作
成すると共に、本文を構成する文字以外の文字について
ラベル画像Ｓ２から文字領域以外の領域を全て白にした
第２の文字画像Ｓ４ｂを作成し、該第１の文字画像Ｓ４
ａを統合閾値設定処理５へ送る。

【００１２】統合閾値設定処理５では、第１の文字画像
Ｓ４ａを走査し、統合閾値Ｓ５を設定する。例えば、図
３（ａ）のような文字画像の場合、先の提案２と同様の
統合閾値設定操作を行う。先の提案２では、図３
（ａ），（ｂ）の両方の要素が混在した文字画像につい
てこの統合閾値設定処理を行っていたのに対し、本実施
例では、図３（ａ）のような文字画像に対してのみ統合
閾値設定処理５を行うため、より確実に、適切な統合閾
値Ｓ５を得ることができる。その後、領域抽出処理６で
は、統合閾値Ｓ５を用いて第１と第２の文字画像Ｓ４
ａ，Ｓ４ｂの各々について領域抽出を行う。この領域抽
出処理６では、例えば図３（ａ），（ｂ）のような文字
画像に対してそれぞれ別々に、先の提案２と同様の領域
抽出処理を行う。但し、図３（ｂ）のような文字画像に
ついては、ブロックの間隔が広いため、統合閾値設定処
理５で設定した統合閾値Ｓ５の例えばｎ倍（ｎ；実数）
の値を統合閾値として領域の抽出を行うことが望まし
い。

【００１３】（II）前記（Ｉ）の各処理内容（II）（１）統合閾値設定処理５（図４）図４は、図１中の統合閾値設定処理５の処理内容図であ
る。図４において、先ず、図１中の文字画像作成処理４
により作成された第１の文字画像Ｓ４ａのデータ５１を
横方向に走査し、最長白ラン分布抽出処理５２により、
横方向の白ラン分布を抽出する。縦方向も同様な操作を
行う。次に、白ラン幅ヒストグラム作成処理５３によ
り、白ラン分布から横及び縦方向のヒストグラムを作成
する。そして、白ラン幅検出処理５４により、このヒス
トグラムの最大値を与える連続する白ラン幅を求めた
後、統合閾値決定処理５５により、横及び縦方向の統合
閾値からなる統合閾値Ｓ５を設定する。

【００１４】（II）（２）領域抽出処理６（図５）図５は、図１中の領域抽出処理６の内容を示す図であ
る。先ず、第１と第２の文字画像Ｓ４ａ，Ｓ４ｂに対し
てそれぞれ横分割処理６１で１回目の横分割を行い、以
降は縦分割処理６２と横分割処理６４とを交互に行う。
判定処理６３，６５で、第１と第２の文字画像Ｓ４ａ，
Ｓ４ｂに対し横分割によって得られた第１のブロック数
と、縦分割によって得られた第２のブロック数との一致
／不一致の判定を行い、縦分割のブロック数と横分割の
ブロック数が等しくなった時点で、第１と第２の文字画
像Ｓ４ａ，Ｓ４ｂに対するそれぞれの領域抽出処理を終
了する。

【００１５】以上のように、本実施例では、図１の文字
判定処理３で、例えば新聞の本文を構成する文字とそれ
以外の文字とに分類し、本文を構成する文字から作成し
た第１の文字画像Ｓ４ａに対して統合閾値設定処理５で
統合閾値Ｓ５の設定を行うため、適切な統合閾値を得る
ことができる。しかも、領域抽出処理６において、２種
類の文字から作成した第１と第２の文字画像Ｓ４ａ，Ｓ
４ｂに対して別々に領域の抽出を行うため、先の提案２
では本文文字領域とそれ以外の文字領域とを誤って統合
するおそれがあったのに対し、本実施例の方法では正し
く統合が行える。なお、本発明は上記実施例に限定され
ず、種々の変形が可能である。例えば、図５の領域抽出
処理６において、縦分割処理６２を行った後に横分割処
理６１を行い、その後、その処理を交互に繰り返すよう
にしたり、あるいは図５以外の方法で領域抽出処理６を
行ったり、さらに図４以外の方法で統合閾値設定処理５
を行うようにしてもよい。また、本実施例の領域抽出方
法は、新聞以外の一般の文書画像についても適用が可能
である。

【００１６】

【発明の効果】以上詳細に説明したように、第１の発明
によれば、文書画像における特定の文字とそれ以外の文
字とを文字判定処理で判別し、文書画像作成処理によっ
て特定の文字から作成した第１の文字画像に対して統合
閾値設定処理で統合閾値の設定を行うため、適切な統合
閾値を得ることができる。しかも、特定の文字とそれ以
外の文字との２種類の文字から作成した第１と第２の文
字画像に対して領域抽出処理で別々に領域抽出を行うた
め、第１の文字領域と第２の文字領域とを誤って統合す
ることがなく、正しく統合が行える。第２の発明によれ
ば、第２の文字画像の領域抽出では、第１の文字画像の
領域抽出に用いた統合閾値とは異なる値を用いることに
より、ブロックの間隔が広い新聞等の文書画像に対して
的確な領域の抽出が可能となる。

【図面の簡単な説明】

【図１】本発明の実施例を示す文書画像の領域抽出方法
の処理内容図である。

【図２】先の提案２の問題点の説明図である。

【図３】図１の文字画像の例を示す図である。

【図４】図１中の統合閾値設定処理５の処理内容を示す
図である。

【図５】図１中の領域抽出処理６の処理内容を示す図で
ある。

【符号の説明】

１領域画像作成処理２ラベル画像作成処理３文字判定処理４文字画像作成処理５統合閾値設定処理６領域抽出処理Ｓ１領域画像Ｓ２ラベル画像Ｓ４ａ，Ｓ４ｂ第１，第２の文字画像Ｓ５統合閾値

Claims

【特許請求の範囲】

【請求項１】全面黒の領域画像と原画像から文書画像
の構成要素を黒画素連結領域として表現した領域画像を
作成する領域画像作成処理と、前記領域画像の構成要素
に一意に番号を与えたラベル画像を作成するラベル画像
作成処理とを施し、前記ラベル画像を用いて前記文書画
像の領域抽出を行う文書画像の領域抽出方法において、前記ラベル画像から、文字の大きさによって特定の文字
とそれ以外の文字とを判別する文字判定処理と、前記特定の文字について前記ラベル画像から文字領域以
外の領域を全て白にした第１の文字画像を作成すると共
に、前記特定の文字以外の文字について前記ラベル画像
から文字領域以外の領域を全て白にした第２の文字画像
を作成する文字画像作成処理と、前記第１の文字画像を走査して統合閾値を設定する統合
閾値設定処理と、前記統合閾値を用い、前記第１と第２の文字画像に対し
て別々に領域抽出を行う領域抽出処理とを、実行して前記文書画像の領域抽出を行うことを特徴とす
る文書画像の領域抽出方法。
【請求項２】前記領域抽出処理において、前記第２の
文字画像の領域抽出では統合閾値を変更して領域抽出を
行うことを特徴とする請求項１記載の文書画像の領域抽
出方法。