JPH04112282A

JPH04112282A - 単語領域抽出方式

Info

Publication number: JPH04112282A
Application number: JP2410749A
Authority: JP
Inventors: Hiroshi Nakayama; 寛中山
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1990-07-27
Filing date: 1990-12-14
Publication date: 1992-04-14

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

［０００１］

【産業上の利用分野】

本発明は、ハンディスキャナー装置によって読み込んだ
文書画像やデイスプレィ画面に表示された文書画像の部
分画像より、英単語のようなスペースで区切られた文字
列（単語と総称する）の領域を抽出する単語領域抽出方
式に関する。［０００２］

【従来の技術】

文字認識システムにおいて、ハンディスキャナー装置を
用いて原稿画像を入力する場合、読み取り領域が不適切
となって単語の切り出しく単語入力）を正しく行なうこ
とができないことがあった。それは従来のハンディスキ
ャナー装置が、そのような単語入力を前提としていなか
ったため、読み取り範囲を覗き窓から確認できるように
はなっていたが、原稿上の目的としている単語に対して
読み取り位置が適切であるか否かを簡単に確認するため
の手段を備えていなかったからである。［０００３］このような不都合を解決するため、原稿読み取り窓と原
稿上の単語の先頭及び行中心との相対的位置をそれぞれ
合わせるための二つのガイドライン（スタートラインと
センターライン）を有し、読み取り領域と単語の先頭及
び行中心との相対的位置がほぼ一定した読み取り画像を
得られるハンディスキャナー装置と、このガイドライン
付きハンディスキャナー装置によって読み込んだ画像よ
り、ガイドライン位置を利用して簡単な処理により単語
領域を抽出する単語領域抽出装置とを考案し、同一出願
人により「ハンディスキャナー装置及び単語領域抽出装
置」なる発明の名称にて平成２年７月１９日付で特許出
願がなされている。［０００４］また、デイスプレィ画面上において、マウス（ポインテ
ィングデバイス）などを用いて必要な単語領域を囲む矩
形の二つの対角頂点を指定し、この矩形内を単語領域と
して抽出するという方式がある。しかし、文書の行間が
狭い場合や単語間スペースが狭い場合、あるいは単語に
接近して罫線がある場合に、単語領域のみを囲む矩形の
指定が容易でないという問題がある。［０００５］この問題を解決するため、前記ハンディスキャナー装置
と同様のガイドラインを持つ、単語領域より十分大きな
一定の大きさの枠を定義し、この枠（全体、ガイドライ
ンのみ、あるいはガイドラインの交点部分のみ）を文書
画像とともにデイスプレィ画面に表示し、ガイドライン
を目的の単語領域の先頭及び行とほぼ一致させるように
枠を移動させ、枠内の部分画像を入力画像として、ガイ
ドラインの位置情報（基準位置情報）を利用し簡単な処
理によって目的の単語領域を抽出する単語領域抽出方式
を考案し、やはり同一出願人により「単語領域抽出方式
」なる発明の名称にて平成２年７月１９日付で特許出願
がなされている。［０００６］

【発明が解決しようとする課題】

本発明の目的は、前記特許出願に係る単語領域抽出装置
あるいは単語領域抽出方式を改良し、ガイドライン付き
ハンディスキャナー装置によって読み込まれた文書画像
あるいはデイスプレィ画面上でガイドライン付き粋によ
り指定された領域の文書画像を人力画像として、人力画
像のスキュー　が大きい場合にも、より確実に単語領域
を抽出可能な単語領域抽出方式を提供することにある。［０００７］

【課題を解決するための手段】

特許請求の範囲の請求項１記載の発明は、ガイドライン
付きハンディスキャナー装置によって読み込まれた文書
画像あるいはデイスプレィ画面上でガイドライン付き枠
により指定された領域の文書画像のような、抽出すべき
目的単語領域の先頭基準位置及び行基準位置の情報を有
する入力画像について、行基準位置より水平射影を調べ
ることにより目的単語領域の行を切り出し、切り出した
行の範囲について、先頭基準位置の近傍の垂直射影を調
べることによって目的単語領域の先頭位置を検出し、検
出した先頭位置の後の垂直射影を調べることによって目
的単語領域の末尾位置を検出する単語領域抽出方式にお
いて、入力画像を行方向に一定の重なりを持つ複数の領
域に分割し、先頭の分割領域から末尾の分割領域へ向か
って分割領域毎に、直前の分割領域の行切り出しの結果
を参照しながら目的単語領域の行の切り出しを行なうこ
とを特徴とする。［０００８］請求項２記載の発明は、前記請求項１記載の発明による
各分割領域の行切り出しにおいて、行の上端及び下端の
探索限界を設定し、それぞれの探索限界を越えても、行
の上端または下端に対応した水平射影値が閾値以上から
閾値未満へ変化する位置を検出できないときは、上端ま
たは下端で行接続が起こったと判断し、水平射影値を利
用した接続行を強制分離する処理によって目的単語領域
の行の上端または下端の位置を決定することを特徴とす
る。［０００９］請求項３記載の発明は、前記請求項１記載の発明による
各分割領域の行切り出しにおいて、二つ以上の行が切り
出された場合に、一定の条件を満たすときに二つ以上の
行を併合することを特徴とする。［００１０］

【作用】

請求項１ないし３記載の発明によれば、人力画像の持つ
先頭基準位置（スタートライン位置）及び行基準位置（
センターライン位置）を利用するため単語領域を簡単な
処理によって効率的に抽出可能であるとともに、入力画
像の行方向の分割領域毎に、直前の分割領域での行切り
出し結果を参照しつつ行切り出しを行なうので、入力画
像全体について一括して行切り出しを行なう方式に比べ
、入力画像のスキューがあっても、スキューによって行
接続が起こりやすい、行間が狭い文書や単語と罫線が接
近したような文書中の目的単語領域の行をより確実に切
り出すことが可能である。［００１１］また請求項２の発明によれば、行接続を判断しその強制
分離を行なうため、入力画像のスキューがかなり大きい
場合においても、目的単語の行を適切に切り出すことが
可能となるため、ハンディスキャナー装置によって入力
画像を読み込む場合のようにスキューが大きくなりゃす
い場合においても、確実な単語領域抽出が可能である。［００１２］さらに請求項３の発明によれば、一つであるべき行が二
つ以上の行に分離する場合、例えばｉやｊのような文字
の上の黒丸部分が一つの行として切り出されたような場
合に、それを修正して、より的確な単語領域抽出を達成
できる。［００１３］

【実施例】

図１は本発明を実施するためのシステムの一例を示すブ
ロック図である。１は処理や各種制御を実行するＣＰＵ
、２はオペレーティングシステムや本発明に係る単語領
域抽出処理、その他アプリケーションのプログラムなど
を記憶するためのプログラムメモリ、３は処理の中間デ
ータや処理結果データなどを記憶するためのデータメモ
リ、４と５はＣＲＴデイスプレィとそのインタフェース
、６は画像データを記憶するための画像メモリ、７と８
はマウスとキーボード、９はそのインタフェース、１０
は画像データファイルなどのデータファイルやオペレー
ティングシステム、各種プログラムを保存するための補
助記憶装置、１１はそのインタフェース、１２と１３は
ガイドライン付きハンディスキャナー装置とそのインタ
フェースである。［００１４］単語領域抽出処理の対象となる入力画像は、ハンディス
キャナー装置１２より直接入力され画像メモリ６に取り
込まれた画像であるか、あるいは、補助記憶装置１０よ
り画像メモリ６に取り込まれた画像のＣＲＴデイスプレ
ィ３の画固上で領域指定された部分画像である。［００１５］いずれにしても、図２に示すように、単語領域抽出処理
の対象となる人力画像２０は、目的単語領域の先頭基準
位置であるスタートライン２１と目的単語領域の行基準
位置であるセンターライン２２の情報を持っている。［００１６］ここで、ハンディスキャナー装置１２は、図３に示すよ
うな読み取り窓３０を通して原稿の画像を読み取るもの
で、この読み取り窓３０と原稿上の目的単語領域との位
置合わせのためのガイドラインとしてスタートライン３
１とセンターライン３２とを持っている。図２のスター
トライン２１とセンターライン２２はスタートライン３
１とセンターライン３２の中心線にそれぞれ対応する。このようなハンディスキャナー装置１２によって文書画
像を読み込む場合、原稿上の目的単語領域゛の先頭（左
端）にスタートライン３１を、また目的単語領域の行の
中心にセンターライン３２の中心を、はぼ一致させるよ
うに読み取り窓３０．の位置合わせをし、読み取り窓３
０の領域の画像を読み込む。［００１７］また、大型イメージスキャナー装置などによってページ
単位で読み取られて補助記憶装置１０に格納されている
文書画像中の単語領域抽出を行なう場合、必要ページの
文書画像を画像メモリ６に読み込み、これをＣＲＴデイ
スプレィ６の画面に表示させ、入力画像の領域を指定す
る。図４は、この人力画像領域指定の説明図であり、画
面４０に図３に示した読み取り窓３０と同様の、単語領
域より大きな枠４１を文書画像と重ねて表示し、スター
トライン４２を目的の単語（ここでは’Ｒｅｃｏｇｎｉ
ｔｉｏｎ”　）の領域の先頭と、かつセンターライン４
３を目的単語領域の行と、はぼ一致させるように枠４１
を移動させる。この枠４１内の部分画像が単語領域抽出
処理の入力画像となる。図２のスタートライン２１とセ
ンターライン２２はスタートライン４２とセンターライ
ン４３の中心線にそれぞれ対応する。［００１８］なお、枠４０は図４に示したように全体を画面に表示し
てもよいカミ枠線を表示せず、スタートライン４２とセ
ンターライン４３だけを表示させたり、あるいはスター
トライン４２とセンターライン４３の交点部分だけを表
示させてもよい。要は、二つのガイドラインと目的単語
領域との位置合わせができればよい。［００１９］次に、入力画像（その画像データは画像メモリ６上にあ
る）より目的の単語領域を抽出する処理を説明する。こ
の処理の全体の流れは図５に示す通りである。以下、各処理段階について具体的に説明する。［００２０］分副領埃ｑ設定上まず、図２に示した基準位置情報付きの入力画像２０を
行方向に複数の領域に分割する。隣合う分割領域は一部
重なりを持たせる。入力画像２０を３分割した例を図６
に示す。なお、この例のように左端の分割領域にスター
トライン゛２１が含まれるように分割領域の大きさを選
ぶ。［，００２１］へ判領域′位の′テ七り出し２一つの分割領域についての処理の概要を図７に示す。な
お、この行切り出し処理は左端（先端）の分割領域から
右端（末尾）の分割領域へ向かって順に実行する。（ｏｏｚｚ７位置である。［００２３］始位置とする。［００２４］ただし、行端探索開始位置のｙ座標Ｙは次の条件画像高
さＸｉ／４＜Ｙ＜画像高さ×３／４を満足しなければな
らない。この条件を満足する行端探索開始位置を設定で
きなＴデイスプレィ４の画面上での枠位置設定のエラー
と判断し、域抽出処理は異常終了となる。［００２５］この段階で単語領ン位置に代えて、左隣の分割領域において抽出された現
在性（目的の単語領域の行とみなされた行）の中心のラ
イン位置を起点として、左端の分割領域の場合と同様の
手順により行端探索開始位置を求める。［００２６］ただし、行端探索開始位置のｙ座標Ｙの満足すべき条件
は、左隣分割領域の現在行上端十ノイズ高さくＹかつＹ〈左隣分割領域の現在性下端−ノイズ高さである。こ
のような条件を満足する行端探索開始位置が設定できな
い場合、行切り出し処理は正常終了となる。目的の単語
領域の後（右）に十分な空白が存在しその空白部分の分
割領域（図５の空白分割領域）の場合に、このような正
常終了となる。［００２７］環ステップ１０２　′一端探索打ち切り位置の計定行端
探索開始位置から上向きまたは下向きに行端を探索する
力へ行端探索開始位置から十分能れた位置まで探索を進
めても行端を発見できないときは、隣合った行が接続し
ていると考えられるので、ある位置までで行端探索を打
ち切るべきである。ここでは、そのような探索限界であ
る行端探索打ち切り位置を設定する［００２８］まず左端の分割領域について説明する。行の高さ（ｙ方
向幅）を推定する情報がないため、処理対象とする文字
の高さの最大値より多少大きな高さだけ行端探索開始位
置から離れた位置を行端探索打ち切り位置とする。［００２９］次に左端の分割領域以外の分割領域について説明する。左隣の分割領域で現在行だけが検出され、その前（上）
の行も次（下）の行も検出されていなない場合図８に示
すように、左隣の分割領域における現在行の高さをｈｃ
として、同現在行の上端からｈｃだけ上の位置を上側の
行端探索打ち切り位置とし、現在行の下端からｈｃだけ
下の位置を下側の行端探索打ち切り位置とする。ただし
、このようにして求めた打ち切り位置が画像の上端また
は下端を越えている場合は、画像の上端または下端を打
ち切り位置とする。［００３０１他方、左隣の分割領域で現在行のみならず前の行または
次の行も検出されている場合、左隣の分割領域の現在行
の上端または下端からｈｃだけ上または下の位置カミ前
の行の下端より下または次の行の上端より上ならば、そ
れぞれの位置を上側または下側の行端探索打ち切り位置
とする。しかし、図９に示すように、現在行の上端から
ｈｃだけ上の位置が前の行の下端より上のときは、両位
置の中点位置を上側の打ち切り位置とし、同様に現在行
の下端がらｈｃだけ下の位置が次行の上端より下のとき
は、両位置の中点位置を下側の打ち切り位置とする。

【００３月行端探索開始位置から下向きに水平射影がオンからオフ
へ変化する行端の探索を打ち切り位置まで行なう　（ス
テップ１０３）。［００３２］行端が検出された場合は、この行端を現在行の下たんと
し、さらに下向きに水平射影が再びオンする位置すなわ
ち現在行の次（下）の行の上端を探索する（ステップ１
０４）。［００３３］ステップ１０３の処理で行端が検出されなかった場合、
現在行と次行とが接続していると判断されるので、接続
行の強制分離の処理（ステップ１ｏ５）を行なつ。［００３４］すなわち、左端の分割領域においては、図１０に示すよ
うに、行端探索開始位置と下側の行端探索打ち切り位置
とを１：３に内分する位置から、下側の行端探索打ち切
り位置までの範囲内で水平射影の値が最小の位置を、現
在行の下端とする。［００３５］左端の分割領域以外の分割領域においては、図１１に示
すように、左隣の分割領域での現在行の下端からｈｅ／
４（ｈｅは現在行の高さ）だけ上の位置より下側の打ち
切り位置までの範囲内で水平射影の値が最小の位置を、
当該分割領域における現在行の下端とする。【００３６】ステップ１０６ないし１０８　上向き′〒”探索・１続
行の強制分離行端探索開始位置より上向きに水平射影が
オンからオフへ変化する行端の探索を行端探索打ち切り
位置まで行なう（ステップ１０６）。［００３７］行端が検出された場合は、この行端を現在行の上端とし
、さらに上向きに水平射影が再びオンする位置すなわち
現在行の前（上）の行の下端を探索する（ステップ１０
７）。［００３８］ステップ１０６の処理で行端が検出されなかった場合、
現在行と次行とが接続していると判断し、接続行の強制
分離の処理（ステップ１０８）を行なう。［００３９］すなわち、左端の分割領域においては、図１２に示すよ
うに、行端探索開始位置と上側の行端探索打ち切り位置
とを１：３に内分する位置から打ち切り位置までの範囲
内で水平射影の値が最小の位置を、現在行の上端とする
。［００４０］左端の分割領域以外の分割領域においては、図１３に示
すように、左隣の分割領域での現在行の上端からｈｃ／
４（ｈｃは現在行の高さ）だけ下の位置より上側の打ち
切り位置までの範囲内で水平射影値が最小の位置を、当
該分割領域におけ現在行の上端とする。［００４１］ステップ１０９　′−分離のチエツクと′合ステップ１
０５及び１０８における行の強制分離の妥当性を行の高
さや左隣の分割領域での現在行の行端などからチエツク
し、分離位置が不適当で統合すべきときは統合を行なっ
て現在行の範囲を修正する。行間が狭い文書や目的の単
語に接近して罫線がある文書などは、その画像のスキュ
ーが大きい場合などに行接続が起こりやすい。このよう
な行接続が起こった場合でも、以上のような分割領域単
位の行切り出し処理により、適切な行切り出しが可能で
あるため、次の単語先頭及び末尾の検出処理を正常に行
ない目的の単語領域を抽出可能となる。［００４２］単紐先販Ｏ検量主処理の内容は図１４に示す通りである。この単語先頭検
出は、スタートライン２１の位置を基準として、先に切
り出された現在性の範囲内の垂直射影を調べることによ
り単語の先頭文字の左端を検出するもので、先頭文字と
スタートラインとの位置関係としては図１５の（ａ）、
　　（ｂ）または（Ｃ）に示すような場合がある。［００４３］まずスタートライン位置の垂直射影値を閾値と比較しく
ステップ２０１）　閾値未満であれば図１５（ａ’）の
ような場合である可能性が大きいので、スタートライン
位置より右側に垂直射影値が閾値以上となる位置を探し
、その位置を先頭文字の左端すなわち単語領域の先頭位
置として仮決定しくステップ２０２）　その位置より右
に垂直射影値が閾値以上の範囲がある値以上続いている
か調べる（ステップ２０３）。垂直射影値が閾値以上の
範囲が一定値以上続いているときは、図１５（ａ）のよ
うな場合であるので、仮決定した先頭位置を本決定して
データメモリ３に書き込む（ステップ２０４）。［００４４］ただし、図１５（ａ）の場合でも、スタートラインと先
頭文字との間のペース内のノイズがステップ２０２で先
頭位置として検出されることがある。この場合法のステ
ップ２０３で条件を満足しないので、ステップ２０２に
戻り、さらに右へ先頭文字を探すことにより、最終的に
先頭文字の左端すなわち単語領域の先頭位置を検出する
。［００４５］図１５（ｂ）または（Ｃ）の場合のように、スタートラ
インがある文字に重なっている場合、ステップ２０１で
垂直射影値が閾値以上と判定されるので、スタートライ
ンから左と右に垂直射影値が閾値未満となる位置を探し
、その位置をスタートラインと重なった文字の左端と右
端とする（ステップ２０５）。そして、注目している文
字の幅が一定値以上であるか調べる（ステップ２０６）
。文字幅が一定値以上であれば、間違いなくスタートラ
インの位置は文字内であるので、ステップ２０５で検出
した左端と右端のいずれがスタートラインに近いか調べ
る（ステップ２０７）。左端のほうがスタートラインに
近いならば、図１５（ｃ）の場合であるので、ステップ
２０５で検出した左端の位置を単語領域の先頭位置に決
定し、データメモリ３に書き込む。［００４６］ステップ２０７で右端のほうがスタートラインに近いと
判定したときは、図１５（ｂ）のように先頭文字より前
の文字がスタートラインと重なっている場合であるので
、ステップ２０２に分岐し、さらに右に単語領域の先頭
を探す。［００４７］また、ステップ２０６で文字幅が一定値未満と判定され
たときは、図１５（ａ）のような場合であるが、これは
スタートラインの直下にノイズがあると判断されるので
、ステップ２０２に分岐して先頭位置を検出する。［００４８］単眼末尾桧山処理↓ 処理内容は図１６に示す通りである。この処理は、単語
の先頭文字を起点として、隣合う文字の間のスペースを
調べ、スペース幅が狭い文字は単語内と判断し、広いス
ペースが見つかったときは、その前の方の文字を末尾単
語とし、その右端を単語領域の末尾位置として検出する
ものである。図１７はその説明図である［００４９］まず、スペースが広いか狭いかの判定のためのスペース
幅閾値を求める（ステップ３０１）。すなわち、先に検
出された行の高さ（または垂直射影値の最大値）と予め
設定された文字の縦横比とから基準文字幅を計算する。この基準文字幅の１．５倍の値と、先に検出された先頭
文字の前のスペースの幅とを比較し、そのスペース幅の
ほうが大きいときは、先頭文字の前のスペースを無効と
する。同様に、基準文字幅の０．　５倍の値と、先頭文
字の前のスペースとを比較し、そのスペース幅のほうが
小さいときも先頭文字の前のスペースを無効とする。［００５０］そして、先頭文字の前のスペースが無効とされた場合は
、計算により求めた基準文字幅の４分の１の値をスペー
ス幅閾値に決定する。先頭文字の前のスペースが有効の
場合は、そのスペース幅の２分の１の値と基準文字幅の
４分の１の値の平均をスペース幅閾値とする。［００５１］このようにしてスペース幅閾値を決定すると、先頭文字
を注目文字に設定しくステップ３０２）　注目文字の右
の垂直射影を調べることにより、注目文字の右に隣接す
る文字を探す（ステップ３０３）。右に隣接する文字が
見つからないときは、その時の注目文字を単語の末尾文
字とし、その右端位置を単語末尾位置として検出し、こ
れをデータメモリ３に書き込む（ステップ３０４）。［００５２］注目文字の右隣接文字が見つかったときは、両文字間の
スペースの幅を求めてスペース幅閾値と比較しくステッ
プ３０５）　スペース幅がスペース幅閾値以上であれば
注目文字を末尾文字とし、その右端を単語領域末尾位置
として検出する（ステップ３０４）。スペース幅がスペ
ース幅閾値より小さいときは、右側の文字を改めて注目
文字に設定しくステップ３０６）　ステップ３０３から
の処理を行なう。［００’５３］以上の処理により単語の行範囲の先頭から末尾までの領
域が単語領域として抽出される。［００５４］次に、分割領域における行切り出し処理（図５の処理２
）の変形例を、図１９に示すフローチャートを用い説明
する。この変形例は、分離性の併合処理に特徴がある。［００５５］ステップ４０１は図７のステップ１０１と同様の行端探
索開始位置の設定を行なう処理ステップである。ステッ
プ４０２は図７のステップ１０２と同様の行端探索打ち
切り位置の設定を行なう処理ステップである。ステップ
４０３゛は、図７のステップ１０３からステップ１０７
までの処理と同様に、行端探索開始位置より上下に水平
射影を行端探索打ち切り位置まで調べて行を切り出す処
理ステ・ノブであるが、切り出すのは現在行だけである
。ステップ４０８は図７のステ・ノブ１０８と同様の接
続行強制分離を行なう処理ステップである。［００５６］ステップ４０４においては、現在行の下端より下向きに
、画像の下端を行端探索打ち切り位置として、水平射影
を調べることにより現在行の次（下）の行を切り出す。ステップ４０６においては、現在行の上端より上向きに
、画像の上端を行端探索打ち切り位置として、水平射影
を調べることにより現在行の前（上）の行を切り出す。［００５７］ステップ４０．５，４０７は行分離のチエツクと分離性
併合を行なう処理ステ・ノブである力板その説明に先だ
って、ここでの処理の対象となる行分離の様態について
図１９及び図２０により説明する。［０’０５８］併合を考慮すべき行分離は２種類に分類できるが、ここ
では、それぞれを連続性分離と非連続行分離と呼ぶ。［００５９］現在処理中の分割領域内の分離行が、左隣の分割領域内
の現在行と重なりを持っている場合に、この分離行が連
続性分離を起こした行である。図１９に、処理中の分割
領域内の現在行の前の行が連続性分離を起こした例を示
す。［００６０１他方、左隣の分割領域内の現在行と重なりを持たない状
態で、現在行から分離した行がある場合、この分離行は
非連続行分離を起こした行である。図２０Ｆ、現在処理
中の分割領域内における現在行の前の行カミ非連続行分
離を起こした例を示す。［００６１］まず連続性分離を起こした行の併合について説明する。この併合処理は、一定の条件を満たす間は、前の行、次
の行ともに繰り返し実行される。また、これはステップ
４０７による「上の連続分離行に対する併合処理」とス
テ・ノブ４０５による「下の連続分離行に対する併合処
理」とがある。［００６２］「上の連続分離行に対する併合処理」について説明する
。この併合を実行するための条件は「現在行の前（上）の分離行（注目分離行）カミ左隣の
分割領域内の現在行と重なりを持ち、カリ、左隣領域内
の現在行の上端から、該現在行の高さの４分の１の値だ
け上の位置より、注目分離行の上端が下にある。」とい
うことである。この条件を満たす注目分離行は現在行に
併合する。［００６３］「下の連続分離行に対する併合処理」は、連続性分離を
起こした前の行を現在行に併合する処理で、その併合条
件は「上の連続分離行に対する併合処理」の併合条件の
上下関係を入れ替えたものである。［００６４］次に、非連続行分離を起こした行の併合処理について説
明する。これは現在行の前（上）の分離行に対してのみ
ステップ４０７で実行される。ｉやｊのような文字の上
の黒丸部分が分離行になる場合を考慮すれば、一般に十
分であるからである。次のａからｅの条件がすべて満た
される場合に、前の行を現在行に併合する。ａ、注目する前の行の下端力板左隣の分割領域内の現在
行の上端より上にある（非連続行分離の条件）。ｂ、注目する前の行と現在行との間隔カミ現在行の高さ
の３分の１未満である（行間と行高さの関係）。Ｃ０左隣の分割領域で前の行が検出されている場合にお
いて、現在処理中の分割領域内の現在行の高さの３分の
１だけ左隣の分割領域内の前の行の下端から上方の位置
より下に、現在処理中の分割領域内の注目している前の
行の上端がある。ｄ、現在処理中の分割領域において、現在行の高さが、
注目する前の行の高さの３倍よりも大きい（行高さの比
）。ｅ、注目する前の行の垂直射影より求めた最大文字幅が
、当該前の行の高さの３分の２より／卦かい（文字幅）
。［００６５］

【発明の効果】

以上説明したように、請求項１または２記載の発明によ
れば、人力画像の持つ先頭基準位置（スタートライン位
置）及び行基準位置（センターライン位置）を利用して
簡単かつ効率的に単語領域が抽出可能となるとともに、
行方向の分割領域毎の行切り出し処理さらには接続行分
離処理によって、画像人力にハンディスキャナー装置を
用いる場合のように人力画像のスキューが大きいときで
も、スキューによる行接続が起こりやすい行間の狭い文
書や単語と罫線が接近したような文書中の目的単語領域
を確実に抽出することができる。

【図面の簡単な説明】

【図１】本発明を実施するためのシステムの一例を示すブロック
図である。

【図２】入力画像の説明図である。

【図３】ガイドライン付きハンディスキャナー装置の読み取り窓
及びガイドラインの説明図である。

【図４】デイスプレィ画面上での入力画像領域の指定方法及びガ
イドライン付き枠の説明図である。

【図５】単語領域抽出処理の全体的流れを示すフローチャートで
ある。

【図６】入力画像の領域分割の一例の説明図である。

【図７】分割領域毎の行切り出し処理のフローチャートである。

【図８】行端探索打ち切り位置の設定方法の説明図である。

【図９】行端探索打ち切り位置の設定方法の説明図である。

【図１０】行下端側の接続強制分離の説明図である。

【図１１】行下端側の接続強制分離の説明図である。

【図１２】打上端側の接続強制分離の説明図である。

【図１３】打上端側の接続強制分離の説明図である。

【図１４】単語先頭検出処理のフローチャートである。

【図１５】スタートラインと単語との位置関係の説明図である。

【図１６】単語末尾検出処理のフローチャートである。

【図１７】単語末尾検出の説明図である。

【符号の説明】

　　ＣＰＵ２　プログラムメモリ３　データメモリ４　　ＣＲＴデイスプレィ６　画像メモリ７　マウス８　キーボード１０　補助記憶装置１２　ガイドライン付きハンディスキャナー装置２０　
人力装置スタートラインセンターライン読み取り窓スタートラインセンターライン画面枠スタートラインセンターライン

【書類芯】

図面

【図１】

【図２】

【図５】

【図６】

【図７】

【図８】

【図９】

【図１１】

【図１２】

【図１３】

【図１４】

【図１５１【図１６】［図１７】

【図１９】

【図２０】

【図１８】

【書類名】【提出日】【あて先】【事件の表示】【出願番号】【発明の名称】【補正をする者】【事件との関係】【識別番号】【氏名又は名称】【代理人】【識別番号】【弁理士】【氏名又は名称】【発送番号】

【手続補正　１】

【補正対象書類名】【補正対象項目名】【補正方法】【補正の内容】【代理人】【識別番号】【弁理士】【氏名又は名称】

【手続補正　２】

【補正対象書類名】

【補正対象項目名】【補正方法】【補正の内容】

手続補正書平成３年４月２２日

Claims

【特許請求の範囲】

【請求項１】抽出すべき目的単語領域の先頭基準位置及
び行基準位置の情報を有する入力画像について、行基準
位置より上下に水平射影を調べることにより目的単語領
域の行を切り出し、切り出した行の範囲について、先頭
基準位置の近傍の垂直射影を調べることによって目的単
語領域の先頭位置を検出し、検出した先頭位置の後の垂
直射影を調べることによって目的単語領域の末尾位置を
検出する単語領域抽出方式において、入力画像を行方向
に一定の重なりを持つ複数の領域に分割し、先頭の分割
領域から末尾の分割領域へ向かって分割領域毎に、直前
の分割領域の行切り出し結果を参照しながら目的単語領
域の行の切り出しを行なうことを特徴とする単語領域抽
出方式。
【請求項２】各分割領域の行切り出しにおいて、行の上
端及び下端の探索限界を設定し、それぞれの探索限界を
超えても、行の上端または下端に対応した水平射影値が
閾値以上から閾値未満へ変化する位置を検出できないと
きは、上端または下端で行接続が起こったと判断し、水
平射影値を利用した接続行を強制分離する処理によって
目的単語領域の行の上端または下端の位置を決定するこ
とを特徴とする請求項１記載の単語領域抽出方式。
【請求項３】各分割領域の行切り出しにおいて、二つ以
上の行が切り出された場合に、一定の条件を満たすとき
に二つ以上の行を併合することを特徴とする請求項１記
載の単語領域抽出方式。