JPH04112282A - 単語領域抽出方式 - Google Patents

単語領域抽出方式

Info

Publication number
JPH04112282A
JPH04112282A JP2410749A JP41074990A JPH04112282A JP H04112282 A JPH04112282 A JP H04112282A JP 2410749 A JP2410749 A JP 2410749A JP 41074990 A JP41074990 A JP 41074990A JP H04112282 A JPH04112282 A JP H04112282A
Authority
JP
Japan
Prior art keywords
line
word
area
divided
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2410749A
Other languages
English (en)
Inventor
Hiroshi Nakayama
寛 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2410749A priority Critical patent/JPH04112282A/ja
Publication of JPH04112282A publication Critical patent/JPH04112282A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
[0001]
【産業上の利用分野】
本発明は、ハンディスキャナー装置によって読み込んだ
文書画像やデイスプレィ画面に表示された文書画像の部
分画像より、英単語のようなスペースで区切られた文字
列(単語と総称する)の領域を抽出する単語領域抽出方
式に関する。 [0002]
【従来の技術】
文字認識システムにおいて、ハンディスキャナー装置を
用いて原稿画像を入力する場合、読み取り領域が不適切
となって単語の切り出しく単語入力)を正しく行なうこ
とができないことがあった。それは従来のハンディスキ
ャナー装置が、そのような単語入力を前提としていなか
ったため、読み取り範囲を覗き窓から確認できるように
はなっていたが、原稿上の目的としている単語に対して
読み取り位置が適切であるか否かを簡単に確認するため
の手段を備えていなかったからである。 [0003] このような不都合を解決するため、原稿読み取り窓と原
稿上の単語の先頭及び行中心との相対的位置をそれぞれ
合わせるための二つのガイドライン(スタートラインと
センターライン)を有し、読み取り領域と単語の先頭及
び行中心との相対的位置がほぼ一定した読み取り画像を
得られるハンディスキャナー装置と、このガイドライン
付きハンディスキャナー装置によって読み込んだ画像よ
り、ガイドライン位置を利用して簡単な処理により単語
領域を抽出する単語領域抽出装置とを考案し、同一出願
人により「ハンディスキャナー装置及び単語領域抽出装
置」なる発明の名称にて平成2年7月19日付で特許出
願がなされている。 [0004] また、デイスプレィ画面上において、マウス(ポインテ
ィングデバイス)などを用いて必要な単語領域を囲む矩
形の二つの対角頂点を指定し、この矩形内を単語領域と
して抽出するという方式がある。しかし、文書の行間が
狭い場合や単語間スペースが狭い場合、あるいは単語に
接近して罫線がある場合に、単語領域のみを囲む矩形の
指定が容易でないという問題がある。 [0005] この問題を解決するため、前記ハンディスキャナー装置
と同様のガイドラインを持つ、単語領域より十分大きな
一定の大きさの枠を定義し、この枠(全体、ガイドライ
ンのみ、あるいはガイドラインの交点部分のみ)を文書
画像とともにデイスプレィ画面に表示し、ガイドライン
を目的の単語領域の先頭及び行とほぼ一致させるように
枠を移動させ、枠内の部分画像を入力画像として、ガイ
ドラインの位置情報(基準位置情報)を利用し簡単な処
理によって目的の単語領域を抽出する単語領域抽出方式
を考案し、やはり同一出願人により「単語領域抽出方式
」なる発明の名称にて平成2年7月19日付で特許出願
がなされている。 [0006]
【発明が解決しようとする課題】
本発明の目的は、前記特許出願に係る単語領域抽出装置
あるいは単語領域抽出方式を改良し、ガイドライン付き
ハンディスキャナー装置によって読み込まれた文書画像
あるいはデイスプレィ画面上でガイドライン付き粋によ
り指定された領域の文書画像を人力画像として、人力画
像のスキュー が大きい場合にも、より確実に単語領域
を抽出可能な単語領域抽出方式を提供することにある。 [0007]
【課題を解決するための手段】
特許請求の範囲の請求項1記載の発明は、ガイドライン
付きハンディスキャナー装置によって読み込まれた文書
画像あるいはデイスプレィ画面上でガイドライン付き枠
により指定された領域の文書画像のような、抽出すべき
目的単語領域の先頭基準位置及び行基準位置の情報を有
する入力画像について、行基準位置より水平射影を調べ
ることにより目的単語領域の行を切り出し、切り出した
行の範囲について、先頭基準位置の近傍の垂直射影を調
べることによって目的単語領域の先頭位置を検出し、検
出した先頭位置の後の垂直射影を調べることによって目
的単語領域の末尾位置を検出する単語領域抽出方式にお
いて、入力画像を行方向に一定の重なりを持つ複数の領
域に分割し、先頭の分割領域から末尾の分割領域へ向か
って分割領域毎に、直前の分割領域の行切り出しの結果
を参照しながら目的単語領域の行の切り出しを行なうこ
とを特徴とする。 [0008] 請求項2記載の発明は、前記請求項1記載の発明による
各分割領域の行切り出しにおいて、行の上端及び下端の
探索限界を設定し、それぞれの探索限界を越えても、行
の上端または下端に対応した水平射影値が閾値以上から
閾値未満へ変化する位置を検出できないときは、上端ま
たは下端で行接続が起こったと判断し、水平射影値を利
用した接続行を強制分離する処理によって目的単語領域
の行の上端または下端の位置を決定することを特徴とす
る。 [0009] 請求項3記載の発明は、前記請求項1記載の発明による
各分割領域の行切り出しにおいて、二つ以上の行が切り
出された場合に、一定の条件を満たすときに二つ以上の
行を併合することを特徴とする。 [0010]
【作用】
請求項1ないし3記載の発明によれば、人力画像の持つ
先頭基準位置(スタートライン位置)及び行基準位置(
センターライン位置)を利用するため単語領域を簡単な
処理によって効率的に抽出可能であるとともに、入力画
像の行方向の分割領域毎に、直前の分割領域での行切り
出し結果を参照しつつ行切り出しを行なうので、入力画
像全体について一括して行切り出しを行なう方式に比べ
、入力画像のスキューがあっても、スキューによって行
接続が起こりやすい、行間が狭い文書や単語と罫線が接
近したような文書中の目的単語領域の行をより確実に切
り出すことが可能である。 [0011] また請求項2の発明によれば、行接続を判断しその強制
分離を行なうため、入力画像のスキューがかなり大きい
場合においても、目的単語の行を適切に切り出すことが
可能となるため、ハンディスキャナー装置によって入力
画像を読み込む場合のようにスキューが大きくなりゃす
い場合においても、確実な単語領域抽出が可能である。 [0012] さらに請求項3の発明によれば、一つであるべき行が二
つ以上の行に分離する場合、例えばiやjのような文字
の上の黒丸部分が一つの行として切り出されたような場
合に、それを修正して、より的確な単語領域抽出を達成
できる。 [0013]
【実施例】
図1は本発明を実施するためのシステムの一例を示すブ
ロック図である。1は処理や各種制御を実行するCPU
、2はオペレーティングシステムや本発明に係る単語領
域抽出処理、その他アプリケーションのプログラムなど
を記憶するためのプログラムメモリ、3は処理の中間デ
ータや処理結果データなどを記憶するためのデータメモ
リ、4と5はCRTデイスプレィとそのインタフェース
、6は画像データを記憶するための画像メモリ、7と8
はマウスとキーボード、9はそのインタフェース、10
は画像データファイルなどのデータファイルやオペレー
ティングシステム、各種プログラムを保存するための補
助記憶装置、11はそのインタフェース、12と13は
ガイドライン付きハンディスキャナー装置とそのインタ
フェースである。 [0014] 単語領域抽出処理の対象となる入力画像は、ハンディス
キャナー装置12より直接入力され画像メモリ6に取り
込まれた画像であるか、あるいは、補助記憶装置10よ
り画像メモリ6に取り込まれた画像のCRTデイスプレ
ィ3の画固上で領域指定された部分画像である。 [0015] いずれにしても、図2に示すように、単語領域抽出処理
の対象となる人力画像20は、目的単語領域の先頭基準
位置であるスタートライン21と目的単語領域の行基準
位置であるセンターライン22の情報を持っている。 [0016] ここで、ハンディスキャナー装置12は、図3に示すよ
うな読み取り窓30を通して原稿の画像を読み取るもの
で、この読み取り窓30と原稿上の目的単語領域との位
置合わせのためのガイドラインとしてスタートライン3
1とセンターライン32とを持っている。図2のスター
トライン21とセンターライン22はスタートライン3
1とセンターライン32の中心線にそれぞれ対応する。 このようなハンディスキャナー装置12によって文書画
像を読み込む場合、原稿上の目的単語領域゛の先頭(左
端)にスタートライン31を、また目的単語領域の行の
中心にセンターライン32の中心を、はぼ一致させるよ
うに読み取り窓30.の位置合わせをし、読み取り窓3
0の領域の画像を読み込む。 [0017] また、大型イメージスキャナー装置などによってページ
単位で読み取られて補助記憶装置10に格納されている
文書画像中の単語領域抽出を行なう場合、必要ページの
文書画像を画像メモリ6に読み込み、これをCRTデイ
スプレィ6の画面に表示させ、入力画像の領域を指定す
る。図4は、この人力画像領域指定の説明図であり、画
面40に図3に示した読み取り窓30と同様の、単語領
域より大きな枠41を文書画像と重ねて表示し、スター
トライン42を目的の単語(ここでは’Recogni
tion” )の領域の先頭と、かつセンターライン4
3を目的単語領域の行と、はぼ一致させるように枠41
を移動させる。この枠41内の部分画像が単語領域抽出
処理の入力画像となる。図2のスタートライン21とセ
ンターライン22はスタートライン42とセンターライ
ン43の中心線にそれぞれ対応する。 [0018] なお、枠40は図4に示したように全体を画面に表示し
てもよいカミ枠線を表示せず、スタートライン42とセ
ンターライン43だけを表示させたり、あるいはスター
トライン42とセンターライン43の交点部分だけを表
示させてもよい。要は、二つのガイドラインと目的単語
領域との位置合わせができればよい。 [0019] 次に、入力画像(その画像データは画像メモリ6上にあ
る)より目的の単語領域を抽出する処理を説明する。こ
の処理の全体の流れは図5に示す通りである。 以下、各処理段階について具体的に説明する。 [0020] 分副領埃q設定上 まず、図2に示した基準位置情報付きの入力画像20を
行方向に複数の領域に分割する。隣合う分割領域は一部
重なりを持たせる。入力画像20を3分割した例を図6
に示す。なお、この例のように左端の分割領域にスター
トライン゛21が含まれるように分割領域の大きさを選
ぶ。 [,0021] へ判領域′位の′テ七り出し2 一つの分割領域についての処理の概要を図7に示す。な
お、この行切り出し処理は左端(先端)の分割領域から
右端(末尾)の分割領域へ向かって順に実行する。 (oozz7 位置である。 [0023] 始位置とする。 [0024] ただし、行端探索開始位置のy座標Yは次の条件画像高
さXi/4<Y<画像高さ×3/4を満足しなければな
らない。この条件を満足する行端探索開始位置を設定で
きなTデイスプレィ4の画面上での枠位置設定のエラー
と判断し、域抽出処理は異常終了となる。 [0025] この段階で単語領 ン位置に代えて、左隣の分割領域において抽出された現
在性(目的の単語領域の行とみなされた行)の中心のラ
イン位置を起点として、左端の分割領域の場合と同様の
手順により行端探索開始位置を求める。 [0026] ただし、行端探索開始位置のy座標Yの満足すべき条件
は、左隣分割領域の現在行上端十ノイズ高さくYかつ Y〈左隣分割領域の現在性下端−ノイズ高さである。こ
のような条件を満足する行端探索開始位置が設定できな
い場合、行切り出し処理は正常終了となる。目的の単語
領域の後(右)に十分な空白が存在しその空白部分の分
割領域(図5の空白分割領域)の場合に、このような正
常終了となる。 [0027] 環ステップ102 ′一端探索打ち切り位置の計定行端
探索開始位置から上向きまたは下向きに行端を探索する
力へ行端探索開始位置から十分能れた位置まで探索を進
めても行端を発見できないときは、隣合った行が接続し
ていると考えられるので、ある位置までで行端探索を打
ち切るべきである。ここでは、そのような探索限界であ
る行端探索打ち切り位置を設定する[0028] まず左端の分割領域について説明する。行の高さ(y方
向幅)を推定する情報がないため、処理対象とする文字
の高さの最大値より多少大きな高さだけ行端探索開始位
置から離れた位置を行端探索打ち切り位置とする。 [0029] 次に左端の分割領域以外の分割領域について説明する。 左隣の分割領域で現在行だけが検出され、その前(上)
の行も次(下)の行も検出されていなない場合図8に示
すように、左隣の分割領域における現在行の高さをhc
として、同現在行の上端からhcだけ上の位置を上側の
行端探索打ち切り位置とし、現在行の下端からhcだけ
下の位置を下側の行端探索打ち切り位置とする。ただし
、このようにして求めた打ち切り位置が画像の上端また
は下端を越えている場合は、画像の上端または下端を打
ち切り位置とする。 [00301 他方、左隣の分割領域で現在行のみならず前の行または
次の行も検出されている場合、左隣の分割領域の現在行
の上端または下端からhcだけ上または下の位置カミ前
の行の下端より下または次の行の上端より上ならば、そ
れぞれの位置を上側または下側の行端探索打ち切り位置
とする。しかし、図9に示すように、現在行の上端から
hcだけ上の位置が前の行の下端より上のときは、両位
置の中点位置を上側の打ち切り位置とし、同様に現在行
の下端がらhcだけ下の位置が次行の上端より下のとき
は、両位置の中点位置を下側の打ち切り位置とする。
【003月 行端探索開始位置から下向きに水平射影がオンからオフ
へ変化する行端の探索を打ち切り位置まで行なう (ス
テップ103)。 [0032] 行端が検出された場合は、この行端を現在行の下たんと
し、さらに下向きに水平射影が再びオンする位置すなわ
ち現在行の次(下)の行の上端を探索する(ステップ1
04)。 [0033] ステップ103の処理で行端が検出されなかった場合、
現在行と次行とが接続していると判断されるので、接続
行の強制分離の処理(ステップ1o5)を行なつ。 [0034] すなわち、左端の分割領域においては、図10に示すよ
うに、行端探索開始位置と下側の行端探索打ち切り位置
とを1:3に内分する位置から、下側の行端探索打ち切
り位置までの範囲内で水平射影の値が最小の位置を、現
在行の下端とする。 [0035] 左端の分割領域以外の分割領域においては、図11に示
すように、左隣の分割領域での現在行の下端からhe/
4(heは現在行の高さ)だけ上の位置より下側の打ち
切り位置までの範囲内で水平射影の値が最小の位置を、
当該分割領域における現在行の下端とする。 【0036】 ステップ106ないし108 上向き′〒”探索・1続
行の強制分離行端探索開始位置より上向きに水平射影が
オンからオフへ変化する行端の探索を行端探索打ち切り
位置まで行なう(ステップ106)。 [0037] 行端が検出された場合は、この行端を現在行の上端とし
、さらに上向きに水平射影が再びオンする位置すなわち
現在行の前(上)の行の下端を探索する(ステップ10
7)。 [0038] ステップ106の処理で行端が検出されなかった場合、
現在行と次行とが接続していると判断し、接続行の強制
分離の処理(ステップ108)を行なう。 [0039] すなわち、左端の分割領域においては、図12に示すよ
うに、行端探索開始位置と上側の行端探索打ち切り位置
とを1:3に内分する位置から打ち切り位置までの範囲
内で水平射影の値が最小の位置を、現在行の上端とする
。 [0040] 左端の分割領域以外の分割領域においては、図13に示
すように、左隣の分割領域での現在行の上端からhc/
4(hcは現在行の高さ)だけ下の位置より上側の打ち
切り位置までの範囲内で水平射影値が最小の位置を、当
該分割領域におけ現在行の上端とする。 [0041] ステップ109 ′−分離のチエツクと′合ステップ1
05及び108における行の強制分離の妥当性を行の高
さや左隣の分割領域での現在行の行端などからチエツク
し、分離位置が不適当で統合すべきときは統合を行なっ
て現在行の範囲を修正する。行間が狭い文書や目的の単
語に接近して罫線がある文書などは、その画像のスキュ
ーが大きい場合などに行接続が起こりやすい。このよう
な行接続が起こった場合でも、以上のような分割領域単
位の行切り出し処理により、適切な行切り出しが可能で
あるため、次の単語先頭及び末尾の検出処理を正常に行
ない目的の単語領域を抽出可能となる。 [0042] 単紐先販O検量主 処理の内容は図14に示す通りである。この単語先頭検
出は、スタートライン21の位置を基準として、先に切
り出された現在性の範囲内の垂直射影を調べることによ
り単語の先頭文字の左端を検出するもので、先頭文字と
スタートラインとの位置関係としては図15の(a)、
  (b)または(C)に示すような場合がある。 [0043] まずスタートライン位置の垂直射影値を閾値と比較しく
ステップ201) 閾値未満であれば図15(a’)の
ような場合である可能性が大きいので、スタートライン
位置より右側に垂直射影値が閾値以上となる位置を探し
、その位置を先頭文字の左端すなわち単語領域の先頭位
置として仮決定しくステップ202) その位置より右
に垂直射影値が閾値以上の範囲がある値以上続いている
か調べる(ステップ203)。垂直射影値が閾値以上の
範囲が一定値以上続いているときは、図15(a)のよ
うな場合であるので、仮決定した先頭位置を本決定して
データメモリ3に書き込む(ステップ204)。 [0044] ただし、図15(a)の場合でも、スタートラインと先
頭文字との間のペース内のノイズがステップ202で先
頭位置として検出されることがある。この場合法のステ
ップ203で条件を満足しないので、ステップ202に
戻り、さらに右へ先頭文字を探すことにより、最終的に
先頭文字の左端すなわち単語領域の先頭位置を検出する
。 [0045] 図15(b)または(C)の場合のように、スタートラ
インがある文字に重なっている場合、ステップ201で
垂直射影値が閾値以上と判定されるので、スタートライ
ンから左と右に垂直射影値が閾値未満となる位置を探し
、その位置をスタートラインと重なった文字の左端と右
端とする(ステップ205)。そして、注目している文
字の幅が一定値以上であるか調べる(ステップ206)
。文字幅が一定値以上であれば、間違いなくスタートラ
インの位置は文字内であるので、ステップ205で検出
した左端と右端のいずれがスタートラインに近いか調べ
る(ステップ207)。左端のほうがスタートラインに
近いならば、図15(c)の場合であるので、ステップ
205で検出した左端の位置を単語領域の先頭位置に決
定し、データメモリ3に書き込む。 [0046] ステップ207で右端のほうがスタートラインに近いと
判定したときは、図15(b)のように先頭文字より前
の文字がスタートラインと重なっている場合であるので
、ステップ202に分岐し、さらに右に単語領域の先頭
を探す。 [0047] また、ステップ206で文字幅が一定値未満と判定され
たときは、図15(a)のような場合であるが、これは
スタートラインの直下にノイズがあると判断されるので
、ステップ202に分岐して先頭位置を検出する。 [0048] 単眼末尾桧山処理↓ 処理内容は図16に示す通りである。この処理は、単語
の先頭文字を起点として、隣合う文字の間のスペースを
調べ、スペース幅が狭い文字は単語内と判断し、広いス
ペースが見つかったときは、その前の方の文字を末尾単
語とし、その右端を単語領域の末尾位置として検出する
ものである。図17はその説明図である[0049] まず、スペースが広いか狭いかの判定のためのスペース
幅閾値を求める(ステップ301)。すなわち、先に検
出された行の高さ(または垂直射影値の最大値)と予め
設定された文字の縦横比とから基準文字幅を計算する。 この基準文字幅の1.5倍の値と、先に検出された先頭
文字の前のスペースの幅とを比較し、そのスペース幅の
ほうが大きいときは、先頭文字の前のスペースを無効と
する。同様に、基準文字幅の0. 5倍の値と、先頭文
字の前のスペースとを比較し、そのスペース幅のほうが
小さいときも先頭文字の前のスペースを無効とする。 [0050] そして、先頭文字の前のスペースが無効とされた場合は
、計算により求めた基準文字幅の4分の1の値をスペー
ス幅閾値に決定する。先頭文字の前のスペースが有効の
場合は、そのスペース幅の2分の1の値と基準文字幅の
4分の1の値の平均をスペース幅閾値とする。 [0051] このようにしてスペース幅閾値を決定すると、先頭文字
を注目文字に設定しくステップ302) 注目文字の右
の垂直射影を調べることにより、注目文字の右に隣接す
る文字を探す(ステップ303)。右に隣接する文字が
見つからないときは、その時の注目文字を単語の末尾文
字とし、その右端位置を単語末尾位置として検出し、こ
れをデータメモリ3に書き込む(ステップ304)。 [0052] 注目文字の右隣接文字が見つかったときは、両文字間の
スペースの幅を求めてスペース幅閾値と比較しくステッ
プ305) スペース幅がスペース幅閾値以上であれば
注目文字を末尾文字とし、その右端を単語領域末尾位置
として検出する(ステップ304)。スペース幅がスペ
ース幅閾値より小さいときは、右側の文字を改めて注目
文字に設定しくステップ306) ステップ303から
の処理を行なう。 [00’53] 以上の処理により単語の行範囲の先頭から末尾までの領
域が単語領域として抽出される。 [0054] 次に、分割領域における行切り出し処理(図5の処理2
)の変形例を、図19に示すフローチャートを用い説明
する。この変形例は、分離性の併合処理に特徴がある。 [0055] ステップ401は図7のステップ101と同様の行端探
索開始位置の設定を行なう処理ステップである。ステッ
プ402は図7のステップ102と同様の行端探索打ち
切り位置の設定を行なう処理ステップである。ステップ
403゛は、図7のステップ103からステップ107
までの処理と同様に、行端探索開始位置より上下に水平
射影を行端探索打ち切り位置まで調べて行を切り出す処
理ステ・ノブであるが、切り出すのは現在行だけである
。ステップ408は図7のステ・ノブ108と同様の接
続行強制分離を行なう処理ステップである。 [0056] ステップ404においては、現在行の下端より下向きに
、画像の下端を行端探索打ち切り位置として、水平射影
を調べることにより現在行の次(下)の行を切り出す。 ステップ406においては、現在行の上端より上向きに
、画像の上端を行端探索打ち切り位置として、水平射影
を調べることにより現在行の前(上)の行を切り出す。 [0057] ステップ40.5,407は行分離のチエツクと分離性
併合を行なう処理ステ・ノブである力板その説明に先だ
って、ここでの処理の対象となる行分離の様態について
図19及び図20により説明する。 [0’058] 併合を考慮すべき行分離は2種類に分類できるが、ここ
では、それぞれを連続性分離と非連続行分離と呼ぶ。 [0059] 現在処理中の分割領域内の分離行が、左隣の分割領域内
の現在行と重なりを持っている場合に、この分離行が連
続性分離を起こした行である。図19に、処理中の分割
領域内の現在行の前の行が連続性分離を起こした例を示
す。 [00601 他方、左隣の分割領域内の現在行と重なりを持たない状
態で、現在行から分離した行がある場合、この分離行は
非連続行分離を起こした行である。図20F、現在処理
中の分割領域内における現在行の前の行カミ非連続行分
離を起こした例を示す。 [0061] まず連続性分離を起こした行の併合について説明する。 この併合処理は、一定の条件を満たす間は、前の行、次
の行ともに繰り返し実行される。また、これはステップ
407による「上の連続分離行に対する併合処理」とス
テ・ノブ405による「下の連続分離行に対する併合処
理」とがある。 [0062] 「上の連続分離行に対する併合処理」について説明する
。この併合を実行するための条件は 「現在行の前(上)の分離行(注目分離行)カミ左隣の
分割領域内の現在行と重なりを持ち、カリ、左隣領域内
の現在行の上端から、該現在行の高さの4分の1の値だ
け上の位置より、注目分離行の上端が下にある。」とい
うことである。この条件を満たす注目分離行は現在行に
併合する。 [0063] 「下の連続分離行に対する併合処理」は、連続性分離を
起こした前の行を現在行に併合する処理で、その併合条
件は「上の連続分離行に対する併合処理」の併合条件の
上下関係を入れ替えたものである。 [0064] 次に、非連続行分離を起こした行の併合処理について説
明する。これは現在行の前(上)の分離行に対してのみ
ステップ407で実行される。iやjのような文字の上
の黒丸部分が分離行になる場合を考慮すれば、一般に十
分であるからである。次のaからeの条件がすべて満た
される場合に、前の行を現在行に併合する。 a、注目する前の行の下端力板左隣の分割領域内の現在
行の上端より上にある(非連続行分離の条件)。 b、注目する前の行と現在行との間隔カミ現在行の高さ
の3分の1未満である(行間と行高さの関係)。 C0左隣の分割領域で前の行が検出されている場合にお
いて、現在処理中の分割領域内の現在行の高さの3分の
1だけ左隣の分割領域内の前の行の下端から上方の位置
より下に、現在処理中の分割領域内の注目している前の
行の上端がある。 d、現在処理中の分割領域において、現在行の高さが、
注目する前の行の高さの3倍よりも大きい(行高さの比
)。 e、注目する前の行の垂直射影より求めた最大文字幅が
、当該前の行の高さの3分の2より/卦かい(文字幅)
。 [0065]
【発明の効果】
以上説明したように、請求項1または2記載の発明によ
れば、人力画像の持つ先頭基準位置(スタートライン位
置)及び行基準位置(センターライン位置)を利用して
簡単かつ効率的に単語領域が抽出可能となるとともに、
行方向の分割領域毎の行切り出し処理さらには接続行分
離処理によって、画像人力にハンディスキャナー装置を
用いる場合のように人力画像のスキューが大きいときで
も、スキューによる行接続が起こりやすい行間の狭い文
書や単語と罫線が接近したような文書中の目的単語領域
を確実に抽出することができる。
【図面の簡単な説明】
【図1】 本発明を実施するためのシステムの一例を示すブロック
図である。
【図2】 入力画像の説明図である。
【図3】 ガイドライン付きハンディスキャナー装置の読み取り窓
及びガイドラインの説明図である。
【図4】 デイスプレィ画面上での入力画像領域の指定方法及びガ
イドライン付き枠の説明図である。
【図5】 単語領域抽出処理の全体的流れを示すフローチャートで
ある。
【図6】 入力画像の領域分割の一例の説明図である。
【図7】 分割領域毎の行切り出し処理のフローチャートである。
【図8】 行端探索打ち切り位置の設定方法の説明図である。
【図9】 行端探索打ち切り位置の設定方法の説明図である。
【図10】 行下端側の接続強制分離の説明図である。
【図11】 行下端側の接続強制分離の説明図である。
【図12】 打上端側の接続強制分離の説明図である。
【図13】 打上端側の接続強制分離の説明図である。
【図14】 単語先頭検出処理のフローチャートである。
【図15】 スタートラインと単語との位置関係の説明図である。
【図16】 単語末尾検出処理のフローチャートである。
【図17】 単語末尾検出の説明図である。
【符号の説明】
  CPU 2 プログラムメモリ 3 データメモリ 4  CRTデイスプレィ 6 画像メモリ 7 マウス 8 キーボード 10 補助記憶装置 12 ガイドライン付きハンディスキャナー装置20 
人力装置 スタートライン センターライン 読み取り窓 スタートライン センターライン 画面 枠 スタートライン センターライン
【書類芯】
図面
【図1】
【図2】
【図5】
【図6】
【図7】
【図8】
【図9】
【図11】
【図12】
【図13】
【図14】
【図151 【図16】 [図17】
【図19】
【図20】
【図18】
【書類名】 【提出日】 【あて先】 【事件の表示】 【出願番号】 【発明の名称】 【補正をする者】 【事件との関係】 【識別番号】 【氏名又は名称】 【代理人】 【識別番号】 【弁理士】 【氏名又は名称】 【発送番号】
【手続補正 1】
【補正対象書類名】 【補正対象項目名】 【補正方法】 【補正の内容】 【代理人】 【識別番号】 【弁理士】 【氏名又は名称】
【手続補正 2】
【補正対象書類名】
【補正対象項目名】 【補正方法】 【補正の内容】
手続補正書 平成3年4月22日

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】抽出すべき目的単語領域の先頭基準位置及
    び行基準位置の情報を有する入力画像について、行基準
    位置より上下に水平射影を調べることにより目的単語領
    域の行を切り出し、切り出した行の範囲について、先頭
    基準位置の近傍の垂直射影を調べることによって目的単
    語領域の先頭位置を検出し、検出した先頭位置の後の垂
    直射影を調べることによって目的単語領域の末尾位置を
    検出する単語領域抽出方式において、入力画像を行方向
    に一定の重なりを持つ複数の領域に分割し、先頭の分割
    領域から末尾の分割領域へ向かって分割領域毎に、直前
    の分割領域の行切り出し結果を参照しながら目的単語領
    域の行の切り出しを行なうことを特徴とする単語領域抽
    出方式。
  2. 【請求項2】各分割領域の行切り出しにおいて、行の上
    端及び下端の探索限界を設定し、それぞれの探索限界を
    超えても、行の上端または下端に対応した水平射影値が
    閾値以上から閾値未満へ変化する位置を検出できないと
    きは、上端または下端で行接続が起こったと判断し、水
    平射影値を利用した接続行を強制分離する処理によって
    目的単語領域の行の上端または下端の位置を決定するこ
    とを特徴とする請求項1記載の単語領域抽出方式。
  3. 【請求項3】各分割領域の行切り出しにおいて、二つ以
    上の行が切り出された場合に、一定の条件を満たすとき
    に二つ以上の行を併合することを特徴とする請求項1記
    載の単語領域抽出方式。
JP2410749A 1990-07-27 1990-12-14 単語領域抽出方式 Pending JPH04112282A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2410749A JPH04112282A (ja) 1990-07-27 1990-12-14 単語領域抽出方式

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP19959990 1990-07-27
JP2-199599 1990-07-27
JP2410749A JPH04112282A (ja) 1990-07-27 1990-12-14 単語領域抽出方式

Publications (1)

Publication Number Publication Date
JPH04112282A true JPH04112282A (ja) 1992-04-14

Family

ID=26511630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2410749A Pending JPH04112282A (ja) 1990-07-27 1990-12-14 単語領域抽出方式

Country Status (1)

Country Link
JP (1) JPH04112282A (ja)

Similar Documents

Publication Publication Date Title
JP2835178B2 (ja) 文書読取装置
JPH1139428A (ja) 文書映像の方向修正方法
JP4757001B2 (ja) 画像処理装置、画像処理方法
JP2013171309A (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JPH08180068A (ja) 電子ファイリング装置
JPH08329187A (ja) 文書読取装置
JPH04112282A (ja) 単語領域抽出方式
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JP3484446B2 (ja) 光学文字認識装置
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JPH09288714A (ja) 表認識方法および装置
JPH117493A (ja) 文字認識処理装置
JPH0728935A (ja) 文書画像処理装置
JPH05282493A (ja) 英文字認識装置
JPH09269970A (ja) 文字認識方法とその装置
JPH0714000A (ja) 表認識装置
JP2000011192A (ja) 画像間位置合わせ方法
JPH01292586A (ja) 文字認識支援装置
JPH04330586A (ja) 単語領域抽出方式
JP2827227B2 (ja) 文字認識方法
JP3116453B2 (ja) 英文字認識装置
JPH11242716A (ja) 画像処理方法および記録媒体
JPH06149888A (ja) 電子ファイリングシステム
JP2000187704A (ja) 文字認識装置及びその方法及び記憶媒体
JP2933947B2 (ja) 画像処理方法及び装置