JPH02187883A - 文書読取装置 - Google Patents

文書読取装置

Info

Publication number
JPH02187883A
JPH02187883A JP1006879A JP687989A JPH02187883A JP H02187883 A JPH02187883 A JP H02187883A JP 1006879 A JP1006879 A JP 1006879A JP 687989 A JP687989 A JP 687989A JP H02187883 A JPH02187883 A JP H02187883A
Authority
JP
Japan
Prior art keywords
black
area
black area
group
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1006879A
Other languages
English (en)
Other versions
JP2579356B2 (ja
Inventor
Kazumi Matsuura
松浦 一巳
Fumio Yoda
依田 文夫
Keiji Kobayashi
啓二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP1006879A priority Critical patent/JP2579356B2/ja
Publication of JPH02187883A publication Critical patent/JPH02187883A/ja
Application granted granted Critical
Publication of JP2579356B2 publication Critical patent/JP2579356B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は、文書を光学的に走査し、光電変換して得ら
れた文書画像から文字列中の文字を切り出して認識する
ことにより文書を読取る文書読取装置に係わり、特に文
字列切り出し処理に関するものである。
[従来の技術] 第7図は、例えば「印刷文書の文字列切り出し」 (昭
和63年電子情報通信学会秋季全国大会予稿集D−20
2)に記載されたような従来の文書読取装置を示すブロ
ック襦成図である。
図において、1は用紙等に印刷された文書を光学的に走
査し、光電変換して文書画像を得る文書画像入力手段、
2は文書画像入力手段1で得られた文書画像を走査し、
黒画素の連結成分から成る領域を黒領域として検出する
黒領域検出手段、3は黒領域検出手段2で得られた黒領
域群を走査し、同−段組中の本文文字列群から成る股領
域を検出する股領域検出手段、4は股領域検出手段3で
得られた各段領域内で本文文字列の領域を検出する本文
文字列検出手段、5は本文文字列検出手段4で検出した
各本文文字列の領域で個々の文字を切り出して認識する
文字切り出し・認識手段である。なお、上記文書画像入
力手段1はイメージ・スキャナにより実現され、黒領域
検出手段2〜文字切り出し・認識手段5は画像メモリを
備えたコンピュータ・システムにより実現される。
第8図から第11図までに示した図は、上記第7図に示
した従来の文書読取装置の具体的な動作例を示す図であ
る。
第8図の6は文書画像入力手段1によって入力された文
書画像、第9図の7は黒領域検出手段2で得られた黒領
域群から求めた矩形群、第10図の8は股領域検出手段
3で得られた股領域、第11図の9は本文文字列検出手
段4で得られた本文文字列から求めた矩形群である。
又、第12図の10は、デイスプレィ等の表示装置に表
示された文書画像6上で、マウス等の指示装置を用いて
読取範囲の右上端と左下端の2点を指示することによっ
て、読取範囲を部分的に指示した結果を表示した表示装
置の画面である。
次に動作について説明する。
文書画像入力手段1では、文書を光学的に走査して光電
変換し、文字部が黒画素であり、背景部が白画素である
2値の文書画像6を得る。
黒領域検出手段2では、人力された上記2値の文書画像
6に対してラベリング等の画像処理を行うことにより、
黒画素の連結成分から成る黒領域を検出し、検出した各
黒領域の外接矩形を求めて矩形群7を得る。この時、罫
線の除去も行う。
股領域検出手段3では、黒領域検出手段2で得られた上
記矩形群7を走査し、矩形の幅が読取るべき本文文字列
の幅に近くて、且つ、その矩形の上端及び下端がそれぞ
れ隣接する矩形の上端及び下端とほぼ等しい場合、これ
らの矩形に対応する黒領域を結合した領域を股領域8と
して検出する。
本文文字列検出手段4では、股領域検出手段3で得られ
た上記股領域8毎に黒領域検出手段2で得られた矩形群
7を走査し、本文文字列と判定した矩形群9に対応する
黒領域をJ・1次並べる。
文字切り出し・認識手段5では、本文文字列検出手段4
で本文文字列と判定された黒領域毎に個々の文字パター
ンを切り出して認識する。
[発明が解決しようとする課題] 従来の文書読取装置は以上のように構成されていたので
、股領域検出手段や本文文字列検出手段で股領域や本文
文字列の検出を誤った場合、修正に手間がかかるといっ
た問題点があった。例えば、見出しや図の一部を本文文
字列と誤って判定した場合や本文文字列を検出できなか
った場合、指示された読取範囲内の全ての文字を修正す
る必要があり、認識結果の修正を行う為の文字の削除や
挿入に多くの時間がかかるといった問題点があった。
更に、検出した全ての本文文字列の領域のnil Ba
結果が出力されるので、その内の一部分だけが必要な場
合は不必要な部分を削除しなければならないといった問
題点があった。これに対処する方法としては、第12図
に示すように、文書画像を表示装置に表示して読取範囲
を指定し、指定された範囲の文書画像だけを処理する方
法があるが、この方法では、文書画像上での正確な位置
を指示する必要がある為に、解像度の大きな表示装置を
用いる必要があり、装置が高価になるといった問題点が
あった。
この発明は上記のような間;垣点を解消するためになさ
れたもので、簡単に読取るべき文字列の領域の入力がで
きる文書読取装置を得ることを目的とする。
[課題を解決するための手段] この発明に係る文書読取装置は、黒領域検出手段で検出
された黒領域群を表示する表示手段と、表示された黒領
域群の中から読取るべき黒領域を指示する指示手段と、
指示された黒領域群及びその指示順序から読取るべき黒
領域群及びその読取順序を決定する読取領域決定手段と
を備えたものである。
[作用コ この発明における文書読取装置は、黒領域検出手段で得
られた黒領域群をデイスプレィ等の表示装置に表示し、
オペレータがマウス等の指示装置を用いて表示装置に表
示された黒領域群の中から読取るべき黒領域を指示する
ことにより、容易に読取るべき黒領域、すなわち文字列
を決定することができる。
[実施例] 以下、この発明の一実施例を図について説明する。
第1図は実施例の文書読取装置を示すブロック構成図で
あり、前記第7図に示した従来例と同−又は相当部分に
は同一符号を付してその説明は省略する。
図において、11は黒領域検出手段2で検出された黒領
域の外接矩形をデイスプレィ等の表示装置に表示する表
示手段、12は表示手段11で表示された矩形群の中か
ら読取るべき黒領域に対応する矩形をマウス等の指示装
置で指示する指示手段、13は指示手段12で指示され
た矩形群とその指示順序に基づいて読取るべき黒領域と
その読取順序を決定する読取領域決定手段である。なお
、上記表示手段11.指示手段12及び読取領域決定手
段13は、デイスプレィ等の表示装置やマウス等の指示
装置を備えたコンピュータ・システムにより実現される
第2図から第6図までに示した図は、上記第1図に示し
た文書読取装置の具体的な動作例を示す図である。
第2図の7は黒領域検出手段2で検出した黒領域の外接
矩形を表示手段11により表示装置に表示した矩形群、
第3図の14はオペレータが指示手段12により2表示
装置に表示された矩形群7の中から読取を開始する黒領
域に対応する矩形を指示し、表示手段11が指示された
矩形を反転表示した画面、第4図の15はオペレータが
指示手段12により2表示装置に表示された矩形群の中
から読取を終了する黒領域に対応する矩形を指示し、表
示手段11が指示された矩形を反転表示した画面、第5
図の16は前記画面14及び画面15におけるオペレー
タの指示に基づいて読取領域決定手段13が読取るべき
黒領域群を決定し、表示手段11が読取領域に決定され
た黒領域に対応する表示装置に表示された矩形を反転表
示した両面、第6図の17は読取領域決定手段13によ
り読取領域と決定され、文字切り出し・認識手段5に送
られる黒領域群に対応する矩形群である。
次に動作について説明する。
表示手段11は、黒領域検出手段2で検出した黒領域の
外接矩形群7をデイスプレィ等の表示装置に表示する。
オペレータは、表示装置に表示された矩形群7の中から
読取るべき黒領域に対応する矩形を指示手段12の指示
装置を用いて指示する。この指示方法は、先ず、オペレ
ータが読取を開始する黒領域に対応する表示装置に表示
された矩形を指示手段12を用いて指示すると、表示手
段11は指示された矩形を反転表示した画面14を表示
装置に表示する。次に、オペレータが読取を終了する黒
領域に対応する表示装置に表示された矩形を指示手段1
2の指示装置を用いて指示すると、表示手段11は指示
された矩形を反転表示した画面15を表示装置に表示す
る。これらの指示は、指示すべき矩形内の任意の1点を
マウス等で指示することにより行う。この後、読取領域
決定手段13はオペレータによって指示された矩形間に
存在する全ての矩形を読取領域に対応する矩形として検
出する。そして、表示手段11は検出された矩形群を反
転表示した画面16を表示装置に表示する。読取領域決
定手段13は、反転表示した矩形群17に対応する黒領
域群を読取領域群として、読取開始黒領域から読取終了
黒領域の方向にある読取対象の黒領域を文字切り出し・
認識手段5に順次転送する。
なお、上記実施例では、指示手段は読取範囲にある読取
領域の指定を2つの矩形を指示することにより行ってい
るが、読取領域に対応する矩形を1個ずつ読取順序に従
って指示しても良い。
又、表示手段は、黒領域検出手段で検出された黒領域の
外接矩形だけを表示しているが、外接矩形内又は黒領域
内の文書画像を重ね合わせて表示しても良い。
更に、黒領域検出手段は、文書画像上で黒画素が密集す
る領域を検出できる手段であれば良く、文書画像を走査
して求めた黒画素の周辺分布値を用いて黒領域を求める
手段等の周知の手段を用いても良い。
[発明の効果] 以上のように、この発明によれば、黒領域検出手段の後
に表示手段と指示手段と読取領域決定手段を設け、黒領
域検出手段で得られた黒領域群を表示し、表示さ九た黒
領域群の中から読取るべき黒領域を指示することにより
読取領域の決定を行うようにしたので、読取領域を部分
的に且つ容易に指示することができる効果が得られる。
【図面の簡単な説明】
第1図はこの発明の一実施例による文書読取装置を示す
ブロック構成図、第2図ないし第6図は実施例の動作例
を示す図、第7図は従来の文書読取装置を示すブロック
構成図、第8図ないし第12図は従来の文書読取装置の
動作例を示すブロック構成図である。 1は文書画像入力手段、2は黒領域検出手段、5は文字
切り出し・認識手段、11は表示手段、12は指示手段
、13は読取領域決定手段。

Claims (1)

    【特許請求の範囲】
  1. 文書を光学的に走査し、光電変換して得られた文書画像
    から黒画素が密集する領域を黒領域として検出し、検出
    された黒領域群から文字列中の文字を切り出して認識す
    ることにより文書を読取る文書読取装置において、検出
    された黒領域群を表示する表示手段と、表示された黒領
    域群の中から読取るべき黒領域を指示する指示手段と、
    指示された黒領域群及びその指示順序から読取るべき黒
    領域群及びその読取順序を決定する読取領域決定手段と
    を備えたことを特徴とする文書読取装置。
JP1006879A 1989-01-13 1989-01-13 文書読取装置 Expired - Fee Related JP2579356B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1006879A JP2579356B2 (ja) 1989-01-13 1989-01-13 文書読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1006879A JP2579356B2 (ja) 1989-01-13 1989-01-13 文書読取装置

Publications (2)

Publication Number Publication Date
JPH02187883A true JPH02187883A (ja) 1990-07-24
JP2579356B2 JP2579356B2 (ja) 1997-02-05

Family

ID=11650511

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1006879A Expired - Fee Related JP2579356B2 (ja) 1989-01-13 1989-01-13 文書読取装置

Country Status (1)

Country Link
JP (1) JP2579356B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0388087A (ja) * 1989-08-31 1991-04-12 Toshiba Corp 文書読取装置
JP2008171356A (ja) * 2007-01-15 2008-07-24 Ricoh Co Ltd 画像処理装置、画像形成装置、画像処理方法、画像処理プログラムおよび記録媒体

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58169682A (ja) * 1982-03-31 1983-10-06 Toshiba Corp 文字画像処理装置
JPS60163171A (ja) * 1984-02-06 1985-08-26 Hitachi Ltd 文章読取装置
JPS61198375A (ja) * 1985-02-28 1986-09-02 Toshiba Corp 光学的文字読取装置
JPS62226287A (ja) * 1986-03-28 1987-10-05 Hitachi Ltd 文書画像の領域分割方式
JPS62243084A (ja) * 1986-04-16 1987-10-23 Oki Electric Ind Co Ltd 文字切出し方式
JPS62298887A (ja) * 1986-06-18 1987-12-25 Nec Corp 文字認識装置
JPS6337487A (ja) * 1986-08-01 1988-02-18 Matsushita Electric Ind Co Ltd 文字認識装置
JPS63109591A (ja) * 1986-10-27 1988-05-14 Sharp Corp 光学的文字読取装置
JPS6419487A (en) * 1987-07-15 1989-01-23 Matsushita Electric Industrial Co Ltd Character recognizing device

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58169682A (ja) * 1982-03-31 1983-10-06 Toshiba Corp 文字画像処理装置
JPS60163171A (ja) * 1984-02-06 1985-08-26 Hitachi Ltd 文章読取装置
JPS61198375A (ja) * 1985-02-28 1986-09-02 Toshiba Corp 光学的文字読取装置
JPS62226287A (ja) * 1986-03-28 1987-10-05 Hitachi Ltd 文書画像の領域分割方式
JPS62243084A (ja) * 1986-04-16 1987-10-23 Oki Electric Ind Co Ltd 文字切出し方式
JPS62298887A (ja) * 1986-06-18 1987-12-25 Nec Corp 文字認識装置
JPS6337487A (ja) * 1986-08-01 1988-02-18 Matsushita Electric Ind Co Ltd 文字認識装置
JPS63109591A (ja) * 1986-10-27 1988-05-14 Sharp Corp 光学的文字読取装置
JPS6419487A (en) * 1987-07-15 1989-01-23 Matsushita Electric Industrial Co Ltd Character recognizing device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0388087A (ja) * 1989-08-31 1991-04-12 Toshiba Corp 文書読取装置
JP2008171356A (ja) * 2007-01-15 2008-07-24 Ricoh Co Ltd 画像処理装置、画像形成装置、画像処理方法、画像処理プログラムおよび記録媒体

Also Published As

Publication number Publication date
JP2579356B2 (ja) 1997-02-05

Similar Documents

Publication Publication Date Title
US7170647B2 (en) Document processing apparatus and method
JP3756719B2 (ja) 文書修飾装置及び画像処理装置
JP4574503B2 (ja) 画像処理装置、画像処理方法およびプログラム
JPH02187883A (ja) 文書読取装置
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP2661898B2 (ja) 文字認識装置
JPH0548510B2 (ja)
JPH02210586A (ja) 表領域分離装置および表領域分離方法
JPH0564396B2 (ja)
JPS63304387A (ja) 文書読取装置
JP2800192B2 (ja) 高速文字図形分離装置
JP2007081882A (ja) 原稿読取装置および原稿読取方法
JP2734628B2 (ja) 文字認識装置
JP2803735B2 (ja) 罫線を含んだ文字認識装置
JP2004213215A (ja) 画像入力方法及び画像入力装置
JP2925300B2 (ja) 光学的文字読取装置
JPS6031682A (ja) 印刷文書画像の領域抽出方法および装置
JP2980636B2 (ja) 文字認識装置
JPH05174179A (ja) 文書画像処理装置
JPH02193278A (ja) 画像処理装置
JPS61165184A (ja) 基準点自動検出処理方法
JPS62114077A (ja) 画素特徴抽出装置
JPH03160582A (ja) 文書画像データに於ける罫線と文字の分離方法
JPS63184181A (ja) 光学文字認識装置
JPS63316563A (ja) 画像読取装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees