JPH05252402A - 文書読取り装置 - Google Patents

文書読取り装置

Info

Publication number
JPH05252402A
JPH05252402A JP3331817A JP33181791A JPH05252402A JP H05252402 A JPH05252402 A JP H05252402A JP 3331817 A JP3331817 A JP 3331817A JP 33181791 A JP33181791 A JP 33181791A JP H05252402 A JPH05252402 A JP H05252402A
Authority
JP
Japan
Prior art keywords
data
character
background
document
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3331817A
Other languages
English (en)
Inventor
Masaki Izumi
雅喜 和泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Japan Ltd
Original Assignee
Eastman Kodak Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Japan Ltd filed Critical Eastman Kodak Japan Ltd
Priority to JP3331817A priority Critical patent/JPH05252402A/ja
Publication of JPH05252402A publication Critical patent/JPH05252402A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Color Image Communication Systems (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【目的】 黒の文字及び黄色の背景などの文字部と色付
背景部の両方を有する文書を確実に読み取ることが可能
な文書読取り装置を提供する。 【構成】 文書10の情報はCCDカラーラインセンサ
16にて電気信号に変換され、増幅器18にて増幅され
た後、A/Dコンバータ20にてデジタル信号に変換さ
れる。デジタル信号に変換された文書データは文字二値
化回路22、背景二値化回路24に入力され、それぞれ
文字データ及び背景データが出力される。背景データは
さらに処理回路26、エッジ抽出回路28にて背景の輪
郭部のみが抽出され、文字データと輪郭データは合成回
路30にて合成され出力される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文書読取り装置、特に文
字及び色付き背景を有する文書を読取る装置に関する。
【0002】
【従来の技術】近年、情報化社会の到来とともに取り扱
う情報量が飛躍的に増大し、これに伴い取り扱うべき文
書量も増大の一途をたどっている。そこで、このような
多量の文書を高速かつ効率的に処理すべく、文書データ
を読取りデジタルデータとしてコンピュータで取扱い可
能とし、編集や整理を行い適宜CRTやプリンタ等の出
力機器に出力するファイリングシステムの開発が進んで
いる。
【0003】図8にはこのようなファイリングシステム
に用いられる従来の文書読取り装置の構成ブロック図が
示されている。文字が印刷された文書10が図示しない
搬送系により所定位置まで搬入され、蛍光灯等の光源を
含む照明系12により文書10の所定ラインに読取り光
が照射される。文書10の表面で反射された光はレンズ
を含む光学系14により集光され、CCDラインセンサ
16に結像される。CCDラインセンサ16は複数のC
CDを一列に配列して構成され、各CCDは入射した光
の光量に応じた電気信号を順次出力する。従って、この
CCDラインセンサ16からは文書10の濃淡で表現さ
れる文字情報が電気信号の形でライン毎に順次出力され
る。
【0004】CCDラインセンサ16からの電気信号は
増幅器18にて増幅された後、A/Dコンバータ20に
て所定のサンプリング周波数でデジタル信号に変換され
る。そして、デジタル信号に変換された文書データは二
値化回路22に入力され、0(白)または1(黒)のい
ずれかに二値化されて出力される。ここで、二値化回路
22での二値化処理はしきい値とA/Dコンバータ20
から供給される文書データとの大小比較により行われ、
しきい値としてはある固定値や読みとるべき文書10の
コントラストに応じて設定する浮動しきい値等が用いら
れる。すなわち、文書10の各画素のデジタル値(輝
度)がしきい値以上の場合には0と判定されて背景デー
タとなり、しきい値以下の場合には1と判定されて文字
データとなる。
【0005】
【発明が解決しようとする課題】ここで、従来の文書は
白紙に黒文字が印刷されたものが主であったが、最近で
は文字の他に例えば色付きの背景が印刷された文書が用
いられるようになっている。図7にはこのように文字と
色付背景が印刷された文書の一例が示されている。「イ
ーストマン・・」の文字は黒インクで印刷され、一方図
中斜線で示す背景部は黄色インクで印刷されている。
【0006】このような文書を従来の文書読取り装置で
読みとると、各画素のデジタル値がしきい値以上かある
いは以下かで1または0に二値化されてしまうため、文
字データを読み取ろうとしてしきい値を高く設定すると
図9(A)に示されるように背景データが欠落し、逆に
背景データを読み取ろうとしてしきい値を低く設定する
と図9(B)に示されるように文字データが欠落してし
まう問題があった。
【0007】なお、図7に示されるような文字部と色付
背景部を有する文書を二値化する方法としては、ディザ
法(疑似階調法)が知られているが、ディザ法によるデ
ータ出力は一般に圧縮率が低く効率のよいファイリング
が困難となる問題がある。
【0008】また、CCDラインセンサ16の代わりに
カラースキャナを用いれば文字と色付背景を読み取るこ
とはできるが、出力は一般的に多値データとなるため同
様にファイリングの効率が低い問題がある。
【0009】本発明は上記従来技術の有する課題に鑑み
なされたものであり、その目的は文字部と色付背景部を
有する文書を確実に読取り、ファイリングを効率よく行
うことが可能な文書読取り装置を提供することにある。
【0010】
【課題を解決するための手段】上記目的を達成するため
に、本発明の文書読取り装置は文字部と色付背景部とを
有する文書の濃淡を電気信号に変換する光電変換手段
と、前記電気信号から前記文字部に対応する文字信号を
二値化処理して文字データを抽出する文字処理手段と、
前記電気信号から前記色付部に対応する色付信号を二値
化処理して色付データを抽出する背景処理手段と、前記
色付データから前記色付部の輪郭に対応する輪郭データ
を抽出する輪郭抽出手段と、前記文字データと前記輪郭
データとを合成する合成手段とを有することを特徴とす
る。
【0011】
【作用】従来装置においては、単一の二値化回路のみを
用いて文字信号及び色付信号を二値化処理していたた
め、しきい値を調整してもいずれかの情報が欠落してし
まったが、本発明では文字信号を二値化する文字処理手
段と色付信号を二値化する背景処理手段を設け、さらに
色付部の輪郭部を抽出して文字データと合成することに
より、文字と色付部の同時読取りを可能としている。
【0012】
【実施例】以下、図面を用いながら本発明に係る文書読
取り装置の好適な実施例を説明する。
【0013】第1実施例 図1には本実施例の構成ブロック図が示されている。図
7に示されるような黒インクの文字部と黄色インクの背
景部を有する文書10は図示しない搬送系で所定位置に
搬入され、蛍光灯などの光源を含む照明系12から読取
り光が文書10の読取りラインに照射される。文書10
の読取りラインで反射された光はレンズを含む光学系1
4で集光され、CCDカラーラインセンサ16上に結像
される。CCDカラーラインセンサ16はR(赤)、G
(緑)、B(青)それぞれの光に感応する複数のCCD
を一列に配列して構成され、各CCDは入射した光の光
量に応じた電気信号を順次出力する。従って、このCC
Dカラーラインセンサ16からは文書10の濃淡で表現
される文字情報及び背景情報がR、G、Bそれぞれの電
気信号の形で読取りライン毎に順次出力される。
【0014】CCDカラーラインセンサ16からのR、
G、Bの電気信号は増幅器18a、18b、18cにて
それぞれ増幅された後、A/Dコンバータ20a、20
b、20cに供給され、所定のサンプリング周波数でそ
れぞれデジタル信号に変換される。
【0015】デジタル信号に変換された各R、G、B信
号は文字二値化回路22及び背景二値化回路24に入力
され、それぞれしきい値と大小比較されて0または1の
いずれかに二値化される。図2には文字二値化回路22
の構成例が示されており、また図3には背景二値化回路
24の構成例が示されている。文字二値化回路22は
R、G、B各信号をそれぞれのしきい値で二値化する二
値化回路22a、22b、22c及びこれら二値化回路
22a、22b、22cからの二値化データのANDを
取るAND回路22dから構成されている。ここで、
R、G、B各信号の二値化を行うためのしきい値1は文
字データのみを二値化するために、前述した図9(A)
に示されるような文字データのみが抽出されるようなし
きい値に設定される。そして、二値化回路22a、22
b、22cの出力はAND回路22dに供給されるた
め、二値化回路22a、22b、22cいずれも1、す
なわち黒色の文字データが存在する場合のみAND回路
22dから1が出力されることになる。このことは、黒
インクで印刷された図7の「イーストマン……」のみが
AND回路22dから出力されることを意味している。
【0016】一方、背景二値化回路24は図3に示され
るようにR、G、B各信号の二値化を行う二値化回路2
4a、24b、24c及びこれら二値化回路24a、2
4b、24cからの出力のORをとるOR回路24dか
ら構成されている。ここで、二値化回路24a、24
b、24cのしきい値2は前述した図9(B)に示され
るように背景部のみが抽出されるようなしきい値に設定
される。そして、これら二値化回路24a、24b、2
4cの出力はOR回路24dに接続されているため、こ
れら二値化回路24a、24b、24cのいずれもが0
でない限り1が出力されるため、文書10の白紙部分以
外、すなわち文字データの黒色を含めて色付背景部全体
が出力されることになる。
【0017】このように、文字二値化回路22からは文
字データが出力され、背景二値化回路24からは背景デ
ータが出力されるが、色付背景部が例えば網点印刷のよ
うに点の集合で構成されている場合、背景二値化回路2
4からの背景データはノイズである高周波成分を含むこ
とになる。従って、本実施例においてはこのような高周
波ノイズを除去するため、ローパスフィルタやノイズ除
去フィルタで構成される処理回路26を設けて高周波成
分を除去している。さらに、背景データのうち、色付背
景部の輪郭のみを抽出するためにエッジ抽出回路28が
設けられており、処理回路26からのノイズ除去済の背
景データ信号から輪郭部に相当するデータ信号のみが抽
出される。エッジ抽出回路28としては公知の回路を用
いることができ、本実施例においてはラプラシアンフィ
ルタを用いた畳込み処理により背景データの高周波成
分、すなわち輪郭のみを抽出している。
【0018】そして、文字二値化回路22からの文字デ
ータ及びエッジ抽出回路28にて抽出された輪郭データ
は共に加算器で構成される合成回路30に供給され、文
字データと輪郭データとが合成されて出力される。図4
にはこのように文字データと色付背景の輪郭データとが
合成されて出力された一例が示されている。背景データ
の輪郭部のみを抽出して文字データと合成しているた
め、文字データが背景データに埋没することなく、文字
データを読み取ることができると共に色付背景が文書1
0にあったことを示す輪郭をも明瞭に読み取ることが可
能となる。
【0019】第2実施例 図5には本発明の第2の実施例の構成ブロック図が示さ
れている。本実施例においては、前述した第1実施例の
ように黒の文字部と黄色の背景部を有する文書10を読
み取るのではなく、黒の文字部、黄色の背景部に加え、
さらに赤の文字部が黒の文字部及び黄色の背景部に隣接
して印刷されている文章を読み取る場合を想定してい
る。このような文書を前述した第1実施例の文書読取り
装置で読み取った場合には、赤の文字部に相当する文字
データは図1における処理回路26で高周波ノイズとし
て除去されてしまい、合成回路30からの出力には含ま
れないこととなり、情報が欠落してしまう。本第2実施
例ではこのような点に鑑み、新たに除去回路32が設け
られている。この除去回路32は減算回路を含んで構成
され、背景二値化回路24からの出力データから処理回
路26からの背景データを除去する。ここで、前述した
ように赤の文字部を有する文書を読み取った場合、背景
データにはこの赤の文字データと黄色の背景データが混
在しているが、このうち黄色の背景データはこの除去回
路32で除去されるため、この除去回路32からは赤の
文字データのみが出力されることになる。従って、合成
回路30にて前述した第1実施例と同様の文字データ、
エッジ抽出回路28からの輪郭データ並びに除去回路3
2からのデータを供給し、これらを合成して出力するこ
とにより黒の文字部、黄色の背景部、並びに赤の文字部
全てを読み取って出力することが可能となる。
【0020】第3実施例 図6には本発明の第3実施例の構成ブロック図が示され
ている。本実施例においては、前述した第1、第2実施
例と異なり、ラインセンサとしてCCD白黒ラインセン
サが用いられている点が相違する。このように白黒ライ
ンセンサを用いた場合でも、低いしきい値の文字二値化
回路22及び高いしきい値の背景二値化回路24にてそ
れぞれ文字データ及び文字データを含む背景データを抽
出し、背景データからさらに処理回路26及びエッジ抽
出回路28を介して輪郭データを抽出しこれらを合成回
路30にて合成することにより、黒の文字部及び背景部
を同時に読み取ることが可能となる。
【0021】
【発明の効果】以上説明したように、本発明に係る文書
読取り装置によれば、文字部と色付背景部を有する文書
を読み取る場合にも、いずれかのデータが欠落すること
なく、文字及び背景両情報を同時に読み取ることが可能
となり、ファイリングシステムの効率化を図ることが可
能となる。
【図面の簡単な説明】
【図1】本発明の一実施例の構成ブロック図である。
【図2】同実施例の文字二値化回路の構成ブロック図で
ある。
【図3】同実施例の背景二値化回路の構成ブロック図で
ある。
【図4】同実施例の画像読取り装置にて読み取った出力
例を示す説明図である。
【図5】本発明の他の実施例の構成ブロック図である。
【図6】本発明の他の実施例の構成ブロック図である。
【図7】文字部及び色付背景部を有する文書の一例を示
す説明図である。
【図8】従来装置の構成ブロック図である。
【図9】従来装置による文書読取りの出力例を示す説明
図である。
【符号の説明】
10 文書 16 CCDラインセンサ 20 A/D 22 文字二値化回路 24 背景二値化回路 28 エッジ抽出回路 30 合成回路

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文字部と色付部とを有する文書の濃淡を
    電気信号に変換する光電変換手段と、 前記電気信号から前記文字部に対応する文字信号を二値
    化処理して文字データを抽出する文字処理手段と、 前記電気信号から前記色付部に対応する色付信号を二値
    化処理して色付データを抽出する背景処理手段と、 前記色付データから前記色付部の輪郭に対応する輪郭デ
    ータを抽出する輪郭抽出手段と、 前記文字データと前記輪郭データとを合成する合成手段
    と、 を有することを特徴とする文書読取り装置。
JP3331817A 1991-12-16 1991-12-16 文書読取り装置 Pending JPH05252402A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3331817A JPH05252402A (ja) 1991-12-16 1991-12-16 文書読取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3331817A JPH05252402A (ja) 1991-12-16 1991-12-16 文書読取り装置

Publications (1)

Publication Number Publication Date
JPH05252402A true JPH05252402A (ja) 1993-09-28

Family

ID=18247981

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3331817A Pending JPH05252402A (ja) 1991-12-16 1991-12-16 文書読取り装置

Country Status (1)

Country Link
JP (1) JPH05252402A (ja)

Similar Documents

Publication Publication Date Title
JP4189506B2 (ja) 画像処理のための装置、方法及び記録媒体
US7170647B2 (en) Document processing apparatus and method
JP3088010B2 (ja) 線画分離方法および装置
JP2003152995A (ja) 画像処理装置
JP3753357B2 (ja) 文字抽出方法および記録媒体
JPH04295978A (ja) 画像読み取り装置
JPH08235355A (ja) 画像処理装置
US5055944A (en) Image signal processing apparatus
JPH04288692A (ja) 画像入力装置
JPH05252402A (ja) 文書読取り装置
JPH11341295A (ja) 画像処理方法
JPH08123901A (ja) 文字抽出装置及び該装置を用いた文字認識装置
JPH10108012A (ja) 像域分離装置
JP4383429B2 (ja) 帳票イメージ処理方法及びその装置
JP3839221B2 (ja) 帳票イメージ処理方法及びその装置
JP3210378B2 (ja) 画像入力装置
JP2670372B2 (ja) 2値化方式
JPS6255348B2 (ja)
JPH02274173A (ja) 文字分離装置
JPH06243290A (ja) 光学式文字読取装置
JP2853140B2 (ja) 画像領域識別装置
JPH04291683A (ja) デジタル画像処理装置
JPH0778831B2 (ja) 画像信号処理装置
JP2700352B2 (ja) 下地ノイズ除去2値化処理装置
JPH03125287A (ja) 文字認識装置