JPH10240868A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPH10240868A
JPH10240868A JP9043904A JP4390497A JPH10240868A JP H10240868 A JPH10240868 A JP H10240868A JP 9043904 A JP9043904 A JP 9043904A JP 4390497 A JP4390497 A JP 4390497A JP H10240868 A JPH10240868 A JP H10240868A
Authority
JP
Japan
Prior art keywords
character
recognition
logical
unit
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9043904A
Other languages
English (en)
Inventor
Yuji Hamazaki
祐児 浜崎
Yoshimi Yamada
義美 山田
Hajime Sato
元 佐藤
Susumu Naitsu
将 内津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP9043904A priority Critical patent/JPH10240868A/ja
Publication of JPH10240868A publication Critical patent/JPH10240868A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 二値化された帳票イメージに対する文字認識
を行う文字認識装置における認識率を向上させる。 【解決手段】 二値化された帳票1のイメージI1は、
ファクシミリ装置(FAX)2によって受信され、イメ
ージメモリ3に格納される。切出部4は、帳票イメージ
の文字単位の領域I2を切出す。フィルタ部10は、異
なるルールでフィルタリング処理を行う5つの論理フィ
ルタ11〜15を有しており、最初に例えば論理フィル
タ11を選択して用い、領域I2中の文字パタンの整形
を行う。その整形された文字パタンに対して認識部21
が文字認識を行う。ここで、文字認識が不能の場合、認
識制御部22の指示により、論理フィルタ11〜15の
選択が変更され、変更された論理フィルタ12を用いた
文字パタンの整形と文字認識が行われる。以下、同様の
処理が繰り返され、複数回の文字認識が行われる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、光学式文字読取装
置(以下、OCRという)等に代表される文字読取装置
に関するものであある。
【0002】
【従来の技術】従来のOCRは、帳票の画像を多値画像
として取り込み、該多値画像に対して予め設定された閾
値で、濃度に関する二値化を行う。この二値化の結果得
られた二値化画像に対して文字認識を行い、帳票に記入
または印刷されたされた文字を認識してその文字コード
を出力する。従来では、文字認識の認識率を向上するた
めに、最初の文字認識でリジェクト(文字コードが検索
できない事象)が発生すると、二値化の際の閾値を変更
して二値化画像中の文字パタンを変化させ、複数回の文
字認識を行う。これにより、高い文字認識率が得られて
いる。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
OCRでは、次のような課題があった。最近、ファクシ
ミリ通信された帳票イメージに対する文字認識を行うと
いう需要が増えており、入力手段がファクシミリ装置と
して構成されたOCRが、商品化されている。ところ
が、ファクシミリ装置を介してOCRに入力される画像
データは多値画像ではなく、二値で表された二値画像で
ある。そのため、1回しか文字認識が行われず、文字認
識における認識率が向上できなかった。
【0004】
【課題を解決するための手段】前記課題を解決するため
に、本発明のうちの第1の発明は、文字認識装置におい
て、次のような受信手段、イメージメモリ、切出部、フ
ィルタ部、認識部及び認識制御部を設けている。受信手
段は、二値化された帳票イメージを受信するものであ
る。イメージメモリは、前記帳票イメージを格納するも
のである。切出部は、前記イメージメモリに格納された
帳票イメージから、読取対象の文字パタンを含む領域を
切り出すものである。フィルタ部は、前記領域中の各画
素の値を周辺画素の状況に応じて異なるルールでそれぞ
れ再設定する複数の論理フィルタを有し、該複数の論理
フィルタのうち指示された論理フィルタを用いて該領域
中の文字パタンを整形するものである。認識部は、前記
整形された文字パタンに対する文字認識を行い、該文字
認識で得られた文字コードを出力するものである。そし
て、認識制御部は、前記フィルタ部に対して前記指示を
与える機能と、該指示を与えた結果で前記文字コードが
得られなかった場合に、前記フィルタ部に新たな指示を
出し該フィルタ部で用いる論理フィルタを変更する機能
とを有し、該フィルタ部及び前記認識部における処理を
複数回実行させるものである。
【0005】第2の発明は、文字認識装置において、次
のような受信手段、イメージメモリ、切出部、フィルタ
部、認識部及び認識制御部を設けている。受信手段は、
二値化された帳票イメージを受信するものである。イメ
ージメモリは、前記帳票イメージを格納するものであ
る。切出部は、前記イメージメモリに格納された帳票イ
メージから、読取対象の文字パタンを含む領域を切り出
すものである。フィルタ部は、前記領域中の各画素の値
を周辺画素の状況に応じて異なるルールでそれぞれ再設
定する複数の論理フィルタを有し、該複数の論理フィル
タのうち指示された論理フィルタを用いて該領域中の文
字パタンを整形するものである。認識部は、前記整形さ
れた文字パタンに対する文字認識を行い、該文字認識で
得られた文字コード或いは該文字認識で付随して得られ
る該文字パタンに関する情報を出力するものである。認
識制御部は、前記フィルタ部に対して前記指示を与える
機能と、該指示を与えた結果で前記文字コードが得られ
なかった場合に、前記文字パタンに関する情報に応じて
前記フィルタ部に新たな指示を出し該フィルタ部で用い
る論理フィルタを任意に変更する機能とを有し、該フィ
ルタ部及び前記認識部における処理を複数回実行させる
ものである。
【0006】第1及び第2の発明によれば、以上のよう
に文字認識装置を構成したので、イメージメモリに格納
される帳票イメージは、二値で表された二値画像である
が、フィルタ部の論理フィルタを変更することで、認識
対象の文字の文字パタンが変化する。このように変化し
た文字パタンに文字認識を行えば、文字コードが抽出し
やすくなる。認識制御部が、指示を適宜フィルタ部に与
え、論理フィルタを変更するので、複数回の文字認識が
可能になる。従って、前記課題を解決できるのである。
【0007】
【発明の実施の形態】図1は、本発明の実施形態を示す
文字認識装置の構成ブロック図である。この文字認識装
置は、帳票1に記入または印刷された文字を認識するも
のであり、受信手段であるファクシミリ装置(FAX)
2を備えている。このファクシミリ装置2には、図示し
ない電話回線等を介して帳票1の二値化されたイメージ
が送られてくる。ファクシミリ装置2の出力側には、該
ファクシミリ装置2を介した帳票1のイメージI1を格
納するイメージメモリ3が接続されている。イメージメ
モリ3の出力側には切出部4が接続され、この切出部4
の出力側に、フィルタ部10が接続されている。論理フ
ィルタ部10の出力側にはパターンメモリ20が接続さ
れている。パターンメモリ20の出力側に認識部21が
接続されている。認識部21は、2つの出力先を持ち、
その一方の出力先がこの文字認識装置の出力端子OUT
になっている。他方の出力先が認識制御部22になって
いる。認識制御部22は、フィルタ部10に指示を与え
る構成になっている。
【0008】切出部3は、イメージメモリ3に格納され
たイメージから、例えぱ1文字単位の領域I2を切り出
す機能を有している。フィルタ部10は、例えば5個の
論理フィルタ11,12,13,14,15を有してい
る。各論理フィルタ11〜15の入力側が、切出部4の
出力側に接続され、各論理フィルタ11〜15の出力側
がパタンメモリ20の入力側に接続されている。これら
論理フィルタ11〜15は、それぞれ異なるルールで領
域I2中の画素の値を再設定するものである。フィルタ
部10は、認識制御部22からの指示で論理フィルタ1
1〜15のいずれかを選択し、その選択した論理フィル
タの出力する領域のデータをパタンメモリ20に与える
構成になっている。図2は、第1の論理フィルタ11〜
15によるフィルタリング処理を説明する図である。図
2には、隣接する9つの画素X1〜X9が示されてい
る。このうちのX5が注目画素であり、画素X1〜X
4,X6〜X9が周辺画素である。フィルタリング処理
を行う場合、各画素X1〜X9の値を次の(1)式に代
入し、その(1)式を計算した結果と、値Tとを比較し
て注目画素X5の値を設定する。
【0009】
【数1】 画素X1〜X9が白でその値がすべて“0”の場合に
は、(1)式の計算結果が値Tよりも小さくなり、注目
画素X5の値も“0”の白に設定される。画素X1〜X
9が黒でその値がすべて“1”の場合には、(1)式の
計算結果が例えば値Tよりも大きくなり、注目画素X5
の値も“1”の黒に設定される。このような注目画素の
設定を、論理フィルタ11〜15は領域I2の全画素に
対して行う。ここで、値Tは任意に設定でき、この値T
を変化させることで、フィルタリング処理結果が異な
る。一方、注目画素X5の値に重み付けを行って(1)
式の計算を行うことによっても、フィルタリング処理結
果が異なる。図3(a),(b)は、フィルタリング処
理のルールの具体例を説明する図であり、図4(a),
(b)は、図3(a),(b)による文字パタンの変化
をそれぞれ示す図である。
【0010】各論理フィルタ11〜15は、予め条件と
して与えられたそれぞれ異なるルールで、領域I2に対
するフィルタ処理を行うが、そのルールは、例えば
(1)式における注目画素X5の重み付けと、値Tの設
定値である。図3(a)では、値Tを3とし、注目画素
X5の値を白の場合“0”及び黒の場合“1”にしてい
る。図3(b)では、値Tを5とし、注目画素X5の値
を白の場合“0”及び黒の場合は重み付けして“3”に
している。図3(a)のルールを用いてフィルタリング
処理を行うと、図4(a)のように、文字パタンP1
が、文字パタンP2に変化する。図3(b)のルールを
用いてフィルタリング処理を行うと、図4(b)のよう
に、文字パタンP1が、文字パタンP3に変化する。文
字パタンP2と文字パタンP3とを比較すると、両方と
もノイズN1は除去されるが、その文字の線幅が異な
る。パタンP2の方が、切れがなく、また線幅も良く、
文字認識に適している。各論理フィルタ11〜15は、
注目画素の重み付けと値Tとの組み合わせが異なるよう
に条件付けされ、ルールの異なるフィルタリング処理で
ノイズの除去と文字パタンの平滑化を行うようになって
いる。
【0011】次に、図1の文字認識装置の動作を説明す
る。ファクシミリ装置2には、通信相手からのファクシ
ミリ信号が与えられる。このファクシミリ信号を受信す
ることによって、帳票1の二値化されたイメージI1が
入力され、そのイメージI1がイメージメモリ3に格納
される。切出部4は、イメージI1から1文字単位の領
域I2を切出す。領域I2には、認識対象の文字パタン
が含まれている。図1の文字認識装置は、この領域I2
に対する最初のの文字認識を行う(以下、1stスキャ
ンという)。1stスキャンでは、認識制御部22から
の指示で、フィルタ部10は論理フィルタ11を選択し
て活性化する。論理フィルタ11は、条件付けされたル
ールでフィルタリング処理を行い、(1)式を用いて領
域I2の各画素を再設定する。これにより、整形された
文字パタンは、パタンメモリ20に格納される。認識部
21が、パタンメモリに格納された文字パタンと辞書と
を比較して文字認識を行う。この1stスキャンの文字
認識で、認識対象文字に対応する文字コードが得られた
場合には、その文字コートが出力端子OUTから出力さ
れる。認識不能で文字コードが抽出できないときには、
認識部21からリジェクト信号が認識制御部22へ与え
られる。
【0012】リジェクト信号を受けた認識制御部22
は、フィルタ部10に対して新たな指示を与えて2回目
の文字認識処理(2ndスキャン)を実行させる。新た
な指示により、フィルタ部10は論理フィルタ12を選
択して活性化する。論理フィルタ12は、条件付けされ
たルールでフィルタリング処理を行い、(1)式を用い
て領域I2の各画素を再設定する。これにより、整形さ
れた文字パタンは、1stスキャンの場合と同様に、パ
タンメモリ20に格納され、認識部21が、パタンメモ
リに格納された文字パタンと辞書とを比較して文字認識
を行う。この2ndスキャンでも、文字コードが抽出で
きない場合には、以下、1stスキャン及び2ndスキ
ャンと同様に、論理フィルタ13〜15に変更しなが
ら、3〜5回目の認識処理を行う。以上のように、本実
施形態では、フィルタ部10に領域I2中の各画素の値
を周辺画素の状況に応じて異なるルールでそれぞれ再設
定する論理フィルタ11〜15を設け、各スキャンで文
字コードが得られない場合に、その論理フィルタ11〜
15の選択を換えて文字パタンを整形し、複数回の文字
認識を行うようにしている。そのため、与えられた帳票
1のイメージが二値の場合でも、文字認識に適した文字
パタンが得られ、文字認識率を向上できる。
【0013】なお、本発明は、上記実施形態に限定され
ず種々の変形が可能である。その変形例としては、例え
ば次のようなものがある。 (1) 論理フィルタ11〜15の数は5個に限らず増
加させてもよい。 (2) 上記実施形態では、論理フィルタ11〜15を
順に選択するようにしているが、認識部21で文字認識
を行ったときに、付随して得られる文字パタンの線幅等
の情報や文字の種類等の情報を認識制御部22にフィー
ドバックし、該情報に応じて、任意の論理フィルタを選
択するようにしてもよい。このようにすることで、スキ
ャンの回数を減じることができ、処理の高速化が実現で
きる。
【0014】
【発明の効果】以上詳細に説明したように、第1及び第
2の発明によれば、二値化された帳票イメージを受信す
る受信手段と、イメージメモリと、切出部及び認識部を
備えた文字認識装置に、複数の論理フィルタを有するフ
ィルタ部と、論理フィルタ部に対して指示を与える機能
と、文字コードが得られなかった場合に、フィルタ部で
用いる論理フィルタを変更する機能とを有する認識制御
部とを設けているので、帳票のイメージが二値で与えら
れても、複数回の文字認識が可能であり、文字認識率が
向上する。
【図面の簡単な説明】
【図1】本発明の実施形態を示す文字認識装置の構成ブ
ロック図である。
【図2】図1の論理フィルタ11〜15によるフィルタ
リング処理を説明する図である。
【図3】フィルタリング処理のルールの具体例を説明す
る図である。
【図4】図3による文字パタンの変化を示す図である。
【符号の説明】
1 帳票 2 ファクシミリ装置 3 イメージメモリ 4 切出部 10 フィルタ部 11〜15 論理フィルタ 20 パタンメモリ 21 認識部 22 認識制御部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 内津 将 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 二値化された帳票イメージを受信する受
    信手段と、 前記帳票イメージを格納するイメージメモリと、 前記イメージメモリに格納された帳票イメージから、読
    取対象の文字パタンを含む領域を切り出す切出部と、 前記領域中の各画素の値を周辺画素の状況に応じて異な
    るルールでそれぞれ再設定する複数の論理フィルタを有
    し、該複数の論理フィルタのうち指示された論理フィル
    タを用いて該領域中の文字パタンを整形するフィルタ部
    と、 前記整形された文字パタンに対する文字認識を行い、該
    文字認識で得られた文字コードを出力する認識部と、 前記フィルタ部に対して前記指示を与える機能と、該指
    示を与えた結果で前記文字コードが得られなかった場合
    に、該フィルタ部に新たな指示を出し該フィルタ部で用
    いる論理フィルタを変更する機能とを有し、該フィルタ
    部及び前記認識部における処理を複数回実行させる認識
    制御部とを、 備えたことを特徴とする文字読取装置。
  2. 【請求項2】 二値化された帳票イメージを受信する受
    信手段と、 前記帳票イメージを格納するイメージメモリと、 前記イメージメモリに格納された帳票イメージから、読
    取対象の文字パタンを含む領域を切り出す切出部と、 前記領域中の各画素の値を周辺画素の状況に応じて異な
    るルールでそれぞれ再設定する複数の論理フィルタを有
    し、該複数の論理フィルタのうち指示された論理フィル
    タを用いて該領域中の文字パタンを整形するフィルタ部
    と、 前記整形された文字パタンに対する文字認識を行い、該
    文字認識で得られた文字コード或いは該文字認識で付随
    して得られる該文字パタンに関する情報を出力する認識
    部と、 前記フィルタ部に対して前記指示を与える機能と、該指
    示を与えた結果で前記文字コードが得られなかった場合
    に、前記文字パタンに関する情報に応じて前記フィルタ
    部に新たな指示を出し該フィルタ部で用いる論理フィル
    タを任意に変更する機能とを有し、該フィルタ部及び前
    記認識部における処理を複数回実行させる認識制御部と
    を、 備えたことを特徴とする文字読取装置
JP9043904A 1997-02-27 1997-02-27 文字読取装置 Pending JPH10240868A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9043904A JPH10240868A (ja) 1997-02-27 1997-02-27 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9043904A JPH10240868A (ja) 1997-02-27 1997-02-27 文字読取装置

Publications (1)

Publication Number Publication Date
JPH10240868A true JPH10240868A (ja) 1998-09-11

Family

ID=12676707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9043904A Pending JPH10240868A (ja) 1997-02-27 1997-02-27 文字読取装置

Country Status (1)

Country Link
JP (1) JPH10240868A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021128443A (ja) * 2020-02-12 2021-09-02 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2021128444A (ja) * 2020-02-12 2021-09-02 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021128443A (ja) * 2020-02-12 2021-09-02 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2021128444A (ja) * 2020-02-12 2021-09-02 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Similar Documents

Publication Publication Date Title
US4903312A (en) Character recognition with variable subdivisions of a character region
EP1173003B1 (en) Image processing method and image processing apparatus
JPH05225378A (ja) 文書画像の領域分割システム
JPH10240868A (ja) 文字読取装置
JPH11272798A (ja) ボ―ルド体文字を区別する方法及び装置
KR100334624B1 (ko) 클러스터링기반문서영상분할방법
JPH10222602A (ja) 光学式文字読取装置
JP3545227B2 (ja) 画像処理方法及び装置、光学式文字読取装置
JPS60153575A (ja) 文字読取方法
JP2000113111A (ja) イメージ認識用特徴値抽出方法、およびその装置、イメージ解析プログラムを格納する記憶媒体
JPS58197581A (ja) 文字図形認識方法とその装置
JP3681919B2 (ja) 情報コードの切り出し方法
JP3710164B2 (ja) 画像処理装置及び方法
EP0446630A2 (en) Method and apparatus for segmenting characters in an amount field on a financial document
JP4580520B2 (ja) 文字認識方法および文字認識装置
JPH09114925A (ja) 光学式文字読取装置
JPH0785221A (ja) 図面自動認識装置の文字とシンボルの分離・認識方法
JP3277977B2 (ja) 文字認識方法
JPH022189B2 (ja)
JP3210224B2 (ja) 文字認識装置
JPH0540848A (ja) 文書画像の領域抽出方法
JP3471925B2 (ja) 複写装置及び画像処理方法
JP2002354238A (ja) 像域分離システムおよびそれを適用した画像処理システム
JPH11353417A (ja) 光学式文字読取装置
JPH02166583A (ja) 文字認識装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030617