JPH0677270B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0677270B2
JPH0677270B2 JP59004155A JP415584A JPH0677270B2 JP H0677270 B2 JPH0677270 B2 JP H0677270B2 JP 59004155 A JP59004155 A JP 59004155A JP 415584 A JP415584 A JP 415584A JP H0677270 B2 JPH0677270 B2 JP H0677270B2
Authority
JP
Japan
Prior art keywords
pattern
character
data
line width
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59004155A
Other languages
English (en)
Other versions
JPS60147892A (ja
Inventor
実 永尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP59004155A priority Critical patent/JPH0677270B2/ja
Publication of JPS60147892A publication Critical patent/JPS60147892A/ja
Publication of JPH0677270B2 publication Critical patent/JPH0677270B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 <発明の技術分野> 本発明は、未知文字を光学的に読み取り、これを白黒2
値化して文字パターンを求め、この文字パターンに基づ
き未知文字の特徴を抽出し標準パターンと照合して、未
知文字を認識する文字認識装置に関する。
<発明の背景> 従来の文字認識装置は、第1図に示す如く、文字読取り
部を構成する読取りヘッド3,CCD(Charged-Coupled De
vice)4,A/D変換器5を含んでおり、帳票1上の未知文
字2を読取りヘツド3で光学的に読み取り、これをCCD4
で電気信号に変換し、更にA/D変換器5によりデジタル
信号に変換する。このデジタル信号は前処理回路6に与
えられ、データの2値化ノイズ除去、平滑化、丸め処理
等、文字認識に必要な前処理を行なつている。前処理回
路6は、第2図に示す如く、A/D変換器5の出力を白黒
2値化して文字パターンを画像メモリ7に格納する2値
化回路8と、文字パターンの線幅を測定して線幅判定信
号iを出力する線幅測定回路9と、線幅判定信号iの内
容に基づき前記2値化処理のしきい値を可変設定するし
きい値決定回路10と、文字パターンを構成する複数のメ
ッシュのデータを所定の変換条件により1メッシュのメ
ッシュ変換データに変換して被検査パターンを生成し、
これを画像メモリ11上に組み立てる丸め処理回路12とを
含む。ここでメッシュとは画素を意味する(以下、同
様)。前記被検査パターンは文字認識部13の特徴抽出回
路14に入力され、文字の特徴、例えば交点数、端点数、
分枝点数、ループ数等がコード化されて抽出され、更に
この特徴コードは辞書照合回路15において、辞書16に予
め格納してある標準パターンの特徴コードと照合され
る。その結果、両者が一致すると、その特徴コードをも
つ標準パターンのIDコードが出力され、また不一致のと
き、再処理指令jが前記前処理回路6へ送られる。この
再処理指令jがあると、前処理回路6のしきい値決定回
路10は線幅判定信号iの内容に基づき2値化処理のしき
い値を大小変更して、文字パターンの線幅を補正し、こ
の補正されたパターンに基づき特徴抽出以下の同様の文
字認識処理が再実施される。ところがこの種従来方式の
場合、文字パターンにおける白地と黒地との境界部分の
濃度差が一定レベル以上あると、しきい値を大小変更し
ても文字パターンの補正効果が顕著に現われない場合が
生ずる。例えば帳票への文字書込みに使用された筆記具
の種類によつては、前記濃度差がきわめて大きくなり、
かかる場合には文字認識処理の再実施が無意味となり、
認識処理効率を低下させるだけとなる。
<発明の目的> 本発明は、文字認識処理の再実施に際し、文字パターン
の線幅補正を2値化処理以降の段階で実施する方式を採
用することによつて、文字パターンの補正効果を向上さ
せた文字認識装置を提供することを目的とする。
<発明の構成および効果> 本発明の文字認識装置は、未知文字を読み取って電気信
号に変換する文字読取り部と、前記文字読取り部の出力
を白黒2値化して文字パターンを生成する2値化処理部
と、前記2値化処理部で生成された文字パターンの線幅
を測定して線幅の大小の状態を示す線幅判定信号を出力
する線幅測定部と、前記文字パターンを所定のマスク領
域に分割して分割領域毎のパターンデータをマスク走査
により取り出すマスク走査部と、前記マスク走査部によ
り取り出された各パターンデータを被検査パターンを構
成するデータに変換するためのメモリをもつデータ変換
部と、前記データ変換部の出力データにより構成される
被検査パターンより未知文字の特徴を抽出し標準パター
ンと照合して未知文字を認識すると共に、未知文字を認
識できなかったとき、再処理指令を出力する文字認識部
とを備えたものである。そして前記データ変換部は、前
記文字認識部からの再処理指令の有無と、前記線幅測定
部より出力される線幅判定信号と、前記マスク走査部に
より取り出されたパターンデータとの組み合わせを前記
メモリのアドレスとして入力して、対応するメモリアド
レスより被検査パターンを構成するデータを出力させる
ようにしている。
本発明によれば、文字パターンにおける白地と黒地との
境界部分の濃度差が大きい場合であつても、文字パター
ンの線幅補正効果が顕著に現われる。従つて使用される
筆記具の種類等によつて補正効果が左右されることがな
く、文字認識処理の再実施が有効となり、文字認識精度
が向上する等、発明目的を達成した優れた効果を奏す
る。
<実施例の説明> 第3図は本発明を実施した文字認識装置の部分的構成を
示す。
同図中、A/D変換器5は、CCD出力を複数レベルのデジタ
ル信号に変換して前処理回路6へ送出する。前処理回路
6は、A/D変換器5の出力を一定レベルのしきい値で2
値化して文字パターンを画像メモリ7(例えば縦横64メ
ツシユ)へ格納する2値化回路8と、前記しきい値を設
定して2値化回路8へ付与するしきい値決定回路10と、
文字パターンの線幅を測定して線幅の大小の状態を示す
線幅判定信号iを出力する線幅測定回路9と、文字パタ
ーンを構成する複数のメッシュのデータを所定の変換条
件に従って1メッシュのメッシュ変換データに変換して
画像メモリ11(例えば縦横32メツシユ)へ被検査パター
ンを組み立てる丸め処理回路20とを含む。
本実施例における丸め処理回路20は、第5図に示す如
く、文字パターンを構成する4メツシユ(縦2メツシユ
×横2メツシユ)分の各パターンデータ群a1,a2,a3,…
…,an,……を1メツシユのメツシユ変換データb1,b2,
b3,……,bn,……にデータ変換するための回路であり、
第4図に示す如く、画像メモリ7をマスク走査して4メ
ツシユ分のパターンデータ群を順次取り出すマスク走査
回路21と、マスク走査回路21の出力をアドレスデータと
して対応するアドレスにメツシユ変換データを格納して
あるROM(Read Only Memory)22とから成る。このROM
22のアドレスは、線幅判定信号iおよび、文字認識部か
らの再処理指令jによつても規定され、前記再処理指令
jの有無と線幅判定信号iと前記マスク走査回路21より
出力された4メッシュのパターンデータ群との組み合わ
せとから成るアドレスデータ入力に基づき、ROM22より
いずれか対応するアドレスのメツシユ変換データが選択
出力され、画像メモリ11に被検査パターンが組み立てら
れる。
例えば通常処理時、すなわち再処理指令jが発せられて
いない場合は、第6図(1)に示す如く、4メッシュの
パターンデータ群に2メッシュ以上の黒地データ(図中
斜線で示す)を含むとき、メッシュ変換データとして1
メッシュの黒地データ(それ以外は1メッシュの白地デ
ータ)が設定される。すなわち再処理指令jがオフであ
って、4メッシュ中、2メッシュ以上が黒地データであ
るとき、線幅判定信号iの内容を問わず、ROM22からの
出力データが黒地データとなるようにROM22のメッシュ
変換データを設定しておくのである。また再処理後、す
なわち再処理指令jが発せられた場合は、線幅判定信号
iの内容に応じて前記変換条件が変更されるもので、線
幅判定信号iが“太め”を意味する内容である場合、第
6図(2)に示すように、4メッシュのパターンデータ
群に3メッシュ以上の黒地データを含むとき、メッシュ
変換データとして1メッシュの黒地データ(それ以外は
1メッシュの白地データ)が設定され、これにより文字
パターンが細め処理される。すなわち再処理指令jがオ
ンであり、4メッシュ中、3メッシュ以上が黒地データ
であって、線幅判定信号iが“太め”を意味する内容で
あるとき、ROM22からの出力データが黒地データとなる
ようにROM22のメッシュ変換データを設定しておくので
ある。さらに再処理時、すなわち再処理指令jが発せら
れた場合において、線幅判定信号iが“細め”を意味す
る内容である場合、第6図(3)に示すように、4メッ
シュのパターンデータ群に1メッシュ以上の黒地データ
を含むとき、メッシュ変換データとして1メッシュの黒
地データ(それ以外は1メッシュの白地データ)が設定
され、これにより文字パターンが太め処理される。すな
わち再処理指令jがオンであり、4メッシュ中、1メッ
シュ以上が黒地データであって、線幅判定信号iが“細
め”を意味する内容であるとき、ROM22からの出力デー
タが黒地データとなるようにROM22のメッシュ変換デー
タを設定しておくのである。
斯くて未知文字の認識が不能である場合には、文字認識
部より再処理指令jが前処理回路6へ送出され、丸め処
理回路20において、文字パターンの線幅が細いときは太
め処理が、太いときは細め処理が夫々実行されて被検査
パターンが再度組み立てられ、この被検査パターンより
文字の特徴が再抽出されて、文字認識処理が実行され
る。
【図面の簡単な説明】
第1図は文字認識装置の全体構成を示すブロツク図、第
2図は従来の前処理回路の構成を示すブロツク図、第3
図は本発明にかかる前処理回路の構成を示すブロツク
図、第4図は丸め処理回路の構成を示すブロツク図、第
5図はメツシユ変換処理を示す説明図、第6図はメツシ
ユ変換パターンを例示した説明図である。 6……前処理回路、9……線幅測定回路 13……文字認識部、20……丸め処理回路 22……ROM

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】未知文字を読み取って電気信号に変換する
    文字読取り部と、 前記文字読取り部の出力を白黒2値化して文字パターン
    を生成する2値化処理部と、 前記2値化処理部で生成された文字パターンの線幅を測
    定して線幅の大小の状態を示す線幅判定信号を出力する
    線幅測定部と、 前記文字パターンを所定のマスク領域に分割して分割領
    域毎のパターンデータをマスク走査により取り出すマス
    ク走査部と、 前記マスク走査部により取り出された各パターンデータ
    を被検査パターンを構成するデータに変換するためのメ
    モリをもつデータ変換部と、 前記データ変換部の出力データにより構成される被検査
    パターンより未知文字の特徴を抽出し標準パターンと照
    合して未知文字を認識すると共に、未知文字を認識でき
    なかったとき、再処理指令を出力する文字認識部とを備
    えており、 前記データ変換部は、 前記文字認識部からの再処理指令の有無と、前記線幅測
    定部より出力される線幅判定信号と、前記マスク走査部
    により取り出されたパターンデータとの組み合わせを前
    記メモリのアドレスとして入力して、対応するメモリア
    ドレスより被検査パターンを構成するデータを出力させ
    るようにした文字認識装置。
JP59004155A 1984-01-11 1984-01-11 文字認識装置 Expired - Lifetime JPH0677270B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59004155A JPH0677270B2 (ja) 1984-01-11 1984-01-11 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59004155A JPH0677270B2 (ja) 1984-01-11 1984-01-11 文字認識装置

Publications (2)

Publication Number Publication Date
JPS60147892A JPS60147892A (ja) 1985-08-03
JPH0677270B2 true JPH0677270B2 (ja) 1994-09-28

Family

ID=11576860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59004155A Expired - Lifetime JPH0677270B2 (ja) 1984-01-11 1984-01-11 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0677270B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0721814B2 (ja) * 1985-03-30 1995-03-08 株式会社東芝 文字・マ−ク読取装置

Also Published As

Publication number Publication date
JPS60147892A (ja) 1985-08-03

Similar Documents

Publication Publication Date Title
JP3139521B2 (ja) 自動言語決定装置
JPS63158678A (ja) 単語間スペ−ス検出方法
JPS6140684A (ja) 輪郭追跡装置
US4893187A (en) Image processing apparatus
US4138662A (en) Character reader
JPH0677270B2 (ja) 文字認識装置
JP2946095B2 (ja) 線分抽出装置
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JP2859681B2 (ja) 指紋データの2値化方法
JP2812619B2 (ja) 画像処理装置
JPS5914078A (ja) 帳票読取装置
JPS61290581A (ja) 検索情報抽出記憶装置
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JPS5960690A (ja) 2値化装置
JPS62281094A (ja) パタ−ン情報認識方法
JPH04288773A (ja) 属性判別方法
JPS6249482A (ja) 画像前処理装置
JPH0433074B2 (ja)
JPS60225985A (ja) 文字認識装置
JPH0776979B2 (ja) 画像処理方法
JPH06164931A (ja) 画像信号処理装置
JPS59189481A (ja) 文字認識装置
JPS62281095A (ja) パタ−ン情報認識方法
JPS62221082A (ja) 文字再認識方式
JPH04316180A (ja) 文書画像の属性判別方法