JPH0281282A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH0281282A
JPH0281282A JP63232431A JP23243188A JPH0281282A JP H0281282 A JPH0281282 A JP H0281282A JP 63232431 A JP63232431 A JP 63232431A JP 23243188 A JP23243188 A JP 23243188A JP H0281282 A JPH0281282 A JP H0281282A
Authority
JP
Japan
Prior art keywords
character
characters
mxn
vector
density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63232431A
Other languages
English (en)
Inventor
Hideaki Suzuki
英明 鈴木
Yoshie Matsuzaki
松崎 吉衛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63232431A priority Critical patent/JPH0281282A/ja
Publication of JPH0281282A publication Critical patent/JPH0281282A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は画像処理を用いた印刷文字の認識方法に係夛、
特に、切れやかすれがある印刷文字でも+m識すること
が可能な文字la!臓方法に関する。
〔従来の技術〕
従来の文字認識方法、例えば特開昭61−255488
号公報に記載されている文字i!識方法は、文字パター
ンを複数領域に分割し、その分割単位毎に類似度を辞書
パターンと比較照合し、判定している。
〔発明が解決しようとする課題〕
従来技術は、パターンマツチング法の応用が主体で、何
れにしろ、2値画像を用いた認識アルゴリズムがその殆
どを占める。従って、印字品質の良い紙等に印字された
文字の認識に適用するときは良好な照合結果が得られる
が、切れや擦れあるいはコントラストの悪い印刷文字で
は、良好な2値画像が得られず、これを判別しようとす
るには、その認識アルゴリズムは複雑とな)、認識時間
が増大すると共に、誤認識率が高くなってリジェクト数
が増大するという問題がある。
本発明の課題は、切れや擦れ中コントラストの悪い印刷
文字でも良好且つ高速に認識することができる文字認識
方法を提供することにある。
〔課題を解決するための手段〕
上記課題は、入力画像に対して1文字切出し彼にその文
字を縦横のメツシュに分割し、各メッシェ内よ)そのメ
ッシェ内を代表する濃度を順にサンプリングし、文字の
パターンを濃度ベクトルで表現し、この濃度ベクトルと
、同じ形式で文字を表現してある辞書との照合をベント
ル空間上で行ない、候補文字を限定することで、達成さ
れる。
〔作用〕
1文字をmXnのメツシュに分割し、各メッシェ内の濃
度をサンプリングすると、この1文字は、mXn次元の
ベクトルで表現される。このmxn次元の文字ベクトル
と、同じ(mXn次元で表現した辞書ベクトルとを照合
することで、文字の判定を行なう。mXn次元ベクトル
の照合においては、−要素(mXn領域の内の1領域の
濃度)あるいは数要素(数領域の濃度)が異なっていた
としても、他の要素が同じであnば、異なっている要素
は文字の切れや擦れが原因であると判別でき、正当文字
を候補としてあげることができる。コントラストの悪い
文字は、良好な文字に比べてその濃度の値つま、9mX
n個の要素の値は異なる。しかし、mXn個の要素の値
の傾向つまシ濃淡の傾向は、同じ文字であれば同様の傾
向を示す。従って、この場合にも、正当な候補文字を限
定できる。
〔実施例〕
以下、本発明の一実施例を図面を参照して説明する。
第2図は、本発明の一実施例に係る文字認識方法を応用
した文字認識システムの構成図である。
シヌテムは、文字が印刷された製品及びその製品を実装
した製品であるワーク21の表面の印刷文字の読取シを
行うものである。メカ制御インタフェース22を介した
画像処理装置20からの指令に基き、チーフルコントロ
ーラ25はXテーブル24.  Xテーブル25を制御
し、TV左カメラ6の視野内にワーク21が入るように
する。視野内に入ったワーク21は、照明光源27によ
り均一に照明され、表面の画像がTV左カメラ6により
画像処理装置20に取9込まれる。
画像処理装置20は、第3図に示すハードウェア構成を
持つ。画像処理装置20は、TV左カメラ6からの信号
を入力しモニタテレビ28(第2図)への出力を行う画
像入出力回路51、入力した画像データを格納するため
の画像メモリ52、メカ制御インターフェース22等の
外部信号の入出力を行う汎用入出力回路63、画像間演
算や評価プログラム等の演算を行う演算回路66、プロ
グラムやデータを格納しておくプログラムメモリ65、
以上の動作全体を制御するC P U 54.また、こ
れらの回路間の信号通信を行うマルチパス67から成る
印刷文字の読取りは、画像処理装置2Qの内部で第1図
に示すフローに従う処理を行うことによりなされる。こ
の処理プログラムは、プログラムメモリ35に格納して
ある。まず、画像入出力回路51を用い、すでにTV左
カメラ6の視野内にあるワーク21表面に描かれた文字
列の画像を、画像メモリ32に取ル込む(ステップ11
)。そして、演算回路3により以下の処理を行う。まず
、画像中から1文字ずつ文字が存在する四角形の領域を
切シ出す(ステップ12)・この際の切出しの方法は、
あらかじめ文字列の先頭と末尾に、それぞれ切出し用の
マーカを印字しておき、文字の位置をマーカよシ検出す
る。また、1文字ごとの切出しは、文字のピッチが一定
であることを利用して行う。そして、切シ出された文字
領域内を縦横がmXnの領域に分割してその文字パター
ンを類似度を計算して評価する(ステップ13)o候補
文字が複数の場合には、先に分割したmXn個の領域ご
とにエツジを抽出することにより文字の候補をリストア
ツブし、この結果、候補文字が複数の場合にはりジエク
トとしくステップ16)、候補文字が1つの場合は認識
結果を出力しくステップ14)する。切)出されたすべ
ての文字に対して、上記の処理(ステップ13〜ステツ
プ16)を行い、入力画像中の文字の読み取シを終了す
る。
ステップ13での文字の評価は、第4図に示すフローに
よって行う0まず、切シ出された文字領域内を縦横がm
Xn個の領域に分割する(ステップ41)。この後、各
領域を代表する濃度を領域内よシサンプリングし、この
濃度を成分とした濃度ベクトルで入カバターンを表現す
る(ステップ42)。
例えば、m=5.n=3とすると、15次元のベクトル
となる。つぎに、入カバターンの濃度ベクトルと、辞書
上のパターンベクトルとの間で識別のための類似度を計
算する(ステップ45)。この時、濃度ベクトルの各成
分がすべて辞書上のパターンベクトルの各成分と一致し
ている場合は、入力文字を確実に確定できるが、例えば
、文字線の切れやかすれなどによって濃度ベクトルの成
分の内、一致しないところがある場合には、類似度のみ
では確定できない。そこで、類似度に対する閾値を設定
し、このあらかじめ定められた閾値を用いて、類似度が
高いものをすべてを抽出して、これをすべて候補文字と
する(ステップ44)。
ステップ15での類似度計算の結果、候補文字が複数個
選択された場合、次のステッカ5での候補をひとつにし
ぼるための文字評価を第5図の70−にしたがって行な
う。候補がひとつにしぼれない場合、分割したmXn個
の各領域に対してそれぞれ文字線のエツジを抽出しくス
テップ51)、この結果得られるmXn個の各領域内で
の文字線の種類(第6図に6種類のみ例示する)に関し
て、辞書との照合を行i(ステップ52)、候補文字の
中から一致するものを対象の文字として確定する。
以上により、コントラストが悪い文字、文字線の切れや
かすれなどによって認識が不可能であった文字の認識が
可能となる・ 尚、認識対象とする印刷文字の字体設計において予め認
識しやすいパターンを用いることで、信頼性を向上させ
ることができる。
〔発明の効果〕
本発明によれば、文字の印字状態が悪いもの、例えば、
コントラストの悪い画像、文字線の切れ、あるいは、か
すれとiったものに影響を受けにくくな)、高速かつ安
定した認識が実現できる。
【図面の簡単な説明】
第1図は本発明の一実施例に係る文字認識方法の処理フ
ローチャート、第2図は本発明の一実施例に係る文字認
識装置のシステム構成図、第3図は、第2図に示す画像
処理装置の詳細構成図、第4図は類似度を用いた認識処
理の70−チャート、第5図は類似度によってしぼ)き
れなかった文字に対して行うエツジに抽出による認識処
理のフローチャート、第6図はエツジに抽出により得ら
れる各領域内での文字線の種類を示す図である。 13・・・類似度評価ステップ、15・・・エツジ抽出
評価ステップ、42・・・濃度値サンプリングステップ
、20・・・画像処理装置、21・・・認識対象物、2
2・・・インタフェース、23・・・コントローラ、2
4・・・Xテーブル、25・・・yテーブル、26・・
・カメラ、27・・・拡大レンズ、28・・・モニタ。 第 1図

Claims (1)

  1. 【特許請求の範囲】 1、英数字、記号などの印刷文字を画像処理により認識
    する文字認識方法において、入力画像に対して1文字切
    出し後にその文字を縦横のメッシュに分割して、各メッ
    シュ内よりそのメッシュ内を代表する濃度を順にサンプ
    リングし、文字のパターンを濃度ベクトルにより表現し
    、この濃度ベクトルと、同じ形式で文字を表現してある
    辞書との照合をベクトル空間上にて行い、候補文字を限
    定することを特徴とする文字認識方法。 2、請求項1において、辞書パターンとの前記照合に際
    して、候補となる文字が複数ある場合には、各メッシュ
    内のエッジを検出し、これにより候補中から入力文字が
    何であるかを決定することを特徴とする文字認識方法。
JP63232431A 1988-09-19 1988-09-19 文字認識方法 Pending JPH0281282A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63232431A JPH0281282A (ja) 1988-09-19 1988-09-19 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63232431A JPH0281282A (ja) 1988-09-19 1988-09-19 文字認識方法

Publications (1)

Publication Number Publication Date
JPH0281282A true JPH0281282A (ja) 1990-03-22

Family

ID=16939159

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63232431A Pending JPH0281282A (ja) 1988-09-19 1988-09-19 文字認識方法

Country Status (1)

Country Link
JP (1) JPH0281282A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008044380A1 (en) * 2006-10-11 2008-04-17 Sharp Kabushiki Kaisha Pattern recognizing device for recognizing input pattern by using dictionary pattern

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008044380A1 (en) * 2006-10-11 2008-04-17 Sharp Kabushiki Kaisha Pattern recognizing device for recognizing input pattern by using dictionary pattern

Similar Documents

Publication Publication Date Title
EP3401842B1 (en) Text image processing method and apparatus
JPH05242292A (ja) 分離方法
US5335289A (en) Recognition of characters in cursive script
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
CN109508716B (zh) 一种图像文字的定位方法及装置
JPH0281282A (ja) 文字認識方法
US6208756B1 (en) Hand-written character recognition device with noise removal
CN110807456A (zh) 一种银行卡卡号的定位方法及装置
JPH07160801A (ja) オンライン文字認識装置
JP3710164B2 (ja) 画像処理装置及び方法
KR950011065B1 (ko) 문자 인식방법
JP3349243B2 (ja) 文字列読み取り装置
JP4209511B2 (ja) 文字認識方法、文字認識装置および文字認識方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4580520B2 (ja) 文字認識方法および文字認識装置
JP3428504B2 (ja) 文字認識装置
KR940007934B1 (ko) 온라인 문자인식을 위한 획분할 및 문자분류방법
JP3329528B2 (ja) ドキュメント読取り装置
JPS62281082A (ja) 文字認識装置
JP2000099631A (ja) パターン認識装置及びパターン認識方法
KR20220168787A (ko) 만주어의 글자 추출 방법 및 이를 수행하는 시스템
JP2778436B2 (ja) 文字切り出し装置
JPH03219384A (ja) 文字認識装置
JPH03217993A (ja) 文字サイズ認識装置
JPH0830717A (ja) 文字認識方法とその装置
Messelodi et al. Detection of polygonal frames in complex document images