JPH0262682A

JPH0262682A - 文字認識方法

Info

Publication number: JPH0262682A
Application number: JP63215382A
Authority: JP
Inventors: Mikio Aoki; 三喜男青木
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 1988-08-30
Filing date: 1988-08-30
Publication date: 1990-03-02

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野］本発明は、紙面上に書かれた文字を画像として入力する
ことにより、文字画像から文字領域を捜し出しコード番
号に変換する文字認識装置の文字認識方法に関する。

［従来の技！］近年、文字認識装置の急激なる進歩により、さまざまな
交合画像から文字領域を自動的に抽出し、さらに一つ一
つの文字を切り出し、認識し、自動的に文書ファイルが
作成できるようＫなってきており、文字の認識の方法は
、さまざまな方法が考え出されてきている。

例えば文字認識方法の一つとして、メツシュ特徴（研究
実用化報告　第３４巻・第１号ｔ　ｐ−ｐ４７〜５７）
がある。該方法は、文字全体の大まかな形状分布を表現
したものである。特徴の抽出方法は、文字の外接矩形を
分割してル×ルの小領域を求める。該各々の小領域に含
まれる文字部の面積を計数してメツシュ特徴とする。該
メツシュ特徴は、一つの文字につきル×ルコのブータラ
持っており、ル×ルコのうちのある領域における文字部
の面積の割合を辞書として所有しているデータと比較す
ることによって、文字の推定が可能となる。

また、他の方法として、べり７エラル特徴（研究実用化
報告　第３４巻　第１号　ｐ、ｐ、４７　〜５７　）が
ある。該方法は、文字の周辺情報に着目したものである
。特徴の抽出方法は、まず文字パターンの外接矩形を求
め、外接矩形の各辺をそれぞれル分割する。次に分割さ
れた分割辺から文字に向かって走査していき、最初に文
字に出合うまでの面積、次に文字に出合うまでの面積を
計数する。各分割辺に対して同様の処理を行うことによ
り、ＷＸ４Ｘ２のデータを持つペリフェラル特ｌｌを得
ることができ、該ル×４×２のデータと辞書として所有
しているデータとを比較することによりて文字の推定が
可能となる。

［発明が解決しようとする課題］しかしながら、前記文字認識方法の、メツシュ特徴やペ
リフェラル特徴のみでは、候補文字を一つに絞ることは
非常にむずかしい。

例えば、英数字を例にとると、メツシー特徴においては
、小文字のｇと数字の８、小文字のｑと数字の９、また
、ペリフェラル特徴ニおいては、■と小文字の７１小文
字のｒと小文字のｔ１大文字のＧと小文字のｅといった
文字のデータが非常に近い位を示している。したがって
、前記のような方法にて文字を認識させた場合、似たデ
ータを持つ文字に対しては非常にまちがえやすいという
課題を有している。

そこで本発明は以上の様な課題を解決するもので、その
目的とするところは、似たデータを持つ文字に対しても
高速にかつ正確に認識結果を出す方法を提供することに
ある。

［課題を解決するための手段］本発明の光学的画像入力手段により紙面等に書かれた文
字画像を読み取り、入力された画像データ中の文字を認
識しコード番号に置き換える文字認識方法は、（１）　　文字抽出時に得られる文字画像の位置及び大
きさによぢて候補文字を分類した後に文字を推定するこ
とを特徴とする。

（２）文字認識前段階である文字抽出段階において得ら
れる文字基準線と、文字画像の位置とを比較することに
より、候補文字を分類することを特徴とする。

（３）文字認識前段階である文字行抽出段階において得
られる標準文字高と、文字画像の大きさを比較すること
により、候補文字を分類することを特徴とする。

［実施例］以下、本発明を実施例に基づいて詳細に説明する。

本発明の文字認識方法は、一般に第４図のブロック図に
示す様なハードウェアにおいて用いられる。該ハードウ
ェアは、認識対象文字画像を入力するための画像入力装
置３４２画像入力装置３４によって入力された画像情報
及び演算結果を蓄えるＲＡＭ５２、演算を実行するＣＩ
ＰＵ３１、文字認識のための辞書データ及び演算のプロ
グラムが納まっているＲＯＭ３３、及び認識した結果を
表示するモイスブレイ３５により構成されている。

以下、本発明の文字認識方法を、第５図に示すフローチ
ャートに従って詳細に説明する。

ブロックＡにおいて認識対象となる文字画像１が入力さ
れる。この時、画像入力装置３４の読み取り幅によって
入力された文字画像１はさまざまであるが、通常複数行
の文字画像１が入力されるちなみに、第１図に示した文
字画像１は１行のみしか表わしてないが、複数行入力し
た場合も本発明の文字認識方法は全く変わり無い。画像
入力装置３４により入力された画像が第１図（−）に示
す様な斜めの画像であった場合、ブロックＢ以降におい
て認識の防げとなるので、斜めに入力された場合にはこ
の時点で第１図＜ｂ＞に示す様に水平に並び換える。

ブロックＢにおいて、水平に並び換えられた文字画像２
の横方向の周辺分布４を計数する。一般に横方向の周辺
分布は、第１図の５に示す様な形状となる。入力画像が
複数行の場合、横方向の周辺分布は、第１図（Ｃ）に似
たものが行と同じ数だけできあがる。該横方向の周辺分
布３の形状をみると、その形状より標準文字高■（小文
字Ｘの高さ）及び、文字行基準線■の位置を知ることが
できる。ブロックＢにおいては、標準文字高■及び文字
行基準線■と同時に文字行の位置を抽出する。

ブロック０においては、ブロックＢにおいて抽出された
文字行の中から単語領域を抽出する。単語領域の抽出は
、文字行と垂直な方向の周辺分布を計数し、該周辺分布
め固まりと固まりの間隔を調べ、文字間隔か単語間隔か
を判断することによって可能である。

ブロックＤにおいては、ブロックＯにおいて抽出された
単語領域から文字領域を抽出する。文字領域の抽出は、
ブロックＣにおいて計数された周辺分布の結果を用いて
抽出することも可能であるが、対象文字が英数字である
場合には、小文字の１、ｊをぬかしてすべてが一つの連
結成分よりなっているので、文字画像の輪郭をとること
により文字の抽出が可能である。本発明においては、文
字の輪郭を用いて文字の抽出を行った。また文字の輪郭
抽出と同時に文字の高さ及び文字の基準線が求まる。

ブロック■において、ブロックＤにおいて抽出された文
字の認識を行う。ブロックＥにおいてはまず最初にブロ
ックＤにおいて抽出された文字の高さ及び文字の基準線
と、ブロックＢにおいて抽出された標準文字高及び文字
行基準線とを比較し。

候補文字を分類する。一般に、文字の高さ及び文字の基
準線との関係は第２図に示す３つのグループに分けるこ
とができる。１つ目のグループは、第２図−１１に示さ
れる様なグループである。該グループは、文字の高さ■
−１は標準文字高■に比べかなり高く、文字の基準線■
−１は文字行基準線■とほぼ同じ位置にある。該文字の
グループに属す文字は第４図における０ＨＡＲＡ２及び
０ＨｋＲｋ５のグループである。２つめのグループは、
第２図−１２に示される様なグループである該グループ
は、文字の高さ■−２は標準文字高とほぼ等しく、また
文字の基準線■−２も文字行基準線■とほぼ等しい。該
文字のグループに属す文字は第４図における０ＨＡＲＡ
４のグループである。３つめのグループは、第２図−１
３に示される様なグループである。該グループは、文字
の高さ■−３は標準文字に比べかなり高く、また文字の
基準線■−５は文字行基準線■に比べかなり低い位置に
ある。該文字のグループに属す文字は第４図における０
ＨＡＲＡ１のグループである。

以上の様に、文字の高さ及び文字の基準線の情報により
、候補文字を３つのグループにしぼることが可能である
。従って、候補文字の数は当初５２字あったものが、多
（て３４文字、少くて５文字となり、平均すると認識に
用いられる時間が半減する。ブロックＥにおいては、こ
うしてしぼられた候補文字の辞書データと抽出文字のデ
ータとの比較を行い抽出文字が何であるかの認識を行う
。

以上の様にブロックＥにおいて抽出文字の認識が終了す
ると、ブロックＣにおいて抽出された単語の認識が終了
するまでブロックＤ、ブロックＥを繰り返し、単語の認
識が終了するとブロックＢにより抽出された文字行の認
識が終了するまでブロックＣ，ブロックＤ、ブロックＥ
の一連の動作を繰り返す。さらに、入力画像のすべての
認識が終了するまで、ブロックＢ、ブロック０．ブロッ
クＤ及びブロックＥの一連の動作を繰り返し、文字画像
をコート化する。このようにして画像入力装置３４によ
って入力した文字画像２を一つの文書ファイルに変換す
る。この後、ブロックＦにおいて、認識した結果をデイ
スプレィ６５に表示して終了する。

以上の様に本発明の文字認識方法は、入力された画像を
水平に並び換えた後に横方向の周辺分布を計数するので
、周辺分布を調べることにより文字行の位置を知ること
ができ、それと同時に、文字行基準線及び標準文字高を
知ることが可能となる。こうして得られた文字行基準線
及び標準文字高と、文字抽出時に得られる文字基準線及
び文字高とを比較することにより、候補文字を３つのグ
ループに分離することができる。候補文字を３つのグル
ープに分類することにより、今まで５２文字の候補文字
があったものが、多くて、３４文字、少くて５文字の候
補文字となる。その結果、認識に要する時間は、平均し
て従来の半分以下にすることが可能となる。また、この
様な位置情報及び大きさ情報を用いることにより、ｒと
ｔ１小文字のｑと数字の９（第３図には示さない）、小
文字のｇと数字の８（第３図には示さない）といった様
な非常によ（似たデータを持つ文字もはっきりと分類す
ることが可能となり、高速にかつ正確に認識することが
可能となる。

［発明の効果］以上述べた様に本発明によれば、入力された画像の横方
向の周辺分布を計数し、文字行の位置を求める際に、文
字行基準線及び標準文字高を求める。この後、該文字行
基準線及び標準文字高と、文字抽出時に得られる文字基
準線及び文字高とを比較することにより候補文字しぼる
ことが可能となる。その結果、似たデータを持つ文字も
分類でき、しかも候補文字の数が少ないので、高速でか
つ高い確率の認識が可能となる。結果、現在幅広く用い
られているＯＯＲをより使いやすく、信頼の持てるもの
とすることができる。

【図面の簡単な説明】

第１図（α）〜（Ｃ）に本発明の文字認識方法の文字行
基準線及び標準文字高の求め方を示した図。第２図（９）〜（Ｃ）に本発明の文字認識方法の文字行
基準線及び標準文字高を用いた分類の方法を示した図。第３図（α）〜Ｃｄ）に本発明の文字認識方法の文字行
基準線及び標準文字高による分類を示した図。第４図に本発明の文字認識方法が用いられる文字認識装
置のブロック図。第５図に本発明の文字認識手段のフローチャートを示す
。１・・・・・・・・・入力文字画像２・・・・・・・・・修正文字画像５・・・・・・・・・横方向周辺分布 ■・・・・・・・・・文字行基準線 ■−１１２ｔ３・・・・・・文字基準線■・・・・・・
・・・標準文字高 ■−１，２，５・・・・・文字高１１．１２，１３・・・・・・抽出文字２１・・・・・
・グループ０ＨＡＥＡ１２２・・・・・・グループ０Ｈ
ＡＲＡ２２３・・・・・・グループＯ−ＨＡ　ＲＡ　５
２４・・・・・・グループ０ＨＡＲＡ４３１　・・・　
・・・　０ＰＵ２　・・・　・・・　ＲＡＭ３　・・・・・・　ＲＯＭ４・・・・・・画像入力装置５・・・・・・デイスプレィ・・・・・・ブロックＡ・・・・・・ブロックＢ・・・・・・ブロック０・・・・・・ブロックＤ・・・・・・ブロックＥ・・・・・・ブロックＦ以上

Claims

【特許請求の範囲】

（１）　光学的画像入力手段により紙面等に書かれた文
字画像を読み取り、入力された画像データ中の文字を認
識しコード番号に置き換える文字認識方法において、文字抽出時に得られる文字画像の位置及び大きさによっ
て候補文字を分類した後に文字を推定することを特徴と
する文字認識方法。
（２）　文字認識前段階である文字行抽出段階において
得られる文字行基準線と、文字画像の位置とを比較する
ことにより、候補文字を分類することを特徴とする第１
項記載の文字認識方法。
（３）　文字認識前段階である文字行抽出段階において
得られる標準文字高と、文字画像の大きさを比較するこ
とにより、候補文字を分類することを特徴とする第１項
記載の文字認識方法。