JPH0262682A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH0262682A
JPH0262682A JP63215382A JP21538288A JPH0262682A JP H0262682 A JPH0262682 A JP H0262682A JP 63215382 A JP63215382 A JP 63215382A JP 21538288 A JP21538288 A JP 21538288A JP H0262682 A JPH0262682 A JP H0262682A
Authority
JP
Japan
Prior art keywords
character
characters
block
image
reference line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63215382A
Other languages
English (en)
Inventor
Mikio Aoki
三喜男 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP63215382A priority Critical patent/JPH0262682A/ja
Publication of JPH0262682A publication Critical patent/JPH0262682A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、紙面上に書かれた文字を画像として入力する
ことにより、文字画像から文字領域を捜し出しコード番
号に変換する文字認識装置の文字認識方法に関する。
[従来の技!] 近年、文字認識装置の急激なる進歩により、さまざまな
交合画像から文字領域を自動的に抽出し、さらに一つ一
つの文字を切り出し、認識し、自動的に文書ファイルが
作成できるようKなってきており、文字の認識の方法は
、さまざまな方法が考え出されてきている。
例えば文字認識方法の一つとして、メツシュ特徴(研究
実用化報告 第34巻・第1号t p−p47〜57)
がある。該方法は、文字全体の大まかな形状分布を表現
したものである。特徴の抽出方法は、文字の外接矩形を
分割してル×ルの小領域を求める。該各々の小領域に含
まれる文字部の面積を計数してメツシュ特徴とする。該
メツシュ特徴は、一つの文字につきル×ルコのブータラ
持っており、ル×ルコのうちのある領域における文字部
の面積の割合を辞書として所有しているデータと比較す
ることによって、文字の推定が可能となる。
また、他の方法として、べり7エラル特徴(研究実用化
報告 第34巻 第1号 p、p、47 〜57 )が
ある。該方法は、文字の周辺情報に着目したものである
。特徴の抽出方法は、まず文字パターンの外接矩形を求
め、外接矩形の各辺をそれぞれル分割する。次に分割さ
れた分割辺から文字に向かって走査していき、最初に文
字に出合うまでの面積、次に文字に出合うまでの面積を
計数する。各分割辺に対して同様の処理を行うことによ
り、WX4X2のデータを持つペリフェラル特llを得
ることができ、該ル×4×2のデータと辞書として所有
しているデータとを比較することによりて文字の推定が
可能となる。
[発明が解決しようとする課題] しかしながら、前記文字認識方法の、メツシュ特徴やペ
リフェラル特徴のみでは、候補文字を一つに絞ることは
非常にむずかしい。
例えば、英数字を例にとると、メツシー特徴においては
、小文字のgと数字の8、小文字のqと数字の9、また
、ペリフェラル特徴ニおいては、■と小文字の71小文
字のrと小文字のt1大文字のGと小文字のeといった
文字のデータが非常に近い位を示している。したがって
、前記のような方法にて文字を認識させた場合、似たデ
ータを持つ文字に対しては非常にまちがえやすいという
課題を有している。
そこで本発明は以上の様な課題を解決するもので、その
目的とするところは、似たデータを持つ文字に対しても
高速にかつ正確に認識結果を出す方法を提供することに
ある。
[課題を解決するための手段] 本発明の光学的画像入力手段により紙面等に書かれた文
字画像を読み取り、入力された画像データ中の文字を認
識しコード番号に置き換える文字認識方法は、 (1)  文字抽出時に得られる文字画像の位置及び大
きさによぢて候補文字を分類した後に文字を推定するこ
とを特徴とする。
(2)文字認識前段階である文字抽出段階において得ら
れる文字基準線と、文字画像の位置とを比較することに
より、候補文字を分類することを特徴とする。
(3)文字認識前段階である文字行抽出段階において得
られる標準文字高と、文字画像の大きさを比較すること
により、候補文字を分類することを特徴とする。
[実施例] 以下、本発明を実施例に基づいて詳細に説明する。
本発明の文字認識方法は、一般に第4図のブロック図に
示す様なハードウェアにおいて用いられる。該ハードウ
ェアは、認識対象文字画像を入力するための画像入力装
置342画像入力装置34によって入力された画像情報
及び演算結果を蓄えるRAM52、演算を実行するCI
PU31、文字認識のための辞書データ及び演算のプロ
グラムが納まっているROM33、及び認識した結果を
表示するモイスブレイ35により構成されている。
以下、本発明の文字認識方法を、第5図に示すフローチ
ャートに従って詳細に説明する。
ブロックAにおいて認識対象となる文字画像1が入力さ
れる。この時、画像入力装置34の読み取り幅によって
入力された文字画像1はさまざまであるが、通常複数行
の文字画像1が入力されるちなみに、第1図に示した文
字画像1は1行のみしか表わしてないが、複数行入力し
た場合も本発明の文字認識方法は全く変わり無い。画像
入力装置34により入力された画像が第1図(−)に示
す様な斜めの画像であった場合、ブロックB以降におい
て認識の防げとなるので、斜めに入力された場合にはこ
の時点で第1図<b>に示す様に水平に並び換える。
ブロックBにおいて、水平に並び換えられた文字画像2
の横方向の周辺分布4を計数する。一般に横方向の周辺
分布は、第1図の5に示す様な形状となる。入力画像が
複数行の場合、横方向の周辺分布は、第1図(C)に似
たものが行と同じ数だけできあがる。該横方向の周辺分
布3の形状をみると、その形状より標準文字高■(小文
字Xの高さ)及び、文字行基準線■の位置を知ることが
できる。ブロックBにおいては、標準文字高■及び文字
行基準線■と同時に文字行の位置を抽出する。
ブロック0においては、ブロックBにおいて抽出された
文字行の中から単語領域を抽出する。単語領域の抽出は
、文字行と垂直な方向の周辺分布を計数し、該周辺分布
め固まりと固まりの間隔を調べ、文字間隔か単語間隔か
を判断することによって可能である。
ブロックDにおいては、ブロックOにおいて抽出された
単語領域から文字領域を抽出する。文字領域の抽出は、
ブロックCにおいて計数された周辺分布の結果を用いて
抽出することも可能であるが、対象文字が英数字である
場合には、小文字の1、jをぬかしてすべてが一つの連
結成分よりなっているので、文字画像の輪郭をとること
により文字の抽出が可能である。本発明においては、文
字の輪郭を用いて文字の抽出を行った。また文字の輪郭
抽出と同時に文字の高さ及び文字の基準線が求まる。
ブロック■において、ブロックDにおいて抽出された文
字の認識を行う。ブロックEにおいてはまず最初にブロ
ックDにおいて抽出された文字の高さ及び文字の基準線
と、ブロックBにおいて抽出された標準文字高及び文字
行基準線とを比較し。
候補文字を分類する。一般に、文字の高さ及び文字の基
準線との関係は第2図に示す3つのグループに分けるこ
とができる。1つ目のグループは、第2図−11に示さ
れる様なグループである。該グループは、文字の高さ■
−1は標準文字高■に比べかなり高く、文字の基準線■
−1は文字行基準線■とほぼ同じ位置にある。該文字の
グループに属す文字は第4図における0HARA2及び
0HkRk5のグループである。2つめのグループは、
第2図−12に示される様なグループである該グループ
は、文字の高さ■−2は標準文字高とほぼ等しく、また
文字の基準線■−2も文字行基準線■とほぼ等しい。該
文字のグループに属す文字は第4図における0HARA
4のグループである。3つめのグループは、第2図−1
3に示される様なグループである。該グループは、文字
の高さ■−3は標準文字に比べかなり高く、また文字の
基準線■−5は文字行基準線■に比べかなり低い位置に
ある。該文字のグループに属す文字は第4図における0
HARA1のグループである。
以上の様に、文字の高さ及び文字の基準線の情報により
、候補文字を3つのグループにしぼることが可能である
。従って、候補文字の数は当初52字あったものが、多
(て34文字、少くて5文字となり、平均すると認識に
用いられる時間が半減する。ブロックEにおいては、こ
うしてしぼられた候補文字の辞書データと抽出文字のデ
ータとの比較を行い抽出文字が何であるかの認識を行う
以上の様にブロックEにおいて抽出文字の認識が終了す
ると、ブロックCにおいて抽出された単語の認識が終了
するまでブロックD、ブロックEを繰り返し、単語の認
識が終了するとブロックBにより抽出された文字行の認
識が終了するまでブロックC,ブロックD、ブロックE
の一連の動作を繰り返す。さらに、入力画像のすべての
認識が終了するまで、ブロックB、ブロック0.ブロッ
クD及びブロックEの一連の動作を繰り返し、文字画像
をコート化する。このようにして画像入力装置34によ
って入力した文字画像2を一つの文書ファイルに変換す
る。この後、ブロックFにおいて、認識した結果をデイ
スプレィ65に表示して終了する。
以上の様に本発明の文字認識方法は、入力された画像を
水平に並び換えた後に横方向の周辺分布を計数するので
、周辺分布を調べることにより文字行の位置を知ること
ができ、それと同時に、文字行基準線及び標準文字高を
知ることが可能となる。こうして得られた文字行基準線
及び標準文字高と、文字抽出時に得られる文字基準線及
び文字高とを比較することにより、候補文字を3つのグ
ループに分離することができる。候補文字を3つのグル
ープに分類することにより、今まで52文字の候補文字
があったものが、多くて、34文字、少くて5文字の候
補文字となる。その結果、認識に要する時間は、平均し
て従来の半分以下にすることが可能となる。また、この
様な位置情報及び大きさ情報を用いることにより、rと
t1小文字のqと数字の9(第3図には示さない)、小
文字のgと数字の8(第3図には示さない)といった様
な非常によ(似たデータを持つ文字もはっきりと分類す
ることが可能となり、高速にかつ正確に認識することが
可能となる。
[発明の効果] 以上述べた様に本発明によれば、入力された画像の横方
向の周辺分布を計数し、文字行の位置を求める際に、文
字行基準線及び標準文字高を求める。この後、該文字行
基準線及び標準文字高と、文字抽出時に得られる文字基
準線及び文字高とを比較することにより候補文字しぼる
ことが可能となる。その結果、似たデータを持つ文字も
分類でき、しかも候補文字の数が少ないので、高速でか
つ高い確率の認識が可能となる。結果、現在幅広く用い
られているOORをより使いやすく、信頼の持てるもの
とすることができる。
【図面の簡単な説明】
第1図(α)〜(C)に本発明の文字認識方法の文字行
基準線及び標準文字高の求め方を示した図。 第2図(9)〜(C)に本発明の文字認識方法の文字行
基準線及び標準文字高を用いた分類の方法を示した図。 第3図(α)〜Cd)に本発明の文字認識方法の文字行
基準線及び標準文字高による分類を示した図。 第4図に本発明の文字認識方法が用いられる文字認識装
置のブロック図。 第5図に本発明の文字認識手段のフローチャートを示す
。 1・・・・・・・・・入力文字画像 2・・・・・・・・・修正文字画像 5・・・・・・・・・横方向周辺分布 ■・・・・・・・・・文字行基準線 ■−112t3・・・・・・文字基準線■・・・・・・
・・・標準文字高 ■−1,2,5・・・・・文字高 11.12,13・・・・・・抽出文字21・・・・・
・グループ0HAEA122・・・・・・グループ0H
ARA223・・・・・・グループO−HA RA 5
24・・・・・・グループ0HARA431 ・・・ 
・・・ 0PU 2 ・・・ ・・・ RAM 3 ・・・・・・ ROM 4・・・・・・画像入力装置 5・・・・・・デイスプレィ ・・・・・・ブロックA ・・・・・・ブロックB ・・・・・・ブロック0 ・・・・・・ブロックD ・・・・・・ブロックE ・・・・・・ブロックF 以上

Claims (3)

    【特許請求の範囲】
  1. (1) 光学的画像入力手段により紙面等に書かれた文
    字画像を読み取り、入力された画像データ中の文字を認
    識しコード番号に置き換える文字認識方法において、 文字抽出時に得られる文字画像の位置及び大きさによっ
    て候補文字を分類した後に文字を推定することを特徴と
    する文字認識方法。
  2. (2) 文字認識前段階である文字行抽出段階において
    得られる文字行基準線と、文字画像の位置とを比較する
    ことにより、候補文字を分類することを特徴とする第1
    項記載の文字認識方法。
  3. (3) 文字認識前段階である文字行抽出段階において
    得られる標準文字高と、文字画像の大きさを比較するこ
    とにより、候補文字を分類することを特徴とする第1項
    記載の文字認識方法。
JP63215382A 1988-08-30 1988-08-30 文字認識方法 Pending JPH0262682A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63215382A JPH0262682A (ja) 1988-08-30 1988-08-30 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63215382A JPH0262682A (ja) 1988-08-30 1988-08-30 文字認識方法

Publications (1)

Publication Number Publication Date
JPH0262682A true JPH0262682A (ja) 1990-03-02

Family

ID=16671375

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63215382A Pending JPH0262682A (ja) 1988-08-30 1988-08-30 文字認識方法

Country Status (1)

Country Link
JP (1) JPH0262682A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04148294A (ja) * 1990-10-08 1992-05-21 Fujitsu Ltd 文字認識方式
US5729630A (en) * 1990-05-14 1998-03-17 Canon Kabushiki Kaisha Image processing method and apparatus having character recognition capabilities using size or position information

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5729630A (en) * 1990-05-14 1998-03-17 Canon Kabushiki Kaisha Image processing method and apparatus having character recognition capabilities using size or position information
JPH04148294A (ja) * 1990-10-08 1992-05-21 Fujitsu Ltd 文字認識方式

Similar Documents

Publication Publication Date Title
Ha et al. Document page decomposition by the bounding-box project
US6006240A (en) Cell identification in table analysis
US5369714A (en) Method and apparatus for determining the frequency of phrases in a document without document image decoding
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
JPH05242292A (ja) 分離方法
Biswas et al. Writer identification of Bangla handwritings by radon transform projection profile
CN102779276B (zh) 文本图像识别方法和装置
Liang et al. Performance evaluation of document layout analysis algorithms on the UW data set
US6567545B1 (en) Format recognition method, apparatus and storage medium
JP2006338578A (ja) 文字認識装置
JPH08320914A (ja) 表認識方法および装置
Fan et al. A robust proposal generation method for text lines in natural scene images
JPH05334490A (ja) 表認識装置
JPH0262682A (ja) 文字認識方法
Majumdar et al. Recognizing handwriting styles in a historical scanned document using unsupervised fuzzy clustering
Peng et al. Document image matching based on component blocks
Fan et al. A feature point clustering approach to the recognition of form documents
JP7283756B2 (ja) 情報処理装置、及びプログラム
JPH0350692A (ja) 文字認識装置
JP3091278B2 (ja) 文書認識方式
JPH0281189A (ja) 文字認識方法
JPH1166230A (ja) 文書認識装置、文書認識方法及び媒体
JPH0273484A (ja) 文字認識方法
JPH05120483A (ja) 文字認識装置
JPH01231186A (ja) 文字認識方式