JPH061507B2 - 文字列認識装置 - Google Patents

文字列認識装置

Info

Publication number
JPH061507B2
JPH061507B2 JP62011630A JP1163087A JPH061507B2 JP H061507 B2 JPH061507 B2 JP H061507B2 JP 62011630 A JP62011630 A JP 62011630A JP 1163087 A JP1163087 A JP 1163087A JP H061507 B2 JPH061507 B2 JP H061507B2
Authority
JP
Japan
Prior art keywords
character
word
image
recognition
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62011630A
Other languages
English (en)
Other versions
JPS63178380A (ja
Inventor
慎治 佐瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP62011630A priority Critical patent/JPH061507B2/ja
Publication of JPS63178380A publication Critical patent/JPS63178380A/ja
Publication of JPH061507B2 publication Critical patent/JPH061507B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、光学的に文字を読み取る文字認識装置に関
し、特に、特定の名称を読み取る文字列読み取り装置に
関する。
(従来の技術) 従来、この種の文字認識装置は、有効なデータ入力の手
段として、開発されている。しかし、現状では、対象が
印刷文字であるか限定文字枠内に書かれた手書き文字で
あるか又は、各文字が完全に分離している等様々な限定
事項を有しているのが実情である。
印刷文字列の認識方式の例としては、アール・ジー・ケ
イシー・(R.G.Casey)「リカーシブセグメンテイション
アンドクラシィフィケイションオブコンポジィットキャ
ラクターパターンズ(Recursive Segmentation and Clas
sification of Composite CharacterPattens)」第6回
パタン認識国際会議プロシーディング,pp1023-1026(19
82),(Proc.6thICPR,)がある。
又、各文字が完全に分離している例としては、中野康明
他、“文字認識と協調した表形式文書の理解”電子通信
学会論文誌'86/3Vo1.J69-DNo.3(1986)があげられる。
しかし、手書き文字列は、一般には、文字枠内に書かれ
ない場合が多い。このような文字列をよみ取ることは、
非常にに有力な入力手段となるが、この場合文字は接触
していたり、不均等に並んでいるのが普通で、なおかつ
漢字には分離文字を含んでいる。従って、文字を読む以
前に文字列を一文字毎に分離する文字切り出しの性能が
十分とは言い難い現状では、上記の文字認識装置によ
り、郵便物の宛名のような比較的自由に書かれた手書き
文字を読み取ることは困難である。
(発明が解決しようとする問題点) 上述した従来の文字認識装置では、文字切り出し性能が
十分でないという現状では、郵便物の宛名の如く比較的
自由に書かれた手書き文字を精度よく読みとることは困
難であるという欠点がある。又単語間の順序系列を用い
ていないことにより上述の単語認識方式では、十分な精
度と処理速度を得ることが困難であるという欠点があ
る。
本発明は、各文字行の先頭より、特定の文字を抽出し、
この抽出された部分を文字行から取り除くという操作を
繰り返すことにより、文字が接触したり分離した場合で
も、安定して文字を取り出すことができ、かつ、認識対
象が少数の単語の組み合わせにより構成されているとし
て、画像サイズや単語の文字数とは関わりなく、単語単
位で判定を行なうことにより、効率よく精度のよい、文
字認識が可能で、更にその単語間の順序を与えることに
より、更に効率よく精度のよい文字列認識装置を提供す
ることにある。
(問題を解決するための手段) 入力文字図形として、その文字列を2次元座標を指定す
ることにより、2値の値が参照できる形式で保持する入
力パタンバッファと、入力パタンより、入力パタンバッ
ファと対応した形式で線分方向別に方向寄与の値による
方向画像を作成する特徴抽出部と、予め出現することの
知られている単語及び該単語間の順序系列を記憶する単
語記憶部と、各文字図形の標準パタンを線分の系列とし
て表現し、各線分の方向と許容される線分長の変動量
と、線分間の相対位置情報を記憶するための文字標準パ
タン記憶部と、与えられた文字列画像の先頭より指定さ
れた存在位置不明の文字を文字標準パタンを参照して抽
出し、該文字の外接枠及び抽出信頼度を求める文字認識
部と、上記文字認識部の結果をもとに、上記入力パタン
及び方向画像より次に読むべき画像を設定し、次に抽出
すべき文字を文字認識部に指定することにより文字認識
と文字切り出しを交互に行ない、かつ単語毎に認識信頼
度及び抽出した単語の外接枠の位置を求める単語認識部
と上記単語認識部の結果をもとに、単語間で判定を行な
い、対応する結果をもとに入力パタン及び方向画像を再
設定することにより、次に読み取るべき単語認識と単語
画像の切り出しを交互に行い、かつ次に抽出すべき単語
を単語間の順序系列に従い単語認識部に指定する判定部
を有している。
(作用) 比較的自由に書かれた文字列(例えば、郵便物の宛先・
宛名等)を光学的に読みとる際、どの領域に各文字があ
るかを判定する文字切り出しの技術が、文字認識の技術
と共に重要な技術となるが、文字切り出しを上記文字列
に対して正確に行なうには、文字更には単語が認識され
る必要がある。そこで、本発明では、文字列の先頭より
順に文字を読みとるとし、文字列の画像の先頭より、特
定の文字画像を抽出する。抽出の方法は、文字は線分よ
り構成されているとして、線分を標準パタンに従って追
跡することにより抽出する。文字を抽出することによ
り、文字列の画像よりたとえ文字が接触していても文字
を切り出すことが可能となる。従って従来の文字認識
が、文字画像を入力とし、認識結果を文字カテゴリ名と
していたのに対して、ここでは文字カテゴリ名及び、文
字列画像を入力とし、抽出した文字画像及びその抽出信
頼度を出力としている。
更に日本語文字には、類似文字(例えば“問”,“間”
等)及び分離しても読める文字(例えば“台”→カタカ
ナの“ム”,“ロ”)があるため、識別結果は、単語単
位で行なう方が安定した識別が期待できる。
この場合、文字列中に出現する単語が既知であれば、文
字毎の識別結果を並べて単語又は単語の系列である文の
辞書と比較して結果を判定する後処理型の文字列認識よ
り、先に文字列中に出現可能な単語を選び出し、識別を
行なう方が効率がよく、安定した認識が可能となる。
更に単語間に順序規則がある時、以前の単語認識の結果
をもとに次に出現する単語の候補を絞ることができれば
より高速で、より安定した識別ができる。
本手法で問題となるのは、文字認識において、文字が抽
出できたかどうかの判定であるが、本手法では、文字標
準パタンをもとに線分を追跡し、かつ、線分追跡に用い
られなかった文字列上の線部分をも評価することによ
り、線分追跡が不可能な場合、及び、線分追跡に用いら
れなかった文字列上の線分部が多い場合には、抽出不可
能という判定を下すことにより上記問題を解決してい
る。
(実施例) 次に本発明について図面を参照して説明する。
第1図は本発明の一実施例を示すブロツク図である。第
1図において入力パタン1は2次元、2値の文字列画像
である。線分部を黒画素、背景部を白画素とし、横軸を
x、縦軸yとする座標を導入して記述される。第2図
に、文字列画像の一例として“台東区下谷・・・・”の文字
列の先頭部分を示す。同図においてハッチングを施され
た部分が黒画素等を示している。
入力パタンは、特徴抽出部2において、方向画像3に変
換される。方向画像は文字列画像の各黒画素がどの方向
の線分に属しているか調べ、その方向別に各画素を分割
して作られる2値画像であり、例えば、横、右上がり、
縦、左上がりの4種類などが用いられる。尚、方向画像
の生成方法は従来技術である。
第3図は、本発明で用いる標準パタン4の一例を示して
いる。第3図を用いて標準パタンについて説明する。標
準パタン4としては、文字図形を線分の系列として記述
され保持されるものとする。また文字線の曲線部を区分
的な直線で近似することができるので、標準パタンは第
3図に示す如き有向線分による図形で表現される。ここ
で各線分の方向は第4図に示すように8方向に量子化さ
れている。なお量子化は8方向と限定せず、4方向、1
6方向など異なった方法が考えられるが以下では、簡単
のため8方向量子化の例を用いて説明する。また、一筆
書きで表現できない文字に関しては、線分の接続だけを
意味する仮想線を導入する。第3図で実線は線分を点線
は仮想線を表わしている。更に標準パタンにおいて、文
字の線幅は一定である文字モデルとする。通常、線分系
列は、筆順に従って与える。標準パタンは、本発明では
第3図のような標準パタンを2次元図形としてそのまま
保持するのではなく、第K線分の方向を示す情報dkと線
分の長さの許容変動範囲(ik,mk)と線分始点間の4種の
相対位置情報Uk,Dk,Lk,Rk<K(K=1,…K;Kは線分数を示し
第3図の場合はK=5となる)として表現し保持する。
方向dkとしてはx−y平面での方向ベクトル(△xk,△
yk)(但し△xk={0,1,−1},△yk={0,
1,−1})を用いる方法が一例として考えられる。
(第4図)いま第K線分をVで示すと標準パタンBは (1)式で表現され、Kに関して参照可能な形式で保持さ
れる。なお標準パタンは、認識の対象となる各文字クラ
スに対して1個以上を有するものとする。
本発明では標準パタンの形を固定せず、各線分の長さ|
|を許容される範囲で変化させて種々の標準パタン
を発生していると考える。すなわち第5図(a)に示す文
字“下”の|V|を伸長すると同図(b)の如くなり、
さらにV|を短縮すると同図(c)の如くなる。同様に
各線分の長さを種々に変化させると千変万化の字体(変
形図形)が得られるが、これらはいずれも文字“下”の
パタンであることに変わりない。しかし文字によって余
り変化させると異なった文字になってしまうものもある
ので、各線分の許容長さ変動値ik,mk及び線分始点間の
4種の相対位置情報Uk,Dk,Lk,Rkを導入し、字体の変化
を制御しあわせすぎによる誤認識を防ぐとともに、発生
する図形の数を減少することにより、処理の効率化をは
かる。又、mkはその線分が実線であるか仮想線であるか
の分類にも用いられmk>0で実線mk<0で仮想線を表わ
す。ik,mkはik≦|V|≦|mk|の範囲内でのみ線分
の長さが変動することを示し、Uk,Dk,Lk,Rkはそれぞれ
下記の条件を満足する線分系列のK番目以前に出現する
線分番号を表わし、第K線分の始点がそれ以前の線分系
列のある線分の始点を参照して、第Uk線分の始点より下
方にあり、第Dk線分の始点より上方にあり、第Lk線分の
始点より右方にあり、第Rk線分の始点より左方にあるこ
とを示す。従ってUk,Dk,Lk,Rk<Kであり、参照する線
分のない時には、0とする。(必ずU1=D1=L1=R1=0であ
る。)要するに、本発明においては、標準パタンをベク
トルの系列で表現しており、各ベクトルはその方向と長
さと始点位置で定められるが、このうち上記パラメータ
dkは方向制御しik,mkは長さを制御し、Uk,Dk,Lk,Rk
位置を制御するパラメータとして各線分に与えられてい
る。
第1図の文字認識部5は、入力として、文字名、文字列
画像及び文字列方向画像を受け取ると、標準パタン4よ
り文字名に対応する標準パタンを用いて、文字列画像の
先頭より、照合を行ない、最もよく一致する文字図形
(以後、一致文字図形と呼ぶ)及びその抽出信頼度を求
める。ここで、標準パタンにより一致文字図形を求める
ことは、標準パタンの各線分Vkの長さ|Vk|を入力画像
と最も一致するように一意に定めることに相当する。
一致文字図形は、例えば第6図のような文字列画像より
第3図の標準パタンを用いて照合すると第7図に実線で
示した線図形として得られる。この一致文字図形を用い
て、最外郭の座標x1,x2,y1,y2を求めれば文字図形の領
域は容易に定まり、文字切り出しが可能となる。
文字認識部5の出力は、この文字切り出しの領域及び前
述の抽出信頼度としている。ただし、一致文字図形が抽
出できない場合は、信頼度のかわりにリジェクトコード
を出力する。
文字列より一致図形及びその抽出信頼度の検出の具体例
は、本願出願人の出願になる(特願昭61-307052号(特
開昭63-157290号)、文字認識装置)に詳述されている
ので詳細は省略する。
単語記憶部6は、単語名と、その属するレベルと、次に
出現する単語のレベルが登録されている。単語のレベル
とは、単語間の順序関係を定めるもので、単語として、
同じ位置に出現可能な単語が一つのレベルとして予じめ
分類されている。
以下、東京都台東区内の住所読み取りを例に本発明を説
明する。東京都台東区の単語辞書の一部を第8図に示
す。第8図において、レベル1は文字列の先頭にくる可
能性のある単語で構成され、レベル2は区名、レベル3
は、区名の次に出現する可能性のある単語で構成されて
いる。
判定部7は、文字列画像1及び方向画像3を受け取り、
単語記憶部6より読むべきレベルの単語を一つずつ取り
出し、単語認識部9に送り、単語認識部より、文字列画
像よりの該単語の単語抽出信頼度と抽出外接枠の位置を
受け取る。判定部は、単語毎に単語抽出信頼度を比較
し、同一レベルで最も高い抽出信頼度を得た単語に判定
し、その結果を判定結果13として出力し、その結果に応
じた次に読むべき単語のレベルを設定し、又対応する抽
出外接枠位置を用いて文字列画像及びその方向画像を再
設定する。この処理を読むべきレベルがなくなるか、単
語抽出ができなくなる迄繰り返す。
第2図の入力パタンと、第8図の単語構成が与えられた
場合を例示する。判定部は、最初レベル1の単語を単語
記憶部に取り出しにくい。まず第2図の文字列画像とこ
れに対応する方向画像と単語名“東京都”を単語認識部
に送り、単語認識部において指定された単語の画像を文
字列中より抽出し、単語抽出信頼度C(東京都)と外接
枠の位置P(東京都)を受け取る。レベル1の他の単語
に対しても同様の処理を繰り返し、抽出信頼度C(都
内)、C(台東区)及び外接枠の位置P(都内)P(台
東区)をそれぞれ求める。そして、C(都内)<C(東
京都)<C(台東区)であれば判定結果を“台東区”と
してこの結果を13に出力しその枠サイズP(台東区)に
もとづいて、入力画像及び方向画像より、枠サイズの部
分を取り除き、入力画像及び方向画像の次の部分が先頭
にくるように画像を再設定する。第9図に第2図の“台
東区”の各文字の一致文字図形を実線で示し、その単語
外接枠サイズP(台東区)をもとに再設定した文字列画
像を示す。そして次に読むべきレベル3とし、文字列画
像を第10図、方向画像をこれに対応したものとして上記
処理を繰り返す。
単語認識部9は、判定部7より、文字列画像これに対応
する方向画像及び、抽出すべき単語名を受け取ると、単
語名を構成する文字を先頭より一文字毎に文字認識に指
定する。単語の先頭の文字名を指定する場合は、判定部
7より受け取った文字列画像及び方向画像をそのまま文
字認識部5に送り、文字認識部において、文字列より、
指定された文字の画像を抽出し、その抽出信頼度cと抽
出した文字外接枠位置pを文字認識部より受け取る。単
語の2番目以降の文字を文字認識に指定する場合には、
まず判定部においてなされたのと同様に同一単語内のそ
れ以前の文字に対する画像の抽出部分を取り除いた文字
画像及び方向画像を設定し、以下先頭の文字と同様に抽
出信頼度c及び外接枠位置pを求める。
もし、文字認識部よりリジェクトコードが返されれば、
即座に単語認識部における処理は中止され判定部にリジ
ェクトコードが渡される。さもなければ、単語に含まれ
るすべての文字に対して順次抽出信頼度c及び文字切り
出し位置pを求め。各文字の抽出信頼度の平均値を単語
抽出信頼度Cとし、各文字の外接枠の結合を単語の外接
枠位置Pとして、判定部に出力する。
判定部より、単語認識部に第2図の文字列画像とこれに
対応した方向画像及び単語名“台東区”が与えられた場
合と一例として説明する。(第9図参照) まず文字認識部に第2図の文字列画像とこれに対応した
方向画像及び文字名“台”を出力し、文字認識部より抽
出信頼度c(台)及び文字切り出し位置p(台)を入力
する。この結果がリジェクトでなければ、文字列画像及
び方向画像より台9図のp(台)より上に相当する部分
を除去し残りのp(台)より下に相当する部分を新たに
2値文字列画像及び方向画像として設定する。そして、
次に上記の新たに設定された画像及び文字名“東”を出
力し、入力として抽出信頼度c(東)及び文字切り出し
位置p(東)を文字認識部より得る。以後同様にp
(東)をもとに新たに文字列画像及び方向画像を設定し
直しこれらと共に文字名“区”を出力し抽出信頼度c
(区)及び文字切り出し位置p(区)を入力する。
こうして各文字の抽出信頼度c(台)c(東)c(区)
が求まったならば により単語抽出信頼度C(台東区)を求め単語切り出し
位置P(台東区)を P(台東区)=p(区) としてこれらを判定部に出力する。
上記のようにして、判定部、単語認識部、文字認識部の
処理を繰り返すことにより、単語認識部に登録してある
レベル毎に文字列が順次認識されていくことになる。
(発明の効果) 以上説明したように、本発明は、文字認識と文字切り出
しを融合させることにより、文字枠のない、接続した文
字をも含む文字列の認識を可能とし、かつ文字認識と文
字切り出しを別々に行なうよりも処理効率も高く、又単
語単位で判定を行ないなおかつ先に単語名を決めてから
連続的に文字認識を行なうため、認識率が向上し、更
に、単語間に順序系列を与えることにより、処理効率及
び認識率が向上し、郵便物の宛先のごとき、比較的自由
に書かれた手書き文字列をも読み取ることができる効果
がある。
【図面の簡単な説明】
第1図は本発明の構成の一例を示す機能ブロック図であ
る。 第2図は、本発明に適用される入力画像の一例をであ
る。 第3図は標準パタンを説明するための例図であり、第4
図は標準パタンの各線分が取りうる方向を示したもので
ある。 第5図は第3図の標準パタンにより、様々な文字図形が
表現できることを示すことである。 第6図は文字認識部に入力される2値文字列画像の一例
を第7図は、第6図の文字列画像より、文字認識部にお
いて、第3図の標準パタンを用いて抽出された一致図形
及びその文字切り出し位置を示す。 第8図は単語記憶部の構成を示す一例である。 第9図は、第2図の入力パタンに対して単語“台東区”
を抽出した際の各文字の一致図形及び各文字の切り出し
位置及び単語の切り出し位置を示した図である。 第10図は第2図の入力パタンと第8図の単語記憶部に対
してレベル1で“台東区”と判定結果が出た時の判定部
の単語切り出し後の新たに設定し直された文字列を示す
2値画像である。 図において、 1…入力パタン、 2…特徴抽出部、 3…方向画像部、 4…文字標準パタン、 5…文字認識部、 6…単語記憶部、 7…判定部、 9…単語認識部 をそれぞれ示す。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】入力文字図形として、その文字列を2次元
    座標を指定することにより、2値の値が参照できる形式
    で保持する入力パタンバッファと、入力パタンより、入
    力パタンバッファと対応した形式で線分方向別の方向寄
    与の値による複数の方向画像を作成する特徴抽出部と各
    文字図形の標準パタンを線分の系列として表現し、各線
    分の方向と許容される線分長の変動量と、線分間の相対
    位置情報を記憶するための文字標準パタン記憶部と、予
    じめ、文字列中に出現することの知られている単語及び
    該単語間の順序系列を記憶する単語記憶部と、与えられ
    た文字列画像の先頭より読み取るべき文字を文字標準パ
    タンを参照して照合し、該文字の文字切り出し位置及び
    抽出信頼度を求める文字認識部と読みとるべき単語を構
    成する各文字名と入力パタン及び方向画像内の照合され
    るべき部分画像を上記文字認識部に与え、文字認識部の
    結果である文字切り出し位置により、文字切り出しを行
    ない次に照合すべき部分画像を作成することにより、文
    字認識と文字切り出しを交互に行ない、単語の抽出信頼
    度及び抽出した単語の外接枠の位置即ち単語切り出し位
    置を求める単語認識部と上記単語認識部の結果をもと
    に、単語間で判定を行ない、対応する結果の単語切り出
    し位置をもとに、次に読まれるべき入力パタン及び方向
    画像の部分画像を作成し、次に読みとるべき単語を単語
    間の順序系列に従い単語認識部に与えることにより、単
    語認識と単語画像の切り出しを交互に行ないながら単語
    単位で識別判定を行なう判定部を有する文字列認識装
    置。
JP62011630A 1987-01-20 1987-01-20 文字列認識装置 Expired - Lifetime JPH061507B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62011630A JPH061507B2 (ja) 1987-01-20 1987-01-20 文字列認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62011630A JPH061507B2 (ja) 1987-01-20 1987-01-20 文字列認識装置

Publications (2)

Publication Number Publication Date
JPS63178380A JPS63178380A (ja) 1988-07-22
JPH061507B2 true JPH061507B2 (ja) 1994-01-05

Family

ID=11783255

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62011630A Expired - Lifetime JPH061507B2 (ja) 1987-01-20 1987-01-20 文字列認識装置

Country Status (1)

Country Link
JP (1) JPH061507B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63298678A (ja) * 1987-05-29 1988-12-06 Nec Corp 単語認識装置

Also Published As

Publication number Publication date
JPS63178380A (ja) 1988-07-22

Similar Documents

Publication Publication Date Title
EP0740263A2 (en) Method of training character templates for use in a recognition system
CN111401099B (zh) 文本识别方法、装置以及存储介质
Ramesh et al. Offline Kannada handwritten character recognition using convolutional neural networks
CN113158977A (zh) 改进FANnet生成网络的图像字符编辑方法
Elgammal et al. A graph-based segmentation and feature extraction framework for Arabic text recognition
CN115862045A (zh) 基于图文识别技术的病例自动识别方法、系统、设备及存储介质
Raj et al. Junction point elimination based Tamil handwritten character recognition: an experimental analysis
KR0170656B1 (ko) 필기체문자 인식방법 및 장치
CN111126160B (zh) 基于五笔输入法构建的智能汉字结构评价方法及系统
Najoua et al. A robust approach for Arabic printed character segmentation
Parwej An empirical evaluation of off-line Arabic handwriting and printed characters recognition system
Shakunthala et al. Enhanced text line segmentation and skew estimation for handwritten Kannada document
KR0186025B1 (ko) 후보 문자 분류 방법
JPH061507B2 (ja) 文字列認識装置
Oliveira et al. A synthetic database to assess segmentation algorithms
Bushofa et al. Segmentation and Recognition of Printed Arabic Characters.
Ali et al. Language independent optical character recognition for hand written text
AlKhateeb et al. Interactive knowledge discovery for baseline estimation and word segmentation in handwritten Arabic text
Shaikh et al. Bengali printed character recognition–a new approach
CN116311264B (zh) 一种基于字符轮廓的字符识别方法
Oladayo Yorùbá language and numerals’ offline interpreter using morphological and template matching
Amin Recognition of printed Arabic text using machine learning
US20250391186A1 (en) Vehicle mileage recognition method and apparatus
JPS63269267A (ja) 文字認識方法
Hirose et al. Authorship identification of ukiyoe by using rakkan image