JPH061507B2

JPH061507B2 - 文字列認識装置

Info

Publication number: JPH061507B2
Application number: JP62011630A
Authority: JP
Inventors: 慎治佐瀬
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1987-01-20
Filing date: 1987-01-20
Publication date: 1994-01-05
Anticipated expiration: 2009-01-05
Also published as: JPS63178380A

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、光学的に文字を読み取る文字認識装置に関
し、特に、特定の名称を読み取る文字列読み取り装置に
関する。

（従来の技術）従来、この種の文字認識装置は、有効なデータ入力の手
段として、開発されている。しかし、現状では、対象が
印刷文字であるか限定文字枠内に書かれた手書き文字で
あるか又は、各文字が完全に分離している等様々な限定
事項を有しているのが実情である。

印刷文字列の認識方式の例としては、アール・ジー・ケ
イシー・(R.G.Casey)「リカーシブセグメンテイション
アンドクラシィフィケイションオブコンポジィットキャ
ラクターパターンズ(Recursive Segmentation and Clas
sification of Composite CharacterPattens)」第６回
パタン認識国際会議プロシーディング，pp1023-1026(19
82),(Proc.6thICPR,)がある。

又、各文字が完全に分離している例としては、中野康明
他、“文字認識と協調した表形式文書の理解”電子通信
学会論文誌'86/3Vo1.J69-DNo.3(1986)があげられる。

しかし、手書き文字列は、一般には、文字枠内に書かれ
ない場合が多い。このような文字列をよみ取ることは、
非常にに有力な入力手段となるが、この場合文字は接触
していたり、不均等に並んでいるのが普通で、なおかつ
漢字には分離文字を含んでいる。従って、文字を読む以
前に文字列を一文字毎に分離する文字切り出しの性能が
十分とは言い難い現状では、上記の文字認識装置によ
り、郵便物の宛名のような比較的自由に書かれた手書き
文字を読み取ることは困難である。

（発明が解決しようとする問題点）上述した従来の文字認識装置では、文字切り出し性能が
十分でないという現状では、郵便物の宛名の如く比較的
自由に書かれた手書き文字を精度よく読みとることは困
難であるという欠点がある。又単語間の順序系列を用い
ていないことにより上述の単語認識方式では、十分な精
度と処理速度を得ることが困難であるという欠点があ
る。

本発明は、各文字行の先頭より、特定の文字を抽出し、
この抽出された部分を文字行から取り除くという操作を
繰り返すことにより、文字が接触したり分離した場合で
も、安定して文字を取り出すことができ、かつ、認識対
象が少数の単語の組み合わせにより構成されているとし
て、画像サイズや単語の文字数とは関わりなく、単語単
位で判定を行なうことにより、効率よく精度のよい、文
字認識が可能で、更にその単語間の順序を与えることに
より、更に効率よく精度のよい文字列認識装置を提供す
ることにある。

（問題を解決するための手段）入力文字図形として、その文字列を２次元座標を指定す
ることにより、２値の値が参照できる形式で保持する入
力パタンバッファと、入力パタンより、入力パタンバッ
ファと対応した形式で線分方向別に方向寄与の値による
方向画像を作成する特徴抽出部と、予め出現することの
知られている単語及び該単語間の順序系列を記憶する単
語記憶部と、各文字図形の標準パタンを線分の系列とし
て表現し、各線分の方向と許容される線分長の変動量
と、線分間の相対位置情報を記憶するための文字標準パ
タン記憶部と、与えられた文字列画像の先頭より指定さ
れた存在位置不明の文字を文字標準パタンを参照して抽
出し、該文字の外接枠及び抽出信頼度を求める文字認識
部と、上記文字認識部の結果をもとに、上記入力パタン
及び方向画像より次に読むべき画像を設定し、次に抽出
すべき文字を文字認識部に指定することにより文字認識
と文字切り出しを交互に行ない、かつ単語毎に認識信頼
度及び抽出した単語の外接枠の位置を求める単語認識部
と上記単語認識部の結果をもとに、単語間で判定を行な
い、対応する結果をもとに入力パタン及び方向画像を再
設定することにより、次に読み取るべき単語認識と単語
画像の切り出しを交互に行い、かつ次に抽出すべき単語
を単語間の順序系列に従い単語認識部に指定する判定部
を有している。

（作用）比較的自由に書かれた文字列（例えば、郵便物の宛先・
宛名等）を光学的に読みとる際、どの領域に各文字があ
るかを判定する文字切り出しの技術が、文字認識の技術
と共に重要な技術となるが、文字切り出しを上記文字列
に対して正確に行なうには、文字更には単語が認識され
る必要がある。そこで、本発明では、文字列の先頭より
順に文字を読みとるとし、文字列の画像の先頭より、特
定の文字画像を抽出する。抽出の方法は、文字は線分よ
り構成されているとして、線分を標準パタンに従って追
跡することにより抽出する。文字を抽出することによ
り、文字列の画像よりたとえ文字が接触していても文字
を切り出すことが可能となる。従って従来の文字認識
が、文字画像を入力とし、認識結果を文字カテゴリ名と
していたのに対して、ここでは文字カテゴリ名及び、文
字列画像を入力とし、抽出した文字画像及びその抽出信
頼度を出力としている。

更に日本語文字には、類似文字（例えば“問”，“間”
等）及び分離しても読める文字（例えば“台”→カタカ
ナの“ム”，“ロ”）があるため、識別結果は、単語単
位で行なう方が安定した識別が期待できる。

この場合、文字列中に出現する単語が既知であれば、文
字毎の識別結果を並べて単語又は単語の系列である文の
辞書と比較して結果を判定する後処理型の文字列認識よ
り、先に文字列中に出現可能な単語を選び出し、識別を
行なう方が効率がよく、安定した認識が可能となる。

更に単語間に順序規則がある時、以前の単語認識の結果
をもとに次に出現する単語の候補を絞ることができれば
より高速で、より安定した識別ができる。

本手法で問題となるのは、文字認識において、文字が抽
出できたかどうかの判定であるが、本手法では、文字標
準パタンをもとに線分を追跡し、かつ、線分追跡に用い
られなかった文字列上の線部分をも評価することによ
り、線分追跡が不可能な場合、及び、線分追跡に用いら
れなかった文字列上の線分部が多い場合には、抽出不可
能という判定を下すことにより上記問題を解決してい
る。

（実施例）次に本発明について図面を参照して説明する。

第１図は本発明の一実施例を示すブロツク図である。第
１図において入力パタン１は２次元、２値の文字列画像
である。線分部を黒画素、背景部を白画素とし、横軸を
ｘ、縦軸ｙとする座標を導入して記述される。第２図
に、文字列画像の一例として“台東区下谷・・・・”の文字
列の先頭部分を示す。同図においてハッチングを施され
た部分が黒画素等を示している。

入力パタンは、特徴抽出部２において、方向画像３に変
換される。方向画像は文字列画像の各黒画素がどの方向
の線分に属しているか調べ、その方向別に各画素を分割
して作られる２値画像であり、例えば、横、右上がり、
縦、左上がりの４種類などが用いられる。尚、方向画像
の生成方法は従来技術である。

第３図は、本発明で用いる標準パタン４の一例を示して
いる。第３図を用いて標準パタンについて説明する。標
準パタン４としては、文字図形を線分の系列として記述
され保持されるものとする。また文字線の曲線部を区分
的な直線で近似することができるので、標準パタンは第
３図に示す如き有向線分による図形で表現される。ここ
で各線分の方向は第４図に示すように８方向に量子化さ
れている。なお量子化は８方向と限定せず、４方向、１
６方向など異なった方法が考えられるが以下では、簡単
のため８方向量子化の例を用いて説明する。また、一筆
書きで表現できない文字に関しては、線分の接続だけを
意味する仮想線を導入する。第３図で実線は線分を点線
は仮想線を表わしている。更に標準パタンにおいて、文
字の線幅は一定である文字モデルとする。通常、線分系
列は、筆順に従って与える。標準パタンは、本発明では
第３図のような標準パタンを２次元図形としてそのまま
保持するのではなく、第Ｋ線分の方向を示す情報d_kと線
分の長さの許容変動範囲(ik,mk)と線分始点間の４種の
相対位置情報U_k,D_k,L_k,R_k＜K(K=1,…K;Kは線分数を示し
第３図の場合はＫ＝５となる）として表現し保持する。
方向d_kとしてはｘ−ｙ平面での方向ベクトル（△_xk,△
_yk）（但し△_ｘｋ＝｛０，１，−１｝，△_ｙｋ＝｛０，
１，−１｝）を用いる方法が一例として考えられる。
（第４図）いま第Ｋ線分をＶ_ｋで示すと標準パタンＢは (1)式で表現され、Ｋに関して参照可能な形式で保持さ
れる。なお標準パタンは、認識の対象となる各文字クラ
スに対して１個以上を有するものとする。

本発明では標準パタンの形を固定せず、各線分の長さ｜
Ｖ_ｋ｜を許容される範囲で変化させて種々の標準パタン
を発生していると考える。すなわち第５図(a)に示す文
字“下”の｜Ｖ_３｜を伸長すると同図(b)の如くなり、
さらにＶ_２｜を短縮すると同図(c)の如くなる。同様に
各線分の長さを種々に変化させると千変万化の字体（変
形図形）が得られるが、これらはいずれも文字“下”の
パタンであることに変わりない。しかし文字によって余
り変化させると異なった文字になってしまうものもある
ので、各線分の許容長さ変動値ik，mk及び線分始点間の
４種の相対位置情報U_k,D_k,L_k,R_kを導入し、字体の変化
を制御しあわせすぎによる誤認識を防ぐとともに、発生
する図形の数を減少することにより、処理の効率化をは
かる。又、mkはその線分が実線であるか仮想線であるか
の分類にも用いられmk＞０で実線mk＜０で仮想線を表わ
す。ik,mkはik≦｜Ｖ_ｋ｜≦｜_mk｜の範囲内でのみ線分
の長さが変動することを示し、U_k,D_k,L_k,R_kはそれぞれ
下記の条件を満足する線分系列のＫ番目以前に出現する
線分番号を表わし、第Ｋ線分の始点がそれ以前の線分系
列のある線分の始点を参照して、第U_k線分の始点より下
方にあり、第D_k線分の始点より上方にあり、第L_k線分の
始点より右方にあり、第R_k線分の始点より左方にあるこ
とを示す。従ってU_k,D_k,L_k,R_k＜Ｋであり、参照する線
分のない時には、０とする。（必ずU₁=D₁=L₁=R₁=0であ
る。）要するに、本発明においては、標準パタンをベク
トルの系列で表現しており、各ベクトルはその方向と長
さと始点位置で定められるが、このうち上記パラメータ
dkは方向制御しik，mkは長さを制御し、U_k,D_k,L_k,R_kは
位置を制御するパラメータとして各線分に与えられてい
る。

第１図の文字認識部５は、入力として、文字名、文字列
画像及び文字列方向画像を受け取ると、標準パタン４よ
り文字名に対応する標準パタンを用いて、文字列画像の
先頭より、照合を行ない、最もよく一致する文字図形
（以後、一致文字図形と呼ぶ）及びその抽出信頼度を求
める。ここで、標準パタンにより一致文字図形を求める
ことは、標準パタンの各線分V_kの長さ｜V_k｜を入力画像
と最も一致するように一意に定めることに相当する。

一致文字図形は、例えば第６図のような文字列画像より
第３図の標準パタンを用いて照合すると第７図に実線で
示した線図形として得られる。この一致文字図形を用い
て、最外郭の座標x₁,x₂,y₁,y₂を求めれば文字図形の領
域は容易に定まり、文字切り出しが可能となる。

文字認識部５の出力は、この文字切り出しの領域及び前
述の抽出信頼度としている。ただし、一致文字図形が抽
出できない場合は、信頼度のかわりにリジェクトコード
を出力する。

文字列より一致図形及びその抽出信頼度の検出の具体例
は、本願出願人の出願になる（特願昭61-307052号（特
開昭63-157290号）、文字認識装置）に詳述されている
ので詳細は省略する。

単語記憶部６は、単語名と、その属するレベルと、次に
出現する単語のレベルが登録されている。単語のレベル
とは、単語間の順序関係を定めるもので、単語として、
同じ位置に出現可能な単語が一つのレベルとして予じめ
分類されている。

以下、東京都台東区内の住所読み取りを例に本発明を説
明する。東京都台東区の単語辞書の一部を第８図に示
す。第８図において、レベル１は文字列の先頭にくる可
能性のある単語で構成され、レベル２は区名、レベル３
は、区名の次に出現する可能性のある単語で構成されて
いる。

判定部７は、文字列画像１及び方向画像３を受け取り、
単語記憶部６より読むべきレベルの単語を一つずつ取り
出し、単語認識部９に送り、単語認識部より、文字列画
像よりの該単語の単語抽出信頼度と抽出外接枠の位置を
受け取る。判定部は、単語毎に単語抽出信頼度を比較
し、同一レベルで最も高い抽出信頼度を得た単語に判定
し、その結果を判定結果13として出力し、その結果に応
じた次に読むべき単語のレベルを設定し、又対応する抽
出外接枠位置を用いて文字列画像及びその方向画像を再
設定する。この処理を読むべきレベルがなくなるか、単
語抽出ができなくなる迄繰り返す。

第２図の入力パタンと、第８図の単語構成が与えられた
場合を例示する。判定部は、最初レベル１の単語を単語
記憶部に取り出しにくい。まず第２図の文字列画像とこ
れに対応する方向画像と単語名“東京都”を単語認識部
に送り、単語認識部において指定された単語の画像を文
字列中より抽出し、単語抽出信頼度Ｃ（東京都）と外接
枠の位置Ｐ（東京都）を受け取る。レベル１の他の単語
に対しても同様の処理を繰り返し、抽出信頼度Ｃ（都
内）、Ｃ（台東区）及び外接枠の位置Ｐ（都内）Ｐ（台
東区）をそれぞれ求める。そして、Ｃ（都内）＜Ｃ（東
京都）＜Ｃ（台東区）であれば判定結果を“台東区”と
してこの結果を13に出力しその枠サイズＰ（台東区）に
もとづいて、入力画像及び方向画像より、枠サイズの部
分を取り除き、入力画像及び方向画像の次の部分が先頭
にくるように画像を再設定する。第９図に第２図の“台
東区”の各文字の一致文字図形を実線で示し、その単語
外接枠サイズＰ（台東区）をもとに再設定した文字列画
像を示す。そして次に読むべきレベル３とし、文字列画
像を第10図、方向画像をこれに対応したものとして上記
処理を繰り返す。

単語認識部９は、判定部７より、文字列画像これに対応
する方向画像及び、抽出すべき単語名を受け取ると、単
語名を構成する文字を先頭より一文字毎に文字認識に指
定する。単語の先頭の文字名を指定する場合は、判定部
７より受け取った文字列画像及び方向画像をそのまま文
字認識部５に送り、文字認識部において、文字列より、
指定された文字の画像を抽出し、その抽出信頼度ｃと抽
出した文字外接枠位置ｐを文字認識部より受け取る。単
語の２番目以降の文字を文字認識に指定する場合には、
まず判定部においてなされたのと同様に同一単語内のそ
れ以前の文字に対する画像の抽出部分を取り除いた文字
画像及び方向画像を設定し、以下先頭の文字と同様に抽
出信頼度ｃ及び外接枠位置ｐを求める。

もし、文字認識部よりリジェクトコードが返されれば、
即座に単語認識部における処理は中止され判定部にリジ
ェクトコードが渡される。さもなければ、単語に含まれ
るすべての文字に対して順次抽出信頼度ｃ及び文字切り
出し位置ｐを求め。各文字の抽出信頼度の平均値を単語
抽出信頼度Ｃとし、各文字の外接枠の結合を単語の外接
枠位置Ｐとして、判定部に出力する。

判定部より、単語認識部に第２図の文字列画像とこれに
対応した方向画像及び単語名“台東区”が与えられた場
合と一例として説明する。（第９図参照）まず文字認識部に第２図の文字列画像とこれに対応した
方向画像及び文字名“台”を出力し、文字認識部より抽
出信頼度ｃ（台）及び文字切り出し位置ｐ（台）を入力
する。この結果がリジェクトでなければ、文字列画像及
び方向画像より台９図のｐ（台）より上に相当する部分
を除去し残りのｐ（台）より下に相当する部分を新たに
２値文字列画像及び方向画像として設定する。そして、
次に上記の新たに設定された画像及び文字名“東”を出
力し、入力として抽出信頼度ｃ（東）及び文字切り出し
位置ｐ（東）を文字認識部より得る。以後同様にｐ
（東）をもとに新たに文字列画像及び方向画像を設定し
直しこれらと共に文字名“区”を出力し抽出信頼度ｃ
（区）及び文字切り出し位置ｐ（区）を入力する。

こうして各文字の抽出信頼度ｃ（台）ｃ（東）ｃ（区）
が求まったならばにより単語抽出信頼度Ｃ（台東区）を求め単語切り出し
位置Ｐ（台東区）をＰ（台東区）＝ｐ（区）としてこれらを判定部に出力する。

上記のようにして、判定部、単語認識部、文字認識部の
処理を繰り返すことにより、単語認識部に登録してある
レベル毎に文字列が順次認識されていくことになる。

（発明の効果）以上説明したように、本発明は、文字認識と文字切り出
しを融合させることにより、文字枠のない、接続した文
字をも含む文字列の認識を可能とし、かつ文字認識と文
字切り出しを別々に行なうよりも処理効率も高く、又単
語単位で判定を行ないなおかつ先に単語名を決めてから
連続的に文字認識を行なうため、認識率が向上し、更
に、単語間に順序系列を与えることにより、処理効率及
び認識率が向上し、郵便物の宛先のごとき、比較的自由
に書かれた手書き文字列をも読み取ることができる効果
がある。

【図面の簡単な説明】

第１図は本発明の構成の一例を示す機能ブロック図であ
る。第２図は、本発明に適用される入力画像の一例をであ
る。第３図は標準パタンを説明するための例図であり、第４
図は標準パタンの各線分が取りうる方向を示したもので
ある。第５図は第３図の標準パタンにより、様々な文字図形が
表現できることを示すことである。第６図は文字認識部に入力される２値文字列画像の一例
を第７図は、第６図の文字列画像より、文字認識部にお
いて、第３図の標準パタンを用いて抽出された一致図形
及びその文字切り出し位置を示す。第８図は単語記憶部の構成を示す一例である。第９図は、第２図の入力パタンに対して単語“台東区”
を抽出した際の各文字の一致図形及び各文字の切り出し
位置及び単語の切り出し位置を示した図である。第10図は第２図の入力パタンと第８図の単語記憶部に対
してレベル１で“台東区”と判定結果が出た時の判定部
の単語切り出し後の新たに設定し直された文字列を示す
２値画像である。図において、１…入力パタン、２…特徴抽出部、３…方向画像部、４…文字標準パタン、５…文字認識部、６…単語記憶部、７…判定部、９…単語認識部をそれぞれ示す。

Claims

【特許請求の範囲】

【請求項１】入力文字図形として、その文字列を２次元
座標を指定することにより、２値の値が参照できる形式
で保持する入力パタンバッファと、入力パタンより、入
力パタンバッファと対応した形式で線分方向別の方向寄
与の値による複数の方向画像を作成する特徴抽出部と各
文字図形の標準パタンを線分の系列として表現し、各線
分の方向と許容される線分長の変動量と、線分間の相対
位置情報を記憶するための文字標準パタン記憶部と、予
じめ、文字列中に出現することの知られている単語及び
該単語間の順序系列を記憶する単語記憶部と、与えられ
た文字列画像の先頭より読み取るべき文字を文字標準パ
タンを参照して照合し、該文字の文字切り出し位置及び
抽出信頼度を求める文字認識部と読みとるべき単語を構
成する各文字名と入力パタン及び方向画像内の照合され
るべき部分画像を上記文字認識部に与え、文字認識部の
結果である文字切り出し位置により、文字切り出しを行
ない次に照合すべき部分画像を作成することにより、文
字認識と文字切り出しを交互に行ない、単語の抽出信頼
度及び抽出した単語の外接枠の位置即ち単語切り出し位
置を求める単語認識部と上記単語認識部の結果をもと
に、単語間で判定を行ない、対応する結果の単語切り出
し位置をもとに、次に読まれるべき入力パタン及び方向
画像の部分画像を作成し、次に読みとるべき単語を単語
間の順序系列に従い単語認識部に与えることにより、単
語認識と単語画像の切り出しを交互に行ないながら単語
単位で識別判定を行なう判定部を有する文字列認識装
置。