JPH067392B2

JPH067392B2 - 文字認識装置

Info

Publication number: JPH067392B2
Application number: JP59074753A
Authority: JP
Inventors: 実永尾
Original assignee: Omron Tateisi Electronics Co
Current assignee: Omron Corp
Priority date: 1984-04-12
Filing date: 1984-04-12
Publication date: 1994-01-26
Anticipated expiration: 2009-01-26
Also published as: JPS60217480A

Description

【発明の詳細な説明】＜発明の技術分野＞本発明は、未知のカナ，英字，数字等の文字を自動的に
読み取って認識する文字認識装置に関する。

＜発明の背景＞従来この種の文字認識装置では、第１図に示す如く、用
紙Ｐ上の文字を１文字毎に光電交換し、これをさらに
“１”，“０”の２値パターンに変換した後、この２値
パターンにつきノイズ除去や文字図形境界面の平滑化な
どの前処理が実施される。次に文字認識を行なうのに必
要ないくつかの特徴（交点、分岐点、ループ数、ストロ
ークの長さ情報など）を抽出する特徴抽出処理が行なわ
れ、この抽出結果に応じて多数の文字より特徴が共通す
る文字のいくつかが候補文字として絞り込まれる。この
絞り込みにより第１段階の認識が終了するが、候補文字
が複数ある場合にはさらにその中から唯一の文字の選択
を行なうための詳細な識別処理がなされる。この詳細な
識別処理は一般には辞書照合処理といわれる。ここで辞
書とは各文字の特徴を一定の系列で格納したもので通常
ＲＯＭで構成されている。それゆえ上述して候補文字の
絞り込みは、特徴抽出によって得られた特徴群にもとづ
き、辞書の中から特定の文字群を選定することをいい、
辞書誘導処理と呼ばれる。

上述したようにこの辞書誘導処理に続いて、辞書中に予
め記憶される各文字の標準となる特徴系列（以下標準パ
タ−ンという）と認識対象文字の対応する特徴系列の一
致度を検出する照合処理がなされる。この照合処理結果
にもとづき読取った文字が特定されたり、あるいは認識
不能として認識結果が出力される。

次に辞書の一例について説明する。

第２図(A)は、同図(B)のカナ文字「ア」の標準パタ−ン
Ｄ１を図形化したものであり、ここに示した標準パタ−
ンＤ１が辞書として記憶されている。すなわちこの辞書
において文字「ア」は、３つの端点と、１個の分岐点
と、番号値で表わされる１０個の方向成分（ベクト
ル）とで構成されている。なおここに示すベクトル番号
値は文字のストローク方向がそれぞれ第３図に示す０か
ら７までの８方向のいずれの方向であるかを区別するた
めのものである。従って上記標準パタ−ンＤ１は文字
「ア」が端点から始まって２・１・２・３・４・５と
いうベクトルをこの順番で有した後、分岐点で終了す
る要素と、端点から始まりベクトル２・３・４・５お
よび端点をこの順番で有する要素とを含むことを示し
ている。これらの各要素を図示したものが第２図(B)の
下段に示すものである。

ここで、第１図のフローチャートで説明した文字認識装
置のより具体的な処理手順を上記した第２図および第４
図ないし第８図を用いて説明する。

用紙Ｐから読取られた文字は２値化処理後、前処理され
て、システムの記憶エリアに記憶される。ここで記憶さ
れる文字パターンは第４図に示すように筆跡そのままの
太目のものである。しかしこの太目の文字パターンはい
わゆる細め等の処理が施され、第５図に示すように文字
の骨格を示す情報に変換される。この変換にあたって前
記骨格は第７図に示すＡ（左右）、Ｂ（上下）、Ｃ（斜
右上り）、Ｄ（斜右下り）の４方向に正規化される。こ
こで行なう正規化は第３図に示した８方向成分への区別
を容易にするためのもので、この変換処理に続いて読取
った文字の特徴系列を得る処理がなされる。この特徴系
列の表現は辞書すなわち第２図(B)の標準パタ−ンＤ１
と同様に行なわれ、その結果、第６図に示すような１
３４３４という特徴系列が得られる。この特徴系
列は読取対象文字すなわち未知の文字のパターンを示す
ものであるから以下未知パターンと呼ぶ。

以上のようにして得られた未知パターンは辞書誘導処理
の結果得られた候補文字の標準パタ−ンとその一致度が
照合される。今第６図に示す未知パターンと、第２図
(B)に示す「ア」の標準パタ−ンとが照合されたとする
と、この照合処理は第８図に示すように、標準パタ−ン
中の方向成分の順番と未知パターンの方向成分の順番と
が一致しているか否か等、一定の規則にしたがって行な
われる。この例の場合、未知パターンの方向成分は標準
パタ−ンが持つ方向成分にすべて含まれ、かつ順番も一
致しているので、未知パターンはカナ文字「ア」として
認識され出力される。

一般的な文字認識装置においては、以上のようにして文
字認識がなされるが、上記説明で理解できるように、文
字認識における照合処理においては文字を構成している
方向成分の順番が重要であり、またこの方向成分の順番
はいずれの点を方向成分操索の起点とするかにより変化
するものであることがわかる。

ところで従来の文字認識装置は、文字端点に限って前記
方向成分の探索起点とする探索方式を採用し、照合処理
においてはその検索起点からの方向成分の順番により照
合をおこなっている。この方式で文字「ス」「マ」を第
９図に示す如く、文字の上側より走査した場合、第１０
図および第１１図に示す特徴系列のパターンが得られ、
従ってこの両文字は第２番目の方向成分の要素（第１０
図の“６”と第１１図の“２”）の差異に基づき確実に
区別して認識できる。ところが文字「ユ」「ヲ」を同様
の方法で探索した場合、第１２図および第１３図に示す
如く夫々パターンの特徴系列の方向成分の順番（第１２
図の“１４，１”と第１３図の“１４，１”は全く同一
となり、従って両文字を区別して識別することが困難で
ある。この問題に対応するため、従来の文字認識装置
は、他の観点からの文字特徴を抽出した後、別の識別処
理をさらに追加しており、これがため従来の文字認識装
置では、別に追加した識別処理のための処理時間がかか
り、その分、処理の高速化が阻害されていた。

さらに、例えば第１４図(1)に示す文字「ニ」を上側よ
り探索すると、文字図形の変形によって、同図(2)(3)に
示す如く、ベクトル番号が相違する場合が生じる。これ
がためかかる２種類のパターンを辞書に記憶させる必要
があり、辞書照合の処理時間が増し、また辞書の容量増
大を招き、その結果、処理の高速化および共通の低価格
化を阻害している。

＜発明の目的＞本発明は、前記した従来の文字認識装置の欠点を解消
し、辞書照合の処理時間を短縮し、高速且つ高精度の文
字認識装置を提供することを目的とする。

＜発明の構成および効果＞上記目的を達成するため、本発明では標準パターンを格
納する辞書記憶手段に、各文字毎に探索起点の特徴点種
別を示す特徴点情報および前記探索起点がどの方向のス
トロークのどちら側の端点であるかということを示すス
トロークの端点位置情報を予め規定して記憶させてお
き、照合処理時に、特徴点情報およびストロークの端点
位置情報に基づき未知パターンのストロークを追跡する
ようにした。本発明によれば、第１回目の探索起点を文
字分岐点とし、第２回目の探索起点を文字端点とするこ
とにより文字認識を行う。これにより、確実な文字認識
が可能となり、文字端点を常に探索起点とする従来例に
比較して、照合処理時間を短縮でき、辞書容量を節減す
る等、発明目的を達成した顕著な効果を奏する。

＜実施例の説明＞第１７図は本発明にかかる文字認識装置を示し、用紙Ｐ
上の文字はＡ／Ｄ変換回路１で光学的に読取られデジタ
ルデータに変換されて画像メモリ２に記憶される。Ａ／
Ｄ変換回路１にはＣＰＵ３およびストローク検出回路４
が接続されており、ＣＰＵ３は照合処理を含む文字認識
装置をプログラムにしたがい実行し、またストローク検
出回路４は読取られた文字をたとえば第１８図に示すよ
うに４方向ストローク（第７図参照）に変換する。また
図中、ＲＯＭ５は認識対象文字の標準パタ−ンを記憶す
る辞書およびプログラム用のメモリであり、ＲＡＭ６は
入力文字の４方向ストロークや８方向変換データの記憶
用およびプログラム実行時のワークエリア用のメモリで
ある。ＲＡＭ６の記憶内容は第１８図に示すストローク
抽出後のイメージに対応して格納されており、その具体
的な内容は第１９図に示してある。

第１９図中、ＴＥＲＭは文字図形の端点情報の格納領域
であり、Ｔ１は１つの端点、ＳＡはＡ方向のストローク
を、Ｓ１はそのＡ方向の追番を夫々示す。同様にＴ２〜
Ｔ３は他の端点を示しており、ＳＣはＣ方向のストロー
クであることを示す。またＬ，Ｒは文字端点のストロー
クに対する位置を示しており、Ｌは端点位置がストロー
クの左側であることを、またＲは同様に右側であること
を夫々示す。ＣＨＫＮはストローク間の接続情報（屈折
点）が格納される領域であり、図示例では追番Ｓ１のＡ
方向ストロークのＲ（右側）と追番Ｓ１のＣ方向ストロ
ークのＲ（右側）とが屈折点Ｋ１として接続されている
ことを意味している。ＣＨＢＫは文字図形の分岐点情報
が格納される領域であり、図示例では追番Ｓ１のＣ方向
ストロークのＬ（左側）が文字分岐点Ｂ１であることを
意味している。ＡＲＴＭはＡストロークの端点の２次元
座標アドレス情報が格納される領域であり、ＣＳＴＭは
Ｃストロークの端点の２次元座標アドレス情報が格納さ
れる領域である。なおストロークの端点の２次元座標ア
ドレス情報を格納する領域としては、Ｂストロークおよ
びＤストロークの端点アドレス情報を格納する領域ＢＳ
ＴＭ，ＤＳＴＭも設けられるがここでは第１８図の文字
例にＢストローク、Ｄストロークを含んでいないので図
示されていない。またＰＯＮＴは未知パターンのストロ
ーク追跡過程におけるストローク情報を格納する領域、
ＳＣＭは認識対象文字すなわち未知文字のストロークの
８方向に変換されたデータを格納する領域である。

第２０図はＲＯＭ５の記憶内容のうち、辞書部分を例示
したものであり、図示例は第２１図の文字「ユ」の辞書
を示している。この辞書には各文字格納領域毎に先ず文
字の方向成分探索の起点を示す特徴点情報が格納してあ
る。この特徴点情報は、探索の起点となる特徴点（文字
端点、分岐点等の文字の特徴をなす点を総称する）の種
別を示すものであり、図中は探索起点が分岐点である
ことを示し、は探索起点が文字端点であることを示
す。従って第２０図に示す例では、第１回目は文字分岐
点を、第２回目は文字端点を、夫々起点として文字の方
向成分を探索することになる。

この特徴点情報のつぎには、ストローク端点の位置情報
が格納してある。図中、ＡＬはストロークＡの左側端点
より追跡することを示し、同様にストロークＡの右側端
点ではＡＲ、ストロークＢの上側および下側端点ではＢ
Ｕ，ＢＤ、ストロークＣの左側および右側端点ではＣ
Ｌ，ＣＲ、ストロークＤの左側および右側端点ではＤ
Ｌ，ＤＲをもって示すことになる。第２０図の例では第
１回目の走査においては、ストロークＣの左側の点よ
り、また第２回目の走査においてはストロークＡの左側
の点より追跡することになっている。従って、第１回目
の走査においては、未知文字を上側から走査した際、最
初に出会った文字分岐点がストロークＣの左側であれ
ば、その文字分岐点より未知パターンのストローク追跡
を実施することになる。

第２２図は、上記実施例にかかる装置の照合処理動作を
示し、以下、辞書誘導処理により、候補文字が「ユ」に
絞られた場合の照合処理について説明する。文字「ユ」
では第１５図に示すように、０５１という特徴
系列のパターンが得られる。また、文字「ヲ」では第１
６図に示すように、５１４という特徴系列のパ
ターンが得られる。次に、詳細説明を行う。

先ずステップ１１（以下「ＳＴ１１」の如く示す）にお
いて、絞られた候補文字「ユ」からＲＯＭ５の「ユ」の
辞書（第２０図）を参照し、第１回目走査における特徴
点情報をロードする。つぎにＳＴ１２で同様にＲＯＭ
５の辞書を参照し、第１回目走査のストローク端点位置
情報ＣＬをロードした後、走査モードを上側辺に設定し
て、上側辺の左端に相当するアドレスを走査カウンタに
格納して初期化する（ＳＴ１３，１４）。次に走査モー
ドにしたがって第１８図に示したイメージをＲＡＭ６上
で走査する。図示例では、第９図に示す如く、上辺左側
から右端に走査してゆくことになる。この時各走査点毎
にＲＡＭ６のＡＳＴＭ領域、ＣＳＴＭ領域のストローク
端点の２次元アドレスと走査カウンタの座標が一致する
か比較される（ＳＴ１５）。比較の結果両座標が一致し
ない限り走査カウンタが更新されこの座標アドレス比較
が繰り返される（ＳＴ１５、２７、２８）。そして走査
カウンタの内容とＲＡＭ６の端点２次元アドレスが例え
ば座標（１６，２５）にて一致すると、このストローク
端点を仮の起点とし、次にこのストローク端点が文字端
点であるか否かを判定する（ＳＴ１６）。この座標（１
６，２５）はＣＳＴＭ領域に格納されており、Ｃ方向ス
トロークのストローク番号１の左側端点に該当する。つ
ぎに、この端点の情報がＴＥＲＭ領域において、文字端
点として格納されているか否かがチェックされる。図示
例の場合、ＴＥＲＭ領域にはＣ方向のストロークのスト
ローク番号１の左側端点が存在しておらず、従ってＳＴ
１６の判定は“ＮＯ”となり、つぎのＳＴ１７へ移行す
る。ＳＴ１７では、前記ストローク端点が文字分岐点で
あるか否かをチェックする。図示例の場合、ＣＨＢＫ領
域内に前記ストローク端点の情報（ＳＣ，Ｓ１，Ｌ）が
存在しており、従ってＳＴ１７の判定は“ＹＥＳ”とな
る。次のＳＴ１８は、ＳＴ１６、１７の判定結果と前記
ＳＴ１１でロードされた特徴点情報の内容を比較してお
り、この場合、両者は文字分岐点である点で共通するか
ら、ＳＴ１８の判定は“ＹＥＳ”となり、つぎのＳＴ１
９へ移行する。このＳＴ１９は前記ストローク端点位置
情報（ＳＣ，Ｓ１，Ｌ）と前記ＳＴ１２でロードされた
ストローク端点位置情報ＣＬとを比較するもので、この
場合、両者はＣ方向ストロークの左端端点を意味する内
容で一致しており、ＳＴ１９の判定は“ＹＥＳ”とな
る。そこでこの文字分岐点をストローク追跡時の起点と
して、ＲＡＭ６のＳＣＭ領域に文字分岐点マークを格
納し、また上記ストローク端点位置情報（ＳＣ，Ｓ１，
Ｌ）をＰＯＮＴ領域に格納する。

尚第２３図に示す如く、２個の分岐点Ｂ₁，Ｂ₂を有する
パターンにおいて、最初に到達した分岐点（例えば
Ｂ₁）についてのＳＴ１９の判定が“ＮＯ”の場合、つ
ぎにＳＴ２０で、その分岐点Ｂ₁のストロークが前記Ｓ
Ｔ１２でロードされたストローク端点位置情報に含まれ
るストローク情報と同種であるか否かがチェックされ
る。そしてＳＴ２０で、同種のストロークであると判定
されたとき、更に走査を進めるべくＳＴ２７へ移行し、
この場合他の分岐点Ｂ₂についてもＳＴ１９で同様のチ
ェックが行なわれることになる。

また前記ＳＴ１６、１７において文字端点や文字分岐が
抽出されない時、さらに走査を進めるべくＳＴ２７に移
行し、走査カウンタを更新するものである。

かくて前記文字分岐点が抽出された場合において、つぎ
にＰＯＮＴ領域のストローク端点情報（ＳＣ，Ｓ１，
Ｌ）を用いて、第３図に示す８方向データ（Ｃ方向スト
ロークで左から右へのストロークは方向０）に変換し、
この方向データ“０”をＲＡＭ６の８方向変換データ格
納領域ＳＣＭに格納する。（ＳＴ２１）。続いてＰＯＮ
Ｔ領域に格納したストロークから、さらに接続情報を探
すために、このストロークのもう一方のストローク端点
情報（ＳＣ，Ｓ１，Ｒ）にＰＯＮＴ領域を変更する。そ
して変更されたＣ方向ストロークのストローク番号１の
右側端(R)が文字端点であるか、接続点（屈折点）であ
るか、あるいは文字分岐点であるかをＰＯＮＴ領域のデ
ータを参照して、文字端点格納領域ＴＥＲＭ、屈折点格
納領域ＣＨＫＮおよび、分岐点格納領域ＣＨＢＫ内の登
録内容を調べてチェックする。図示例ではＣＨＫＮ領域
より（ＳＣ，Ｓ１，Ｒ）を見出すことができ、変更後の
ストローク端点は文字接続点（Ｋ１）であることがわか
る。それゆえ、ＳＴ２２の接続情報チェックの判定は
「有」と判断される。これに伴いＰＯＮＴ領域のストロ
ーク情報をこの（ＳＡ，Ｓ１，Ｒ）に変更した後、制御
はＳＴ２１に移される。

以後文字の端点が検出されるまでＳＴ２１およびＳＴ２
２が繰返し実行される。その結果この図示例では０５
がＲＡＭ６のストロークの８方向変換データ格納領域
ＳＣＭに格納される。

次にＳＴ２３において、つぎの起点情報が有在するか否
かがチェックされる。第２０図に示す例では、第２回目
の起点情報が存在しており。従ってＳＴ２３の判定が
“ＹＥＳ”となり、ＳＴ２５でつぎの起点情報を、Ｓ
Ｔ２６で第２回目のストローク端点位置情報ＡＬを夫々
ロードした後、上記と同様の走査を行なうべくＳＴ１３
に移行する。

なお、上記の動作において、８方向変換の終了したスト
ロークは変換後適時抹消（ＲＡＭ６上のＡＳＴＭ，ＣＳ
ＴＭ領域のストローク番号をスペースコードに変換）す
る。これによって、一度検出されたストロークが重複検
出されることはなくなる。

第２回目の探索も第１回目の場合と同様に走査モードが
決定され（ＳＴ１３）、走査カウンタを初期化する（Ｓ
Ｔ１４）。そして上記した第１回目の場合と同様に走査
カウンタを更新しながら走査を行ない、ＲＡＭ６のＡＳ
ＴＭ、ＣＳＴＭ領域に格納されるストロークの２次元ア
ドレスデータと走査カウンタとを比較する（ＳＴ１５、
２７、２８）。第１８図に示した例ではアドレス（２，
２８）で一致が成立する。このアドレス（２，２８）は
ＡＳＴＭ領域に格納されている。それゆえこの端点はＡ
方向ストローク（ＳＡ）のストローク番号２（Ｓ２）の
左側（Ｌ）であることがわかる。次に、このストローク
端点が文字端点であるかを判定し、文字端点である時、
その情報をＲＡＭ６のＰＯＮＴ領域に走査時の仮のの起
点として格納する（ＳＴ１６）。つぎに前記抽出された
文字端点がＳＴ２５でロードした起点情報の内容と一致
するか否かを判定する。（ＳＴ１８）。この場合第２回
目の起点情報は、すなわち文字端点であるから、その
判定は“ＹＥＳ”となりＳＴ１９へ移行する。ＳＴ１９
ではこの文字端点と前記ＳＴ２６でロードしたストロー
ク端点位置情報とを比較し、一致した時に、この文字端
点を走査時の起点とし、さらに文字端点マークをＲＡ
Ｍ６のＳＣＭ領域に格納する。次に、第１回目と同様に
ＰＯＮＴ領域のストローク情報を用いて８方向データ方
向１に変換し、この方向データ“１”を８方向変換デー
タ格納領域ＳＣＭに“１”を格納する（ＳＴ２１）。続
いて、ＰＯＮＴ領域に格納したストロークからさらに接
続情報を探すためにこのストロークのもう一方のストロ
ーク端点位置情報（ＳＡ，Ｓ２，Ｒ）にＰＯＮＴ領域を
変更する。接続有無の確認は、このＰＯＮＴ領域のデー
タを参照してＴＥＲＭ領域、ＣＨＫＮ領域、ＣＨＢＫ領
域を調べることにより行なうが、図示例では変更後のス
トローク端点（ＳＡ，Ｓ２，Ｒ）がＴＥＲＮ領域中に存
在するので文字端点であると判定されＳＴ２２が"NO"と
なって、８方向変換データ格納領域ＳＣＭには文字端点
マークが格納される。そしてＳＴ２３で再び次の起点
があるか否かが判定されるが図示例では第２回目までの
起点辺がＲＯＭ５に格納されているのみなので、ここで
は判定が“ＮＯ”となり、続いてＲＡＭ６の８方向変換
データ格納領域ＳＣＭの内容とＲＯＭ５の辞書の文字
「ユ」の標準パターンが比較される（ＳＴ２４）。比較
の結果、ある一定率以上の一致が得られれば入力文字を
「ユ」と認識する。

【図面の簡単な説明】

第１図は一般的な文字認識装置の概略を説明するための
フローチャート、第２図(A)，(B)は文字例「ア」を方向
成分に変換した標準パタ−ン例を説明するための図、第
３図は文字のストロークの方向成分を８方向に正規化す
る場合の方向番号を示す図、第４図は文字例「ア」の光
学的に読取った状態でのパターンを示す図、第５図は第
４図の文字「ア」を細めてストロークの骨格のみを示し
た図、第６図は第５図に示す文字「ア」を端点、方向成
分、屈折点で表わす場合を説明するための図、第７図は
４方向成分を説明するための図、第８図は第２図に示す
文字「ア」の標準パタ−ンと第５図，第６図に示す文字
「ア」の照合による認識動作を説明するための図、第９
図は走査が開始される辺を説明するための図、第１０図
乃至第１３図は文字「ス」「マ」「ユ」「ヲ」を方向成
分に変換したパターン例を説明するための図、第１４図
は文字「ニ」のパターン例の違いを説明するための図、
第１５図および第１６図は本発明を実施して文字「ユ」
「ヲ」を方向成分に変換した場合のパターン例を示す
図、第１７図は本発明が実施される文字認識装置の回路
ブロック図、第１８図は入力された文字を４方向ストロ
ークに変換したイメージの一例を示す図、第１９図は第
１７図に示す文字認識装置のＲＡＭの格納領域配置例を
示す図、第２０図は同ＲＯＭの辞書格納領域の一文字分
のデータ配置例を示す図、第２１図は文字「ユ」の標準
パターンを示す図、第２２図は、第17図に示す文字認識
装置の動作を説明するためのフローチャート、第２３図
は２個の分岐点を有するパターン例を示す図である。

Claims

【特許請求の範囲】

【請求項１】未知文字を光学的に読み取って文字パター
ンを求める手段と、文字パターンの特徴を抽出する手段
と、抽出された特徴を記憶する手段と、抽出された特徴
を共通にする文字グループを候補文字として誘導する手
段と、各文字毎に固有の標準パターンを記憶すると共に
各文字毎に探索起点の特徴点種別を示す特徴点情報およ
び前記探索起点がどの方向のストロークのどちら側の端
点であるかということを示すストロークの端点位置情報
を予め規定して記憶する辞書記憶手段と、前記誘導され
た文字グループの各文字について、前記特徴点情報およ
びストロークの端点位置情報に基づき、未知パターンの
ストロークを追跡しつつ標準パターンと比較する照合手
段とを具備して成る文字認識装置。