JPS60217480A

JPS60217480A - 文字認識装置

Info

Publication number: JPS60217480A
Application number: JP59074753A
Authority: JP
Inventors: Minoru Nagao; 永尾　実
Original assignee: Tateisi Electronics Co; Omron Tateisi Electronics Co
Current assignee: Omron Corp
Priority date: 1984-04-12
Filing date: 1984-04-12
Publication date: 1985-10-31
Anticipated expiration: 2009-01-26
Also published as: JPH067392B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〈発明の技術分野〉本発明は、未知のカナ、英字、数字等の文字を自動的に
読取って認識する文字認識装置に関する。

〈発明の背景〉従来この種の文字認識装置では、第１図に示す如く、用
紙Ｐ上の文字を１文字毎に光電変換し、これをさらに”
１”、”Ｏ”の２値パターンに変換した後、この２値パ
ターンにつきノイズ除去や文字図形境界面の平滑化なと
の前処理か実施される。次に文字認識を行なうのに必要
ないくつかの特徴（交点、分岐点、ループ数、ストロー
クの長さ清報なと）をＱ）行なわれ、この抽出結果に応
じて多数の文字より特徴が共通する文字のいくつがか候
補文字として絞り込まれる。この絞り込みにより第１段
階の認識が終了するが、候補文字が複数ある場合にはさ
らにその中から唯一の文字の選択を行なうための詳細な
識別処理がなされる。この詳細な識別処理は一般には辞
書照合処理といわれる。ここで辞書とは各文字の特徴を
一定の系列で格納したもので通常ＲＯＭで構成されてい
る。それゆえ上述した候補文字の絞り込みは、特徴抽出
によって得られた特徴群にもとづき、辞書の中から特定
の文字群を選定することをいい辞書誘導処理と呼ばれる
。

上述したようにこの辞書誘導処理に続いて、辞書中に予
じめ記憶される各文字の標準となる特徴系列（以下標準
パターンという）と認識対象文字の対応する特徴系列の
一致度を検出する照合処理がなされる。この照合処理結
果にもとづき読取った文字が特定されたり、あるいは認
識不能として認識結果が出力される。

次に辞書の一例について説明する。

第２図（Ａ）は、同図（Ｂ）のカナ文字「ア」の標準パ
ターンＤ１を図形化したものであり、ここに示した標準
パターンＤ１が辞書として記憶されている。すなわちこ
の辞書において文字「ア」Ｃよ・３つの端点■と、１個
の分岐点［有］と、番号値で表わされる１０個の方向成
分（ベクトル）とで構成されている。なおここに示すベ
クトル番号値は文字のストローク方向がそれぞれ第３図
に示すＯから７までの８方向のいずれの方向であるかを
区別するためのものである。従って上記標準パターンＤ
Ｉは文字「ア」が端点■から始まって２・１・３・４・
５というベクトルをこの順番で有した後分岐点■て終了
する要素と、端点■から始まりベクトル２・３・４・５
および端点■をこの順番で有する要素とを含むことを示
している。これらの各要素を図示したものが第２図（Ｂ
）の下段に示すものである。

ここで、第１図のフローチャートで説明した文字認識装
置のより具体的な処理手順を上記した第２図および第４
図ないし第８図を用いて説明する。

用紙Ｐから読取られた文字は２値化処理、前処理されて
、システムの記憶エリアに記憶される。ここで記憶され
る文字パターンは第４図に示すように筆跡そのままの太
目のものである。

しかしこの太目の文字パターンはいわゆる細め等の処理
か施され、第５図に示すように文字の骨格を示す情報に
変換される。この変換にあたって前記骨格は第７図に示
すＡ（左右）、Ｂ（上下）、Ｃ（斜右上り）、Ｄ（斜右
下り）の４方向に正規化される。ここで行なう正規化は
第３図に示した８方向成分への区別を容易にするための
もので、この変換処理に続いて読取った文字の特徴系列
を得る処理がなされる。この特徴系列の表現は辞書すな
わち第２図（Ｂ）の標準パターンＤ１と同様に行なわれ
、その結果、第６図に示すような■１３４■■３４■と
いう特徴系列が得られる。この特徴系列は読取対象文字
すなわち未知の文字のパターンを示すものであるから以
下未知パターンと呼ぶ。

以上のようにして得られた未知パターンは辞書誘導処理
の結果得られた候補文字の標準パターンとその一致度が
照合される。令弟６図に示す未知パターンと、第２図（
Ｂ）に示す「ア」の。

標準パターンとが照合されたとすると、この照合処理は
第８図に示すように、標準パターン中の方向成分の順番
と未知パターンの方向成分の１１＠番とが一致している
か否か等、一定の規則にしたがって行なわれる。この例
の場合、未知パターンの方向成分は標準パターンが持つ
方向成分にすへて含まれ、かつ順番も一致しているので
、未知パターンはカナ文字「ア」として認識され出力さ
れる。

一般的な文字認識装置においては、以上のようにして文
字認識がなされるが、上記説明で理解できるように、文
字認識における照合処理においては文字を構成している
方向成分の順番か重要であり、またこの方向成分の順番
はいずれの点を方向成分検索の起点とするかにより変化
するものであることがわかる。

ところで従来の文字認識装置は、文字端点に限って前記
方向成分の探索起点とする探索方式を採用している。こ
の方式で文字「ス」「マ」を第９図に示す如く、文字の
上側より走査した場合、第１０図および第１１図に示す
特徴系列のパターンが得られ、従ってこの両文字は第２
番目の要素の差異に基つき確実に区別して認識できる。

ところが文字「ユ」「ヲ」を同様の方法で探索した場合
、第１２図および第１３図に示す如く夫々パターンの特
徴系列は全く同一となり、従って両文字を区別して識別
することが困難である。この問題に対応するため、従来
の文字認識装置は、他の観点からの文字特徴を抽出した
後、別の識別処理をさらに追加しており、これがため従
来の文字認識装置では、別に追加した識別処理のための
処理時間がかかり、その分、処理の高速化が阻害されて
いた。

さらに、例えば第１４図（１）に示す文字「二」を上側
より探索すると、文字図形の変形によって、同図（２］
　＋３＋に示す如く、ベクトル番号か相違する場合が生
じる。これがためかかる２種類のパターンを辞書に記憶
させる必要があり、辞書照合の処理時間が増し、また辞
書の容量増大を招き、その結果、処理の高速化および共
通の低価格化を阻害している。

〈発明の目的〉本発明は、前記した従来の文字認識装置の欠点を解消し
、辞書照合の処理時間を短縮し、高速且つ高精度の文字
認識装置を提供することを目的とする。

〈発明の構成および効果〉上記目的を達成するため、本発明では標準パターンを格
納する辞書記憶手段４こ、各文字毎に探索起点の特徴点
種別を示す特徴点清報およびストロークの端点位置情報
を予め規定して記憶させておき、照合処理時に、特徴点
情報およびストロークの端点位置情報に基づき未知パタ
ーンのストロークを追跡するようにした。不発明によれ
は、例えは文字「ユ」「チ」を文字の上側より探索した
場合、第１回目の探索起点を文字分岐点とし、第２回目
の探索起点を文字端点とすると、文字「ユ」では第１５
図に示す如り、−■０５■■１■という特徴系列のパタ
ーンが得られ、一方文字「ヲｊでは第１６図に示す如く
、■５■■１４のという特徴系列のパターンか得られる
。従って両文字は確実に区別して認識し得、文字端点を
常に探索起点とする従来例に比較して、照合処理時間を
短縮でき、辞書容量を節減する等、発明目的を達成した
顕著な効果を奏する。

〈実施例の説明〉第１７図は本発明にかかる文字認識装置を示し、用紙Ｐ
上の文字はＡ　／　Ｄ変換回路１て光学的に読取られデ
ジタルデータに変換されて画像メモリ２に記憶される。

Ａ　／　Ｄ変換回路１にはｃｐｕ３およびストローク検
出回路４が結合なされており、ＣＰＵ３は照合処理を含
む文字認識処理をプログラムにしたがい実行し、またス
トローク検出回路４は読取られた文字をたとえば第１８
図に示すように４方向ストロークに変換する。また図中
、ＲＯＭ５は認識対象文字の標準パターンを記憶する辞
書およびプログラム用のメモリであり、ＲＡＭ５は入力
文字の４方向ストロークや８方向変換データＱ記憶用お
よびプログラム実行時のワークエリア用のメモリである
。ＲＡＭ５の記憶内容は第１８図に示すストローク抽出
後のイメージに対応して・格納されており、その具体的
な内容は第１９図に示しである。

第１９図中、ＴＥＲＭは文字図形の端点情報の格納領域
であり、Ｔ１は１つの端点、ＳＡは入方向のストローク
を、ＳｌはそのＡ方向の追番を夫々示す。同様にＴ２〜
Ｔ３は他の端点を示しており、ＳＣはＣ方向のストロー
クであることを示す。またり、Ｒは文字端点のストロー
クに対する位置を示しており、Ｌは端点位置かストロー
クの左側であることを、またＩ（は同様に右側であるこ
とを夫々示す。ＣＨＫ　Ｎはストローク間の接続情報（
屈折点）か格納される領域であり、図示例では追番Ｓ１
のＡ方向ストロークのＲ（右側）と追番Ｓ２のＣ方向ス
トロークのＲ（右側）とが屈折点として接続されている
ことを意味している。ＣＨＢ　Ｋ　は文字図形の分岐点
情報が格納される領域であり、図示例では追番Ｓ１のＣ
方向ストロークのしく左側）か文字分岐点であることる
意味している。ＡＳＴＭはＡストロークの端点の２次元
座標アドレス情報が格納される領域であり、Ｃ３ＴＭ　
はＣストロークの端点の２次元座標アドレス情報が格納
される領域である。なおストロークの端点の２次元座標
アドレス情報を格納する領域としては、Ｂストロークお
よびＤストロークの端点アドレス情報を格納する領域Ｂ
ＳＴＭ　、ＤＳＴＭも設けられるがここでは第１８図の
文字例にＢストローク、Ｄストロークを含んでいないの
で図示されていない。またＰＯＮＴ　は未知パターンの
ストローク追跡過程におけるストローク情報を格納する
領域、ＳＣＭは認識対象文字すなわち未知文字のストロ
ークの８方向に変換されたテークを格納する領域である
。

第２０図はＰＯＭ５の記憶内容のうち、辞書部分を例示
したものであり、図示例は第２１図の文字「ユ」の辞書
を示している。この辞書には各文字格納領域毎に先ず文
字の方向成分探索の起点を示す特徴点情報が格納しであ
る。この特徴点情報は、探索の起点となる特徴点（文字
端点、分岐点等の文字の特徴をなす点を総称する）の種
別を示すものであり、図中■は探索起点が分岐点である
ことを示し、■は探索起点か文字端点であることを示す
。従って第２０図に示す例では、第１回目は文字分岐点
を、第２回目は文字端点を、夫々起点として文字の方向
成分を探索することになる。

この特徴点情報のつきには、ストローク端点の位置情報
が格納しである。図中、ＡＬはストロークＡの左側端点
より追跡することを示し、同様にストロークＡの右側端
点てはＡＲ、ストロークＢの上側および下側端点ではＢ
Ｕ、ＢＤ、ストロークＣの左側および右側端点てはＣＬ
。

ＣＲ、ストロークＤの左側および右側端点てはＤＬ、Ｄ
Ｒをもって示すことになる。第２０図の例では第１回目
の走査においては、ストロークＣの左側の点より、また
第２回目の走査においてはストロークＡの左側の点より
追跡することになっている。従って、第１回目の走査に
おいては、未知文字を上側から走査し１こ際、最初に出
会った文字分岐点がストロークＣの左側であれば、その
文字分岐点より未知パターンのストローク追跡を実施す
ることになる。

第２２図は、上記実施例にかかる装置の照合処理動作を
示し、以下、辞書誘導処理により、候補文字が「ユ」に
絞られた場合の照合処理について説明する。

先ずステップ１１（以下、ｒ　５ＴＩＩＪの如く示す）
において、絞られた候補文字「ユ」からＲＯＭ　５の「
ユ」の辞書（第２０図）を参照し、第１回目走査におけ
る特徴点情報■をロードする。つぎにＳＴｌ　２で同様
にＲＯＭ５の辞書を参照し、第１回目走査のストローク
端点位置情報ＣＬをロードした後、走査モードを上側辺
に設定して、上側辺の左端に相当するアドレスを走査カ
ウンタに格納して初期化する（　Ｓ　”Ｉ”　１３　。

１４）。次に走査モードにしたがって第１８図に示した
イメージをＲＡＭ５上で走査する。図示例では、第９図
に示す如く、上辺左側から右端に走査してゆくことにな
る。この時各走査点毎にＲＡＭ５のＡＳＴＭ領域、Ｃ５
ＴＭ領域のストローク端点の２次元アドレスと走査カウ
ンタの座標か一致するか比較される（　５Ｔ１５）。

比較の結果両座標が一致しない限り走査カウンタが更新
されこの座標アドレス比較が繰り返される（ＳＴ１５．
２７．２８）。そして走査カウンタの内容とＲＡＭ　６
　の端点２次元アドレスが例えば座標（１６，２５）に
て一致すると、このストローク端点を仮の起点とし、次
にこのストローク端点か文字端点であるか否かを判定す
る（ＳＴ１６）。この座標（１６，２５）はＣ５ＴＭ領
域に格納されており、Ｃ方向ストロークのストローク番
号１の左側端点に該当する。つきに、この端点の情報か
ＴＥＲＭ　領域において、文字端点として格納されてい
るか否かがチェックされる。図示例の場合、ＴＥｋＭ　
領域にはＣ方向ストロークのストローク番号１の左側端
点か存在しておらず、従って５Ｔ１６　の判定はＮＯ″
となり、つきの５Ｔ１７　へ移行する。５−Ｔ１７では
、前記ストローク端点が文字分岐点であるか否かをチェ
ックする。図示例の場合、ＣＨＢ　Ｋ領域内に前記スト
ローク端点の情報（ＳＣ’、５１゜Ｌ）が存在しており
、従ってｓ　−ｒ　１７　の判定は“ＹＥＳ″　となる
。っぎの５Ｔ１８　は、５Ｔ１５．１７の判定結果と前
記５Ｔ１１でロードされた特徴点情報の内容を比較して
おり、この場合、両者は文字分岐点である点て共通する
がら、５Ｔ１８の判定は”ＹＥＳ”　となり、っきの５
Ｔ１９へ移行する。この５Ｔ１９　は前記ストローク端
点情報（ＳＣ、Ｓ　ｌ　、　Ｌ）　ト１Ｊｉｃｊ　５Ｔ
１２　テロードされたストローク端点位置情報ＣＬとを
比較するもので、この場合、両者はＣ方向ストロークの
左端端点を意味する内容で一致しており、５Ｔ１９　の
判定は”　ＹＥＳ　”となる。そこでこの文字分岐点を
ストローク追跡時の起点として、ＲＡＭ５　のＳＣＭ　
領域に文字分岐点マーク■を格納し、また上記ストロー
ク端点情報（ＳＣ。

Ｓｌ、Ｌ）をＰＯＮＴ　領域に格納する。

尚第２３図に示す如く、２個の分岐点Ｂ、、Ｂ２を有す
るパターンにおいて、最初に到達した分岐点（例えばＢ
＋）についての５Ｔ１９の判定が”ＮＯ”　の場合、つ
きにＳ’Ｔ２０で、その分岐点Ｂ１のストロークが前記
５Ｔ１２でロードされたストローク端点位置情報に含ま
れるストローク清報と同種であるか否かがチェックされ
る。

そして５Ｔ２０　で同種のストロークである判定された
とき、更に走査を進めるへ（５Ｔ２７　へ移行し、この
場合他の分岐点Ｂ２についても５Ｔ１９で同様のチェッ
クが行なわれることになる。

また前記５Ｔ１６，１７において文字端点や文字分岐が
抽出されない時、さらに走査を進めるべ（５Ｔ２７　に
移行し、走査カウンタを更新するものである。

か（て前記文字分岐点が抽出された場合において、つき
にＦＯＮＴ　領域のストローク端点情報（ＳＣ，Ｓｌ、
Ｌ）を用いて、第３図に示す８ご♀Ｌ方向（Ｃ方向ストロークで左から右へのストロークは方
向０）に変換し、この方向データ“０″をＲＡＭ６　の
８方向変換テータ格納領域ＳＣへ■に格納する（ＳＴ２
１）。続いてＦＯＮＴ領域に格納したストロークから、
さらに接続情報を探すために、このストロークのもう一
方のストローク端点情報（ＳＣ，Ｓｌ　、Ｒ）にＰＯＮ
Ｔ　＠域を変更する。そして変更されたＣ方向ストロー
クのストローク番号１の右側端（Ｒ）が文字端点である
か、接続点（屈折点）であるか、あるいは文字分岐点で
あるかをＰＯＮＴ領域のデータを参照して、文字端点格
納領域ＴＥＲＭ、屈折点格納領域ＣＨＫＮ　および、分
岐点格納領域ＣＨＢＫ内の登録内容を調べてチェックす
る。図示例ではＣＨＫＮ　領域より（ＳＣ，５１，Ｉｔ
）を見出すことができ、変更後のストローク端点は文字
接続点（Ｋ１）であることがわかる。それゆえ、５Ｔ２
２　の接続情報チェックの判定は「有」と判断される。

これに伴いＦＯＮＴ　領域のストローク情報をこの（Ｓ
Ａ、Ｓｌ、Ｒ）に変更した後、制御は５Ｔ２１　に移さ
れる。

以後文字の端点が検出されるまでＳｌ２１　および５Ｔ
２２　が繰返し実行される。その結果この図示例では■
０５のがＲＡＭ６　のストロークの８方向変換デ一タ格
納領域ＳＣＭに格納される。

次に５Ｔ２３　において、っきの起点清報が存在するか
否かかチェックされる。第１７図に示す例では、第２回
目の起点情報が存在しており。

従ってＳＴ２３　の判定がＹＥＳ”となり、５１２５て
っぎの起点情報■を、ｓ　ｒ　２６て第２回目のストロ
ーク端点位置情報ＡＬを夫々ロートした後、上記と同様
の走査を行なうべく５−ｒｌａに移行する。

なお、上記の動作において、８方向変換の終了したスト
ロークは変換後適時抹ｆｆ１４　（ＲＡＭ　５上１７）
　ＡＳＴＭ　、　Ｃ５−１’Ｍ領域のストローク番号ラ
スペースコートに変換）する。これによって、一度検出
されたストロークが重複検出されルコとはなくなる。

第２回目の探索も第１回目の場合と同様に走査モードが
決定され（ＳＴ１３）、走査カウンタを初期化する（Ｓ
Ｔ１４）。そして上記した第１回目の場合と同様に走査
カウンタを更新しながら走査を行ナイ、ＲＡＭ６　（７
）ＡＳＴＭ、ＣＳ　’Ｉ−Ｍ領域に格納されるストロー
クの２次元アドレスデータと走査カウンタとを比較する
（ＳＴ１５．２７．２８）。第１８図に示した例ではア
ドレス（２、２８）　チ一致カ成立する。このアドレス
（２，２８）はＡｓＴＭ　領域に格納されている。

それゆえこの端点はＡ方向ストローク（ＳＡ）のストロ
ーク番号２　（Ｓ２）の左側（Ｌ）であることがわかる
。次に、このストローク端点が文字端点であるかを判定
し、文字端点である時、その情報をＲＡＭ５のＦＯＮＴ
領域に走査時の仮のの起点として格納する（ＳＴ１６）
。つきに前記抽出された文字端点が５Ｔ２５でロードし
た起点情報の内容と一致するか否かを判定する。（ＳＴ
１８）。この場合第２回目の起点情報は■、すなわち文
字端点であるから、その判定は“ＹＥＳ”となりＳＴ１
　ｇ　へ移行する。ｓ−ｒｌｇ　ではこの文字端点と前
記Ｓ　Ｔ　２６　でロードしたストローク端点清報とを
比較し、一致した時に、この文字端点を走査時の起点と
し、さらに文字端点マーク■をＲＡＭ６のＳＣＭ　領域
に格納する。次に、第１回目と同様にＦＯＮＴ領域のス
トローク情報を用いて８方向データ方向１に変換し、こ
の方向テーク“１”　を８方向変換デ゛−夕格納領域Ｓ
ＣＭに”１”を格納する（Ｓ’ｌ”２１）。続いて、Ｆ
　ＯＮＴ　領域ζこ格納したストロークからさらに接続
情報を探すためにこのストロークのもう一方のストロー
ク端点情報にＰＯＮＴ領域を右側の端点を示す（ＳＡ、
Ｓ２．Ｒ）に変更する。

接続有無の確認は、このＦＯＮＴ領域のテークを参照し
てＴＥ＋ＲＭ領域、ＣＨＫＮ領域を調べることにより行
なうが、図示例では変更後のストローク端点（ＳＡ、Ｓ
２　、Ｒ）　がＴＥＲＮ領域中に存在するので文字端点
であると判定され、８方同変換データ格納領域ＳＣ￥に
■を格納する（Ｓ−１−２１）。−そして５Ｔ２３で再
ひ次の起点指定が？判定されるが図示例では第２回目ま
での起点辺がＲＯＭ５に格納されているのみなので、こ
こでは判定が“ＮＯ”　となり、続いてＲＡＭ６の８方
向変換デ一タ格納領域ＳＣＭの内容とＲ，ＯＭ　５の辞
書の文字「ユ」の標準パターンが比較される（ＳＴ２４
）。比較の結果、ある一定率以上の一致が得られれば入
力文字を１−ユ」と認識する。

【図面の簡単な説明】

第１図は一般的な文字認識装置の概略を説明するための
フローチャート、！　２　図（Ａ）　、　（Ｂ）ハ文字
例「ア」を方向成分に変換した標べ（パターン例を説明
するための図、第３図は文字のストロークの方向成分を
８方向に正規化する場合の方向番号を示す図、第４図は
文字例「ア」の光学的に読取った状態でのパターンを示
す図、第５図は第４図の文字「ア」を細めてストローク
の骨格のみを示した図、第６図は第５図に示す文字「ア
Ｊを端点、方向成分、屈折点で表わす場合を説明するた
めの図、第７図は４方向酸分を説明するための図、第８
図は第２図に示す文字「ア」の標準パターンと第５図、
第６図に示す文字「ア」の照合による認識動作を説明す
るための図、第９図は走査が開始される辺を説明するた
めの図、第１０図乃至第１３図は文字「ヌ」「マ」「ユ
」「ヲ」を方向成分に変換したパターン例を説明するた
めの図、第１４図は文字「二」のパターン例の違いを説
明するための図、第１５図および第１６図は本発明を実
施して文字「ユ」「ヲ」を方向成分に変換した場合のパ
ターン例を示す図、第１７図は本発明か実施される文字
認識装置の回路ブロック図、第１８図は第１７図に示す
文字認識装置に入力される文字例を示す図、第１９図は
第１７図に示す文字認識装置のＲＡ　Ｍの格納領域配置
例を示す図、第２０図は同ＲＯＭの辞書格納領域の一文
字分のデータ配置例を示す図、第２１図は文字「ユ」の
標準パターンを示す図、第２２図は、第１７図に示す文
字認識装置の動作を説明するためのフローチャート、第
２３図は２個の分岐点を有するパターン例を示す図であ
る。竹／　図分　２　図枡　３　図牙４　図り分７０図分／ｌ　図シ１−／２　グうヤノ３　図分７５　図例７６図うヤ　７７　図７１メ７９　図丁ｌＳＡ　妊／Ｉ　フｔ２ＳＡ　θ　−ｍ−＋χ Ｍ　５２Ｔ：３７ｉ　（μ−−ユーーーー −４ＳＡ２に／ＳＡｔ ’Ｔ、（２，２５ＪＳＡ、５２ｒＡＬＪ０．２１１Ｃ１ＩＣ５／５／＜３．ｃ＞　Ｌ（２ｔ　７ン　Ｒ２（２，２１１）Ｌ（３０，２８）Ｒ分２θ　図分２７　図

Claims

【特許請求の範囲】

未知文字を光学的に読み取って文字パターンをめる手段
と、文字パターンの特徴を抽出する手段と、抽出された
特徴を記憶する手段と、抽出−された特徴を共通にする
文字グループを候補文字として誘導する手段と、各文字
毎をこ固有の標準パ、ターンを記憶すると共に各文字毎
に探索起点の特徴点種別を示す特徴点情報およびストロ
ークの端点位置情報を予め規定して記憶する辞書記憶手
段と、前記誘導された文字グループの各文字について、
前記特徴点情報およびストロークの端点位置情報に基づ
き、未知パターンのストロークを追跡しつつ標準パター
ンと比較する照合手段とを具備して成る文字認識装置。