JPH067392B2 - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH067392B2 JPH067392B2 JP59074753A JP7475384A JPH067392B2 JP H067392 B2 JPH067392 B2 JP H067392B2 JP 59074753 A JP59074753 A JP 59074753A JP 7475384 A JP7475384 A JP 7475384A JP H067392 B2 JPH067392 B2 JP H067392B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- stroke
- point
- end point
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 <発明の技術分野> 本発明は、未知のカナ,英字,数字等の文字を自動的に
読み取って認識する文字認識装置に関する。
読み取って認識する文字認識装置に関する。
<発明の背景> 従来この種の文字認識装置では、第1図に示す如く、用
紙P上の文字を1文字毎に光電交換し、これをさらに
“1”,“0”の2値パターンに変換した後、この2値
パターンにつきノイズ除去や文字図形境界面の平滑化な
どの前処理が実施される。次に文字認識を行なうのに必
要ないくつかの特徴(交点、分岐点、ループ数、ストロ
ークの長さ情報など)を抽出する特徴抽出処理が行なわ
れ、この抽出結果に応じて多数の文字より特徴が共通す
る文字のいくつかが候補文字として絞り込まれる。この
絞り込みにより第1段階の認識が終了するが、候補文字
が複数ある場合にはさらにその中から唯一の文字の選択
を行なうための詳細な識別処理がなされる。この詳細な
識別処理は一般には辞書照合処理といわれる。ここで辞
書とは各文字の特徴を一定の系列で格納したもので通常
ROMで構成されている。それゆえ上述して候補文字の
絞り込みは、特徴抽出によって得られた特徴群にもとづ
き、辞書の中から特定の文字群を選定することをいい、
辞書誘導処理と呼ばれる。
紙P上の文字を1文字毎に光電交換し、これをさらに
“1”,“0”の2値パターンに変換した後、この2値
パターンにつきノイズ除去や文字図形境界面の平滑化な
どの前処理が実施される。次に文字認識を行なうのに必
要ないくつかの特徴(交点、分岐点、ループ数、ストロ
ークの長さ情報など)を抽出する特徴抽出処理が行なわ
れ、この抽出結果に応じて多数の文字より特徴が共通す
る文字のいくつかが候補文字として絞り込まれる。この
絞り込みにより第1段階の認識が終了するが、候補文字
が複数ある場合にはさらにその中から唯一の文字の選択
を行なうための詳細な識別処理がなされる。この詳細な
識別処理は一般には辞書照合処理といわれる。ここで辞
書とは各文字の特徴を一定の系列で格納したもので通常
ROMで構成されている。それゆえ上述して候補文字の
絞り込みは、特徴抽出によって得られた特徴群にもとづ
き、辞書の中から特定の文字群を選定することをいい、
辞書誘導処理と呼ばれる。
上述したようにこの辞書誘導処理に続いて、辞書中に予
め記憶される各文字の標準となる特徴系列(以下標準パ
タ−ンという)と認識対象文字の対応する特徴系列の一
致度を検出する照合処理がなされる。この照合処理結果
にもとづき読取った文字が特定されたり、あるいは認識
不能として認識結果が出力される。
め記憶される各文字の標準となる特徴系列(以下標準パ
タ−ンという)と認識対象文字の対応する特徴系列の一
致度を検出する照合処理がなされる。この照合処理結果
にもとづき読取った文字が特定されたり、あるいは認識
不能として認識結果が出力される。
次に辞書の一例について説明する。
第2図(A)は、同図(B)のカナ文字「ア」の標準パタ−ン
D1を図形化したものであり、ここに示した標準パタ−
ンD1が辞書として記憶されている。すなわちこの辞書
において文字「ア」は、3つの端点と、1個の分岐点
と、番号値で表わされる10個の方向成分(ベクト
ル)とで構成されている。なおここに示すベクトル番号
値は文字のストローク方向がそれぞれ第3図に示す0か
ら7までの8方向のいずれの方向であるかを区別するた
めのものである。従って上記標準パタ−ンD1は文字
「ア」が端点から始まって2・1・2・3・4・5と
いうベクトルをこの順番で有した後、分岐点で終了す
る要素と、端点から始まりベクトル2・3・4・5お
よび端点をこの順番で有する要素とを含むことを示し
ている。これらの各要素を図示したものが第2図(B)の
下段に示すものである。
D1を図形化したものであり、ここに示した標準パタ−
ンD1が辞書として記憶されている。すなわちこの辞書
において文字「ア」は、3つの端点と、1個の分岐点
と、番号値で表わされる10個の方向成分(ベクト
ル)とで構成されている。なおここに示すベクトル番号
値は文字のストローク方向がそれぞれ第3図に示す0か
ら7までの8方向のいずれの方向であるかを区別するた
めのものである。従って上記標準パタ−ンD1は文字
「ア」が端点から始まって2・1・2・3・4・5と
いうベクトルをこの順番で有した後、分岐点で終了す
る要素と、端点から始まりベクトル2・3・4・5お
よび端点をこの順番で有する要素とを含むことを示し
ている。これらの各要素を図示したものが第2図(B)の
下段に示すものである。
ここで、第1図のフローチャートで説明した文字認識装
置のより具体的な処理手順を上記した第2図および第4
図ないし第8図を用いて説明する。
置のより具体的な処理手順を上記した第2図および第4
図ないし第8図を用いて説明する。
用紙Pから読取られた文字は2値化処理後、前処理され
て、システムの記憶エリアに記憶される。ここで記憶さ
れる文字パターンは第4図に示すように筆跡そのままの
太目のものである。しかしこの太目の文字パターンはい
わゆる細め等の処理が施され、第5図に示すように文字
の骨格を示す情報に変換される。この変換にあたって前
記骨格は第7図に示すA(左右)、B(上下)、C(斜
右上り)、D(斜右下り)の4方向に正規化される。こ
こで行なう正規化は第3図に示した8方向成分への区別
を容易にするためのもので、この変換処理に続いて読取
った文字の特徴系列を得る処理がなされる。この特徴系
列の表現は辞書すなわち第2図(B)の標準パタ−ンD1
と同様に行なわれ、その結果、第6図に示すような1
3434という特徴系列が得られる。この特徴系
列は読取対象文字すなわち未知の文字のパターンを示す
ものであるから以下未知パターンと呼ぶ。
て、システムの記憶エリアに記憶される。ここで記憶さ
れる文字パターンは第4図に示すように筆跡そのままの
太目のものである。しかしこの太目の文字パターンはい
わゆる細め等の処理が施され、第5図に示すように文字
の骨格を示す情報に変換される。この変換にあたって前
記骨格は第7図に示すA(左右)、B(上下)、C(斜
右上り)、D(斜右下り)の4方向に正規化される。こ
こで行なう正規化は第3図に示した8方向成分への区別
を容易にするためのもので、この変換処理に続いて読取
った文字の特徴系列を得る処理がなされる。この特徴系
列の表現は辞書すなわち第2図(B)の標準パタ−ンD1
と同様に行なわれ、その結果、第6図に示すような1
3434という特徴系列が得られる。この特徴系
列は読取対象文字すなわち未知の文字のパターンを示す
ものであるから以下未知パターンと呼ぶ。
以上のようにして得られた未知パターンは辞書誘導処理
の結果得られた候補文字の標準パタ−ンとその一致度が
照合される。今第6図に示す未知パターンと、第2図
(B)に示す「ア」の標準パタ−ンとが照合されたとする
と、この照合処理は第8図に示すように、標準パタ−ン
中の方向成分の順番と未知パターンの方向成分の順番と
が一致しているか否か等、一定の規則にしたがって行な
われる。この例の場合、未知パターンの方向成分は標準
パタ−ンが持つ方向成分にすべて含まれ、かつ順番も一
致しているので、未知パターンはカナ文字「ア」として
認識され出力される。
の結果得られた候補文字の標準パタ−ンとその一致度が
照合される。今第6図に示す未知パターンと、第2図
(B)に示す「ア」の標準パタ−ンとが照合されたとする
と、この照合処理は第8図に示すように、標準パタ−ン
中の方向成分の順番と未知パターンの方向成分の順番と
が一致しているか否か等、一定の規則にしたがって行な
われる。この例の場合、未知パターンの方向成分は標準
パタ−ンが持つ方向成分にすべて含まれ、かつ順番も一
致しているので、未知パターンはカナ文字「ア」として
認識され出力される。
一般的な文字認識装置においては、以上のようにして文
字認識がなされるが、上記説明で理解できるように、文
字認識における照合処理においては文字を構成している
方向成分の順番が重要であり、またこの方向成分の順番
はいずれの点を方向成分操索の起点とするかにより変化
するものであることがわかる。
字認識がなされるが、上記説明で理解できるように、文
字認識における照合処理においては文字を構成している
方向成分の順番が重要であり、またこの方向成分の順番
はいずれの点を方向成分操索の起点とするかにより変化
するものであることがわかる。
ところで従来の文字認識装置は、文字端点に限って前記
方向成分の探索起点とする探索方式を採用し、照合処理
においてはその検索起点からの方向成分の順番により照
合をおこなっている。この方式で文字「ス」「マ」を第
9図に示す如く、文字の上側より走査した場合、第10
図および第11図に示す特徴系列のパターンが得られ、
従ってこの両文字は第2番目の方向成分の要素(第10
図の“6”と第11図の“2”)の差異に基づき確実に
区別して認識できる。ところが文字「ユ」「ヲ」を同様
の方法で探索した場合、第12図および第13図に示す
如く夫々パターンの特徴系列の方向成分の順番(第12
図の“14,1”と第13図の“14,1”は全く同一
となり、従って両文字を区別して識別することが困難で
ある。この問題に対応するため、従来の文字認識装置
は、他の観点からの文字特徴を抽出した後、別の識別処
理をさらに追加しており、これがため従来の文字認識装
置では、別に追加した識別処理のための処理時間がかか
り、その分、処理の高速化が阻害されていた。
方向成分の探索起点とする探索方式を採用し、照合処理
においてはその検索起点からの方向成分の順番により照
合をおこなっている。この方式で文字「ス」「マ」を第
9図に示す如く、文字の上側より走査した場合、第10
図および第11図に示す特徴系列のパターンが得られ、
従ってこの両文字は第2番目の方向成分の要素(第10
図の“6”と第11図の“2”)の差異に基づき確実に
区別して認識できる。ところが文字「ユ」「ヲ」を同様
の方法で探索した場合、第12図および第13図に示す
如く夫々パターンの特徴系列の方向成分の順番(第12
図の“14,1”と第13図の“14,1”は全く同一
となり、従って両文字を区別して識別することが困難で
ある。この問題に対応するため、従来の文字認識装置
は、他の観点からの文字特徴を抽出した後、別の識別処
理をさらに追加しており、これがため従来の文字認識装
置では、別に追加した識別処理のための処理時間がかか
り、その分、処理の高速化が阻害されていた。
さらに、例えば第14図(1)に示す文字「ニ」を上側よ
り探索すると、文字図形の変形によって、同図(2)(3)に
示す如く、ベクトル番号が相違する場合が生じる。これ
がためかかる2種類のパターンを辞書に記憶させる必要
があり、辞書照合の処理時間が増し、また辞書の容量増
大を招き、その結果、処理の高速化および共通の低価格
化を阻害している。
り探索すると、文字図形の変形によって、同図(2)(3)に
示す如く、ベクトル番号が相違する場合が生じる。これ
がためかかる2種類のパターンを辞書に記憶させる必要
があり、辞書照合の処理時間が増し、また辞書の容量増
大を招き、その結果、処理の高速化および共通の低価格
化を阻害している。
<発明の目的> 本発明は、前記した従来の文字認識装置の欠点を解消
し、辞書照合の処理時間を短縮し、高速且つ高精度の文
字認識装置を提供することを目的とする。
し、辞書照合の処理時間を短縮し、高速且つ高精度の文
字認識装置を提供することを目的とする。
<発明の構成および効果> 上記目的を達成するため、本発明では標準パターンを格
納する辞書記憶手段に、各文字毎に探索起点の特徴点種
別を示す特徴点情報および前記探索起点がどの方向のス
トロークのどちら側の端点であるかということを示すス
トロークの端点位置情報を予め規定して記憶させてお
き、照合処理時に、特徴点情報およびストロークの端点
位置情報に基づき未知パターンのストロークを追跡する
ようにした。本発明によれば、第1回目の探索起点を文
字分岐点とし、第2回目の探索起点を文字端点とするこ
とにより文字認識を行う。これにより、確実な文字認識
が可能となり、文字端点を常に探索起点とする従来例に
比較して、照合処理時間を短縮でき、辞書容量を節減す
る等、発明目的を達成した顕著な効果を奏する。
納する辞書記憶手段に、各文字毎に探索起点の特徴点種
別を示す特徴点情報および前記探索起点がどの方向のス
トロークのどちら側の端点であるかということを示すス
トロークの端点位置情報を予め規定して記憶させてお
き、照合処理時に、特徴点情報およびストロークの端点
位置情報に基づき未知パターンのストロークを追跡する
ようにした。本発明によれば、第1回目の探索起点を文
字分岐点とし、第2回目の探索起点を文字端点とするこ
とにより文字認識を行う。これにより、確実な文字認識
が可能となり、文字端点を常に探索起点とする従来例に
比較して、照合処理時間を短縮でき、辞書容量を節減す
る等、発明目的を達成した顕著な効果を奏する。
<実施例の説明> 第17図は本発明にかかる文字認識装置を示し、用紙P
上の文字はA/D変換回路1で光学的に読取られデジタ
ルデータに変換されて画像メモリ2に記憶される。A/
D変換回路1にはCPU3およびストローク検出回路4
が接続されており、CPU3は照合処理を含む文字認識
装置をプログラムにしたがい実行し、またストローク検
出回路4は読取られた文字をたとえば第18図に示すよ
うに4方向ストローク(第7図参照)に変換する。また
図中、ROM5は認識対象文字の標準パタ−ンを記憶す
る辞書およびプログラム用のメモリであり、RAM6は
入力文字の4方向ストロークや8方向変換データの記憶
用およびプログラム実行時のワークエリア用のメモリで
ある。RAM6の記憶内容は第18図に示すストローク
抽出後のイメージに対応して格納されており、その具体
的な内容は第19図に示してある。
上の文字はA/D変換回路1で光学的に読取られデジタ
ルデータに変換されて画像メモリ2に記憶される。A/
D変換回路1にはCPU3およびストローク検出回路4
が接続されており、CPU3は照合処理を含む文字認識
装置をプログラムにしたがい実行し、またストローク検
出回路4は読取られた文字をたとえば第18図に示すよ
うに4方向ストローク(第7図参照)に変換する。また
図中、ROM5は認識対象文字の標準パタ−ンを記憶す
る辞書およびプログラム用のメモリであり、RAM6は
入力文字の4方向ストロークや8方向変換データの記憶
用およびプログラム実行時のワークエリア用のメモリで
ある。RAM6の記憶内容は第18図に示すストローク
抽出後のイメージに対応して格納されており、その具体
的な内容は第19図に示してある。
第19図中、TERMは文字図形の端点情報の格納領域
であり、T1は1つの端点、SAはA方向のストローク
を、S1はそのA方向の追番を夫々示す。同様にT2〜
T3は他の端点を示しており、SCはC方向のストロー
クであることを示す。またL,Rは文字端点のストロー
クに対する位置を示しており、Lは端点位置がストロー
クの左側であることを、またRは同様に右側であること
を夫々示す。CHKNはストローク間の接続情報(屈折
点)が格納される領域であり、図示例では追番S1のA
方向ストロークのR(右側)と追番S1のC方向ストロ
ークのR(右側)とが屈折点K1として接続されている
ことを意味している。CHBKは文字図形の分岐点情報
が格納される領域であり、図示例では追番S1のC方向
ストロークのL(左側)が文字分岐点B1であることを
意味している。ARTMはAストロークの端点の2次元
座標アドレス情報が格納される領域であり、CSTMは
Cストロークの端点の2次元座標アドレス情報が格納さ
れる領域である。なおストロークの端点の2次元座標ア
ドレス情報を格納する領域としては、Bストロークおよ
びDストロークの端点アドレス情報を格納する領域BS
TM,DSTMも設けられるがここでは第18図の文字
例にBストローク、Dストロークを含んでいないので図
示されていない。またPONTは未知パターンのストロ
ーク追跡過程におけるストローク情報を格納する領域、
SCMは認識対象文字すなわち未知文字のストロークの
8方向に変換されたデータを格納する領域である。
であり、T1は1つの端点、SAはA方向のストローク
を、S1はそのA方向の追番を夫々示す。同様にT2〜
T3は他の端点を示しており、SCはC方向のストロー
クであることを示す。またL,Rは文字端点のストロー
クに対する位置を示しており、Lは端点位置がストロー
クの左側であることを、またRは同様に右側であること
を夫々示す。CHKNはストローク間の接続情報(屈折
点)が格納される領域であり、図示例では追番S1のA
方向ストロークのR(右側)と追番S1のC方向ストロ
ークのR(右側)とが屈折点K1として接続されている
ことを意味している。CHBKは文字図形の分岐点情報
が格納される領域であり、図示例では追番S1のC方向
ストロークのL(左側)が文字分岐点B1であることを
意味している。ARTMはAストロークの端点の2次元
座標アドレス情報が格納される領域であり、CSTMは
Cストロークの端点の2次元座標アドレス情報が格納さ
れる領域である。なおストロークの端点の2次元座標ア
ドレス情報を格納する領域としては、Bストロークおよ
びDストロークの端点アドレス情報を格納する領域BS
TM,DSTMも設けられるがここでは第18図の文字
例にBストローク、Dストロークを含んでいないので図
示されていない。またPONTは未知パターンのストロ
ーク追跡過程におけるストローク情報を格納する領域、
SCMは認識対象文字すなわち未知文字のストロークの
8方向に変換されたデータを格納する領域である。
第20図はROM5の記憶内容のうち、辞書部分を例示
したものであり、図示例は第21図の文字「ユ」の辞書
を示している。この辞書には各文字格納領域毎に先ず文
字の方向成分探索の起点を示す特徴点情報が格納してあ
る。この特徴点情報は、探索の起点となる特徴点(文字
端点、分岐点等の文字の特徴をなす点を総称する)の種
別を示すものであり、図中は探索起点が分岐点である
ことを示し、は探索起点が文字端点であることを示
す。従って第20図に示す例では、第1回目は文字分岐
点を、第2回目は文字端点を、夫々起点として文字の方
向成分を探索することになる。
したものであり、図示例は第21図の文字「ユ」の辞書
を示している。この辞書には各文字格納領域毎に先ず文
字の方向成分探索の起点を示す特徴点情報が格納してあ
る。この特徴点情報は、探索の起点となる特徴点(文字
端点、分岐点等の文字の特徴をなす点を総称する)の種
別を示すものであり、図中は探索起点が分岐点である
ことを示し、は探索起点が文字端点であることを示
す。従って第20図に示す例では、第1回目は文字分岐
点を、第2回目は文字端点を、夫々起点として文字の方
向成分を探索することになる。
この特徴点情報のつぎには、ストローク端点の位置情報
が格納してある。図中、ALはストロークAの左側端点
より追跡することを示し、同様にストロークAの右側端
点ではAR、ストロークBの上側および下側端点ではB
U,BD、ストロークCの左側および右側端点ではC
L,CR、ストロークDの左側および右側端点ではD
L,DRをもって示すことになる。第20図の例では第
1回目の走査においては、ストロークCの左側の点よ
り、また第2回目の走査においてはストロークAの左側
の点より追跡することになっている。従って、第1回目
の走査においては、未知文字を上側から走査した際、最
初に出会った文字分岐点がストロークCの左側であれ
ば、その文字分岐点より未知パターンのストローク追跡
を実施することになる。
が格納してある。図中、ALはストロークAの左側端点
より追跡することを示し、同様にストロークAの右側端
点ではAR、ストロークBの上側および下側端点ではB
U,BD、ストロークCの左側および右側端点ではC
L,CR、ストロークDの左側および右側端点ではD
L,DRをもって示すことになる。第20図の例では第
1回目の走査においては、ストロークCの左側の点よ
り、また第2回目の走査においてはストロークAの左側
の点より追跡することになっている。従って、第1回目
の走査においては、未知文字を上側から走査した際、最
初に出会った文字分岐点がストロークCの左側であれ
ば、その文字分岐点より未知パターンのストローク追跡
を実施することになる。
第22図は、上記実施例にかかる装置の照合処理動作を
示し、以下、辞書誘導処理により、候補文字が「ユ」に
絞られた場合の照合処理について説明する。文字「ユ」
では第15図に示すように、051という特徴
系列のパターンが得られる。また、文字「ヲ」では第1
6図に示すように、514という特徴系列のパ
ターンが得られる。次に、詳細説明を行う。
示し、以下、辞書誘導処理により、候補文字が「ユ」に
絞られた場合の照合処理について説明する。文字「ユ」
では第15図に示すように、051という特徴
系列のパターンが得られる。また、文字「ヲ」では第1
6図に示すように、514という特徴系列のパ
ターンが得られる。次に、詳細説明を行う。
先ずステップ11(以下「ST11」の如く示す)にお
いて、絞られた候補文字「ユ」からROM5の「ユ」の
辞書(第20図)を参照し、第1回目走査における特徴
点情報をロードする。つぎにST12で同様にROM
5の辞書を参照し、第1回目走査のストローク端点位置
情報CLをロードした後、走査モードを上側辺に設定し
て、上側辺の左端に相当するアドレスを走査カウンタに
格納して初期化する(ST13,14)。次に走査モー
ドにしたがって第18図に示したイメージをRAM6上
で走査する。図示例では、第9図に示す如く、上辺左側
から右端に走査してゆくことになる。この時各走査点毎
にRAM6のASTM領域、CSTM領域のストローク
端点の2次元アドレスと走査カウンタの座標が一致する
か比較される(ST15)。比較の結果両座標が一致し
ない限り走査カウンタが更新されこの座標アドレス比較
が繰り返される(ST15、27、28)。そして走査
カウンタの内容とRAM6の端点2次元アドレスが例え
ば座標(16,25)にて一致すると、このストローク
端点を仮の起点とし、次にこのストローク端点が文字端
点であるか否かを判定する(ST16)。この座標(1
6,25)はCSTM領域に格納されており、C方向ス
トロークのストローク番号1の左側端点に該当する。つ
ぎに、この端点の情報がTERM領域において、文字端
点として格納されているか否かがチェックされる。図示
例の場合、TERM領域にはC方向のストロークのスト
ローク番号1の左側端点が存在しておらず、従ってST
16の判定は“NO”となり、つぎのST17へ移行す
る。ST17では、前記ストローク端点が文字分岐点で
あるか否かをチェックする。図示例の場合、CHBK領
域内に前記ストローク端点の情報(SC,S1,L)が
存在しており、従ってST17の判定は“YES”とな
る。次のST18は、ST16、17の判定結果と前記
ST11でロードされた特徴点情報の内容を比較してお
り、この場合、両者は文字分岐点である点で共通するか
ら、ST18の判定は“YES”となり、つぎのST1
9へ移行する。このST19は前記ストローク端点位置
情報(SC,S1,L)と前記ST12でロードされた
ストローク端点位置情報CLとを比較するもので、この
場合、両者はC方向ストロークの左端端点を意味する内
容で一致しており、ST19の判定は“YES”とな
る。そこでこの文字分岐点をストローク追跡時の起点と
して、RAM6のSCM領域に文字分岐点マークを格
納し、また上記ストローク端点位置情報(SC,S1,
L)をPONT領域に格納する。
いて、絞られた候補文字「ユ」からROM5の「ユ」の
辞書(第20図)を参照し、第1回目走査における特徴
点情報をロードする。つぎにST12で同様にROM
5の辞書を参照し、第1回目走査のストローク端点位置
情報CLをロードした後、走査モードを上側辺に設定し
て、上側辺の左端に相当するアドレスを走査カウンタに
格納して初期化する(ST13,14)。次に走査モー
ドにしたがって第18図に示したイメージをRAM6上
で走査する。図示例では、第9図に示す如く、上辺左側
から右端に走査してゆくことになる。この時各走査点毎
にRAM6のASTM領域、CSTM領域のストローク
端点の2次元アドレスと走査カウンタの座標が一致する
か比較される(ST15)。比較の結果両座標が一致し
ない限り走査カウンタが更新されこの座標アドレス比較
が繰り返される(ST15、27、28)。そして走査
カウンタの内容とRAM6の端点2次元アドレスが例え
ば座標(16,25)にて一致すると、このストローク
端点を仮の起点とし、次にこのストローク端点が文字端
点であるか否かを判定する(ST16)。この座標(1
6,25)はCSTM領域に格納されており、C方向ス
トロークのストローク番号1の左側端点に該当する。つ
ぎに、この端点の情報がTERM領域において、文字端
点として格納されているか否かがチェックされる。図示
例の場合、TERM領域にはC方向のストロークのスト
ローク番号1の左側端点が存在しておらず、従ってST
16の判定は“NO”となり、つぎのST17へ移行す
る。ST17では、前記ストローク端点が文字分岐点で
あるか否かをチェックする。図示例の場合、CHBK領
域内に前記ストローク端点の情報(SC,S1,L)が
存在しており、従ってST17の判定は“YES”とな
る。次のST18は、ST16、17の判定結果と前記
ST11でロードされた特徴点情報の内容を比較してお
り、この場合、両者は文字分岐点である点で共通するか
ら、ST18の判定は“YES”となり、つぎのST1
9へ移行する。このST19は前記ストローク端点位置
情報(SC,S1,L)と前記ST12でロードされた
ストローク端点位置情報CLとを比較するもので、この
場合、両者はC方向ストロークの左端端点を意味する内
容で一致しており、ST19の判定は“YES”とな
る。そこでこの文字分岐点をストローク追跡時の起点と
して、RAM6のSCM領域に文字分岐点マークを格
納し、また上記ストローク端点位置情報(SC,S1,
L)をPONT領域に格納する。
尚第23図に示す如く、2個の分岐点B1,B2を有する
パターンにおいて、最初に到達した分岐点(例えば
B1)についてのST19の判定が“NO”の場合、つ
ぎにST20で、その分岐点B1のストロークが前記S
T12でロードされたストローク端点位置情報に含まれ
るストローク情報と同種であるか否かがチェックされ
る。そしてST20で、同種のストロークであると判定
されたとき、更に走査を進めるべくST27へ移行し、
この場合他の分岐点B2についてもST19で同様のチ
ェックが行なわれることになる。
パターンにおいて、最初に到達した分岐点(例えば
B1)についてのST19の判定が“NO”の場合、つ
ぎにST20で、その分岐点B1のストロークが前記S
T12でロードされたストローク端点位置情報に含まれ
るストローク情報と同種であるか否かがチェックされ
る。そしてST20で、同種のストロークであると判定
されたとき、更に走査を進めるべくST27へ移行し、
この場合他の分岐点B2についてもST19で同様のチ
ェックが行なわれることになる。
また前記ST16、17において文字端点や文字分岐が
抽出されない時、さらに走査を進めるべくST27に移
行し、走査カウンタを更新するものである。
抽出されない時、さらに走査を進めるべくST27に移
行し、走査カウンタを更新するものである。
かくて前記文字分岐点が抽出された場合において、つぎ
にPONT領域のストローク端点情報(SC,S1,
L)を用いて、第3図に示す8方向データ(C方向スト
ロークで左から右へのストロークは方向0)に変換し、
この方向データ“0”をRAM6の8方向変換データ格
納領域SCMに格納する。(ST21)。続いてPON
T領域に格納したストロークから、さらに接続情報を探
すために、このストロークのもう一方のストローク端点
情報(SC,S1,R)にPONT領域を変更する。そ
して変更されたC方向ストロークのストローク番号1の
右側端(R)が文字端点であるか、接続点(屈折点)であ
るか、あるいは文字分岐点であるかをPONT領域のデ
ータを参照して、文字端点格納領域TERM、屈折点格
納領域CHKNおよび、分岐点格納領域CHBK内の登
録内容を調べてチェックする。図示例ではCHKN領域
より(SC,S1,R)を見出すことができ、変更後の
ストローク端点は文字接続点(K1)であることがわか
る。それゆえ、ST22の接続情報チェックの判定は
「有」と判断される。これに伴いPONT領域のストロ
ーク情報をこの(SA,S1,R)に変更した後、制御
はST21に移される。
にPONT領域のストローク端点情報(SC,S1,
L)を用いて、第3図に示す8方向データ(C方向スト
ロークで左から右へのストロークは方向0)に変換し、
この方向データ“0”をRAM6の8方向変換データ格
納領域SCMに格納する。(ST21)。続いてPON
T領域に格納したストロークから、さらに接続情報を探
すために、このストロークのもう一方のストローク端点
情報(SC,S1,R)にPONT領域を変更する。そ
して変更されたC方向ストロークのストローク番号1の
右側端(R)が文字端点であるか、接続点(屈折点)であ
るか、あるいは文字分岐点であるかをPONT領域のデ
ータを参照して、文字端点格納領域TERM、屈折点格
納領域CHKNおよび、分岐点格納領域CHBK内の登
録内容を調べてチェックする。図示例ではCHKN領域
より(SC,S1,R)を見出すことができ、変更後の
ストローク端点は文字接続点(K1)であることがわか
る。それゆえ、ST22の接続情報チェックの判定は
「有」と判断される。これに伴いPONT領域のストロ
ーク情報をこの(SA,S1,R)に変更した後、制御
はST21に移される。
以後文字の端点が検出されるまでST21およびST2
2が繰返し実行される。その結果この図示例では05
がRAM6のストロークの8方向変換データ格納領域
SCMに格納される。
2が繰返し実行される。その結果この図示例では05
がRAM6のストロークの8方向変換データ格納領域
SCMに格納される。
次にST23において、つぎの起点情報が有在するか否
かがチェックされる。第20図に示す例では、第2回目
の起点情報が存在しており。従ってST23の判定が
“YES”となり、ST25でつぎの起点情報を、S
T26で第2回目のストローク端点位置情報ALを夫々
ロードした後、上記と同様の走査を行なうべくST13
に移行する。
かがチェックされる。第20図に示す例では、第2回目
の起点情報が存在しており。従ってST23の判定が
“YES”となり、ST25でつぎの起点情報を、S
T26で第2回目のストローク端点位置情報ALを夫々
ロードした後、上記と同様の走査を行なうべくST13
に移行する。
なお、上記の動作において、8方向変換の終了したスト
ロークは変換後適時抹消(RAM6上のASTM,CS
TM領域のストローク番号をスペースコードに変換)す
る。これによって、一度検出されたストロークが重複検
出されることはなくなる。
ロークは変換後適時抹消(RAM6上のASTM,CS
TM領域のストローク番号をスペースコードに変換)す
る。これによって、一度検出されたストロークが重複検
出されることはなくなる。
第2回目の探索も第1回目の場合と同様に走査モードが
決定され(ST13)、走査カウンタを初期化する(S
T14)。そして上記した第1回目の場合と同様に走査
カウンタを更新しながら走査を行ない、RAM6のAS
TM、CSTM領域に格納されるストロークの2次元ア
ドレスデータと走査カウンタとを比較する(ST15、
27、28)。第18図に示した例ではアドレス(2,
28)で一致が成立する。このアドレス(2,28)は
ASTM領域に格納されている。それゆえこの端点はA
方向ストローク(SA)のストローク番号2(S2)の
左側(L)であることがわかる。次に、このストローク
端点が文字端点であるかを判定し、文字端点である時、
その情報をRAM6のPONT領域に走査時の仮のの起
点として格納する(ST16)。つぎに前記抽出された
文字端点がST25でロードした起点情報の内容と一致
するか否かを判定する。(ST18)。この場合第2回
目の起点情報は、すなわち文字端点であるから、その
判定は“YES”となりST19へ移行する。ST19
ではこの文字端点と前記ST26でロードしたストロー
ク端点位置情報とを比較し、一致した時に、この文字端
点を走査時の起点とし、さらに文字端点マークをRA
M6のSCM領域に格納する。次に、第1回目と同様に
PONT領域のストローク情報を用いて8方向データ方
向1に変換し、この方向データ“1”を8方向変換デー
タ格納領域SCMに“1”を格納する(ST21)。続
いて、PONT領域に格納したストロークからさらに接
続情報を探すためにこのストロークのもう一方のストロ
ーク端点位置情報(SA,S2,R)にPONT領域を
変更する。接続有無の確認は、このPONT領域のデー
タを参照してTERM領域、CHKN領域、CHBK領
域を調べることにより行なうが、図示例では変更後のス
トローク端点(SA,S2,R)がTERN領域中に存
在するので文字端点であると判定されST22が"NO"と
なって、8方向変換データ格納領域SCMには文字端点
マークが格納される。そしてST23で再び次の起点
があるか否かが判定されるが図示例では第2回目までの
起点辺がROM5に格納されているのみなので、ここで
は判定が“NO”となり、続いてRAM6の8方向変換
データ格納領域SCMの内容とROM5の辞書の文字
「ユ」の標準パターンが比較される(ST24)。比較
の結果、ある一定率以上の一致が得られれば入力文字を
「ユ」と認識する。
決定され(ST13)、走査カウンタを初期化する(S
T14)。そして上記した第1回目の場合と同様に走査
カウンタを更新しながら走査を行ない、RAM6のAS
TM、CSTM領域に格納されるストロークの2次元ア
ドレスデータと走査カウンタとを比較する(ST15、
27、28)。第18図に示した例ではアドレス(2,
28)で一致が成立する。このアドレス(2,28)は
ASTM領域に格納されている。それゆえこの端点はA
方向ストローク(SA)のストローク番号2(S2)の
左側(L)であることがわかる。次に、このストローク
端点が文字端点であるかを判定し、文字端点である時、
その情報をRAM6のPONT領域に走査時の仮のの起
点として格納する(ST16)。つぎに前記抽出された
文字端点がST25でロードした起点情報の内容と一致
するか否かを判定する。(ST18)。この場合第2回
目の起点情報は、すなわち文字端点であるから、その
判定は“YES”となりST19へ移行する。ST19
ではこの文字端点と前記ST26でロードしたストロー
ク端点位置情報とを比較し、一致した時に、この文字端
点を走査時の起点とし、さらに文字端点マークをRA
M6のSCM領域に格納する。次に、第1回目と同様に
PONT領域のストローク情報を用いて8方向データ方
向1に変換し、この方向データ“1”を8方向変換デー
タ格納領域SCMに“1”を格納する(ST21)。続
いて、PONT領域に格納したストロークからさらに接
続情報を探すためにこのストロークのもう一方のストロ
ーク端点位置情報(SA,S2,R)にPONT領域を
変更する。接続有無の確認は、このPONT領域のデー
タを参照してTERM領域、CHKN領域、CHBK領
域を調べることにより行なうが、図示例では変更後のス
トローク端点(SA,S2,R)がTERN領域中に存
在するので文字端点であると判定されST22が"NO"と
なって、8方向変換データ格納領域SCMには文字端点
マークが格納される。そしてST23で再び次の起点
があるか否かが判定されるが図示例では第2回目までの
起点辺がROM5に格納されているのみなので、ここで
は判定が“NO”となり、続いてRAM6の8方向変換
データ格納領域SCMの内容とROM5の辞書の文字
「ユ」の標準パターンが比較される(ST24)。比較
の結果、ある一定率以上の一致が得られれば入力文字を
「ユ」と認識する。
第1図は一般的な文字認識装置の概略を説明するための
フローチャート、第2図(A),(B)は文字例「ア」を方向
成分に変換した標準パタ−ン例を説明するための図、第
3図は文字のストロークの方向成分を8方向に正規化す
る場合の方向番号を示す図、第4図は文字例「ア」の光
学的に読取った状態でのパターンを示す図、第5図は第
4図の文字「ア」を細めてストロークの骨格のみを示し
た図、第6図は第5図に示す文字「ア」を端点、方向成
分、屈折点で表わす場合を説明するための図、第7図は
4方向成分を説明するための図、第8図は第2図に示す
文字「ア」の標準パタ−ンと第5図,第6図に示す文字
「ア」の照合による認識動作を説明するための図、第9
図は走査が開始される辺を説明するための図、第10図
乃至第13図は文字「ス」「マ」「ユ」「ヲ」を方向成
分に変換したパターン例を説明するための図、第14図
は文字「ニ」のパターン例の違いを説明するための図、
第15図および第16図は本発明を実施して文字「ユ」
「ヲ」を方向成分に変換した場合のパターン例を示す
図、第17図は本発明が実施される文字認識装置の回路
ブロック図、第18図は入力された文字を4方向ストロ
ークに変換したイメージの一例を示す図、第19図は第
17図に示す文字認識装置のRAMの格納領域配置例を
示す図、第20図は同ROMの辞書格納領域の一文字分
のデータ配置例を示す図、第21図は文字「ユ」の標準
パターンを示す図、第22図は、第17図に示す文字認識
装置の動作を説明するためのフローチャート、第23図
は2個の分岐点を有するパターン例を示す図である。
フローチャート、第2図(A),(B)は文字例「ア」を方向
成分に変換した標準パタ−ン例を説明するための図、第
3図は文字のストロークの方向成分を8方向に正規化す
る場合の方向番号を示す図、第4図は文字例「ア」の光
学的に読取った状態でのパターンを示す図、第5図は第
4図の文字「ア」を細めてストロークの骨格のみを示し
た図、第6図は第5図に示す文字「ア」を端点、方向成
分、屈折点で表わす場合を説明するための図、第7図は
4方向成分を説明するための図、第8図は第2図に示す
文字「ア」の標準パタ−ンと第5図,第6図に示す文字
「ア」の照合による認識動作を説明するための図、第9
図は走査が開始される辺を説明するための図、第10図
乃至第13図は文字「ス」「マ」「ユ」「ヲ」を方向成
分に変換したパターン例を説明するための図、第14図
は文字「ニ」のパターン例の違いを説明するための図、
第15図および第16図は本発明を実施して文字「ユ」
「ヲ」を方向成分に変換した場合のパターン例を示す
図、第17図は本発明が実施される文字認識装置の回路
ブロック図、第18図は入力された文字を4方向ストロ
ークに変換したイメージの一例を示す図、第19図は第
17図に示す文字認識装置のRAMの格納領域配置例を
示す図、第20図は同ROMの辞書格納領域の一文字分
のデータ配置例を示す図、第21図は文字「ユ」の標準
パターンを示す図、第22図は、第17図に示す文字認識
装置の動作を説明するためのフローチャート、第23図
は2個の分岐点を有するパターン例を示す図である。
Claims (1)
- 【請求項1】未知文字を光学的に読み取って文字パター
ンを求める手段と、文字パターンの特徴を抽出する手段
と、抽出された特徴を記憶する手段と、抽出された特徴
を共通にする文字グループを候補文字として誘導する手
段と、各文字毎に固有の標準パターンを記憶すると共に
各文字毎に探索起点の特徴点種別を示す特徴点情報およ
び前記探索起点がどの方向のストロークのどちら側の端
点であるかということを示すストロークの端点位置情報
を予め規定して記憶する辞書記憶手段と、前記誘導され
た文字グループの各文字について、前記特徴点情報およ
びストロークの端点位置情報に基づき、未知パターンの
ストロークを追跡しつつ標準パターンと比較する照合手
段とを具備して成る文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59074753A JPH067392B2 (ja) | 1984-04-12 | 1984-04-12 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59074753A JPH067392B2 (ja) | 1984-04-12 | 1984-04-12 | 文字認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS60217480A JPS60217480A (ja) | 1985-10-31 |
| JPH067392B2 true JPH067392B2 (ja) | 1994-01-26 |
Family
ID=13556338
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59074753A Expired - Lifetime JPH067392B2 (ja) | 1984-04-12 | 1984-04-12 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH067392B2 (ja) |
-
1984
- 1984-04-12 JP JP59074753A patent/JPH067392B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPS60217480A (ja) | 1985-10-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0538038B1 (en) | Character recognition method & apparatus | |
| US4972499A (en) | Pattern recognition apparatus | |
| US4907285A (en) | Image understanding system | |
| JP3065104B2 (ja) | 指紋一致装置 | |
| KR100249055B1 (ko) | 문자인식장치및방법 | |
| EP0542566B1 (en) | Character recognition method and apparatus thereof | |
| JPS60217477A (ja) | 手書き文字認識装置 | |
| US4491965A (en) | Character recognition apparatus | |
| JPH067392B2 (ja) | 文字認識装置 | |
| JPH067394B2 (ja) | パターン認識装置 | |
| JPH0256709B2 (ja) | ||
| JPS60164882A (ja) | 文字認識装置 | |
| JPS60204088A (ja) | 文字認識装置 | |
| JPS60225984A (ja) | 文字認識装置 | |
| JP2671985B2 (ja) | 情報認識方法 | |
| Amin | Recognition of printed Arabic text using machine learning | |
| JPS5933584A (ja) | 文字認識装置 | |
| JPH07200734A (ja) | 光学的文字読取装置 | |
| JP2851865B2 (ja) | 文字認識装置 | |
| JP3151866B2 (ja) | 英文字認識方法 | |
| JPH11126216A (ja) | 図面自動入力装置 | |
| JPH04280394A (ja) | 文字認識装置及び認識文字確定方法 | |
| JP2622004B2 (ja) | 文字認識装置 | |
| KR100206827B1 (ko) | 문자 인식을 위한 한글/영문 판별방법 | |
| JP3138665B2 (ja) | 手書き文字認識方式および記録媒体 |