JPS60217480A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPS60217480A JPS60217480A JP59074753A JP7475384A JPS60217480A JP S60217480 A JPS60217480 A JP S60217480A JP 59074753 A JP59074753 A JP 59074753A JP 7475384 A JP7475384 A JP 7475384A JP S60217480 A JPS60217480 A JP S60217480A
- Authority
- JP
- Japan
- Prior art keywords
- character
- stroke
- information
- end point
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〈発明の技術分野〉
本発明は、未知のカナ、英字、数字等の文字を自動的に
読取って認識する文字認識装置に関する。
読取って認識する文字認識装置に関する。
〈発明の背景〉
従来この種の文字認識装置では、第1図に示す如く、用
紙P上の文字を1文字毎に光電変換し、これをさらに”
1”、”O”の2値パターンに変換した後、この2値パ
ターンにつきノイズ除去や文字図形境界面の平滑化なと
の前処理か実施される。次に文字認識を行なうのに必要
ないくつかの特徴(交点、分岐点、ループ数、ストロー
クの長さ清報なと)をQ)行なわれ、この抽出結果に応
じて多数の文字より特徴が共通する文字のいくつがか候
補文字として絞り込まれる。この絞り込みにより第1段
階の認識が終了するが、候補文字が複数ある場合にはさ
らにその中から唯一の文字の選択を行なうための詳細な
識別処理がなされる。この詳細な識別処理は一般には辞
書照合処理といわれる。ここで辞書とは各文字の特徴を
一定の系列で格納したもので通常ROMで構成されてい
る。それゆえ上述した候補文字の絞り込みは、特徴抽出
によって得られた特徴群にもとづき、辞書の中から特定
の文字群を選定することをいい辞書誘導処理と呼ばれる
。
紙P上の文字を1文字毎に光電変換し、これをさらに”
1”、”O”の2値パターンに変換した後、この2値パ
ターンにつきノイズ除去や文字図形境界面の平滑化なと
の前処理か実施される。次に文字認識を行なうのに必要
ないくつかの特徴(交点、分岐点、ループ数、ストロー
クの長さ清報なと)をQ)行なわれ、この抽出結果に応
じて多数の文字より特徴が共通する文字のいくつがか候
補文字として絞り込まれる。この絞り込みにより第1段
階の認識が終了するが、候補文字が複数ある場合にはさ
らにその中から唯一の文字の選択を行なうための詳細な
識別処理がなされる。この詳細な識別処理は一般には辞
書照合処理といわれる。ここで辞書とは各文字の特徴を
一定の系列で格納したもので通常ROMで構成されてい
る。それゆえ上述した候補文字の絞り込みは、特徴抽出
によって得られた特徴群にもとづき、辞書の中から特定
の文字群を選定することをいい辞書誘導処理と呼ばれる
。
上述したようにこの辞書誘導処理に続いて、辞書中に予
じめ記憶される各文字の標準となる特徴系列(以下標準
パターンという)と認識対象文字の対応する特徴系列の
一致度を検出する照合処理がなされる。この照合処理結
果にもとづき読取った文字が特定されたり、あるいは認
識不能として認識結果が出力される。
じめ記憶される各文字の標準となる特徴系列(以下標準
パターンという)と認識対象文字の対応する特徴系列の
一致度を検出する照合処理がなされる。この照合処理結
果にもとづき読取った文字が特定されたり、あるいは認
識不能として認識結果が出力される。
次に辞書の一例について説明する。
第2図(A)は、同図(B)のカナ文字「ア」の標準パ
ターンD1を図形化したものであり、ここに示した標準
パターンD1が辞書として記憶されている。すなわちこ
の辞書において文字「ア」Cよ・3つの端点■と、1個
の分岐点[有]と、番号値で表わされる10個の方向成
分(ベクトル)とで構成されている。なおここに示すベ
クトル番号値は文字のストローク方向がそれぞれ第3図
に示すOから7までの8方向のいずれの方向であるかを
区別するためのものである。従って上記標準パターンD
Iは文字「ア」が端点■から始まって2・1・3・4・
5というベクトルをこの順番で有した後分岐点■て終了
する要素と、端点■から始まりベクトル2・3・4・5
および端点■をこの順番で有する要素とを含むことを示
している。これらの各要素を図示したものが第2図(B
)の下段に示すものである。
ターンD1を図形化したものであり、ここに示した標準
パターンD1が辞書として記憶されている。すなわちこ
の辞書において文字「ア」Cよ・3つの端点■と、1個
の分岐点[有]と、番号値で表わされる10個の方向成
分(ベクトル)とで構成されている。なおここに示すベ
クトル番号値は文字のストローク方向がそれぞれ第3図
に示すOから7までの8方向のいずれの方向であるかを
区別するためのものである。従って上記標準パターンD
Iは文字「ア」が端点■から始まって2・1・3・4・
5というベクトルをこの順番で有した後分岐点■て終了
する要素と、端点■から始まりベクトル2・3・4・5
および端点■をこの順番で有する要素とを含むことを示
している。これらの各要素を図示したものが第2図(B
)の下段に示すものである。
ここで、第1図のフローチャートで説明した文字認識装
置のより具体的な処理手順を上記した第2図および第4
図ないし第8図を用いて説明する。
置のより具体的な処理手順を上記した第2図および第4
図ないし第8図を用いて説明する。
用紙Pから読取られた文字は2値化処理、前処理されて
、システムの記憶エリアに記憶される。ここで記憶され
る文字パターンは第4図に示すように筆跡そのままの太
目のものである。
、システムの記憶エリアに記憶される。ここで記憶され
る文字パターンは第4図に示すように筆跡そのままの太
目のものである。
しかしこの太目の文字パターンはいわゆる細め等の処理
か施され、第5図に示すように文字の骨格を示す情報に
変換される。この変換にあたって前記骨格は第7図に示
すA(左右)、B(上下)、C(斜右上り)、D(斜右
下り)の4方向に正規化される。ここで行なう正規化は
第3図に示した8方向成分への区別を容易にするための
もので、この変換処理に続いて読取った文字の特徴系列
を得る処理がなされる。この特徴系列の表現は辞書すな
わち第2図(B)の標準パターンD1と同様に行なわれ
、その結果、第6図に示すような■134■■34■と
いう特徴系列が得られる。この特徴系列は読取対象文字
すなわち未知の文字のパターンを示すものであるから以
下未知パターンと呼ぶ。
か施され、第5図に示すように文字の骨格を示す情報に
変換される。この変換にあたって前記骨格は第7図に示
すA(左右)、B(上下)、C(斜右上り)、D(斜右
下り)の4方向に正規化される。ここで行なう正規化は
第3図に示した8方向成分への区別を容易にするための
もので、この変換処理に続いて読取った文字の特徴系列
を得る処理がなされる。この特徴系列の表現は辞書すな
わち第2図(B)の標準パターンD1と同様に行なわれ
、その結果、第6図に示すような■134■■34■と
いう特徴系列が得られる。この特徴系列は読取対象文字
すなわち未知の文字のパターンを示すものであるから以
下未知パターンと呼ぶ。
以上のようにして得られた未知パターンは辞書誘導処理
の結果得られた候補文字の標準パターンとその一致度が
照合される。令弟6図に示す未知パターンと、第2図(
B)に示す「ア」の。
の結果得られた候補文字の標準パターンとその一致度が
照合される。令弟6図に示す未知パターンと、第2図(
B)に示す「ア」の。
標準パターンとが照合されたとすると、この照合処理は
第8図に示すように、標準パターン中の方向成分の順番
と未知パターンの方向成分の11@番とが一致している
か否か等、一定の規則にしたがって行なわれる。この例
の場合、未知パターンの方向成分は標準パターンが持つ
方向成分にすへて含まれ、かつ順番も一致しているので
、未知パターンはカナ文字「ア」として認識され出力さ
れる。
第8図に示すように、標準パターン中の方向成分の順番
と未知パターンの方向成分の11@番とが一致している
か否か等、一定の規則にしたがって行なわれる。この例
の場合、未知パターンの方向成分は標準パターンが持つ
方向成分にすへて含まれ、かつ順番も一致しているので
、未知パターンはカナ文字「ア」として認識され出力さ
れる。
一般的な文字認識装置においては、以上のようにして文
字認識がなされるが、上記説明で理解できるように、文
字認識における照合処理においては文字を構成している
方向成分の順番か重要であり、またこの方向成分の順番
はいずれの点を方向成分検索の起点とするかにより変化
するものであることがわかる。
字認識がなされるが、上記説明で理解できるように、文
字認識における照合処理においては文字を構成している
方向成分の順番か重要であり、またこの方向成分の順番
はいずれの点を方向成分検索の起点とするかにより変化
するものであることがわかる。
ところで従来の文字認識装置は、文字端点に限って前記
方向成分の探索起点とする探索方式を採用している。こ
の方式で文字「ス」「マ」を第9図に示す如く、文字の
上側より走査した場合、第10図および第11図に示す
特徴系列のパターンが得られ、従ってこの両文字は第2
番目の要素の差異に基つき確実に区別して認識できる。
方向成分の探索起点とする探索方式を採用している。こ
の方式で文字「ス」「マ」を第9図に示す如く、文字の
上側より走査した場合、第10図および第11図に示す
特徴系列のパターンが得られ、従ってこの両文字は第2
番目の要素の差異に基つき確実に区別して認識できる。
ところが文字「ユ」「ヲ」を同様の方法で探索した場合
、第12図および第13図に示す如く夫々パターンの特
徴系列は全く同一となり、従って両文字を区別して識別
することが困難である。この問題に対応するため、従来
の文字認識装置は、他の観点からの文字特徴を抽出した
後、別の識別処理をさらに追加しており、これがため従
来の文字認識装置では、別に追加した識別処理のための
処理時間がかかり、その分、処理の高速化が阻害されて
いた。
、第12図および第13図に示す如く夫々パターンの特
徴系列は全く同一となり、従って両文字を区別して識別
することが困難である。この問題に対応するため、従来
の文字認識装置は、他の観点からの文字特徴を抽出した
後、別の識別処理をさらに追加しており、これがため従
来の文字認識装置では、別に追加した識別処理のための
処理時間がかかり、その分、処理の高速化が阻害されて
いた。
さらに、例えば第14図(1)に示す文字「二」を上側
より探索すると、文字図形の変形によって、同図(2]
+3+に示す如く、ベクトル番号か相違する場合が生
じる。これがためかかる2種類のパターンを辞書に記憶
させる必要があり、辞書照合の処理時間が増し、また辞
書の容量増大を招き、その結果、処理の高速化および共
通の低価格化を阻害している。
より探索すると、文字図形の変形によって、同図(2]
+3+に示す如く、ベクトル番号か相違する場合が生
じる。これがためかかる2種類のパターンを辞書に記憶
させる必要があり、辞書照合の処理時間が増し、また辞
書の容量増大を招き、その結果、処理の高速化および共
通の低価格化を阻害している。
〈発明の目的〉
本発明は、前記した従来の文字認識装置の欠点を解消し
、辞書照合の処理時間を短縮し、高速且つ高精度の文字
認識装置を提供することを目的とする。
、辞書照合の処理時間を短縮し、高速且つ高精度の文字
認識装置を提供することを目的とする。
〈発明の構成および効果〉
上記目的を達成するため、本発明では標準パターンを格
納する辞書記憶手段4こ、各文字毎に探索起点の特徴点
種別を示す特徴点清報およびストロークの端点位置情報
を予め規定して記憶させておき、照合処理時に、特徴点
情報およびストロークの端点位置情報に基づき未知パタ
ーンのストロークを追跡するようにした。不発明によれ
は、例えは文字「ユ」「チ」を文字の上側より探索した
場合、第1回目の探索起点を文字分岐点とし、第2回目
の探索起点を文字端点とすると、文字「ユ」では第15
図に示す如り、−■05■■1■という特徴系列のパタ
ーンが得られ、一方文字「ヲjでは第16図に示す如く
、■5■■14のという特徴系列のパターンか得られる
。従って両文字は確実に区別して認識し得、文字端点を
常に探索起点とする従来例に比較して、照合処理時間を
短縮でき、辞書容量を節減する等、発明目的を達成した
顕著な効果を奏する。
納する辞書記憶手段4こ、各文字毎に探索起点の特徴点
種別を示す特徴点清報およびストロークの端点位置情報
を予め規定して記憶させておき、照合処理時に、特徴点
情報およびストロークの端点位置情報に基づき未知パタ
ーンのストロークを追跡するようにした。不発明によれ
は、例えは文字「ユ」「チ」を文字の上側より探索した
場合、第1回目の探索起点を文字分岐点とし、第2回目
の探索起点を文字端点とすると、文字「ユ」では第15
図に示す如り、−■05■■1■という特徴系列のパタ
ーンが得られ、一方文字「ヲjでは第16図に示す如く
、■5■■14のという特徴系列のパターンか得られる
。従って両文字は確実に区別して認識し得、文字端点を
常に探索起点とする従来例に比較して、照合処理時間を
短縮でき、辞書容量を節減する等、発明目的を達成した
顕著な効果を奏する。
〈実施例の説明〉
第17図は本発明にかかる文字認識装置を示し、用紙P
上の文字はA / D変換回路1て光学的に読取られデ
ジタルデータに変換されて画像メモリ2に記憶される。
上の文字はA / D変換回路1て光学的に読取られデ
ジタルデータに変換されて画像メモリ2に記憶される。
A / D変換回路1にはcpu3およびストローク検
出回路4が結合なされており、CPU3は照合処理を含
む文字認識処理をプログラムにしたがい実行し、またス
トローク検出回路4は読取られた文字をたとえば第18
図に示すように4方向ストロークに変換する。また図中
、ROM5は認識対象文字の標準パターンを記憶する辞
書およびプログラム用のメモリであり、RAM5は入力
文字の4方向ストロークや8方向変換データQ記憶用お
よびプログラム実行時のワークエリア用のメモリである
。RAM5の記憶内容は第18図に示すストローク抽出
後のイメージに対応して・格納されており、その具体的
な内容は第19図に示しである。
出回路4が結合なされており、CPU3は照合処理を含
む文字認識処理をプログラムにしたがい実行し、またス
トローク検出回路4は読取られた文字をたとえば第18
図に示すように4方向ストロークに変換する。また図中
、ROM5は認識対象文字の標準パターンを記憶する辞
書およびプログラム用のメモリであり、RAM5は入力
文字の4方向ストロークや8方向変換データQ記憶用お
よびプログラム実行時のワークエリア用のメモリである
。RAM5の記憶内容は第18図に示すストローク抽出
後のイメージに対応して・格納されており、その具体的
な内容は第19図に示しである。
第19図中、TERMは文字図形の端点情報の格納領域
であり、T1は1つの端点、SAは入方向のストローク
を、SlはそのA方向の追番を夫々示す。同様にT2〜
T3は他の端点を示しており、SCはC方向のストロー
クであることを示す。またり、Rは文字端点のストロー
クに対する位置を示しており、Lは端点位置かストロー
クの左側であることを、またI(は同様に右側であるこ
とを夫々示す。CHK Nはストローク間の接続情報(
屈折点)か格納される領域であり、図示例では追番S1
のA方向ストロークのR(右側)と追番S2のC方向ス
トロークのR(右側)とが屈折点として接続されている
ことを意味している。CHB K は文字図形の分岐点
情報が格納される領域であり、図示例では追番S1のC
方向ストロークのしく左側)か文字分岐点であることる
意味している。ASTMはAストロークの端点の2次元
座標アドレス情報が格納される領域であり、C3TM
はCストロークの端点の2次元座標アドレス情報が格納
される領域である。なおストロークの端点の2次元座標
アドレス情報を格納する領域としては、Bストロークお
よびDストロークの端点アドレス情報を格納する領域B
STM 、DSTMも設けられるがここでは第18図の
文字例にBストローク、Dストロークを含んでいないの
で図示されていない。またPONT は未知パターンの
ストローク追跡過程におけるストローク情報を格納する
領域、SCMは認識対象文字すなわち未知文字のストロ
ークの8方向に変換されたテークを格納する領域である
。
であり、T1は1つの端点、SAは入方向のストローク
を、SlはそのA方向の追番を夫々示す。同様にT2〜
T3は他の端点を示しており、SCはC方向のストロー
クであることを示す。またり、Rは文字端点のストロー
クに対する位置を示しており、Lは端点位置かストロー
クの左側であることを、またI(は同様に右側であるこ
とを夫々示す。CHK Nはストローク間の接続情報(
屈折点)か格納される領域であり、図示例では追番S1
のA方向ストロークのR(右側)と追番S2のC方向ス
トロークのR(右側)とが屈折点として接続されている
ことを意味している。CHB K は文字図形の分岐点
情報が格納される領域であり、図示例では追番S1のC
方向ストロークのしく左側)か文字分岐点であることる
意味している。ASTMはAストロークの端点の2次元
座標アドレス情報が格納される領域であり、C3TM
はCストロークの端点の2次元座標アドレス情報が格納
される領域である。なおストロークの端点の2次元座標
アドレス情報を格納する領域としては、Bストロークお
よびDストロークの端点アドレス情報を格納する領域B
STM 、DSTMも設けられるがここでは第18図の
文字例にBストローク、Dストロークを含んでいないの
で図示されていない。またPONT は未知パターンの
ストローク追跡過程におけるストローク情報を格納する
領域、SCMは認識対象文字すなわち未知文字のストロ
ークの8方向に変換されたテークを格納する領域である
。
第20図はPOM5の記憶内容のうち、辞書部分を例示
したものであり、図示例は第21図の文字「ユ」の辞書
を示している。この辞書には各文字格納領域毎に先ず文
字の方向成分探索の起点を示す特徴点情報が格納しであ
る。この特徴点情報は、探索の起点となる特徴点(文字
端点、分岐点等の文字の特徴をなす点を総称する)の種
別を示すものであり、図中■は探索起点が分岐点である
ことを示し、■は探索起点か文字端点であることを示す
。従って第20図に示す例では、第1回目は文字分岐点
を、第2回目は文字端点を、夫々起点として文字の方向
成分を探索することになる。
したものであり、図示例は第21図の文字「ユ」の辞書
を示している。この辞書には各文字格納領域毎に先ず文
字の方向成分探索の起点を示す特徴点情報が格納しであ
る。この特徴点情報は、探索の起点となる特徴点(文字
端点、分岐点等の文字の特徴をなす点を総称する)の種
別を示すものであり、図中■は探索起点が分岐点である
ことを示し、■は探索起点か文字端点であることを示す
。従って第20図に示す例では、第1回目は文字分岐点
を、第2回目は文字端点を、夫々起点として文字の方向
成分を探索することになる。
この特徴点情報のつきには、ストローク端点の位置情報
が格納しである。図中、ALはストロークAの左側端点
より追跡することを示し、同様にストロークAの右側端
点てはAR、ストロークBの上側および下側端点ではB
U、BD、ストロークCの左側および右側端点てはCL
。
が格納しである。図中、ALはストロークAの左側端点
より追跡することを示し、同様にストロークAの右側端
点てはAR、ストロークBの上側および下側端点ではB
U、BD、ストロークCの左側および右側端点てはCL
。
CR、ストロークDの左側および右側端点てはDL、D
Rをもって示すことになる。第20図の例では第1回目
の走査においては、ストロークCの左側の点より、また
第2回目の走査においてはストロークAの左側の点より
追跡することになっている。従って、第1回目の走査に
おいては、未知文字を上側から走査し1こ際、最初に出
会った文字分岐点がストロークCの左側であれば、その
文字分岐点より未知パターンのストローク追跡を実施す
ることになる。
Rをもって示すことになる。第20図の例では第1回目
の走査においては、ストロークCの左側の点より、また
第2回目の走査においてはストロークAの左側の点より
追跡することになっている。従って、第1回目の走査に
おいては、未知文字を上側から走査し1こ際、最初に出
会った文字分岐点がストロークCの左側であれば、その
文字分岐点より未知パターンのストローク追跡を実施す
ることになる。
第22図は、上記実施例にかかる装置の照合処理動作を
示し、以下、辞書誘導処理により、候補文字が「ユ」に
絞られた場合の照合処理について説明する。
示し、以下、辞書誘導処理により、候補文字が「ユ」に
絞られた場合の照合処理について説明する。
先ずステップ11(以下、r 5TIIJの如く示す)
において、絞られた候補文字「ユ」からROM 5の「
ユ」の辞書(第20図)を参照し、第1回目走査におけ
る特徴点情報■をロードする。つぎにSTl 2で同様
にROM5の辞書を参照し、第1回目走査のストローク
端点位置情報CLをロードした後、走査モードを上側辺
に設定して、上側辺の左端に相当するアドレスを走査カ
ウンタに格納して初期化する( S ”I” 13 。
において、絞られた候補文字「ユ」からROM 5の「
ユ」の辞書(第20図)を参照し、第1回目走査におけ
る特徴点情報■をロードする。つぎにSTl 2で同様
にROM5の辞書を参照し、第1回目走査のストローク
端点位置情報CLをロードした後、走査モードを上側辺
に設定して、上側辺の左端に相当するアドレスを走査カ
ウンタに格納して初期化する( S ”I” 13 。
14)。次に走査モードにしたがって第18図に示した
イメージをRAM5上で走査する。図示例では、第9図
に示す如く、上辺左側から右端に走査してゆくことにな
る。この時各走査点毎にRAM5のASTM領域、C5
TM領域のストローク端点の2次元アドレスと走査カウ
ンタの座標か一致するか比較される( 5T15)。
イメージをRAM5上で走査する。図示例では、第9図
に示す如く、上辺左側から右端に走査してゆくことにな
る。この時各走査点毎にRAM5のASTM領域、C5
TM領域のストローク端点の2次元アドレスと走査カウ
ンタの座標か一致するか比較される( 5T15)。
比較の結果両座標が一致しない限り走査カウンタが更新
されこの座標アドレス比較が繰り返される(ST15.
27.28)。そして走査カウンタの内容とRAM 6
の端点2次元アドレスが例えば座標(16,25)に
て一致すると、このストローク端点を仮の起点とし、次
にこのストローク端点か文字端点であるか否かを判定す
る(ST16)。この座標(16,25)はC5TM領
域に格納されており、C方向ストロークのストローク番
号1の左側端点に該当する。つきに、この端点の情報か
TERM 領域において、文字端点として格納されてい
るか否かがチェックされる。図示例の場合、TEkM
領域にはC方向ストロークのストローク番号1の左側端
点か存在しておらず、従って5T16 の判定はNO″
となり、つきの5T17 へ移行する。5−T17では
、前記ストローク端点が文字分岐点であるか否かをチェ
ックする。図示例の場合、CHB K領域内に前記スト
ローク端点の情報(SC’、51゜L)が存在しており
、従ってs −r 17 の判定は“YES″ となる
。っぎの5T18 は、5T15.17の判定結果と前
記5T11でロードされた特徴点情報の内容を比較して
おり、この場合、両者は文字分岐点である点て共通する
がら、5T18の判定は”YES” となり、っきの5
T19へ移行する。この5T19 は前記ストローク端
点情報(SC、S l 、 L) ト1Jicj 5T
12 テロードされたストローク端点位置情報CLとを
比較するもので、この場合、両者はC方向ストロークの
左端端点を意味する内容で一致しており、5T19 の
判定は” YES ”となる。そこでこの文字分岐点を
ストローク追跡時の起点として、RAM5 のSCM
領域に文字分岐点マーク■を格納し、また上記ストロー
ク端点情報(SC。
されこの座標アドレス比較が繰り返される(ST15.
27.28)。そして走査カウンタの内容とRAM 6
の端点2次元アドレスが例えば座標(16,25)に
て一致すると、このストローク端点を仮の起点とし、次
にこのストローク端点か文字端点であるか否かを判定す
る(ST16)。この座標(16,25)はC5TM領
域に格納されており、C方向ストロークのストローク番
号1の左側端点に該当する。つきに、この端点の情報か
TERM 領域において、文字端点として格納されてい
るか否かがチェックされる。図示例の場合、TEkM
領域にはC方向ストロークのストローク番号1の左側端
点か存在しておらず、従って5T16 の判定はNO″
となり、つきの5T17 へ移行する。5−T17では
、前記ストローク端点が文字分岐点であるか否かをチェ
ックする。図示例の場合、CHB K領域内に前記スト
ローク端点の情報(SC’、51゜L)が存在しており
、従ってs −r 17 の判定は“YES″ となる
。っぎの5T18 は、5T15.17の判定結果と前
記5T11でロードされた特徴点情報の内容を比較して
おり、この場合、両者は文字分岐点である点て共通する
がら、5T18の判定は”YES” となり、っきの5
T19へ移行する。この5T19 は前記ストローク端
点情報(SC、S l 、 L) ト1Jicj 5T
12 テロードされたストローク端点位置情報CLとを
比較するもので、この場合、両者はC方向ストロークの
左端端点を意味する内容で一致しており、5T19 の
判定は” YES ”となる。そこでこの文字分岐点を
ストローク追跡時の起点として、RAM5 のSCM
領域に文字分岐点マーク■を格納し、また上記ストロー
ク端点情報(SC。
Sl、L)をPONT 領域に格納する。
尚第23図に示す如く、2個の分岐点B、、B2を有す
るパターンにおいて、最初に到達した分岐点(例えばB
+)についての5T19の判定が”NO” の場合、つ
きにS’T20で、その分岐点B1のストロークが前記
5T12でロードされたストローク端点位置情報に含ま
れるストローク清報と同種であるか否かがチェックされ
る。
るパターンにおいて、最初に到達した分岐点(例えばB
+)についての5T19の判定が”NO” の場合、つ
きにS’T20で、その分岐点B1のストロークが前記
5T12でロードされたストローク端点位置情報に含ま
れるストローク清報と同種であるか否かがチェックされ
る。
そして5T20 で同種のストロークである判定された
とき、更に走査を進めるへ(5T27 へ移行し、この
場合他の分岐点B2についても5T19で同様のチェッ
クが行なわれることになる。
とき、更に走査を進めるへ(5T27 へ移行し、この
場合他の分岐点B2についても5T19で同様のチェッ
クが行なわれることになる。
また前記5T16,17において文字端点や文字分岐が
抽出されない時、さらに走査を進めるべ(5T27 に
移行し、走査カウンタを更新するものである。
抽出されない時、さらに走査を進めるべ(5T27 に
移行し、走査カウンタを更新するものである。
か(て前記文字分岐点が抽出された場合において、つき
にFONT 領域のストローク端点情報(SC,Sl、
L)を用いて、第3図に示す8ご♀L 方向(C方向ストロークで左から右へのストロークは方
向0)に変換し、この方向データ“0″をRAM6 の
8方向変換テータ格納領域SCへ■に格納する(ST2
1)。続いてFONT領域に格納したストロークから、
さらに接続情報を探すために、このストロークのもう一
方のストローク端点情報(SC,Sl 、R)にPON
T @域を変更する。そして変更されたC方向ストロー
クのストローク番号1の右側端(R)が文字端点である
か、接続点(屈折点)であるか、あるいは文字分岐点で
あるかをPONT領域のデータを参照して、文字端点格
納領域TERM、屈折点格納領域CHKN および、分
岐点格納領域CHBK内の登録内容を調べてチェックす
る。図示例ではCHKN 領域より(SC,51,It
)を見出すことができ、変更後のストローク端点は文字
接続点(K1)であることがわかる。それゆえ、5T2
2 の接続情報チェックの判定は「有」と判断される。
にFONT 領域のストローク端点情報(SC,Sl、
L)を用いて、第3図に示す8ご♀L 方向(C方向ストロークで左から右へのストロークは方
向0)に変換し、この方向データ“0″をRAM6 の
8方向変換テータ格納領域SCへ■に格納する(ST2
1)。続いてFONT領域に格納したストロークから、
さらに接続情報を探すために、このストロークのもう一
方のストローク端点情報(SC,Sl 、R)にPON
T @域を変更する。そして変更されたC方向ストロー
クのストローク番号1の右側端(R)が文字端点である
か、接続点(屈折点)であるか、あるいは文字分岐点で
あるかをPONT領域のデータを参照して、文字端点格
納領域TERM、屈折点格納領域CHKN および、分
岐点格納領域CHBK内の登録内容を調べてチェックす
る。図示例ではCHKN 領域より(SC,51,It
)を見出すことができ、変更後のストローク端点は文字
接続点(K1)であることがわかる。それゆえ、5T2
2 の接続情報チェックの判定は「有」と判断される。
これに伴いFONT 領域のストローク情報をこの(S
A、Sl、R)に変更した後、制御は5T21 に移さ
れる。
A、Sl、R)に変更した後、制御は5T21 に移さ
れる。
以後文字の端点が検出されるまでSl21 および5T
22 が繰返し実行される。その結果この図示例では■
05のがRAM6 のストロークの8方向変換デ一タ格
納領域SCMに格納される。
22 が繰返し実行される。その結果この図示例では■
05のがRAM6 のストロークの8方向変換デ一タ格
納領域SCMに格納される。
次に5T23 において、っきの起点清報が存在するか
否かかチェックされる。第17図に示す例では、第2回
目の起点情報が存在しており。
否かかチェックされる。第17図に示す例では、第2回
目の起点情報が存在しており。
従ってST23 の判定がYES”となり、5125て
っぎの起点情報■を、s r 26て第2回目のストロ
ーク端点位置情報ALを夫々ロートした後、上記と同様
の走査を行なうべく5−rlaに移行する。
っぎの起点情報■を、s r 26て第2回目のストロ
ーク端点位置情報ALを夫々ロートした後、上記と同様
の走査を行なうべく5−rlaに移行する。
なお、上記の動作において、8方向変換の終了したスト
ロークは変換後適時抹ff14 (RAM 5上17)
ASTM 、 C5−1’M領域のストローク番号ラ
スペースコートに変換)する。これによって、一度検出
されたストロークが重複検出されルコとはなくなる。
ロークは変換後適時抹ff14 (RAM 5上17)
ASTM 、 C5−1’M領域のストローク番号ラ
スペースコートに変換)する。これによって、一度検出
されたストロークが重複検出されルコとはなくなる。
第2回目の探索も第1回目の場合と同様に走査モードが
決定され(ST13)、走査カウンタを初期化する(S
T14)。そして上記した第1回目の場合と同様に走査
カウンタを更新しながら走査を行ナイ、RAM6 (7
)ASTM、CS ’I−M領域に格納されるストロー
クの2次元アドレスデータと走査カウンタとを比較する
(ST15.27.28)。第18図に示した例ではア
ドレス(2、28) チ一致カ成立する。このアドレス
(2,28)はAsTM 領域に格納されている。
決定され(ST13)、走査カウンタを初期化する(S
T14)。そして上記した第1回目の場合と同様に走査
カウンタを更新しながら走査を行ナイ、RAM6 (7
)ASTM、CS ’I−M領域に格納されるストロー
クの2次元アドレスデータと走査カウンタとを比較する
(ST15.27.28)。第18図に示した例ではア
ドレス(2、28) チ一致カ成立する。このアドレス
(2,28)はAsTM 領域に格納されている。
それゆえこの端点はA方向ストローク(SA)のストロ
ーク番号2 (S2)の左側(L)であることがわかる
。次に、このストローク端点が文字端点であるかを判定
し、文字端点である時、その情報をRAM5のFONT
領域に走査時の仮のの起点として格納する(ST16)
。つきに前記抽出された文字端点が5T25でロードし
た起点情報の内容と一致するか否かを判定する。(ST
18)。この場合第2回目の起点情報は■、すなわち文
字端点であるから、その判定は“YES”となりST1
g へ移行する。s−rlg ではこの文字端点と前
記S T 26 でロードしたストローク端点清報とを
比較し、一致した時に、この文字端点を走査時の起点と
し、さらに文字端点マーク■をRAM6のSCM 領域
に格納する。次に、第1回目と同様にFONT領域のス
トローク情報を用いて8方向データ方向1に変換し、こ
の方向テーク“1” を8方向変換デ゛−夕格納領域S
CMに”1”を格納する(S’l”21)。続いて、F
ONT 領域ζこ格納したストロークからさらに接続
情報を探すためにこのストロークのもう一方のストロー
ク端点情報にPONT領域を右側の端点を示す(SA、
S2.R)に変更する。
ーク番号2 (S2)の左側(L)であることがわかる
。次に、このストローク端点が文字端点であるかを判定
し、文字端点である時、その情報をRAM5のFONT
領域に走査時の仮のの起点として格納する(ST16)
。つきに前記抽出された文字端点が5T25でロードし
た起点情報の内容と一致するか否かを判定する。(ST
18)。この場合第2回目の起点情報は■、すなわち文
字端点であるから、その判定は“YES”となりST1
g へ移行する。s−rlg ではこの文字端点と前
記S T 26 でロードしたストローク端点清報とを
比較し、一致した時に、この文字端点を走査時の起点と
し、さらに文字端点マーク■をRAM6のSCM 領域
に格納する。次に、第1回目と同様にFONT領域のス
トローク情報を用いて8方向データ方向1に変換し、こ
の方向テーク“1” を8方向変換デ゛−夕格納領域S
CMに”1”を格納する(S’l”21)。続いて、F
ONT 領域ζこ格納したストロークからさらに接続
情報を探すためにこのストロークのもう一方のストロー
ク端点情報にPONT領域を右側の端点を示す(SA、
S2.R)に変更する。
接続有無の確認は、このFONT領域のテークを参照し
てTE+RM領域、CHKN領域を調べることにより行
なうが、図示例では変更後のストローク端点(SA、S
2 、R) がTERN領域中に存在するので文字端点
であると判定され、8方同変換データ格納領域SC¥に
■を格納する(S−1−21)。−そして5T23で再
ひ次の起点指定が?判定されるが図示例では第2回目ま
での起点辺がROM5に格納されているのみなので、こ
こでは判定が“NO” となり、続いてRAM6の8方
向変換デ一タ格納領域SCMの内容とR,OM 5の辞
書の文字「ユ」の標準パターンが比較される(ST24
)。比較の結果、ある一定率以上の一致が得られれば入
力文字を1−ユ」と認識する。
てTE+RM領域、CHKN領域を調べることにより行
なうが、図示例では変更後のストローク端点(SA、S
2 、R) がTERN領域中に存在するので文字端点
であると判定され、8方同変換データ格納領域SC¥に
■を格納する(S−1−21)。−そして5T23で再
ひ次の起点指定が?判定されるが図示例では第2回目ま
での起点辺がROM5に格納されているのみなので、こ
こでは判定が“NO” となり、続いてRAM6の8方
向変換デ一タ格納領域SCMの内容とR,OM 5の辞
書の文字「ユ」の標準パターンが比較される(ST24
)。比較の結果、ある一定率以上の一致が得られれば入
力文字を1−ユ」と認識する。
第1図は一般的な文字認識装置の概略を説明するための
フローチャート、! 2 図(A) 、 (B)ハ文字
例「ア」を方向成分に変換した標べ(パターン例を説明
するための図、第3図は文字のストロークの方向成分を
8方向に正規化する場合の方向番号を示す図、第4図は
文字例「ア」の光学的に読取った状態でのパターンを示
す図、第5図は第4図の文字「ア」を細めてストローク
の骨格のみを示した図、第6図は第5図に示す文字「ア
Jを端点、方向成分、屈折点で表わす場合を説明するた
めの図、第7図は4方向酸分を説明するための図、第8
図は第2図に示す文字「ア」の標準パターンと第5図、
第6図に示す文字「ア」の照合による認識動作を説明す
るための図、第9図は走査が開始される辺を説明するた
めの図、第10図乃至第13図は文字「ヌ」「マ」「ユ
」「ヲ」を方向成分に変換したパターン例を説明するた
めの図、第14図は文字「二」のパターン例の違いを説
明するための図、第15図および第16図は本発明を実
施して文字「ユ」「ヲ」を方向成分に変換した場合のパ
ターン例を示す図、第17図は本発明か実施される文字
認識装置の回路ブロック図、第18図は第17図に示す
文字認識装置に入力される文字例を示す図、第19図は
第17図に示す文字認識装置のRA Mの格納領域配置
例を示す図、第20図は同ROMの辞書格納領域の一文
字分のデータ配置例を示す図、第21図は文字「ユ」の
標準パターンを示す図、第22図は、第17図に示す文
字認識装置の動作を説明するためのフローチャート、第
23図は2個の分岐点を有するパターン例を示す図であ
る。 竹/ 図 分 2 図 枡 3 図 牙4 図 り 分70図 分/l 図 シ1−/2 グ うヤノ3 図 分75 図 例76図 うヤ 77 図 71メ 79 図 丁l SA 妊/I フ t 2 SA θ −m−+χ M 52 T:37i (μ−−ユーーーー −4 SA 2 に/ SA t ’T、(2,25JSA、52rALJ0.211C 1 I C 5/ 5/ <3.c> L (2t 7ン R 2 (2,211)L (30,28)R 分2θ 図 分27 図
フローチャート、! 2 図(A) 、 (B)ハ文字
例「ア」を方向成分に変換した標べ(パターン例を説明
するための図、第3図は文字のストロークの方向成分を
8方向に正規化する場合の方向番号を示す図、第4図は
文字例「ア」の光学的に読取った状態でのパターンを示
す図、第5図は第4図の文字「ア」を細めてストローク
の骨格のみを示した図、第6図は第5図に示す文字「ア
Jを端点、方向成分、屈折点で表わす場合を説明するた
めの図、第7図は4方向酸分を説明するための図、第8
図は第2図に示す文字「ア」の標準パターンと第5図、
第6図に示す文字「ア」の照合による認識動作を説明す
るための図、第9図は走査が開始される辺を説明するた
めの図、第10図乃至第13図は文字「ヌ」「マ」「ユ
」「ヲ」を方向成分に変換したパターン例を説明するた
めの図、第14図は文字「二」のパターン例の違いを説
明するための図、第15図および第16図は本発明を実
施して文字「ユ」「ヲ」を方向成分に変換した場合のパ
ターン例を示す図、第17図は本発明か実施される文字
認識装置の回路ブロック図、第18図は第17図に示す
文字認識装置に入力される文字例を示す図、第19図は
第17図に示す文字認識装置のRA Mの格納領域配置
例を示す図、第20図は同ROMの辞書格納領域の一文
字分のデータ配置例を示す図、第21図は文字「ユ」の
標準パターンを示す図、第22図は、第17図に示す文
字認識装置の動作を説明するためのフローチャート、第
23図は2個の分岐点を有するパターン例を示す図であ
る。 竹/ 図 分 2 図 枡 3 図 牙4 図 り 分70図 分/l 図 シ1−/2 グ うヤノ3 図 分75 図 例76図 うヤ 77 図 71メ 79 図 丁l SA 妊/I フ t 2 SA θ −m−+χ M 52 T:37i (μ−−ユーーーー −4 SA 2 に/ SA t ’T、(2,25JSA、52rALJ0.211C 1 I C 5/ 5/ <3.c> L (2t 7ン R 2 (2,211)L (30,28)R 分2θ 図 分27 図
Claims (1)
- 未知文字を光学的に読み取って文字パターンをめる手段
と、文字パターンの特徴を抽出する手段と、抽出された
特徴を記憶する手段と、抽出−された特徴を共通にする
文字グループを候補文字として誘導する手段と、各文字
毎をこ固有の標準パ、ターンを記憶すると共に各文字毎
に探索起点の特徴点種別を示す特徴点情報およびストロ
ークの端点位置情報を予め規定して記憶する辞書記憶手
段と、前記誘導された文字グループの各文字について、
前記特徴点情報およびストロークの端点位置情報に基づ
き、未知パターンのストロークを追跡しつつ標準パター
ンと比較する照合手段とを具備して成る文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59074753A JPH067392B2 (ja) | 1984-04-12 | 1984-04-12 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59074753A JPH067392B2 (ja) | 1984-04-12 | 1984-04-12 | 文字認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS60217480A true JPS60217480A (ja) | 1985-10-31 |
| JPH067392B2 JPH067392B2 (ja) | 1994-01-26 |
Family
ID=13556338
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59074753A Expired - Lifetime JPH067392B2 (ja) | 1984-04-12 | 1984-04-12 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH067392B2 (ja) |
-
1984
- 1984-04-12 JP JP59074753A patent/JPH067392B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPH067392B2 (ja) | 1994-01-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3065104B2 (ja) | 指紋一致装置 | |
| Lee et al. | Recognition of handwritten Chinese characters via short line segments | |
| CN116258842B (zh) | 指纹模板动态拼接优选系统及方法 | |
| JPS60217480A (ja) | 文字認識装置 | |
| JPH067394B2 (ja) | パターン認識装置 | |
| JPS60204088A (ja) | 文字認識装置 | |
| JPS60164882A (ja) | 文字認識装置 | |
| JPH0256709B2 (ja) | ||
| JPS60225984A (ja) | 文字認識装置 | |
| JPH0357509B2 (ja) | ||
| JPS5933584A (ja) | 文字認識装置 | |
| JPH11126216A (ja) | 図面自動入力装置 | |
| JP2851865B2 (ja) | 文字認識装置 | |
| JPH01129368A (ja) | 画像認識装置 | |
| JPS60217479A (ja) | 文字認識装置 | |
| JPS61267882A (ja) | 文字認識装置 | |
| JPS6046753B2 (ja) | パタ−ンの特徴抽出方式 | |
| JPH0353392A (ja) | 文字認識装置 | |
| JPH04280394A (ja) | 文字認識装置及び認識文字確定方法 | |
| Su et al. | A FAULT-TOLERANT CHINESE CHECK | |
| JPS61121184A (ja) | 文字認識装置 | |
| KR100206827B1 (ko) | 문자 인식을 위한 한글/영문 판별방법 | |
| JPS60217482A (ja) | 文字認識装置 | |
| JPS5854432B2 (ja) | パタ−ン認識処理方法 | |
| JPS6089289A (ja) | 文字認識方式 |