JPS58201183A - 手書き文字認識における特徴抽出方法 - Google Patents
手書き文字認識における特徴抽出方法Info
- Publication number
- JPS58201183A JPS58201183A JP57085524A JP8552482A JPS58201183A JP S58201183 A JPS58201183 A JP S58201183A JP 57085524 A JP57085524 A JP 57085524A JP 8552482 A JP8552482 A JP 8552482A JP S58201183 A JPS58201183 A JP S58201183A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- character
- black
- partial
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/182—Extraction of features or characteristics of the image by coding the contour of the pattern
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は手書き文字の特徴を抽出してパターン構造を形
成し、予め用意された標準のパターン構造とのマツチン
グにまり文字認識を行う場合の特徴抽出方法に関する。
成し、予め用意された標準のパターン構造とのマツチン
グにまり文字認識を行う場合の特徴抽出方法に関する。
従来、文字の端点、角(かど)、分岐点などの細部特徴
を抽出して認識を行う文字認識方式には、いわゆる文字
細線化の技術が利用されており、細線化されたパターン
情報から細部特徴を抽出するものである。しかし、上記
細線化の方法は、例えば、白と黒の境界に位置する黒絵
素を白絵素に順に変換していくものであり、不要な突@
(ノイズ)を発生する場合がある。そのため誤まった細
部特徴を抽出する可能性がある。また、認識の立場から
すれば、細線化と特徴抽出を独立fこ考えて、かつ独立
な細部特徴を多く抽出してパターンマツチングを行うこ
とは、複雑で処理時間を要するものである。
を抽出して認識を行う文字認識方式には、いわゆる文字
細線化の技術が利用されており、細線化されたパターン
情報から細部特徴を抽出するものである。しかし、上記
細線化の方法は、例えば、白と黒の境界に位置する黒絵
素を白絵素に順に変換していくものであり、不要な突@
(ノイズ)を発生する場合がある。そのため誤まった細
部特徴を抽出する可能性がある。また、認識の立場から
すれば、細線化と特徴抽出を独立fこ考えて、かつ独立
な細部特徴を多く抽出してパターンマツチングを行うこ
とは、複雑で処理時間を要するものである。
本発明は、白黒2値入力文字パターンの特徴を抽出して
この入力文字のパターン構造を作成し、標準パターン構
造とのマツチングを行うに際し、前記白黒2値入力文字
パターンからその文字の輪郭線を抽出し、前記輪郭線か
らコーナ一点・変曲点を検出して、直線、湾曲、円(ル
ープ)等基準パターンを抽出し、抽出されたこの基準パ
ターンの対応関係から同一視される部分を抽出し、新し
く直線、湾曲、円(ループ)等の大まかな部分パターン
を構成することを特徴とし、入力文字のパターンを細線
化することなく、処理して特徴が抽出されるため、細線
化処理してから特徴を抽出する場合のように誤った特徴
を抽出するようなことがなく、特に手書き文字の認識に
有効である効果を奏する。
この入力文字のパターン構造を作成し、標準パターン構
造とのマツチングを行うに際し、前記白黒2値入力文字
パターンからその文字の輪郭線を抽出し、前記輪郭線か
らコーナ一点・変曲点を検出して、直線、湾曲、円(ル
ープ)等基準パターンを抽出し、抽出されたこの基準パ
ターンの対応関係から同一視される部分を抽出し、新し
く直線、湾曲、円(ループ)等の大まかな部分パターン
を構成することを特徴とし、入力文字のパターンを細線
化することなく、処理して特徴が抽出されるため、細線
化処理してから特徴を抽出する場合のように誤った特徴
を抽出するようなことがなく、特に手書き文字の認識に
有効である効果を奏する。
以下本発明の具体例を第1図と第2図に基づいて説明す
る。
る。
本発明における文字の特徴は、直線・湾曲・円(ループ
)等で(これらを部分パターンと称す)であり、それら
の記述は大まかなもので、パターンマツチングの際、文
字の変形に影響されlζくい量を持っている。また、こ
れら部分パターンはそれらの接続関係、相対的位置関係
から、その部分パターンより、より大きな部分パターン
を新しく形成するという階層性を持っている。
)等で(これらを部分パターンと称す)であり、それら
の記述は大まかなもので、パターンマツチングの際、文
字の変形に影響されlζくい量を持っている。また、こ
れら部分パターンはそれらの接続関係、相対的位置関係
から、その部分パターンより、より大きな部分パターン
を新しく形成するという階層性を持っている。
本発明では上記のような部分パターンを抽出するためI
こ、先ず第1図(a)に示すまうな白黒2値文字パター
ン〔但し、ここで(1)は白、(2)は黒を表わす。〕
から、その境界点の集合である輪郭線〔第1図(b)〕
を求め、その輪郭線をたどった場合に急激な方向変化を
する点・変曲点でその輪郭線を分割する。この分割によ
って得られた輪郭線の各部を、直線・湾曲・円(ループ
)等の種類のパターンに分割する(以下、基準パターン
と称す)。これら基準パターンは、それを検出するため
に用いた輪郭線の絵素をデータとして持つ必要はなく、
大まかな情報、例えば、始点・終点・始点での接線の方
位・終点での接線の方位・長さ等で記述すればよい。こ
の例を第1図(C)に示す。直線41 は、始点P1、
終点P2 であり、湾曲w1 は、始点P2、終点P3
である。ここで、基準パターンが輪郭線から得られたも
のである事に注目すると、ある基準パターンには平行関
係(対応関係)にあるものが必ず存在する。第1図(c
)の例で直線11 は、直線14 と平行関係であり、
湾曲w2 の一部と平行関係にある。このまうな平行関
係は、基準パターンの近接する始点、終点、始点での接
線の方位等を用い適切な閾値を持たせて検出できる。こ
の平行関係により新しくパターンが形成されろ。第1図
の例では、直線!11 の一部と湾曲W2 の一部から
直線L1、湾曲W1 と湾曲W8 の一部から湾曲W
1を形成する。このように、基準パターンの平行関係か
ら得られるパターンを部分パターと定義する。
こ、先ず第1図(a)に示すまうな白黒2値文字パター
ン〔但し、ここで(1)は白、(2)は黒を表わす。〕
から、その境界点の集合である輪郭線〔第1図(b)〕
を求め、その輪郭線をたどった場合に急激な方向変化を
する点・変曲点でその輪郭線を分割する。この分割によ
って得られた輪郭線の各部を、直線・湾曲・円(ループ
)等の種類のパターンに分割する(以下、基準パターン
と称す)。これら基準パターンは、それを検出するため
に用いた輪郭線の絵素をデータとして持つ必要はなく、
大まかな情報、例えば、始点・終点・始点での接線の方
位・終点での接線の方位・長さ等で記述すればよい。こ
の例を第1図(C)に示す。直線41 は、始点P1、
終点P2 であり、湾曲w1 は、始点P2、終点P3
である。ここで、基準パターンが輪郭線から得られたも
のである事に注目すると、ある基準パターンには平行関
係(対応関係)にあるものが必ず存在する。第1図(c
)の例で直線11 は、直線14 と平行関係であり、
湾曲w2 の一部と平行関係にある。このまうな平行関
係は、基準パターンの近接する始点、終点、始点での接
線の方位等を用い適切な閾値を持たせて検出できる。こ
の平行関係により新しくパターンが形成されろ。第1図
の例では、直線!11 の一部と湾曲W2 の一部から
直線L1、湾曲W1 と湾曲W8 の一部から湾曲W
1を形成する。このように、基準パターンの平行関係か
ら得られるパターンを部分パターと定義する。
この部分パターンも基準パターンと同様、始点、終点、
始点での接線の方位等で記述する。各位は平行関係にあ
る基準パターンから求めた平均値を採用する。このよう
にして得られた部分パターンは、その文字を構成する最
小の特徴ということができる。第1図(d)においては
直線Ll、湾曲W1、・・・で入力文字を構成している
。ここで得られた部分パターンは、それらの接続関係相
対的位置関係EこまってさらEこ大きな部分パターンを
構成するという階層性を持っており、認識の際に有効で
ある。
始点での接線の方位等で記述する。各位は平行関係にあ
る基準パターンから求めた平均値を採用する。このよう
にして得られた部分パターンは、その文字を構成する最
小の特徴ということができる。第1図(d)においては
直線Ll、湾曲W1、・・・で入力文字を構成している
。ここで得られた部分パターンは、それらの接続関係相
対的位置関係EこまってさらEこ大きな部分パターンを
構成するという階層性を持っており、認識の際に有効で
ある。
また例えば、直線L2 と湾曲W1 と直線L4で
円(ループ)が構成され、直線L1 とL4 、 L
8で湾曲が構成されている。
円(ループ)が構成され、直線L1 とL4 、 L
8で湾曲が構成されている。
第2図は第1図のような処理を実行する装置の構成図を
示す。Ql)は入力文字(3)を白黒2値パターンに変
換する光電変換部、に)は文字パターン記憶部で、上記
白黒2値パターンを記憶する。(2)は輪郭線抽出部で
、水平走査の2ラインを文字パターン記憶部に)から順
次読み出すことによって演算する。(ハ)は基準パター
ン抽出部で、輪郭線をたどり急激な方向変化、変曲点を
見出し、直線部分パターン演算部(ハ)、湾曲部分パタ
ーン演算部翰、円(ループ)部分パターン演算部(至)
に送られ、始点・終点の座標、始点での接線の方位、終
点での接線の方位、湾曲における方向変化量、円におけ
る中心点、及び長さを演算し、基準パターン記憶部(ハ
)に送られる。(ホ)は基準パターン平行部抽出部で、
上記基準パターンのデータ、特に、始点、終点の座標、
始点での接線の方位、終点での接線の方位を比較し、平
行関係のある部分を求め、上記各部分パターン演算部(
ホ)翰(至)で7新たに始点の座標、終点の座標等を計
算して部分パターンを求め、部分パターン記憶部■に送
られる。この部分パターン記憶部(イ)では、上記の部
分パターンの種類、始点・終点、始点での接線の方位、
終点での接線の方位、全部分パターンにおけるその部分
パターンが占める大きさ、湾曲ならば方向変化量、円(
ループ)ならば中心点をパターン構造として記憶され、
認識部へ送られる。
示す。Ql)は入力文字(3)を白黒2値パターンに変
換する光電変換部、に)は文字パターン記憶部で、上記
白黒2値パターンを記憶する。(2)は輪郭線抽出部で
、水平走査の2ラインを文字パターン記憶部に)から順
次読み出すことによって演算する。(ハ)は基準パター
ン抽出部で、輪郭線をたどり急激な方向変化、変曲点を
見出し、直線部分パターン演算部(ハ)、湾曲部分パタ
ーン演算部翰、円(ループ)部分パターン演算部(至)
に送られ、始点・終点の座標、始点での接線の方位、終
点での接線の方位、湾曲における方向変化量、円におけ
る中心点、及び長さを演算し、基準パターン記憶部(ハ
)に送られる。(ホ)は基準パターン平行部抽出部で、
上記基準パターンのデータ、特に、始点、終点の座標、
始点での接線の方位、終点での接線の方位を比較し、平
行関係のある部分を求め、上記各部分パターン演算部(
ホ)翰(至)で7新たに始点の座標、終点の座標等を計
算して部分パターンを求め、部分パターン記憶部■に送
られる。この部分パターン記憶部(イ)では、上記の部
分パターンの種類、始点・終点、始点での接線の方位、
終点での接線の方位、全部分パターンにおけるその部分
パターンが占める大きさ、湾曲ならば方向変化量、円(
ループ)ならば中心点をパターン構造として記憶され、
認識部へ送られる。
以上のように本発明にまると、細線化をすることなく特
徴抽出を行うことができるので、従来のように誤った特
徴を抽出することはなく、さら(こ特徴は大まかなもの
から構成され、それらが階層性を持つ構造にしているが
ためパターンマツチングによる手書き文字認識fこは大
変有効なものである。
徴抽出を行うことができるので、従来のように誤った特
徴を抽出することはなく、さら(こ特徴は大まかなもの
から構成され、それらが階層性を持つ構造にしているが
ためパターンマツチングによる手書き文字認識fこは大
変有効なものである。
第1図(a)〜(d)は、本発明の特徴抽出方法の処理
過程の説明図、第2図は本発明の方法を実現する装置の
一実施例のブロック図である。 /1−14−・・直線、w 1〜w 8−湾曲、(11
−・・白、+21−・・黒、(3)・・・入力文字、Q
])・・・光電変換部、に)・・・輪郭線抽出部、(ハ
)・・・基準パターン抽出部、に)・・・基準パターン
平行部抽出部、(ハ)・・・直線部分パターン演算部、
に)・・・湾曲部分パターン演算部、…・・・内部分パ
ターン演算部 代理人 森本義弘 第1図 第2図
過程の説明図、第2図は本発明の方法を実現する装置の
一実施例のブロック図である。 /1−14−・・直線、w 1〜w 8−湾曲、(11
−・・白、+21−・・黒、(3)・・・入力文字、Q
])・・・光電変換部、に)・・・輪郭線抽出部、(ハ
)・・・基準パターン抽出部、に)・・・基準パターン
平行部抽出部、(ハ)・・・直線部分パターン演算部、
に)・・・湾曲部分パターン演算部、…・・・内部分パ
ターン演算部 代理人 森本義弘 第1図 第2図
Claims (1)
- 1、 白黒2値入力文字パターンの特徴を抽出してこの
入力文字のパターン構造を作成し、標準のパターン構造
とのマツチングを行うに際し、前記白黒2値入力文字パ
ターンからその文字の輪郭線を抽出し、前記輪郭線から
コーナ一点・変曲点を検出して直線、湾曲、円(ループ
)等基準パターンを抽出し、抽出されたこの基準パター
ンの対応関係から同一視される部分を抽出し、新しく直
線、湾曲、円(ループ)等の大まかな部分パターンを構
成する手書き文字認識における特徴抽出方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57085524A JPS58201183A (ja) | 1982-05-19 | 1982-05-19 | 手書き文字認識における特徴抽出方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57085524A JPS58201183A (ja) | 1982-05-19 | 1982-05-19 | 手書き文字認識における特徴抽出方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS58201183A true JPS58201183A (ja) | 1983-11-22 |
Family
ID=13861285
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57085524A Pending JPS58201183A (ja) | 1982-05-19 | 1982-05-19 | 手書き文字認識における特徴抽出方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS58201183A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6580826B1 (en) * | 1996-10-11 | 2003-06-17 | Lucent Technologies Inc. | Method and apparatus for parametric representation of handwritten symbols |
-
1982
- 1982-05-19 JP JP57085524A patent/JPS58201183A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6580826B1 (en) * | 1996-10-11 | 2003-06-17 | Lucent Technologies Inc. | Method and apparatus for parametric representation of handwritten symbols |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
| JPS58201183A (ja) | 手書き文字認識における特徴抽出方法 | |
| JP2868134B2 (ja) | 画像処理方法及び装置 | |
| JP2871590B2 (ja) | 画像抽出方式 | |
| JP2859681B2 (ja) | 指紋データの2値化方法 | |
| JP2006072758A (ja) | 指紋照合装置 | |
| JP2976426B2 (ja) | 文字認識装置 | |
| JP2002334301A (ja) | 2値イメージの特徴点抽出方法及び特徴点抽出プログラム | |
| JPS62282379A (ja) | 図形認識装置 | |
| JP2677007B2 (ja) | 線判別システム | |
| JPS6334682A (ja) | 文字認識装置 | |
| JPH0877293A (ja) | 文字認識装置および文字認識用辞書作成方法 | |
| JPS61125687A (ja) | パタ−ン抽出方式 | |
| JPH09114925A (ja) | 光学式文字読取装置 | |
| JP2001060250A (ja) | 文字認識方法および装置 | |
| JP2575402B2 (ja) | 文字認識方法 | |
| JP2732748B2 (ja) | ファジィパターン認識装置 | |
| JPS5814709B2 (ja) | 閉図形の形状認識方式 | |
| JPS63778A (ja) | パターン認識方法 | |
| JPH04112284A (ja) | 文字認識装置 | |
| JPH0981680A (ja) | 文字補完装置 | |
| Chianese et al. | Improving the use of contours and skeletons for off-line cursive script segmentation | |
| JPH01191988A (ja) | 文字認識方法 | |
| JPH0420221B2 (ja) | ||
| JPS5822479A (ja) | 文字認識装置 |