JPH0545990B2 - - Google Patents
Info
- Publication number
- JPH0545990B2 JPH0545990B2 JP58109188A JP10918883A JPH0545990B2 JP H0545990 B2 JPH0545990 B2 JP H0545990B2 JP 58109188 A JP58109188 A JP 58109188A JP 10918883 A JP10918883 A JP 10918883A JP H0545990 B2 JPH0545990 B2 JP H0545990B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- sub
- scanning
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 239000000284 extract Substances 0.000 claims description 10
- 238000000034 method Methods 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 4
- 238000003491 array Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 description 18
- 239000011159 matrix material Substances 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
(技術分野)
本発明は高速で精度の良い特徴抽出方法に関す
るものである。
るものである。
(背景技術)
従来文字図形認識装置に於ては、文字図形パタ
ーンよりストロークを抽出し、それら抽出された
ストロークの位置、長さ、ストローク間の相互関
係等を用いて認識する方式が多く採用されてい
る。この種の装置においては、(1)文字図形の輪郭
を追跡することにより検出された輪郭点系列につ
いて曲率を計算し、その曲率の大きな値の点を分
割点として輪郭系列を分割し、分割された系列を
組合わせることによりストロークを抽出するか、
又は(2)文字図形パターンに細線化処理を行なつて
骨格化し、その骨格パターンの連結性及び骨格パ
ターンを追跡し急激な角度の変化点等を検出して
ストロークを抽出し、該抽出されたストロークに
ついて幾何学的な特徴等を抽出し文字図形の認識
を行なつていた。しかしながら、(1)の方法は、文
字図形パターンが大きくなり又文字図形パターン
が複雑化すると、その処理量が増大しそのため処
理速度の低下を招き、(2)の方法は、文字図形パタ
ーンを細線化する必要があり又その細線化による
パターンのひずみ、ヒゲ等の問題があり、その後
の処理が複雑なものとなる欠点がある。
ーンよりストロークを抽出し、それら抽出された
ストロークの位置、長さ、ストローク間の相互関
係等を用いて認識する方式が多く採用されてい
る。この種の装置においては、(1)文字図形の輪郭
を追跡することにより検出された輪郭点系列につ
いて曲率を計算し、その曲率の大きな値の点を分
割点として輪郭系列を分割し、分割された系列を
組合わせることによりストロークを抽出するか、
又は(2)文字図形パターンに細線化処理を行なつて
骨格化し、その骨格パターンの連結性及び骨格パ
ターンを追跡し急激な角度の変化点等を検出して
ストロークを抽出し、該抽出されたストロークに
ついて幾何学的な特徴等を抽出し文字図形の認識
を行なつていた。しかしながら、(1)の方法は、文
字図形パターンが大きくなり又文字図形パターン
が複雑化すると、その処理量が増大しそのため処
理速度の低下を招き、(2)の方法は、文字図形パタ
ーンを細線化する必要があり又その細線化による
パターンのひずみ、ヒゲ等の問題があり、その後
の処理が複雑なものとなる欠点がある。
(発明の課題)
本発明の目的はこれらの欠点を改善するもの
で、文字図形パターンの所望の方向のストローク
成分を表わすサブパターンを抽出し、サブパター
ンについて文字外接枠の辺上の点から走査して走
査線上のすべての文字線の位置を検出し、走査開
始点と文字線との距離を前記走査方向の文字外接
枠の大きさで正規化して抽出するN乗和の辺単位
の配列を分割して特徴ベクトル群を抽出すること
を特徴とし、その目的は高速で安定な文字認識方
法を提供することにある。
で、文字図形パターンの所望の方向のストローク
成分を表わすサブパターンを抽出し、サブパター
ンについて文字外接枠の辺上の点から走査して走
査線上のすべての文字線の位置を検出し、走査開
始点と文字線との距離を前記走査方向の文字外接
枠の大きさで正規化して抽出するN乗和の辺単位
の配列を分割して特徴ベクトル群を抽出すること
を特徴とし、その目的は高速で安定な文字認識方
法を提供することにある。
(発明の構成および作用)
第1図は本発明の文字認識装置における実施
例、第2図はサブパターン例、第3図は特徴抽出
例を示す。
例、第2図はサブパターン例、第3図は特徴抽出
例を示す。
第1図中1は光電変換部、2はパターンレジス
タ、3は線幅計算部、4はサブパターン抽出部、
5は文字枠検出部、6は特徴抽出部、7は特徴マ
トリクス抽出部、8は識別部、9は文字名出力で
ある。
タ、3は線幅計算部、4はサブパターン抽出部、
5は文字枠検出部、6は特徴抽出部、7は特徴マ
トリクス抽出部、8は識別部、9は文字名出力で
ある。
本実施例の動作は、読取機構にセツトされた帳
票上の文字は光電変換部1において2値の量子化
されたデイジタル電気信号に変換され、パターン
レジスタ2に格納される。それと同時に、線幅計
算部3において入力パターンの線幅(W)が計算
される。サブパターン抽出部4は、パターンレジ
スタについて垂直スキヤンを全面行なつて、黒ビ
ツトの連続長さと線幅計算部3において計算され
た線幅との関係より垂直サブパターン(VSP)
を抽出する。同様に、水平スキヤンにより水平サ
ブパターン(HSP)を、右斜め45°スキヤンによ
り右斜めサブパターン(RSP)を、左斜め45°ス
キヤンにより左斜めサブパターン(LSP)を抽出
する。第2図は原パターンと各サブパターンの例
でaは原パターン、bは垂直サブパターン
(VSP)、cは水平サブパターン(HSP)、dは右
斜めサブパターン(RSP)、eは左斜めサブパタ
ーン(LSP)である。文字枠検出部5は、パター
ンレジスタ内の文字図形パターンに外接する方形
の枠(以後文字枠と称する)を検出し、パターン
レジスタで定義される2次元平面における前記文
字枠を規定する為の位置座標を特徴抽出部6へ送
出する。以後の説明においては文字枠の左下を原
点とし、水平方向をX軸、垂直方向をY軸とする
座標系を使用する。特徴抽出部6は、まず垂直サ
ブパターンについて、文字枠を構成する4辺のう
ち垂直な辺である左辺上の点P(0,y)から水
平走査を開始し、白点から黒点への変化点をすべ
て検出し、検出した変化点と前記走査を開始した
垂直辺上の点Pとの間の距離すなわちX座標の差
を文字枠のX方向の長さを正規化定数として正規
化した値のN乗(Nは定数、本実施例ではN=
2)の値の計算を前記検出したすべての変化点に
ついて行ない、その総和を配列Vl(y)に格納す
る。但し前記白点とは文字背景部を表わし、黒点
とは文字線部を表わす。また式(1)は前記のVl(y)
を式で表わしたものであり△Xkはそれぞれの変
化点と文字枠辺上の走査開始点との距離を示し、
k=1,……,K,Kは検出された変化点個数を
表わす。又、式(1)中の△Xは文字枠の水平方向の
長さであり、Cは整数化定数であり本実施例にお
いてはC=50とした。
票上の文字は光電変換部1において2値の量子化
されたデイジタル電気信号に変換され、パターン
レジスタ2に格納される。それと同時に、線幅計
算部3において入力パターンの線幅(W)が計算
される。サブパターン抽出部4は、パターンレジ
スタについて垂直スキヤンを全面行なつて、黒ビ
ツトの連続長さと線幅計算部3において計算され
た線幅との関係より垂直サブパターン(VSP)
を抽出する。同様に、水平スキヤンにより水平サ
ブパターン(HSP)を、右斜め45°スキヤンによ
り右斜めサブパターン(RSP)を、左斜め45°ス
キヤンにより左斜めサブパターン(LSP)を抽出
する。第2図は原パターンと各サブパターンの例
でaは原パターン、bは垂直サブパターン
(VSP)、cは水平サブパターン(HSP)、dは右
斜めサブパターン(RSP)、eは左斜めサブパタ
ーン(LSP)である。文字枠検出部5は、パター
ンレジスタ内の文字図形パターンに外接する方形
の枠(以後文字枠と称する)を検出し、パターン
レジスタで定義される2次元平面における前記文
字枠を規定する為の位置座標を特徴抽出部6へ送
出する。以後の説明においては文字枠の左下を原
点とし、水平方向をX軸、垂直方向をY軸とする
座標系を使用する。特徴抽出部6は、まず垂直サ
ブパターンについて、文字枠を構成する4辺のう
ち垂直な辺である左辺上の点P(0,y)から水
平走査を開始し、白点から黒点への変化点をすべ
て検出し、検出した変化点と前記走査を開始した
垂直辺上の点Pとの間の距離すなわちX座標の差
を文字枠のX方向の長さを正規化定数として正規
化した値のN乗(Nは定数、本実施例ではN=
2)の値の計算を前記検出したすべての変化点に
ついて行ない、その総和を配列Vl(y)に格納す
る。但し前記白点とは文字背景部を表わし、黒点
とは文字線部を表わす。また式(1)は前記のVl(y)
を式で表わしたものであり△Xkはそれぞれの変
化点と文字枠辺上の走査開始点との距離を示し、
k=1,……,K,Kは検出された変化点個数を
表わす。又、式(1)中の△Xは文字枠の水平方向の
長さであり、Cは整数化定数であり本実施例にお
いてはC=50とした。
Vl(y)=K
〓k=1
{△xk/△X×C}2 ……(1)
上記の様な処理を文字枠の2つの垂直辺上のす
べての点を開始点として行ない、垂直サブパター
ンについて、文字枠の左辺上の点から水平走査を
開始して作成する配列Vl(i)、文字枠の右辺上の
点から水平走査を開始して作成する配列Vr(i)
を抽出する。但しi=0,……,YT,YTは文
字枠上辺のY座標である。同様な処理により、水
平サブパターン、右斜めサブパターン、左斜めサ
ブパターンについては文字枠の2個の水平辺上の
すべての点から垂直走査を行なつて、水平サブパ
ターンについて配列Hb(j),Ht(j)、右斜めサ
ブパターンについての配列Rb(j),Rt(j)、左
斜めサブパターンについての配列Lb(j),Lt(j)
を抽出する。但しj=0,……,XR,XRは文
字枠右辺のX座標である。前記水平サブパター
ン、右斜めサブパターン、左斜めサブパターンに
ついて抽出する配列の添字bは文字枠の水平な下
辺上の点を開始点としたものを表わしtは水平な
上辺上の点を開始点としたものを表わす。又、
Hb(j),Ht(j),Rb(j),Rt(j),Lb(j),
Lt
(j)を抽出する際における走査開始点と白点か
ら黒点への変化点との距離の正規化定数としては
文字枠の垂直方向の長さ△Yを使用した。特徴マ
トリクス抽出部7は特徴抽出部6において抽出さ
れた8種の配列を使用し、各配列をM個(Mは定
数、本実施例ではM=7)に分割し、分割された
配列の同一分割単位内の配列の値の平均値を計算
することによりM×8次元の特徴マトリクスF
(m,n)を抽出する。但しm=1,……,M,
n=1,……,8である。識別部8は特徴マトリ
クス抽出部7で抽出された特徴マトリクスと、同
形式で記述された標準文字マスクf(m,n)と
の間の式(2)で示される距離(D)を計算しその距
離が最も小さい値を与える標準文字マスクのカテ
ゴリ名を文字名出力9へ出力する。
べての点を開始点として行ない、垂直サブパター
ンについて、文字枠の左辺上の点から水平走査を
開始して作成する配列Vl(i)、文字枠の右辺上の
点から水平走査を開始して作成する配列Vr(i)
を抽出する。但しi=0,……,YT,YTは文
字枠上辺のY座標である。同様な処理により、水
平サブパターン、右斜めサブパターン、左斜めサ
ブパターンについては文字枠の2個の水平辺上の
すべての点から垂直走査を行なつて、水平サブパ
ターンについて配列Hb(j),Ht(j)、右斜めサ
ブパターンについての配列Rb(j),Rt(j)、左
斜めサブパターンについての配列Lb(j),Lt(j)
を抽出する。但しj=0,……,XR,XRは文
字枠右辺のX座標である。前記水平サブパター
ン、右斜めサブパターン、左斜めサブパターンに
ついて抽出する配列の添字bは文字枠の水平な下
辺上の点を開始点としたものを表わしtは水平な
上辺上の点を開始点としたものを表わす。又、
Hb(j),Ht(j),Rb(j),Rt(j),Lb(j),
Lt
(j)を抽出する際における走査開始点と白点か
ら黒点への変化点との距離の正規化定数としては
文字枠の垂直方向の長さ△Yを使用した。特徴マ
トリクス抽出部7は特徴抽出部6において抽出さ
れた8種の配列を使用し、各配列をM個(Mは定
数、本実施例ではM=7)に分割し、分割された
配列の同一分割単位内の配列の値の平均値を計算
することによりM×8次元の特徴マトリクスF
(m,n)を抽出する。但しm=1,……,M,
n=1,……,8である。識別部8は特徴マトリ
クス抽出部7で抽出された特徴マトリクスと、同
形式で記述された標準文字マスクf(m,n)と
の間の式(2)で示される距離(D)を計算しその距
離が最も小さい値を与える標準文字マスクのカテ
ゴリ名を文字名出力9へ出力する。
D=√{(,)−(,)}2 ……(2)
(発明の効果)
以上説明した様に、本実施例の特徴マトリクス
抽出部において抽出された特徴マトリクスは、文
字図形パターンのストロークの位置、長さ、方向
等を表わすもので、文字特有な性質を表現してい
る。又、図3に2種の形が類似した文字パターン
と特徴抽出部で抽出する配列を図形的に表現した
例において観察されるように、文字の局所的な違
いが前記配列に充分に反映されるので認識精度の
向上を図ることができる。又、特徴抽出部におい
て各配列を作成する際に、走査を開始した文字枠
辺上の点と文字線との距離を文字枠の当該走査方
向の大きさで正規化しているので手書文字におい
て特有な筆者の違いによる文字の大きさの変動等
を吸収することができるので精度の良い認識が可
能である。又、文字図形パターンからの特徴抽出
を単純な走査という処理により実現しているので
高度な認識が可能であり、装置の小型化を図るこ
ともできる利点がある。
抽出部において抽出された特徴マトリクスは、文
字図形パターンのストロークの位置、長さ、方向
等を表わすもので、文字特有な性質を表現してい
る。又、図3に2種の形が類似した文字パターン
と特徴抽出部で抽出する配列を図形的に表現した
例において観察されるように、文字の局所的な違
いが前記配列に充分に反映されるので認識精度の
向上を図ることができる。又、特徴抽出部におい
て各配列を作成する際に、走査を開始した文字枠
辺上の点と文字線との距離を文字枠の当該走査方
向の大きさで正規化しているので手書文字におい
て特有な筆者の違いによる文字の大きさの変動等
を吸収することができるので精度の良い認識が可
能である。又、文字図形パターンからの特徴抽出
を単純な走査という処理により実現しているので
高度な認識が可能であり、装置の小型化を図るこ
ともできる利点がある。
本発明は、文字図形パターンから各方向のスト
ローク成分を抽出したサブパターンを垂直又は水
平に走査し、文字枠辺と文字線との距離を当該走
査方向の文字枠の大きさで正規化した値のN乗和
を特徴としているので、複雑な処理を必要とせず
又、手書文字の変形に追従して安定に特徴を抽出
しているので高速で精度の良い文字認識装置に利
用することができる。
ローク成分を抽出したサブパターンを垂直又は水
平に走査し、文字枠辺と文字線との距離を当該走
査方向の文字枠の大きさで正規化した値のN乗和
を特徴としているので、複雑な処理を必要とせず
又、手書文字の変形に追従して安定に特徴を抽出
しているので高速で精度の良い文字認識装置に利
用することができる。
第1図は本発明の文字認識装置における実施
例、第2図a〜eはサブパターン例を示す図、第
3図は特徴例を示す図である。 1……光電変換部、2……パターンレジスタ、
3……線幅計算部、4……サブパターン抽出部、
5……文字枠検出部、6……特徴抽出部、7……
特徴マトリクス抽出部、8……識別部、9……文
字名出力。
例、第2図a〜eはサブパターン例を示す図、第
3図は特徴例を示す図である。 1……光電変換部、2……パターンレジスタ、
3……線幅計算部、4……サブパターン抽出部、
5……文字枠検出部、6……特徴抽出部、7……
特徴マトリクス抽出部、8……識別部、9……文
字名出力。
Claims (1)
- 1 文字図形パターンを所望の方向に走査して、
当該走査方向における文字線の断面を検出し、断
面長が前記文字図形パターンの文字線幅より十分
長い断面を抽出することにより行なうサブパター
ンの抽出を複数の方向について行ない、抽出した
それぞれのサブパターンについて、前記文字図形
パターンの文字外接枠の辺上の点を開始点として
所定の方向へ走査し、走査線上におけるすべての
文字線の位置を検出し、走査を開始した辺上の点
と、前記検出した文字線との距離を前記文字外接
枠の前記所定の方向の大きさで正規化した値のN
乗和(Nは定数)を抽出する処理を、前記サブパ
ターン毎に、又前記文字外接枠の4辺のうち少な
くとも2辺以上の辺上のすべての点を開始点とし
て、走査線を単位として行なつて、各サブパター
ン毎に文字外接枠の辺を単位とした前記走査線毎
のN乗和の配列を抽出し、抽出した前記N乗和の
配列をそれぞれM個(Mは定数)に分割し、各分
割単位内の前記N乗和の平均値を計算したもの
を、それぞれの配列からM次元の特徴ベクトルと
して抽出することにより、前記文字図形パターン
についての特徴ベクトル群を抽出し、抽出した特
徴ベクトル群と同形式で表現された辞書と照合す
ることにより文字を認識することを特徴とする文
字認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58109188A JPS603071A (ja) | 1983-06-20 | 1983-06-20 | 文字認識方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58109188A JPS603071A (ja) | 1983-06-20 | 1983-06-20 | 文字認識方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS603071A JPS603071A (ja) | 1985-01-09 |
| JPH0545990B2 true JPH0545990B2 (ja) | 1993-07-12 |
Family
ID=14503864
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58109188A Granted JPS603071A (ja) | 1983-06-20 | 1983-06-20 | 文字認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS603071A (ja) |
-
1983
- 1983-06-20 JP JP58109188A patent/JPS603071A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS603071A (ja) | 1985-01-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0545990B2 (ja) | ||
| JPH0545991B2 (ja) | ||
| JPH0545993B2 (ja) | ||
| JPS5837780A (ja) | 文字認識方式 | |
| JPH0545992B2 (ja) | ||
| JPS62154079A (ja) | 文字認識方式 | |
| JPS6019287A (ja) | 文字認識方法 | |
| JPS62125485A (ja) | 文字認識方式 | |
| JPS6318787B2 (ja) | ||
| JPH0420228B2 (ja) | ||
| JPH01152586A (ja) | 文字図形認識方法 | |
| JPS62157983A (ja) | 文字認識方式 | |
| JPS6262392B2 (ja) | ||
| JPH0475553B2 (ja) | ||
| JPS6262393B2 (ja) | ||
| JPS6363952B2 (ja) | ||
| JPS59140589A (ja) | 輪郭抽出装置 | |
| JPS62114080A (ja) | 文字認識方式 | |
| JPH01152585A (ja) | 特徴抽出方法 | |
| JPH0420227B2 (ja) | ||
| JPH0547871B2 (ja) | ||
| JPH0276084A (ja) | 高速文字図形分離装置 | |
| JPS5953969A (ja) | 線図形ベクトル化方式 | |
| JPS6038756B2 (ja) | 文字認識方式 | |
| JPH01196657A (ja) | 文書構造認識方法 |