JPH04299483A - 特徴抽出装置 - Google Patents
特徴抽出装置Info
- Publication number
- JPH04299483A JPH04299483A JP3087823A JP8782391A JPH04299483A JP H04299483 A JPH04299483 A JP H04299483A JP 3087823 A JP3087823 A JP 3087823A JP 8782391 A JP8782391 A JP 8782391A JP H04299483 A JPH04299483 A JP H04299483A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- total number
- feature
- small area
- patterns
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims abstract description 17
- 238000004364 calculation method Methods 0.000 abstract description 2
- 238000000034 method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】本発明は、光学式文字読取り装置
などに利用される特徴抽出装置に関するものである。
などに利用される特徴抽出装置に関するものである。
【0002】
【従来の技術】光学式文字読取り装置(OCR)などに
利用される文字認識方法のうち、方向特徴を用いる認識
方法は、照合対象の文字パターン群のそれぞれから予め
方向特徴パターンを抽出して登録しておき、これらと認
識対象の文字パターンから抽出した方向特徴パターンと
を照合することにより文字認識を行うものである。この
方向特徴パターンを用いる文字認識方法の一つは、電子
通信学会論文誌 Vol.J 65 ーD No.5(
’82/5)に掲載された「手書漢字の方向パターン・
マッチング法による解析」と題する斎藤らの論文に記載
されている。上記論文によれば、方向特徴パターンの抽
出は、文字パターンの輪郭を追跡し着目する輪郭点の前
後に近接する2個の輪郭点を結ぶ微小輪郭線の方向を縦
、横、斜めの4方向に量子化したものをこの着目する輪
郭点の方向特徴パターンとして与えるものである。
利用される文字認識方法のうち、方向特徴を用いる認識
方法は、照合対象の文字パターン群のそれぞれから予め
方向特徴パターンを抽出して登録しておき、これらと認
識対象の文字パターンから抽出した方向特徴パターンと
を照合することにより文字認識を行うものである。この
方向特徴パターンを用いる文字認識方法の一つは、電子
通信学会論文誌 Vol.J 65 ーD No.5(
’82/5)に掲載された「手書漢字の方向パターン・
マッチング法による解析」と題する斎藤らの論文に記載
されている。上記論文によれば、方向特徴パターンの抽
出は、文字パターンの輪郭を追跡し着目する輪郭点の前
後に近接する2個の輪郭点を結ぶ微小輪郭線の方向を縦
、横、斜めの4方向に量子化したものをこの着目する輪
郭点の方向特徴パターンとして与えるものである。
【0003】また、他の方向特徴の抽出方法として、文
字パターンを1画の線幅に細線化した後、この細線化パ
ターンの各画素と周囲の画素との連結方向によって方向
特徴を抽出するものも知られている。
字パターンを1画の線幅に細線化した後、この細線化パ
ターンの各画素と周囲の画素との連結方向によって方向
特徴を抽出するものも知られている。
【0004】
【発明が解決しようとする課題】上記従来の方向特徴パ
ターンの抽出手法によれば、パターン領域を小領域群に
分割するか否かにかかわらず、微小輪郭線上の輪郭画素
について方向特徴パターンの算定が行われる。このため
、微小輪郭線の抽出とその上の輪郭画素についての方向
特徴パターンの抽出に多大の処理ステップが必要になり
、処理時間が長引くという問題がある。
ターンの抽出手法によれば、パターン領域を小領域群に
分割するか否かにかかわらず、微小輪郭線上の輪郭画素
について方向特徴パターンの算定が行われる。このため
、微小輪郭線の抽出とその上の輪郭画素についての方向
特徴パターンの抽出に多大の処理ステップが必要になり
、処理時間が長引くという問題がある。
【0005】
【課題を解決するための手段】本発明の特徴抽出装置は
、特徴抽出対象のパターンを含む二次元空間を横長、縦
長及び斜め方向に長い小領域に分割し各小領域内に存在
する黒又は白の画素の総数を方向特徴パターンとして抽
出する方向特徴パターン抽出部を備えている。
、特徴抽出対象のパターンを含む二次元空間を横長、縦
長及び斜め方向に長い小領域に分割し各小領域内に存在
する黒又は白の画素の総数を方向特徴パターンとして抽
出する方向特徴パターン抽出部を備えている。
【0006】本発明が特徴抽出の対象とするパターンは
、マトリクス状に配列された画素群から構成されている
。一例として、特徴抽出対象の文字パターンがマトリク
ス状に配列された32×32個の“1”又は“0”の画
素群から構成されるものとする。
、マトリクス状に配列された画素群から構成されている
。一例として、特徴抽出対象の文字パターンがマトリク
ス状に配列された32×32個の“1”又は“0”の画
素群から構成されるものとする。
【0007】この特徴抽出対象の文字パターンを含む二
次元空間が、図1(A)、(B)、(C)及び(D)に
例示するように、横長の64個の小領域A0〜A63、
縦長の64個の小領域B0 〜B63、右上がりの斜め
に長い小領域C0 〜C63及び左上がりの斜めに長い
64個の小領域D0 〜D63に分割される。そして、
各小領域についてその内部に含まれる黒画素(“1”)
の総数が計数される。
次元空間が、図1(A)、(B)、(C)及び(D)に
例示するように、横長の64個の小領域A0〜A63、
縦長の64個の小領域B0 〜B63、右上がりの斜め
に長い小領域C0 〜C63及び左上がりの斜めに長い
64個の小領域D0 〜D63に分割される。そして、
各小領域についてその内部に含まれる黒画素(“1”)
の総数が計数される。
【0008】図2(A)に例示するように、特徴抽出対
象のパターンを構成する横方向の線分が存在する領域で
は、横長の小領域Ai内に含まれる黒画素の総数が縦長
の小領域Bj、斜めに長い小領域Ck、D 内に含ま
れる黒画素の総数よりも多くなる。また、図2(B)に
例示するように、特徴抽出対象のパターンを構成する縦
方向の線分が存在する領域では、縦長の小領域Bj内に
含まれる黒画素の総数が横長の小領域や斜めに長い小領
域内に含まれる黒画素の総数に比べて多くなる。同様に
、図2(C)と(D)に例示するように、特徴抽出対象
の文字パターンを構成する右上がりや左上がりの斜めの
線分が存在する領域では、斜めに長い小領域CkとD
に含まれる黒画素の総数が他の三つの小領域内に含ま
れる画素デ−タの総数よりも多くなる。
象のパターンを構成する横方向の線分が存在する領域で
は、横長の小領域Ai内に含まれる黒画素の総数が縦長
の小領域Bj、斜めに長い小領域Ck、D 内に含ま
れる黒画素の総数よりも多くなる。また、図2(B)に
例示するように、特徴抽出対象のパターンを構成する縦
方向の線分が存在する領域では、縦長の小領域Bj内に
含まれる黒画素の総数が横長の小領域や斜めに長い小領
域内に含まれる黒画素の総数に比べて多くなる。同様に
、図2(C)と(D)に例示するように、特徴抽出対象
の文字パターンを構成する右上がりや左上がりの斜めの
線分が存在する領域では、斜めに長い小領域CkとD
に含まれる黒画素の総数が他の三つの小領域内に含ま
れる画素デ−タの総数よりも多くなる。
【0009】このように、横長、縦長及び斜めに長い小
領域のそれぞれについて内部に含まれる黒画素の総数を
算定することにより、文字パターンを構成する線分の方
向性、すなわち方向特徴パターンを容易に検出すること
ができる。
領域のそれぞれについて内部に含まれる黒画素の総数を
算定することにより、文字パターンを構成する線分の方
向性、すなわち方向特徴パターンを容易に検出すること
ができる。
【0010】横長の小領域A0 〜A63について算定
された黒画素の総数LA0 〜LA63は、図3(A)
に示すような方向特徴パターンとして保存される。同様
に、縦長の小領域B0 〜B63について算定された黒
画素の総数LB0 〜LB63、右上がりの斜め方向の
小領域C0 〜C63について算定された黒画素の総数
LC0 〜LC63、左下がりの斜め方向小領域D0
〜D63について算定された黒画素の総数LD0 〜L
D63も、それぞれ図3(B)、(C)及び(D)に示
すように、方向特徴パターンとして保存される。
された黒画素の総数LA0 〜LA63は、図3(A)
に示すような方向特徴パターンとして保存される。同様
に、縦長の小領域B0 〜B63について算定された黒
画素の総数LB0 〜LB63、右上がりの斜め方向の
小領域C0 〜C63について算定された黒画素の総数
LC0 〜LC63、左下がりの斜め方向小領域D0
〜D63について算定された黒画素の総数LD0 〜L
D63も、それぞれ図3(B)、(C)及び(D)に示
すように、方向特徴パターンとして保存される。
【0011】以下、上述の方向特徴を文字認識方法に利
用する場合について説明する。
用する場合について説明する。
【0012】特徴抽出対象のパターンと照合される複数
の登録文字パターンについても、図3(A)〜(D)と
同様な各小領域内の黒画素の総数に基づく方向特徴パタ
ーンが予め作成されている。この方向特徴パターンに基
づくパターン照合に際しては、例えば、各小領域内の黒
画素の総数の差分の総和、ΣδLAi+ΣδLBi +
ΣδLCi +ΣδLDi が算定され、この値が小さ
いほど高い優先順位の認識候補となる。
の登録文字パターンについても、図3(A)〜(D)と
同様な各小領域内の黒画素の総数に基づく方向特徴パタ
ーンが予め作成されている。この方向特徴パターンに基
づくパターン照合に際しては、例えば、各小領域内の黒
画素の総数の差分の総和、ΣδLAi+ΣδLBi +
ΣδLCi +ΣδLDi が算定され、この値が小さ
いほど高い優先順位の認識候補となる。
【0013】あるいはまた、各小領域内の黒画素の総数
についてのユークリッド距離としてΣ(δLAi )2
+Σ(δLBi )2 +Σ(δLCi )2 +Σ
(δLDi )2 の平方根が算定され、この値が小さ
いほど高い優先順位の認識候補となる。
についてのユークリッド距離としてΣ(δLAi )2
+Σ(δLBi )2 +Σ(δLCi )2 +Σ
(δLDi )2 の平方根が算定され、この値が小さ
いほど高い優先順位の認識候補となる。
【0014】さらには、横長、縦長、斜め方向に長い4
種類の64個の小領域(合計256個の小領域)に対応
した256次元の空間が想定され、各小領域内の画素数
の総和を長さとする256次元の方向特徴ベクトルが想
定される。ここで、類似度は内積を距離で除算すること
によって求められる。
種類の64個の小領域(合計256個の小領域)に対応
した256次元の空間が想定され、各小領域内の画素数
の総和を長さとする256次元の方向特徴ベクトルが想
定される。ここで、類似度は内積を距離で除算すること
によって求められる。
【0015】
【実施例】図4は、本発明の一実施例の特徴抽出装置を
文字認識装置に適用した場合の構成を示すブロック図で
あり、以下この例に従って説明する。1はCPU、2は
文字パターンメモリ、3は方向特徴パターンメモリ、4
は登録方向特徴パターンメモリである。
文字認識装置に適用した場合の構成を示すブロック図で
あり、以下この例に従って説明する。1はCPU、2は
文字パターンメモリ、3は方向特徴パターンメモリ、4
は登録方向特徴パターンメモリである。
【0016】文字パターンメモリ2には、特徴抽出対象
、すなわち認識対象の文字パターンがサイズの規格化を
受けた状態で保持される。CPU1は、文字パターンメ
モリ2内の文字パターンの保持領域を横長、縦長などの
各小領域に分割して各小領域内を走査することにより画
素デ−タを読出して“1”(黒画素)の総数を算定する
。CPU1は、この算定結果を、第3図に例示するよう
な方向特徴パターンとして方向特徴パターンメモリ3に
書込む。CPU1は、この方向特徴パターンの抽出が終
了すると、登録方向特徴パターンメモリ4に登録中の照
合対象の方向特徴パターンを一つずつ読出してメモリ3
に保持中の抽出済みの方向特徴パターンと照合する。 この照合は、前述したように、ユークリッド距離などに
基づいて行われ、最少距離の登録方向特徴パターンに該
当する文字パターンが認識結果として選択される。
、すなわち認識対象の文字パターンがサイズの規格化を
受けた状態で保持される。CPU1は、文字パターンメ
モリ2内の文字パターンの保持領域を横長、縦長などの
各小領域に分割して各小領域内を走査することにより画
素デ−タを読出して“1”(黒画素)の総数を算定する
。CPU1は、この算定結果を、第3図に例示するよう
な方向特徴パターンとして方向特徴パターンメモリ3に
書込む。CPU1は、この方向特徴パターンの抽出が終
了すると、登録方向特徴パターンメモリ4に登録中の照
合対象の方向特徴パターンを一つずつ読出してメモリ3
に保持中の抽出済みの方向特徴パターンと照合する。 この照合は、前述したように、ユークリッド距離などに
基づいて行われ、最少距離の登録方向特徴パターンに該
当する文字パターンが認識結果として選択される。
【0017】以上、抽出された方向特徴パターンを直ち
に登録中の方向特徴パターンと照合する構成を例示した
。しかしながら、抽出された方向特徴パターンをその特
徴に基づき一旦分類したのち、各分類について登録され
ている方向特徴パターンと照合する構成とすることもで
きる。また、方向特徴パターンを登録しておかずに、上
記分類を適宜な段数にわたって繰り返してゆくことによ
り認識を行う構成とすることもできる。
に登録中の方向特徴パターンと照合する構成を例示した
。しかしながら、抽出された方向特徴パターンをその特
徴に基づき一旦分類したのち、各分類について登録され
ている方向特徴パターンと照合する構成とすることもで
きる。また、方向特徴パターンを登録しておかずに、上
記分類を適宜な段数にわたって繰り返してゆくことによ
り認識を行う構成とすることもできる。
【0018】また、方向特徴パターンの抽出に際し各処
理領域内の黒画素の総数を計数する構成を例示した。し
かしながら、黒画素の代わりに白画素の総数を計数し、
同じく白画素について作成済みの登録パターンと照合す
る構成とすることもできる。
理領域内の黒画素の総数を計数する構成を例示した。し
かしながら、黒画素の代わりに白画素の総数を計数し、
同じく白画素について作成済みの登録パターンと照合す
る構成とすることもできる。
【0019】
【発明の効果】以上詳細に説明したように、本発明の特
徴抽出装置は、特徴抽出対象のパターンを含む二次元空
間を横長、縦長及び斜め方向に長い小領域に分割し各小
領域内に存在する画素デ−タの総数を方向特徴パターン
として抽出する方向特徴パターン抽出部を備えているの
で、従来装置と異なり微小輪郭線の抽出とその上の輪郭
画素についての方向特徴パターンの算定が不要となり、
処理ステップと処理時間が大幅に短縮されるという効果
が奏される。
徴抽出装置は、特徴抽出対象のパターンを含む二次元空
間を横長、縦長及び斜め方向に長い小領域に分割し各小
領域内に存在する画素デ−タの総数を方向特徴パターン
として抽出する方向特徴パターン抽出部を備えているの
で、従来装置と異なり微小輪郭線の抽出とその上の輪郭
画素についての方向特徴パターンの算定が不要となり、
処理ステップと処理時間が大幅に短縮されるという効果
が奏される。
【図1】本発明の構成と作用を説明するための概念図で
ある。
ある。
【図2】本発明の構成と作用を説明するための概念図で
ある。
ある。
【図3】本発明の構成と作用を説明するための概念図で
ある。
ある。
【図4】本発明の一実施例の文字認識装置の構成を示す
ブロック図である。
ブロック図である。
Claims (1)
- 【請求項1】特徴抽出対象のパターンを含む二次元空間
を横長、縦長及び斜め方向に長い小領域に分割し各小領
域内に存在する黒又は白の画素の総数を方向特徴パター
ンとして抽出する方向特徴パターン抽出部を備えたこと
を特徴とする特徴抽出装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3087823A JPH04299483A (ja) | 1991-03-27 | 1991-03-27 | 特徴抽出装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3087823A JPH04299483A (ja) | 1991-03-27 | 1991-03-27 | 特徴抽出装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH04299483A true JPH04299483A (ja) | 1992-10-22 |
Family
ID=13925678
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3087823A Pending JPH04299483A (ja) | 1991-03-27 | 1991-03-27 | 特徴抽出装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH04299483A (ja) |
-
1991
- 1991-03-27 JP JP3087823A patent/JPH04299483A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN107247950A (zh) | 一种基于机器学习的身份证图像文本识别方法 | |
| CN111461131B (zh) | 身份证号码信息识别方法、装置、设备及存储介质 | |
| JPH01253077A (ja) | 文字列検出方法 | |
| US5841905A (en) | Business form image identification using projected profiles of graphical lines and text string lines | |
| CN107437084B (zh) | 一种脱机手写体文本识别的字符重心定位方法 | |
| CN115830607B (zh) | 基于人工智能的文本识别方法、装置、计算机设备及介质 | |
| Ali et al. | A holistic method to recognize characters in natural scenes | |
| JPH04299483A (ja) | 特徴抽出装置 | |
| JP3009237B2 (ja) | 特徴抽出方法 | |
| JP2005149395A (ja) | 文字認識装置、ナンバープレート認識システム | |
| CN108073927B (zh) | 一种字符识别方法及装置 | |
| JPS5951033B2 (ja) | 図形基本要素抽出装置 | |
| JP2605807B2 (ja) | 特徴抽出方式 | |
| JPH03175591A (ja) | 文字認識装置 | |
| JP2797523B2 (ja) | 図面続取装置 | |
| JP3104355B2 (ja) | 特徴抽出装置 | |
| JPH0449148B2 (ja) | ||
| JPH11120291A (ja) | パタン認識システム | |
| KR950001594B1 (ko) | 이치화된 영상의 고속 영역 분할 추출방법 | |
| JP2002251613A (ja) | 図形認識方法及び装置 | |
| JPH0545992B2 (ja) | ||
| JPH0145669B2 (ja) | ||
| JP2974167B2 (ja) | 文字の大分類認識方法 | |
| JPH0877293A (ja) | 文字認識装置および文字認識用辞書作成方法 | |
| JP2832035B2 (ja) | 文字認識装置 |