JPS63779A - パターン認識方法 - Google Patents
パターン認識方法Info
- Publication number
- JPS63779A JPS63779A JP61144487A JP14448786A JPS63779A JP S63779 A JPS63779 A JP S63779A JP 61144487 A JP61144487 A JP 61144487A JP 14448786 A JP14448786 A JP 14448786A JP S63779 A JPS63779 A JP S63779A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- dictionary
- feature vector
- character
- components
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔技術分野〕
本発明は文字などのパターンの認識方式に関し、さらに
詳細には、多層方向ヒストグラム法によるパターン認識
方式に関する。
詳細には、多層方向ヒストグラム法によるパターン認識
方式に関する。
本出願人は、特願昭第59−202822号。
特願昭第58−202825号などによって、多層方向
ヒストグラム法によるパターン認識方式を既に提案して
いる。本発明は、このようなパターン認識方式の改良に
関するものである。
ヒストグラム法によるパターン認識方式を既に提案して
いる。本発明は、このようなパターン認識方式の改良に
関するものである。
この多層方向ヒストグラム法によるパターン認識方式に
おいては1文字などのパターンの輪郭画素に方向コード
を付け、そのパターンの枠の各辺から対向する辺に向か
ってパターンを走査して白画素(背景)の次に出現する
方向コードを検出し。
おいては1文字などのパターンの輪郭画素に方向コード
を付け、そのパターンの枠の各辺から対向する辺に向か
ってパターンを走査して白画素(背景)の次に出現する
方向コードを検出し。
その方向コードをそれが走査線上で何番目に検出された
かによって複数の層に層別する。そして、パターンの枠
内の分割領域毎に、ある層までの層別の方向コードのヒ
ストグラムを求め、それぞれのヒストグラムを成分(特
徴量)としたベクトルを、パターンの特徴ベクトルとし
て用いる。
かによって複数の層に層別する。そして、パターンの枠
内の分割領域毎に、ある層までの層別の方向コードのヒ
ストグラムを求め、それぞれのヒストグラムを成分(特
徴量)としたベクトルを、パターンの特徴ベクトルとし
て用いる。
例えば、方向コードとして8種類のコードを付け、パタ
ーン枠内を4×4のメツシュ領域に分割し、第1層およ
び第2層の方向コードまでを対象とすると、特徴ベクト
ルの次元数は256 (=4X4X2X8)となる。
ーン枠内を4×4のメツシュ領域に分割し、第1層およ
び第2層の方向コードまでを対象とすると、特徴ベクト
ルの次元数は256 (=4X4X2X8)となる。
辞書に関しては、同一パターンとしての複数のパターン
から同様の特徴ベクトルを抽出し、その平均を辞書パタ
ーン(標準パターン)の特徴ベクトルとして登録する。
から同様の特徴ベクトルを抽出し、その平均を辞書パタ
ーン(標準パターン)の特徴ベクトルとして登録する。
また、本出願人は、層別のための走査方向も加味してさ
らに詳細に方向コードを層別する同様のパターン認識方
式に既に提案している。本発明は、このパターン認識方
式にも同様に適用できるものである。
らに詳細に方向コードを層別する同様のパターン認識方
式に既に提案している。本発明は、このパターン認識方
式にも同様に適用できるものである。
さらに、パターン枠内の領域分割の方法は、前記先願の
明細書および図面に開示した方法に限らない。例えば、
前記先願のパターン認識方式と同様に、方向コードが均
等に分配されるようにパターン枠内をメツシュ分割し、
そのメツシュ領域を予め設定されたパラメータに従って
部分的に重ね合わせて、少ない領域に統合するような方
法を採用してもよい。このような領域分割方法を採用し
た多層方向ヒストグラム法によるパターン認識方式は、
本出願人により提案済みであるが、このようなパターン
認識方式にも、本発明は同様に適用し得るものである。
明細書および図面に開示した方法に限らない。例えば、
前記先願のパターン認識方式と同様に、方向コードが均
等に分配されるようにパターン枠内をメツシュ分割し、
そのメツシュ領域を予め設定されたパラメータに従って
部分的に重ね合わせて、少ない領域に統合するような方
法を採用してもよい。このような領域分割方法を採用し
た多層方向ヒストグラム法によるパターン認識方式は、
本出願人により提案済みであるが、このようなパターン
認識方式にも、本発明は同様に適用し得るものである。
さて、このような多層方向ヒストグラム法によるパター
ン認識方式においては、未知パターンがら抽出された特
徴ベクトルと、辞書パターンの特徴ベクトルとの対応次
元成分の距離または類似度の演算によって未知パターン
と辞書パターンとのマツチングを行い、距離の総和が最
小の辞書パターンまたは類似度の総和が最大の辞書パタ
ーンを認識結果とする。
ン認識方式においては、未知パターンがら抽出された特
徴ベクトルと、辞書パターンの特徴ベクトルとの対応次
元成分の距離または類似度の演算によって未知パターン
と辞書パターンとのマツチングを行い、距離の総和が最
小の辞書パターンまたは類似度の総和が最大の辞書パタ
ーンを認識結果とする。
しかし、前記のように特徴ベクトルの次元数が大きくな
ると、距離または類似度の演算量が多く、マツチング時
間が長くなり、また辞書容量が大きくなるという問題が
あった。
ると、距離または類似度の演算量が多く、マツチング時
間が長くなり、また辞書容量が大きくなるという問題が
あった。
したがって本発明の目的は、多層方向ヒストグラム法に
よるパターン認識方式において、マツチングの効率化お
よび辞書容量の削除を図ることにある。
よるパターン認識方式において、マツチングの効率化お
よび辞書容量の削除を図ることにある。
多層方向ヒストグラム法による特徴ベクトルは、パター
ン識別効果の大きい次元の成分と、その効果がそれほど
顕著でない次元の成分とがある。これに関し、説明を簡
単にするために、2次元の特徴ベクトルを考える。
ン識別効果の大きい次元の成分と、その効果がそれほど
顕著でない次元の成分とがある。これに関し、説明を簡
単にするために、2次元の特徴ベクトルを考える。
次元数を2として多層方向ヒストグラム法による辞書を
作成した場合、″文″′、″字″、“認″。
作成した場合、″文″′、″字″、“認″。
11 m l+のそれぞれの辞書パターンの特徴ベクト
ルは、それぞれ第5図のg工r gzr gzr g4
のようになる。この例では1図から明らかなように、各
特徴ベクトルは成分(特徴量)Aのほうが、成分(特徴
量)Bよりも分散(または標準偏差)が大きい。換言す
れば、成分Aのほうが、未知パターンに対する識別能力
が高い。
ルは、それぞれ第5図のg工r gzr gzr g4
のようになる。この例では1図から明らかなように、各
特徴ベクトルは成分(特徴量)Aのほうが、成分(特徴
量)Bよりも分散(または標準偏差)が大きい。換言す
れば、成分Aのほうが、未知パターンに対する識別能力
が高い。
未知パターンと辞書パターンとのマツチングは。
基本的には、未知パターンと辞書パターンの特徴ベクト
ルの対応次元成分の距離または類似度を求め、その距離
の総和が最小または類似度の総和が最大の辞書パターン
を認識結果とするものである。
ルの対応次元成分の距離または類似度を求め、その距離
の総和が最小または類似度の総和が最大の辞書パターン
を認識結果とするものである。
こ\で、前記のような特徴ベクトルの性質に着目すれば
、パターン識別能力の高い部分から優先的に距離または
類似度を演算することにより、パターン識別能力の高い
一部の成分について距離または類似度を演算した段階で
、候補となり得ない辞書パターンを排除し、候補となり
得る辞書パターンを早い段階で絞り込むことができるで
あろう。
、パターン識別能力の高い部分から優先的に距離または
類似度を演算することにより、パターン識別能力の高い
一部の成分について距離または類似度を演算した段階で
、候補となり得ない辞書パターンを排除し、候補となり
得る辞書パターンを早い段階で絞り込むことができるで
あろう。
また、多層方向ヒストグラム法による特徴ベクトルは、
その各次元成分の順番を入れ替えてもパターンの特徴は
保存されるという性質がある。
その各次元成分の順番を入れ替えてもパターンの特徴は
保存されるという性質がある。
以上のような点に着目し、本発明にあっては、辞書作成
に際し、辞書パターンの特徴ベクトルの各次元毎の標準
偏差または分散を求め、各辞書パターンの特徴ベクトル
の成分を標準値または分散の大きい次元順に並べ替え、
そのような並べ替え後の特徴ベクトルを辞書に登録して
おく。
に際し、辞書パターンの特徴ベクトルの各次元毎の標準
偏差または分散を求め、各辞書パターンの特徴ベクトル
の成分を標準値または分散の大きい次元順に並べ替え、
そのような並べ替え後の特徴ベクトルを辞書に登録して
おく。
例えば、多層方向ヒストグラム法により作成されたある
辞書パターンの特徴ベクトルが第6図の(a)に示すよ
うであったとする。そして、全標準パターンについて計
算された標準偏差または分散の大きい次元順がX 4.
Xl、 X、、 X7. X、。
辞書パターンの特徴ベクトルが第6図の(a)に示すよ
うであったとする。そして、全標準パターンについて計
算された標準偏差または分散の大きい次元順がX 4.
Xl、 X、、 X7. X、。
X2.X、、XG、・・・であるとする。そうすると、
この特徴ベクトルは、その各次元X□j x2. x、
。
この特徴ベクトルは、その各次元X□j x2. x、
。
・・の成分が第6図の(b)に示すように並べ替えられ
て辞書に登録される。つまり、元の特徴ベクトルの次元
x4の成分が並べ替え後の特徴ベクトルの最上位の次元
Y□の成分、次元X□の成分が次位の次元Y2の成分、
というように並べ替えられる。
て辞書に登録される。つまり、元の特徴ベクトルの次元
x4の成分が並べ替え後の特徴ベクトルの最上位の次元
Y□の成分、次元X□の成分が次位の次元Y2の成分、
というように並べ替えられる。
そして、未知パターンから抽出された特徴ベクトルを、
辞書パターンの特徴ベクトルの成分の並べ替え順に従っ
て成分の並べ替えをおこなったのち、辞書パターンの特
徴ベクトルの対応次元成分との距離または類似度の演算
を行うことにより、未知パターンと辞書パターンとのマ
ツチングを行う。
辞書パターンの特徴ベクトルの成分の並べ替え順に従っ
て成分の並べ替えをおこなったのち、辞書パターンの特
徴ベクトルの対応次元成分との距離または類似度の演算
を行うことにより、未知パターンと辞書パターンとのマ
ツチングを行う。
こ\で、手書き漢字などの多くの種類のあるパターンの
認識の場合は、次元数の多い特徴ベクトルを用いて詳細
マツチングを行う必要がある。しかし、ANSK文字の
ように種類の少ない文字のようなパターンの認識を対象
とした場合、前記のように標準偏差または分散の大きい
次元順つまりパターン識別能力の高い次元順に辞書パタ
ーンおよび未知パターンの成分を並べ替えれば、その上
位の比較的少ない次元数(ANSK文字の場合、例えば
20次元、24次元など)だけのマツチングで十分な認
識率を達成できることが確認できた。
認識の場合は、次元数の多い特徴ベクトルを用いて詳細
マツチングを行う必要がある。しかし、ANSK文字の
ように種類の少ない文字のようなパターンの認識を対象
とした場合、前記のように標準偏差または分散の大きい
次元順つまりパターン識別能力の高い次元順に辞書パタ
ーンおよび未知パターンの成分を並べ替えれば、その上
位の比較的少ない次元数(ANSK文字の場合、例えば
20次元、24次元など)だけのマツチングで十分な認
識率を達成できることが確認できた。
この点に着目し、本発明にあってはさらに、前記のよう
に次元並べ替え後の辞書パターンの特徴ベクトルの上位
N次元だけを残し、下位の次元をすてたベクトルを、最
終的に辞書パターンの特徴ベクトルとして辞書に登録す
ることにより、辞書容量の削除とマツチング効率の一層
の向上を達成する。
に次元並べ替え後の辞書パターンの特徴ベクトルの上位
N次元だけを残し、下位の次元をすてたベクトルを、最
終的に辞書パターンの特徴ベクトルとして辞書に登録す
ることにより、辞書容量の削除とマツチング効率の一層
の向上を達成する。
以下1本発明の実施例について図面を参照し説明する。
第1図は、本発明の一実施例の機能的構成を簡略化して
示す概略ブロック図である。なお、この実施例において
は、認識対象のパターンとしてANSKの文字のような
比較的種類の少ない文字パターンを想定している。
示す概略ブロック図である。なお、この実施例において
は、認識対象のパターンとしてANSKの文字のような
比較的種類の少ない文字パターンを想定している。
図において、10は原稿から文字パターンを読み取り、
文字パターン情報を前処理部12に入力するパターン読
み取り部である。前処理部12は、入力文字パターンの
文字切り出し、正規化などの前処理を行い、処理後の文
字パターンを1字毎に特徴抽出部14に入力する部分で
ある。
文字パターン情報を前処理部12に入力するパターン読
み取り部である。前処理部12は、入力文字パターンの
文字切り出し、正規化などの前処理を行い、処理後の文
字パターンを1字毎に特徴抽出部14に入力する部分で
ある。
特徴抽出部14は、入力文字パターンから前記多層方向
ヒストグラム法により特徴ベクトルを抽出する部分であ
る。
ヒストグラム法により特徴ベクトルを抽出する部分であ
る。
こNで、この実施例においては、動作モートとして辞書
作成モードとパターン12g1モートとがある。まず、
辞書作成モードの場合について以下に説明する。また、
このモードにおける辞書作成処理の概略フローチャート
を第2図に示し、以下の説明において対応するステップ
番号を()内に示す。
作成モードとパターン12g1モートとがある。まず、
辞書作成モードの場合について以下に説明する。また、
このモードにおける辞書作成処理の概略フローチャート
を第2図に示し、以下の説明において対応するステップ
番号を()内に示す。
辞書作成のためには、各文字種について、M個の文字パ
ターンがパターン読み取り部10より順次入力される(
ステップ102)。その入力文字パターンは前処理部1
2で前処理を受け(ステップ102)、特徴抽出部14
に入力されて多層方向ヒストグラム法による特徴ベクト
ル(例えば256次元のベクトル)を抽出される(ステ
ップ104)。抽出された特徴ベクトルは並へ替え部1
6に入力される。
ターンがパターン読み取り部10より順次入力される(
ステップ102)。その入力文字パターンは前処理部1
2で前処理を受け(ステップ102)、特徴抽出部14
に入力されて多層方向ヒストグラム法による特徴ベクト
ル(例えば256次元のベクトル)を抽出される(ステ
ップ104)。抽出された特徴ベクトルは並へ替え部1
6に入力される。
18は並べ替え部16によって参照される並へ替えテー
ブル部であり、これには予め作成された並べ替えテーブ
ルが登録されている。
ブル部であり、これには予め作成された並べ替えテーブ
ルが登録されている。
この並べ替えテーブルは次のようにして作成される。各
文字種について、複数の文字パターンから多層方向ヒス
トグラム法により特徴ベクトル(例えば256次元のベ
クトル)を抽出し、その平均を、その文字種の標準パタ
ーンの特徴ベクトルとする。このようにして得た全文字
種(全体でに種)の標準パターンの特徴ベクトルの各次
元n毎の標準偏差σ、は次式 により計算する。こ\で、kは文字種の番号であり、g
knは文字種にの次元nの成分(特徴量)であり、また
gnは次元nの成分の全文字種の平均である。
文字種について、複数の文字パターンから多層方向ヒス
トグラム法により特徴ベクトル(例えば256次元のベ
クトル)を抽出し、その平均を、その文字種の標準パタ
ーンの特徴ベクトルとする。このようにして得た全文字
種(全体でに種)の標準パターンの特徴ベクトルの各次
元n毎の標準偏差σ、は次式 により計算する。こ\で、kは文字種の番号であり、g
knは文字種にの次元nの成分(特徴量)であり、また
gnは次元nの成分の全文字種の平均である。
なお、標準偏差の代わりに、その平方である分散を求め
てもよい。
てもよい。
そのようにして計算した標準偏差または分散の大きい順
に次元番号を並べ、その次元番号と対応する元の次元番
号との対応テーブルを、上位のN次元まで作る。この対
応テーブルが前記並べ替えテーブルである。
に次元番号を並べ、その次元番号と対応する元の次元番
号との対応テーブルを、上位のN次元まで作る。この対
応テーブルが前記並べ替えテーブルである。
辞書作成モードの説明に戻る。並べ替え部16において
、入力文字パターンから抽出された特徴ベクトルg k
nmは各次元成分が並べ替えテーブル部18の並べ替え
テーブルに従って並べ替えられ、並べ替え後の上位N次
元の成分からなる特徴ベクトルgknが辞書作成部20
に入力される(ステップ106)。
、入力文字パターンから抽出された特徴ベクトルg k
nmは各次元成分が並べ替えテーブル部18の並べ替え
テーブルに従って並べ替えられ、並べ替え後の上位N次
元の成分からなる特徴ベクトルgknが辞書作成部20
に入力される(ステップ106)。
このようにして、同−文字織のM個の文字パターンに対
する次元並べ替え後のN次元の特徴ベクトルが辞書作成
部20に蓄積されると、辞書作成部20は、そのM個の
特徴ベクトルの平均を求め。
する次元並べ替え後のN次元の特徴ベクトルが辞書作成
部20に蓄積されると、辞書作成部20は、そのM個の
特徴ベクトルの平均を求め。
それを文字種にの辞書パターンの特徴ベクトル(N次元
ベクトル)fknとして1文字コードを付加し辞書22
に登録する(ステップ1o8)。
ベクトル)fknとして1文字コードを付加し辞書22
に登録する(ステップ1o8)。
次に、文字種番号kが更新され(ステップ110)、ス
テップ100に戻り、次の文字種について同様の辞書作
成処理が実行される6 最後の文字種(k=k)まで処理が実行されると、ステ
ップ112により処理終了と判断され、処理を完了する
。
テップ100に戻り、次の文字種について同様の辞書作
成処理が実行される6 最後の文字種(k=k)まで処理が実行されると、ステ
ップ112により処理終了と判断され、処理を完了する
。
つぎに、パターン認識モードの場合について以下に説明
する。また、このモードにおける処理の概略フローチャ
ートを第3図に示し、以下の説明において対応するステ
ップ番号を()内に示す。
する。また、このモードにおける処理の概略フローチャ
ートを第3図に示し、以下の説明において対応するステ
ップ番号を()内に示す。
認識対象の文字パターン(未知文字パターン)はパター
ン読み取り部1oから入力され(ステップ200)、前
処理部12により前処理を受け(ステップ202)、特
徴抽出部14に入力され、そこで多層方向ヒストグラム
法により特徴ベクトルxn(例えば256次元ベクトル
)を抽出される(ステップ204)。
ン読み取り部1oから入力され(ステップ200)、前
処理部12により前処理を受け(ステップ202)、特
徴抽出部14に入力され、そこで多層方向ヒストグラム
法により特徴ベクトルxn(例えば256次元ベクトル
)を抽出される(ステップ204)。
この特徴ベクトルXnは並べ替え部16に入力され、並
べ替えテーブルに従って標準偏差または分散の大きい次
元順に成分が並べ替えられ、その上位N次元の成分から
なる特徴ベクトルYnに変換された後、マツチング部4
に送られる(ステップ206)。
べ替えテーブルに従って標準偏差または分散の大きい次
元順に成分が並べ替えられ、その上位N次元の成分から
なる特徴ベクトルYnに変換された後、マツチング部4
に送られる(ステップ206)。
マツチング部24においては、っぎのようにして未知入
カバターンと辞書パターンとのマツチングが行われる(
ステップ208)。
カバターンと辞書パターンとのマツチングが行われる(
ステップ208)。
それぞれの文字種にの辞書パターンの特徴ベクトルfk
nと未知文字パターンの特徴ベクトルYnとの距離Dk
を次式 :1 によって計算する。そして、その距離のソートを行い、
距離が最小の辞書パターンを候補文字として決定するに の候補文字の文字コードは、未知文字パターンに対する
認識結果として出力される(ステップ210)。
nと未知文字パターンの特徴ベクトルYnとの距離Dk
を次式 :1 によって計算する。そして、その距離のソートを行い、
距離が最小の辞書パターンを候補文字として決定するに の候補文字の文字コードは、未知文字パターンに対する
認識結果として出力される(ステップ210)。
このように、この実施例では、辞書パターンの特徴ベク
トルは標準偏差または分散の大きい次元順、つまりパタ
ーン識別能力の高い次元順に成分が並べ替えられ、かつ
上位N次元以外のパターン識別能力の低い成分を捨てた
形で辞書に登録されており、また未知入カバターンの特
徴ベクトルは辞書パターンと同じ次元順の成分が並べ替
えられ。
トルは標準偏差または分散の大きい次元順、つまりパタ
ーン識別能力の高い次元順に成分が並べ替えられ、かつ
上位N次元以外のパターン識別能力の低い成分を捨てた
形で辞書に登録されており、また未知入カバターンの特
徴ベクトルは辞書パターンと同じ次元順の成分が並べ替
えられ。
辞書パターンと未知文字パターンとのマツチングは、N
次元のベクトル間の距離または類似度に演算によって行
われる。
次元のベクトル間の距離または類似度に演算によって行
われる。
したがって、距離または類似度の演算量が少なく高いマ
ツチング効率を達成でき、しかも、パターン識別能力の
高い次元を利用しているため十分な認識率を達成できる
。さらに、次元数の減少により、辞書容量の大幅な削除
を達成できる。
ツチング効率を達成でき、しかも、パターン識別能力の
高い次元を利用しているため十分な認識率を達成できる
。さらに、次元数の減少により、辞書容量の大幅な削除
を達成できる。
次に、本発明の他の実施例について説明する。
この実施例の全体的な機能的構成は前記実施例と同様で
あり、マツチング部24におけるマツチング処理が一部
相違するだけである。そこで、そのマツチング部24の
処理についてだけ、第4図のフローチャートを参照し、
説明する。
あり、マツチング部24におけるマツチング処理が一部
相違するだけである。そこで、そのマツチング部24の
処理についてだけ、第4図のフローチャートを参照し、
説明する。
成分の並べ替え後の未知文字パターンのN次元特徴ベク
トルがマツチングに入力されると、文字種つまり辞書パ
ターンの番号が1にセットされ(ステップ300)、そ
の辞書パターンと未知文字パターンとのマツチングが行
われる。
トルがマツチングに入力されると、文字種つまり辞書パ
ターンの番号が1にセットされ(ステップ300)、そ
の辞書パターンと未知文字パターンとのマツチングが行
われる。
まず、上位N2次元(Nよ<N)までについて、その辞
書パターンの特徴ベクトルfknと未知文字パターンの
特徴ベクトルY。どの距離の総和d、が計算される(ス
テップ3o2)。そして、その距離の総和d工と閾値T
h1との比較判定が行われる(ステップ304)。
書パターンの特徴ベクトルfknと未知文字パターンの
特徴ベクトルY。どの距離の総和d、が計算される(ス
テップ3o2)。そして、その距離の総和d工と閾値T
h1との比較判定が行われる(ステップ304)。
d工>Th1であれば、その辞書パターンは距離が大き
過ぎて候補パターン(候補文字)とはなり得ないから、
そのマツチングをこの段階で打切り。
過ぎて候補パターン(候補文字)とはなり得ないから、
そのマツチングをこの段階で打切り。
辞書パターン番号kをインクリメントしくステップ30
6)、ステップ302に戻る。
6)、ステップ302に戻る。
つまり、上位N1次元までの距離演算によって、未知文
字パターンの大分類(候補パターンの絞り込み)が行わ
れ、こ\で排除された辞書パターンのマツチングは、こ
の段階で終了する。
字パターンの大分類(候補パターンの絞り込み)が行わ
れ、こ\で排除された辞書パターンのマツチングは、こ
の段階で終了する。
ステップ304においてd1≦Th1であれば、全次元
Nまでの距離を総和d2が求められる(ステップ310
)。そして、その距離d2と、その直前までの候補パタ
ーンと未知文字パターンとの距離とが比較され、小さい
ほうの候補パターンと距離が保存され(ステップ312
)、ステップ206を介してステップ302に戻る。
Nまでの距離を総和d2が求められる(ステップ310
)。そして、その距離d2と、その直前までの候補パタ
ーンと未知文字パターンとの距離とが比較され、小さい
ほうの候補パターンと距離が保存され(ステップ312
)、ステップ206を介してステップ302に戻る。
最終の辞書パターンまでマツチングが終了すると、ステ
ップ308にて終了と判定され、最終的に残っていた候
補パターンの文字コードが出力され(ステップ314)
、未知文字パターンの認識処理が完了する。
ップ308にて終了と判定され、最終的に残っていた候
補パターンの文字コードが出力され(ステップ314)
、未知文字パターンの認識処理が完了する。
このように、この実施例では特徴ベクトルの上位次元か
ら優先的に距離を演算し、ある次元までの演算結果によ
って候補パターンとなる得ない辞書パターンを早期に排
除し、候補パターンとなり得る辞書パターンについてだ
け全次元の距離演算を行って詳細マツチングを行う。し
たがって、前記実施例におけるよりも無駄な距離演算が
減少し、マツチング効率がさらに向上する。
ら優先的に距離を演算し、ある次元までの演算結果によ
って候補パターンとなる得ない辞書パターンを早期に排
除し、候補パターンとなり得る辞書パターンについてだ
け全次元の距離演算を行って詳細マツチングを行う。し
たがって、前記実施例におけるよりも無駄な距離演算が
減少し、マツチング効率がさらに向上する。
このような段階的な候補パターンの縦り込みを2段階以
上行ってもよい。□例えば、各辞書パターンについて、
上位N工(たゾしN工<N)次元までの距離を演算する
ことにより、未知文字パターンの大分類を行う。そこで
排除されなかった場合に、その辞書パターンについて上
位N2(たゾし、N1<N2<N)次元までの距離を演
算して未知文字パターンの中分類を行う。この中分類で
も排除されない場合、上位N、 (たゾしN z <
N3 < N )次元までの距離演算によって未知文字
パターンの小分類を行う。この小分類でも排除されない
場合、全次元についての距離演算による未知文字パター
ンの詳細マツチングを行う。
上行ってもよい。□例えば、各辞書パターンについて、
上位N工(たゾしN工<N)次元までの距離を演算する
ことにより、未知文字パターンの大分類を行う。そこで
排除されなかった場合に、その辞書パターンについて上
位N2(たゾし、N1<N2<N)次元までの距離を演
算して未知文字パターンの中分類を行う。この中分類で
も排除されない場合、上位N、 (たゾしN z <
N3 < N )次元までの距離演算によって未知文字
パターンの小分類を行う。この小分類でも排除されない
場合、全次元についての距離演算による未知文字パター
ンの詳細マツチングを行う。
このようにすれば、候補となり得ない辞書パターンとの
マツチング演算を一層早期に中止し、マツチング時間を
一層短縮することができる。
マツチング演算を一層早期に中止し、マツチング時間を
一層短縮することができる。
なお、前記各実施例においては、未知パターンと辞書パ
ターンとのマツチングに距離を用いたが、類似度を求め
て同様のマツチング処理を行ってもよいことは当然であ
る。
ターンとのマツチングに距離を用いたが、類似度を求め
て同様のマツチング処理を行ってもよいことは当然であ
る。
また1本発明は文字パターンに限らす、音声などパター
ン全般の認識に同様に適用できるものである、 〔効 果〕 以上の説明から明らかなように、本発明によれば、多層
方向ヒストグラム法によるマツチング効率を大幅に向上
してパターン認識時間を短縮できると\もに、辞書容量
を大幅に削除できるなどの効率が得られる。
ン全般の認識に同様に適用できるものである、 〔効 果〕 以上の説明から明らかなように、本発明によれば、多層
方向ヒストグラム法によるマツチング効率を大幅に向上
してパターン認識時間を短縮できると\もに、辞書容量
を大幅に削除できるなどの効率が得られる。
第1図は本発明の一実施例の機能的構成を簡略化して示
す簡略ブロック図、第2図は同実施例における辞書作成
処理の概略フローチャート、第3図は同実施例における
パターン認識処理の概略フローチャート、第4図は本発
明の法の実施例におけるマツチング処理の概略フローチ
ャート、第5図は多層方向ヒストグラム法における特徴
ベクトルの性質を説明するためのベクトル図、第6図は
特徴ベクトルの成分並べ替えの説明図である。 10・・・パターン読み取り部、 12・・・前処理
部、14・・・特徴抽出部、 16・・・並べ替え部
、18・・・並べ替えテーブル部、 20・・・辞書
作成部、 22・・・辞書。 第1図 φ 詰畠謔里参
す簡略ブロック図、第2図は同実施例における辞書作成
処理の概略フローチャート、第3図は同実施例における
パターン認識処理の概略フローチャート、第4図は本発
明の法の実施例におけるマツチング処理の概略フローチ
ャート、第5図は多層方向ヒストグラム法における特徴
ベクトルの性質を説明するためのベクトル図、第6図は
特徴ベクトルの成分並べ替えの説明図である。 10・・・パターン読み取り部、 12・・・前処理
部、14・・・特徴抽出部、 16・・・並べ替え部
、18・・・並べ替えテーブル部、 20・・・辞書
作成部、 22・・・辞書。 第1図 φ 詰畠謔里参
Claims (2)
- (1)多層方向ヒストグラム法によるパターン認識方式
において、多層方向ヒストグラム法によって得られた標
準パターンの特徴ベクトルの成分を標準偏差または分散
の大きい次元順に予め並べ替えたのち、その上位N次元
の成分だけからなるベクトルを辞書パターンの特徴ベク
トルとして辞書に登録しておき、多層方向ヒストグラム
法により未知パターンから抽出した特徴ベクトルの成分
を、辞書パターンの特徴ベクトルの成分の並べ替え順に
従って並べ替え、その成分並べ替え後の特徴ベクトルと
辞書パターンの特徴ベクトルとの対応次元成分の距離ま
たは類似度を演算することにより、未知パターンと辞書
パターンとのマッチングを行うことを特徴とするパター
ン認識方式。 - (2)特徴ベクトルの距離または類似度の演算を上位次
元の成分から優先的に行い、その演算の結果によって、
さらに下位次元の成分の距離または類似度の演算を行う
か否かを判定することを特徴とする特許請求の範囲第1
項に記載のパターン認識方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61144487A JPH0740287B2 (ja) | 1986-06-20 | 1986-06-20 | パターン認識方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61144487A JPH0740287B2 (ja) | 1986-06-20 | 1986-06-20 | パターン認識方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS63779A true JPS63779A (ja) | 1988-01-05 |
| JPH0740287B2 JPH0740287B2 (ja) | 1995-05-01 |
Family
ID=15363467
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP61144487A Expired - Lifetime JPH0740287B2 (ja) | 1986-06-20 | 1986-06-20 | パターン認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0740287B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002074268A (ja) * | 2000-08-31 | 2002-03-15 | Hewlett Packard Co <Hp> | 文字認識システム |
| JP2002099913A (ja) * | 2000-07-21 | 2002-04-05 | Lg Electronics Inc | 漸進的ヒストグラムを利用したマルチメディアの検索方法 |
-
1986
- 1986-06-20 JP JP61144487A patent/JPH0740287B2/ja not_active Expired - Lifetime
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002099913A (ja) * | 2000-07-21 | 2002-04-05 | Lg Electronics Inc | 漸進的ヒストグラムを利用したマルチメディアの検索方法 |
| US7039255B2 (en) | 2000-07-21 | 2006-05-02 | Lg Electronics Inc. | Method for searching multimedia using progressive histogram |
| JP2002074268A (ja) * | 2000-08-31 | 2002-03-15 | Hewlett Packard Co <Hp> | 文字認識システム |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0740287B2 (ja) | 1995-05-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Lehal et al. | Feature extraction and classification for OCR of Gurmukhi script | |
| Chi et al. | Separation of single-and double-touching handwritten numeral strings | |
| CN100390815C (zh) | 模板优化的字符识别方法和系统 | |
| Hussain et al. | Character recognition of Arabic and Latin scripts | |
| JPS63779A (ja) | パターン認識方法 | |
| JPS63780A (ja) | パターン認識方法 | |
| Han et al. | Coarse classification of Chinese characters via stroke clustering method | |
| Qahwaji et al. | Detection of closed regions in digital images | |
| Jayarathna et al. | A junction based segmentation algorithm for offline handwritten connected character segmentation | |
| JP2832928B2 (ja) | 文字認識方法 | |
| KR910000786B1 (ko) | 패턴인식방식 | |
| JPH0795336B2 (ja) | 文字認識方式 | |
| Saeed et al. | A new approach for hand-palm recognition | |
| JP2853169B2 (ja) | パターン認識装置 | |
| JP3104355B2 (ja) | 特徴抽出装置 | |
| JPS63778A (ja) | パターン認識方法 | |
| JPH0557633B2 (ja) | ||
| JPH03175591A (ja) | 文字認識装置 | |
| JP2001060250A (ja) | 文字認識方法および装置 | |
| JPH11120291A (ja) | パタン認識システム | |
| Lau et al. | EDT based tracing maximum thinning algorithm on grey scale images | |
| JPH09231314A (ja) | オンライン手書き文字認識装置 | |
| Abdesselam | Local Similarities for Boosting the Performance of Local Binary Patterns Technique | |
| JPS62271190A (ja) | セグメント数字認識方式 | |
| JP2004013319A (ja) | 画像中の物体認識方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| EXPY | Cancellation because of completion of term |