JPH041870A - パターン認識方法および装置 - Google Patents
パターン認識方法および装置Info
- Publication number
- JPH041870A JPH041870A JP2101837A JP10183790A JPH041870A JP H041870 A JPH041870 A JP H041870A JP 2101837 A JP2101837 A JP 2101837A JP 10183790 A JP10183790 A JP 10183790A JP H041870 A JPH041870 A JP H041870A
- Authority
- JP
- Japan
- Prior art keywords
- output
- value
- recognition
- confidence
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、多層構造の神経回路モデルを用いたパターン
認識装置において、神経回路網の出力信号から計算した
確信度に従って、認識結果のみならずリジェクト信号を
出力するパターン認識方法および装置に関するものであ
る。
認識装置において、神経回路網の出力信号から計算した
確信度に従って、認識結果のみならずリジェクト信号を
出力するパターン認識方法および装置に関するものであ
る。
従来、多層神経回路網を用いたパターン認識では、パタ
ーンや特徴量を入力し、文献(“A Neu−ral
Network Digit Recognition
” by D、J、Burr :JEERIntern
ational Conference on Sys
tem、 Manand Cybernetics :
1986. pp、1621−1625)に示される
ように、各要素がカテゴリへの類似度を表現するような
ベクトル量として出力信号を得る。多くの場合、出力信
号の要素は、0から1の数値または−1から1の数値と
して表現されている。ベクトル量の要素の中で最大の値
を取る要素が表すカテゴリを認識結果とするものである
。
ーンや特徴量を入力し、文献(“A Neu−ral
Network Digit Recognition
” by D、J、Burr :JEERIntern
ational Conference on Sys
tem、 Manand Cybernetics :
1986. pp、1621−1625)に示される
ように、各要素がカテゴリへの類似度を表現するような
ベクトル量として出力信号を得る。多くの場合、出力信
号の要素は、0から1の数値または−1から1の数値と
して表現されている。ベクトル量の要素の中で最大の値
を取る要素が表すカテゴリを認識結果とするものである
。
パターンvlWA装置では、認識対象でないパターンが
入力されたり、2つのカテゴリのうちのどちらともわか
らないようなパターンが入力されることがある。このよ
うな場合には、無理に認識結果を求めるよりは、認識不
能としてリジェクトする方が認識結果の信鯨性を高める
ことができる。
入力されたり、2つのカテゴリのうちのどちらともわか
らないようなパターンが入力されることがある。このよ
うな場合には、無理に認識結果を求めるよりは、認識不
能としてリジェクトする方が認識結果の信鯨性を高める
ことができる。
そのため従来のパターン認識装置では、パターンの整合
度を入力パターンと各カテゴリ毎の標準パターンとの類
似度で評価し、最も類似度が高いカテゴリを認識結果と
するなどの方法がある。このような方法では、第1位候
補の類似度が成る一定値以上に達しないとリジェクトし
たり、1位候補と2位候補との類似度の差が成る一定値
以上ないとリジェクトするなどの方法が取られている。
度を入力パターンと各カテゴリ毎の標準パターンとの類
似度で評価し、最も類似度が高いカテゴリを認識結果と
するなどの方法がある。このような方法では、第1位候
補の類似度が成る一定値以上に達しないとリジェクトし
たり、1位候補と2位候補との類似度の差が成る一定値
以上ないとリジェクトするなどの方法が取られている。
神経回路網を用いたパターン認識方法においては、出力
信号は上限下限を持つ値を要素として持つベクトル値で
あるが、この値は従来のパターン認識方法に見られる類
似度とは異なり、上記の従来のリジェクト方法を用いた
場合には、認識誤りとリジェクトの双方を減らすように
しきい値を設定することは困難であり、本来正しく認識
されているパターンの多くがリジェクトされてしまう。
信号は上限下限を持つ値を要素として持つベクトル値で
あるが、この値は従来のパターン認識方法に見られる類
似度とは異なり、上記の従来のリジェクト方法を用いた
場合には、認識誤りとリジェクトの双方を減らすように
しきい値を設定することは困難であり、本来正しく認識
されているパターンの多くがリジェクトされてしまう。
上記のような従来のパターン認識方法におけるリジェク
ト方法では、1位候補の値のみを用いているか、または
2位候補までの値を用いている。
ト方法では、1位候補の値のみを用いているか、または
2位候補までの値を用いている。
これでは、非常に似た複数のパターンを分類する場合に
はリジェクトが多く発生してしまう。またこのような方
法では、2つ以上の候補の類似度などの値を統一的に評
価してリジェクトを行うことはできない。
はリジェクトが多く発生してしまう。またこのような方
法では、2つ以上の候補の類似度などの値を統一的に評
価してリジェクトを行うことはできない。
本発明の目的は、神経回路網の出力信号であるベクトル
値から認識結果の確信度を求め、その値としきい値とを
比較判定して認識結果を出力するか、あるいはリジェク
ト信号を出力することができるパターン認識方法および
装置を提供することにある。
値から認識結果の確信度を求め、その値としきい値とを
比較判定して認識結果を出力するか、あるいはリジェク
ト信号を出力することができるパターン認識方法および
装置を提供することにある。
第1の発明は、多層構造の神経回路網を用いたパターン
認識方法において、 入力パターンまたは入力パターンから抽出された特徴量
を入力して、多層構造の神経回路網によってカテゴリを
表す出力ベクトルに変換し、その出力ベクトルから、1
つの要素だけが値域の上限値の近くになり、その他の要
素は値域の下限値の近くであるときに確信度が最大とな
るように確信度を計算し、その確信度をしきい値と比較
して、しきい値よりも大きい場合には出力結果を認識結
果とし、確信度がしきい値よりも小さい場合にはリジェ
クトすることを特徴とする特 第2の発明は、多層構造の神経回路網を用いたパターン
認識装置において、 入力データからカテゴリを表す出力ベクトル信号へと変
換する神経回路網を実現する手段と、出力ベクトル信号
のうちで最大値を持つカテゴリを検出する手段と、 出力ベクトル信号が、1つの要素だけが値域の上限値の
近くになり、その他の要素は値域の下限値の近くである
ときに確信度が最大となるように確信度を計算する手段
と、 確信度がしきい値より大きい場合には最大値検出部の出
力をもって認識結果とし、確信度がしきい値以下の場合
にはリジェクトとして判定する手段とを備え、 認識結果またはリジェクト信号を出力することを特徴と
する。
認識方法において、 入力パターンまたは入力パターンから抽出された特徴量
を入力して、多層構造の神経回路網によってカテゴリを
表す出力ベクトルに変換し、その出力ベクトルから、1
つの要素だけが値域の上限値の近くになり、その他の要
素は値域の下限値の近くであるときに確信度が最大とな
るように確信度を計算し、その確信度をしきい値と比較
して、しきい値よりも大きい場合には出力結果を認識結
果とし、確信度がしきい値よりも小さい場合にはリジェ
クトすることを特徴とする特 第2の発明は、多層構造の神経回路網を用いたパターン
認識装置において、 入力データからカテゴリを表す出力ベクトル信号へと変
換する神経回路網を実現する手段と、出力ベクトル信号
のうちで最大値を持つカテゴリを検出する手段と、 出力ベクトル信号が、1つの要素だけが値域の上限値の
近くになり、その他の要素は値域の下限値の近くである
ときに確信度が最大となるように確信度を計算する手段
と、 確信度がしきい値より大きい場合には最大値検出部の出
力をもって認識結果とし、確信度がしきい値以下の場合
にはリジェクトとして判定する手段とを備え、 認識結果またはリジェクト信号を出力することを特徴と
する。
第3の発明は、多層構造の神経回路網を用いたパターン
認識装置において、 入力データからカテゴリを表す出力ベクトル信号へと変
換する神経回路網を実現する手段と、出力信号を降順に
ソートする手段と、 ソートされた結果の最大値のカテゴリを記憶する手段と
、 ソートされた出力ベクトル信号のうちの上位の一定個数
の要素において、第1位の要素だけが値域の上限値の近
くになり、その他の要素は値域の下限値の近くであると
きに確信度が最大となるように確信度を計算する手段と
、 確信度がしきい値より大きい場合には最大値カテゴリ記
憶部の内容をもって認識結果とし、確信度がしきい値以
下の場合にはリジェクトとして判定する手段とを備え、 認識結果またはリジェクト信号を出力することを特徴と
する。
認識装置において、 入力データからカテゴリを表す出力ベクトル信号へと変
換する神経回路網を実現する手段と、出力信号を降順に
ソートする手段と、 ソートされた結果の最大値のカテゴリを記憶する手段と
、 ソートされた出力ベクトル信号のうちの上位の一定個数
の要素において、第1位の要素だけが値域の上限値の近
くになり、その他の要素は値域の下限値の近くであると
きに確信度が最大となるように確信度を計算する手段と
、 確信度がしきい値より大きい場合には最大値カテゴリ記
憶部の内容をもって認識結果とし、確信度がしきい値以
下の場合にはリジェクトとして判定する手段とを備え、 認識結果またはリジェクト信号を出力することを特徴と
する。
第1の発明であるパターン認識方法では、多層型の神経
回路網を用いて、入力されるパターンまたはパターンの
特徴量から各カテゴリに対応する出力信号を求め、その
最大値をもつカテゴリを認識結果として定める。さらに
、出力値のベクトル全体から以下の式を用いて確信度を
計算する。ここで、認識対象のカテゴリ数をNとして、
神経回路網からの出力ベクトルをPi (1≦i≦N
、 0≦Pi≦1)、α、βを係数とすると、確信度
Rは、 ・ ・ ・(1) として求める。この値は、1つの値だけが上限値lに近
く、他の全ての値が下限値0に近いときに最大値を取り
、最大値を持つ要素Piが1から離れたり、第2位以下
の要素が最大値に接近した場合に、Rは小さくなる。そ
の値Rがしきい値よりも大きい場合には、最大の出力値
を持つカテゴリを認識結果として選択し、Rがしきい値
よりも小さい場合にはリジェクト信号を出力することに
より、不確かな認識結果をリジェクトすることができる
。
回路網を用いて、入力されるパターンまたはパターンの
特徴量から各カテゴリに対応する出力信号を求め、その
最大値をもつカテゴリを認識結果として定める。さらに
、出力値のベクトル全体から以下の式を用いて確信度を
計算する。ここで、認識対象のカテゴリ数をNとして、
神経回路網からの出力ベクトルをPi (1≦i≦N
、 0≦Pi≦1)、α、βを係数とすると、確信度
Rは、 ・ ・ ・(1) として求める。この値は、1つの値だけが上限値lに近
く、他の全ての値が下限値0に近いときに最大値を取り
、最大値を持つ要素Piが1から離れたり、第2位以下
の要素が最大値に接近した場合に、Rは小さくなる。そ
の値Rがしきい値よりも大きい場合には、最大の出力値
を持つカテゴリを認識結果として選択し、Rがしきい値
よりも小さい場合にはリジェクト信号を出力することに
より、不確かな認識結果をリジェクトすることができる
。
第2の発明であるパターン認識装置では、神経回路網の
出力ベクトルの全ての要素値から式(1)に従った演算
を実行する手段と、得られた確信度の値をしきい値と比
較して認識結果を出力するかリジェクトを行うかを判定
する手段とを備えることにより、不確かな認識結果をリ
ジェクトする。
出力ベクトルの全ての要素値から式(1)に従った演算
を実行する手段と、得られた確信度の値をしきい値と比
較して認識結果を出力するかリジェクトを行うかを判定
する手段とを備えることにより、不確かな認識結果をリ
ジェクトする。
第3の発明であるパターン認識装置では、神経回路網の
出力ベクトル値を降順に並べて、その上位の一定個数の
値から式(1)に従って確信度を計算する手段と、得ら
れた確信度の値をしきい値と比較して認識結果を出力す
るかリジェクトを行うかを判定する手段を備えることに
より、認識結果に影響を与え得る出力値の上位のカテゴ
リの値から計算した確信度に従って不確かな認識結果を
リジェクトする。
出力ベクトル値を降順に並べて、その上位の一定個数の
値から式(1)に従って確信度を計算する手段と、得ら
れた確信度の値をしきい値と比較して認識結果を出力す
るかリジェクトを行うかを判定する手段を備えることに
より、認識結果に影響を与え得る出力値の上位のカテゴ
リの値から計算した確信度に従って不確かな認識結果を
リジェクトする。
以下、本発明の実施例である文字認識方法と装置を図面
を参照して説明する。
を参照して説明する。
第1図は、本発明のパターン認識方法を説明する流れ図
を示す。認識対象となるパターンが入力され(ステップ
S 101)、次にそのパターンより特徴抽出がなされ
(ステップS 102)、ベクトル値に変換される。抽
出される特徴はどのようなものでもよく、文字認識の場
合ではガウスフィルタによる濃淡特徴や方向曲率を抽出
した特徴などがある。
を示す。認識対象となるパターンが入力され(ステップ
S 101)、次にそのパターンより特徴抽出がなされ
(ステップS 102)、ベクトル値に変換される。抽
出される特徴はどのようなものでもよく、文字認識の場
合ではガウスフィルタによる濃淡特徴や方向曲率を抽出
した特徴などがある。
また、特徴抽出をしない場合には、入力パターン自体を
特徴ベクトル値として扱うことも可能である。−例とし
て、第2図を参照してガウスフィルタによる文字パター
ンの特徴抽出方法を説明する。
特徴ベクトル値として扱うことも可能である。−例とし
て、第2図を参照してガウスフィルタによる文字パター
ンの特徴抽出方法を説明する。
フィルタリング部203において、白黒の二値画像とし
て入力された文字パターン201に、5×5マトリクス
で与えられたガウスフィルタ202を畳み込む。入カニ
値画像を32画素×42西素の二値画像B (i、j)
、5X5フイルタをF(k、l)、結果の多値画像をG
(i、j)とすると、G(i、j) ・(2) なる式に従って計算が実行する。その結果のG(i、j
)は、リサンプリング部204で9×11の99個のデ
ータに間引かれ、濃淡特徴になる。第2図の濃淡時@2
06は、このデータを表示したもので、1つ1つの要素
の値を丸の大きさで示している。
て入力された文字パターン201に、5×5マトリクス
で与えられたガウスフィルタ202を畳み込む。入カニ
値画像を32画素×42西素の二値画像B (i、j)
、5X5フイルタをF(k、l)、結果の多値画像をG
(i、j)とすると、G(i、j) ・(2) なる式に従って計算が実行する。その結果のG(i、j
)は、リサンプリング部204で9×11の99個のデ
ータに間引かれ、濃淡特徴になる。第2図の濃淡時@2
06は、このデータを表示したもので、1つ1つの要素
の値を丸の大きさで示している。
次に特徴ベクトル値は、多層神経回路網を用いて出力値
に変換する(ステップS 103)。計算方法を第3図
を用いて説明する。第3図では、第0層から第2層まで
の3層構造の神経回路網の計算方法を説明するが、本発
明では、3層構造に限るものではなく、2層のものや4
層以上のものにも容易に拡張が可能である。
に変換する(ステップS 103)。計算方法を第3図
を用いて説明する。第3図では、第0層から第2層まで
の3層構造の神経回路網の計算方法を説明するが、本発
明では、3層構造に限るものではなく、2層のものや4
層以上のものにも容易に拡張が可能である。
第3図では、第1図のステップ3102によって抽出さ
れた特徴ベクトル値を多層神経回路網に入力し、第0層
のベクトル値とする(ステップ5301)。次に、以下
の式(3)に従って第0層ベクトル値から第1層のマト
リクス積を計算する(ステップS 302)。第0層の
ベクトル値をo=’(1≦1≦N o )とし、第1層
重みマトリクス値をW==’(1≦i≦N0.1≦j≦
N、) 、計算結果のベクトル値をo=’(1≦j≦N
、)とすると、0.1 = Σ (o4’Xw 点
Jl) 十 01厘 (3)と
なる。ただし、ここでθ、1はバイアス値である。次に
o、’(1≦j≦N、)の各々に対して以下の式(4)
に従ってS関数を計算する(ステップ5303)。
れた特徴ベクトル値を多層神経回路網に入力し、第0層
のベクトル値とする(ステップ5301)。次に、以下
の式(3)に従って第0層ベクトル値から第1層のマト
リクス積を計算する(ステップS 302)。第0層の
ベクトル値をo=’(1≦1≦N o )とし、第1層
重みマトリクス値をW==’(1≦i≦N0.1≦j≦
N、) 、計算結果のベクトル値をo=’(1≦j≦N
、)とすると、0.1 = Σ (o4’Xw 点
Jl) 十 01厘 (3)と
なる。ただし、ここでθ、1はバイアス値である。次に
o、’(1≦j≦N、)の各々に対して以下の式(4)
に従ってS関数を計算する(ステップ5303)。
o’J’ = 1/2 (1+tanh (oj’)
) (4)次に、第2層重みマトリクスをw、
、”(1≦j≦N、、t≦に≦NZ)とし、バイアス値
をθ−として、 okz=Σ (Oj、’ X Wjk”)+θ−(5)
なる計算を行う(ステップS 304)。さらに、o
、 2(1≦に≦N z )は各々の式(6)に従って
S関数が計算される(ステップS 305)。
) (4)次に、第2層重みマトリクスをw、
、”(1≦j≦N、、t≦に≦NZ)とし、バイアス値
をθ−として、 okz=Σ (Oj、’ X Wjk”)+θ−(5)
なる計算を行う(ステップS 304)。さらに、o
、 2(1≦に≦N z )は各々の式(6)に従って
S関数が計算される(ステップS 305)。
o’−= 1/ 2 (1+tanh (oil”)
] (6)最後に、第2層のデータは出力信号
として出力される(ステップS 306)。
] (6)最後に、第2層のデータは出力信号
として出力される(ステップS 306)。
ここで用いられる第1層および第2層の重みマトリクス
は、文献(“An Introduction to
Cospu−ting with Neural Ne
ts″by R,P、Lippmann:IEEE。
は、文献(“An Introduction to
Cospu−ting with Neural Ne
ts″by R,P、Lippmann:IEEE。
ASSP: April 1987. pp、4−22
)に示されるような方法で予め学習により決定しである
ものとする。
)に示されるような方法で予め学習により決定しである
ものとする。
次に、出力データo’h”(1≦に≦N、)の中から、
最大値を求める。その番号を最大値カテゴリとする(ス
テップS 104)。
最大値を求める。その番号を最大値カテゴリとする(ス
テップS 104)。
また、式(1)に従って出力データから確信度Rが計算
される(ステップS 105)。ここで、出力データは
N次元のベクトルで、ベクトルの要素Pi(1≦i≦N
)は、それぞれOから1までの値をとるとする。このパ
ターン認識方法を、数字認識のために用いる場合には、
10個の文字を認識対象とするためNの値は10と設定
し、英数字を認識対象とする場合には、大文字26文字
、小文字26文字。
される(ステップS 105)。ここで、出力データは
N次元のベクトルで、ベクトルの要素Pi(1≦i≦N
)は、それぞれOから1までの値をとるとする。このパ
ターン認識方法を、数字認識のために用いる場合には、
10個の文字を認識対象とするためNの値は10と設定
し、英数字を認識対象とする場合には、大文字26文字
、小文字26文字。
数字10文字を認識するため、Nの値を62に設定する
。また、式(1)の係数α、βをそれぞれlとした。
。また、式(1)の係数α、βをそれぞれlとした。
これは、本質的な問題ではなく他の値を取ることも可能
である。また、式(1)では、出力データの各要素がO
から1までの値を仮定したが、−1から1の場合や、さ
らに−船釣に出力データの各要素がaからbまでの値を
とる場合にも容易に拡張でき以下の式(7)で表現でき
る。
である。また、式(1)では、出力データの各要素がO
から1までの値を仮定したが、−1から1の場合や、さ
らに−船釣に出力データの各要素がaからbまでの値を
とる場合にも容易に拡張でき以下の式(7)で表現でき
る。
R=−a Σ (P 1−a) (b−P i)−β
(Σ ((P 1−a)/ (b−a) )・ ・
・(7) 次に、計算された確信度Rとしきい値Tとを比較して(
ステップS 106)、Rがしきい値以上ならばステッ
プ5107へ進み、ステップ5104で求められた最大
値のカテゴリ番号を出力し、Rがしきい値未満ならばス
テップ5108へすすみ、リジェクト信号である0を出
力する。しきい値Tの値は便宜上0.1とするが、これ
は本質的なものではなくどのような値でもよい。以上の
ステップで1パターンの認識処理を終了する。
(Σ ((P 1−a)/ (b−a) )・ ・
・(7) 次に、計算された確信度Rとしきい値Tとを比較して(
ステップS 106)、Rがしきい値以上ならばステッ
プ5107へ進み、ステップ5104で求められた最大
値のカテゴリ番号を出力し、Rがしきい値未満ならばス
テップ5108へすすみ、リジェクト信号である0を出
力する。しきい値Tの値は便宜上0.1とするが、これ
は本質的なものではなくどのような値でもよい。以上の
ステップで1パターンの認識処理を終了する。
次に第4図、第5図、第6図を参照して、第2の発明の
パターン認識装置の一実施例について説明する。
パターン認識装置の一実施例について説明する。
第4図は、文字認識装置の全体のブロック図を示す。こ
の文字認識装置は、特徴抽出部402と、認識部403
と、コード生成部404とから構成されている。
の文字認識装置は、特徴抽出部402と、認識部403
と、コード生成部404とから構成されている。
認識対象となる文字パターンは、端子401より入力さ
れ、特徴抽出部402において特徴ベクトルに変換され
る。この特徴抽出部は、本発明において本質的な問題で
はなく、従来の文字認識装置において用いられる方向特
徴、輪郭の曲率方向特徴などを用いてもよい。特徴抽出
部402で抽出されベクトルに変換された特徴データは
、認識部403に送られ、認識処理が行われ出力信号に
変換される。この出力信号は、1からNのうちの認識結
果のカテゴリ番号、またはリジェクトを表す番号Oとす
る。Nは、認識対象のカテゴリ数である。この出力信号
はコード生成部404に送られて、認識結果がJISコ
ードなどの文字コードに変換され端子405より出力さ
れる。
れ、特徴抽出部402において特徴ベクトルに変換され
る。この特徴抽出部は、本発明において本質的な問題で
はなく、従来の文字認識装置において用いられる方向特
徴、輪郭の曲率方向特徴などを用いてもよい。特徴抽出
部402で抽出されベクトルに変換された特徴データは
、認識部403に送られ、認識処理が行われ出力信号に
変換される。この出力信号は、1からNのうちの認識結
果のカテゴリ番号、またはリジェクトを表す番号Oとす
る。Nは、認識対象のカテゴリ数である。この出力信号
はコード生成部404に送られて、認識結果がJISコ
ードなどの文字コードに変換され端子405より出力さ
れる。
認識部403の一例を第5図を用いて説明する。
この認識部は、多層神経回路網計算部501と、出力デ
ータ記憶部502と、最大カテゴリ検出部503と、確
信度計算部504と、認識結果・リジェクト判定部50
5とから構成されている。
ータ記憶部502と、最大カテゴリ検出部503と、確
信度計算部504と、認識結果・リジェクト判定部50
5とから構成されている。
特徴抽出部402で求められた特徴データは、多層神経
回路網計算部501に転送され、認識処理が行われて出
力ベクトルに変換される。ここでの出力ベクトルは、そ
の要素のそれぞれが認識対象のカテゴリのスコアを表し
ており、出力ベクトルの次元数Nは、認識対象とするカ
テゴリ数に等しい。
回路網計算部501に転送され、認識処理が行われて出
力ベクトルに変換される。ここでの出力ベクトルは、そ
の要素のそれぞれが認識対象のカテゴリのスコアを表し
ており、出力ベクトルの次元数Nは、認識対象とするカ
テゴリ数に等しい。
多層神経回路網計算部501の一例を第6図を用いて説
明する。この例では、3層型のモデルを用いているが、
これは本質的な問題ではなく、2層のもの、4層以上の
モデルを用いた場合、またはそれ以外の結合形式の神経
回路モデルを用いた場合でも容易に拡張が可能である。
明する。この例では、3層型のモデルを用いているが、
これは本質的な問題ではなく、2層のもの、4層以上の
モデルを用いた場合、またはそれ以外の結合形式の神経
回路モデルを用いた場合でも容易に拡張が可能である。
この多層神経回路網計算部は、マトリクス積演算部60
1 と、S関数部602と、中間層記憶部603と、マ
トリクス積演算部604と、S−関数部605と、第1
層重みマトリクス記憶部606と、第2層重みマトリク
ス記憶部607とから構成されている。
1 と、S関数部602と、中間層記憶部603と、マ
トリクス積演算部604と、S−関数部605と、第1
層重みマトリクス記憶部606と、第2層重みマトリク
ス記憶部607とから構成されている。
特徴抽出部402から入力されるベクトル値をoi’(
1≦i≦N、)とし、第1層重みマトリクス記憶部60
6に保持されるマトリクス値をWij(1≦i≦N6,
1≦j≦N1)、中間層記憶部603に保持されるベク
トル値を ’=’(1≦j≦N、)とすると、マトリク
ス積演算部601では、式(3)に従って計算を行う。
1≦i≦N、)とし、第1層重みマトリクス記憶部60
6に保持されるマトリクス値をWij(1≦i≦N6,
1≦j≦N1)、中間層記憶部603に保持されるベク
トル値を ’=’(1≦j≦N、)とすると、マトリク
ス積演算部601では、式(3)に従って計算を行う。
ただし、ここでθJ1 はバイアス値であり、第1層重
みマトリクス記憶部606に記憶される。結果のoJ+
(1≦j≦N、)は各々、S関数部602において式(
4)に従ってo″を求め、中間層記憶部603に記憶す
る。
みマトリクス記憶部606に記憶される。結果のoJ+
(1≦j≦N、)は各々、S関数部602において式(
4)に従ってo″を求め、中間層記憶部603に記憶す
る。
第2層重みマトリクス記憶部607に記憶される重みマ
トリクスをwJm”(1≦j≦N、1≦に≦N2)とし
、この記憶部607に記憶されるバイアス値をθ−とす
るとマトリクス積演算部604では、式(5)を実現す
る計算を行う。結果の。−(l≦に≦N、)は各々、S
関数部605において式(6)に従った計算によりo′
1を求め、出力信号として出力され、出力データ記憶部
502に記憶される。
トリクスをwJm”(1≦j≦N、1≦に≦N2)とし
、この記憶部607に記憶されるバイアス値をθ−とす
るとマトリクス積演算部604では、式(5)を実現す
る計算を行う。結果の。−(l≦に≦N、)は各々、S
関数部605において式(6)に従った計算によりo′
1を求め、出力信号として出力され、出力データ記憶部
502に記憶される。
ここで用いられる重みマトリクスは予め学習により決定
されているものとする。また、S関数として式(4)1
式(6)を用いた場合には、関数の出力値は0から1の
間の小数値となる。
されているものとする。また、S関数として式(4)1
式(6)を用いた場合には、関数の出力値は0から1の
間の小数値となる。
出力データ記憶部502から読み出されたベクトパター
ンは最大カテゴリ検出部503に送られて最大値をもつ
要素が求められ、その要素の表すカテゴリ番号を認識結
果・リジェクト判定部505に送る。
ンは最大カテゴリ検出部503に送られて最大値をもつ
要素が求められ、その要素の表すカテゴリ番号を認識結
果・リジェクト判定部505に送る。
また、出力データ記憶部502から読み出されたベクト
ルデータは確信度計算部504にも送られる。
ルデータは確信度計算部504にも送られる。
確信度計算部504では、式(1)に従った演算により
確信度Rを求める。
確信度Rを求める。
確信度計算部504で得られた値Rは認識結果リジェク
ト判定部505に送られ、しきい値Tと比較され、しき
い値Tよりも大きい場合には認識結果のカテゴリ番号が
コード生成部404へ転送され、確信度Rがしきい値T
よりも小さい場合には、リジェクト信号がコード生成部
404へ転送される。
ト判定部505に送られ、しきい値Tと比較され、しき
い値Tよりも大きい場合には認識結果のカテゴリ番号が
コード生成部404へ転送され、確信度Rがしきい値T
よりも小さい場合には、リジェクト信号がコード生成部
404へ転送される。
ここでは、カテゴリ番号として1からN(Nはカテゴリ
数)までの数値、リジェクト信号として数値0とする。
数)までの数値、リジェクト信号として数値0とする。
次に、第3の発明の一実施例である文字認識装置を説明
する。
する。
文字認識装置全体の構成は第3図に従い、認識部の構成
が第2の発明と異なる。本実施例における認識部700
を第7図に示す。この認識部700は、多層神経回路網
計算部701と、出力データ記憶部702と、データソ
ート部703と、最大カテゴリ検出部704と、確信度
計算部705と、認識結果・リジェクト判定部706と
から構成されている。
が第2の発明と異なる。本実施例における認識部700
を第7図に示す。この認識部700は、多層神経回路網
計算部701と、出力データ記憶部702と、データソ
ート部703と、最大カテゴリ検出部704と、確信度
計算部705と、認識結果・リジェクト判定部706と
から構成されている。
入力パターンは、特徴抽出部402で、特徴ベクトルに
変換されて多層神経回路網計算部701に入力され認識
される。多層神経回路網計算部701での構成は、前述
の第6図での多層神経回路網計算部501の構成と同じ
である。そこからのN次元の出力データは、出力データ
記憶部702に保存される。ここで、Nは認識対象のカ
テゴリ数を表す。
変換されて多層神経回路網計算部701に入力され認識
される。多層神経回路網計算部701での構成は、前述
の第6図での多層神経回路網計算部501の構成と同じ
である。そこからのN次元の出力データは、出力データ
記憶部702に保存される。ここで、Nは認識対象のカ
テゴリ数を表す。
出力データ記憶部702から読み出されたデータは、デ
ータソート部703において大きい値から順に並べ直さ
れる。最大値を持つカテゴリ番号は最大カテゴリレジス
タ704に記憶される。
ータソート部703において大きい値から順に並べ直さ
れる。最大値を持つカテゴリ番号は最大カテゴリレジス
タ704に記憶される。
データソート部703から出力された大きい値のものか
ら順にM個の値は、確信度計算部705に入力され、 ・ ・ ・(8) に従った計算が実行される。ここで、MはNに比べて小
さな数とし、実施例では、手書き数字認識ではMを5と
し、英数字を認識対象とする場合にはMを10とした。
ら順にM個の値は、確信度計算部705に入力され、 ・ ・ ・(8) に従った計算が実行される。ここで、MはNに比べて小
さな数とし、実施例では、手書き数字認識ではMを5と
し、英数字を認識対象とする場合にはMを10とした。
このMの値は、本質的なものでなく他の値でもよい、ま
た、Piはデータソート部703の出力値で、iが小さ
いほどPiは大きな値をとる。α、βはそれぞれ1とし
た。
た、Piはデータソート部703の出力値で、iが小さ
いほどPiは大きな値をとる。α、βはそれぞれ1とし
た。
確信度計算部705で計算された確信度の値は、認識結
果・リジェクト判定部706に送られて、予め設定され
たしきい値Tよりも大きい場合には、認識結果として最
大カテゴリレジスタ内のカテゴリ番号を、さもない場合
にはりジエクト信号をコード生成部404に転送し、こ
こで認識結果の文字コードが生成され出力される。ここ
で、しきい値Tを0.1としたが、これ以外の数値でも
実現は可能である。
果・リジェクト判定部706に送られて、予め設定され
たしきい値Tよりも大きい場合には、認識結果として最
大カテゴリレジスタ内のカテゴリ番号を、さもない場合
にはりジエクト信号をコード生成部404に転送し、こ
こで認識結果の文字コードが生成され出力される。ここ
で、しきい値Tを0.1としたが、これ以外の数値でも
実現は可能である。
以上の説明から明らかなように、本発明のパターン認識
方法および装置では、神経回路網での認識部から出力さ
れた各カテゴリのスコアが、その値の取り得る範囲を(
a、b)とした場合に、1つの要素だけがaの値を取り
、他の要素全てがbの値を取った場合に明確にaの値を
取ったカテゴリが認識結果として正しいものと出力され
る。全カテゴリのうちでの最大値が、範囲の上限aから
離れている場合や、最大値を取るカテゴリに、近い値を
とるカテゴリが複数個存在する場合に、確信度は減少し
、誤認識を起こしている確率の高い認識結果として、こ
の認識結果をリジェクトする。
方法および装置では、神経回路網での認識部から出力さ
れた各カテゴリのスコアが、その値の取り得る範囲を(
a、b)とした場合に、1つの要素だけがaの値を取り
、他の要素全てがbの値を取った場合に明確にaの値を
取ったカテゴリが認識結果として正しいものと出力され
る。全カテゴリのうちでの最大値が、範囲の上限aから
離れている場合や、最大値を取るカテゴリに、近い値を
とるカテゴリが複数個存在する場合に、確信度は減少し
、誤認識を起こしている確率の高い認識結果として、こ
の認識結果をリジェクトする。
リジェクトされた場合には、他の認識方法を起動したり
、人手によって認識結果を修正するなどして認識結果の
信軌度を高めることができる。
、人手によって認識結果を修正するなどして認識結果の
信軌度を高めることができる。
第1図は、本願第1の発明のパターン認識方法の説明図
、 第2図は、特徴抽出部として、ガウスフィルタを用いた
場合の例を示す図、 第3図は、3層構造の神経回路網の計算方法の説明図、 第4図は、文字認識装置のブロック図、第5図は、認識
部の一例を示すブロック図、第6図は、多層神経回路網
計算部の一例を示すブロック図、 第7図は、認識部の他の例を示すブロック図である。 402 ・・・・・特徴抽出部 403 ・・・・・認識部 404 ・・・・・コード生成部 501、701・・・多層神経回路網計算部502、7
02・・・出力データ記憶部503 ・・・・・最大カ
テゴリ検出部504、705・・・確信度計算部 505、706・・・認識結果・リジェクト判定部70
3 ・・・・・データソート部 704 ・・・・・最大カテゴリレジスタ代理人 弁
理士 岩 佐 義 幸 禅2図 馬1図 糸3図 vi)6図 第5図 糸7図
、 第2図は、特徴抽出部として、ガウスフィルタを用いた
場合の例を示す図、 第3図は、3層構造の神経回路網の計算方法の説明図、 第4図は、文字認識装置のブロック図、第5図は、認識
部の一例を示すブロック図、第6図は、多層神経回路網
計算部の一例を示すブロック図、 第7図は、認識部の他の例を示すブロック図である。 402 ・・・・・特徴抽出部 403 ・・・・・認識部 404 ・・・・・コード生成部 501、701・・・多層神経回路網計算部502、7
02・・・出力データ記憶部503 ・・・・・最大カ
テゴリ検出部504、705・・・確信度計算部 505、706・・・認識結果・リジェクト判定部70
3 ・・・・・データソート部 704 ・・・・・最大カテゴリレジスタ代理人 弁
理士 岩 佐 義 幸 禅2図 馬1図 糸3図 vi)6図 第5図 糸7図
Claims (3)
- (1)多層構造の神経回路網を用いたパターン認識方法
において、 入力パターンまたは入力パターンから抽出された特徴量
を入力して、多層構造の神経回路網によってカテゴリを
表す出力ベクトルに変換し、その出力ベクトルから、1
つの要素だけが値域の上限値の近くになり、その他の要
素は値域の下限値の近くであるときに確信度が最大とな
るように確信度を計算し、その確信度をしきい値と比較
して、しきい値よりも大きい場合には出力結果を認識結
果とし、確信度がしきい値よりも小さい場合にはリジェ
クトすることを特徴とするパターン認識方法。 - (2)多層構造の神経回路網を用いたパターン認識装置
において、 入力データからカテゴリを表す出力ベクトル信号へと変
換する神経回路網を実現する手段と、出力ベクトル信号
のうちで最大値を持つカテゴリを検出する手段と、 出力ベクトル信号が、1つの要素だけが値域の上限値の
近くになり、その他の要素は値域の下限値の近くである
ときに確信度が最大となるように確信度を計算する手段
と、 確信度がしきい値より大きい場合には最大値検出部の出
力をもって認識結果とし、確信度がしきい値以下の場合
にはリジェクトとして判定する手段とを備え、 認識結果またはリジェクト信号を出力することを特徴と
するパターン認識装置。 - (3)多層構造の神経回路網を用いたパターン認識装置
において、 入力データからカテゴリを表す出力ベクトル信号へと変
換する神経回路網を実現する手段と、出力信号を降順に
ソートする手段と、 ソートされた結果の最大値のカテゴリを記憶する手段と
、 ソートされた出力ベクトル信号のうちの上位の一定個数
の要素において、第1位の要素だけが値域の上限値の近
くになり、その他の要素は値域の下限値の近くであると
きに確信度が最大となるように確信度を計算する手段と
、 確信度がしきい値より大きい場合には最大値カテゴリ記
憶部の内容をもって認識結果とし、確信度がしきい値以
下の場合にはリジェクトとして判定する手段とを備え、 認識結果またはリジェクト信号を出力することを特徴と
するパターン認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2101837A JP2778194B2 (ja) | 1990-04-19 | 1990-04-19 | パターン認識方法および装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2101837A JP2778194B2 (ja) | 1990-04-19 | 1990-04-19 | パターン認識方法および装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH041870A true JPH041870A (ja) | 1992-01-07 |
| JP2778194B2 JP2778194B2 (ja) | 1998-07-23 |
Family
ID=14311187
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2101837A Expired - Lifetime JP2778194B2 (ja) | 1990-04-19 | 1990-04-19 | パターン認識方法および装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2778194B2 (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE19639884A1 (de) * | 1995-09-27 | 1997-04-03 | Hitachi Ltd | Mustererkennungssystem |
| JP2012146199A (ja) * | 2011-01-13 | 2012-08-02 | Nippon Steel Corp | 視線位置検出装置、視線位置検出方法、及びコンピュータプログラム |
| JP2017224184A (ja) * | 2016-06-16 | 2017-12-21 | 株式会社日立製作所 | 機械学習装置 |
-
1990
- 1990-04-19 JP JP2101837A patent/JP2778194B2/ja not_active Expired - Lifetime
Non-Patent Citations (1)
| Title |
|---|
| INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS =1989 * |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE19639884A1 (de) * | 1995-09-27 | 1997-04-03 | Hitachi Ltd | Mustererkennungssystem |
| US5911002A (en) * | 1995-09-27 | 1999-06-08 | Hitachi, Ltd. | Pattern recognition system |
| DE19639884C2 (de) * | 1995-09-27 | 2000-09-21 | Hitachi Ltd | Mustererkennungssystem |
| JP2012146199A (ja) * | 2011-01-13 | 2012-08-02 | Nippon Steel Corp | 視線位置検出装置、視線位置検出方法、及びコンピュータプログラム |
| JP2017224184A (ja) * | 2016-06-16 | 2017-12-21 | 株式会社日立製作所 | 機械学習装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2778194B2 (ja) | 1998-07-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5287275A (en) | Image recognition apparatus and method for recognizing a pattern within an image | |
| US5337369A (en) | Equipment for fingerprint pattern classification | |
| CN111046774A (zh) | 一种基于卷积神经网络的中文签名笔迹鉴定方法 | |
| US5490223A (en) | Pattern recognition apparatus | |
| CN114331946A (zh) | 一种图像数据处理方法、设备以及介质 | |
| CN111353514A (zh) | 模型训练方法、图像识别方法、装置及终端设备 | |
| CN113689381A (zh) | 波纹管内壁瑕疵检测模型及检测方法 | |
| CN114445657B (zh) | 目标检测方法、装置、电子设备及存储介质 | |
| US3942169A (en) | Pattern recognition system | |
| CN116206227B (zh) | 5g富媒体信息的图片审查系统、方法、电子设备及介质 | |
| KR20160144660A (ko) | 컨볼루션 신경망을 위한 개선된 분류 층 | |
| JPH041870A (ja) | パターン認識方法および装置 | |
| US6694059B1 (en) | Robustness enhancement and evaluation of image information extraction | |
| JP2019057087A (ja) | 文字認識方法及び文字認識システム | |
| Stojanović et al. | Deep learning‐based approach to latent overlapped fingerprints mask segmentation | |
| US5333210A (en) | Method and system for pattern analysis using a coarse-coded neural network | |
| JP3222699B2 (ja) | パターン認識装置 | |
| JPH04112391A (ja) | パターン識別方法 | |
| US5950180A (en) | Process for the classification of objects | |
| CN111310806B (zh) | 分类网络及图像处理方法、装置、系统和存储介质 | |
| JPH08263660A (ja) | 信号認識方法、信号認識装置、信号認識装置の学習方法及び信号認識装置の学習装置 | |
| CN116645727B (zh) | 一种基于Openpose模型算法的行为捕捉识别方法 | |
| JPH05303642A (ja) | パターン認識装置 | |
| JPH05282457A (ja) | 被写体認識方法 | |
| JPH05303645A (ja) | 画像認識装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090508 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100508 Year of fee payment: 12 |
|
| EXPY | Cancellation because of completion of term |