JPH0447486A - 文字認識方法 - Google Patents
文字認識方法Info
- Publication number
- JPH0447486A JPH0447486A JP2154085A JP15408590A JPH0447486A JP H0447486 A JPH0447486 A JP H0447486A JP 2154085 A JP2154085 A JP 2154085A JP 15408590 A JP15408590 A JP 15408590A JP H0447486 A JPH0447486 A JP H0447486A
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- change
- amount
- calculating
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 70
- 239000013598 vector Substances 0.000 claims abstract description 82
- 238000013528 artificial neural network Methods 0.000 claims abstract description 43
- 238000000605 extraction Methods 0.000 claims abstract description 41
- 239000011159 matrix material Substances 0.000 claims description 14
- 230000003247 decreasing effect Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 description 19
- 210000000988 bone and bone Anatomy 0.000 description 11
- 238000005452 bending Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 229940050561 matrix product Drugs 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 241000272814 Anser sp. Species 0.000 description 1
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、文字画像から特徴量を求めた後に、多層神経
回路網を用いて識別を行う文字認識方法に関するもので
ある。
回路網を用いて識別を行う文字認識方法に関するもので
ある。
従来、多層神経回路網を用いた文字認識では、文字画像
から特徴抽出を行い、その特徴量を多層神経回路網に入
力し、文献じA Neural NetworkDig
it Recognition’ by D、J、Bu
rr: TEEE International Co
nference on System、 Man a
nd Cyber−netics: 1986. pp
、1621−1625)に示されるように、各要素がカ
テゴリへの類似度を表現するようなベクトル量として出
力信号を得る。多くの場合、出力信号の要素は、0から
1の数値または一工から1の数値として表現されている
。ベクトル量の要素の中で最大の値を取る要素が表すカ
テゴリを認識結果とするものである。さらに、出力信号
から認識結果に対する確信度が計算され、その確信度が
しきい値よりも高い場合には、その認識結果を出力し、
しきい値よりも低い場合には、その認識結果を棄却して
認識結果を出力しないことにより、誤った認識結果を出
力することを避け、認識結果の信顛性を高めている。
から特徴抽出を行い、その特徴量を多層神経回路網に入
力し、文献じA Neural NetworkDig
it Recognition’ by D、J、Bu
rr: TEEE International Co
nference on System、 Man a
nd Cyber−netics: 1986. pp
、1621−1625)に示されるように、各要素がカ
テゴリへの類似度を表現するようなベクトル量として出
力信号を得る。多くの場合、出力信号の要素は、0から
1の数値または一工から1の数値として表現されている
。ベクトル量の要素の中で最大の値を取る要素が表すカ
テゴリを認識結果とするものである。さらに、出力信号
から認識結果に対する確信度が計算され、その確信度が
しきい値よりも高い場合には、その認識結果を出力し、
しきい値よりも低い場合には、その認識結果を棄却して
認識結果を出力しないことにより、誤った認識結果を出
力することを避け、認識結果の信顛性を高めている。
手書き文字の特徴としては、文字線のかすれによる欠落
やにじみによる穴のつぶれが多いことや、非線形や文字
の位相構造が変化することが挙げられる。前述のような
特徴抽出を行った後に、識別を行うような従来手法では
、特徴抽出段階でパラメータが用いられており、そのパ
ラメータは予め決定され固定されている。文字認識の実
行時において、認識結果が棄却された場合に、多くの場
合に人間がみると明確に認識できることがある。これは
特徴抽出の段階でパラメータが固定されているために、
文字パターンの変形に特徴抽出処理が追従できず、正し
く特徴が抽出できないために、識別も正しく行えずに認
識結果が棄却されてしまうためである。
やにじみによる穴のつぶれが多いことや、非線形や文字
の位相構造が変化することが挙げられる。前述のような
特徴抽出を行った後に、識別を行うような従来手法では
、特徴抽出段階でパラメータが用いられており、そのパ
ラメータは予め決定され固定されている。文字認識の実
行時において、認識結果が棄却された場合に、多くの場
合に人間がみると明確に認識できることがある。これは
特徴抽出の段階でパラメータが固定されているために、
文字パターンの変形に特徴抽出処理が追従できず、正し
く特徴が抽出できないために、識別も正しく行えずに認
識結果が棄却されてしまうためである。
本発明の目的は、文字線の途切れや穴のつぶれ、非線形
な局所位置の変化、位相構造の変化という多様な文字パ
ターンの変形に、従来の文字認識方法が追従できないと
いう欠点を除去せしめ、入力された文字の変形が大きい
場合にも、その変化に追従できる文字認識方法を提供す
ることにある。
な局所位置の変化、位相構造の変化という多様な文字パ
ターンの変形に、従来の文字認識方法が追従できないと
いう欠点を除去せしめ、入力された文字の変形が大きい
場合にも、その変化に追従できる文字認識方法を提供す
ることにある。
第1の発明は、文字画像から特徴を計算して多層神経回
路網により識別処理を行う文字認識方法において、 文字画像から複数のパラメータ値を用いて特徴抽出を行
うステップと、 それによって得られた特徴ベクトルを入力して、各カテ
ゴリ毎のスコアを出力する多層神経回路網を計算するス
テップと、 多層神経回路網の出力から出力結果の確信度を計算し、
その確信度をしきい値と比較して、しきい値よりも高け
れば認識結果をそのまま出力するステップと、 もししきい値よりも低ければ、各パラメータを一定値増
減させて確信度を求め、確信度が高くなった場合のパラ
メータの変更量を求めるステ・ンブと、 全パラメータについて変更量を求めた後に、全パラメー
タを変更して特徴抽出から再試行することを制御するス
テップとを、 含むことを特徴とする。
路網により識別処理を行う文字認識方法において、 文字画像から複数のパラメータ値を用いて特徴抽出を行
うステップと、 それによって得られた特徴ベクトルを入力して、各カテ
ゴリ毎のスコアを出力する多層神経回路網を計算するス
テップと、 多層神経回路網の出力から出力結果の確信度を計算し、
その確信度をしきい値と比較して、しきい値よりも高け
れば認識結果をそのまま出力するステップと、 もししきい値よりも低ければ、各パラメータを一定値増
減させて確信度を求め、確信度が高くなった場合のパラ
メータの変更量を求めるステ・ンブと、 全パラメータについて変更量を求めた後に、全パラメー
タを変更して特徴抽出から再試行することを制御するス
テップとを、 含むことを特徴とする。
第2の発明は、文字画像から特徴を計算して多層神経回
路網により識別処理を行う文字認識方法において、 文字画像から複数のパラメータ値を用いて特徴抽出を行
うステップと、 それによって得られた特徴ベクトルを入力して、各カテ
ゴリ毎のスコアを出力する多層神経回路網を計算するス
テップと、 多層神経回路網の出力から出力結果の確信度を計算し、
その確信度をしきい値と比較して、しきい値よりも高け
れば認識結果をそのまま出力するステップと、 もししきい値よりも低ければ、確信度を高めるように多
層神経回路網に入力する特徴ベクトルが変化すべき量を
求めるステップと、 1つのパラメータが影響を与える特徴ベクトル内の要素
の変更量の和を求めるステップと、特徴ベクトルの変化
量の和に基づいて特徴抽出でのパラメータ値を変更する
ステップと、変更したパラメータ値を用いて特徴抽出か
ら再試行することを制御するステップとを、含むことを
特徴とする。
路網により識別処理を行う文字認識方法において、 文字画像から複数のパラメータ値を用いて特徴抽出を行
うステップと、 それによって得られた特徴ベクトルを入力して、各カテ
ゴリ毎のスコアを出力する多層神経回路網を計算するス
テップと、 多層神経回路網の出力から出力結果の確信度を計算し、
その確信度をしきい値と比較して、しきい値よりも高け
れば認識結果をそのまま出力するステップと、 もししきい値よりも低ければ、確信度を高めるように多
層神経回路網に入力する特徴ベクトルが変化すべき量を
求めるステップと、 1つのパラメータが影響を与える特徴ベクトル内の要素
の変更量の和を求めるステップと、特徴ベクトルの変化
量の和に基づいて特徴抽出でのパラメータ値を変更する
ステップと、変更したパラメータ値を用いて特徴抽出か
ら再試行することを制御するステップとを、含むことを
特徴とする。
第3の発明は、文字画像から特徴を計算して多層神経回
路網により識別処理を行う文字認識方法において、 文字画像から複数のパラメータ値を用いて特徴抽出を行
うステップと、 それによって得られた特徴ベクトルを入力して、各カテ
ゴリ毎のスコアを出力する多層神経回路網を計算するス
テップと、 多層神経回路網の出力から出力結果の確信度を計算し、
その確信度をしきい値と比較して、しきい値よりも高け
れば認識結果をそのまま出力するステップと、 もししきい値よりも低ければ、確信度を高めるように多
層神経回路網に入力する特徴ベクトルが変化すべき量を
求めるステップと、 1つのパラメータを増減させた場合の特徴ベクトルの変
化量を求め、全パラメータに対する特徴ベクトルの変化
量の組による行列の擬逆行列と特徴ベクトルが変化すべ
き量を表すベクトルとの積から各パラメータを変更する
量を求めるステップと、 変更したパラメータ値を用いて特徴抽出から再試行する
ことを制御するステップとを、含むことを特徴とする。
路網により識別処理を行う文字認識方法において、 文字画像から複数のパラメータ値を用いて特徴抽出を行
うステップと、 それによって得られた特徴ベクトルを入力して、各カテ
ゴリ毎のスコアを出力する多層神経回路網を計算するス
テップと、 多層神経回路網の出力から出力結果の確信度を計算し、
その確信度をしきい値と比較して、しきい値よりも高け
れば認識結果をそのまま出力するステップと、 もししきい値よりも低ければ、確信度を高めるように多
層神経回路網に入力する特徴ベクトルが変化すべき量を
求めるステップと、 1つのパラメータを増減させた場合の特徴ベクトルの変
化量を求め、全パラメータに対する特徴ベクトルの変化
量の組による行列の擬逆行列と特徴ベクトルが変化すべ
き量を表すベクトルとの積から各パラメータを変更する
量を求めるステップと、 変更したパラメータ値を用いて特徴抽出から再試行する
ことを制御するステップとを、含むことを特徴とする。
第1の発明では、文字画像から特徴抽出、識別を行った
後に、各カテゴリのスコアから認識結果の確信度を計算
し、その確信度がしきい値より低い場合には、特徴抽出
でのパラメータを少量変化させて特徴抽出、識別を行っ
てみて、認識結果の確信度の高い方を選択することによ
り徐々に高い確信度をもつ認識結果を得る。
後に、各カテゴリのスコアから認識結果の確信度を計算
し、その確信度がしきい値より低い場合には、特徴抽出
でのパラメータを少量変化させて特徴抽出、識別を行っ
てみて、認識結果の確信度の高い方を選択することによ
り徐々に高い確信度をもつ認識結果を得る。
この第1の発明では特徴抽出の方法に依存せず、ここで
は特徴抽出でのパラメータ集合を(θj1≦j≦パラメ
ータ数)として、抽出された特徴ベクトルを[fil
(1≦i≦特徴次元)とする。
は特徴抽出でのパラメータ集合を(θj1≦j≦パラメ
ータ数)として、抽出された特徴ベクトルを[fil
(1≦i≦特徴次元)とする。
特徴ベクトルを多層神経回路網に入力し、各カテゴリ毎
のスコアを計算する。多層神経回路網での計算は、3層
の場合を例にとると、以下のように計算できる。
のスコアを計算する。多層神経回路網での計算は、3層
の場合を例にとると、以下のように計算できる。
特徴ベクトル値を多層神経回路網に入力し第0層のベク
トル値として、第0層ベクトル(iから第1層のマート
リクス積を計算する。第0層のベクトル値をoi (1
≦i≦N、)とし、第1層重みマトリクス値をW、j’
(l≦i≦N0,1≦j≦N+)、計算結果のベクト
ル値をo、’(1≦j≦N、)とすると、 OJ′=Σ (O工’XWtj’) +θj ’
(1)となる。ただし、ここでθ、1はバイ
アス値である。次にoJ’(1≦j≦N、)の各々に対
して以下の式に従ってS関数を計算する。
トル値として、第0層ベクトル(iから第1層のマート
リクス積を計算する。第0層のベクトル値をoi (1
≦i≦N、)とし、第1層重みマトリクス値をW、j’
(l≦i≦N0,1≦j≦N+)、計算結果のベクト
ル値をo、’(1≦j≦N、)とすると、 OJ′=Σ (O工’XWtj’) +θj ’
(1)となる。ただし、ここでθ、1はバイ
アス値である。次にoJ’(1≦j≦N、)の各々に対
して以下の式に従ってS関数を計算する。
o’j’ = 1/2 (1+tanh (oj’)
) (2)さらに、第2層重みマトリクスをw
j−(1≦jsN+、1≦に≦N t )とし、バイア
ス値をθ−とすると、 o−=Σ(0’=’XWJh”)+θ−(3)なる計算
を行う。続いて、o−(1≦に≦N2)は各々、以下の
ようにS関数が計算され、各カテゴリのスコアとして出
力される。
) (2)さらに、第2層重みマトリクスをw
j−(1≦jsN+、1≦に≦N t )とし、バイア
ス値をθ−とすると、 o−=Σ(0’=’XWJh”)+θ−(3)なる計算
を行う。続いて、o−(1≦に≦N2)は各々、以下の
ようにS関数が計算され、各カテゴリのスコアとして出
力される。
o’w” = 1 / 2 (1+tanh (oh”
) ) (4)次に多層神経回路網の出力値か
ら確信度を計算する。確信度の計算方法はどのようなも
のでも良いが、例えば以下のような確信度Rの定義式を
用いることができる。
) ) (4)次に多層神経回路網の出力値か
ら確信度を計算する。確信度の計算方法はどのようなも
のでも良いが、例えば以下のような確信度Rの定義式を
用いることができる。
・ ・ ・(5)
この式では、認識対象のカテゴリ数をNとして、神経回
路網からの出力ベクトルをP、(1≦i≦N、O≦P8
≦1)、α、βを係数とする。この確信度の値は、カテ
ゴリのスコアのうち1つの値だけが上限値1に近く、他
の全ての値が下限値0に近いときに最大値を取り、最大
値を持つ要素P。
路網からの出力ベクトルをP、(1≦i≦N、O≦P8
≦1)、α、βを係数とする。この確信度の値は、カテ
ゴリのスコアのうち1つの値だけが上限値1に近く、他
の全ての値が下限値0に近いときに最大値を取り、最大
値を持つ要素P。
が1から離れたり、第2位以下の要素が最大値に接近し
た場合に、Rは小さくなる。
た場合に、Rは小さくなる。
確信度が予め定めたしきい値よりも大きい場合には、識
別結果は充分な確信度が得られたものと見なし、その結
果を認識結果として出力する。確信度Rがしきい値より
も小さい場合には、特徴抽出でのパラメータ値を調節し
て認識処理を再試行する。パラメータ値の調節方法を以
下に述べる。
別結果は充分な確信度が得られたものと見なし、その結
果を認識結果として出力する。確信度Rがしきい値より
も小さい場合には、特徴抽出でのパラメータ値を調節し
て認識処理を再試行する。パラメータ値の調節方法を以
下に述べる。
まず、特徴抽出段階での第i番目のパラメータ値θ、だ
けを一定量大きくして、特徴抽出・識別をした場合の認
識結果の確信度R、+と、一定量小さくした場合の認識
結果の確信度R8−を求める。パラメータ変更前の確信
度をRoとして、Ro。
けを一定量大きくして、特徴抽出・識別をした場合の認
識結果の確信度R、+と、一定量小さくした場合の認識
結果の確信度R8−を求める。パラメータ変更前の確信
度をRoとして、Ro。
R,”、R,−を比較し、高い確信度を得た場合の変更
量を、第i番目のパラメータの変更量Δθ。
量を、第i番目のパラメータの変更量Δθ。
として定めることができる。全パラメータに対して変更
量を求めた後に、それらを元のパラメータ値に加えて全
パラメータを変更して、認識処理を行うことにより、少
し高い確信度の認識結果を得ることができる。
量を求めた後に、それらを元のパラメータ値に加えて全
パラメータを変更して、認識処理を行うことにより、少
し高い確信度の認識結果を得ることができる。
これを繰り返し行うことにより、徐々に最適なパラメー
タへと変更して、確信度がしきい値を超えたところで繰
り返し処理を終了すれば、確信度の高い認識結果を得る
ことができる。−足回数の繰り返し後も、確信度がしき
い値を超えない場合には、入力文字画像を認識できない
ものとして棄却する。
タへと変更して、確信度がしきい値を超えたところで繰
り返し処理を終了すれば、確信度の高い認識結果を得る
ことができる。−足回数の繰り返し後も、確信度がしき
い値を超えない場合には、入力文字画像を認識できない
ものとして棄却する。
第2の発明では、文字画像から特徴抽出、識別を行った
後に、各カテゴリのスコアから認識結果の確信度を計算
し、その確信度がしきい値より低い場合には、第1の発
明と同様の確信度の規範に基づいて、多層神経回路網に
入力する特徴量が変化すべき値を求めた後に、それを実
現するための特徴抽出でのパラメータの変更量を求める
ことにより、徐々に確信度の高い認識結果を得ることが
できる。確信度Rを太き(するための入力待微量の変更
量を求めるには、以下の式に従って計算できる。
後に、各カテゴリのスコアから認識結果の確信度を計算
し、その確信度がしきい値より低い場合には、第1の発
明と同様の確信度の規範に基づいて、多層神経回路網に
入力する特徴量が変化すべき値を求めた後に、それを実
現するための特徴抽出でのパラメータの変更量を求める
ことにより、徐々に確信度の高い認識結果を得ることが
できる。確信度Rを太き(するための入力待微量の変更
量を求めるには、以下の式に従って計算できる。
Δf、=rdR/d f、 (
6)これは、確信度Rの計算式を定める式の偏微分によ
りΔf1の計算式は得られることを示している。
6)これは、確信度Rの計算式を定める式の偏微分によ
りΔf1の計算式は得られることを示している。
例えば、第1の発明で説明したような式(1)から式(
4)で表される3層の神経回路網によって識別を行うと
し、さらに確信度の定義式として、式(5)を用いて、
係数α、βをそれぞれ1とした場合には、特徴ベクトル
の変更量Δf、は、 Δf、= ・ ・(7) となり、実際の値を代入して計算することにより、特徴
ベクトルの要素の変更量Δf、は計算できる。
4)で表される3層の神経回路網によって識別を行うと
し、さらに確信度の定義式として、式(5)を用いて、
係数α、βをそれぞれ1とした場合には、特徴ベクトル
の変更量Δf、は、 Δf、= ・ ・(7) となり、実際の値を代入して計算することにより、特徴
ベクトルの要素の変更量Δf、は計算できる。
ここで、γは0.1などの適当な小さな値でよい。
また、Uは式(2)5式(4)でのシグモイド関数の傾
き制御のパラメータであり、hjは多層神経回路網での
第1層ユニットの第j番目のユニットの出力値で、式(
2)での0′1 と同一であり、qkは第2層の第に番
目のユニットの出力値で、式(4)でのOL、l と同
一とする。
き制御のパラメータであり、hjは多層神経回路網での
第1層ユニットの第j番目のユニットの出力値で、式(
2)での0′1 と同一であり、qkは第2層の第に番
目のユニットの出力値で、式(4)でのOL、l と同
一とする。
次に特徴ベクトルの変更を実現するための特徴抽出での
パラメータの変更量を求める。これは特徴抽出でのパラ
メータが影響する特徴ベクトルの要素の変更量を足し合
わせることにより、パラメータを変更すべき値を求める
。第j番目のパラメータθ、を増加させた時に、増加す
る特徴ベクトルの要素の集合F、゛と減少する特徴ベク
トルの要素の集合FJ″を予め定めておき、1つのパラ
メータが影響する特徴ベクトルの要素の変更蓋Δf、の
総和からパラメータの変更量を求める。
パラメータの変更量を求める。これは特徴抽出でのパラ
メータが影響する特徴ベクトルの要素の変更量を足し合
わせることにより、パラメータを変更すべき値を求める
。第j番目のパラメータθ、を増加させた時に、増加す
る特徴ベクトルの要素の集合F、゛と減少する特徴ベク
トルの要素の集合FJ″を予め定めておき、1つのパラ
メータが影響する特徴ベクトルの要素の変更蓋Δf、の
総和からパラメータの変更量を求める。
F 、 +に属する要素の変更量Δf、の総和をΔθ、
とし、F、−に属する要素の変更量のΔf、の総和をΔ
θ、−とした場合に、パラメータの変更量Δθ、は、 Δθj=Δθ、−Δθj −(8) によって求められる。Δθiの方がΔθ、−より大きい
場合には、パラメータθ1を増加させた場合に増加する
特徴ベクトルの要素の方を大きく変更すべきであること
がわかり、パラメータθ、をΔθjに従って増加させれ
ばよく、逆にΔθ1−の方が大きい場合には、パラメー
タθjを減少させたときに増加する特徴ベクトルの方を
大きく変更すべきであることがわかり、パラメータθj
をΔθ、に従って減少させる。
とし、F、−に属する要素の変更量のΔf、の総和をΔ
θ、−とした場合に、パラメータの変更量Δθ、は、 Δθj=Δθ、−Δθj −(8) によって求められる。Δθiの方がΔθ、−より大きい
場合には、パラメータθ1を増加させた場合に増加する
特徴ベクトルの要素の方を大きく変更すべきであること
がわかり、パラメータθ、をΔθjに従って増加させれ
ばよく、逆にΔθ1−の方が大きい場合には、パラメー
タθjを減少させたときに増加する特徴ベクトルの方を
大きく変更すべきであることがわかり、パラメータθj
をΔθ、に従って減少させる。
これを全パラメータに対して計算して、全パラメータを
変更すれば、確信度を少し高めるための特徴ベクトルの
変更量を実現できる。その後に認識処理を再試行して、
少し確信度の高い認識結果を得ることができる。これを
繰り返し行って、徐々に最適なパラメータへと変更して
、確信度がしきい値を超えたところで繰り返し処理を終
了することにより、確信度の高い結果を得ることができ
る。−足回数の繰り返し後も、確信度がしきい値を超え
ない場合には、入力文字画像を認識できないものとして
棄却する。
変更すれば、確信度を少し高めるための特徴ベクトルの
変更量を実現できる。その後に認識処理を再試行して、
少し確信度の高い認識結果を得ることができる。これを
繰り返し行って、徐々に最適なパラメータへと変更して
、確信度がしきい値を超えたところで繰り返し処理を終
了することにより、確信度の高い結果を得ることができ
る。−足回数の繰り返し後も、確信度がしきい値を超え
ない場合には、入力文字画像を認識できないものとして
棄却する。
第3の発明では、文字画像から特徴抽出、識別を行った
後に、各カテゴリのスコアから認識結果の確信度を計算
し、その確信度がしきい値より低い場合には、第2の発
明と同様の確信度の規範に基づいて、式(6)と式(7
)に従って確信度を高めるために特徴ベクトルの要素の
変更量EΔf、Jを求め、それを列ベクトルAとする。
後に、各カテゴリのスコアから認識結果の確信度を計算
し、その確信度がしきい値より低い場合には、第2の発
明と同様の確信度の規範に基づいて、式(6)と式(7
)に従って確信度を高めるために特徴ベクトルの要素の
変更量EΔf、Jを求め、それを列ベクトルAとする。
次に特徴抽出での第1番目のパラメータθiを一定量増
減させた場合の特徴ベクトルをそれぞれ[fiパ]と[
fi’1として、その差分ベクトルを、 [Δfi’]−[Δfi”] −[Δfi’−]
(9)に従って求め、それを全パラメータに対して行
って得たベクトル集合を行列Bとする。パラメータの変
更量の列ベクトル[Δθ、]をCとすると、A=BC0
0) なる線形変換を仮定すれば、BtをBの擬逆行列とする
と、パラメータの変更量のベクトルCは、C=B’A
00で求められる。これ
により、確信度を高めるように求めた特徴ベクトルの変
更量を実現するパラメータの変更量[Δθ、コを求める
ことができる。
減させた場合の特徴ベクトルをそれぞれ[fiパ]と[
fi’1として、その差分ベクトルを、 [Δfi’]−[Δfi”] −[Δfi’−]
(9)に従って求め、それを全パラメータに対して行
って得たベクトル集合を行列Bとする。パラメータの変
更量の列ベクトル[Δθ、]をCとすると、A=BC0
0) なる線形変換を仮定すれば、BtをBの擬逆行列とする
と、パラメータの変更量のベクトルCは、C=B’A
00で求められる。これ
により、確信度を高めるように求めた特徴ベクトルの変
更量を実現するパラメータの変更量[Δθ、コを求める
ことができる。
これを基に全パラメータを変更して認識処理を再試行す
れば、少し確信度の高い認識結果を得ることができる。
れば、少し確信度の高い認識結果を得ることができる。
これを繰り返し行って徐々に最適なパラメータへと変更
して、確信度がしきい値を超えたところで繰り返し処理
を終了することにより、確信度の高い結果を得ることが
できる。
して、確信度がしきい値を超えたところで繰り返し処理
を終了することにより、確信度の高い結果を得ることが
できる。
以下、図面を用いて本発明の文字認識方法の実施例を説
明する。
明する。
第1図は、第1の発明の文字認識方法の処理の流れ図を
示す。
示す。
文字入カステップ102では、粒状雑音が除去された後
の文字画像を1文字ずっ二値画像として入力する。初期
パラメータ設定ステップ103では、特徴抽出のための
パラメータを初期的に設定する。
の文字画像を1文字ずっ二値画像として入力する。初期
パラメータ設定ステップ103では、特徴抽出のための
パラメータを初期的に設定する。
本実施例では、後述のように特徴ベクトルとして輪郭線
の曲率と方向を用いるので、輪郭線の疑似方向と疑似曲
率を求めるための輪郭線追跡の画素数を第1のパラメー
タθ1とし、曲率を5種類に分類するためのパラメータ
(θ2.θ3.θ4.θ5)を4つ用意する。初期的な
パラメータ値として、それぞれ(5,1,2,0,2,
−0,2,−1,2)と設定する。ここで説明する特徴
抽出方法とそのパラメータは、本発明を説明する上で便
宜的なもので本質的な問題ではない。
の曲率と方向を用いるので、輪郭線の疑似方向と疑似曲
率を求めるための輪郭線追跡の画素数を第1のパラメー
タθ1とし、曲率を5種類に分類するためのパラメータ
(θ2.θ3.θ4.θ5)を4つ用意する。初期的な
パラメータ値として、それぞれ(5,1,2,0,2,
−0,2,−1,2)と設定する。ここで説明する特徴
抽出方法とそのパラメータは、本発明を説明する上で便
宜的なもので本質的な問題ではない。
特徴ベクトル計算ステップ104では、第2図に示すよ
うに局所構造解析ステップ201を実施する。
うに局所構造解析ステップ201を実施する。
局所構造解析の内容を第3図を用いて説明する。
まず、文字サイズの正規化ステップ301では、2値の
文字パターンを一定の大きさに正規化する。
文字パターンを一定の大きさに正規化する。
次に、その2値画像の黒画素と白画素との隣接する位置
を順に探索することにより輪郭抽出ステップ302を行
い、ステップ303では、その輪郭上の各点から両方向
に長さθ、の触手をのばし、両方向の触手のなす角度を
曲率とすることにより輪郭点の曲率を計算し、さらに両
方向にのばした触手の方向の平均を輪郭点の方向とする
。続くステ・ンブ304では、連続するL個の曲率のデ
ータから曲率の平滑化をする。ここでは、正規化処理は
横30画素、縦40ii1素程度になるようにし、曲率
平滑化の画素数りを5画素とする。上記の平滑化された
曲率データを基に、ステップ305で局所構造への分割
を行う、ここで、局所構造として5種類のものを用いる
0局所構造の抽出には、曲率φ(s)(Sは起点からの
輪郭上の距離)と4つのパラメータ(θ2〜θ、)を用
いる。
を順に探索することにより輪郭抽出ステップ302を行
い、ステップ303では、その輪郭上の各点から両方向
に長さθ、の触手をのばし、両方向の触手のなす角度を
曲率とすることにより輪郭点の曲率を計算し、さらに両
方向にのばした触手の方向の平均を輪郭点の方向とする
。続くステ・ンブ304では、連続するL個の曲率のデ
ータから曲率の平滑化をする。ここでは、正規化処理は
横30画素、縦40ii1素程度になるようにし、曲率
平滑化の画素数りを5画素とする。上記の平滑化された
曲率データを基に、ステップ305で局所構造への分割
を行う、ここで、局所構造として5種類のものを用いる
0局所構造の抽出には、曲率φ(s)(Sは起点からの
輪郭上の距離)と4つのパラメータ(θ2〜θ、)を用
いる。
(0)直線分(θ、〉φ(S)〉θ4なるSの区間)
(1)正曲率の曲線骨(θ2〉φ(S)〉θ3なるSの
区間) (2)負曲率の曲線骨(θ4〉φ(S)〉θ、なるSの
区間) (3)正曲率の屈曲点(φ(S)〉θ2なるSの区間) (4)負曲率の屈曲点(φ(S)〈θ、なるSの区間) ステップ306では、近接する同種の局所構造のうち、
それらの間隔がしきい値以下の場合には該当する2つの
局所構造を統合し1つにする。このしきい値は、実施例
では2画素とした。また、ステップ307では局所構造
のうちの曲線骨は、局所構造の部分における曲率の総和
が、π/2を超えないように分割される。屈曲点では、
同様に3π/2を超えないように分割される。このよう
にして求められた局所構造は、ステップ30Bにおいて
、その始点、終点の座標と方向が5種類の局所構造ごと
に記憶される。このようにして抽出された局所構造の例
を第4図に示す、第4図(a)は、抽出された文字の輪
郭線401を示し、第4図Φ)は抽出された局所構造の
例を示す。第4図(b)において白丸から白丸までを結
んだ実線分が1つの局所構造である。402は直線分で
あり、403は正曲率の曲線骨、404は負曲率の曲線
骨、405は正曲率の屈曲点、406は負曲率の屈曲点
の例である。
区間) (2)負曲率の曲線骨(θ4〉φ(S)〉θ、なるSの
区間) (3)正曲率の屈曲点(φ(S)〉θ2なるSの区間) (4)負曲率の屈曲点(φ(S)〈θ、なるSの区間) ステップ306では、近接する同種の局所構造のうち、
それらの間隔がしきい値以下の場合には該当する2つの
局所構造を統合し1つにする。このしきい値は、実施例
では2画素とした。また、ステップ307では局所構造
のうちの曲線骨は、局所構造の部分における曲率の総和
が、π/2を超えないように分割される。屈曲点では、
同様に3π/2を超えないように分割される。このよう
にして求められた局所構造は、ステップ30Bにおいて
、その始点、終点の座標と方向が5種類の局所構造ごと
に記憶される。このようにして抽出された局所構造の例
を第4図に示す、第4図(a)は、抽出された文字の輪
郭線401を示し、第4図Φ)は抽出された局所構造の
例を示す。第4図(b)において白丸から白丸までを結
んだ実線分が1つの局所構造である。402は直線分で
あり、403は正曲率の曲線骨、404は負曲率の曲線
骨、405は正曲率の屈曲点、406は負曲率の屈曲点
の例である。
次に第2図の特徴ベクトル計算ステップ202の手順に
ついて、第5図を用いて説明する。ステップ501にお
ける局所構造の位置計算では、局所構造の始点と終点の
座標の平均を局所構造の位置として定め、さらに文字を
nXmの粗メツシユで区切り、局所構造の属するメツシ
ュの位1f(i、j)(0≦i≦n−1,0≦j≦m−
1)を求める。
ついて、第5図を用いて説明する。ステップ501にお
ける局所構造の位置計算では、局所構造の始点と終点の
座標の平均を局所構造の位置として定め、さらに文字を
nXmの粗メツシユで区切り、局所構造の属するメツシ
ュの位1f(i、j)(0≦i≦n−1,0≦j≦m−
1)を求める。
ステップ502では、局所構造の始点の方向ベクトルと
終点の方向ベクトル平均ベクトルにより局所構造の方向
を定め、これを45°おきの8方向に量子化し、方向コ
ードq(0≦9≦7)を求める。
終点の方向ベクトル平均ベクトルにより局所構造の方向
を定め、これを45°おきの8方向に量子化し、方向コ
ードq(0≦9≦7)を求める。
以上局所構造の種類番号P(上記の0から4)、メツシ
ュの位置(i、j)、方向dを用いて、特徴ベクトルの
要素番号 に=5(8(ixm+j)+q)+p+1 02)を
求め、特徴ベクトル[fm] (k=1〜D、 D=
nXmX5x8)に特徴量を加算する。ステップ503
で局所構造が屈曲点か否かを判定し、屈曲点の場合〆は
ステップ506に進み、特徴ベクトルの要素に特徴量と
して1を加算し、屈曲点でなければステップ504に進
み局所構造の大きさとして、局所構造の始点から終点ま
での輪郭線上の距離を特徴とする求め、ステップ505
において特徴ベクトルの要素に加算する。全局所構造に
ついての処理を終了するまで、ステップ501からステ
ップ507までの処理を繰り返して、入力文字データの
特徴ベクトル[r、]を求める。
ュの位置(i、j)、方向dを用いて、特徴ベクトルの
要素番号 に=5(8(ixm+j)+q)+p+1 02)を
求め、特徴ベクトル[fm] (k=1〜D、 D=
nXmX5x8)に特徴量を加算する。ステップ503
で局所構造が屈曲点か否かを判定し、屈曲点の場合〆は
ステップ506に進み、特徴ベクトルの要素に特徴量と
して1を加算し、屈曲点でなければステップ504に進
み局所構造の大きさとして、局所構造の始点から終点ま
での輪郭線上の距離を特徴とする求め、ステップ505
において特徴ベクトルの要素に加算する。全局所構造に
ついての処理を終了するまで、ステップ501からステ
ップ507までの処理を繰り返して、入力文字データの
特徴ベクトル[r、]を求める。
以上の特徴ベクトル計算ステップ104で求められた特
徴ベクトルは、第1図の多層神経回路網計算ステップ1
05において、各カテゴリ毎のスコアに変換される。多
層神経回路網計算ステップ105での処理手順の詳細な
説明を第6図を用いて行う。
徴ベクトルは、第1図の多層神経回路網計算ステップ1
05において、各カテゴリ毎のスコアに変換される。多
層神経回路網計算ステップ105での処理手順の詳細な
説明を第6図を用いて行う。
第6図では、第0層から第2層までの3層構造の神経回
路網の計算方法を説明しているが、本発明では、3層構
造に限るものではなく、2層のものや4層以上のものに
も拡張が可能である。
路網の計算方法を説明しているが、本発明では、3層構
造に限るものではなく、2層のものや4層以上のものに
も拡張が可能である。
第6図のステップ601では、第1図のステップ104
によって抽出された特徴ベクトル値を多層神経回路網に
入力し第0層のベクトル値として、式(1)に従って第
0層ベクトル値から第1層のマトリクス積o=’(1≦
j≦Nl)を計算する。次にステップ602でoJ′の
各々に対して、式(2)に従ってS関数を計算する。
によって抽出された特徴ベクトル値を多層神経回路網に
入力し第0層のベクトル値として、式(1)に従って第
0層ベクトル値から第1層のマトリクス積o=’(1≦
j≦Nl)を計算する。次にステップ602でoJ′の
各々に対して、式(2)に従ってS関数を計算する。
次にステップ603では、式(3)に従って第2層のマ
トリクス積oh”(l≦に≦N2)を求める。さらにス
テップ604において、o kZは各々の式(4)に従
ってS関数が計算され、各カテゴリのスコアとして出力
される。
トリクス積oh”(l≦に≦N2)を求める。さらにス
テップ604において、o kZは各々の式(4)に従
ってS関数が計算され、各カテゴリのスコアとして出力
される。
ここで用いられる第1層および第2層の重みマトリクス
は、文献(”An Introduction to
Compu−ting with Neural Ne
ts″by R,P、Lippwann: IEEE。
は、文献(”An Introduction to
Compu−ting with Neural Ne
ts″by R,P、Lippwann: IEEE。
ASSP: April 1987. pp、4−22
)に示されるような方法で予め学習により決定しである
ものとする。
)に示されるような方法で予め学習により決定しである
ものとする。
次に第1図の確信度計算ステップ106では、以下の式
を用いて確信度を計算する。ここで、認識対象のカテゴ
リ数をNとして、神経回路網からの出力ヘクトルをP、
(1≦i≦N、 o≦Pi≦1)、α、βを係数とす
ると、確信度Rは、式(5)によって定義することがで
きる。この確信度の定義は、本発明においては本質的な
ものでなく、確信度を他の方法で定義した場合にも適用
が可能である。
を用いて確信度を計算する。ここで、認識対象のカテゴ
リ数をNとして、神経回路網からの出力ヘクトルをP、
(1≦i≦N、 o≦Pi≦1)、α、βを係数とす
ると、確信度Rは、式(5)によって定義することがで
きる。この確信度の定義は、本発明においては本質的な
ものでなく、確信度を他の方法で定義した場合にも適用
が可能である。
この文字認識方法を、数字認識のために用いる場合には
、10個の文字を認識対象とするためNの値は10と設
定し、英数字を認識対象とする場合には、大文字26文
字、小文字26文字、数字10文字を認識するため、N
の値を62に設定する。また、式(5)の係数α、βを
それぞれ1とした。これは、本質的な問題ではなく他の
値をとることも可能である。また、式(5)では、出力
データの各要素が0から1までの値を仮定したが、−1
から1の場合や、さらに−船釣に出力データの各要素が
aからbまでの値をとる場合にも容易に拡張できる。
、10個の文字を認識対象とするためNの値は10と設
定し、英数字を認識対象とする場合には、大文字26文
字、小文字26文字、数字10文字を認識するため、N
の値を62に設定する。また、式(5)の係数α、βを
それぞれ1とした。これは、本質的な問題ではなく他の
値をとることも可能である。また、式(5)では、出力
データの各要素が0から1までの値を仮定したが、−1
から1の場合や、さらに−船釣に出力データの各要素が
aからbまでの値をとる場合にも容易に拡張できる。
第1図のステップ107では、確信度Rとしきい値を比
較し、Rの方が大きい場合には、多層神経回路網計算ス
テップ106の出力結果は、信転できる結果として、そ
の出力信号から最大値カテゴリ検出113を行い、その
結果カテゴリを出力して(ステップ114)、1文字の
認識処理を終了する。
較し、Rの方が大きい場合には、多層神経回路網計算ス
テップ106の出力結果は、信転できる結果として、そ
の出力信号から最大値カテゴリ検出113を行い、その
結果カテゴリを出力して(ステップ114)、1文字の
認識処理を終了する。
確信度としきい値との比較ステップ107で、確信度が
小さい場合には、今までの繰り返し数をカウントしくス
テップ108)、繰り返し回数としきい値とを比較(ス
テップ109) して、繰り返し回数が多くなると、認
識処理を中断して、棄却信号出力を行い(ステップll
2)、入力された文字画像はとのカテゴリに属するかは
明確には判断できないものであると出力する。
小さい場合には、今までの繰り返し数をカウントしくス
テップ108)、繰り返し回数としきい値とを比較(ス
テップ109) して、繰り返し回数が多くなると、認
識処理を中断して、棄却信号出力を行い(ステップll
2)、入力された文字画像はとのカテゴリに属するかは
明確には判断できないものであると出力する。
もし繰り返し回数が一定回数以下である場合には、ステ
ップ110に進み、特徴抽出でのパラメータの変更量を
計算する。
ップ110に進み、特徴抽出でのパラメータの変更量を
計算する。
パラメータの変更量の計算方法を第7図を用いて説明す
る。ステップ701では確信度計算ステップ106で得
られた値をRoとして保存する。ステップ702では、
第1番目のパラメータをθiとして、ステップ703で
は第1番目のパラメータだけを、一定量増やして、θ、
+Δθ、とじて、他のパラメータは元の値を用いて、特
徴抽出と多層神経回路網による識別を行い、その出力結
果がら式(5)に従って確信度R3゛を求める。次にス
テップ704では、第1番目のパラメータだけを、一定
量減らして、θ、−Δθ、とじて、他のパラメータは元
の値を用いて、特徴抽出と多層神経回路網による識別を
行い、その出力結果から式(5)に従って確信度R,−
を求める。
る。ステップ701では確信度計算ステップ106で得
られた値をRoとして保存する。ステップ702では、
第1番目のパラメータをθiとして、ステップ703で
は第1番目のパラメータだけを、一定量増やして、θ、
+Δθ、とじて、他のパラメータは元の値を用いて、特
徴抽出と多層神経回路網による識別を行い、その出力結
果がら式(5)に従って確信度R3゛を求める。次にス
テップ704では、第1番目のパラメータだけを、一定
量減らして、θ、−Δθ、とじて、他のパラメータは元
の値を用いて、特徴抽出と多層神経回路網による識別を
行い、その出力結果から式(5)に従って確信度R,−
を求める。
ステップ705では、Ri ” + Ri −+
R11を比較して、もしR,+が最大値をとるならば、
ステップ706に進みa、を1として、ステップ710
に進む。
R11を比較して、もしR,+が最大値をとるならば、
ステップ706に進みa、を1として、ステップ710
に進む。
もし、Ri−が最大値をとるならば、ステップ708に
進みaiを−1として、ステップ710に進む。
進みaiを−1として、ステップ710に進む。
もし、Roが最大値をとるならば、ステップ709に進
みaiを0として、ステップ710に進む。以上のステ
ップ702からステップ710までの処理を、全パラメ
ータに対して実行した後に、ステップ712において全
パラメータの変更量(aiΔθ、)(1≦i≦パラメー
タ数)を求める。
みaiを0として、ステップ710に進む。以上のステ
ップ702からステップ710までの処理を、全パラメ
ータに対して実行した後に、ステップ712において全
パラメータの変更量(aiΔθ、)(1≦i≦パラメー
タ数)を求める。
この変更量を基に、第1図のステップ111でパラメー
タの変更を行い、ステップ104から認識処理を再試行
し、確信度がしきい値以上になり、認識結果が得られる
か、繰り返し回数がしきい値以上になり棄却されるまで
、以上のステップ104からステップ110の処理を繰
り返して行う。
タの変更を行い、ステップ104から認識処理を再試行
し、確信度がしきい値以上になり、認識結果が得られる
か、繰り返し回数がしきい値以上になり棄却されるまで
、以上のステップ104からステップ110の処理を繰
り返して行う。
次に第2の発明の文字認識方法の実施例を説明する。全
体の処理の流れは、第1の発明の文字認識方法と同様に
第1図の流れにしたがう、その内容は、ステップ110
のパラメータ変更量の計算を除いて第1図の内容と同様
であり説明を省略する。
体の処理の流れは、第1の発明の文字認識方法と同様に
第1図の流れにしたがう、その内容は、ステップ110
のパラメータ変更量の計算を除いて第1図の内容と同様
であり説明を省略する。
本実施例の文字認識方法のパラメータ変更量の計算ステ
ップ110の詳細な説明を第8図を用いて行う。
ップ110の詳細な説明を第8図を用いて行う。
まず、ステップ801では確信度Rを高めるための特徴
ベクトルf、(1≦i≦N o )の変更量Δf。
ベクトルf、(1≦i≦N o )の変更量Δf。
を計算する。Rを式(5)として定義して、α、βをそ
れぞれ1とすると、式(7)を用いて実際の値を代入し
て計算することにより、特徴ベクトルの要素の変更量Δ
f、は計算できる。ここで、γは0.1などの適当な小
さな値でよい。また、Uは式(2)。
れぞれ1とすると、式(7)を用いて実際の値を代入し
て計算することにより、特徴ベクトルの要素の変更量Δ
f、は計算できる。ここで、γは0.1などの適当な小
さな値でよい。また、Uは式(2)。
式(4)でのシグモイド関数の傾き制御のパラメータで
、h、は多層神経回路網での第1層ユニットの第j番目
のユニットの出力値で、qlは第2雁の第に番目のユニ
ットの出力値とする。
、h、は多層神経回路網での第1層ユニットの第j番目
のユニットの出力値で、qlは第2雁の第に番目のユニ
ットの出力値とする。
次に、ステップ802からステップ807では、各パラ
メータの変更量を求める。この処理をパラメータの数だ
け繰り返す。
メータの変更量を求める。この処理をパラメータの数だ
け繰り返す。
まず、1つのパラメータが影響を与える特徴ベクトルの
要素の総和を求める。実施例では、文字の輪郭線の方向
と、曲率を求める触手長θ1と、曲率を5つの種類に分
類するためのしきい値(θ2〜θ、)を利用しているが
、例えばθ3は局所構造を、正曲率の曲線骨と直線骨を
分類するためのしきい値であり、θ、を大きくすると正
曲率の曲線骨に関する特徴量は減少し、直線骨に関する
特徴量は増加する。よって、ステップ803では直線骨
に関する特徴ベクトルの要素の変更量の総和を以下の式
で求める。
要素の総和を求める。実施例では、文字の輪郭線の方向
と、曲率を求める触手長θ1と、曲率を5つの種類に分
類するためのしきい値(θ2〜θ、)を利用しているが
、例えばθ3は局所構造を、正曲率の曲線骨と直線骨を
分類するためのしきい値であり、θ、を大きくすると正
曲率の曲線骨に関する特徴量は減少し、直線骨に関する
特徴量は増加する。よって、ステップ803では直線骨
に関する特徴ベクトルの要素の変更量の総和を以下の式
で求める。
ΣΔf’++ (k=5 (8(mx+y)+q)+
p)・・aつ メツシュの位置(x、y) (O≦X≦n−1,0≦y<m−1 方向コード q(0≦q≦7) 局所構造の種類番号 p(1≦p≦5)ただし、正曲率
の曲線骨の局所構造種類番号を3とすると、p=3とし
て、x、y、qに関して、Δfkの総和を計算し、Δθ
1°とする。また、ステップ804では、パラメータθ
1を大きくした場合に、減少する特徴ベクトル要素の総
和を求める。θ3の場合には式0湯でP=2として、Δ
f。
p)・・aつ メツシュの位置(x、y) (O≦X≦n−1,0≦y<m−1 方向コード q(0≦q≦7) 局所構造の種類番号 p(1≦p≦5)ただし、正曲率
の曲線骨の局所構造種類番号を3とすると、p=3とし
て、x、y、qに関して、Δfkの総和を計算し、Δθ
1°とする。また、ステップ804では、パラメータθ
1を大きくした場合に、減少する特徴ベクトル要素の総
和を求める。θ3の場合には式0湯でP=2として、Δ
f。
の総和を求め、ΔθJ−とする。
つぎに、ステップ805では、パラメータθ1の変更量
Δθjを式(8)に従った計算により求める。
Δθjを式(8)に従った計算により求める。
ステップ806では、パラメータの変更量Δθ、があま
り太き(ならないように、小さな値の定数δと一δとの
間になるように修正する。もし、δより大きい場合には
Δθ、をδに置換し、もし−δより小さい場合には、−
δにW摸する。
り太き(ならないように、小さな値の定数δと一δとの
間になるように修正する。もし、δより大きい場合には
Δθ、をδに置換し、もし−δより小さい場合には、−
δにW摸する。
以上のステップ802からステップ808までの処理を
、全パラメータに対して実行した後に、ステップ809
において全パラメータの変更量(Δθ、)(1≦j≦パ
ラメータ数)を求める。
、全パラメータに対して実行した後に、ステップ809
において全パラメータの変更量(Δθ、)(1≦j≦パ
ラメータ数)を求める。
この変更量を基に、第一図のステップ111でパラメー
タの変更を行い、ステップ104がら認識処理を再試行
し、確信度がしきい値以上になり、認識結果得られるか
、繰り返し回数がしきい値以上になり棄却されるまで、
以上のステ・ンブ104からステップ110の処理を繰
り返して行う。
タの変更を行い、ステップ104がら認識処理を再試行
し、確信度がしきい値以上になり、認識結果得られるか
、繰り返し回数がしきい値以上になり棄却されるまで、
以上のステ・ンブ104からステップ110の処理を繰
り返して行う。
次に第3の発明の文字認識方法の実施例を説明する。全
体の処理の流れは、第1の発明の文字認識方法と同様に
第1図の流れに従う。その内容は、ステップ110のパ
ラメータ変更量の計算を除いて第1図の内容と同様であ
り説明を省略する。本実施例の文字認識方法パラメータ
変更量の計算ステップ110の詳細な説明を第9図を用
いて行う。
体の処理の流れは、第1の発明の文字認識方法と同様に
第1図の流れに従う。その内容は、ステップ110のパ
ラメータ変更量の計算を除いて第1図の内容と同様であ
り説明を省略する。本実施例の文字認識方法パラメータ
変更量の計算ステップ110の詳細な説明を第9図を用
いて行う。
よす、ステップ901では、第8図の場合と同様に、確
信度Rを高めるための特徴ベクトルf。
信度Rを高めるための特徴ベクトルf。
(1≦i≦N、)の変更量Δf1を式(7)に従った計
算により求める。
算により求める。
次にステップ902からステップ904で、パラメータ
θjによる特徴ベクトルの要素f、の変化量ΔfIJを
求める。ステップ902では、パラメータθ、を少量増
加させてθ、+Δθ、として特徴抽出を行い、その結果
の特徴ベクトルを[f i”]を求める。次に同様にし
て、ステップ903において、パラメータθ1を少量減
少させてθj−Δθ1として特徴抽出を行い、その結果
の特徴ベクトルを[fi’−]を求める。その後、ステ
ップ904において、パラメータθ、が特徴ベクトルに
与える影響量として、列ベクトル[Δf i’]を式(
9)に従った計算により求める。
θjによる特徴ベクトルの要素f、の変化量ΔfIJを
求める。ステップ902では、パラメータθ、を少量増
加させてθ、+Δθ、として特徴抽出を行い、その結果
の特徴ベクトルを[f i”]を求める。次に同様にし
て、ステップ903において、パラメータθ1を少量減
少させてθj−Δθ1として特徴抽出を行い、その結果
の特徴ベクトルを[fi’−]を求める。その後、ステ
ップ904において、パラメータθ、が特徴ベクトルに
与える影響量として、列ベクトル[Δf i’]を式(
9)に従った計算により求める。
ステップ902からステップ904までの処理を全パラ
メータに対して行うことにより、パラメータ数の特徴量
の変更ベクトル[Δf1″]が得られる。
メータに対して行うことにより、パラメータ数の特徴量
の変更ベクトル[Δf1″]が得られる。
これらを行方向に並べることにより、行列[Δf、゛]
が得られ、これを行列Bとする。Bの擬逆行列Btは、
ステップ905で以下の式に従って計算される。
が得られ、これを行列Bとする。Bの擬逆行列Btは、
ステップ905で以下の式に従って計算される。
Bt=B”(BB”)−’ 圓
ここでB′″は、行列Bの随伴行列を表し、X −1は
Xの逆行列を表す。
ここでB′″は、行列Bの随伴行列を表し、X −1は
Xの逆行列を表す。
ステップ906では、ステップ901で求められている
特徴量の変更量の列ベクトル[Δfi]をAとし上記の
Btとから、式(IQに従ってパラメータの変更量の列
ベクトル[Δθj′]であるCが求められる。
特徴量の変更量の列ベクトル[Δfi]をAとし上記の
Btとから、式(IQに従ってパラメータの変更量の列
ベクトル[Δθj′]であるCが求められる。
ステップ907では、パラメータの変更量Δθ1があま
り大きくならないように、小さな値の定数δと−δとの
間にはいるように修正する。もし、δより大きい場合に
はΔθ1′をδに置換し、もし−δより小さい場合には
、−δに置換する。
り大きくならないように、小さな値の定数δと−δとの
間にはいるように修正する。もし、δより大きい場合に
はΔθ1′をδに置換し、もし−δより小さい場合には
、−δに置換する。
この変更量を基に、第1図ステップ111でパラメータ
の変更を行い、ステップ104から認識処理を再試行し
、確信度がしきい値以上になり、認識結果得られるか、
繰り返し回数がしきい値以上になり棄却されるまで、以
上のステップ104からステップ110の処理を繰り返
して行う。
の変更を行い、ステップ104から認識処理を再試行し
、確信度がしきい値以上になり、認識結果得られるか、
繰り返し回数がしきい値以上になり棄却されるまで、以
上のステップ104からステップ110の処理を繰り返
して行う。
ここでは、文字輪郭線の方向と曲率に関する特徴量を用
いて本発明の実施例を述べたが、他の特徴抽出方法につ
いてもいくつかのパラメータへの拡張は容易に行える。
いて本発明の実施例を述べたが、他の特徴抽出方法につ
いてもいくつかのパラメータへの拡張は容易に行える。
以上の説明から明らかなように、本発明の文字認識方法
では、認識結果の信軌性を評価する確信度を定義した上
で、文字認識での特徴抽出で用いられるパラメータを認
識結果の確信度を高めるという規範に基づいて、入力文
字の変形に適応的にしかも自動的に調節を行い、その結
果の確信度の高い認識結果のみを出力する。これによっ
てパラメータの設定が微妙に影響して、本来充分認識で
きる程度の質の文字画像であるにも拘わらず、認識結果
を棄却して、認識結果が得られなかったものを、本発明
の文字認識方法を用いることによって、特徴抽出のパラ
メータが調節され、正しい認識を得ることができる。ま
た、非常に質が悪(人間がみても認識できないような文
字画像は、何度パラメータを調節しても高い確信度が得
られないために、従来と同様に棄却される。よって、誤
認識率を増加させることなく、棄却率を減少させ、認識
率を増加させて、全体的に認識性能を向上させることが
できる。
では、認識結果の信軌性を評価する確信度を定義した上
で、文字認識での特徴抽出で用いられるパラメータを認
識結果の確信度を高めるという規範に基づいて、入力文
字の変形に適応的にしかも自動的に調節を行い、その結
果の確信度の高い認識結果のみを出力する。これによっ
てパラメータの設定が微妙に影響して、本来充分認識で
きる程度の質の文字画像であるにも拘わらず、認識結果
を棄却して、認識結果が得られなかったものを、本発明
の文字認識方法を用いることによって、特徴抽出のパラ
メータが調節され、正しい認識を得ることができる。ま
た、非常に質が悪(人間がみても認識できないような文
字画像は、何度パラメータを調節しても高い確信度が得
られないために、従来と同様に棄却される。よって、誤
認識率を増加させることなく、棄却率を減少させ、認識
率を増加させて、全体的に認識性能を向上させることが
できる。
第1図は、本発明の文字認識方法の処理全体の流れ図、
第2図は、特徴ベクトルの計算方法の流れ図、第3図は
、特徴ベクトル計算での局所構造を抽出する処理を示す
流れ図、 第4図は、抽出された文字の輪郭線の局所構造の例を示
す図、 第5図は、抽出された局所構造から特徴ベクトルに変換
する方法を示す流れ図、 第6図は、多層神経回路網の計算方法を示す図、第7図
は、第1の発明の文字認識方法での特徴抽出でのパラメ
ータの変更量を計算する方法を示す図、 第8図は、第2の発明の文字認識方法での特徴抽出での
パラメータの変更量を計算する方法を示す図、 第9図は、第3の発明の文字認識方法での特徴抽出での
パラメータの変更量を計算する方法を示す図である。
、特徴ベクトル計算での局所構造を抽出する処理を示す
流れ図、 第4図は、抽出された文字の輪郭線の局所構造の例を示
す図、 第5図は、抽出された局所構造から特徴ベクトルに変換
する方法を示す流れ図、 第6図は、多層神経回路網の計算方法を示す図、第7図
は、第1の発明の文字認識方法での特徴抽出でのパラメ
ータの変更量を計算する方法を示す図、 第8図は、第2の発明の文字認識方法での特徴抽出での
パラメータの変更量を計算する方法を示す図、 第9図は、第3の発明の文字認識方法での特徴抽出での
パラメータの変更量を計算する方法を示す図である。
Claims (3)
- (1)文字画像から特徴を計算して多層神経回路網によ
り識別処理を行う文字認識方法において、文字画像から
複数のパラメータ値を用いて特徴抽出を行うステップと
、 それによって得られた特徴ベクトルを入力して、各カテ
ゴリ毎のスコアを出力する多層神経回路網を計算するス
テップと、 多層神経回路網の出力から出力結果の確信度を計算し、
その確信度をしきい値と比較して、しきい値よりも高け
れば認識結果をそのまま出力するステップと、 もししきい値よりも低ければ、各パラメータを一定値増
減させて確信度を求め、確信度が高くなった場合のパラ
メータの変更量を求めるステップと、 全パラメータについて変更量を求めた後に、全パラメー
タを変更して特徴抽出から再試行することを制御するス
テップとを、 含むことを特徴とする文字認識方法。 - (2)文字画像から特徴を計算して多層神経回路網によ
り識別処理を行う文字認識方法において、文字画像から
複数のパラメータ値を用いて特徴抽出を行うステップと
、 それによって得られた特徴ベクトルを入力して、各カテ
ゴリ毎のスコアを出力する多層神経回路網を計算するス
テップと、 多層神経回路網の出力から出力結果の確信度を計算し、
その確信度をしきい値と比較して、しきい値よりも高け
れば認識結果をそのまま出力するステップと、 もししきい値よりも低ければ、確信度を高めるように多
層神経回路網に入力する特徴ベクトルが変化すべき量を
求めるステップと、 1つのパラメータが影響を与える特徴ベクトル内の要素
の変更量の和を求めるステップと、特徴ベクトルの変化
量の和に基づいて特徴抽出でのパラメータ値を変更する
ステップと、 変更したパラメータ値を用いて特徴抽出から再試行する
ことを制御するステップとを、 含むことを特徴とする文字認識方法。 - (3)文字画像から特徴を計算して多層神経回路網によ
り識別処理を行う文字認識方法において、文字画像から
複数のパラメータ値を用いて特徴抽出を行うステップと
、 それによって得られた特徴ベクトルを入力して、各カテ
ゴリ毎のスコアを出力する多層神経回路網を計算するス
テップと、 多層神経回路網の出力から出力結果の確信度を計算し、
その確信度をしきい値と比較して、しきい値よりも高け
れば認識結果をそのまま出力するステップと、 もししきい値よりも低ければ、確信度を高めるように多
層神経回路網に入力する特徴ベクトルが変化すべき量を
求めるステップと、 1つのパラメータを増減させた場合の特徴ベクトルの変
化量を求め、全パラメータに対する特徴ベクトルの変化
量の組による行列の擬逆行列と特徴ベクトルが変化すべ
き量を表すベクトルとの積から各パラメータを変更する
量を求めるステップと、 変更したパラメータ値を用いて特徴抽出から再試行する
ことを制御するステップとを、 含むことを特徴とする文字認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2154085A JP2682203B2 (ja) | 1990-06-14 | 1990-06-14 | 文字認識方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2154085A JP2682203B2 (ja) | 1990-06-14 | 1990-06-14 | 文字認識方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0447486A true JPH0447486A (ja) | 1992-02-17 |
| JP2682203B2 JP2682203B2 (ja) | 1997-11-26 |
Family
ID=15576565
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2154085A Expired - Fee Related JP2682203B2 (ja) | 1990-06-14 | 1990-06-14 | 文字認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2682203B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6057112B1 (ja) * | 2016-04-19 | 2017-01-11 | AI inside株式会社 | 文字認識装置、方法およびプログラム |
-
1990
- 1990-06-14 JP JP2154085A patent/JP2682203B2/ja not_active Expired - Fee Related
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6057112B1 (ja) * | 2016-04-19 | 2017-01-11 | AI inside株式会社 | 文字認識装置、方法およびプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2682203B2 (ja) | 1997-11-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN109614922B (zh) | 一种动静态手势识别方法和系统 | |
| JP3027321B2 (ja) | 拘束のない手書き英数字のオンライン認識の方法及び装置 | |
| EP0622750B1 (en) | Pattern recognition | |
| US20230047131A1 (en) | Contour shape recognition method | |
| EP0649113B1 (en) | Multifont optical character recognition using a box connectivity approach | |
| US6128410A (en) | Pattern matching apparatus and method that considers distance and direction | |
| US5479533A (en) | Pattern recognition apparatus and method using fuzzy logic | |
| US5263107A (en) | Receptive field neural network with shift-invariant pattern recognition | |
| JPH0695192A (ja) | 画像認識装置及び画像入力方法 | |
| EP3702958B1 (en) | Method for verifying the identity of a user by identifying an object within an image that has a biometric characteristic of the user and separating a portion of the image comprising the biometric characteristic from other portions of the image | |
| CN101197045A (zh) | 一种图像立体匹配方法及其装置 | |
| JP2010134957A (ja) | パターン認識方法 | |
| CN113191361A (zh) | 一种形状识别方法 | |
| EP0586210A2 (en) | Optical character recognition | |
| JPH0765165A (ja) | ニューラル・ネットワークによるパターン認識方法及び装置 | |
| EP0604687B1 (en) | Method for deriving character features in a character recognition system | |
| EP0709800B1 (en) | Method for designing classification trees | |
| Rajnoha et al. | Handwriting comenia script recognition with convolutional neural network | |
| JPH0447486A (ja) | 文字認識方法 | |
| CN106909936B (zh) | 一种基于双车辆可变形部件模型的车辆检测方法 | |
| NIHARMINE et al. | RECOGNITION OF HANDWRITTEN TIFINAGH CHARACTERS USING GRADIENT DIRECTION FEATURES. | |
| Mokshith Reddy et al. | Signature Verification using Edge Detection and Oc-Svm | |
| JP2778194B2 (ja) | パターン認識方法および装置 | |
| KR102889812B1 (ko) | 저사양 임베디드 디바이스에서의 빠른 번호판 인식을 위해 미분 기반 경계선 검출 알고리즘 및 깊이별 분리 합성곱 기반 Yolo 모델 추론 속도 최적화 기법을 이용한 번호판 인식 방법 및 이를 이용한 컴퓨팅 장치 | |
| Pan et al. | An improved iris localization method. |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070808 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080808 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080808 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090808 Year of fee payment: 12 |
|
| LAPS | Cancellation because of no payment of annual fees |